안녕하세요? SDF2023 <AI시대, 다시 쓰는 경제 패러다임> 준비에 여념이 없는 SBS D포럼에서 보내드리는 SDF다이어리입니다.
올 상반기, 전 세계를 휩쓴 화두를 하나 뽑자면 단연 챗GPT로 대변되는 생성형 AI기술의 등장일겁니다. 이런 가운데 국내 스타트업이 만든 거대 언어모델(LLM·Large Language Model)이 오픈소스 분야에서 오픈AI의 챗GPT를 넘어 세계 1위 '생성 AI' 모델로 등극했다는 소식이 전해지면서 글로벌 AI업계의 이목이 집중되고 있습니다. 그 주인공은 AI 전문기업, 업스테이지(Upstage)인데요.
|
|
|
업스테이지가 이번에 1위를 차지한 허깅페이스의 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 알려져 있습니다.
업스테이지는 소프트웨어공학과 AI 분야의 최고 전문가로 잘 알려진 김성훈 대표가 이끌고 있는데요. 생성 AI의 기술력을 확보하기 위한 세계적 경쟁이 뜨겁게 벌어지고 있는 이때, 이런 성과는 어떻게 가능했고 또 한국의 AI 기술 발전은 어떤 방향성과 철학을 가지고 나아가야 할지 업스테이지를 만들고, 이끌고 있는 김성훈 대표를 만나 자세한 이야기를 나눠봤습니다.
|
|
|
Q. 반갑습니다. 대표님. 먼저 업스테이지가 허깅페이스 LLM에서 (8월 1일 기준) 1위를 했는데요. 어떤 의미인지 설명해주실 수 있을까요?
|
|
|
네. 우리가 인공지능을 만들면 이게 얼마나 좋은 것인지, 개인에게 딱 맞는 것인지를 검사를 해봐야 하잖아요. 그것을 검사하는 대회라고 생각하시면 됩니다. 비유가 적절한지는 모르겠지만 말하자면 아이큐를 측정하듯이요. 시험 문제를 내고 문제를 얼마나 잘 푸는지 4가지 종목 (추론과 상식 능력, 언어 이해 종합능력 및 할루시네이션(오류 가능성) 방지) 등을 가지고 시험을 보고 순위를 매기는 거예요. 시험을 모두 잘 풀면 1등에 올라가는 거고요. 그런 테스트를 통해서 더 좋은 AI를 만들자는 취지로 많은 회사에서 참여하고 있는데요. 어떤 의미에서 AI와 관련해서 가장 유명한 ‘빌보드 차트라고’보시면 되고 업스테이지가 거기에서 1등을 한 것이죠. |
|
|
Q. 그렇다면 업스테이지만의 차별화된 인공지능 기술은 무엇인지 궁금합니다. 아직 업스테이지에 대해서 잘 모르시는 분도 있을 것 같아요. |
|
|
네. 그렇죠. 업스테이지는 시작한 지 얼마 안 되었기 때문에 사실 많은 분들이 모르실 수도 있어요. (2020년 10월 창업) 일단 크게는 세 가지 정도의 서비스를 가지고 있는데요. 하나는 OCR(Optical Character Recognition) 기술이라는 거예요. 쉽게 설명해서 우리가 사회에서 명함을 주고받으면 기록하기 위해서 이메일 주소 같은 걸 타이핑하는 경우가 생기잖아요. 이걸 타이핑을 하지 않고 그냥 이미지만 넣으면 그 안에 있는 글씨를 자동으로 뽑아내는 기술, 그런게 굉장히 곳곳에 필요하거든요. 영수증을 받아서 수작업을 하는 경우도 해당되겠죠. 그런 일들을 모두 없애줄 수 있는 OCR기술을 하고 있고요.
또 하나는 추천엔진이라고 하는 개인화 추천시스템이에요. 예를 들어 SBS 방송 프로그램을 시청하고 나면 “아, 이걸 봤으니까 다른 것도 보면 좋겠다”라고 추천해주는 AI 기술이죠. 그런 것들을 개발해서 지금은 쇼핑앱 등 기업에서 많이 사용을 하고 있어요.
|
|
|
그리고 생성형 AI챗봇인데요. 아마 이걸 가장 많은 분들이 써보셨을 것 같아요. AskUp이라고 카카오 안에서 대화를 할 수 있는 AI챗봇 서비스가 있는데요. 론칭한지 2~3개월 만에 사용자가 130만 명을 넘었습니다. 아마 국내에서는 제일 빠르게 성장하는 AI 서비스라고 보시면 될 것 같아요. 저희는 궁극적으로는 AI를 가지고 기업 고객이나 개인 사용자들이 정말 가치를 느낄 만한 새로운 일을 가지고 사회에 기여를 해보자는 취지로 일하고 있기 때문에, AI로 할 수 있는 일들을 전반적으로 다 보고 있습니다. |
|
|
▶ 업스테이지가 개발한 대화형 챗봇 AskUp에 SBS D포럼에 대해 묻고 답변을 들었다.
|
|
|
Q. 오픈소스를 지향하고 계신 것으로 알고 있습니다. 챗GPT의 경우도 3.5 까지는 오픈모델이었지만 챗GPT-4부터는 방침을 달리했는데요. 업스테이지가 계속 오픈소스를 지향하는 데에는 어떤 이유가 있을까요? |
|
|
저는 사실 “AI가 정말 성숙해 있느냐?”라고 질문했을 때 조금 부족함이 있는 것 같아요. 저희들이 회사를 처음 만들 때도 ‘클루(KLUE)’[1]를 구축하고 아예 오픈을 했거든요. 그렇게 저희들이 만든 것도 오픈소스로 올려놔서 사람들이 다 써볼 수 있어요. 그렇게 한 이유는 이 AI생태계를 키우기 위한 거예요. 많은 분들이 써보고 여기에서 가치를 느끼고 그렇게 판이 커져야 결국은 저희들이 할 일도 늘어나고, 세상이 더 많은 AI를 쓰는 방향으로 가는 것이잖아요. 그런 길을 가는 데에 있어서 오픈소스가 굉장히 좋다고 생각해요. |
|
|
[1] 클루(KLUE :Korean Language Understanding Evaluation) : 최초의 한국어 자연어 이해 평가 공개 데이터셋으로 한국어 AI 연구 생태계를 넓히고 국내 AI 산업 발전에 힘을 싣기 위해 업스테이지가 주도해 산학계의 전문가들과 함께 개발했다. 📎홈페이지 이동 클릭 |
|
|
Q. 요즘 AI 업계에서는 ‘데이터’의 이슈가 점점 더 중요하게 부상하고 있는데요. 대기업에서도 이 부분에 집중 투자하고 있다고 하고요. ‘질 좋은 데이터를 확보’하는 부분은 어떻게 해결하고 계신가요?
|
|
|
말씀 주신 것처럼 ‘데이터’가 사실은 이제 앞으로 굉장히 중요한 이슈입니다. 인공지능을 비롯한 기술이 발전해 나갈 때 정말 질 좋은 데이터를 많이 가지고 있는 나라, 또 그것이 문서화되어 있는 나라가 정말 힘을 많이 발휘하게 될 것 같아요.
제가 이야기를 들어보니까 독일 같은 경우는 GPT의 성능이 굉장히 뛰어난데, 그 이유가 그런 질 좋은 데이터들이 굉장히 많아서라고 하더라고요. 반면에 한국은 지금 문서화 되어있는 데이터의 양 자체가 많은 것 같지는 않아서 국가적으로도 좀 많은 고민이 필요한 것 같아요. 저희 회사도 마찬가지고요. 아시겠지만 네이버나 카카오 같은 회사의 많은 사람들이 이용하는 서비스에는 블로그나, 카페 등에 글이 많이 남아있지만 그렇지 않은 회사들은 데이터가 많지 않죠. 그래서 저희들 같은 경우는 자체적으로 데이터를 모으는 일도 하지만 데이터를 가지고 있는 회사와 좋은 전략적 제휴를 맺어서 데이터를 확보하는 전략을 가지고 있어요.
이게 어떤 의미에서는 ‘우리 회사 데이터만 쓰겠다’하는 것보다, 아까 오픈소스를 이야기한 것처럼 이런 부분에도 오픈 바람이 불고 협업하는 구조가 된다면 다른 특정 회사보다 더 데이터를 많이 이용할 수 있는 것이죠.
|
|
|
업스테이지는 지난 14일, ‘1T클럽’을 발족한다고 발표했습니다. ‘1T 클럽’은 ‘1 트릴리온(조 단위) 토큰 클럽’을 줄인 것으로 텍스트, 책, 기사, 보고서, 논문 등 다양한 형태의 1억 단어 이상의 한국어 데이터를 기여하는 파트너사들로 구성되며 현재 20여개 언론사 및 기업, 학계 등 데이터 제공자들과 긴밀한 협의를 진행하고 있다고 하는데요. 이를 통해 한국어 데이터의 부족 문제를 해결함과 동시에 한국 문화 정서를 담아낼 수 있는 고품질의 LLM을 개발해 국내 생성형 AI에 활용하고 발전에 기여할 것이라고 이야기를 전했습니다. |
|
|
Q. 데이터 이슈는 항상 저작권 문제와도 연결이 되는데요. 이 부분은 어떻게 보고계세요?
|
|
|
제가 저작권 문제의 전문가는 아니지만 제가 생각하는 것을 말씀드리자면, 예를 들어 작가가 쓴 글이 AI를 통해 학습이 됐고 그것 때문에 AI가 똑똑해졌다면 거기에서 나오는 수익이나 이익이 작가들에게 갈 수 있는 구조가 되어야 한다고 생각해요. 장기적으로는요. 그래서 그런 구조를 어떻게 만들 것인가 하는 것은 사회적으로 여러 협의가 필요한 부분이고 시스템을 만들 때는 어떤 데이터가 얼마만큼 어떻게 사용되었는지를 잘 트레킹 할 수 있도록 구조를 만들어서 서비스를 해야 한다고 생각하고 있습니다. |
|
|
Q. 올해 SDF는 <AI시대, 다시 쓰는 경제 패러다임>을 주제로 준비 중인데요. 기술 혁신의 중심에 계시는 분으로서, AI라는 굉장한 혁신기술이 우리 경제를 어떻게 뒤흔들고 바꿀 것으로 보시는지 궁금합니다.
|
|
|
정말 어려운 질문인데요. 초거대 지능이 출현한다고 일단 보시면 될 것 같아요. 그것은 그리고 모든 분야에 출현할 수 있죠. 경제 쪽을 물어보셨으니까 금융 쪽으로 예를 들어볼게요. 초지능 금융이 나왔다면 그럼 그걸 갖고 있는 사람과 그렇지 않은 사람과의 게임, 그리고 그것에 따른 이익의 분배, 부의 쏠림을 생각해보시면 엄청나게 큰 차이가 날 거예요.
예로 들었던 금융뿐만 아니라 거의 모든 영역에서요. 초거대 초지능으로 인한 엄청난 ‘쏠림 현상’이 나타날 거고 그것이 경제에 큰 영향을 미칠 거라고 생각합니다. 많이 이야기가 나오는 것처럼 로봇에 세금을 걷는다든지 하는 여러 가지 방법으로 전체적인 부는 다 올라갈 거예요. 하지만 쏠림현상이 나타날 것이라는 거죠. 결국 그런 것들을 잘 이용하는 사람은 굉장한 혜택을 누릴 수 있게 되고 그렇지 못한 사람은 지금보다 더 힘든 시간을 보낼 수도 있다는 생각이 들어요.
그리고 이것은 인공지능 기술을 활용할 줄 아는 개인과 그렇지 못한 개인의 문제를 넘어서는 것이죠. 국가 대 국가, 그리고 기업 대 기업까지 확장되는 문제이기 때문에 더 좋은 기술을 우리가 먼저 취득할 수 있도록 많은 투자와 관심이 필요하죠.
그런 측면에서 조금 더 의견을 드려보면, 우리도 스티브 잡스나 오픈AI의 샘 올트만이나 심지어 일론 머스크 같은 그런 스타들을 키울 수 있는 분위기가 조성되면 좋을 것 같아요. 약간 튀는, 개성 강한 사람들을 더 돋보이게, 앞으로 나아갈 수 있도록 하고 달리게 하는 것이죠. 회사도 마찬가지고요. 잘하는 회사를 확 밀어줘서 세계에서 우뚝 설 수 있게요. 그게 국가 전체를 살리고 더 많은 이익을 줄 수 있을 것이라 생각합니다.
|
|
|
▶ SBS D포럼팀과 인터뷰 중인 업스테이지 김성훈 대표, <지난 1일>
|
|
|
너무도 빠르게 발전하는 기술, 변화하는 사회 속에 살아남고 적응하기 위해서 어떤 선택을 해야 할지 혼란을 겪는 분들이 많은데요.
여러 갈림길에서 늘 새롭고 도전적인 선택으로 자신만의 길을 개척해온 김성훈 대표이기에 이런 혼란의 시기를 건너가는 방법에 대해 그에게 묻고 싶어졌습니다.
|
|
|
“AI시대를 살아가려면 어떤 역량을 갖추고, 어떤 선택해야할까요?”
“우선 굉장히 많이 혼란스러우시겠죠. 새로운 기술도 나온다고 하고 심지어 어떤 부분에서는 나보다 똑똑한 것 같고요. 하지만 저는 결론적으로 전혀 걱정하실 필요가 없을 것 같아요. 아시다시피 역사를 통해서 보면 우리 인류는 늘 그 방법을 찾아냈고, 여러분들 각자도 다 그런 방법을 찾으실 수 있을 거라고 생각해요.
그렇지만 제가 개인적으로 생각하는 ‘팁’을 드린다면 먼저 여러분들이 지금 하고 계시는 일, 하고자 하시는 일들이 얼마나 반복적인 일인가를 생각해보셨으면 좋겠어요. 내가 1년이 지나도 하는 일이 거의 똑같고, 반복적인 일이라면 그것이 아마 기계나 AI 대체될 확률이 굉장히 많이 있을 것 같아요.
두 번째는 요즘 인공지능이나 챗GPT 같은 것들이 결국 지향하는 바는 일상에서 쉽게 사용할 수 있도록 만드는 거거든요. 그러다보니까 옛날보다 컴퓨터도, AI도 많이 쉬워졌어요. 그러니까 그런 새로운 기술이 나오면 그것에 대해서 거부감을 갖지 말고, 오히려 더 적극적으로 가서 끌어안고 써보고 이용해보시라고 말씀드리고 싶어요. 굉장히 좋은 기회를 찾으실 겁니다.”
|
|
|
전환은 이미 시작되었고, 우리는 그 초입에 서 있습니다. AI기술이 세상을 어디까지, 얼마나 바꿀지는 그 누구도 확언할 수 없을 겁니다. 예측하기 어려운 파고 앞, 기대와 두려움 사이에 서 있는 지금 어떤 준비를 해야 하고 어떤 논의를 해나가야 할지, 국가는 물론 기업, 개인까지 모두의 노력이 모아져야 할 때라는 생각이 다시 한 번 들었습니다. |
|
|
(글: 최예진 작가, sdf@sbs.co.kr) |
|
|
|