SDF 다이어리

Ep.140

Ep.140AI시대, 우리가 가져야 할 질문은?

2023.03.15
안녕하세요? 미래를 여는 담대한 도전, SDF다이어리입니다. 최근 챗GPT가 장안의 화제입니다. 새 학기가 시작되면서 입학식 축사부터 회장 선거 유세에까지 챗GPT가 써준 내용이 빠지지 않고 등장하고 있습니다. 많은 관련 데이터를 조합해 말이 되게 문맥을 작성해 내는 인공지능의 능력에 다들 신기해하고 관심을 갖기 시작한 것인데요.
저도 남들처럼 챗GPT에게 제가 누구인지 물었습니다.

언뜻 보아서는 잘 설명한 것처럼 보이지만 저는 국내 최초로 북한 내부에서 취재를 진행한 경험이 없습니다. 그러니까 사실 여부를 제대로 알고 있지 않다면 판별하기 어려운 거짓도 마치 사실인양 전한다는 맹점이 있습니다.

그렇다면 이렇게 아직은 불완전하고, 점점 더 가짜와 진짜를 분별하기가 쉽지 않아 지는 시대를 맞아 우리는 인공지능을 어떻게 봐야 할까요? 또 인공지능을 둘러싸고 우리가 가져야 할 질문들은 무엇일까요?

오혜연 카이스트 인공지능연구원장을 만나봤습니다.
먼저 카이스트 인공지능연구원에서는 어떤 연구를 하는지 물었습니다.

“인공지능을 연구하시는 분들은 각자는 너무 훌륭하게 잘하시는데 연구원의 역할은 모여서 할 수 있는 것은 무엇인가? 예를 들면 A라는 연구 주제를 하고 있는데 A 하는 사람이 다섯 명 모이면 그것은 별로 좋지 않잖아요. 그런데 A를 하는 사람과 정말 인공지능이 아닌 예를 들면 바이오를 하는 사람, 아니면 정치학을 하는 사람이 모였을 때 어떻게 또 새로운 주제가 나올까? 그 새로운 기술이 사회에 미치는 영향력은 무엇일까? 그런 것들을 지난해 주로 연구했고, 지금 챗GPT도 그렇지만 AI기술이 굉장히 수준이 올라갔잖아요. 더 이상 연구실에서만 연구하는 기술이 아니라 기업이 들고 나오면서 정말 사람이 쓰게 되는 것들이 나오잖아요. 그랬을 때 사용자들이 이걸 어떻게 쓰냐 이런 게 굉장히 중요한데, 그러한 연구가 아직은 많이 되어 있지 않아요. 사람과 AI가 만났을 때 어떻게 공존하고, 사람이 어떻게 AI한테서 원하는 것을 얻어내고, 그것으로 인해 더 좋은 일을 할 수 있게 할 것인가? 그러려면 어떻게 해야하는지 그런 것을 연구원에서 연구해야 할 것 같아요.”

오혜연 원장은 특히 사람이 모두 같지 않다는데 주목하고 있었습니다.

“사실 사람마다 다르잖아요. 그렇게 생각하면 할 게 너무 많은 거죠. 이게 한국 사람은 어떻게 쓰냐, 한국 내에서도 서울 사람은 어떻게 쓰고, 대전 사람은 어떻게 쓰고, 10대는 어떻게 쓰고 30대는 어떻게 쓰는가가 다 다를 수 있는 거죠.”
Q. 같은 기술이라도 다양하게 쓸 수 있다는 관점이 재밌는데요. 다양화된 어떤 맞춤화된 방식의 AI를 보려면 기존에 그냥 상용화된 모두가 같은 것을 쓰는 거라고 가정하고 쓸 때와 달라져야 되는 것일까요?
챗GPT만 보면 이게 그냥 미국 30대 백인이 쓰는 언어의 평균 뭐 그런 식으로 그 모델이 나온 거예요. 그중에서도 굉장히 범용적인 언어를 쓰기 때문에 욕도 안 하고 굉장히 흥분하는 표현도 안 하고 그러잖아요. 그런데 나는 10대처럼 사춘기 막 질풍노도의 시기를 거치는 그런 애들의 언어를 구사하는 챗봇이랑 얘기를 하고 싶을 수도 있고, 아니면 뭐 60대 막 굉장히 지혜로운 사람 예를 들면 오바마 같은 그런 세계 정치를 볼 수 있는 사람과 얘기를 하고 싶을 수도 있고, 사용하는 사람의 의도도 다르잖아요. 질문하는 방식은 비슷해 보여도 이걸 이용해서 내 과제를 5분 만에 하고 싶은 학생도 있을 수 있지만, 그것을 써보면서 영어 작문을 배우고 싶은 사람도 있을 수 있고요. 이렇게 사용자의 의도는 굉장히 다를 수 있다는 말이죠. 그러면 기술이 이 사용자의 의도를 어떻게 파악할 것이고 그 의도에 맞게 어떻게 행동을 해야 될 것인가 이런 것들이 다 연구 주제인 것 같아요.
<지난해 카이스트 인공지능연구원에서 발간한 책. AI와 다른 학문이 만나 어떤 새로운 기술을 만들어낼 수 있는지를 들여다봤다.>
Q. 챗GPT의 영향력을 어느 정도로 보고 계신 지 궁금해요.
제가 이런 언어 모델, 자연언어 처리 분야의 연구를 하는 사람이기 때문에 물론 그쪽으로 쏠려 있는 의견을 지금 드릴 수밖에 없는데요. 저는 굉장히 파괴적인, 파격적인 큰 영향력이 있을 기술이라고 봐요. 알파고와 가장 큰 차이는 알파고는 굉장히 전문적인 영역에 국한되어 있는 AI였으면 언어라는 것은 이 세상 모든 사람들이 그냥 사람이라는 정의, 사람을 어떻게 보면 다른 동물과 차별화할 수 있게 하는 게 언어잖아요. 그래서 AI가 언어를 풀면 AI를 다 풀었다 그런 얘기를 하는 사람들도 있는데 그만큼 극단적이지는 않아도 지능이라는 것의 굉장히 많은 부분이 언어로 표현되고 다른 사람한테 전달되고 기록되고 그렇다는 것을 생각하면 저는 알파고보다는 훨씬 더 영향력이 클 것이라고 봐요. 그런데 그게 챗GPT냐? 그것은 아니고요. 여기에서부터 시작을 하는 거겠죠.
Q. 그럼 자연어 처리의 약간의 맛보기 정도를 보여준 챗GPT가 어떤 식으로 가게 될까요?
언어는 소통의 도구이니까 누구랑 소통하냐, 그게 자신 자신과의 소통일 수도 있고, 우리가 다른 사람과 소통하는 것처럼 더 발전을 하겠죠. 사실 지금 챗GPT가 소통을 하고 있느냐? 되게 논란의 여지가 많고 어떻게 보면 ‘사용자가 굉장히 큰 데이터베이스와 소통을 하는 것’ 같은 그런 느낌이기도 해요. 몇 백억 개의 문서를 다 이렇게 꾸역꾸역 넣어서 거기에서 그것을 기반으로 뱉어내는 것이니까 (아직은) 좋은 소통은 아니겠죠.

<그림 그려주는 인공지능 서비스 DALL?E2에게 ‘큰 데이터베이스와 소통하는 사람’을 그려달라고 요청한 이미지. DALL?E2는 ‘사람(human)’을 남성으로 그려냈다.>

내가 철학자와 소통하고 싶다고 했을 때 얘기하게 해 줄 수 있고, 내가 제일 좋아하는 작가와 소통하고 싶다 했을 때 얘기하게 해 줄 수도 있고 아니면 정말 그냥 내 앞에 있는 다른 언어와 다른 배경을 가지고 있는 사람과 소통을 잘할 수 있게 해 준다든지, 또 앞으로 로봇이 중요해진다면 로봇과 사람이 어떻게 소통을 할지 그런 게 중요해지는 것 같아요. 좀 더 구체적으로 얘기하면 영역별로 나올 수도 있고 금융전문가 같은 챗봇 그리고 번역/통역이더라도 중국인이랑 반도체 비즈니스에 대한 통역을 제일 잘해주는 챗봇 이런 쪽으로 (더 세분화되면서) 발전하지 않을까 생각합니다.
Q. 전환기이다 보니 AI 같은 새로운 혁신기술 경쟁력의 입장을 생각하지 않을 수 없는데요. 우리나라가 기술분야에서 산업적으로나 국가 경쟁력을 위해 표준화라든지 뭐 잡고 가야 하는 부분들이 분명히 있을 텐데요. 지속가능성의 입장에서 뭐가 더 필요할까요?
저는 경쟁력이라는 것과 더불어 리더십을 같이 생각해야 한다고 생각해요. 우리가 미국만 보면 계속 뒤처지는 것 같지만 사실 한국의 기술력이 나쁘지 않거든요? 특히 지금 우리가 얘기하는 언어모델 쪽은 우리가 뒤처져 있지는 않아요. 그러니까 그게 1등을 못한다는 건데, 꼭 1등만 리더가 되는 것은 아니니까 다르게 보면 지금 전 세계에 몇 백 개의 나라가 있고 언어를 보면 몇 천 개의 언어가 있는데 사실 한국어 모델은 그중에서도 굉장히 많이 발전되어 있는 모델 중에 하나예요. 그런 의미로 봤을 때 우리가 리더로서 특히 이제 아시아를 보면 인구는 많은데 아직 이 분야가 덜 발전이 된 나라들이 많이 있고요.

아시아에 물론 중국이 있고 일본도 있지만 중국은 이제 미국이랑 싸우고 있고 일본은 우리랑 약간 비슷하다고 볼 수 있는데 그러면 일본이랑 한국이랑 이 아시아에서 어떻게 리더십을 갖고 갈 것인가? 언어 모델뿐 아니라 우리나라의 AI기술이 아시아를 어떻게 선도할 것인가 저는 그게 되게 중요하다고 보고 경쟁력에 있어서는 뭐 인력도 필요하고 데이터도 더 필요하고 투자가 더 필요한데 그중에서 이제 데이터는 좀 중요한 것 같아요. 한국어만 본다면 데이터가 사실은 지금으로서는 가장 병목 지점인 것 같아요. 법적으로 풀어야 되는지 방법은 잘 모르겠지만 더 많은 데이터를 확보할 수 있으면 충분히 우리가 경쟁력을 더 갖는 좋은 자원이 될 것 같아요.
Q. 학습시킬 데이터 말씀이시죠?
네, 개인정보보호 그런 것이 중요한 것은 맞지만 예를 들면 언론사의 SBS의 기사들도 우리가 학습데이터로 다 쓰지 못하거든요. 저작권 그런 이슈 때문이죠. 물론 미국도 챗GPT가 지금 저작권 이슈가 좀 많이 제기되고 있기는 한데 (경쟁력 입장에서는) 그런 게 좀 중요해요.
Q. 아시아의 리더가 될 수 있지 않나 하셨는데 다른 언어권이라도 리더가 될 수 있나요?
교육도 많이 시켜야 하고, 카이스트만 해도 외국학생들이 많이 와 있잖아요. 그리고 기업들도 네이버 같은 경우 아시아국가들에 많이 진출해 있기도 하고요. 정부가 좀 더 관심을 가지고 그냥 수출관점에만 볼 게 아니라 장기적으로, 예를 들면 구글 같은 회사도 미국 회사지만 인도네시아어, 베트남어 다 하고 있거든요. 그런데 일단 우리가 지역적으로도 더 가깝고 문화적으로도 더 비슷할 수도 있고 그런 장점을 살리면 저는 대학에 있으니까 수출의 관점보다는 언어와 문화, 지리, 역사, 그런 것을 잘 보고서 우리의 지능이라는 것은 역사, 문화, 이런 게 다 같이 있는 거잖아요. 그런 게 중요한 것 같아요.

그리고 언어에 따라서 기술이 다르지 않거든요. 예전에는 그랬는데 지금은 그냥 데이터만 있으면 사실 모델이 학습하는 방법은 똑같아요. 그래서 굳이 뭐 영어가 더 잘된다는 것은 그만큼 학습데이터가 많아서 그렇고 다양해서 그렇고 그래서 제가 데이터를 언급한 거예요.
과거 2007년 구글의 회장 에릭 슈미츠가 SDF연사로 처음 한국을 방문했을 때 앞으로는 “검색해서 없으면 세상에 없는 것이 될 것이다”라고 말해 이슈가 된 적이 있었는데요. 2000년대 초반 엄청 핫했던 ‘디지털’ 기술이 이제는 모든 곳에 적용되면서 보이지 않는 기술이 된 것처럼 AI도 점점 발전하면 ‘디지털’ 기술이 그랬던 것처럼 우리 삶의 모든 곳에 적용돼 보이지 않는 기술이 될 것으로 생각됐습니다.
Q. AI가 모든 곳에 적용돼서 디지털처럼 안 보이는 곳에 들어갈 가능성이 높다면 일반인의 입장에서는 어떤 고민과 질문들을 하는 게 현명할까요?
"나는 어떻게 더 깊은 생각을 할 수 있을 것인가”가 제일 중요하다고 생각해요. 예를 들면 언론에서 기사를 쓴다고 했을 때 튀르키예 지진이라고 하면 몇 명이 죽었고 하는 정보는 이제 자동으로 누구에게나 다 들어올 것이라고 생각한다면, 그러한 정보를 가지고 누군가는 더 깊이 있는 질문을 하게 되겠죠. 한국은 지진에서 안전할까? 이번 튀르키예 지진이랑 기후변화랑은 관련이 있을까? 캘리포니아 지진이랑 튀르키예 지진이랑 일본 지진이랑은 어떻게 연관이 있을까? 비리 얘기도 나오던데 건축과 정치적인 그런 구조와는 어떤 상관관계가 있을까? 그런 것을 쓸 수 있는 기자가 이제 경쟁력이 갖춰지는 것이겠죠. 이러한 인사이트를 넣어주면 기사는 AI가 써주니까 그러한 깊은 인사이트는 누가 갖고 있느냐 그게 이제 단순히 기사 쓰는 것만이 아니라 다른 모든 영역에서 필요해지겠죠. 의사들도 그렇고 교수도 그렇고 모든 직업에서 그렇게 될 거 같아요.

지난 24일, 대전 카이스트

Q. 신기술은 보통 좋은 쪽만 강조를 하게 되기 마련인데 우려를 해야 한다면 어떤 것들을 우려해야 할까요?
간단히 생각할 수 있는 것은 사기죠. 지금도 보이스피싱 같은 게 있어서 애가 문자를 보낸 것처럼 그런 경우들이 있는데 그걸 훨씬 더 잘 수 있다면 이게 정말 우리 애가 보낸 것인지, 우리 애 선생님이 보낸 것인지 신뢰할 수 없는 기술이 되는 순간, 그것을 이제 악의를 가지고 충분히 악용될 수 있다고 생각하고요. 그다음에는 페이크 뉴스, 우리가 지금도 뭐가 가짜인지를 찾아낼 방법이 있다고 하지만 지금까지는 판별하는 기술의 정확도가 30 몇 프로라나 이게 아직 잘 안 되는 거예요. 이상한 가짜 정보가 다양한 매체에 다양한 글로 다양한 어투로 전해진다면 여러 군데 그런 이야기가 써져 있을 때 거짓 정보, 허위 사실을 더 믿게 되기가 싶겠죠. 그런 위험이 있을 수 있을 것 같아요. 그러니까 그런 연구도 계속해야 되는 거죠.
Q. 그럼 앞으로의 인공지능은 어떤 쪽으로 가게 될 것이라고 생각하세요?

저는 멀티 모달[1]로 확실히 갈 것이라고 생각하고. 사람의 지능이라는 게 멀티 모달입니다. 우리가 보기도 하고 쓰기도 하고, 오감이 있고 걔네들이 다 축적이 되어서 우리가 태어나서부터 이렇게 몇 십 년을 살면서 그 오감으로 느끼는 습득하는 모든 지식이 쌓여서 한 사람이 되는 거잖아요. 그렇게 될 것 같아요. 인공지능이 오감을 가지게 되고, 또 하나는 각자 다른 사람들이 있는 것처럼 인공지능도 다 각자 다른 성격을 가진, 스타일을 가진 것들이 나오겠죠. 간단하게 생각하면 아기처럼 혹은 어린이처럼 굉장히 호기심이 많다든지, 그래서 막 모든 것에 막 질문하고 뭔가 재밌게 얘기해 주면 굉장히 잘 웃고 아니면 굉장히 심각한 50대 사람이라서 감정기복이 없고 정치뉴스만 보고 이런 것을 만들 수도 있겠죠.


[1] 멀티 모달(Multi Modal)은 전통적으로 텍스트 외에 음성, 제스처, 시선, 표정, 생체신호 등 여러 입력 방식을 융합하여 인간과 컴퓨터 사이에 자연스러운 의사소통이 가능한 사용자 친화형 기술을 의미한다.

Q. 한국어 기반의 언어 모델 AI는 언제쯤 나오게 될까요?

몇몇 회사들이 하고 있고 올해 나오지 않을까 제 예상은 올해 하반기에는 나오지 않을까 생각합니다.[2] GPT도 사실 GPT3.5의 기술에 기반해서 나온 거고, GPT3.5는 나온 지 한 1년 됐나? 그러니까 그 정도의 언어 모델 자체는 제가 알기로는 적어도 LG랑 네이버, 카카오, SKT 4개 기업은 하고 있는 것으로 알고 있습니다.

[2] 네이버는 지난달 27일, ‘챗GPT’ 대비 한국어를 6500배 더 많이 학습한 초대규모 인공지능 서비스인 ‘하이퍼클로바X’를 7월 중, 챗봇 AI검색 엔진 ‘서치GPT’를 상반기 중 출시한다고 밝혔고, 카카오도 지난 3일 인공지능 자회사 카카오브레인에서 올상반기 한국어에 특화된 초거대 AI 언어모델 '코GPT'의 업그레이드 버전을 출시할 계획이며, 이르면 올해 3분기 내 챗GPT에 대응한 AI 챗봇 서비스 '코챗GPT'을 출시할 계획이라고 밝혔다.

<세계최대 이동통신전시회로 알려져 있는 월드모바일콩그레스(WMC)에서도 올해의 관심은 단연 ‘AI’였다. 위 자료는 인도 미디어 AIM에서 만든 기업별 대표 초거대언어모델 챗봇의 부상을 보여주는 표로 국내 기업 가운데 유일하게 ‘LG AI리서치’가 언급됐다.> Analytics India Magazine
Q. 포럼에서 저희가 AI를 다룬다면 어떤 이야기를 다루는 게 의미가 있을까요?
앞으로 AI는 우리랑 공존하게 될 것이고 공존할 때 나는 어떻게 할 것인가, 대학은? 기업은? 정부는 어떻게 해야 할 것인가? 언론도 훨씬 더 많이 쓰게 되지 않을까? 제가 지난 12월 학회에 갔을 때 ‘펭귄랜덤하우스’라는 미국 출판사 있잖아요. 거기에서 북커버를 미드저니(midjourney)라는 그림 그려주는 AI가 책 표지를 만든다고 하더라고요. 거기에도 AI팀이 있고, 그런 연구도 하고 원래는 아티스트들이 책 표지를 그리는데 이제는 아티스트들이 그 툴을 쓰면서 자기가 원하는 데로 책 표지가 나오게 하고 있다고 하더라고요. 방송국이나 할리우드에서도 당연히 더 많이 쓰게 될 것 같고, 그런 것을 쓰지 않아야 된다는 사람들도 있지만 논란의 여지는 당연히 있겠죠. 그래도 당장 쓰지는 않더라도 방송사나 언론사도 AI 연구는 해야 하지 않을까 그렇게 생각합니다.
지난 8일 세계적인 언어학자 노암 촘스키 미국 MIT 교수와 이언 로버츠 영국 케임브리지대 교수, 그리고 사회기술기업인 오셔니트의 제프리 와터멀 AI국장이 ‘챗GPT의 거짓약속’이라는 제목으로 뉴욕타임스에 공동기고문을 올렸습니다. 아직 제약이 많은 머신러닝이 우리 언어와 지식을 관장하는 기술에 녹아들 경우 과학과 윤리의 수준을 저하할 수 있음을 경고하는 내용이었습니다. 특히 챗GPT는 ‘도덕적 사고’를 할 수 없어 옳고 그름을 제대로 인지할 수 없고, 표절 등의 이슈에 대처할 수 없는 것이 큰 맹점이라고 지적했습니다.
저도 저를 잘못 소개하던 GPT3.5 기술의 ‘챗GPT’에게 저의 정보를 제대로 알려주고 정정을 해주는 게 맞는 것인지 잘못됐다고만 알려주고 정확한 정보는 주지 않는 것이 맞는 행동인지 쉽게 판단이 잘 되지 않았는데요. 그럼에도 북한을 취재한 적 없다고만 언급하고 다시 물었더니 이번에는 이렇게 두루뭉술한 한 답을 주었습니다.
이후 출시될 것이라는 GPT4기술을 활용한 서비스는 얼마나 더 발전된 답을 줄 수 있을지 새삼 궁금해집니다.

(글 : 미래팀 이정애 기자)
SDF다이어리를 보시고 소중한 의견이 떠오르셨다면 sdf@sbs.co.kr로 메일을 보내주세요!
전체 목록

SDF다이어리를 빠짐없이 받아보세요!