SDF 다이어리

Ep.168

Ep.168AI시대, 저널리즘은 어디로 가고 있을까?

2023.09.27
안녕하세요? 2023년 SBS D포럼을 36일 앞두고 보내드리는 지적인 당신을 위한 인사이트, SDF다이어리입니다. SDF는 올해 초거대 AI의 등장으로 언론의 생태계는 어떻게 달라지게 될지 또한 주요한 관심사로 들여다보고 있는데요. 모든 분야의 기존의 공식이 뒤바뀌고 있는 이때, 언론은 어떤 방향성을 가지고 더 좋은 보도를 해 나가야 할까요? 언론과 AI는 어떻게 새로운 관계를 맺게 될까요? 언론의 고민이 넓고 깊어질 수밖에 없는 시점입니다.
이 질문에 대한 힌트를 얻기 위해 AI와 저널리즘에 대해 앞서 고민하고 새로운 시도를 하고 있는 SBS의 데이터 저널리스트 배여운 기자를 만나 이야기를 나눠봤습니다.
Q. 안녕하세요? 먼저 간단히 자기소개 먼저 부탁드립니다. 더불어 데이터 저널리스트가 무엇인지도 설명 부탁드립니다. 일반 취재기자와는 어떻게 다른가요?
네. 저는 SBS 데이터 저널리즘팀 ‘마부작침’이라고 하는 팀에서 데이터를 활용해 기사를 쓰고 있고요. 주로 데이터 저널리즘 기법을 활용한 보도를 하기 위해서 매일 같이 데이터를 바라보고 있습니다.

그리고 요즘에는 ‘굳이 데이터 저널리스트와 일반 취재기자를 구분할 필요가 있나?’라는 생각도 하는데요. 왜냐하면 최근에 취재기자들이 판결문 분석을 한다든지 혹은 공공데이터를 가지고 와서 간단하게 통계를 내서 기사에 활용하는 것 자체가 사실 데이터 저널리즘이라는 기법을 활용하는 것이거든요. 그런데 차이를 설명하자면 저 같은 경우에는 ‘데이터 드리븐’(데이터 중심 결정)을 더 들어가는 것 같아요.

일반 기자들에게 취재원이라고 하면 사실 사람이죠. 그리고 취재원을 통해서 기사의 소스들이 많이 나오게 되고 이를 취재해서 기사 보도로 이어지게 되는데요. 저 같은 데이터 저널리스트에게 취재원은 데이터입니다. 제가 데이터에게 어떻게 더 정밀하게 질문을 하고 또 기술적으로 접근을 하는지에 따라 데이터가 답변하는 부분이 달라지기 때문에 저는 조금 더 일반 취재기자들보다는 더 데이터 드리븐(데이터 중심 결정)에 집중해서 접근하는 게 조금 차이라고 볼 수 있을 것 같습니다. 질문에 대한 답을 데이터를 통해서 찾는 거죠.
Q. 기억에 남는 데이터 저널리즘 기사는 어떤 것들이 있으신가요?
저는 데이터를 활용한 공직 감시에 되게 관심이 많거든요. 특히 지방의회를 감시하는 거에 큰 관심을 가지고 있습니다. 왜냐하면 국회 같은 경우는 모든 언론사에서 다 감시를 하고 있어요. 잘 드러나기 때문이죠. 하지만 우리 실생활에 직접적인 관련이 있는 곳 중의 하나가 우리 동네의 지방의회인데, 제가 분석을 시작하기 전까지 지방의회는 사실 좀 사각지대에 많이 놓여 있었거든요? ‘지방의회는 업무추진비를 잘 쓰고 있을까? 지방의원들은 법과 규칙을 잘 지키고 있을까?’라는 의문이 들었습니다. 우리의 큰 관심에서 벗어나 있지만 그들도 공직자이기 때문이죠.

그렇게 질문을 던지고 나서 지방의회와 관련된 업무추진비 데이터, 혹은 공직자 재산데이터에 대해 정보공개 청구를 하거나 또 다양한 방법으로 데이터를 수집해서 분석을 했더니 실제로 방만한 경영을 하면서 공직에 임하고 있는 케이스들이 많았습니다.
또 제가 데이터를 한참 보고 분석을 하다 보면 어떤 인사이트들이 나오는 경우가 있는데요. 최근 3월의 일인데, 전국의 모든 필지, 토지 데이터를 정부에서 공개하고 있는 게 있습니다. 필지에 대한 정보들이 다 들어있는 데이터거든요. 그렇게 많은 데이터를 보다 보니 토지 거래일이 일제 강점기거나 소유자 구분이 창씨개명 혹은 일본인이라고 표시가 되어 있던 땅들이 보이기 시작한 겁니다. 그래서 그런 땅들이 무엇인지 좀 더 자세히 보기 위해서 지도 위에 시각화를 해봤더니, 이게 웬걸? 첨성대 앞의 땅들이 아직도 일본인 명의로 남아 있었던 게 있던 거죠. 일본의 잔재가 남아 있는 건데, 그런 경우는 질문으로 시작하지는 않았지만 데이터 분석을 하면서 찾았던 기억에 남는 사례입니다.
Q. 데이터 저널리스트로서 취재 과정에서 가장 난이도가 높거나 혹은 신경을 쓰는 부분은 뭔가요?
일단 가장 난이도가 높은 건 데이터 수집인 것 같아요. 그러니까 사실 첫 단추부터가 굉장히 어렵습니다. 왜냐하면 저는 데이터 저널리즘을 주로 요리와 비슷하다고 생각을 하거든요. 좋은 요리는 결국 좋은 재료에서 시작하는 것처럼 좋은 데이터 저널리즘 기사는 결국 좋은 데이터, 양질의 데이터에서 시작하기 때문이죠. 때문에 양질의 데이터를 얻으려고 많은 노력을 하고 있습니다. 대표적인 예가 정보공개 청구인데요. 사실 우리나라 같은 경우는 정부가 ‘데이터를 많이 공개하고 있다’고 자평을 하고 있지만, 데이터 저널리스트 입장에서 보면 사실 데이터의 질과 양이 썩 좋지는 않아요. 정보 공개 청구를 했을 때 사실 공개되는 경우가 많이 없기도 하고요. 그래서 정보공개법을 잘 공부해서 정부나 지자체가 정보 공개를 할 수밖에 없게끔, 방법을 찾아서 그렇게 기술적으로 정보공개 청구를 좀 많이 하고 있는 편입니다.

그리고 그렇게 얻은 데이터는 결국 ‘로우 데이터’를 얻은 거거든요. 바로 데이터 분석을 하기는 힘들어요. 요즘 AI가 유행이지만, 기본적으로 AI는 데이터를 학습시켜야 하는데 학습시키기 조차 어려운 데이터들을 보통 많이 받거든요. 데이터 정제를 해야 되는데 거기에서 시간을 많이 차지하게 되죠.

그런데 제가 이 일을 시작하고 나서 늘 신념처럼 생각하는 것은 데이터 저널리즘이라는 게, ‘데이터’와 ‘저널리즘’을 결합한 단어인데 데이터보다는 저널리즘에 좀 더 방점을 둬야 한다고 생각하거든요. 제가 만들고 있는 제일 마지막 결과물은 기사니까요. 저널리즘 측면에서 위배되는 것들이 없는지를 많이 신경 쓸 수밖에 없고 실제로 그렇게 하고 있습니다. 이 부분이 제가 일반 IT업계의 데이터 분석가와 언론의 데이터 저널리스트의 차이라고 생각하는 부분입니다. 효율적인 것보다 조금 더 시간이 걸리더라도 왜곡되지 않고 틀리지 않는 숫자가 보도되도록 하는 것이죠.
Q. 데이터 저널리즘의 가장 큰 장점은 무엇이라고 보세요?
결국에는 객관적이라는 게, 객관적인 보도가 가장 큰 장점이지 않나?라고 생각을 합니다. 데이터라는 것은 결국 어떤 흔적이고 누가 반박할 수 없는 되게 객관적인 자료 중에 하나거든요? 이를 분석해서 어떠한 결과, 숫자를 뽑아내고 보도를 했다는 것은 논란이 있을 수가 없는 보도기 때문에. 제가 아니더라도 동일한 데이터를 활용해서 누군가 분석을 한다면 똑같은 결과가 나온다는 것이 데이터 저널리즘의 장점이 아닐까 생각합니다.
새로운 저널리즘의 탄생으로 여겨졌던 데이터 저널리즘이 국내에 등장한 지도 벌써 10년이 넘었습니다. 그리고 올해 챗GPT 대변되는 본격적인 AI시대가 개막되면서 언론도 거스를 수 없는 전환점을 맞이하고 있는데요. 데이터를 다루고 분석하는 데이터 저널리스트에게 ‘데이터’를 핵심으로 작동하는 AI의 등장은 어떤 영향을 끼치고 있을지 궁금했습니다.
Q. 데이터 저널리스트에게 AI는 유용한 도구의 탄생인가요? 위협적 존재인가요?
저는 존재의 위협이 된다고 생각하지는 않아요. 올 초에 챗GPT 광풍이 엄청났었잖아요. 저도 데이터를 다루다 보니까 챗GPT도 많이 써보게 되고 최근에는 이를 활용한 프로젝트들도 좀 하고 있는데요. 챗GPT가 기자들을 대신할 수 있을까요?라는 질문들을 많이 하시는데, 저는 절대 그럴 일은 없다고 생각하는 쪽입니다. 왜냐면 기자들은 ‘뉴스’를 전하기 때문이죠. 뉴스라는 새로운 것들. 그런데 GPT는 새로운 것들을 만들어내지는 않아요. 취재를 하고 확인하는 과정을 거치지 않는 거죠. 엄밀하고 정확하게, 저널리즘에 충실한 그런 기사를 만들어 내는 건 결국 사람의 영역인 것 같아요.

하지만 취재 과정에서 도움을 받을 수 있는 영역은 AI에서 정말 많아진 것 같아요. 결국 AI라는 것은 데이터를 학습시켜서 우리가 원하고자 하는 것을 얻어내는 거잖아요. 저는 데이터를 다루는 사람이고요. 그런 생각으로 지금 AI를 활용한 프로젝트를 몇 개 기획 중입니다. 그것 중 하나가, 매년 공직자 재산 데이터를 PDF형태로 정부가 공개를 하는데요. 저는 그걸 매년 데이터를 DB화 시키거든요? 저도 가지고 있는 데이터가 쌓이고 있는데 매번 똑같은 작업과 분석을 하는 게 조금 비효율적이라고 생각이 들 때가 있어요. 그러면 이런 부분들을 AI에 학습시켜서 제가 필요한 것들을 물어보면 답을 해줄 수 있게 한다든지, 도움을 받고 싶은 부분은 분명히 있죠. AI기술은 기자들이 어떻게 기획하고 접근하는지에 따라 도움받을 수 있는 것들은 다양해질 것 같아요.
Q. AI를 활용한 프로젝트를 기획 중이라고 하셨는데요. 짧게 더 소개해 주실 만한 게 있을까요?
네. 곧 출시가 될 거지만 현재 ‘폴리스코어’라는 서비스를 만들고 있고요. 그 서비스는 정치인들의 최근 이슈를 GPT 기반으로 요약해 주는 서비스입니다. 이게 무슨 말이냐면, 우리는 너무 많은 정치인들의 이슈가 쏟아지는 시대에 살고 있잖아요. 대부분 뉴스를 포털에서 소화하긴 하겠지만 내가 보는 하나의 뉴스만을 가지고 어떤 정보를 이해한다는 것은 좀 위험할 수 있다고 생각했거든요. 그래서 어떤 정치인의 모든 뉴스를 다 모아서 이를 우리가 좀 요약해서 전달해 주면 어떨까?라는 생각에 데이터 분석 업체인 ‘언더스코어’와 함께 정치인 이슈 요약 서비스인 ‘폴리스코어’를 막바지 개발중에 있습니다. 예를 들어 ‘지금 대통령의 이슈가 뭐야’?라고 물어보면 윤석열 대통령과 관련된 이슈들을 깔끔하게 대답해 주는 서비스입니다.
Q. 챗GPT를 비롯한 생성형 AI 검색 엔진들은 이슈 민감도 때문에 정치 이슈에는 답하지 못하는 경우가 많은데요. 이 부분이 언론의 역할이라고 보시는 건가요?
GPT의 가장 큰 한계는 소위 말하는 ‘할루시네이션’, 환각 현상이죠. 무엇을 물었을 때 잘못된 답변을 너무 당당하게 말을 해주기도 하잖아요. 그래서 언론사에서, 저널리즘에서 AI를 쓴다고 했을 때 저는 가장 크게 신경 써야 하는 부분이 할루시네이션을 없애고 정말 정치인들의 이슈를 가장 사실에 가깝게 말해줘야 한다고 생각했고, 그게 언론에서 AI를 다룰 때의 핵심인 것 같아요. 언론은 절대 거짓말을 하면 안 되니까요. 그 부분에 대한 고민을 굉장히 많이 했고, 할루시네이션을 제거하는 기술들을 많이 개발했습니다.
‘초거대 AI의 등장이 나의 직업, 특정한 직업을 대체할 것인가?’라는 두려운 질문은 여전히 우리 앞에 놓여 있습니다. 하지만 그에 대한 답을 찾는 중에 우리에게 빠져서는 안 되는 질문은 “내 직업에서 AI를 어떻게 활용할 수 있을 것인가” 일 겁니다. 이에 대한 배여운 기자의 생각은 아래와 같았습니다.

“저는 개인적으로 다양한 산업에서 기술이 항상 마지막에 문을 넘는 게 언론이라고 생각하거든요. 그런데 지금 AI라는 하는 기술은 이제 점점 언론의 문을, 담을 넘고 있는 것 같아요. 이게 기회일 수 있다는 생각이 들어요. AI의 재료는 결국 데이터잖아요? 그래서 기존의 데이터 저널리즘의 모델을 넘어서 더 고도화시키고 싶다는 생각을 하고 있습니다. 또 SBS도 그간의 뉴스 속 텍스트, 영상, 음성과 같은 다양한 데이터들이 많이 쌓여있는데, 이를 어떻게 AI에 활용하고 접목할 수 있을지 어떤 여지가 있는지 그 부분에 기여할 수 있도록 하고 싶어요.”

AI라는 굉장히 가능성이 높고 유용할 수 있는 도구를 어떻게 활용해 새로운 산업과 가치를 만들어 나갈지 머리를 맞댄 공론의 장이 반드시 필요한 때입니다.
(글: 최예진 작가 sdf@sbs.co.kr)
SDF다이어리를 보시고 소중한 의견이 떠오르셨다면 sdf@sbs.co.kr로 메일을 보내주세요!
전체 목록

SDF다이어리를 빠짐없이 받아보세요!