PART 01 [SDF2023] 올바른 데이터로 만드는 세계 최고의 고성능 프라이빗 LLM 2023.11.02 영상 전체 보기
영상 크게 보기
#모두를위한AI #국내LLM독립 #의미있는데이터

챗GPT가 불러온 생성형 AI 열풍으로 거대언어모델(LLM)이 차세대 산업 트렌드로 자리잡은 가운데, 기업 내부 데이터만 학습해 데이터 외부 유출을 원천 차단하고 거짓 정보를 지어내는 환각 현상(할루시네이션) 방지에 특화된 ‘프라이빗 LLM’은 생성형 AI 시장 판도를 뒤흔드는 게임 체인저로 부상하고 있다. 하지만 외국어 중심으로 학습된 빅테크의 LLM은 한국어 실력은 물론 정서나 지역적 정보에 취약해 국내 기업들이 활용할 프라이빗 LLM 발전에 걸림돌이 되고 있다. 이에 업스테이지는 1조 규모의 한국어 토큰 데이터를 수집하는 '1T 클럽'을 발족, 데이터 제공자와 모델 제작기업이 상생하는 생태계 확립으로 국내 LLM 독립에 나섰다. 업스테이지는 올바른 데이터로 만든 세계 최고의 고성능 프라이빗 LLM을 통해 대한민국 산업지형을 바꿀 AI 혁신을 제시한다.