‘GPT-3’보다 6500배 많은 한국어 데이터 학습
204B 세계 최대 한국어 언어모델로 AI 주권 확보
네이버가 25일 국내 기업 최초 ‘초대규모 인공지능(AI)’인 ‘하이퍼클로바(HyperCLOVA)’를 공개하고 글로벌 AI 기술 리더로 발돋움하겠다는 계획을 밝혔다.
네이버는 이날 온라인으로 열린 ‘네이버 AI 나우(NAVER AI NOW)’ 컨퍼런스에서 지난해 10월 슈퍼컴퓨터 도입 이후 네이버 AI 기술의 성과와 앞으로의 방향성을 공개했다. 하이퍼클로바는 네이버가 국내 기업 최초로 자체 개발한 초대규모 AI다.
정석근 네이버 클로바(CLOVA) 사내독립기업(CIC) 대표는 키노트에서 “글로벌 기술 대기업들은 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있다”며 “한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다”고 개발 배경을 밝혔다.
기존에는 하나의 AI 서비스를 만들기 위해 각 문제별로 데이터를 확보한 뒤 기계 학습 형태로 정제한 모델을 개발하고, 이를 서비스로 만드는 엔지니어링 작업이 필요했다. 이는 긴 시간과 리소스가 필요했으며 결과물을 다른 영역의 문제에 활용하는 것도 제한적이었다.
정 대표는 “빅 AI는 이 패러다임를 완전히 바꿔 하나의 커다란 모델을 만들고 다양한 문제에 적용하는 방식”이라며 “모델 자체의 플랫폼화, 일반화와 확장이 본격적으로 가능해진 것”이라고 설명했다.
예를 들면 AI가 문서를 요약하고 대화를 번역할 뿐 아니라 상식퀴즈에 대답하는 것도 가능해진다.
정 대표는 “이는 과거 반도체 기술 발전 양상과 유사해보인다”며 “반도체 집적도 수준이 향상될 때마다 새로운 디바이스와 서비스가 시장에 나올 수 있었다면, 빅 AI에서는 모델 크기인 ‘파라미터(매개 변수)’ 수가 반도체의 집적도를 뜻하게 될 것”이라고 언급했다.
이어 “글로벌 기술 대기업들은 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있고 글로벌 무한경쟁에 돌입했다”며 “네이버는 대한민국 가장 많이 사용하는 플랫폼 운영 노하우를 통해 방대한 데이터 다룰 수 있고, 이 역량이 중요한 역할을 하게 될 것”이라고 자부했다.
네이버의 하이퍼클로바는 오픈AI의 GPT-3(175B)를 뛰어넘는 204B(2040억개) 파라미터 규모로 개발됐다. AI 모델의 크기를 나타내는 파라미터의 수가 높아질수록 AI는 더욱 많은 문제를 해결할 수 있게 된다.
하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한 현재 전 세계에서 가장 큰 한국어 초거대 언어모델이기도 하다. 영어가 학습 데이터의 대부분을 차지하는 GPT-3와 달리 하이퍼클로바 학습 데이터는 한국어 비중이 97%에 달한다. 영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어모델을 개발함으로써 AI 주권을 확보한다는 의미가 있다.
이를 위해 네이버는 지난해 10월 국내 기업 최초로 700 페타플롭(PF) 성능의 슈퍼컴퓨터를 도입하며 대용량 데이터 처리를 위한 인프라를 갖췄다. 하이퍼클로바 개발을 위해 5600억개 토큰(token)의 한국어 대용량 데이터도 구축했다.
산학협력에도 공을 들이고 있다. 네이버는 ‘서울대-네이버 초대규모(Hyperscale) AI 연구센터’를 설립하고, 카이스트 AI 대학원과는 ‘카이스트-네이버 초창의적(Hypercreative) AI 연구센터’를 설립하는 등 긴밀한 산학협력을 통해 AI 공동 연구에 박차를 가하고 있다.
네이버는 앞으로 한국어 외 다른 언어로 언어 모델을 확장하고, 언어뿐만 아니라 영상이나 이미지 등도 이해하는 ‘멀티모달(Multimodal) AI’로 하이퍼클로바를 발전시켜나갈 계획이다.
네이버는 하이퍼클로바의 기술을 자사 서비스에 적용해 사용자들에게 차별화된 경험을 제공할 예정이다. 첫 번째 사례로 지난 6일 검색 서비스에 하이퍼클로바를 적용해 사용자가 검색어를 잘못 입력하는 경우 올바른 단어로 전환해 검색해주거나 적절한 검색어를 추천해주는 기능을 선보인 바 있다.
네이버는 하이퍼클로바가 중소상공인(SME)·크리에이터·스타트업 등 기술의 도움이 필요한 ‘모두의 능력’이 될 수 있도록 지원한다는 계획이다. 간단한 설명과 예시를 제시하는 소수학습(Few-shot learning) 방식으로 AI를 동작시킬 수 있기 때문에 AI 전문가가 아니어도 누구나 손쉽게 AI 서비스를 만들 수 있게 된다.
예를 들어 상품 판매에 도움이 되는 적절한 마케팅 문구를 AI가 자동으로 작성해주는 일, 공부해야 할 내용을 AI가 빠르게 요약하거나 모르는 내용을 질문했을 때 자연스럽게 답변해주는 일 등이 가능해질 전망이다.
정 대표는 “더 짧은 시간과 더 적은 리소스를 사용해서 이전에 우리가 상상만 했던, 또는 우리가 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다”며 “하이퍼클로바를 통해 SME와 크리에이터를 포함해 AI 기술이 필요한 모두에게 새로운 경험을 제공할 것”이라고 강조했다.