일본산업뉴스요약

‘일본 국내 최고 성능'의 LLM으로 빅테크에 대항 AI벤처 ‘ELYZA’의 도전은 성공할 수 있을까?
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2024.3.13
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2024-03-21 22:38:36
  • 조회수73

Nikkei X-TECH_2024.3.13

‘일본 국내 최고 성능'의 LLM으로 빅테크에 대항
AI벤처 ‘ELYZA’의 도전은 성공할 수 있을까?

AI(인공지능) 스타트업 ELYZA가 국산 LLM(대규모언어모델)으로 공세에 나선다. 올 3월 12일, ELYZA는 현시점에서 일본 국내 최고 성능을 가진 LLM을 개발했다고 발표했다. 이 LLM을 활용한 생성 AI 서비스를 2024년 봄에 시작. 일본어 처리에 뛰어난 성능을 내세워 수요를 개척해나갈 계획이라고 한다.

하지만, 현재 “국내 LLM의 최고 수준은 겨우 글로벌 상용 레벨에 불과”(ELYZA의 소네오카(曾根岡) CEO)하기 때문에 오픈AI나 구글과 같은 해외 대기업들에 크게 뒤처져 있는 실정이다. 자금력에서 월등한 세계적 빅테크에 스타트업이 대항하기는 쉽지 않다.

-- 글로벌 LLM에 필적하는 수준 달성 --
ELYZA는 도쿄대학 마쓰오(松尾) 교수의 연구실에서 출발한 AI 스타트업이다. 새롭게 개발한 ‘ELYZA-japanese-Llama2-70b’는 메타(Meta)가 오픈소스소프트웨어(OSS)로 공개하고 있는 LLM ‘Llama2’를 기반으로 개발한 것이다. 700억 파라미터의 Llama2에 일본어 데이터를 사용한 사전 학습을 실시. ELYZA가 독자적으로 마련한 데이터 세트를 사용해 다양한 일본어 처리에 적응시켜 나가는 '포스트 트레이닝'을 거듭해 개발했다.

모델 개발에는 정부 지원을 활용했다. ELYZA는 2023년 10월에 산업종합연구소 생성 AI 개발지원프로그램에 채택되었다. AI용 슈퍼컴퓨터 ‘ABCI’를 사용해 2023년 12월부터 2개월에 걸쳐 모델 개발을 추진했다.

“글로벌 LLM에 필적하는 수준을 달성했다”라고 소네오카 CEO는 자신 있게 말한다. ELYZA는 LLM의 성능을 평가하는 벤치마크 테스트 중 하나인 ‘Japanese MT-Bench’를 사용해 국내외 주요 LLM과 일본어 처리 성능을 비교 평가했다.

문장 집필이나 추론, 수학적 지식, 프로그램 코딩 등8개 항목의 성능을 비교한 결과, 비교 대상으로 한 글로벌 모델 8종류 중에서 전체 평균은 7위. 수학적 지식과 코딩을 제외한 6개 항목으로 한정하면 4위였다고 한다.

소네오카 CEO에 따르면, ”객관적으로 볼 때 2023년 말 시점에서 국내 모델은 글로벌 모델과 성능에서 크게 차이가 있었다”. ELYZA가 독자적으로 개발한 벤치마크로 비교하면, 일본어 처리의 스코어는 ELYZA의 130억 파라미터 모델이 대략 3.0. ELYZA가 실험해본 결과, 구글이나 오픈AI등 세계적 대기업들의 모델은 모두 3 포인트 대 중반이었다.

소네오카 CEO는 이번에 새롭게 개발한 모델에서 “글로벌 모델에 필적하는 수준의 성능을 달성했다”라고 한다. 이 새로운 모델의 스코어는 3.62로, GPT-3나 Gemini-Pro과 비슷한 수준이라고 한다.

ELYZA는 일본어 처리의 출력 사례를 제시하며 그 성능을 어필했다. 장문을 요약하고, 문제점과 해결책을 정리하거나, 간단한 문장형 산수 문제에 순서대로 답하는 등, 예제에 문제없이 답변할 수 있다고 한다. 예를 들면, ‘언덕이 많은 마을로 유명한 나가사키(長崎). 오르막과 내리막 중 어느 쪽이 더 많은가?’라는 문제의 정답은 '똑같다'이다. ELYZA의 새로운 모델은 '함정이 있는 문제'라고 지적하며 정답을 맞췄다. 반면, 챗GPT는 만족할만한 답변을 출력하지 못했다고 한다.

ELYZA는 새롭게 개발한 LLM을 사용한 상용 서비스를 2024년 봄에 개시할 예정이다. ‘ELYZALLM for JP’라는 이름으로 API(애플리케이션 프로그래밍 인터페이스)를 통해 기능을 제공. LLM을 사용한 생성 AI 기능을 자사의 사업이나 서비스에 포함시키고 싶은 기업, 정보 보안이나 기업 별 커스터마이징을 중시하는 기업의 수요를 전망하고 있다. 업계나 기업에 특화된 LLM 개발도 추진해나갈 방침이다.

-- 해외 대기업의 자금력이 넘어야 할 장벽 --
현시점에서 국내 최고라고 주장하는 ELYZA. 이제 ELYZA가 상대해야 하는 것은 세계적 빅테크들이다. 하지만 그 앞길은 순탄치만은 않다.

무엇보다 가장 큰 장벽은 자금력이다. 오픈AI에는 마이크로소프트, Anthropic에는 아마존닷컴이 각각 출자. 구글과 메타를 포함해 세계 톱 클래스의 LLM 개발 기업들은 월등한 자금력을 가지고 있다.

자금력을 확보하는 의미에서도 새롭게 개발한 모델을 사용한 비즈니스 모델 확립이 필수적이다. ELYZA LLM for JP의 요금 체계는 미정으로, 안정적 운용에 필요한 컴퓨터 자원과 고객 기업의 데이터량, 이용 빈도 등을 포함해 검토할 계획이라고 한다.

소네오카 CEO는 새로운 서비스 자체만으로 “많은 수익을 올리려는 것은 아니다”라고 한다. 오픈AI조차도 투자 부담과 수익화의 밸런스를 모색하고 있는 가운데, 비즈니스로 연결하는 것은 결코 쉽지 않기 때문이다.

모델의 성능도 더욱 높일 필요가 있다. 해외 대기업들과 동등한 수준이라고는 하지만, 소네오카 CEO는 “어디까지나 표준적인 상용 수준에 이른 것에 지나지 않는다”라고 말한다. ELYZA의 독자적인 평가에 따르면, GPT-4의 스코어는 4 포인트 이상으로, ELYZA의 새로운 모델을 크게 상회한다. 또한 다른 성능 향상을 위해서도 역시 자금력 확보가 필수적이다.

“얼라이언스나 자금 조달 등을 추진하지 않으면 안 된다”. 소네오카 CEO도 자금력의 차이를 가장 큰 과제로 인식하고 있다. 그가 기대하는 것은 정부의 지원이다. 그는 구체적인 자금 지원 확충을 목표로 로비를 추진할 방침을 밝혔다.

그는 “정부의 지원을 얻지 못한다면 3~4년 안에 자금이 떨어져 세계적 대기업들의 모델만이 사용될지도 모른다”라며 이러한 우려를 현실로 만들지 않기 위해서라도 우선은 새로운 사업을 궤도에 올릴 필요가 있다고 한다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록