일본산업뉴스요약

투자 모집하는 '오픈AI의 라이벌'의 실력 -- Anthropic와 Cohere는 무엇이 대단한가?
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2023.12.12
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2023-12-19 15:55:29
  • 조회수224

Nikkei X-TECH_2023.12.12

오픈AI만이 아니다, 세계가 주목하는 생성 AI 스타트업 25사
투자 모집하는 '오픈AI의 라이벌'의 실력
Anthropic와 Cohere는 무엇이 대단한가?

주목할 만한 해외의 생성 AI(인공지능) 스타트업 25사. 이번에 소개할 곳은 대규모 언어모델(LLM)을 비롯한 AI 모델을 개발하는 업체들이다. 챗GPT를 개발한 미국 오픈AI가 주목을 받고 있지만, 미국의 대형 IT기업 등은 제휴처로 오픈AI의 라이벌 기업에 뜨거운 시선을 보내고 있다. 미국 Anthropic(앤스로픽)이나 캐나다의 Cohere(코히어) 등 유력 기업 6사의 실력은 어떨까?

이번에 소개할 스타트업 6사는, Anthropic(미국), Cohere(캐나다), AI21 Labs(이스라엘), Stability AI(영국), Inflection AI(미국), MosaicML(미국)이다.

“우리가 무엇을 하려고 하는지를 파헤치기 위해 ‘파트너’를 소개하겠다”. 미국 시간 2023년 11월 28일, 미국 아마존웹서비스(AWS)가 개최한 연례 이벤트 ‘re:Invent’ 기조강연에서 AWS의 애덤 셀립스키 CEO는 이렇게 말하며 한 인물을 소개했다.

단상에 올라온 사람은 미국 Anthropic의 공동창업자 다리오 아모데이(Dario Amodei) CEO다. 개발자를 비롯한 수천 명의 전문가들로 가득 찬 행사장에서는 일제히 박수가 터져 나왔다.

급속하게 성장하는 AI 스타트업 기업을 상징하는 것은 생성 AI의 기반 기술인 LLM 등을 개발하는 기업이다. AI 관련 유니콘 상위 10개사 중 5개사를 차지한다. 대표격이 오픈AI의 최대 라이벌로 꼽히는 Anthropic이다. 2021년에 오픈AI 간부들이 창업했다는 점도 라이벌로 불리는 이유다.

미국 아마존닷컴은 2023년 9월, Anthropic에 최대 40억 달러를 투자한다고 발표했다. 전략적 제휴를 맺고 Anthropic은 AWS를 주요 클라우드로서 이용한다.

AWS가 제공하는 AI 기계학습 처리용 액셀러레이터 칩 'Trainium'과 추론 처리용 액셀러레이터 칩 'Inferentia'를 사용해, Anthropic이 AI 모델의 구축과 트레이닝, 디플로이를 진행한다. AI 칩 개발에서도 협업한다는 내용이다.

아마존과 AWS가 Anthropic에 집중하는 이유는 무엇일까? 첫째, 그 모델의 성능을 들 수 있다. Anthropic의 최신 LLM ‘Claude 2.1’은 오픈AI의 ‘GPT-4’에 필적하는 능력을 갖고 있다고 한다. AI에 입력할 수 있는 텍스트 상한이 20만 토큰으로 길다는 점이 특징이다. 일반적인 서적 약 500페이지에 상당한다.

오픈AI의 GPT-4는 입력 상한이 3만 2768 토큰이다. 최신 LLM 'GPT-4 turbo'에서는 12만 8000토큰으로 늘었다고는 하지만, 그래도 Claude 2.1이 우세하다. 장문의 계약서나 논문 등을 한 번에 요약할 수 있기 때문에 긴 텍스트를 다루는 추론에는 Claude 2.1이 적합하다.

또 다른 특징은 AI 모델의 안전성이다. Anthropic의 공동창업자 재러드 카플란(Jared Kaplan) 씨는 닛케이 크로스테크에게 “지난 2년간 우리는 안전성 연구를 모델에 통합하는 대응을 계속해 왔다”라고 윤리성을 강조한다. Claude의 일련의 모델은 유엔의 세계인권선언과 다른 AI 기업이 발표하는 가이드라인 등을 학습했다.

적대적 공격에 대한 안전성도 높은 것으로 알려졌다. 아모데이 CEO는 re:Invent에서 “정부는 보다 안전하고 신뢰성 높은 모델을 요구하고 있다. 우리는 악용이나 유해한 사용에 대해서 안전한 모델로 하는 것에 많은 노력을 기울이고 있다”라고 코멘트.

아모데이 CEO는 미국 카네기멜론대학의 연구를 인용해 “연구자들이 다양한 모델에 대해 적대적인 공격을 실시한 결과, 당사 모델이 돌파될 확률은 경쟁사의 10분의 1이었다”라고 설명했다.

AWS는 생성 AI 서비스 ‘Amazon Bedrock’에서 Claude를 이용한 파인튜닝(추가 학습) 기능을 조만간 공개할 예정이다. AWS의 제품담당 부사장은 “파인튜닝은 일례에 불과하다. Bedrock에서 독자적인 기능을 도입하는 것을 목표로 한다”라고 밝히고 있어, 앞으로도 기능이 추가될 전망이다.

-- 테크 대기업이 모두 출자하는 Cohere --
캐나다의 Cohere도 AI 모델의 관심주다. 그 이름을 일약 유명하게 한 것은 2022년 8월에 있었던 조달 라운드였다. 미국 Oracle, 미국 NVIDIA, 미국 Salesforce 산하의 Salesforce Ventures 등 테크 대기업들이 앞다퉈 투자한 것이 화제를 모았다.

공동창업자인 에이단 고메즈(Aidan Gomez) CEO는 AI 성능을 비약적으로 향상시킨 아키텍처 ‘Transformer’를 발표한 논문 ‘Attention Is All You Need’의 공동저자다. 'AI의 대부'로 불리는 제프리 힌튼 씨와 AI 연구의 일인자인 페이페이 리 씨가 지원하는 것도 주목받는 이유 중 하나다.

Cohere의 커뮤니케이션 책임자인 가드너 씨는 “저명한 전문가는 물론 AI 커뮤니티에서 가장 우수한 인재를 모을 수 있다”라고 설명한다.

Cohere는 오픈AI의 챗GPT와 미국 구글의 ‘Bard’ 등 소비자가 이용할 수 있는 생성 AI가 아닌 엔터프라이즈 사용자에 특화된 LLM을 개발한다. “기업이 자사의 내부 데이터에 근거해 모델을 조정할 수 있는 것이 강점이다”(가드너 씨). 오라클, 구글, AWS 등 주요 클라우드 서비스에서 이용할 수 있다.

AI가 그럴듯하게 오류를 답변하는 할루시네이션(환각)을 막는 RAG(Retrieval Augmented Generation, 검색확장생성)에도 강한 것으로 알려졌다. Cohere의 기업용 AI 어시스턴트 서비스 'Coral'은 디폴트로 RAG를 구현하는 기능을 갖추고 있어, 기업이 자사 데이터와 연결해 헐루시네이션을 줄인다. “RAG 기술의 선구자가 우리 팀에 소속되어 있다”(가드너 씨).

Cohere와 마찬가지로 이스라엘의 AI21 Labs도 클라우드 대기업과 업무 제휴를 맺은 유력 기업이다. 연쇄창업가 오리 고젠(Ori Goshen) 씨, 자동차 운전지원시스템을 개발하는 이스라엘 Mobileye 창업자인 암논 샤슈아 씨, 스탠퍼드대학 명예교수 요압 쇼햄(Yoav Shoham) 씨가 창업했다.

"태스크에 특화된 AI를 구축하고 있는 것이 우리의 독자성이다". 고젠 CEO는 이렇게 해설한다. 텍스트 생성 등의 목적에 특화된 LLM을 API(애플리케이션 프로그래밍 인터페이스)로 제공하는 것이 AI21 Labs의 전략이다.

LLM을 개발하는 것 외에 자사에서 생성 AI 개발 기반 ‘AI21 Studio’도 전개한다. AI21 Labs는 이러한 목적 특화형 AI 모델을 ‘모듈’이라고 부르고, 고객은 이것들을 조합해 자사에 최적의 AI 앱을 구축한다.

고젠 CEO는 타사와의 차이점을 다음과 같이 설명한다. “오픈AI는 AGI(범용 인공지능) 개발을 목표로 하는 기업이며, Anthropic은 얼마나 안전하게 모델을 전개할 것인가에 중점을 두고 있다. 우리는 신뢰성이 높은 엔터프라이즈용 AI에 초점을 맞추고 있다”.

-- 데카콘인 데이터브릭스는 스타트업 기업을 인수 --
이미지 생성 AI의 최대주는, 정교한 이미지가 특징인 영국 Stability AI이다. 이미지를 자동 생성하는 ‘Stable Diffusion’이 Stability AI의 대명사다. 23년 11월에는 일본에 특화된 이미지 생성 모델을 발표했다. 일본이 소재인 이미지를 중심으로 학습한 모델로, 일본풍 인물 등을 생성한다.

이미지나 동영상뿐만 아니라 언어모델로도 활약의 장을 넓히고 있다. 23년 8월에는 일본어 전용으로 개발한 LLM을 공개. 챗GPT처럼 대화 형식으로 AI에게 지시할 수 있는 기능도 갖췄다.

AI 모델 스타트업 기업을 둘러싸고 미국의 대형 테크 기업들의 쟁탈전이 시작되었다. 미국 마이크로소프트의 오픈AI, 아마존의 Anthropic과 같은 거액 투자뿐만 아니라 업무 제휴를 내다본 소액 투자도 수두룩하다. 미국 Linkedin 공동창업자 리드 호프먼 씨 등이 설립한 Inflection AI에는 마이크로소프트 등이 출자하고 있다.

데이터 분석 서비스를 전개하는 미국 데이터브릭스는, 누구나 자유롭게 바꿀 수 있는 오픈 소스 소프트웨어(OSS)로서 LLM을 제공하는 미국 MosaicML을 13억 달러에 인수했다. 2023년 11월에는 MosaicML의 LLM과 데이터브릭스의 데이터 기반을 통합한 ‘Data Intelligence Platform’을 발표. LLM을 사용해 기존 사업을 강화하는 움직임이다.

테크 대기업은 모델을 자체 개발하는 한편, 모델의 다양성 등을 요구하며 모델 개발 기업에 추파를 보내고 있다. AI 모델 개발 스타트업 기업의 쟁탈전은 앞으로도 당분간 계속될 것 같다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록