일본산업뉴스요약

AI 번역, 의료∙법률에서 선행 -- 심층학습으로 빨라지는 진화
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2019.9.27
  • 신문사 일본경제신문
  • 게재면 17면
  • 작성자hjtic
  • 날짜2019-10-07 15:55:49
  • 조회수429

AI 번역, 의료∙법률에서 선행
심층학습으로 빨라지는 진화

AI를 이용한 언어 번역의 정밀도가 프로 번역가를 뛰어넘기 시작했다. 앞서 있는 분야는 전문 용어가 많고, 논리를 쉽게 알 수 있는 의료와 법률 등 전문 분야이다. 심층학습(딥러닝)을 번역에 응용하는 스타트업 기업들이 대두되면서 미국 구글과 마이크로소프트도 기술 개발을 서두르고 있다. 언어 장벽에 고심하는 비즈니스에게 희소식이 될 수 있을 지 주목된다.

-- 로제타, 전문 특화로 정밀도 95% --
‘본 계약은 2019년 5월에 발행된 것이며…’ 도쿄 시내에 있는 법률 사무소. 직원이 영어로 쓰인 계약서를 AI 번역 플랫폼업체인 로제타의 시스템에 입력하자 자연스러운 일본어로 자동으로 번역되었다. 로제타에 따르면 정밀도가 95%로, 이는 프로 번역가에 필적한다.

“믿을 수 없다. 잘못된 것이 아닌가?” 로제타의 이츠이시(五石) CEO는 2017년, 부하 직원이 보고한 AI 번역의 진화에 깜짝 놀랐다. 로제타는 2016년부터 심층학습을 이용한 기계 번역을 추진해왔지만, 사람에 필적하는 정밀도가 나오는 것은 2025년경이 될 것으로 이츠이시 CEO는 예상하고 있었다. 그러나 일주일에 걸쳐 확인한 결과, 그는 그제서야 사실임을 깨달을 수 있었다.

기계 번역에서는 소설 등 예술성이 높은 문장보다는 실무적인 서류가 처리하기 쉽다. 심층학습 AI는 대량의 데이터를 제공할수록 스마트하게 진화된다. 로제타는 AI를 의료 및 금융 등 전문 분야에 특화. 일본어와 영어의 대량의 번역 데이터를 AI에 학습시켜 높은 정밀도를 실현했다.

로제타는 2004년에 설립, 90개 언어에 대응하는 등 다양한 번역서비스를 제공하고 있다. AI를 통해 영어 번역에서 프로 수준의 정밀도를 실증해낸 이후, 기업으로부터의 문의가 급증. 올 2월기의 매출은 29억엔으로 전년 대비 45% 증가했고, 영업손익도 흑자로 전환했다.

AI 번역에서 세계를 리드하고 있는 곳은 구글이다. 2016년, 일반용으로 공개되고 있는 ‘구글번역’에 심층학습 기술을 적용해 정밀도를 비약적으로 향상시켰다. 영상인식과 바둑 등에서 성과를 낸 AI 기술을 언어에도 응용한 것이다.

마이크로소프트도 2018년, 중국어에서 영어로의 번역 정밀도가 사람 수준으로 향상되었다고 발표했다. 페이스북은 올 8월, 영어를 독일어로 번역하는 AI가 사람의 정밀도를 뛰어넘었다고 학회에서 인정 받았다.

구글 등의 무기는 방대한 데이터를 수집해 AI에게 학습시키는 것이다. 이것은 어떤 상황에서도 대응할 수 있는 범용형 AI 번역에는 적합하지만, 기업이나 업계마다 다른 문맥을 판독하는 것은 어렵다는 문제가 있다.

예를 들어 ‘Male’이라는 영어 단어는 ‘남성’으로 번역하는 것이 일반적이지만, 제약에서 시험 대상이 동물일 경우 ‘수컷’이라고 번역하는 것이 더 자연스럽다.

로제타는 올해, 무라타(武田)약품공업 및 다이이치산쿄(第一三共)와 잇따라 제휴했다. 그 목적은 기업별로 시스템을 만들어내는 ‘오더 메이드 AI 번역’을 실현하기 위해서다. 사내에서만 적용되는 표현이나 말투를 학습시킨다면 정밀도를 보다 높일 수 있다. 무라타약품공업 등과는 이미 실험을 추진, 내년 봄의 실용화를 목표로 하고 있다.

이 밖에도 일본거래소그룹과 공동으로 IR 자료 번역을 추진하는 등, 대응 분야를 확대하고 있다.

전문 분야 번역에 주력하는 스타트업 기업들은 많다. NTT도코모의 자회사인 미라이번역(도쿄)은 앤더슨∙모우리(毛利)∙토모쯔네(友常)법률사무소(도쿄)와 제휴해 법무 전용 기계번역 엔진을 개발했다. 난해한 전문용어와 긴 문장을 실용 레벨에서 번역할 수 있다고 한다.

-- 소스넥스트, ‘포켓토크’ 인기 --
관광 분야에서 존재감을 높이고 있는 곳이 소스넥스트이다. 소스넥스트의 자동 번역기 ‘포켓토크(POCKETALK)’는 휴대가 가능해 해외에서도 이용할 수 있다는 편리함이 평가되어 누계 출하 대수가 50만대 이상이다. ANA홀딩스 자회사가 연수에 채택하고 있는 등, 대기업들의 도입도 추진되고 있다.

해외 관광객 증가 유지를 위해 정부도 나섰다. 총무성과 정보통신연구기구는 2020년부터 AI를 이용한 동시통역 소프트웨어 개발을 시작한다. 중국어 등 15개 언어에 대응, 2025년의 실용화를 목표로 한다.

미국 조사회사 그랜드뷰 리서치에 따르면, 기계 번역의 세계시장은 연 평균 14.5% 성장. 2022년에 9억 8,330만달러(약 1,060억엔)으로 확대된다고 한다.

번역은 지금까지 전문성이 높은 작업이었다. AI 번역이 더욱 보급된다면 해외여행이나 국제 비즈니스가 보다 편리해질 것이다.

-- 데이터 양 확보가 과제 --
AI를 둘러싼 경쟁에서는 데이터 양이 승패를 좌우한다. 이용자의 방대한 데이터를 수집하고 있는 ‘GAFA’와 정부 주도로 데이터 활용을 추진하는 중국 기업들의 번역 정밀도는 앞으로도 계속 향상될 것은 분명하다. 전문 영역에서 실적을 늘리고 있는 로제타도 안심하고 있을 수만은 없다.

하지만 미국과 중국의 거대 기업들은 모국어 개발을 우선시하는 경향이 있다. 아마존닷컴은 2014년에 첫 번째 AI 스피커를 발매했지만, 일본 투입은 2017년이었다. 음성으로 조작할 수 있는 기능도 영어용이 먼저 도입되었다.

영어와 일본어, 또는 중국어와 일본어 번역의 경우에는 데이터 양이 풍부한 해외 기업들이 앞서나갈 수 있다. 하지만 신흥국들의 언어와 일본어 번역을 위한 AI 개발에 미국과 중국 기업들이 적극적으로 나설 것이라고는 생각하기 어렵다. 로제타의 이츠이시 CEO가 “해외 진출은 생각하지 않는다. 일본어를 축으로 한 번역에 특화 한다”라고 말하는 이유는 여기에 있다.

로제타의 주가는 주식분할을 고려한 베이스에서 4월에 사상 최고가를 달성했다. 하지만 9월 이후부터는 피크의 70% 정도의 수준을 유지하고 있다. 구글 등에 대항해 번역 정밀도를 지속적으로 향상시킬 수 있을 것인가? 기업과의 연대를 강화해 데이터를 확보할 수 있을 지가 성장의 열쇠를 쥐고 있다.

 -- 끝 --

목록