일경비즈니스_2018/04/09_음성데이터의 문자화, 요약은 AI에

책 커버 표지
목차

요약

Nikkei Business_2018.4.9_Front Runner (p66-67)

AI개발∙서비스
음성데이터의 문자화나 요약은 AI에게
A.I. Squared, 자연언어처리에 특화된 벤처기업

자연언어처리에 특화된 AI 벤처기업. 음성을 문자로 바꾸거나 문장 요약을 자동화하여 업무효율화를 높인다. 마케팅이나 전자서적의 PR 등 다양한 분야에서 대기업이 이용하고 있다.

도호쿠전력은 콜센터에 들어온 ‘쓰가루 방언’의 문의 내용을 AI를 이용하여 문자로 바꿔 보았다. 그러나 의미를 알 수 없었다.

이 음성인식 AI는 iPhone의 AI ‘Siri’에 기술을 제공한 미국의 Nuance Communications의 것이다. 사투리가 심하고 독특한 우회적 표현도 많은 ‘쓰가루 방언’은 알아듣기 어려운 대표적인 방언이다. 때문에 유명한 최신 AI도 인식 정밀도가 떨어진다.

그러나 20대~70대의 쓰가루지방(아오모리현 중서부) 주민의 발성을 해석하여 AI에 내장하면, 앞에서 소개한 의미를 알 수 없었던 콜센터의 문의 내용은 “공지에 쓰여 있는 번호로 걸면 되나요?” “단가에는 변함이 없습니다”라는 의미로 바뀐다. AI의 인식 정밀도가 약 76%에서 약 94%로 향상되었다. 도호쿠전력은 이 성과를 콜센터의 대기 시간의 단축하는 등의 업무효율화에 활용할 생각이다.

히로사키(弘前)대학과 함께 이 개량작업을 시작한 곳은 AI 벤처기업인 에이아이 스퀘어(A.I. Squared, 도쿄)다. 자연언어처리 AI의 개발을 전문으로 하고 있으며 문서작성이나 콜센터 업무의 효율화를 담당한다.

-- 언어처리의 연구자를 갖추다 --
에이아이 스퀘어에는 언어처리에 특화된 AI연구자가 10명 정도 소속되어 있다. 또한 사내에 콜센터를 두고 고객의 업무 일부를 수탁하고 있기 때문에 AI의 심층학습에 도움이 되는 데이터 취득부터 실증실험까지 사내에서 해결할 수 있다. 이러한 체제가 평가를 받아, 설립 3년째인 젊은 기업이지만 일본담배산업이나 미쓰이부동산 리얼리티 등의 업무효율화에 관한 사업을 수주하고 있다.

이미 효과가 나온 사례도 있다. 도쿠시마현은 이이즈미(飯泉) 지사의 정례기자회견에서의 발언기록을 홈페이지에 올리는 업무에 에이아이 스퀘어의 시스템을 채용하였다. 음성인식 AI를 사용하여 음성기록을 문자화하는 작업을 자동화하였다. 에이아이  스퀘어의 시스템은 음성데이터를 문장마다 자동으로 구획을 나눠서 일부분만 반복하여 들을 수 있기 때문에 AI가 틀린 경우에도 사람이 수정하기 쉽다. 음성데이터를 문자화하는 작업에 걸리는 시간은 약 10시간에서 절반으로 단축할 수 있었다.

그러나 에이아이 스퀘어의 기술의 핵심은 문자화 후의 공정에 있다. 에이아이 스퀘어의 AI는 문자화한 문장을 자동으로 요약하거나 키워드를 추출할 수 있다. 소요시간은 15분 정도의 회견록이라면 1초에서 몇 초면 된다. 두꺼운 서적도 3분 정도다.

도쿠시마현은 이 기능을 사용하여 홈페이지의 열람자가 자유롭게 요약 비율을 설정하여 회견록을 요약하여 읽을 수 있는 서비스를 시작하였다. 회견록에 대한 액세스는 평균 2배로 증가하였다.

에이아이 스퀘어의 이시다(石田) 사장은 “우리의 요약 AI의 최대 강점은 ‘사전’이 필요 없다는 점이다”라고 강조한다. 예를 들면 ‘그는 친구와 게임을 하며 놀았다’라는 문장을 AI는 ‘그는, 친구로 놀고, 게임으로도 놀았다’라고 잘못된 해석을 할 가능성이 있다. 통상은 오역을 피하기 위해 ‘‘친구’는 놀이 도구가 아니고 ‘게임’은 놀이 도구다’라는 단어 분류를 미리 AI에 학습시켜 둔다. 이러한 분류 데이터가 AI에 있어서는 ‘사전’이다.

기업이 AI에게 정확하게 언어 해석을 시키기 위해서는 자사의 상품이나 독특한 말투를 미리 사전에 등록할 필요가 있다. 다수의 분류로 언어를 구별하기 때문에 작업은 복잡하다. 20명 정도의 전문가가 1년동안 사전을 작성한 사례도 있다. 게다가 상품이 입고될 때마다 새로운 작업이 발생한다. “이런 식으로 사전이 복잡해짐에 따라서 AI의 정밀도는 떨어진다”(이시다 사장)

에이아이 스퀘어의 요약 AI는 이 어려운 작업이 필요하지 않다. 핵심이론을 명확히 밝히지 않고 있지만 단어끼리, 문장끼리의 상관성의 강도를 해석하여 단어∙문장의 중요도를 결정한다고 한다. “말의 의미와는 관계 없이 수학적인 처리만을 하고 있기 때문에 사전은 필요 없다. 그 때문에 쓰가루방언과 같은 방언도 외국어도 같은 AI로 요약할 수 있다”(이시다 사장)

-- ‘키워드’로 업무 개선 --
에이아이 스퀘어의 AI 용도 중에서 가장 사례가 많은 것이 마케팅이다. 콜센터의 대화를 해석, 중요한 키워드를 추출하여 상품개선으로 연결시킨다. 또는 우수한 영업사원의 판매 멘트를 분석하여 다른 영업사원의 업무개선에 활용한다.

앞으로는 전자서적 시장의 활용이 기대된다. 전자서적업체인 MEDIA DO는 작년 5월에 에이아이 스퀘어의 제3자할당증자를 받아 1억 9,500만엔을 출자한다고 발표하였다. 양사는 난해한 전문서적 등에 대해 고객이 구입 전에 요약을 읽을 수 있는 기능을 발매할 계획이다. 미리 요약 비율의 상한을 설정하면 저작권자와의 트러블도 막을 수 있다.

현재 전자서적 매출의 대부분을 만화가 차지하고 있다. 만화의 경우 1권만 무료로 공개하고 다음 권부터는 구매로 유도하는 PR이 가능하지만 고가의 전무서는 내용을 알 수 없으면 구입하기 어렵다. 그래서 요약 AI를 도입하는 것이다.

이시다 사장은 2008년부터 후지소프트에서 신규사업 개척을 담당하는 이사를 맡고 있었다. 그 무렵부터 언어해석은 업무효율화에 있어서 중요한 열쇠가 될 것이라고 전망하였다. “당시는 언어해석을 수익으로 연결하는 기업은 적었다. 주목 받지 못하는 가운데 연구에 매진하고 있었던 전문가를 찾아가 대화로봇을 시작(試作)하는 등 작업을 시작하였다”라고 말한다. “AI가 단순노동을 담당함으로써 사람의 창조성이 보다 발휘되는 환경을 만들고 싶다”. 10년이라는 기다림의 시간을 거쳐 이시다 사장의 구상은 점점 결실을 맺고 있다.

  -- 끝 --

TOP

목차

TOP