- 의사록 작성, AI에게 맡긴다 -- 미국의 AISense, 장시간 대화에 최적화
-
- 카테고리AI/ 로봇·드론/ VR
- 기사일자 2018.9.11
- 신문사 일경산업신문
- 게재면 14면
- 작성자hjtic
- 날짜2018-09-17 16:12:40
- 조회수557
의사록 작성, AI에게 맡긴다
미국의 AISense, 장시간 대화에 최적화
미국에서 음성인식 기술을 이용한 서비스의 저변이 넓어지고 있다. 구글 등의 음성 어시스턴트가 유명하지만 급속하게 지명도를 높이고 있는 서비스가 있다. 미국의 AISense(캘리포니아주)가 제공하는 회의나 강연 의사록 작성 서비스 ‘Otter’다. 서비스를 시작한지 약 반년이 지났으며 이용자는 수십만 명 규모로 확대. 중국어나 일본어 전개도 적극적으로 고려하고 있다. 의사록 작성의 수고에서 해방되는 날이 가까워질 것 같다.
9월 상순에 샌프란시스코에서 열린 스타트업 기업의 콘퍼런스 ‘Disrupt’. 알려 준 사이트에 접속해 보면 스테이지에서 대담을 나누고 있는 우버 테크놀로지 다라 코스로샤히 CEO의 발언이 거의 실시간으로 문자로 기록되었다. 그곳에서 분투하고 있는 ‘의사록 작성자’는 2016년에 설립된 미국의 스타트업 기업 AISense의 음성인식 인공지능(AI)이다
AISense는 2월부터 개인이나 기업용으로 동일 서비스를 제공. 스마트폰이나 컴퓨터의 마이크로 청취한 음성을 기록하면서 클라우드 상에서 해석, 문자로 만들 수 있는 것이 특징이다. 월 600시간까지는 무료, 월 6,000시간까지 사용할 수 있는 유료판은 월 9.99달러다. 서비스 개시에서 약 반년이 지났다. AISense의 Sam Liang CEO는 “이용자는 수십만 명, 작성한 의사록은 수백만 건, 수천만 분에 달했다”라고 말한다.
채용이 급속도로 추진되는 이유는 인식 정밀도에 대한 평가 때문이다. 화상회의시스템을 제공하는 Zoom Video Communications(캘리포니아)는 구글이나 IBM의 동종 기술과 비교하여 AISense의 서비스가 보다 정확하게 회의 중의 대화를 캐치할 수 있다고 판단. 자사의 화상회의시스템 고객에게 제공하는 것을 결정하였다.
창업한지 얼마 되지 않는 스타트업 기업이 왜 IT 거인들을 능가하는 서비스를 만들 수 있을까? Liang CEO는 “목표하고 있는 것이 다르기 때문이다. 사람과 사람과의 대화, 다수 사람들의 대화나 프레젠테이션을 기술하는 것에 특화하여 개량을 거듭하고 있다”라고 밝힌다.
Liang CEO에 따르면, 구글이나 아마존닷컴의 음성 어시스턴트는 지시를 이해하여 앱을 작동시키거나 짧은 질문에 대답하는 것이 특기다. 사람과 기계의 커뮤니케이션을 원활하게 하는 개발을 추진하고 있다. 한편, AISense는 장시간 미팅에서의 대화를 정확하게 인식하는데 최적화. 잡음이 들어가거나 말하는 사람이 바뀌는 장면에서도 사용할 수 있도록 AI를 훈련하고 있다.
이 기사를 쓰기 위한 인터뷰도 Otter 서비스로 의사록을 작성했다. Liang CEO 발언의 80% 정도는 정확하게 기록되어 있었다. 실수가 있을 것 같은 부분도 문자를 클릭하면 바로 수정하기 때문에, 제로 상태에서 문자를 다시 기록하는 것과 비교하면 상당히 작업이 편하다.
현재의 서비스는 영어뿐이다. Liang CEO는 “일본이나 중국, 유럽의 여러 나라에서 서비스에 대한 요구가 있다. 지원하는 언어를 확대할 계획이다”라고 밝힌다. 실용에 충분한 정확성을 확보하기 위해서는 데이터가 필요하며 “언어의 확대에는 어느 정도의 시간이 걸린다”라고 보고 있다.
Otter의 사용이 점점 증가하고 있는 것을 보면 앞으로도 AI를 사용한 의사록 서비스 종류는 증가할 것으로 보인다. 젊은 사원들이 의사록 작성이라는 힘든 노동에서 벗어나는 날은 점점 가까워지고 있다.
●AISense의 Sam Liang CEO에게 듣다
강연 등 큰 사업 기회, 대기업을 앞서는 ‘즉시기록작성’
의사록 작성 서비스 ‘Otter’를 개발한 미국 AISense의 Sam Liang CEO에게 이야기를 들었다.
Q: 심층학습 기술을 이용한 의사록의 자동작성 서비스를 시작한 지 반년이 지났다. 성장 가능성을 어떻게 보고 있나?
“테크 이벤트에 가면 강연 중에 컴퓨터를 열어 메모를 하는데 바쁜 사람들을 많이 볼 수 있다. 내용을 놓치는 것을 걱정하기 때문이다. 그런 장면을 보고 큰 사업 기회가 펼쳐져 있다고 느꼈다”
“대기업의 사원은 30~50%의 시간을 회의에 소비하고 있다는 조사가 있다. 음성 어시스턴트는 구글 등이 뛰어난 기술을 제공하고 있다. 그러나 우리가 전개하는 실시간 의사록 작성에 있어서는 실용에 충분하지 않는 것이 실정이다. 분명히 우리들이 이 분야의 리더라고 생각하고 있다”
Q: 프라이버시에 대한 의식이 높아지고 있다. 방대한 회의 데이터를 어떻게 다루고 있나?
“프라이버시 보호는 비즈니스의 근간이다. 이용료를 받아 자금을 얻고 있으며 고객의 데이터를 어딘가에 판매하는 일은 없다. (클라우드 상에 데이터를 보관하는 서비스를 제공하는) Dropbox나 Evernote도 고객 데이터의 보호를 진지하게 다루고 있다. 그것이 불가능하면 회사의 미래는 없다”
Q: 자금 조달 상황은 어떤가?
“2017년에 벤처캐피털 등으로부터 1,300만달러를 조달하였다. 19년에는 추가 조달을 계획하고 있다”
-- 끝 --