- 아마존, AI의 ‘꿈’을 실현하기 위한 2가지 포석 구축 (후편) -- 스마트 스피커의 대(對) 애플 전략, 착착 추진
-
- 카테고리AI/ 로봇·드론/ VR
- 기사일자 2020.11.10
- 신문사 Nikkei X-TECH
- 게재면 online
- 작성자hjtic
- 날짜2020-11-18 19:17:05
- 조회수389
Nikkei X-TECH_2020.11.10
아마존, AI의 ‘꿈’을 실현하기 위한 2가지 포석 구축 (후편)
스마트 스피커의 대(對) 애플 전략, 착착 추진
기기 연동을 축으로 스마트 스피커 분야에서 공세를 가하고 있는 애플. 이 분야에서 수위를 차지하고 있는 아마존이 음성대화 기능 ‘알렉사(Alexa)’를 업그레이드시켜 애플의 추격을 따돌릴 수 있을 것인지 귀추가 주목된다.
10월에 발매된 스마트 스피커 ‘아마존에코(Amazon Echo)’에는 AI처리(기계학습의 추론 처리) 향상을 위해 ‘AZ1 Neural Edge processor’(이하 AZ1)라고 하는 독자적인 프로세서가 새롭게 탑재되었다. 이 프로세서를 통해 알렉사의 응답에 소요되는 시간이 단축되었다고 한다. AZ1은 아마존이 대만의 미디어텍(Media Tek)과 공동으로 개발한 제품으로, 미디어텍은 에코(Echo) 시리즈에 프로세서 제품을 납품한 실적이 있다. 기존에는 표준 제품이었지만, 이번 AZ1은 아마존의 요망 사항을 충분히 반영한 커스텀(주문제작) 제품이다.
알렉사의 진화는 응답 시간의 단축뿐만이 아니다. 사람과의 대화에 보다 자연스러운 형태로 참여하거나 사람의 지시 내용을 통해 학습하는 등 대폭적인 기능 향상을 도모했다. 사람과의 대화에 보다 자연스러운 형태로 참여하는 기능을 ‘내추럴 턴 테이크(Natural Turn Take)’라고 부른다. 예를 들어 지인과 둘이서 이야기를 하는 중에 ‘알렉사, 대화에 참여해’라고 말하면 알렉사가 대화에 끼어든다. 대화에 참여한 후에는 ‘알렉사’라고 부르지 않아도 알렉사는 자동으로 자신을 향한 지시를 이해한다.
9월에 실시된 온라인 발표회에서는 대화하고 있던 2명이 피자 배달을 부탁했을 때 알렉사가 대화에 참여해 어떤 종류의 피자인지, 사이즈는 어떤 것인지를 질문하며 주문, 주문 내용을 수정하는 모습이 공개되었다. 또한 영화를 보기 전에 알렉사에게 추천 영화를 물어본 뒤, 알렉사가 제안한 영화의 평점이나 예고편 재생을 의뢰하기도 했다.
‘Natural turn-taking’ 기능에서 알렉사는 대화 상대가 누구인지를 명확하게 인식하고 있지 않다고 한다. 대화 도중 등장하는 ‘원하는 것’을 캐치하는 것이 목적이기 때문이다. 가족 등 4~6명 정도가 참여하는 소규모 대화의 경우, 이야기하는 사람을 특정하지 않고 그 대화를 통해 먹고 싶은 요리나 보고 싶은 영화, 듣고 싶은 음악 등을 추정한다고 한다.
알렉사와의 자연스러운 대화를 실현하기 위해 아마존은 스마트 스피커와 카메라를 조합하는 구상도 가지고 있다. 예를 들어 카메라 너머로 말하는 사람이 스마트 스피커를 향하고 있다고 감지될 경우, 알렉사에게 말을 걸고 있다는 사실을 명확히 인지할 수 있다. 에코 시리즈 가운데 카메라 기능을 갖추고 있는 품종은 음성과 영상의 통합 인지 처리가 가능하게 될 것이다. 아마존은 이 통합 처리와 추론 처리의 고속화 등을 위해 AZ1을 개발해 제품에 탑재했다고 한다. 알렉사의 음성인식과 자연언어 이해 등의 연구 개발을 총괄하는 프라사드 씨(VP & Head Scientist)는 구체적인 제품명은 밝히지는 않았지만, AZ1과 같은 전용 반도체를 앞으로 다양한 기기에 탑재해나갈 것이라고 전망한다.
-- 기기 설정을 학습 --
알렉사에는 사람의 지시 내용을 ‘학습’하는 기능이 새롭게 도입된다. 9월의 온라인 이벤트에서 프라사드 씨가 이끄는 연구팀은 다음과 같은 퍼포먼스를 소개했다. Echo를 통해 조명을 조절할 때 프라사드 씨가 “알렉사, 라이트를 나의 독서 모드로 해줘”라고 지시하자, 처음에는 알렉사가 이 지시 내용을 알지 못해 “독서 모드가 무엇인지 모릅니다”라고 응답했다. 프라사드 씨는 “40%의 밝기로 세팅하는 것이야”라고 말해주었고 알렉사는 조명의 독서 모드를 학습해 다음 지시부터는 이 모드로 조절할 수 있게 되었다.
이 시점에서는 학습이라고 말하기 보다는 ‘기억’에 가까운 기능이지만, 아마존에게 이것은 ‘한 단계 위로 크게 올라서는 것’(프라사드 씨)이라고 한다. 이것은 “지금까지 일본어나 영어와 같은 자연언어로 최종 소비자가 AI를 가르치는 것은 불가능했기 때문이다”(프라사드 씨). 이 학습 기능은 언젠간 모든 알렉사가 탑재된 기기에서 이용할 수 있게 될 것이라고 한다. 아마존은 우선 스마트홈용 기기부터 도입해 점차 다양한 분야로 확대해 나갈 계획이다.
프라사드 씨는 최종적으로 사람과 같은 AI를 실현하고 싶다는 꿈을 이야기했다. 이를 실현하기 위해서는 크게 3가지 요소가 불가결하다고 한다. 그 중 2가지가 앞에서 말한 자연스러운 대화로의 참여와 자기학습 기능이다. 현 시점에서는 그 초기 단계라고 할 수 있는 기능을 제품에 구현하는 단계까지 도달하는데 성공했다. 남은 하나는 사람과 같은 자연스러운 응답 능력이다. 예를 들어 상황에 맞게 음성 톤을 바꾸거나, 대화 도중 한 템포 쉬었다가 말하는 것 등을 상정한다.
아마존은 알렉사의 대화 기능의 성능 향상과 더불어, 특정 대화를 강화할 수 있는 기능(앱) ‘스킬’의 개발 환경 정비를 추진하고 있다. 그 핵심 중 하나가 올 7월에 상세히 공개된 ‘Alexa Conversations’이다. 예를 들어 가전 서비스 설정이나 음식 배달 주문, 각종 서비스의 예약 및 확인, 영화와 음악 등의 콘텐츠 선택과 같은 이용을 상정하고 있다. 이미 일부 기업들이 이용하기 시작하고 있으며, 영어에 대응한 베타 버전을 개발자에게 제공 중이라고 한다.
Alexa Conversations에서는 알렉사와 자연스럽게 대화할 수 있도록 예를 들어, 하나의 스킬에 대해 수 만가지 대화 패턴이 자동으로 생성되어 개발자 부담을 줄여줄 수 있다.
7월에 개최된 온라인 이벤트에서는 Alexa Conversations을 이용한 미국 iRobot의 로봇 청소기 ‘룸바(Roomba)’의 퍼포먼스가 공개되었다.
기존에는 “룸바로 안방 침실을 청소해” 또는 “룸바로 월요일 오전 10시에 청소해” 등 이용자가 알렉사에게 의뢰할 필요가 있었다. 하지만 퍼포먼스에서는 알렉사가 “어디를 청소할까요?” “이것은 루틴 작업입니까?” 등을 질문하고 이에 이용자가 답을 함으로써 청소하는 장소와 요일을 대화하면서 세밀하게 설정할 수 있는 모습이 공개되었다.
-- 끝 --
Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.