일본산업뉴스요약

AI 스피커 키트 제작 체험 -- AI 스피커, 하드 빈약/ 클라우드에 처리 의존
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2019.3.27
  • 신문사 일경산업신문
  • 게재면 5면
  • 작성자hjtic
  • 날짜2019-04-04 22:39:34
  • 조회수320

AI 스피커 키트 제작 체험
AI 스피커, 하드는 빈약/ 클라우드에 처리 의존


미국 아마존닷컴의 ‘에코’나 구글의 ‘구글 홈’, LINE의 ‘클로바 프렌즈’ 등 음성조작이 가능한 ‘스마트 스피커’는 완전히 시장에 정착했다는 느낌이 있다. 인공지능(AI)을 이용하고 있기 때문에 AI 스피커라고도 불린다. AI 스피커가 어떤 것인지 알아보기 위해 실제로 만들어 보았다.

AI 스피커 제작에는 구글이 판매하고 있는 ‘AIY 보이스 키트’를 사용하였다. ‘AIY’는 AI와 DIY를 조합한 조어로, 직접 AI를 사용해 보자는 의미다. 구글이 AI 기술의 보급을 추진하기 위해 판매하고 있다. 미국에서는 슈퍼마켓 체인 Target이 판매하고 있다. 일본에서도 Switch Science(도쿄) 등 온라인쇼핑몰에서 구입할 수 있다. 가격은 8,000엔 전후다.

키트에는 조립형 상자와 프린트 기판(보드) 2장, 스피커와 케이블, SD카드가 들어 있다. 이를 매뉴얼에 따라서 조립하면 AI 스피커가 완성된다.

스피커의 심장 부분이라고 할 수 있는 것이 2장의 보드다. 한 장은 영국 라즈베리파이 재단의 마이크로컴퓨터 보드 ‘라즈베리파이 제로WH’다. 다른 한 장은 ‘보이스 보닛’이라는 이름의 보드다.

라즈베리파이 제로WH는 단품에 200엔 정도다. 프로세서는 미국 브로드컴의 ‘BCM2835’. 동작 주파수는 1기가헤르츠(기가는 10억)의 싱글 코어 프로세서다. 10년 전에 일본에서 처음 발매된 ‘iPhone 3G’의 프로세서가 주파수 600메가헤르츠(메가는 100만)였던 것을 생각하면 고성능이 아니라는 것을 알 수 있을 것이다.

사용하는 기본소프트는 ‘리눅스’로 SD카드에 장착하였다. 윈도우와 비교하면 가볍게 작동하지만 GUI(그래픽 유저 인터페이스)를 사용하면 라즈베리파이 제로WH로는 다소 느리게 느껴지는 장면이 많다. 그래서 AI 처리를 시키기에는 조금 짐이 무겁다.

보이스 보닛에는 대규모집적회로(LSI)가 2개 탑재되어 있지만 2개 모두 그렇게 성능이 높지 않은 마이크로컴퓨터다. 이들이 AI처리를 담당하고 있는 것도 아니다.

AI 스피커에는 우선 음성 입출력, 즉 마이크와 스피커가 필요하다. 라즈베리파이 제로WH에는 음성 입출력 기능이 없기 때문에 이를 다른 보드에 장착한 것이 보이스 보닛이다.

하드의 성능이 높지 않아도 음성으로 응답이 가능하다는 말은, 원래 높은 성능이 필요하지 않다는 말도 된다. AIY 키트에는 이미지인식기능이 있는 ‘비전 키트’도 있으며 여기에는 미국 인텔의 AI 반도체가 탑재되어 있다.

이미지인식에 필요한 데이터양은 많아 모든 것을 클라우드에 보내면 시간이 걸리기 때문에 스피커 측에서 처리할 수 있도록 만든 것 같다. 한편, 음성인식처리에 필요한 데이터양은 많지 않다. 데이터를 클라우드에 보내, 처리를 클라우드에 맡기고 있기 때문에 스피커 측에는 그렇게 성능이 없어도 문제가 없다.

실제 제작은 상자를 조립하고, 보드를 핀에 맞춰서 접속, 케이블을 꽂으면 끝난다. 표준 해설은 영어 사이트밖에 없다. 상자를 접는 방향을 틀리기는 했지만 수정이 그렇게 어렵지 않아 완성하는데 문제 없었다.

 -- 끝 --

목록