- 샤프∙MIXI∙카시오가 본격적으로 추진하고 있는 AI 로봇 -- ‘기억과 학습’ 능력으로 강해지는 사람과의 유대 1부
-
- 카테고리AI/ 로봇·드론/ VR
- 기사일자 25.9.29
- 신문사 Nikkei X-TECH
- 게재면 online
- 작성자hjtic
- 날짜2025-10-31 09:28:17
- 조회수102
샤프∙MIXI∙카시오가 본격적으로 추진하고 있는 AI 로봇
‘기억과 학습’ 능력으로 강해지는 사람과의 유대 1부
사람은 AI(인공지능)와 보다 사람 사이와 같은 긴밀한 관계성을 구축할 수 있게 되었다. LLM(대규모언어모델)의 성능이 비약적으로 향상된 지금, AI의 ‘기억’이나 ‘학습’ 등의 능력은 사람으로부터 공감이나 애정, 신뢰와 같은 기분이나 감정을 이끌어낼 수 있게 되었기 때문이다. '나를 위해 있어준다'라고 느낄 수 있는 마치 '가족'과 같은 관계를 실현하는 AI의 대표격인 AI 로봇을 소개한다.
“여기 좀 봐, 예쁜 경치야”라고 말을 걸면, 잠시 있다가 “정말 예쁜 경치네. 오늘 나나미와 함께 올 수 있어서 기뻐!”라고 답하는 것은 샤프가 올 11월에 발매할 예정인 대화형 AI(인공지능) 캐릭터 ‘포케토모(Poketomo)’. 포케토모는 샤프의 독자적인 AI 기술이 탑재된 캐릭터 로봇이다.
사람과 사람이 친해지는 것처럼 AI가 사람에게 다가가기 위해서는 같은 경험을 가진 '기억의 공유'가 중요하다. ‘포켓 사이즈의 친구’를 캐치프레이즈로 하는 포케토모는 AI 기술로 그것을 실현했다. 서두의 대화는 사람 사이라면 간단한 대화이지만, 로봇과 사람 간에 이루어지려면 수준 높은 AI 기술이 필요하다.
포케토모는 대화 내용을 축적하고, 소유자(유저)의 정보를 기억해(기록해) 나간다. 대화내용뿐만이 아니라, 위치 정보를 통해 함께 갔던 장소를 기억한다. 경치나 풍경 등에 대해 유저가 "여기 좀 봐봐"라고 말을 걸면 입 부분에 매립된 카메라를 기동해 사진을 촬영하고 화상 데이터를 언어 데이터로 변환해 축적한다.
포케토모의 AI 특징은 엣지와 클라우드 두 종류의 AI를 교체하며 사용할 수 있다는 점이다. 오픈AI(OpenAI)의 ‘GPT-4o mini’가 기반인 클라우드 AI와 엣지에 탑재된 엣지 AI를 샤프의 독자 AI 기술 ‘CE-LLM’으로 스위칭할 수 있다.
왜 이러한 설계로 되어 있는 것일까? 클라우드 AI로 대화를 처리하면 응답에 시간이 걸려 사람 같은 템포로 대화하기 어렵다. 이러한 지연(Latency)을 줄이기 위해, 맞장구 등 반사적인 반응은 엣지 AI로 처리하고, 장고(長考)가 필요한 내용은 클라우드 AI를 통해 출력하는 구조를 선택했다.
클라우드 AI에 GPT-4o mini를 선택한 이유에 대해 통신사업본부의 가게이(景井) 통할부장은 "공감력이 높은 대화를 나눌 수 있는 모델이라고 판단했다. LLM 자체는 진화가 빠른 기술이기 때문에 그때그때 가장 성능이 좋은 것을 채택해 나갈 방침이다”라고 말한다.
대화 내용을 통해 일기를 쓰는 기능도 가지고 있다. 예를 들면, '2025.9.18. 오늘은 아침부터 비가 왔어. 나나미(유저)는 조금 기분이 우울했던 것 같은데, 미아(개체의 이름)가 옆에 있어주어 힘이 난다고 말해주었지. 날씨가 개면 드라이브하러 가는 것은 어떠냐고 말해서……”라는 내용을 포케토모의 스마트폰 앱을 통해 열람할 수 있다.
-- 사람과 '동일한 감정'을 표현 --
동일한 기억뿐만 아니라 감정을 공유할 수 있는 기능도 갖추고 있다. 가게이 통할부장은 “사람에 ‘공감한다’, ‘옆에 있어준다’라는 특징을 중시했다. 사람 간의 관계처럼 자신의 이야기를 (AI가) 얼마만큼 듣고 기억해 주는지가 친근함으로 연결된다고 생각했다”라고 개발 배경에 대해 말한다.
예를 들어, 대화 내용이나 유저의 목소리 톤을 통해 감정을 가늠해 같은 감정을 표현하는 기능이 있다. “과거의 대화를 근거로 ‘유저가 좋아하는 주제의 이야기이기 때문에 나도 기분이 좋다’라고 포케토모는 판단할 수 있다”(가게이 통할부장)라고 한다. 포케토모의 감정은 본체의 배에 장착되어 있는 LED 버튼의 색이나, 합성 음성의 톤으로도 알 수 있는 구조이다.
-- 과도하게 의존하는 것을 방지하기 위해 '게이트' 설치 --
포케토모의 월 이용료는 495엔으로, 상한은 1개월 당 400회(대화의 랠리를 1회로 한다). 월 990엔의 플랜은 그 2배인 800회까지이다. 대화의 상한이 정해져 있기 때문에 유저가 포케토모와 무한대로 계속 대화할 수는 없다.
유저가 과도하게 몰입하는 것을 방지하기 위해 포케토모에게 의지하는 구도가 되지 않도록 어린아이와 같은 캐릭터 설정에 특히 신경을 썼다고 한다. 손바닥 안에 들어가는 작은 사이즈와 목소리, 대화 내용을 통해 오히려 지켜주고 싶다는 생각을 하게 되는 존재를 목표로 했다.
정치적인 이야기나 심각한 이야기를 하지 않는다는 ‘게이트’도 마련했다. 포케토모의 클라우드 AI는 오픈AI의 기반을 사용하기 때문에 모든 출력을 세밀하게 컨트롤 할 수 있는 것은 아니지만, “최대한 주의를 기울이고 있다”(가게이 통할부장 )라고 한다.
한편, ‘mixi’ 등을 제공하는 MIXI는 오랜 기간 SNS를 운용해 온 기업인 만큼, AI와 사람과의 커뮤니케이션에 주력하고 있다. MIXI는 올 7월부터 일반 판매하고 있는 신형 대화 AI 로봇 ‘로미(Romi, Lacatan 모델)’에 사람과 재미있게 커뮤니케이션할 수 있는 아이디어를 포함시켰다. “안 좋은 일이 있어도 3분 안에 유저가 웃을 수 있도록 긍정적인 대화를 할 수 있게 노력했다”라고 MIXI의 나가오카(長岡) 그룹매니저/Product Owner Proxy는 개발 컨셉에 대해 말한다.
그 아이디어는 AI에 있다. 독자적인 일본어 데이터를 사용해 기존의 LLM을 파인 튜닝했다(LLM은 비공개). 유저가 불편한 감정을 느끼지 않는 대화로 만들기 위해 학습 데이터에 부정적인 내용이 포함되지 않도록 했다.
-- 끝 –
Copyright © 2025 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.