책 커버 표지
NTT 기술 저널_2016/09_커뮤니케이션의 미래를 그리는 기초연구
  • 저자 : NTT DoCoMo
  • 발행일 : 20160901
  • 페이지수/크기 : 72page/28cm

요약

NTT 기술저널_2016. 09 (p6~33)

커뮤니케이션의 미래를 그리는 기초연구


● 통신에서 커뮤니케이션으로
-- 데이터시대에 있어서의 패러다임의 변용(變容)
마에다 에이사쿠 (前田 英作) NTT커뮤니케이션 과학기초연구소 소장

AI(인공지능) 기술의 발전과 기대 속에서, 통신에서 커뮤니케이션으로의 패러다임 시프트가 일어나려고 하고 있다. 이런 속에, NTT가 몰두하고 있는 AI관련의 연구개발 전략을 소개함과 동시에, NTT커뮤니케이션 과학기초연구소에서 현재 추진하려 하고 있는 연구를 소개하면서 커뮤니케이션 과학이 맡고 있는 역할과 미래상에 대하여 생각해 본다.

NTT의 AI기술 “corevoTM
최근, “AI(인공지능)”에 관한 관심이 급속하게 높아지는 속에, 과도한 기대와 싸늘한 비판이 뒤섞여있다. 그러나, 적어도 AI에 관한 새로운 발견이나 기술에 의하여 세상을 움직이는 장치가 크게 달라질 것이라는 것은 틀림이 없다. 또한 앞으로 적절한 투자를 하기 위해서는 AI를 지탱해 줄 기술의 근간과 그 잠재되어 있는 가능성을 명확하게 파악해 놓는 것이 필요하다.

NTT에서는 NTT그룹의 AI기술에 대하여, “corevoTM”(코레보)라는 브랜드 명을 붙였다. 다양한 Player와의 collaboration을 통하여, 함께 revolution을 일으키고 싶다는 생각을 반영했다. “corevoTM”은 사람의 지성이나 사고를 모방하는 것이 아니고, 사람의 활동을 지원하며, 사람의 능력을 보완, 끄집어 내는 AI기술이 있으며, 사회과제의 극복과 산업경쟁력의 강화를 꾀하고 있다.

-- 지능의 시장경제성
-- 커뮤니케이션의 본질을 찾다


● 핸드폰이나 방송을 깨끗한 소리로 전달하는 음성음향 부호화 기술
가마모토 유타카 (鎌本 優)외2명 / NTT 커뮤니케이션 과학기초연구소

현재의 스마트 폰 간의 통화에서는 많은 경우, VoLTE방식이 사용되고 있으며, 지금까지의 고정전화 및 3G휴대전화(피처 폰) 보다 더 자연스런 음성으로 대화를 즐길 수 있게 되었다. 또한, IPTV를 비롯한 방송에서도 음성의 고품질화가 계획되어 있으며, 더욱 현장감이 있는 콘텐츠(Contents)를 즐길 수 있게 되었다. 이 글에서는 이런 고품질의 음원을 전송하기 위한 기초기술인 음성음향 부호화 기술에 대하여 소개하겠다.

-- 최근의 음성음향 부호화
-- 휴대전화용 음성음향 부호화 EVS 코덱
-- 하이레조(High-Resolution Audio)방송용 음향 로스레스 부호화 ALS
-- 금후의 전망


● 방대한 정보의 조합으로 손쉽게 학습
Mathieu Blondel외 2명 / NTT 커뮤니케이션 과학기초연구소

2차의 다항식회귀(Polynomial Regression)에서는 요인(要因)의 조합을 고려하는 것으로 선형회귀 (1차 다항식회귀)보다 데이터에 적합한 모델을 얻을 수 있다고 기대되지만, 요인수가 많아지면 조합이 방대해져, 실현이 어려워진다. 이 글에서는 NTT커뮤니케이션 과학기초연구소가 개발한 요인수가 많은 데이터에도 조합을 효율적으로 다뤄, 해석을 가능하게 하고 초기 수치 비의존 학습 알고리즘에 의하여 해석결과를 얻기 쉽게 해 주는 Convex Factorization Machine(CFM)에 대하여 소개하겠다.  

-- 회귀기술(Regression Technique)
-- CFM
-- 금후의 전개


● 편안하게 잡담을 할 수 있는 시스템의 실현을 목표로
스기야마 히로아키 (杉山 弘晃) 외 2명 / NTT 커뮤니케이션 과학기초연구소

최근 수 년 동안 크게 발전하여, 단 숨에 일상생활에서 접하기 쉬운 존재가 된 잡담시스템 이지만, 음성인식 오류 및 취급하는 화제(話題)의 한계 등, 아직 풀어야 할 과제는 많이 남아있다. 이 글에서는 잡담시스템의 발화(發話)내용의 개선 및 실제 로봇으로의 탑재에 관한 취급과 로봇을 복수체로 했을 경우의 대화두절 회피효과에 대하여 소개한다.

-- 잡담시스템의 보급
-- 다양한 화제에 대한 응답 발화(發話)의 자동생성
-- 시스템 퍼스널리티(Personality) 설계
-- 실제 로봇에 잡담시스템 탑재
-- 복수의 로봇과 대화
-- 금후의 전개


● 언어의 발달, 일본어와 영어는 무엇이 다른가?
오쿠무라 유우코 (奥村 優子) 외 2명 / NTT 커뮤니케이션 과학기초연구소

1~2세 때, 초기 어휘발달에 있어서, 일본어를 습득하는 유아가 영어를 습득하는 유아에 비해, 말의 습득이 느리며, 발화 가능한 어휘수가 적다고 알려져 있다. 한편, 일본어 유아는 새로운 말을 정확하게 학습하는 능력을 일찍부터 가질 수 있다는 것을 알게 되었다. 왜 일본어 유아는 말의 학습은 정확한데 발화 가능한 어휘수가 적은 것일까? 이 글에서는 그 수수께끼의 해답을 찾기 위해, 일본어 유아와 영어 유아의 모친의 발화 스타일을 비교하여, 아이들의 말의 습득과의 상관관계에 대하여 검토한 연구성과에 대하여 소개하겠다.


-- 언어의 발달
-- 발화 가능한 어휘수의 일본어와 영어 비교
-- 실험에서 찾는 말의 학습능력에 대한 일본어와 영어 비교
-- 부모가 말을 걸 때의 일본어와 영어 비교
-- 금후의 전개


● 스포츠선수의 뇌 정보처리과정을 해명하는 가상현실 (Virtual reality) 기술
기무라 도시타카 (木村 駿貴) 외 3명 / NTT 커뮤니케이션 과학기초연구소

스포츠에서 이기기 위해서는 건강한「몸」뿐만 아니라, 뛰어난「기술」 및 흔들리지 않는「정신」을 가지고 있는 것이 중요하다. 이것들은 뇌의 정보처리에 의하여 유지되는 것이지만, 기존의 계측수법으로 그 메커니즘을 알아내기에는 한계가 있다. NTT커뮤니케이션 과학기초 연구센터에서는 Virtual Reality (가상현실) 기술을 가지고, 스포츠선수의 생체정보를 감지하여, 이기기 위한 뇌 정보처리의 에센스를 해독하는 것을 목표로 한다.

-- 스포츠 뇌 과학 프로젝트
-- VR기술을 스포츠 뇌 과학에 활용하다
-- VR기술의 활용사례
-- 금후의 전개


● 미마모 메이트(Mimamo-Mate)
「보살피는 측」과「보살핌 받는 측」을 연결하는 ICT 툴(Tool)
야마시타 나오미 (山下 直美) NTT 커뮤니케이션 과학 기초연구소

이 글에서는 우울증환자의 가족 간병인을 지원하기 위하여 개발한 간호기록용 웹사이트의 앱「미마모 메이트」의 소개와, 그 홈 뉴스 조사에 대하여 보고한다. 홈 뉴스 후의 인터뷰에서, 가족 간병인이 미마모 메이트를 이용함으로써, 자신의 간병활동을 객관적으로 바라볼 수 있는 효과, 가족 간병인과 우울증 환자간의 커뮤니케이션 개선에 효과가 있다는 것을 알게 되었다.

-- 가족 간병인으로의 지원
-- Web 어플「미마모 메이트」의 개발
-- 「미마모 메이트」를 이용한 홈 뉴스 조사
-- 금후의 전개


● 주역 등장
정보를 압축하여 자원을 유효하게 활용
가마모토 유타카 (鎌本 優)NTT 커뮤니케이션 과학 기초연구소 주임연구원

NTT는 지금까지 긴 세월 동안 음성음향부호화의 기초연구뿐 아니라, 표준화에도 공헌을 해 왔다. 향후에는 IoT(Internet of Thing) 및 M2M(Machine to Machine) 등의 전진에 발맞춰, 다양한 신호의 압축이 필요하다고 사료된다. 지금까지의 경험을 살려, 세계의 상황과 니즈(Needs)를 조합한 넓은 의미에서의 압축을 연구해 나가야 할 것이다.

       -- 끝 --

목차