책 커버 표지
NTT 기술 저널_2024/02 진정한 휴머니티를 키우는 테크놀로지
  • 저자 : NTT DoCoMo
  • 발행일 : 20240201
  • 페이지수/크기 : 60page/28cm

요약

NTT 기술저널_2024.2

특집
진정한 휴머니티를 키우는 테크놀로지 연구개발
NTT인간정보연구소

NTT인간정보연구소는 사람 중심을 원칙으로, 급속하게 가속화되고 있는 가상 세계의 발전에 발맞춰 실세계(사람, 사회)와 가상세계의 새로운 공생에 관한 연구 개발을 추진하고 있다. 본 특집에서는 NTT인간정보연구소의 최신 연구에 대해 소개한다.

진정한 휴머니티를 키우는 테크놀로지에 대한 연구개발을 추진하는 NTT인간정보 연구소

‘진정한 휴머니티를 키우는 테크놀로지에 대한 연구개발’이라는 미션 아래 ‘사람 중심을 원칙으로 사람의 모든 기능을 정보통신 처리로 가능하게 한다’라는 것을 비전으로 내걸고 있는 NTT인간정보연구소의 최신 활동에 대해 소개한다.

NTT 인간정보연구소의 미션

NTT 인간정보연구소는 ‘진정한 휴머니티를 키우는 테크놀로지에 대한 연구개발’이라는 미션 아래 ‘사람 중심을 원칙으로 사람의 모든 기능을 정보통신 처리로 가능하게 한다’라는 것을 비전으로 내걸고 있다. 구체적으로는 사람의 특성 가운데 지각, 감성, 사고, 행동, 신체, 환경 등 6가지를 대상으로 하며, 이것들을 데이터화해 정보통신 처리가 가능한 기능으로 하는 것이 요소기술이다.

IOWN(Innovative Optical and Wireless Network) 구상 실현을 위해 NTT인간정보연구소는 위에서 언급한 기능들을 활용한 종합 연구로 디지털트윈컴퓨팅(DTC: Digital Twin Computing)과 리모트월드(Remote World)를 추진하고 있다. 지금 우리들을 둘러싼 환경의 변화로는 생성 AI(인공지능)의 등장, 뇌 관련 기기의 소형화 및 고정밀화, 메타버스와 웹3에 대한 환멸기 도래, 포스트 자본주의 변혁 등이 있다.

이러한 것들을 바탕으로 NTT 인간정보연구소가 추진해야 할 4가지 과제를 소개한다. 첫 번째는 범용 AI에서 뇌를 블랙박스로 취급하는 연구의 가속화. 두 번째는 범용 AI에서 뇌를 화이트박스로 취급하는 연구 착수. 세 번째는 메타버스의 본질적 및 보편적 가치 추구. 네 번째는 휴머니티에 직결된 연구의 가속화이다.

그리고 이러한 과제들을 기반으로 ‘대규모언어모델’과 ‘뉴로테크∙사이버네틱스’를 요소기술 연구개발을 가속화하기 위한 중점화 요소기술로 규정하고, ‘Project Metaverse’ 및 ‘Project Humanity’를 종합연구 구현화를 위한 중점화 유스케이스로 규정했다.

중점화 요소 기술과 중점화 유스케이스에 대해

위의 4가지 중점화 요소기술과 중점화 유스케이스에 대해 설명한다. 첫 번째인 대규모언어모델(LLM: Large Language Models)은 GPT-3의 등장과 다양한 분야에서의 활용에 힘입어 범용 AI 제공이 현실화되고 있다. NTT인간정보연구소는 수십 년에 걸쳐 쌓아온 언어처리 연구를 활용해 사람의 뇌 구조를 분석하는 NTT의 독자적 LLM을 연구개발하고 있다.

새로운 AI 시대의 최첨단을 달리고, 그와 동시에 범용 AI를 핵심으로 한 세계 변혁에 도전할 방침이다. 두 번째인 뉴로테크∙사이버네틱스는 지금까지 쌓아온 신체 구조에 대한 지식과 함께 LLM을 활용함으로써 암묵지 획득이나 사람과 기계를 연결하는 직감적인 인터페이스 등을 실현해 사람 단독으로는 불가능한 것을 가능하게 하는 기술이다.

세 번째인 Project Metaverse는 LLM을 베이스로 함으로써 거리와 시간을 뛰어넘은 새로운 ‘tele-‘를 실현해 불가능할 것 같은 만남이나 지금은 존재하지 않은 업무 및 여가 체험, 또는 자기자신을 알 수 있는 공간을 창출할 수 있다.

네 번째인 Project Humanity는 두 번째인 뉴로테크∙사이버네틱스를 베이스로 함으로써 Diversity & Inclusion을 추진해 가족, 친구, 회사 동료 등 주위 사람들, 또는 병이나 장애를 가진 사람이나 그러한 사람을 서포트하는 사람 등을 대상으로 본인의 의향을 존중한 상태에서 사람의 기능을 획득할 수 있는 세계를 실현할 수 있다.

이번 특집에서는 중점화 요소기술과 중점화 유스케이스의 최신 연구 내용 및 최신 활동에 대해 리포트하며, 여기에서는 NTT의 독자적인 LLM에 대해 소개한다.

NTT의 독자적인 대규모언어모델 ‘tsuzumi’

GPT 등 대규모언어모델의 등장으로 범용 AI의 실현 가능성이 높아지고 있다. NTT인간정보연구소는 GPT의 과제인 언어모델 사이즈, 정보의 신뢰성, 모델의 성장성, 언어 이외의 모달에 대한 적용성, 대규모 학습에 따른 소비전력 문제 등을 해결할 수 있는 독자적인 고효율 LLM ‘tsuzumi’를 2023년 11월에 발표했다.

‘tsuzumi’의 차별화 포인트는 ①언어모델의 소형화(코스트 절감) ②일본어 처리 성능의 우위성 ③커스터마이즈성 향상 ④멀티모달 대응(신체성 보유)이다. ①의 경우, ‘tsuzumi’는 파라미터의 크기가 6억 개인 초경량 버전과 70억 개인 경량 버전 두 종류가 있다.

초경량 버전은 CPU로, 경량 버전은 저렴한 GPU 1대로 고속의 추론 동작이 가능하다. 이것은 GPU 클라우드의 이용 요금으로 환산하면 오픈AI ‘GPT-3’의 1,750억 엔과 비교해 학습 코스트에 있어서는 초경량 버전이 약 300분의 1, 경량 버전이 약 25분의 1이다. 또한 추론 코스트에 있어서도 초경량 버전이 약 70분의 1, 경량 버전이 약 20분의 1이다(두 가지 모두 NTT의 추산).

②는 NTT인간정보연구소가 오랜 기간 쌓아온 언어처리 연구를 활용함으로써 작은 파라미터 크기이지만 높은 성능을 실현했으며, LLM용 벤치마크인 ‘Rakuda’에서는 GPT-3.5와 국내 최고 레벨의 LLM군을 앞선다는 사실을 확인했다. ③은 정밀도나 코스트 등의 조건 차이에 유연하게 대응하기 위해 ‘프롬프트 엔지니어링(Prompt Engineering)’, ‘풀 파인튜닝(Full Fine-tuning)’, ‘어댑터 튜닝(Adapter Tuning)’이라는 3가지 튜닝 방법을 제공하고 있다.

이를 통해 업계별, 조직별, 개인별 등의 커스터마이징을 낮은 코스트로 실현하고 있다. ④는 언어뿐만 아니라, 화상, 영상, 센서 데이터, 음성의 뉴앙스, 얼굴 표정 등 다양한 모달의 입출력에 대응해나감으로써 보다 광범위한 지식을 획득할 수 있다.

그리고 ‘tsuzumi’를 중심으로 40년 이상의 역사를 가진 음성, 화상, 영상처리 기술 등을 연동시키고, 마찬가지로 로보틱스 연구에서 쌓아온 센서∙액추에이터 기술과 인지심리학의 지식을 활용하면서 유스케이스를 창출해 나갈 방침이다.

tsuzumi와 IOWN의 상호작용

IOWN의 대용량 및 저지연 네트워크는 LLM에 필요한 지리적으로 분산되어 있는 각종 리소스를 하나로 연결해 전력 효율화에도 기여하는 기반이 된다. 또한 향후, 무엇이든 알고 있는 하나의 거대한 LLM이 아닌, ‘tsuzumi’를 비롯해 전문성과 개성을 가진 다양한 작은 LLM들이 서로 연계되어 사회 과제를 해결하게 될 것이다. LLM이 사회 활동을 하면 할수록 대량의 LLM의 연계 기반으로서 IOWN이 중요해질 것이다.

독자를 향한 메시지

약 3년에 걸친 코로나19 사태는 국민들의 생활을 일변시켰다. 누군가와 만나는 일이 당연한 것이 아니라는 사실을 우리는 새삼 깨닫게 되었다. 불필요한 활동이 제한되는 가운데 행복하다고 느끼는 것이 절대적으로 필요하지는 않다는 것도 우리는 알게 되었다.

NTT인간정보연구소는 ‘진정한 휴머니티를 키우는 테크놀로지에 대한 연구개발’이라는 미션 아래 ’사람 중심을 원칙으로 사람의 모든 기능을 정보통신 처리로 가능하게 한다’라는 비전을 내걸고 있다. 우리를 둘러싼 환경은 급속도로 변화하고 있다. 레이와(令和)가 시작되었을 때 우리는 5년 후를 상상하기 어려웠다.

‘멀다’를 의미하는 tele-‘가 영어 회사명에 포함되어 있는 NTT는 거리를 뛰어넘은 커뮤니케이션을 생업으로 해왔다. 지난 수년 간의 변화에 있어서도 ICT를 활용하거나, 리모트월드의 보급 및 추진에 기여해왔다. 여전히 격동의 시기에 있지만, 최근 몇 년간 무엇이 만들어졌고, 후세에 남겨야 할 본질은 무엇인지에 대해 사람 중심의 관점에서 논증해야 한다.

소중한 사람과 만나지 못할 때 시간과 거리의 장벽을 뛰어넘는 커뮤니케이션은 존재하는 것일까? 기계는 어디까지 사람의 능력을 모방해도 좋은가? 기계가 사람의 능력을 뛰어넘어도 허용되는 영역은 존재할까? 사람이 편리성이나 행복을 느낄 수 있도록 하기 위해 기술은 어떻게 지원해야 할까?

NTT는 외부와의 콜라보레이션을 통해 이러한 의문들을 스스로에게 던지고 있다. 검증을 거듭해 후세에, 예를 들어, 100년 후에도 남겨두고 싶다고 마음속에서 우러나는 기술에 대해 NTT의 리소스를 집중시켜 나가겠다. NTT인간정보연구소의 행보에 기대해주었으면 한다.

 -- 끝 --

목차