NTT 기술 저널_2024/01 NTT R&D FORUM 2023

책 커버 표지
목차

요약

NTT기술저널_2024.1 특집1 (p4-8)

NTT R&D FORUM 2023
'사람과 지구를 위한 지속적인 도전'

본 기사는 2023년 11월 14~17일에 열린 ‘NTT R&D FORUM 2023-IOWN ACCELERATION’에서 NTT의 시마다(島田) 사장이 한 기조강연을 바탕으로 구성했다. 사람과 지구를 위해서 계속 도전하는 NTT의 R&D에 대해 소개한다.

-- 사회가 안고 있는 과제 --
현재 사회가 안고 있는 다양한 과제 중 3가지를 꼽고 싶다. 첫 번째는 노동력 부족 문제다. 게다가 가장 최근에는 소위 ‘2024년 문제’까지 더해지면서 건설업계와 운송업계 등에서는 매우 큰 문제가 되고 있다.

두 번째는 세계적 과제인 환경 에너지 문제다. 데이터 양의 비약적인 증가로 전력 소비량이 급증하고 있다. 특히 도시의 에너지 수요는 계속 증가하고 있다. 기술혁신을 멈추지 않으면서, 환경과 에너지 문제의 해결을 조화시켜 나가야 한다.

세 번째는 고령화 사회가 도래함에 따라 일본의 재정 압박의 큰 요인이 되고 있는 의료비 증대 문제다. 또한 다양한 사람들이 심신이 충족되어 건강하게 살 수 있는 Well-being 사회의 실현도 요구되고 있다.

이러한 과제를 대용량, 저지연, 저소비 전력으로 실현하는 차세대 커뮤니케이션 기반인 ‘IOWN(Innovative Optical and Wireless Network)’과, 세계 최고 수준의 언어처리능력을 지닌 소형/전력절약형 NTT 버전의 대규모언어모델(LLM) ‘tsuzumi’를 중심으로 한 NTT의 R&D로 해결해 나가고 싶다.

-- IOWN --
증대하는 데이터 양과 전력 소비량의 과제에 대해, IOWN의 최종 목표인 전력 효율 100배, 전송 용량 125배, End-to-End 지연 200분의 1을 목표로 개발을 추진하고 있다.

IOWN의 로드맵으로서 2022년 말에 IOWN1.0을 상용화했다. 구체적인 유스 케이스는 후술하겠다. IOWN 2.0은 2025년도까지 보드 접속용 광전융합 디바이스를 개발할 예정이다. 그 후 2028년도까지 IOWN 3.0으로서 칩간 전용 디바이스를 개발하고, 2032년도에 IOWN 4.0으로서 칩내 광화(光化)를 추진한다.

IOWN 2.0의 포인트는 광전 융합 디바이스를 컴퓨팅 영역에 적용하는 것이다. 이를 실현하는데 있어서 핵심은 대용량 저소비 전력의 소형 광엔진이다. 이 광엔진 및 광엔진을 탑재한 스위치 보드를 이용해 xPU나 메모리 사이를 전기가 아닌, 빛으로 접속함으로써 초저소비 전력인 IOWN 컴퓨팅을 실현해 나간다. IOWN 컴퓨팅을 통해 전력 효율을 기존 대비 8배까지 올릴 수 있다.

현재 광엔진의 경우는 개발이 거의 완료되어 상용 시험을 실시하고 있다. 그리고 2025년도에 광엔진을 탑재한 스위치 보드를 제공할 예정이다. 이 IOWN을 이용한 서비스는 25년에 열리는 오사카-간사이 엑스포에서 체험할 수 있다. NTT 파빌리온의 테마는 ‘감정을 걸치고 있는 건축’이다.

파빌리온을 덮는 ‘천’이 방문객의 열기에 따라 움직이는 장치나, 자연의 빛이나 바람에 따라 표정을 바꾸는 등 ‘살아 있는 파빌리온’을 표현한다. 이들을 All-Photonics Network(APN)와 IOWN 컴퓨팅을 이용해, 원격으로 AI 해석을 통해 실현하고 싶다.

-- NTT 버전 LLM ‘tsuzumi’ --
다음으로 40년 이상의 자연언어 처리 연구 노하우를 결집한 NTT 버전의 LLM ‘tsuzumi’를 소개한다. tsuzumi의 특징은 다음의 4가지다.

첫 번째는 언어 대응력이다. 일본어는 물론 영어, 다국어에도 대응해 나간다. 특히 일본어는 각종 벤치마크에서도 세계 최고 수준의 성능을 자랑하고 있다.

두 번째는 높은 코스트 퍼포먼스(가성비)다. GPT-3와 동일한 수준의 고성능이면서 적은 소비전력 GPU로 고성능을 발휘할 수 있는 지속가능한 점이 특징이다.

세 번째는 저비용으로 튜닝을 할 수 있다는 것이다. 업계나 조직에 고유한 데이터를 기반으로 한 커스터마이즈나 빈번한 정보의 최신화도 가능하다.

네 번째는 도표 등 다양한 형식에도 대응할 수 있다는 것이다. 국산 모델로는 처음으로 표가 포함된 계약서나 청구서를 판독할 수 있게 된다.

tsuzumi의 일본어 성능을 타사와 비교해 보았다. 일본어는 오픈AI의 대규모 챗GPT-3.5를 웃돌며, 같은 수준의 국산 LLM을 크게 웃도는 세계 최고 수준의 성능이다. 영어에서도 세계 최고 수준인 Meta의 LLM과 같은 수준의 성능을 실현해, 다국어에도 대응해 나간다.

높은 코스트 퍼포먼스에 대해 GPT-3 규모의 LLM과 비교해 보았다. tsuzumi는 필요한 GPU 수가 적기 때문에 GPT-3 규모의 LLM과 같은 수준의 성능을 25분의 1의 하드웨어 비용으로 실현한다. 이용할 때도 마찬가지로 20분의 1정도면 된다. 게다가 GPU 수가 적기 때문에 소비하는 전력도 적어진다.

tsuzumi는 2024년 3월에 서비스를 시작한다. 23년 10월부터 사내외에서 폭넓은 트라이얼을 시작했으며, 이미 효과도 나오고 있는 중이다. 또한 24년 4월 이후에 문서, 도표의 판독뿐만 아니라, 예를 들면 아이의 목소리, 음색의 판독, 일본어와 영어 외에 다국어 대응 등도 순차적으로 발매해 나갈 생각이다.

-- 사회적 과제를 해결하기 위한 노력 --
여기서는 IOWN이나 tsuzumi라는 NTT의 R&D 기술/서비스를 이용해, 사회 과제를 해결하는 대응을 소개한다.

■ 노동력 부족에 대한 대응
첫 번째는 노동력 부족에 대한 대응이다. 요즘 건설업계에서는 인력 부족, 장시간 노동, 기술자 고령화 등이 심화되고 있다. 그리고 24년도부터는 시간외 근로 상한 규제가 적용되기 때문에 작업 효율화, 고용 다양화 등 근로 방식 개혁이 요구되고 있다.

그에 대해서 NTT는 EARTHBRAIN, JIZAIE, 다케나카공무점과 협업해, 효율적이면서 안전한 공사를 위한 건설기계의 원격 조작을 추진하고 있다. 구체적으로는 원격조작에 대용량, 저지연, 지연변이가 없는 IOWN APN을 이용함으로써 마치 현장에서 조작하고 있는 것처럼 건설기계를 조작할 수 있게 된다.

(1) 리모트 프로덕션
소니와 함께 검토하고 있는 리모트 프로덕션 사례를 소개한다. 지금까지는 각지의 스타디움 등에서 시합이나 이벤트가 있을 때마다 대대적인 제작 공간, 인원, 기계 재료, 중계차 등이 필요하게 되었다.

APN으로 전국 각지의 방송국과 경기장을 연결함으로써 리모트 프로덕션을 실현할 수 있다. 이에 따라 콘텐츠 제작 등은 원격으로 실시할 수 있게 되므로 이벤트에 필요한 공간, 인원, 기계 재료, 중계차 등의 리소스를 절감할 수 있게 된다.

(2) 컨택트 센터에서의 생산성 향상
컨택트 센터에서의 생산성 향상으로서 도쿄해상일동화재보험과의 협업 사례를 소개한다. tsuzumi를 이용해 컨택트 센터의 생산성 향상을 목표로 해 나간다. 도쿄해상일동화재보험은 사고 대응 부문에서 전국에서 1만 명 이상의 오퍼레이터가 매일 고객의 손해보험 지원에 대응하고 있다.

오퍼레이터는 전화로 사고 상황이나 부상 상황 등을 잘 듣고, 전화가 끝난 후에 대응 내용을 정리해 필요한 정보를 시스템에 입력한다. 그 After Call Work(ACW)에 연간 약 80만 시간이 든다고 한다. 이미 음성 마이닝 등을 통해 ACW가 조금씩 줄어들고 있지만, tsuzumi를 조합함으로써 응대 내용의 요약, 정리가 진전돼 ACW 가동을 50% 이상 더 줄일 수 있을 것으로 상정하고 있다.

(3) 자율주행 시스템의 제공
자율주행 시스템 제공에 대해 소개한다. 지역 버스나 택시 등의 대중교통에서 지역의 드라이버 부족이 현실화되고 있다. 자율주행 기술을 통해 다양한 사회 과제가 해결될 것으로 기대하고 있다. NTT는 이번에 자율주행 기술에 강한 미국의 May Mobility에 출자해, May Mobility의 자율주행 솔루션의 일본내 독점 판매권을 획득했다.

교통 과제를 안고 있는 여러 지방 자치체와의 협업을 통해, 우선은 커뮤니티 버스를 이용한 서비스 제공에 착수한다. 그 후에 자율주행 차량을 다양한 차량에 확대해 나감으로써 드라이버 부족을 비롯한 많은 사회 과제를 해결해 나가고 싶다.

■ 환경/에너지 문제에 대한 대응
환경/에너지 문제에 대한 대응을 소개한다. 데이터 드리븐 사회에서는 급증하는 데이터를 처리하기 위해 방대한 전력이 필요하다. 예를 들어 데이터센터의 소비 전력량은 18년과 30년에는 일본에서 약 6배, 세계에서는 약 13배로 증가할 것으로 예측되고 있다.

또한 AI(인공지능)는 앞으로 점점 보급이 확대될 것인데, 챗GPT와 같은 LLM의 경우는 1회당 학습에 1300MWh의 전력이 필요할 것이라고 한다. 이는 원전 하나를 1시간 가동시킨 발전량 이상에 해당한다.

이처럼 데이터 드리븐 사회에서는 데이터센터의 수요가 점점 증가함과 동시에 지금까지 이상으로 막대한 전력을 소비하게 된다. 그에 대해 NTT는 APN을 사용한 분산형 데이터센터를 통해 이 과제를 해결해 나간다. 분산형 데이터센터의 활용 예를 몇 가지 소개한다.

(1) APN×LLM
최초로 국내 데이터센터 사이를 APN으로 연결해 LLM 학습에 이용한 사례다. tsuzumi의 학습을 위해 이번에 APN을 이용한 클라우드와 온프레미스와의 연계 환경을 구축했다.

요코스카에 있는 NTT 연구소에 방대한 학습 데이터가 있지만 전력 문제로 근처에 GPU 장치를 설치하기가 어렵다는 것을 알았다. 그래서 미타카에 있는 데이터센터의 GPU 클라우드와 요코스카의 학습 데이터 스토리지를 APN으로 접속해 학습했다. 그 결과, 로컬 환경과 비교해 전혀 손색이 없는 환경을 실현할 수 있었다.

(2) 오라클 클라우드와 NTT의 APN 접속
다음은 오라클과 협업하고 있는 사례다. 현재, 오라클과의 클라우드와 NTT의 데이터센터 사이를 APN으로 접속하는 실증을 진행하고 있다. 그렇게 함으로써 대규모의 중요한 데이터는 수중에 두고, 필요한 데이터만을 실시간으로 클라우드에 연계시켜 분석할 수 있게 된다.

(3) 해외 데이터센터 간 APN 접속
마지막으로 NTT의 해외 데이터센터 사이에 APN을 도입하는 사례다. 분산형 데이터센터의 실현을 위해 국내뿐만 아니라 해외, 우선은 영국과 미국에서 데이터센터 간 APN 접속 실증을 준비하고 있다.

이를 통해, 예를 들어 영국에서는 통신경로로 약 100km 떨어져 있는 데이터센터 사이를 마치 하나의 데이터센터로 운용할 수 있게 된다. 이 시험을 23년도 중에 완료할 예정이다. 또한 미국과 영국뿐만 아니라 아시아 등 다른 지역에서도 동일하게 전개해 나갈 예정이다.

■ 고령화와 의료비 증대에 대한 대응, Well-being 추구
고령화로 인한 의료비 증대에 대한 대응과 Well-being 추구에 대해 소개한다.

(1) LLM을 활용한 전자 진료기록카드의 구조화
먼저 의료 분야의 과제다. 일본에서는 전자 진료기록카드가 많이 도입되고 있지만, 예를 들어 같은 증상이라도 진료기록카드를 쓰는 방법이 병원이나 의사에 따라 다르기 때문에 진료기록카드 데이터를 수집해 분석 활용하는 것은 매우 어려운 상황이었다.

tsuzumi는 초경량으로 유연하고 안전하게 의료기록 데이터를 학습할 수 있기 때문에 닥터가 기록한 의료 데이터를 읽고, 공통 포맷에 적절히 표현/배치하여 분석이 가능한 상태로 만든다.

전자 진료기록카드 데이터의 구조화에 이미 대응하고 있는 교토대학 의학부 부속 병원은 “tsuzumi를 통해 전자 진료기록카드 데이터를 통계 데이터로서 다룰 수 있어, 치료 방침을 결정할 때 ‘지원적인 의사결정’이 가능해지면서 환자 개개인에게 적합한 효과적인 치료를 할 수 있게 된다”라고 말한다. 이를 통해 사회 전체의 의료비 적정화로도 이어진다.

게다가 구조화된 전자 진료기록카드 데이터에 의해 투약 효과나, 부작용 등의 의료 데이터 분석도 쉬워진다. 의약품 개발 시간 단축이나 비용 삭감에 활용하며, 효과적인 의약품 개발로도 이어질 것으로 생각한다.

(2) Project Humanity
마지막으로 Well-being 사회의 실현을 위한 대응을 소개한다. 무토 씨는 광고회사를 다니며 DJ 등의 음악 활동을 하고 있었다. 14년, 당시 27세였던 무토 씨는 몸을 움직이는 운동 신경이 노화돼 서서히 움직이지 못하게 되는 ALS(루게릭병) 선고를 받았다. “목소리는 들리지만 반응을 하지 못했다. 여기서 내 인생은 끝나는 건가, 왜 나일까”라고 생각했다고 한다.

무토 씨는 비록 몸이 불편하더라도 기술의 힘으로 표현의 가능성은 반드시 개척할 수 있다고 생각해, DJ로서 시선을 조작해 음악을 연주하는 등 다양한 이벤트에 참가하고 있다. NTT도 그의 노력에 협력하고 싶어 무토 씨에게 “몸을 움직일 수 있다면 무엇을 하고 싶은가?”라고 물었다.

“관객들과 함께 분위기를 띄우고 싶다”라고 대답. 그것을 실현하기 위해서는 가상과 리얼의 융합이 필요하다고 생각해, 아바타를 통해서 몸을 움직이는 것에 도전했다. 세계 최고의 미디어아트 축제 'Ars Electronica'에서 무토 씨는 자신의 목소리로 영어로 의사소통을 했으며, 라이브 퍼포먼스에서는 아바타를 통해 들어올려진 그의 손에 많은 사람들이 호응하며 큰 성공을 거뒀다.

NTT는 ALS라고 하는 중증 장애자라도 커뮤니케이션을 할 수 있는 기술의 연구/개발을 추진하고 있다. 구체적으로는, 예를 들면 이번과 같이 적은 근육의 움직임이나 뇌파를 통해 의식을 판독하고, 신체 능력 전사 기술을 사용해 아바타를 개입시켜 신체 표현을 하거나, 소리를 낼 수 없게 된 사람에게는 음성 합성 기술을 사용해 과거 자신의 목소리를 합성함으로써 자신의 목소리로 외국어를 말할 수 있는 기능도 개발하고 있다.

사람과 지구를 위해 앞으로도 NTT는 계속 도전해 나갈 생각이다.

 -- 끝 --

TOP

목차

TOP