책 커버 표지
일경오토모티브_2018/01_NVIDIA의 아성에 도전하는 AI 반도체
  • 저자 : 日経BP社
  • 발행일 : 20171201
  • 페이지수/크기 : 114page/28cm

요약

Nikkei Automotive_2018. 1 특집요약 (p50~55)

NVIDIA의 아성에 도전하는 AI 반도체
저전력∙저비용 반도체를 새롭게 개발하는 움직임 활발

인공지능(AI)을 사용한 자율주행용 반도체 중에서 미국 NVIDIA(엔비디아)의 GPU가 차지하는 존재감은 크다. 다만, GPU는 고성능인 반면, 소비 전력 및 비용에 따른 과제로 인해 대중적인 자동차에 탑재하기 어렵다는 인식이 강하다. 따라서 저전력∙저비용의 반도체를 새롭게 개발하려는 움직임이 활발해 지고 있다. 반도체를 채택하는 자동차 제조업체에게는 순풍이라고 할 수 있다. 새로운 타입의 반도체는 엔비디아의 아성을 무너뜨릴 수 있을까? 각 사의 활약에 대해 취재했다.

AI를 사용한 자율주행의 분야에서 GPU와 그 외의 반도체 경쟁이 치열해졌다. 현재 AI용의 반도체에 있어서는 미국 엔비디아의 GPU의 존재감이 크다. 자율주행에 꼭 필요한 AI의 학습용 서버에는 당사의 GPU가 표준적으로 사용될 뿐만 아니라, AI의 추론을 담당하는 차재 반도체에서도 GPU가 주역이라고 할 수 있다. 자율주행에서 선두를 달리는 미국 테슬라 및 독일의 아우디 차량도 엔비디아의 GPU를 탑재하고 있다.

GPU가 채택된 이유는 높은 성능에 있다. “자율주행에 필요한 차재 반도체의 연산성능은 120TOPS(Tera Operation Per Second). 현재의 PC용 CPU의 2,300배이상이다”. 도요타자동차 미래창생센터 총괄선진기술개발 컴퍼니의 부사장인 오쿠지(奥地) 씨는 이렇게 지적한다. 120TOPS 정도의 성능을 가진 차재 반도체는 아직 존재하지 않으나, GPU를 탑재한 엔비디아의 차재 AI 컴퓨터인 ’DRIVE PX2’는 20TOPS로, 현 시점에서 구입할 수 있는 하드웨어 중 성능이 가장 뛰어나다.

그런 반면, GPU는 소비전력 및 비용이 높아, 개발 용도나 고급차량용으로는 사용되어도 보급 가격대의 양산 차량으로서는 사용하기 힘들다는 지적이 많다. DRIVE PX2의 소비전력은 80~250W로 상당히 높으며, “가격은 수백만 엔에 달한다”(어느 반도체 상사)고 한다. 엔비디아는 저(低)전력화를 노린 차세대 SoC(System on Chip)인 ’엑스비어(Xavier)’를 탑재한 30TOPS의 차재 AI 컴퓨터 ‘DRIVE PX Xavier’를 양산 차량용으로 제공할 예정이다. 그래도 소비전력은 30W로 크다.

이런 상황 속에 많은 반도체 제조업체는 엑스비어의 30TOPS, 30W라는 성능을 하나의 기준으로 하여, 그것보다 저전력에 저비용의 차재 반도체의 개발을 가속화하고 있다. 대표적인 방법은 ‘엑셀레이터’로 불리는 전용회로를 사용하여 GPU의 기능을 대체하려는 시도이다. GPU가 범용적인 연산기를 다수 나열하는 것에 비해, 엑셀레이터는 특정의 연산을 고속∙저(低)전력으로 실행하는 전용회로를 사용한다는 점이 다르다.

-- ‘엑스비어(Xavier)’를 공략 --
르네사스 일렉트로닉스는 2017년 10월에 도요타와 덴소가 2020년의 실용화를 향해 개발하고 있는 고속도로의 자율주행기술인 ‘Highway Teammate’에 엑셀레이터를 탑재한 당사의 차재 SoC ‘R-Car H3’가 채택되었다고 발표했다. 채택을 하는데 결정적인 역할을 한 것이 ‘양산 차에 요구되는 성능과 소비전력의 밸런스’(당사 집행임원 상무의 오무라 씨)였다고 한다.

도요타는 2017년 5월에 자율주행으로 엔비디아와 제휴하여 엑스비어를 사용해 수년 이내에 AI를 활용한 자율주행 시스템의 시장 투입을 목표로 하고 있었다. 그런 반면, 도요타는 엑스비어의 소비전력이 높은 것을 과제로 인식하고 있으며 르네사스의 SoC도 검토하고 있었다. Highway Teammate는 현재 상황에서는 AI를 사용하지 않을 예정이므로 이번 R-Car H3는 엑스비어의 대항마라고는 말할 수 없다. 그러나 도요타가 2020년대 전반의 실용화를 목표로 하는 일반 도로의 자율주행기술 ‘Urban Teammate’는 AI를 활용할 가능성이 높다. 르네사스는 거기에 엑스비어와 대항할 수 있는 차세대 SoC의 투입을 계획하고 있다. 차세대 SoC는 R-Car H3과 동일하게 엑셀레이터에 의한 저(低)전력화를 추구한다.

-- 연산기의 사용률을 90%로 --
“AI용 차재 반도체에 가장 적합한 것은 엑셀레이터다” ---. AI를 사용한 자율주행 소프트웨어를 개발하고 있는 헝가리 AImotive사의 Head of Japan Office의 Axel Bialke 씨는 이와 같은 지적을 한다. 당사는 AI소프트웨어를 개발하는 입장으로서, GPU의 소비전력이 높은 점을 문제시 하고 있으며, 보다 저(低)전력의 독자적인 엑셀레이터인 ‘aiWare의 개발을 추진하고 있다.

당사는 료요일렉트로와의 기술협력을 통해 물체인식용의 뉴럴네트를 GPU와 aiWare의 각자 움직이게 하는 데모를 2017년 11월에 선보였다. 엑셀레이터도 GPU와 같이 물체를 인식할 수 있으며 보행자를 빨간색, 차량을 파란색, 자전거를 노란색으로 구분할 수 있다.

당사가 AI의 추론 실행 시의 연산기 사용률을 측정한 결과, GPU는 20~30%, aiWara은 약 90%로 큰 차이가 벌어졌다. 이에 따라 aiWare은 “동일한 처리 속도라면 소비전력을 GPU의 1/3~1/4로 저감시킬 수 있다”(Bialke 씨)라고 한다. 제조비용을 결정하는 칩의 면적도 GPU에 비해 1/3~1/4로 줄일 수 있다.

-- 수량에 따라서는 FPGA도 선택지 --
엑셀레이터는 SoC 안에 내장하면 가장 높은 성능을 실현할 수 있다. 그러나 SoC는 개발비가 비싸, 대량생산이 예상되는 용도로만 사용될 수 있다. AI를 사용하는 자율주행용의 SoC가 얼마나 대량으로 필요해질지는 미지수이다. 수량이 많지 않을 경우에는 SoC가 아닌, FPGA(Field Programmable Gate Array)가 유력한 후보가 된다. FPGA는 회로를 자유롭게 바꿀 수 있기 때문에 엑셀레이터로 사용할 수 있다. 또한 표준품으로서 대량으로 생산되고 있기 때문에 소량의 용도로도 사용하기 쉽다.

FPGA를 사용함으로써 뉴럴네트의 추론 처리에 필요한 소비전력을 8.5W로 (GPU에 비해 절반 이하로) 낮출 수 있다”고 한다. FPGA는 GPU에 비해 메모리 엑서스의 빈도를 줄이기 쉬우며 메모리의 입출력 회로로 소비하는 전력을 줄일 수 있다. FPGA에는 당사의 미드레인지 제품인’ Arria 10’을 사용했으며 뉴럴네트에는 중국 Horizon Robotics사의 알고리즘을 사용했다.

-- 속도 5배, 소비전력 1/10로 --
FPGA와 동등한 기능을 더욱 고속, 저(低)전력으로 실현하려는 신형 반도체의 개발이 시작되었다. 태양유전과 반도체 설계회사인 TRL이 공동으로 개발하고 있는 ‘MRLD(Memory-based Reconfigurable Logic Device)’는 FPGA에 비해 동작 속도를 약 5배, 논리회로의 밀도를 약 5배 가능할 뿐 아니라, 같은 동작 속도라면 소비전력을 1/10이하로 절감할 수 있다.

평상시의 논리회로는 게이트(트렌지스터)를 조합하여 진리치(입력의 ‘0’,’1’에 대한 출력의 ‘0’,‘1’의 관계)를 정하고 있다. 그러나 진리치를 메모리에 저장하여 참고하는 것에도 같은 동작이 가능하다. 이런 메모리는 룩업 테이블(Look-Up Table, LUT)이라고 불린다. FPGA, MRLD도 LUT로 논리기능을 실현하고 있다는 점에서는 다르지 않다.

다만, FPGA는 LUT와의 사이를 다수의 스위치를 매개로 접속하는 것에 반해, MRLD는 LUT와 직접 접속하고 있다는 점이 다르다. MRLD는 FPGA의 스위치 부분에 발생하는 신호 지연이나 전력소비를 없앤다. 또한 스위치 부분이 차지하는 칩의 면적도 없앨 수 있다. “FPGA의 스위치 부분은 칩 면적의 약 90%를 차지하고 있기 때문에 그 효과는 크다”(TRL 최고경영책임자인 가츠 씨) 는 말한다.

MRLD는 기존의 IC설계법을 거의 그대로 사용할 수 있을 뿐만 아니라, 현재 개발 중의 ‘맵핑 기능’이라고 불리는 설계방법을 사용하면 “설계 기간은 기존의 1/10로 단축시킬 수 있다”(가츠 씨)고 한다.

MRLD의 회로 구성은 뉴럴네트의 구조와 유사하며 그 특징을 살려 AI에 응용할 수 있는 가능성이 크다. 이런 AI로의 응용은 대학과 공동으로 연구 중에 있다. 그 외에도, GPU로 학습시킨 뉴럴네트를 MRLD 상에서 작동시키는 연구에도 착수하고 있으며 “빠르면 3년 이내에 MRLD를 사용한 자율주행용 AI를 실용화 한다는 목표를 세우고 있다”라고 가츠 씨는 말한다.

-- 자율주행의 ‘판단’을 맡는다 --
자율주행에서는 주로 보행자나 차량의 인식처리에 AI를 활용하지만, 인식된 결과를 기반으로 한 판단을 시행하는 부분에도 AI를 이용할 가능성이 높다. 덴소의 자회사로 반도체 IP를 개발하고 있는 엔에스아이테크는 이런 판단처리에 적합한 신형 프로세서 ’DFP(데이터플로프로세서)’를 개발하고 있다. 판단에 관한 알고리즘은 연구 중이며 어떤 처리가 요구될지는 아직 밝혀지지 않고 있다. 그러나 당사에 따르면 화상처리와 같은 획일적인 처리가 아닌, 복잡한 처리를 단시간에 해결해야 할 필요가 있다고 한다.

예를 들어 전방에 이륜차가 갑자기 달려들어 재빨리 피해야 할 상황에 직면했다고 할 때, 보행자가 없는 우측으로 진로를 바꾸는 순간, 전방으로부터 비닐봉지가 날아왔다고 해도, ‘비닐봉지는 부딪혀도 위험하지 않다’라고 판단하는 능력이 프로세서에게 요구된다고 한다. 일련의 동작을 시간에 따라 세부적으로 나눠서 살펴보면 “위험의 크기나 진로의 판단은 시시각각 달라진다”(엔에스아이테크 개발부장 이토 씨). 이와 같이 복잡한 처리를 단시간에 시행하기 위해서는 DFP와 같은 새로운 칩이 필요하다.

-- 뉴럴네트(신경회로망)의 차이를 흡수 --
AI시장에 참여하는 반도체 제조업체에게 순풍으로 작용하는 새로운 규격이 만들어지고 있다. 미국 Khronos Group는 뉴럴네트의 파일형식의 차이를 흡수하는 ‘NNEF(Neural Network Exchange Format)’으로 불리는 규격을 책정 중에 있다. 뉴럴네트에는 다양한 타입이 있으며, 그 종류에 따라 학급 된 네트워크의 출력 파일 형식이 달라진다. 따라서 반도체 제조업체는 이들 파일 형식에 대응한 변환 툴(도구)을 개별적으로 준비해야 할 필요가 있었다.

이에 대해 Khronos Group은 다양한 파일형식의 뉴럴네트를 통일 포맷의 NNEF로 변환시키는 툴(도구)을 무상으로 제공할 예정이다. 반도체 제조업체는 NNEF용의 변환 툴만 준비하면 다양한 종류의 뉴럴네트에 대응할 수 있게 되어 ‘AI 반도체 시장으로의 진입 장벽을 낮출 수 있게 된다”(NNEF의 사양 책정에 가담한 AImotive사의 Lead AI Research Engineer인 Viktor Gyenes 씨).

NNEF의 규격화를 논의하는 워킹그룹은 미국 Intel사를 비롯해 많은 반도체 제조업체가 그 이름을 올리고 있다. 2017년 12월에 잠정적인 사양인 ‘NNEF 1.0’가 공개되었다. 그 이후, 워킹그룹 이외의 업계의 의견 등을 수렴하여 2018년 중순에 정식판을 낼 방침이다.

-- 엔비디아는 더 앞을 내다본다 --
이와 같이 AI 반도체의 개발이 활발히 진행되고 있는 가운데, 선두를 달리는 엔비디아는 어떻게 대응할 것인가. “단순한 가격 경쟁에는 합류하지 않을 것이다”라는 견해가 많다. 당사는 고성능의 제품을 하루빨리 시장에 제공하여 선행자 이익을 올리는 사업 모델을 강점으로 하고 있다. 당사는 30TOPS, 30W의 DRIVE PX Xavier를 제공하지만, 성능은 같지만 소비전력이 더욱 낮으며 저렴한 반도체가 나오는 것은 시간문제일 것이다. 그 시장에서 가격경쟁이 치열해지면 엔비디아는 다음 시장으로 주축을 옮길 것으로 보인다.

그 징조는 이미 나타나고 있다. 엔비디아는 레벨5의 자율주행에 대응하기 위해 성능을 320TOPS와 엑스비어 보다 한 계단 업그레이드 된 차재 AI컴퓨터 ‘DRIVE PX Pegasus’를 2017년 10월에 발표했다. 당사가 ‘로봇 택시’로 부르는 무인 자율주행차의 이용을 상정하고 있다. 소비전력은 500W로 크지만, “320TOPS의 성능을 500W로 손에 넣을 수만 있다면 대환영이다”라고 하는 고객이 많다고 한다. 레벨5의 자율주행차는 배차 등의 서비스로 수익을 내는 사업모델이므로 새로운 서비스를 하루 빨리 시작하기 위해 높은 성능을 중시하는 고객이 많다고 한다. 엔비디아는 차세대 시장을 스스로 창출함으로써 타사와의 경쟁에서 우위를 차지할 수 있다고 생각하고 있다.

 -- 끝 --

목차