- 반도체 제조사의 상식을 뛰어넘은 테슬라의 AI 코어 -- ‘놀라울 정도로 단순’
-
- 카테고리스마트카/ 항공·우주/ 부품
- 기사일자 2020.8.4
- 신문사 Nikkei X-TECH
- 게재면 online
- 작성자hjtic
- 날짜2020-08-13 09:31:24
- 조회수553
Nikkei X-TECH_2020.8.4
반도체 제조사의 상식을 뛰어넘은 테슬라의 AI 코어
‘놀라울 정도로 단순’
미국 테슬라는 전기자동차(EV) ‘모델3’ 등에 자율주행에 대응하는 새로운 통합 ECU(전자제어 유닛) ‘FSD(Full Self-Driving) 컴퓨터’를 도입. 자체 개발한 반도체칩을 통해 AI의 처리 성능이 비약적으로 향상된 점이 특징이다. 이 AI 반도체를 분석한 결과, 의외의 결과가 밝혀졌다.
‘테슬라의 AI 반도체는 회로 구성이 놀라울 정도로 단순하다”. 이렇게 지적한 곳은 테슬라의 AI 반도체를 분석한 헝가리의 AI모티브(AImotive)이다. AI모티브는 자율주행용 AI 반도체 개발업체로, 자사 제품의 벤치마킹 대상으로 테슬라의 칩을 분석했다.
테슬라가 개발한 ‘FSD칩’은 CPU코어 및 GPU코어와 함께 AI 처리를 고속화하기 위한 전용 회로인 AI 액셀러레이터 ‘NNA(Neural Network Accelerator)’를 탑재하고 있다.
NNA는 FSD칩의 AI 처리 성능을 높이는 ‘심장부’라고 말할 수 있는 회로로, 테슬라는 이 부분을 커스텀 설계로 해 NNA가 놀라울 정도로 단순해졌다고 AI모티브는 지적한다. MAC(Multiply Accumulation, 적화연산)의 회로 블록 주변에 SRAM 회로 블록을 배치했다. MAC - SRAM 간의 데이터 전송 속도가 보틀넥(Bottleneck)이 되기 쉬운 구조로, “반도체 제조사라면 이런 단순한 설계는 하지 않는다”(AI모티브)라고 한다.
화상인식 등의 AI 처리에서는 센서로부터의 입력에 대해 MAC를 통한 적화연산을 여러 번 반복한다. 연산 결과를 SRAM에 일시적으로 저장, 그 데이터를 다음 연산에서 사용하는 것을 반복하는 것이다. 이 때문에 MAC - SRAM 간의 데이터 전송 속도가 늦어질 경우 메모리 액세스 간 연산장치가 대기하게 되면서 낭비가 발생한다.
AI모티브의 추산에서는 AI 처리 시에 NNA의 연산장치가 가동하는 비율(연산장치의 사용 효율)은 30% 정도에 머무를 가능성이 있다고 한다. FSD컴퓨터는 NNA를 총 4개 탑재해 최대 144TOPS(매초 144조 회)의 연산 성능을 가지고 있지만, 만약 연산장치의 사용 효율이 30%인 경우, 실제로는 43TOPS의 연산 성능밖에는 나오지 않는다. 연산장치의 사용 효율이 낮으면 소비전력과 칩 면적(칩 비용)에서도 낭비가 많아진다.
이처럼 테슬라가 일견 불리한 회로 구성을 채택한 점에 대해 AI모티브는 “개발 기간(time to market)을 우선으로 한 결과로 보인다”라고 분석한다. 반도체 업계에서는 MAC - SRAM 간의 데이터 전송 속도를 비약적으로 높일 수 있는 방법이 이미 개발되었기 때문이다. 예를 들어 MAC와 SRAM을 일체화한 회로 블록을 다수 병렬하는 방법을 사용하면 “MAC - SRAM 간의 데이터 전송 속도를 현재 NNA의 약 100배로 고속화할 수 있다”(AI모티브). 이 경우, 연산장치의 사용 효율이 70~90% 개선된다고 한다.
반면 회로 설계는 복잡해진다. “테슬라의 심플한 NNA에 비해 개발 기간은 반년에서 1년 정도 길어질 것이다”(AI모티브). 테슬라는 이 불리한 점을 숙지한 상태에서 “개발 기간을 단축할 수 있는 단순한 회로 구성을 선택했다”라고 AI모티브는 분석한다.
이처럼 반드시 최신이 아닌 기술을 조합해 개발 기간을 단축하는 방법은 이전 애플의 아이폰 등에서도 사용되었다. 테슬라는 자율주행 센서에 최신 LIDAR(레이저레이더)가 아닌 높은 기술 수준의 카메라와 밀리파 레이저를 사용한다. 반도체 또한 새로운 기술을 도입하지 않고 개발 기간 단축을 위한 기술을 선택했다고 AI모티브는 보고 있다.
일반적으로 반도체 제조사는 새로운 기술을 통해 조금이라도 칩 면적을 줄여 저비용화하고 싶어한다. 이 때문에 테슬라처럼 불리함을 숙지한 상태에서 과감하게 이를 사용하는 발상은 나오기 쉽지 않다. 하지만 테슬라처럼 고급 EV 제조사의 입장에선 반도체 칩 면적을 줄이는 것보다 빨리 시장에 내놓는 것이 보다 중요하다고 할 수 있다. 테슬라의 AI 칩은 자동차 제조사만이 가능한 ‘합리적인’ 반도체라고 할 수 있다.
-- 새로운 반도체 아키텍처 제안 잇따라 --
반도체 업계에서는 테슬라의 FSD칩과 NNA를 모델로 진일보한 개선을 위한 움직임이 나오고 있다. 그 중 하나가 앞에서 언급한 MAC와 SRAM을 일체화한 회로 블록을 분산 배치하려는 어프로치이다. AI모티브 외에도 미국 Gyrfalcon Technology가 이러한 아키텍처를 채택하고 있다. 물론 테슬라가 차세대 버전의 NNA에서 이러한 구조를 사용할 가능성도 있다.
AI모티브가 개발하고 있는 AI 엑셀러레이터 IP ‘aiWare’에는 MAC와 SRAM을 일체화한 ‘LAM(Layer Access Module)’이라고 불리는 회로 블록이 다수 병렬된 아키텍처가 채택되었다. 올 10월에 한국 SoC 벤더인 Nextchip은 aiWare의 제 3세대 제품 ‘aiWare 3P’가 탑재된 SoC ‘APACHE5’을 판매할 계획이다. ADAS(Advanced Driver Assistance Systems) 및 자율주행용 카메라로의 탑재를 목표로 하고 있으며, 최대 570만 화소 카메라에 대응할 수 있다고 한다.
향후, ADAS와 자율주행용 카메라에서 고화소화가 추진된다면 AI 엑셀러레이터 연산장치의 사용 효율을 높이는 것은 어려워진다. 고해상도 화상 데이터를 AI로 처리할 경우, 대용량의 캐시메모리가 필요하기 때문이다. AI 엑셀러레이터 안의 SRAM이 부족하면 외부 DRAM에 대한 액세스가 발생해 연산장치의 사용 효율이 급격하게 떨어진다.
테슬라의 NNA는 32M바이트라는 대용량 SRAM을 AI 엑셀러레이터에 탑재함으로써 이 문제를 회피했지만, SRAM을 집중적으로 배치했기 때문에 MAC와의 데이터 전송이 보틀넥이 되기 쉽다. 이 때문에 앞으로는 대용량 SRAM과 함께 LAM과 같은 새로운 아키텍처가 필요하게 될 것이라고 AI모티브는 주장한다. 또한 동일한 SRAM 용량이라면 SRAM을 집중적으로 배치하거나 분산 배치해도 “칩 면적은 거의 변하지 않는다”(AI모티브)고 한다.
-- AI 반도체에 MRAM를 혼재(混載) --
Gyrfalcon Technology의 AI 엑셀러레이터도 연산장치와 메모리를 일체화한 ‘AI Processing in Memory(APiM)’라고 불리는 회로 블록이 다수 병렬된 구조이다. 소형에 저소비 전력인 점 때문에 현재는 주로 스마트폰의 화상처리에 사용되고 있다. 예를 들어 한국 LG전자의 스마트폰 ‘Q70’에서는 동영상 촬영 시에 실시간으로 아웃포커싱 하는 처리에 이 AI 엑셀러레이터가 사용되고 있다.
통상적으로 AI 엑셀러레이터의 메모리에는 SRAM를 사용하지만, Gyrfalcon은 불휘발성 메모리의 MRAM을 사용한 제품도 생산하고 있다. MRAM은 SRAM에 비해 메모리의 밀도를 높일 수 있을 뿐만 아니라 전원을 꺼도 데이터를 보존할 수 있기 때문에 소비전력을 절감할 수 있다. 이처럼 AI 엑셀러레이터에서는 불휘발성 메모리의 활용도 중요한 테마가 될 것으로 보인다.
Gyrfalcon은 앞으로 스마트폰 시장뿐만 아니라 감시카메라와 산업기기(화상검사기기), 자동차 등의 시장을 개척해나갈 계획이다. Gyrfalcon Technology 일본법인의 니시구치(西口) CEO는 “자동차 시장에서는 에프터마켓용 드라이브 레코더를 발판으로 삼고 싶다”라고 말한다.
난폭운전 문제 등을 배경으로 차외 영상을 기록할 수 있는 드라이브 레코더의 수요가 높아지고 있지만, 최근에는 차내 모습을 기록할 수 있는 기종도 늘어나고 있다. 이러한 드라이브 레코더에 AI 엑셀러레이터를 탑재하면 운전자의 졸음을 검지해 경보를 울리는 DMS(운전자 감시시스템)와 같은 기능을 실현할 수 있다고 한다. 구체적인 검토는 지금부터 진행될 예정으로 판매 파트너를 통해 시장을 개척, 향후에는 ADAS와 자율주행 시장에도 도전할 계획이다.
니시구치 CEO는 이전 교세라의 사장과 CEO를 역임한 경영자로, ‘일본의 제조업이야 말로 AI가 필요하다’라는 생각에 AI 엑셀러레이터 사업에 뛰어들었다. 예를 들어 제조업에서 많이 사용되는 화상검사 공정에서는 “검사 대상에 어떻게 빛을 조사(照射)할 것인가, 어떤 카메라가 적합할 것인가 등의 노하우를 현장의 기술자들이 가지고 있다. 여기에 AI를 활용하는 기능을 추가함으로써 경쟁력을 높일 수 있을 것이다”(니시구치 CEO).
“기술 전승에도 AI는 도움이 된다. AI의 수학적인 논리가 아닌 AI를 구사하는 응용 기술을 현장에 확대해나가고 싶다”라고 니시구치 CEO는 말한다. 이를 위해 Gyrfalcon Technology 일본법인은 제조 현장에서 AI를 활용할 수 있는 기술자를 육성하는 ‘AI 디자이너 육성 강좌’를 SUS와 공동으로 설립. 이러한 움직임을 통해 제조업에 관련된 중소기업들을 AI 관점에서 지원해나갈 계획이다.
-- 끝 --
Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.