일본산업뉴스요약

엔비디아, 새로운 GPU ‘A100’ 발표 -- AI 학습 및 추론 성능, 기존 대비 20배
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2020.5.14
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2020-05-22 13:34:44
  • 조회수526

Nikkei X-TECH_2020.5.14

엔비디아, 새로운 GPU ‘A100’ 발표
AI 학습 및 추론 성능, 기존 대비 20배

미국 엔비디아(NVIDIA)가 새로운 GPU ‘A100’를 발표했다. AI 학습 및 추론에서 ‘Volta’세대의 기존 GPU에 비해 20배의 성능을 가지고 있다고 한다. 연산처리 성능은, 예를 들어 FP 32(단일 정밀도 부동 소수점 연산)를 통한 학습에서는 312 테라플롭스(Tera Flops), INT 8(8비트 정수연산)을 통한 추론에서는 1,248 TOPS에 달한다. 이와 함께 ‘A100’을 이용한 슈퍼컴퓨터와 슈퍼컴퓨터로 구성된 클러스터도 함께 발표했다.

A100에서는 ‘Ampere’이라고 하는 새로운 GPU 아키텍처를 채택. A100의 트랜지스터 수는 54억개로, 대만 TSMC의 7㎚세대 제조 프로세스로 제작되었다. GPU의 다이 사이즈(Die size)는 826㎟로, 7㎚세대의 프로세서로서는 ‘업계 최대’(엔비디아)라고 한다. GPU 간을 접속하는 인터커넥트에 600GB(기가바이트)/s(초)의 ‘NVLink’를, 메모리에는 삼성전자의 40GB ‘HBM2’를 채택했다.

A100을 8개 이용한 새로운 슈퍼컴퓨터(서버)가 ’DGX A100’이다. 연산처리 성능은 INT 8에서 10P(Peta) OPS, FP 16(반정밀도(Half precision)부동 소수점 연산)에서는 5페타플롭스(Peta Flops)에 달한다. GPU 간을 연결하는 스위치칩 ‘NVSwitch’를 6개 채택, 쌍방향 통신 대역 폭은 4.8TB(테라바이트)/s(초)이다. 엔비디아가 인수한 미국 Mellanox Technologies의 네트워크 카드 제품으로 200GB/s의 ‘ConnectX-6 VPI’가 9개 장착되어 있다. CPU로는 미국 AMD의 ‘제2세대 EPYC’(개발 코드명 ‘Rome’)’을 채택. 보조기억장치로 15TB의 SSD를 도입했다. DGX A100의 가격은 19만 9,000달러부터이다.

엔비디아는 DGX A100을 140개 사용한 차세대 클러스터 ‘DGX SuperPOD’도 발표. 연산처리 성능은 700페타플롭스에 달한다.

DGX A100은 AI데이터센터의 러닝코스트를 기존에 비해 큰 폭으로 절감할 수 있을 것으로 엔비디아는 보고 있다. 예를 들어 AI 학습을 위한 자사의 기존 서버 ‘DGX-1’ 50대와 추론을 위한 CPU시스템 600대로 구성된 데이터센터를 5대의 DGX A100으로 대체할 수 있어 대폭적인 공간 절약 및 소비전력 절감이 가능하다고 한다. 구체적으로는 랙 횟수가 25번, 소비전력이 630kW였던 것을 랙은 1번, 소비전력은 28kW로 가능하다고 한다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록