니케이 컴퓨터 2024/07/25(1) 데이터센터의 소비전력 급증, 초대규모 모델에 견딜 수 있을까

책 커버 표지
목차

IT가 위험하다
데이터센터의 소비전력 급증, 초대규모 모델에 견딜 수 있을까
특집
・영원의 Java –‘이상의 COBOL’로서 반석의 지위 구축
・시스템 개발에서는 반석, 나쁜 이미지가 족쇄
・표기법의 간략화를 추진, 초보자 친화적인 언어로

요약

Nikkei Computer_2024.7.25 (p8-9)

데이터센터의 소비전력 급증, 초대규모 모델에 견딜 수 있을까
계산량 ‘2020년의 십수만 배’라는 시산도

“지금까지는 연산 장치나 네트워크를 당연한 것처럼 사용해 왔다. 그러나 앞으로는 전력이 제약이 될 수 있다”. 미쓰비시종합연구소의 와타야(綿谷) 연구원은 일본이 미래에 직면할 수 있는 인프라 과제를 이렇게 지적한다.

이러한 지적의 배경에는 생성형 AI의 보급이 있다. 미쓰비시종합연구소가 2024년 5월에 발표한 조사 결과에 따르면, 2040년에는 데이터센터에서 처리하는 계산량이 2020년의 십수만 배에 달할 가능성이 있다고 한다.

데이터센터로 인한 전력수요 증가는 이미 현실이 되고 있다. 도쿄전력의 고바야카와(小早川) 사장은 2024년 6월 14일에 열린 회견에서 국내 전력수요 예측에 대해 언급. 에너지절약 확산에 따른 전력수요 감소라는 최근 경향이 바뀔 수 있다며, 지금이 큰 전환기라고 설명했다.

-- 소비전력이 최대 발전량을 초과하다 --
미쓰비시종합연구소 정책/경제센터의 니시카도(西角) 연구원은 “생성형 AI의 변화는 연속적이라고 보기 어렵기 때문에 트랜드 예측에서는 어렵다”라고 말한다. 그래서 미쓰비시종합연구소는 데이터센터와 네트워크에서의 처리 트래픽량과 전력 효율 각각의 증감을 감안해 곱해서 소비전력을 예측하고 있다.

미쓰비시종합연구소는 예측을 할 때, 생성형 AI의 기반이 되는 모델의 사용법에 따라 3가지 시나리오를 작성했다. (1) 앞으로 등장이 전망되는 파라미터 수가 수조~수십조인 초대규모 모델을 모든 용도에서 사용한다, (2) 가능한 한 수백억 파라미터 이하의 소규모 기반 모델의 생성형 AI를 사용한다, (3) 쌍방을 구분하여 사용한다는 내용이다.

미쓰비시종합연구소는 예측의 전제로 수십 조 규모의 초대규모 모델이 앞으로 등장할 가능성은 있다고 보고 있다. 생성형 AI의 성능과 관련해 오픈 AI가 공표한 ‘스케일링 법칙’에서는 파라미터수를 늘릴수록 성능도 향상한다고 되어 있으며, 지금의 IT업계에서는 통설이 되었다.

미쓰비시종합연구소에서는 지금은 아직 스케일링 법칙의 한계가 보이지 않고, 정확하고 범용성이 높은 생성형 AI의 개발을 위해 초대규모 모델이 개발될 가능성도 있다고 본다. 파라미터수와 소비전력의 관계성은 향후의 기술 혁신으로 변화할 수 있지만, 이번 예측에서는 파라미터수와 연산수, 소비전력이 비례한다고 가정. 이러한 조건에서 2040년 시점의 데이터센터 계산량은 최대 2020년의 십수만 배가 된다는 결과가 나왔다.

생성형 AI의 보급이 소비전력을 비약적으로 증대시킨다는 예측에 대해, 당연히 데이터센터 사업자들도 손을 놓고 있지는 않다. 데이터센터의 전력효율이나 네트워크 기기의 에너지절약 효율은 향상되고 있다.

데이터센터의 에너지절약 효율을 측정하는 지표 중 하나로 PUE(Power Usage Effectiveness)가 있다. 데이터센터 전체의 소비전력을 서버 등 ICT 기기의 소비전력으로 나눈 값으로, 1에 가까울수록 전력의 이용 효율이 높다. 자원에너지청이 업종/분야별 에너지 소비효율의 목표 수준을 정한 ‘벤치마크 제도’에서는 데이터센터 사업자의 2030년도 목표를 PUE1.4 이하로 하고 있다.

데이터센터의 PUE를 밀어 올리는 주요 원인은 서버의 냉각용 전력이다. 생성형 AI를 운용하는 데 쓰이는 GPU(이미지처리반도체)를 탑재하는 서버는 기존의 CPU(중앙연산처리장치) 서버와 비교해 발열량이 크다. 때문에 기존의 냉각 방법으로 GPU 서버를 냉각하기 위해서는 다량의 소비전력이 필요해, 냉각이 따라가지 못하는 경우도 있다.

그래서 데이터센터 사업자는 고효율의 냉각 방법을 모색 중이다. NTT 커뮤니케이션은 2025년 3월에, 에너지 절약 효율을 높인 데이터센터 서비스 ‘Green Nexcenter’의 제공을 시작한다. 사용하는 서버의 종류에 따라, 동일 데이터센터 내에서 기존의 공랭 방식과 액체로 식힌 금속판을 직접 CPU나 GPU에 접촉시키는 액랭 방식 모두를 채택한다.

액랭 방식은 공랭 방식보다 냉각 효율이 높은 것이 특징이다. NTT 커뮤니케이션 플랫폼서비스본부의 마쓰바야시(松林) 부문장은 “액랭 부분만의 PUE인 pPUE(partial PUE)는 1.15. 공랭의 데이터센터보다 소비전력을 약 30% 삭감할 수 있다”라고 말한다.

인터넷 이니셔티브(IIJ)는 데이터센터에 BCP(사업 계속 계획) 용을 겸한 리튬이온 축전지를 설치해, 야간에 모은 전기를 주간에 사용한다. IIJ의 시라이데이터센터 캠퍼스에서는 “2020년에 여름철의 최대 전력을 10.8% 줄이는 피크컷 효과를 실측했다”(IIJ의 도마에(堂前) 홍보부 기술담당 부장).

하지만 미쓰비시종합연구소의 예측에서 소비전력이 최대가 되는 시나리오라면, 데이터센터 사업자에 의한 수많은 전력 절약 시책을 근거로 해도 초대규모 모델을 국내에서 사용할 수 없을 가능성이 있다.

근거의 하나는 일본의 발전 능력에 있다. 전력 광역적 운영추진기관(OCCTO)의 예측에 따르면, 데이터센터나 그것과 마찬가지로 소비전력이 큰 반도체 공장의 증설로 인해 2033년도에는 최대 수요 전력의 개별 편입으로서 537만 킬로와트(kw)가 가산된다고 한다.

이것과는 별도로, 국내의 전력 수급 전망이나 발전소 개발 계획 등을 바탕으로 한 미쓰비시종합연구소의 예측에서는, 2040년의 발전량 상한은 2022년 시점의 1.5배 전후라고 한다. 초대규모 모델을 사용하기 위해서는 이 발전량을 초고하는 전력이 필요하게 될 수 있다.

-- 의약/신재료 개발 등에 영향도 --
수십 조 규모의 파라미터로 이루어진 초대규모 모델을 일본 국내에서 사용할 수 없다면 어떤 사태가 벌어질까?

문장이나 이미지 생성뿐만 아니라, 의약품이나 신규 재료 개발 등 첨단연구에 생성형 AI를 활용하는 움직임이 이미 전 세계에서 확산되고 있다. AI의 성능 향상이 어느 정도냐에 따라 다르지만, 산업계에서 초대규모 모델을 사용하고 싶다는 니즈가 생겨날 가능성은 크다. 소비전력이 걸림돌이 돼 국내 기업의 이런 욕구가 충족되지 못할 수도 있다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

TOP

목차

Nikkei Computer_2024.7.25 목차

IT가 위험하다
데이터센터의 소비전력 급증, 초대규모 모델에 견딜 수 있을까

특집
・영원의 Java –‘이상의 COBOL’로서 반석의 지위 구축
・시스템 개발에서는 반석, 나쁜 이미지가 족쇄
・표기법의 간략화를 추진, 초보자 친화적인 언어로
・착착 진행되는 기능 강화, AI 개발을 전망하다
・갑작스러운 고액 청구의 덫, 라이선스에 주의

특집
・혼란한 정액 감세, 기업/지자체의 부담 증가, 문제시되는 정책 효과

포커스
거대 IT 기업의 생성형 AI 경쟁, 다음은 ‘온디바이스’

인터뷰
미국 데이터로봇(DataRobot)의 데반얀 사하(Debanjan Saha) CEO
예측 AI와 생성형 AI를 조합해 가치 향상, 도쿄에 데이터센터를 신설해 제공

뉴스 & 리포트
・미쓰비시UFJ가 시스템 회사 신설, 지방은행을 위한 메인 프레임을 일괄 조달
・'DX의 성과가 나오고 있다'는 60%대, 시스템 자체 제작에 주력하는 기업 증가
・일본 오라클, '속(續) VMware' 선언, 레거시 마이그레이션을 강화
・히노마루(일장기) LLM 전선에 후지쓰도 참여, 비책은 '약점 극복한 신형 RAG'
・GPT-4o를 2주 조금 넘는 시간에 초고속 구현, 머니 포워드가 베타 버전
・새 지폐 대응은 금융이나 철도가 선행, 투자액은 5000억엔 규모
・SBG가 의료 AI 벤처기업과 합작, 미국의 환자 데이터를 일본에서 활용

난반사
환갑을 맞이한 JBCC, 초고속 개발과 서브스크립션 사업으로 시프트

데이터는 말한다
랜섬웨어의 몸값 지불, 감염 후에 방침을 생각하는 기업이 약 50%

케이스 스터디
[Air Water]
처리 지연을 클라우드 리프트로 해소, V2V로 기간계 이행 기간을 반년 빠르게

도전자
tokuiten의 도요시 류이치로(豊吉 隆一郎) 대표이사
AI와 로봇으로 농업을 DX, 미니토마토 재배 지식 축적

움직이지 않는 컴퓨터
[사카이시, 가와사키시, 사이다마시 등]
정액 감세 처리에서 계속되는 오류, 짧은 준비 기간으로 검증 부족이 드러나다

연재
기업이 빠지는 5가지 AI 리스크
공들인 논문을 학회가 거부, 생성형 AI를 활용한 연구자의 오산

오류 투성이의 설계 리뷰
실은 2종류가 있는 AI 시스템, 정확하게 구분해 리뷰하자

실천 DX, 클라우드로 시작하는 데이터 매니지먼트
복잡해지는 데이터 기반 거버넌스, 데이터 메시로 통제하면서 최적화

사장의 의문에 답하는 IT 전문가의 대화술
중요 데이터를 정리하는 책임자, 데이터 스튜어드를 두자

키워드
AI 에이전트(AI agent)

오피니언
극언 정론
주목 받은 ‘프로세스 오피스’, DX를 고립시키지 않는 핵심

모바일 일도양단
‘도움이 되지 않는 가이드라인’, 고정 브로드밴드 품질 측정에?

나카타 아쓰시의 GAFA 깊이 읽기
업무 데이터 활용하는 생성형 AI 앱 어떻게 개발하나, 방법은 2종류

오모리 도시유키의 프로그래밍으로 가자
프로그래머의 '선민의식', 코드를 쓸 수 있는 것은 대단한 것인가

가쓰무라 유키히로의 ‘오늘도 누군가를 노린다’
링크되어 있는데 실재하지 않는 '팬텀 도메인'에 숨어 있는 함정

 -- 끝 --


 

TOP