일본산업뉴스요약

생성 AI로 인해 변화하는 데이터센터 -- 냉각은 외기부터 기체로
  • 카테고리사물인터넷/ ICT/ 제조·4.0
  • 기사일자 2023.8.3
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2023-08-14 20:17:32
  • 조회수414

Nikkei X-TECH_2023.8.3

생성 AI로 인해 변화하는 데이터센터
냉각은 외기부터 기체로

막대한 계산 자원이 요구되는 생성 AI(인공지능)의 등장으로 인해 데이터센터의 소비전력이 급격하게 증가하고 있다. 그에 따라 냉각 방식을 재검토하는 움직임이 활발해지기 시작했다. 지금까지는 공냉 방식이 중심이었지만 앞으로는 액체에 의한 냉각(액냉) 방식이 본격화될 전망이다.

 

생성 AI가 '데이터센터'에 미치는 영향

・생성 AI에서 이용하는 대규모 언어모델을 학습하기 위해 막대한 계산 자원이 요구된다.

・계산 자원을 늘리기 위해 고성능 프로세서를 채택하기 때문에 소비전력이 증가한다.

・소비전력이 큰 프로세서를 냉각해 정상적으로 작동하기 위해 냉각시스템의 성능 향상이 요구된다.

향후 예상되는 트렌드

・연산처리 성능이 높은 프로세서에 대한 수요가 한층 높아진다.

・소비전력을 줄이기 위해 새로운 반도체나 통신기술, 전력제어 기술의 도입이 늘어난다.

・외기 냉각과 더불어 직접 액체냉각이나 액침냉각의 도입이 늘어난다.


지바현 시라이시에 있는 인터넷 이니셔티브(IIJ) ‘시라이 데이터센터 캠퍼스’. 23년 7월에 2기동을 운영하며 시작했는데 수요가 많아지면서 벌써 3기동 운영을 검토하고 있다.

3기동의 목표는 생성 AI나 대규모 언어모델(LLM)과 같은 막대한 계산 자원이 요구되는 최신 AI에 대응한 데이터센터다. IIJ에 따르면, AI의 학습에 필요한 계산 능력은 2012년 이후부터 3~4개월 마다 배증해 왔다고 한다. 생성 AI의 등장으로 한층 더 속도가 빨라질 것으로 예측된다.

계산 능력에 배증과 더불어 우려되는 것이 소비전력의 증가다. 그것은 발열량이 늘어나는 것을 의미한다. 그래서 IIJ는 냉각 방식을 재검토하기로 했다.

일반적으로 프로세서의 ‘열설계전력(TDP)’이 300W를 넘으면 공냉으로는 충분히 냉각되지 못해 액냉이 필요하다. 생성 AI의 학습에 이용되는 미국 인텔과 Advanced Micro Devices(AMD)의 데이터센터용 CPU 및 엔비디아의 GPU(그래픽처리장치) 등 상위 버전은 이미 TDP가 300W를 넘었다.

-- 직접 액체 냉각을 도입 --
이러한 이유로 IIJ는 3기동에서 콜드 플레이트(냉각 금속판)에 의한 직접 액체 냉각(DLC) 방식의 채택을 검토하고 있다. 다만 데이터센터에는 공냉 방식을 적용해야 하는 네트워크 기기도 존재한다. 그래서 3기동에서는 DLC 방식과 공냉 방식을 병용하는 하이브리드형이 유력한 후보로 떠오르고 있다.

하이브리드형 냉각 시스템이라면 랙(Rack) 당 발열량으로 최대 80kVA까지 대응할 수 있을 것으로 보고 있다. 외기 냉각인 2기동은 20kVA이다.

DLC 방식보다 진일보한 액냉 방식으로서 주목받고 있는 것은 절연성이 있는 액체에 서버 등의 기기를 가라앉혀 식히는 액침냉각 방식이다. 냉각 성능이 높을 뿐만 아니라 서버 냉각에 필요한 에너지를 기존 대비 90% 이상 절감할 수 있다.

이러한 이점 때문에 국내외에서 액침냉각 방식을 도입하기 위한 실증실험이 진행되고 있으며, 일부에서는 이미 실용화되었다. 예를 들면, KDDI와 미쓰비시중공업, NEC넷에스아이(NEC Networks & System Integration)는 데이터센터 서버를 액침 방식으로 식히는 실증실험을 하여 냉각에 드는 전력을 94% 줄였다고 23년 3월에 발표했다. 23년 중에 액침냉각 방식을 채택한 데이터센터의 서비스를 제공할 예정이다.

이점이 많은 액침냉각 방식이지만 유지보수 등 운용에 수고와 비용이 많이 든다. 그래서 이러한 과제를 해결하기 위한 움직임도 나오고 있다. 예컨대 NTT 데이터는 기존보다 운용성이 뛰어난 랙형 액침냉각 시스템을 미쓰비시중공업과 구축해 효과를 검증했다고 23년 6월에 발표했다. NTT 데이터는 23년 중에 이 시스템을 자사 데이터센터에 도입한다고 한다.

랙형 액침냉각 시스템에서는 랙 안에 여러 개의 소형 탱크를 설치해 유닛 단위로 냉각한다. 이를 통해 유지보수의 수고를 줄일 수 있다. 기존의 탱크형은 랙 전체를 하나의 탱크로 냉각하기 때문에 유지보수가 번잡했다.

*키워드
액침냉각: IT 기기나 마더보드를 액체 냉매가 들어간 탱크에 가라앉혀 프로세서 등을 냉각하는 것을 말한다. 액체 냉매의 순환에 팬이나 펌프를 사용하지 않으므로 냉각 시스템의 에너지를 대폭 줄일 수 있다. 게다가 고장으로 이어지는 습도나 산소의 영향을 배제할 수 있기 때문에 서버의 고장률을 낮추는 효과도 기대할 수 있다.

 -- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록