- 이화학연구소, 슈퍼컴퓨터 ‘후가쿠’의 기간 네트워크 쇄신 가용성 향상과 운용 코스트 절감을 양립 2부
-
- 카테고리미래기술,전망/첨단산업
- 기사일자 2025.9.09
- 신문사 Nikkei X-TECH
- 게재면 online
- 작성자hjtic
- 날짜2025-10-13 08:46:53
- 조회수21
이화학연구소, 슈퍼컴퓨터 ‘후가쿠’의 기간 네트워크 쇄신
가용성 향상과 운용 코스트 절감을 양립 2부
-- 조사 및 트러블 대응을 내제화 --
현행 네트워크로 전환한 시점에서 운용 체제도 재검토했다. 그것이 3번째 시책인 네트워크 운용의 내제화이다. 외부에 위탁하는 업무 범위를 기존보다 크게 줄였다.
기존의 체제에서 R-CCS가 담당했던 것은 연구자 등으로부터의 문의에 대응하는 헬프 데스크 업무 등에 머물러 있었으며, 네트워크의 설정 변경 등 대부분의 작업을 외부에 위탁하고 있었다. 연구자가 후가쿠 이용 시, 설정 변경이 필요하게 될 때나 헬프 데스크에서는 대응할 수 없는 조사 등에 대해서는 “의뢰서를 작성해 외부에 위탁했다”(노무라 전문기술원).
새로운 체제에서는 후가쿠 이용에 따른 네트워크 설정 변경이나 후가쿠 이용 중에 발생한 트러블 문의는 우선 외부 위탁한 헬프 데스크의 담당자에게 상황을 정리하도록 한 다음, 노무라 전문기술원을 포함한 2명의 R-CCS 직원이 대응하는 체제로 변경했다. 이와 같은 내제화로 인해 연구자 등의 요망에 대응하는 시간이 확실히 짧아졌다고 한다.
이렇게 해서 후가쿠의 기간 네트워크 사용성은 높아졌다. 반면, 일련의 시책들은 코스트 및 운용 부하 상승을 초래할 수 있는 것처럼 비쳐진다. 그렇게 되지 않도록 R-CCS 는 두 가지 절약 방법을 도입했다. 하나는 케이블 등을 정품에 구애 받지 않고 호환성 있는 시판품으로 대체한 것. 다른 하나는 운용의 외부 위탁을 대폭 줄이고 내제화로 전환한 것이다.
이와 동시에 새로운 감시 툴을 도입하는 등, 내제화에 의한 운용의 신속화도 실현했다. “외부 위탁 비용만을 단순하게 비교하면 70% 정도 줄었다”(노무라 전문기술원).
우선, 도입 비용을 절약하는 방법으로 네트워크 관련 주변 기기를 재검토했다. 예를 들면, 기기를 수납하는 랙이나 광섬유 케이블, 통신 기기에 장착하는 SFP(Small Form-factor Pluggable) 모듈 등을 저가의 제품으로 전환했다.
예를 들어 SFP 모듈의 경우, 제조사 등에서 구입하는 순정품과 비슷한 수준의 기능을 가진 시판품을 찾아냈다.
순정품 가격은 수 십만 엔이지만, “시판품의 경우, 수 만 엔 정도에 불과한 경우도 있다. 인터넷 사이트에서 구입하기도 했다”(노무라 전문기술원)라고 한다.
시판품을 사용하면 정품과 달리 보수 작업 등을 제조사나 판매점에 맡길 수 없다는 문제가 있지만, R-CCS는 시판품으로 구성된 주변 기기를 소모품으로 보고, 고장이 나면 곧바로 자체적으로 교환하는 방법으로 문제를 해결했다.
이전의 운용 실적을 통해 정품이 아니더라도 고장이 빈발하는 상황은 일어나지 않을 것이라고 예상할 수 있었기 때문에 이러한 방법으로 도입 비용을 절감할 수 있었다.
현재, 대부분의 운용은 R-CCS 멤버로 대응할 수 있는 체제를 정비했다. 이를 통해 연구자의 요망에 따라 신속한 네트워크 설정 변경이나 트러블에 대한 대응이 가능해졌으며, 외부 위탁 비용도 약 70% 감소했다.
운용 업무의 대부분을 내제화했지만, 멤버의 업무 부담은 크게 증가하지 않았다. 포인트는 두 가지이다.
하나는 중복 구성의 채택이다. 케이블 교체나 기기 설정 변경에 따른 네트워크 정지 리스크가 경감되어 작업하는 시간대의 자유도도 높아졌다.
다른 하나는 새로운 감시 툴, 미국 Arista Network의 ‘CloudVision’의 도입이다. 네트워크에 연결되는 기기의 상태나 트래픽량 등을 실시간으로 가시화하는 기능을 갖추고 있다.
네트워크의 운용 감시에서 일반적인 SNMP(Simple Network Management Protocol, 간이 망 관리 프로토콜) 기반의 툴보다 폭넓은 정보를 파악할 수 있어 선제적으로 대응하기 쉬워졌다. 예를 들면, 케이블 고장 등의 장애 원인도 특정하기 쉬워졌다.
-- IPv6 환경을 정비 --
운용의 내제화와 그것을 뒷받침하는 중복 구성은 시대의 흐름에 따른 네트워크 환경의 진화에도 기여하고 있다. 예를 들면, 2024년 12월, R-CCS 는 후가쿠의 기간 네트워크로 IPv6 통신을 실현하기 위한 환경을 정비했다. 2030년경의 가동을 목표로 하는 차세대 슈퍼컴퓨터 ‘후가쿠 NEXT’를 염두에 두고 “슈퍼컴퓨터를 구성하는 각각의 계산 노드 단위로 외부와 통신하고 싶다고 하는 니즈에 대응하기 위해 정비했다”(노무라 전문기술원)라고 한다.
예를 들면, 현행의 후가쿠를 구성하는 계산 노드는 전체적으로 약 16만 개. 각각의 노드 단위로 통신할 수 있도록 하려면 약 16만 개의 IP 주소를 할당할 필요가 있다. 이 경우, 다수의 글로벌 유니캐스트 주소를 이용할 수 있는 IPv6 환경이라면 실현하기 쉽다. 그래서 R-CCS는 “2024년의 여름부터 여유 시간을 활용해 IPv6 환경을 조금씩 구축해 왔다”(노무라 전문기술원).
향후에는 취약성에 대한 감시 체제 강화 등, 보안 위협에 대비하는 환경 개선을 목표로 하고 있다고 한다.
-- 끝 –
Copyright © 2025 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.