일본산업뉴스요약

딥마인드, 알파고 제로 개발 -- 독학으로 배우는 AI, 자기와의 대국 통해
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2017.10.19
  • 신문사 일간공업신문
  • 게재면 21면
  • 작성자hjtic
  • 날짜2017-10-25 17:23:20
  • 조회수597

딥마인드, 알파고 제로 개발
독학으로 배우는 AI, 자기와의 대국을 통해 성능 향상

구글의 모회사 알파벳 산하의 딥마인드(영국)는 독학으로 처음부터 바둑을 배우는 AI ‘알파고 제로’를 개발하였다. 2016년에 한국의 최고 바둑기사를 물리친 ‘알파고’는 인간이 대국한 기보를 학습용 데이터로 이용하였다. 한편, 알파고 제로는 자기 대국으로 바둑 두는 기술을 배운다. 학습 개시 3일만에 최고의 바둑 기사를 물리칠 수 있는 실력을 장착, 학습 40일에는 예전 타입의 알파고 등 모든 지능보다 우수한 힘을 갖게 되었다.

알파고 제로는 처음에는 랜덤으로 두지만 자기 대국을 반복할 때마다 성능이 향상된다. 한국의 최고 기사에게 승리했을 때의 (예전) 알파고에게는 학습 3일 만에 100전 전승을 거뒀다. 490만 번 자기 대국을 반복한 결과, 모든 예전 타입의 알파고를 물리쳤다.

알파고 제로는 바둑판 위의 돌 위치 만을 학습 데이터로서 이용하기 때문에 인간이 데이터를 입력할 필요는 없다. 대형 계산기 등의 계산 자원은 예전 타입의 10분의 1이면 된다. 학습 과정에서 기사들이 오랫동안 쌓아 온 ‘정석’을 찾아내고, 새로운 ‘정석’을 만드는데도 성공하였다.

기존의 AI 연구는 연구자가 ‘정석’ 등의 규칙을 프로그램화하여 AI를 강화해 왔다. 알파고는 ‘정석’을 데이터를 통해 학습하고, 알파고 제로는 ‘정석’을 자력으로 획득한 것이 된다.

성과는 19일, 세계적인 과학학술지 네이처에 게재되었다.

  -- 끝 --

목록