일본산업뉴스요약

AI, 일본의 강점은 현장에 -- ‘강화 학습’, ‘전이 학습’이 적은 데이터로 성과
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2018.5.29
  • 신문사 일경산업신문
  • 게재면 6면
  • 작성자hjtic
  • 날짜2018-06-05 08:56:55
  • 조회수422

AI, 일본의 강점은 현장에 있다
강화 학습’, ‘전이 학습’이 적은 데이터로 성과 낸다

인공지능(AI)의 활용이 다양한 분야로 확산되고 있는 가운데 데이터 수집의 중요성이 더욱 커지고 있다. 딥러닝(심층학습)으로 성과를 내기 위해서는 AI에 정답을 이해시키기 위해 얼마나 양질의 데이터를 대량으로 수집할 수 있는 지가 중요해진다. 건설분야 등 학습 데이터를 수집하기 어려운 상황에서의 이용을 내다보고 적은 데이터로 성과를 내는 학습 모델의 연구도 추진하고 있다.

산업기술종합연구소는 23일 일본이 개발해야 할 AI의 기반 기술의 방향성을 발표했다. 그 중에서 일본형 AI로써 강조한 것은 다양한 데이터의 활용이다. 인공지능연구센터의 쓰지이(辻井) 센터장은 “일본의 강점은 (제조업 및 의료 등의)현장을 가지고 있는 것이다. 현장에서 데이터를 얻는 환경을 더욱 적극적으로 활용해야 한다.”고 말했다.

현재 AI는 학습시킬 데이터가 무엇인가에 대해서 인간이 정답을 알려준 뒤 학습시키는 방법이 주류이다. 예를 들어 영상에 비추어진 식자재가 무엇인지를 AI로 분류시키고 싶은 경우에 영상과 거기에 비추어지고 있는 식자재를 판단하는 데이터를 인간이 준비해야만 한다.

데이터 양은 수 만에서 수 십 만이 되는 경우도 있다. 인공지능학회 회장을 역임하는 야마다(山田) 국립정보학연구소 교수는 “정답이 있는 데이터를 어떻게 수집하는 지가 가장 애로 사항이다.”고 말한다.

영상에 비춰진 것이 식자재라면 전문적인 지식이 없어도 분류할 수 있다. 이 경우 데이터 분류를 불특정 다수의 사람에게 일을 발주하는 클라우드 소싱이 유효하다. 연구자가 혼자 힘으로 분류 데이터를 작성하는 것보다 효율이 좋고 단시간에 필요한 데이터를 얻을 수 있다. 데이터를 AI에 학습시키면 식자재를 자동으로 분류하는 서비스 등에 응용할 수 있다.

한편, 인간의 세포가 정상인지 암세포인지를 내시경으로 촬영한 영상으로 분류하는 일은 일반인에게는 어렵다. 영상이 암세포인지 여부를 판단하는 데이터는 전문 의사가 아니면 작성할 수 없기 때문에 AI에 학습시키는 것이 어렵다. 이것이 의료 영상의 판정 시스템 개발이 어려운 요인이다.

데이터가 없어도 사용하기 쉬운 AI의 학습 방법은 몇 가지 있다. 그 중에서도 주목 받고 있는 것이 ‘강화학습’이라 불리는 방법이다. 데이터가 없어도 높은 성과를 내기 위해 행동을 반복함으로써 적절한 성과를 낼 수 있게 된다. 프로 바둑 기사의 기술을 배우지 않아도 AI끼리 대전을 거듭함으로써 세계 최고의 바둑 기사를 웃도는 능력을 손에 넣은 바둑 AI ‘알파고’에는 강화학습이 주로 사용된다.

시미즈건설은 터널 공사에 필요한 굴삭 계획을 작성하는 시스템 개발에서 강화학습을 이용했다. 시뮬레이션 시에 굴삭기가 지나간 경로와 지나가야 할 경로의 차이를 적게 만들도록 시뮬레이션을 반복함으로써 목적한 경로를 지나가는 것이 가능한 굴삭 계획을 짤 수 있게 되었다.

사용할 수 있는 데이터가 적은 경우에는 사전에 비슷한 데이터를 AI에 학습시키고 나서 그 학습 모델을 전용하여 정말로 학습시키고 싶은 데이터를 학습시키는 ‘전이학습’이 사용되고 있다.

도호쿠대학의 이누이(乾) 교수는 멜로디에 맞추어 가사를 자동으로 작성하는 기술을 개발했다. 인터넷에서 일반 공개되어 있는 가사가 있는 멜로디 900곡과 팝송 등 5만 4,000곡의 가사 데이터를 AI에 학습시켰다.

처음에 가사 데이터만을 AI에 학습시켜 자연스러운 일본어를 습득시킨 후 900개 곡 분량의 멜로디를 학습시켜 문장 및 단락의 끝맺음이 멜로디에 맞도록 했다. 가사와 멜로디가 맞아떨어지는 데이터 작성에는 시간이 소요되는 한편 가사만의 데이터는 대량으로 얻을 수 있다는 것에서 전이학습의 이용이 가능해졌다.

다만 전이학습도 만능은 아니다. 유효한 것은 “(전용하기 전후의)문제들이 공통 부분이 있을 때에 한정된다.”(인공지능학회회장 야마다)고 말한다. 수집이 어려운 데이터의 확보와 적은 데이터로 성과를 내는 학습 방법의 확립 두 측면에서 연구를 추진해야 할 것 같다.

-- 끝 --

목록