- 시민이 육성하는 AI의 확대 -- 커뮤니티와 AI가 함께 진화
-
- CategoryAI/ 로봇·드론/ VR
- 기사일자 2018.4.30
- 신문사 일간공업신문
- 게재면 15면
- Writerhjtic
- Date2018-05-07 22:19:09
- Pageview556
시민이 육성하는 AI
커뮤니티와 AI가 함께 진화
시민이 육성하는 AI가 점차 확대되고 있다. 스포츠나 자연관찰 등 커뮤니티에서 데이터를 수집, 그 데이터를 AI에 학습시켜 정밀도를 높인다. 그렇게 만들어진 고정밀 AI서비스를 시민이 향유하는 시민참여형 AI육성모델이 성공을 거두고 있다. 성공의 배경으로 인터넷에서 일을 수주∙발주하는 클라우드 소싱 기술이나 서비스 인프라가 정비되어 있어 시민참여의 장벽이 낮아진 점을 들 수 있다. 커뮤니티와 AI가 모두 진화하는 사회가 실현되고 있다.
AI는 데이터를 자양분으로 성장한다. 데이터가 수집되면 AI가 똑똑해지고, 서비스가 향상되면 보다 많은 데이터를 수집할 수 있게 된다. 때문에 미국의 IT업계에서는 데이터를 독점하기 위한 경쟁이 일어났다. 민간기업이 데이터를 수집, AI로 서비스를 향상시켜 유저를 확보한다. 유저는 서비스를 향수하면서 데이터는 빼앗기고 있다.
그래서 시민에게 데이터의 주도권을 되돌려주는 시도가 모색되고 있다. 단순히 시민이 데이터의 소유권을 주장하는 것만이 아니라 데이터 수집과 서비스 향상의 선순환을 시민이 납득하는 형태로 돌릴 필요가 있다.
-- 전국에서 모인 벌 사진, 대학이 분포조사 --
가장 먼저 움직인 것은 과학커뮤니티다. 자연과학을 좋아하는 시민과 대학 연구자가 협력하여 데이터를 수집, 연구를 추진하고 있다.
도호쿠대학의 오노(大野) 연구원과 야마가타대학의 요코야마(横山) 교수는 시민들에게서 호박벌의 사진을 수집하여 생태분포를 조사하고 있다. 시민이 스마트폰이나 디지털카메라로 촬영한 호박벌 사진의 촬영 지점과 호박벌의 수를 통해 분포 확률을 조사하였다.
오노 연구원은 “시민의 참여로 인해 일본 전체에 대한 분포조사를 할 수 있었다”라며 기뻐한다. 시민에게서 수집한 이미지 데이터는 야마가타대학의 연구원이 벌의 종류를 분류하여 정리하고 있다. 이 데이터는 커뮤니티의 재산이다. 이미지 식별 AI가 이를 학습하여 호박벌의 종을 식별하는 시스템을 개발 중이다.
오노 연구원은 “농림업 분야에서는 해충의 이미지 수집과 AI를 이용하여 종(種)의 분류학상의 소속을 결정하는 연구가 확산되고 있다”라고 설명한다. 벌 이미지에 스마트폰을 갖다 대기만 하면 재미있는 해설이 흘러나오는 ‘곤충도감’이 실현될지도 모른다.
시민이 수집하는 주변의 곤충 데이터와 농림업 전문가가 수집하는 익충과 해충의 데이터가 통합되어 커뮤니티로 환원되는 것이 바람직하다.
-- 클라우드 소싱, ‘엑셀 감각’으로 --
이러한 연계의 배경에는 AI기술의 진화가 있다. 통계수리연구소의 히구치(樋口) 소장은 “이미지나 텍스트, 음성데이터의 학습은 전망이 서 있고, 동영상에 대한 대응은 진행 중이다. 인간의 커뮤니케이션의 대부분을 취급할 수 있게 된다”라고 설명한다.
이미지의 경우는 고문서의 흘림체 문자 데이터를 수집하여 문자를 인식하는 AI를 개발하고 있다. 스포츠 동영상은 자세나 플레이 데이터를 수집하여 이를 분류하면 시민을 위한 자세판정 어플이나 전술지도 어플을 개발할 수 있을 것으로 기대된다.
이러한 연계를 위해서는 데이터 수집의 인프라를 누구나 싸게 사용할 필요가 있었다. 쓰쿠바대학의 모리시마(森嶋) 교수와 마쓰하라(松原) 교수 연구팀은 표계산 소프트 ‘엑셀’을 다루는 감각으로 데이터 수집과 데이터 정리를 관리할 수 있는 시스템 ‘클라우드 시트’를 개발하였다. 웹에서 데이터를 수집하여 일반 시민이 분류한다. 어려운 판단은 전문가의 의견을 참조하는 등 다단계의 데이터 수집 및 정리 작업을 운용할 수 있다. 시민에게 작업을 할당하는 방법을 통해 많은 사람이 일제히 대응하는 클라우드 소싱이 엑셀 감각으로 가능하게 된다.
마쓰하라 교수는 “클라우드 소싱의 최대 난관은 작업 설계다. 클라우드 시트에서는 프로그램인 If then조건 분기를 쓸 수 있으면 누구나 시작할 수 있다”라고 말한다. 프로그램 교육이 이루어지면 중학생도 데이터를 수집할 수 있게 될지도 모른다.
이화학연구소 혁신지능통합연구센터의 스기야마(杉山) 센터장은 “중고생의 동아리에 프로그래밍부나 컴퓨터부가 있는 것처럼 AI부가 만들어질 것이다”라고 기대한다. 정리된 데이터만 있다면 이미지인식 AI는 오픈 소스로 쉽게 만들 수 있다.
-- 가설을 고안∙검증, 조각 지식을 체계화 --
또한 AI의 활용이 익숙하지 않은 분야에 커뮤니티의 힘을 활용하는 연구도 있다. 모리시마 교수는 클라우드 소싱으로 가설을 세워 검증하는 시스템을 개발하였다. 현재의 AI는 인과 추론에 약하다. 데이터를 통해 상관관계를 판정할 수는 있어도 인과관계를 판정하는 것은 어렵다.
그래서 인터넷을 매개로 일반 시민들로부터 가설을 모집하고 가설의 검증도 시민에게 부탁하기로 하였다. 예를 들면 “잘 자려면 어떻게 하면 좋을까요?”라고 시민에게 질문하고 “뜨거운 우유를 자기 전에 마신다” 등의 가설을 많이 모집한다. 그리고 실제로 뜨거운 우유를 마시고 자게 한 후에 효과를 묻는다. 4개의 가설을 각각 100명이 시험하여 수면 임상연구와 동일한 결과를 얻을 수 있었다. 수면 연구에서 유효한 것은 클라우드 소싱에서도 통계적으로 유효했다.
모리시마 교수는 “클라우드 소싱은 수백 명 규모의 실험을 수만 엔에 실시할 수 있다. 임상연구와 비교하여 싸다”라고 말한다. AI기술로 인과관계를 특정하지 못하고 조각조각 분리되어 있는 지식체계도 클라우드 소싱으로 보완하면 지식 전체를 활용할 수 있을지도 모른다.
예를 들면 상점가의 쓰레기 배출 규칙이 잘 지켜지지 않아 쥐가 늘어난다. 이로 인해 고양이가 증가하고, 또 이로 인해 고양이와 자동차의 충돌사고가 증가한다. 이런 식으로 연쇄하는 정보를 단계마다 시민에게 물어서 확인할 수 있을지도 모른다.
시민이 AI의 학습데이터를 수집하거나 AI의 활용이 부진한 분야를 보완하여 육성하는 방법을 통해 커뮤니티를 성장시키는 사회가 점차 실현되고 있다.
-- 끝 --