해동일본기술정보센터 | 해동일본기술정보센터

비즈니스에도 생성 AI 확산 -- 창작 분야 및 제조업에서 활약

카테고리AI/ 로봇·드론/ VR
기사일자 2023.3.6
신문사 Nikkei X-TECH
게재면 online
작성자hjtic
날짜2023-03-13 21:09:01
조회수460

Nikkei X-TECH_2023.3.6

비즈니스에도 생성 AI 확산
창작 분야 및 제조업에서 활약

생성 인공지능(AI)의 활약이 다양한 비즈니스로 확산되고 있다. 생성 AI의 급속한 진화로 애니메이션, 게임, 음악 제작과 같은 창작 분야뿐만 아니라, 제조업의 로봇 제어 등에서도 이용이 검토되고 있다. 생성 AI는 인력 부족에 어려움을 겪는 현장의 구세주가 될 것이라는 기대감이 높아지고 있는 한편, 사람이 담당해야 할 업무에 대한 신중한 검토도 강하게 요구될 것으로 보인다.

생성 AI(Generative AI)란 텍스트나 화상(畵像), 음성, 프로그램 코드 등을 출력하는 것이다. 지금까지는 기술자나 개발자와 같은 전문가들 사이에서 주목 받아 왔지만, 최근 들어 챗봇(대화 AI) 'ChatGPT'와 화상 생성 AI인 'Stable Diffusion', 'Midjourney' 등이 화제가 되고 있다.

이러한 생성 AI는 2022년 등장한 것이지만, 그 이전부터 생성 AI의 성능은 비약적으로 계속 향상되어 왔다. 그리고 드디어 창작 분야에서도 화상 생성 AI의 상용화가 시작되고 있다.

-- 1장의 일러스트를 통해 다양한 표정 생성 --
가장 앞서고 있는 것은 일반 유저 전용 앱이다. DeNA 산하의 IRIAM(도쿄)은 캐릭터 전송 앱 'IRIAM'에 프리퍼드 네트웍스(Preferred Networks, PFN, 도쿄)의 생성 AI 기술을 이용하고 있다.

IRIAM에서는 1장의 캐릭터 일러스트를 바탕으로 해당 캐릭터의 표정을 자동으로 생성한다. 유저는 자신이 준비한 오리지널 캐릭터 일러스트가 있으면 쉽게 캐릭터 동영상 발신자가 될 수 있다.

PFN의 AI를 이용한 '자동 캐릭터 모델링 기술'로 다양한 캐릭터의 표정을 자동으로 생성할 수 있게 되는 것이다. 2021년 시점에서 생성 시간은 약 10초로 짧고, 파일 크기도 약 1M바이트로 작다. 기존의 수작업에 의한 모델링에서는 생성에 60분 이상이 소요되고 파일 크기도 100M바이트 이상으로 컸다.

애니메이션 분야에서도 생성 AI를 도입하려는 움직임이 나오고 있다. 미국의 넷플릭스가 도쿄에 개설한 애니메이션 제작 지원 시설 'Netflix 애니메이션 크리에이터즈 베이스'에서는 배경 미술 제작 공정에 생성 AI를 도입하는 시험적인 프로젝트를 추진. 생성 AI가 애니메이션 제작 시 작업 부하를 얼마나 줄일 수 있고 크리에이터가 창작에 할애할 수 있는 시간을 어느 정도 늘릴 수 있는지 등, 제작 현장 지원으로 이어질 수 있는지 여부를 검증하는 것이 목적이다.

생성 AI가 단숨에 주목받게 된 2022년 여름보다도 이른 같은 해 1월, 프로젝트는 시작되었다. 그 성과로 올 1월에 개봉한 것이 약 3분 분량의 오리지널 애니메이션 '개와 소년'이다.

배경화면을 모두 생성 AI로 작성한 것이 아니라 일부 공정을 AI가 맡았다. 구체적으로는, AI에 텍스트 등을 입력해서 출력된 이미지를 사람이 수정해 마무리했다. 작업 부하 경감 정도는 배경화면에 따라 편차가 있기 때문에 일률적으로는 말할 수 없지만, “부하를 40~50% 정도 낮출 수 있었다”(마키하라(牧原) 감독)라고 한다.

생성 AI의 도입으로 작업 부하를 줄이고 사람이 창작에 할해할 수 있는 시간을 늘리려는 움직임은 애니메이션 업계 전체에서 나오고 있다. 3D 애니메이션으로 유명한 미국의 픽사 애니메이션 스튜디오(Pixar Animation Studios)도 생성 AI를 실제 제작 현장에서 이용할 수 있는지를 검증하고 있다.

-- 제조업에서도 생성 AI 활약 --
생성 AI는 제조업으로도 확산되기 시작했다. 야스카와전기(安川電機)의 자회사인 에이아이큐브(도쿄)는 피킹이나 외관검사, 예지보전 등을 위한 AI 트레이닝에 필요한 화상이나 파형 데이터를 AI로 생성하는 서비스 'Alliom'을 제공하고 있다.

제조 현장에서는 결함이나 고장 등 이상이 발생하는 경우가 매우 적어 이상 데이터를 수집하기 어렵다. 그래서 적은 수의 실제 이상 데이터에서 심층학습 기술의 일종인 적대적 생성 네트워크(GAN)를 이용해 다양한 패턴의 모의 이상 데이터를 다수 생성, AI의 학습에 이용하고 있다.

로봇의 행동을 AI로 생성하려는 움직임도 나오고 있다. 오므론의 산하 연구개발업체인 오므론사이닉엑스(OSX)는 2021년, 교토대학, 도쿄공업대학, 나라(奈良)첨단과학기술대학원대학과 공동으로 자연어 지시를 통한 로봇 제어로 다양한 작업을 가능하게 하는 연구를 시작했다.

언어에 의한 지시와 환경 정보를 기반으로 현 상태에서 목표 상태까지의 변경점(의도)을 형성. 그 의도를 실현하기 위해 필요한 동작의 순서(행동)를 생성한다. 그리고 이 생성된 행동을 바탕으로 로봇을 제어한다.

OSX가 이러한 연구를 시작한 시점에서는 같은 테마를 연구하는 기업이나 연구기관은 거의 없었다. 하지만 2022년부터 대기업들이 잇따라 연구를 추진하면서 “빠르게 분위기가 고조되고 있다”(OSX의 하시모토(橋本) 시니어 리서처)라고 한다. 예를 들면, 구글의 연구 그룹은 2022년 8월, 사람의 불명확한 요구의 의미를 AI가 이해하고, 그것에 근거해 로봇의 행동 계획을 수립하는 AI 'PaLM-SayCan'을 발표했다.

이 AI가 생성한 행동 계획에 따라 로봇 제어기가 실제 로봇을 움직인다. 2022년 12월에 구글은 제어기를 개량한 성과를 공개했다. RT-1이라고 부르는 기술을 통해 작업 성공률이 향상되었다고 한다.

구글의 모회사인 미국 알파벳(Alphabet)의 산하인 영국의 딥마인드(DeepMind)가 2022년 5월에 발표한 각종 태스크에 대응하는 AI Gato도 텍스트뿐만 아니라 다양한 행동을 출력할 수 있다. 로봇 팔의 제어에도 대응한다.

이와 같은 로봇 제어 사례들은 아직 연구 단계에 불과하다. 하지만 연구하는 기업들이 증가함으로써 연구 활동이 활발해져 향후 몇 년 안에 실용화에 가까워질 가능성이 높아질 것으로 전망된다.

-- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

일본산업뉴스요약