일경컴퓨터_2023/07/20_확산 모델 -- Diffusion Model

책 커버 표지
목차

요약

Nikkei Computer_2023.7.20 키워드 (p93)

확산 모델
Diffusion Model

확산 모델은 생성 AI(인공지능) 기술의 일종으로, 대상의 이미지나 음성, 텍스트와 같은 콘텐츠를 단계적으로 열화(劣化)시킨 뒤 열화 과정을 거슬러 올라가도록 단계적으로 재구성해 나가는 과정을 학습시킨 생성 모델이다.

입력된 프롬프트(지시)에 근거해 화상을 생성하는 서비스의 기반 기술 중 하나이다. 이러한 서비스의 대표적인 예로는 미국의 오픈AI(OpenAI)가 제공하는 웹 서비스 ‘DALL·E2’와 영국 스태빌리티 AI(Stability AI)의 ‘Stable Diffusion Online’이 있다.

확산 모델의 첫 번째 모델은 2015년, 미국 스탠퍼드대학의 연구자가 제안했다. 그리고 2020년, 캘리포니아대학 버클리 연구자들이 다른 생성 모델에 필적하는 품질을 달성하면서 활용이 진행되었다.

기존에는 확산 모델과 동일하게 심층학습(딥러닝)을 응용한 적대적 생성네트워크(GAN)가 주류였다. 그러나 학습이 불안정하고, 지시와 다른 화상을 출력하는 등 품질 면에서 과제가 있었다. 한편, 확산 모델은 단계적으로 재구축하는 과정을 학습함으로써 품질이 안정적이라는 강점이 있다.

-- AI가 가공의 그라비아 아이돌 생성 --
확산 모델을 통해 생성된 콘텐츠의 이용은 다양한 분야에서 확산되고 있다. 예를 들면, 광고나 잡지 등에서의 가상 모델 기용이다. 화상 생성 AI를 이용해 마치 실재 인물을 촬영한 것처럼 리얼한 화상을 생성. 화상의 주제와 분위기, 인물까지도 자유롭게 설정해 광고 포스터나 배너 등에서 이용할 수 있다.

한편, 확산 모델에 의한 콘텐츠를 상용(商用) 베이스로 넓게 활용하려면 과제도 있다. 확산 모델을 포함한 생성 AI 개발에는 인터넷상의 콘텐츠를 대량으로 학습시킬 필요가 있으며, 크리에이터가 제작한 콘텐츠도 학습 데이터에 포함된다. 크리에이터의 입장에서는 (1)자신의 작품이 자신의 의사와는 상관 없이 생성 AI의 학습에 사용될 수 있고 (2)생성 AI의 활용이 추진되면 크리에이터의 지위가 위협받게 된다 등의 우려가 나오고 있다. 이 중 (1)에 대해서는 크리에이터가 자신의 작품이 생성 AI의 학습에 사용되지 않도록 지정할 수 있는 구조와 학습 데이터를 제공하는 크리에이터에게 대가를 환원하는 구조 등이 필요하게 될 가능성이 있다.

7월 시점에서는 이러한 과제가 아직 해결되지 않은 상태로, 일본에서의 상업적 이용은 한정적이다. ‘주간 플레이보이’는 지난 5월, AI가 생성한 가공의 그라비아 아이돌 ‘사쓰키 아이 그라비아’를 지면에 게재. 이후 화보집도 발매했지만, 발매 다음 주에 판매를 중지했다.

그 이유에 대해 주간 플레이보이 편집부는 “그라비아에 있어서의 생성 AI의 가능성을 찾기 위해 기획했지만, 편집부에서 생성 AI의 논점 및 문제점에 대한 검토가 충분하지 않았고, 논란의 심각성을 감안해 판매는 신중하게 생각했어야 했다고 판단했다”라고 설명했다.

확산 모델의 향후 발전된 형태로는 정밀도 향상에 수반된 동영상으로의 응용을 생각할 수 있다. “아직 기업의 CM 등에 그대로 사용할 수 있는 퀄리티에는 도달하지 못했지만, 향후 가능성은 충분히 있다”라고 히타치제작소(日立製作所) 첨단AI이노베이션센터 지능비전연구부의 사사키(佐木) 시니어 리서처는 전망한다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

TOP

목차

목차

뉴스& 리포트
1. 타깃이 되고 있는 파일 전송 툴, 사이버 공격으로 탈PPAP에 음영 드리워져
   IT가 위험하다
2. NTT데이터가 새로운 체제로 전환, 국내 영업이익률 12%를 목표로
3. 사법시험의 CBT화 이루어질 것인가? 국가시험 논문 문제에서 첫 시도
4. 생성 AI의 프라이버시 리스크, G7 데이터보호기관이 성명
5. 사내 컨설턴트 5,000명 이상 생성 AI 스킬 교육, 활용 배경은 딜로이트의 위기감
6 부정경쟁방지법이 디지털 공간에 대응, 가짜 메타버스 방지 대책은 추진될 것인가?
7. 간사이(関西) Kaggler 커뮤니티 성황, 목표는 상위 데이터 사이언티스트
8. '블랙잭'의 생성 AI 체험, 프롬프트를 어떻게 쓰느냐에 따라 줄거리 크게 달라져
9. 후지쓰 퇴직자용 SNS에서 파란 일어, 현역 경영 간부가 올린 글이 문제시

데이터는 말한다
생성 AI를 '업무에 활용 중'은 9.1%, 37.8%는 '활용 이미지를 떠올릴 수 없다'.

도전자
시타테루의 고노(河野) 대표이사
의류 공급망의 ‘혁신’ 추진, 클라우드로 비효율 없애

특집
1. 고민하는 클라우드 벤더 -- 판매 확대로 전략 전환, 파트너의 변화도 모색
2. 클라우드를 더 많이 판매하라, 파트너에게 클라우드 시프트를 압박
3. IT 벤더는 진짜 불필요한가? 진화하는 벤더상
4. 어쩔 것인가!? 후지쓰 --   연이은 트러블로 신용 실추, 과연 만회할 수 있을까?

포커스
법인 PC 선택은 제로 트러스트의 첫걸음

인터뷰
고바야시제약(小林製藥)의 고바야시(小林) 사장
연간 5만 건의 아이디어가 힘의 원천, 신속한 상품개발을 디지털로 강화

케이스 스터디
[피아(ぴあ)]
티켓 기간계 시스템을 풀 클라우드화, 연 7,500만장 처리하는 DB를 전환

작동하지 않는 컴퓨터

[니가타(新潟) 현]
현의 공문서 파일 약 10만 건이 소실, 모르는 사이에 추가된 신기능이 원인

키워드
확산모델(Diffusion Model)

연재
1. IT 보안 대책의 최전선 --   최신 프라이버시 관련 규제, 미국∙어린이∙AI가 포인트
2. 강점을 살린 DX(디지털 변혁) 사업기획을 만드는 법 --   비즈니스 플랜 작성이 핵심, 근거 있는 사업계획서 작성 방법
3. 실천 DX, 클라우드로 시작하는 데이터 매니지먼트 -- 데이터 통합 효과를 높이는 데이터 레이크의 특성과 활용법을 이해
4. 사장의 질문에 답하는 IT 전문가의 대화 기술 -- 생성 AI를 실용화하고 있는 대기업에서 사업의 변화를 발 빠르게 체험

오피니언
1. DX 인력의 사장은 인적 자본 손실을 여러 번 옮길 수 있는 환경이 필요하다
2. 모바일 일도양단(一刀兩斷) -- 싸지 않은 도코모 신 요금제의 절묘한 설계, 경쟁사에 위협을 가하지 않는 것이 상책?
3. GAFA의 심층 분석 -- 코드 생성 AI 2종 발표, 구글의 진짜 목표는 ‘IaC’
4. 프로그래밍으로 가자 -- ChatGPT에겐 불가능한 것, 인간 고유의 가치는 무엇인가?

 

ニュース&リポート

データは語る

挑戦者

特集

特集

フォーカス

インタビュー

ケーススタディー

動かないコンピュータ

キーワード

連載

オピニオン

TOP