일경건축_2023/06/22_생성 AI의 기본 -- 건축 실무자가 알아야 할 정보

책 커버 표지
목차

요약

Nikkei Architecture_2023.6.22 (p46-47)

생성 AI의 기본
건축 실무자가 알아야 할 정보

챗GPT가 22년 11월에 공개되면서 단번에 화제가 된 생성 AI(인공지능). 상당수의 기업과 지자체 등이 업무에 도입하는 것을 검토하고 있고, 설계사무소와 건설사도 예외는 아니다. 앞으로 건축 실무자가 업무에서 사용할 때 알아 두면 좋을 생성 AI의 기본 정보를 정리했다.

Q: 유창한 문장이나 정밀한 이미지를 생성하는 구조는?

A: 생성 AI는 인터넷에 있는 문장이나 이미지 등 대량의 데이터를 심층학습(딥러닝) 등의 기법을 사용해 학습시킨 모델로 구성된다.

예를 들면, 챗GPT와 같은 대규모 언어 모델(LLM)의 구조는 어떤 단어 뒤에 이어질 가능성이 가장 높다고 생각되는 단어를 예측해 차례차례 출력하는 것이다. 생성한 문장이 부자연스럽지 않는지 여부를 피드백해 정확도를 높이고 있다.

프롬프트(지시문)를 입력해 이미지를 생성하는 AI의 구조는 좀 더 복잡하다. 포인트는 이미지나 문장 등의 데이터 특징을 나타내는 '특징량'이다. 입력한 지시문을 특징량으로 변환하고, 이를 바탕으로 이미지의 특징량을 생성한다. 또한 생성한 이미지의 특징량을 이미지 데이터로 복원함으로써 문장에서 지시한 대로 이미지를 출력한다.

생성 AI는 학습 데이터의 경향을 바탕으로 답변을 출력하는 것에 불과하기 때문에 그것이 맞는지 여부 등은 판정할 수 없다. 학습에 사용한 데이터는 일정 정도 시간이 경과한 것일 가능성이 높고, 최신 정보가 반영되기 어려운 등의 문제도 안고 있다.

Q: 생성할 수 있는 데이터의 종류나 용도는?

A: 생성 AI는 다양한 종류의 데이터를 출력할 수 있도록 되어 있다. 대표적인 것은 글이다. 이용자가 지시한 대로 문장을 작성하거나 입력한 문장을 요약할 수 있다. 예를 들면, 이야기의 대략적인 설정을 제시하는 것만으로 소설의 줄거리나 문장도 쓸 수 있다.

사내 자료나 법령을 추가로 입력하면 사양서의 자동 작성도 가능하다. 이외에도 사용자의 지시대로 프로그램 코드를 쓸 수 있기 때문에 프로그래밍에 소요되는 노동력을 줄일 수 있을 것으로 기대된다.

또 다른 대표격으로 이미지를 들 수 있다. 작성하고 싶은 이미지의 느낌을 나타내는 키워드나, ‘사진 스타일’ ‘애니메이션 스타일’ 등 스타일을 설정하면 그에 근거한 이미지를 생성한다. 예를 들면, 게임 제작 현장에서 배경으로 그리는 인물이나 건물을 단시간에 제작할 수 있다. 건축 투시도의 첨경(添景) 등에도 응용 가능하다.

음성도 출력 가능하다. 특정 인물의 음성 데이터를 학습시키면, 그 인물의 목소리로 출력할 수 있다. 장르와 템포 등을 지정해 자동으로 악곡을 생성하는 서비스도 있다. 심지어 이미지나 음성 등의 생성물을 조합해 동영상을 만드는 생성 AI도 등장했다.

Q: 누가 어떤 서비스를 제공하고 있나?

A: 주요 서비스에는 '대화형 AI'와 '이미지 생성 AI'의 두 종류가 있다. 대화형 AI의 대표적인 예가 미국 OpenAI가 22년 11월에 공개한 챗GPT다. 무료이고 성능도 뛰어나 사용자 수는 공개 2개월 만에 1억 명을 넘어섰다. 월 20달러로 최신 모델 ‘GPT-4’를 이용할 수 있는 유료 플랜도 있다. 음성 입력도 가능한 스마트폰 앱도 제공하고 있다.

<그림> 주요 생성 AI 서비스 일람

개발처

서비스 이름

대화형 AI

이미지 생성 AI

OpenAI (미국)

챗GPT

DALL-E

마이크로소프트 (미국)

Bing

 

구글 (미국)

Bard

 

Stability AI (영국)

 

Stable Diffusion

Midjourney (미국)

 

Midjourney


이 분야에서는 치열한 패권 다툼이 시작되었다. 미국 마이크로소프트는 23년 2월, 검색 엔진 ‘Bing’에 OpenAI 기술을 도입해, 인터넷 검색 결과에 근거해 질문에 대답하는 기능을 만들었다. 미국 구글도 23년 5월에 자체 대화형 AI ‘Bard’의 일본어판을 발표했다. 대답 결과를 Gmail 등으로 출력할 수 있다.

이미지 생성 AI에는 주로 3가지 서비스가 존재한다. 채팅 앱인 Discord에서 이용할 수 있는 것이 ‘Midjourney’이다. 생성할 수 있는 이미지의 상한수 등에 따라서 10~60달러의 플랜이 있다. 영국 Stability AI의 ‘Stable Diffusion’은 소스 코드를 공개하고 있으며, 브라우저 외에 자신의 PC에 설치해 무료로 이용할 수 있다. 챗GPT의 개발처이기도 한 OpenAI도 ‘DALL-E’라는 이미지 생성 AI를 개발하고 있다.

Q: 건설업계에서의 인지도나 활용 사례는?

A: 건설업계에서는 생성 AI를 잘 활용하지 않고 있다. PwC 컨설팅(도쿄)이 생성 AI의 인지도에 대해 업종별로 조사한 결과, 통신업에서의 인지도가 71%였던 반면에 건설업은 최하위인 32%였다.

건설 현장의 생성 AI에 대한 관심도 희박하다. 자사 활용이나 타사 사례에 대한 관심을 물었더니, 건축/토목 계열 기술직은 유일하게 무관심층(25%)이 관심층(20%)을 웃돌았다.

하지만 대화형 AI에게 사양서나 계약서 문장을 쓰게 하거나 이미지 생성 AI를 사용해 건축물 이미지를 간단하게 작성하는 등 노동력 부족과 장시간 노동으로 고민하는 건설업계에서도 활용의 장점이 크다. 스타트업 기업이 건설 관련 분야에 특화된 생성 AI 서비스를 개발하고 있어, 조금씩 활용 사례가 나올 것으로 보인다.

 -- 끝 --

Copyright © 2020 [Nikkei Architecture] / Nikkei Business Publications, Inc. All rights reserved.

TOP

목차

TOP