일경컴퓨터_2023/0525_GPT-4 -- 멀티모달의 대규모 언어 모델

책 커버 표지
목차

요약

Nikkei Computer_2023.5.25 키워드 (p68)

GPT-4
멀티모달의 대규모 언어 모델

GPT-4는 미국의 오픈AI가 올 3월에 발표한 텍스트와 이미지 입력에 대응하는 멀티모달(Multi Modal)의 대규모 언어 모델이다. 채팅 시스템 ‘챗GPT(Chat GPT)’의 유료 버전 등에서 사용할 수 있다.

GPT-4에서 처리할 수 있는 텍스트는 2만 5,000단어(3만 2,768토큰). 기존 GPT-3.5의 최대 4,097토큰보다 약 8배 길어 기존보다 유저의 의도를 반영한 출력이 가능해졌다.

오픈AI가 3월 15일에 공개한 'GPT-4 Technical Report'는 그 정밀도에 관한 여러 검증 결과를 보여주고 있다. 예를 들어 미국 사법시험 모의고사를 풀었을 때 GPT-3.5는 하위 10% 정도의 성적이었지만, GPT-4의 성적은 상위 10%로, 크게 출력의 정밀도가 높아졌다.

스페인어나 일본어 등에서도 GPT-4는 GPT-3.5나 구글의 거대 언어 모델 ‘PaLM’보다 높은 정확도를 나타냈다. 사람이 입력한 다양한 프롬프트(입력문)에 대해 올바른 내용을 제공한 비율을 측정한 결과, 영어로 GPT-3.5를 이용한 경우에는 70.1%, PaulM을 이용한 경우에는 69.3%인 반면, GPT-4에서는 85.5%였다.

영어를 포함한 25개 언어로 70% 이상의 정답률을 보였다. 하지만 출력한 정보가 부정확한 경우도 있었다. 유저가 직접 확인하거나 피드백하는 것이 앞으로도 필요할 것이다.

GPT-4는 메일이나 자료 등 문서 자동 생성, 데이터 분석, 코드 제안 및 생성 등에 활용할 수 있다. 최근 들어 GPT-4를 이용한 서비스 공개도 잇따르고 있다. 예를 들면, 마이크로소프트는 ‘Microsoft 365 Copilot’과 ‘GitHub Copilot X’, ‘Microsoft Security Copilot’ 등에 GPT-4를 구현했다. 마이크로소프트는 올 1월, 오픈AI에 수 십 억 달러의 추가 투자를 발표, GPT-4의 활용을 가속화할 방침이다.

이 밖에도, 일반용 서비스나 사내 업무 시스템에서의 GPT-4 활용이 확대될 전망이다. 언어학습 서비스 업체인 미국의 듀오링고는 어학학습 앱 기능으로 GPT-4를 구현. 미국의 금융 대기업 모건스탠리는 자사의 자산 관리에 대한 노하우 및 정보를 정리해 사내에서 검색해 활용할 수 있는 방안을 모색하고 있다. 결제 서비스 업체인 미국의 스트라이프는 개발자용으로 API(애플리케이션 프로그래밍 인터페이스) 이용 방법 등을 안내하는 서비스를 개발했다.

-- AI에 대한 우려도 높아져, 안전성 확보가 필수 --
GPT-4를 활용한 서비스 등이 속속 등장하고 있는 가운데, 고도의 인공지능(AI) 개발에 대해 우려를 나타내는 목소리도 있다.

미국의 비영리단체 퓨처오브 라이프 인스티튜트는 3월 22일, ‘GPT-4보다 강력한 AI 시스템 트레이닝을 최소 6개월 즉시 중단할 것을 모든 AI 연구기관에 요구한다’라는 취지의 서명 운동을 시작. 이 6개월 간의 개발 일시 정지 기간에 AI의 연구개발 시의 투명성 확보와 규제당국의 거버넌스 구조 구축 등에 힘쓰도록 요구하고 있다.

이에 대해 오픈AI는 4월 5일, 챗GPT와 GPT-4의 안전성에 관한 시책을 공표했다. 부적절한 응답 가능성을 기존보다 82% 낮추고, 트레이닝 데이터에서의 개인정보 삭제 및 오정보 출력 저감에도 주력하고 있다고 밝히며, 개발은 계속하면서 전문가 및 유저의 목소리를 반영해나갈 것이라는 입장을 제시했다.

 -- 끝 --

Copyright © 2020 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

TOP

목차

TOP