멀티모달의 대규모 언어 모델
GPT-4는 미국의 오픈AI가 올 3월에 발표한 텍스트와 이미지 입력에 대응하는 멀티모달(Multi Modal)의 대규모 언어 모델이다. 채팅 시스템 ‘챗GPT(Chat GPT)’의 유료 버전 등에서 사용할 수 있다.
GPT-4에서 처리할 수 있는 텍스트는 2만 5,000단어(3만 2,768토큰). 기존 GPT-3.5의 최대 4,097토큰보다 약 8배 길어 기존보다 유저의 의도를 반영한 출력이 가능해졌다.
오픈AI가 3월 15일에 공개한 'GPT-4 Technical Report'는 그 정밀도에 관한 여러 검증 결과를 보여주고 있다. 예를 들어 미국 사법시험 모의고사를 풀었을 때 GPT-3.5는 하위 10% 정도의 성적이었지만, GPT-4의 성적은 상위 10%로, 크게 출력의 정밀도가 높아졌다.
스페인어나 일본어 등에서도 GPT-4는 GPT-3.5나 구글의 거대 언어 모델 ‘PaLM’보다 높은 정확도를 나타냈다. 사람이 입력한 다양한 프롬프트(입력문)에 대해 올바른 내용을 제공한 비율을 측정한 결과, 영어로 GPT-3.5를 이용한 경우에는 70.1%, PaulM을 이용한 경우에는 69.3%인 반면, GPT-4에서는 85.5%였다.
영어를 포함한 25개 언어로 70% 이상의 정답률을 보였다.
|