일경네트워크_2023/07_네트워크 기술자가 알아야 할 챗GPT

책 커버 표지
목차

요약

Nikkei Network_23.7 특집 요약 (p20-35)

네트워크 기술자가 알아야 할 챗GPT
그 기세는 멈추지 않는다

2022년에 등장한 이래 화제가 끊이지 않는 미국 OpenAI의 '챗GPT'. 대규모언어모델(Large Language Model, LLM)에 기반한 생성 AI(인공지능)를 통해 대화 형식으로 다양한 문장을 생성할 수 있다.

2023년 2월 이후에는 각 기업이나 단체의 발표가 잇따르면서 기세는 가속화되고 있다. 현장에서 사용하기 시작할 날이 멀지 않아 보인다. 그 날을 대비해 네트워크 기술자로서 원리를 알고, 할 수 있는 것과 할 수 없는 것을 알아 두고 싶다.

Part 1. 동향
‘하룻밤 사이에 세계가 변했다’, 생성 AI를 둘러싼 기술 경쟁 발발


미국 OpenAI가 2022년 11월 30일에 공개한 대화형 생성 AI ‘챗GPT’. 스위스 투자은행 UBS의 조사에 따르면, 23년 1월 31일 시점에서 등록 유저 수는 1억 2,300만 명에 달했다. 지금까지의 SNS에서는 볼 수 없었던 경이로운 속도다.

이러한 전대미문 인기의 이유는 챗GPT에게 질문하면 정확한 답변이 되돌아오는 새로운 체험에 있다. 지금까지 무엇인가 조사할 때는 구글 등의 웹 검색 서비스를 사용하는 것이 일반적이었다.

조사 대상과 관련된 키워드를 입력해 검색하고, 검색 결과로 도출된 웹사이트를 열람한다. 그리고 내용을 읽고 자신에게 필요한 정보인지 아닌지 취사선택할 필요가 있었다. 반면에 챗GPT를 사용하면 궁금한 것을 묻기만 하면 된다.

-- 활발한 마이크로소프트와 구글 --
챗GPT를 공개한 이래, 대화형 AI를 포함한 생성 AI와 그것을 지원하는 LLM을 둘러싸고 숨가쁘게 업계가 움직이고 있다. 특히 2023년 3월 중순에는 미국 구글의 대화형 AI ‘Bard’의 공개, OpenAI의 LLM ‘GPT-4’의 발표 등이 이어지면서 “하루아침에 세계가 바뀌었다”라는 평가를 들었다.

그 중에서도 활발한 2사가 구글과 OpenAI와 협력하고 있는 마이크로소프트다. 여기에 Meta가 개발해 OSS(오픈 소스 소프트웨어)로 공개한 LLM ‘LLaMA’를 기반으로 한 여러 연구개발이 얽혀 있다.

일련의 움직임은 복잡하지만 채팅 서비스와 LLM의 관계를 파악해 두면 이해하기 쉬워진다. 예를 들면 23년 5월에는 마이크로소프트의 검색 서비스 ‘Bing’에서, LLM에 근거한 채팅 기능을 모든 유저가 이용할 수 있게 되었다. 이 기능을 발표한 2023년 2월 시점에서는 “챗GPT보다 강력한 OpenAI의 차세대 LLM을 사용한다”라고 했는데, 후에 GPT-4 기반인 것으로 밝혀졌다.

또한 챗GPT의 유상 계정인 '챗GPT Plus'에서는 사용할 LLM으로 GPT-3.5와 GPT-4를 선택할 수 있다. 구글의 Bard는 공개 초기에는, 구글이 2021년에 발표한 LLM인 ‘LaMDA’를 채택했었지만 ‘PaLM2’로 대체했다. 이에 따라 일본어를 비롯한 영어 이외의 언어로도 이용할 수 있게 되었다.

-- LLM은 규모에서 질로 변화 --
이와 같이 생성 AI의 성능을 결정하는 것은 LLM이다. LLM으로 불리게 된 것은 2018년에 구글의 자연언어 처리를 위한 모델 'BERT'가 등장하고 나서부터다. 이듬해 OpenAI가 발표한 LLM 'GPT-2'는 다양한 태스크를 수행할 수 있음을 보여줬다.

아울러 LLM에는 스케일링 법칙을 적용할 수 있다며, 2020년에 OpenAI는 GPT-2를 대규모화한 GPT-3를 발표했다. 스케일링 법칙이란 AI 모델의 성능은 파라미터 수와 데이터 세트의 양, 트레이닝에 곱하기 계산량의 누승법에 비례한다는 생각이다. 즉 모델의 규모를 키우고 많은 학습 데이터를 사용해 트레이닝에 시간을 들이면 더 나은 모델이 생긴다. 이로 인해LLM의 대규모화 경쟁이 시작되었다.

전환점의 하나가 된 것은 OpenAI가 새 기법 'InstructGPT'를 22년에 발표/구현한 일일 것이다. 단순히 규모를 쫓는 것이 아니라 인간의 지식을 모델에게 피드백하는 '파인 튜닝'을 실시함으로써 성능이 더 향상되는 것을 보여줬다. InstructGPT와 같은 기법으로 대화형 지식을 피드백한 것이 챗GPT에는 포함되어 있다.

23년에 OpenAI가 발표한 GPT-4는 규모 등이 공개되지 않았다. OpenAI의 샘 알트먼 CEO는 “정밀도를 높이는데 모델의 규모가 중요시되는 단계는 지났다”라고 말했다. 앞으로는 스케일링 법칙에 좌우되지 않는 LLM 개발이 중요해질 것으로 보인다.

실제로 GPT-3보다 상당히 작은 규모지만 벤치마크 테스트에서는 동등한 점수를 내는 오픈소스 LLM이 여럿 등장했다. 소규모 LLM을 개별 태스크에 맞춰 커스터마이즈하는 용도가 향후 확대될 가능성도 있다.

-- 최신 정보를 반영할 수 있도록 진화 --
대화에 사용할 수 있어 편리한 챗GPT지만 GPT-4 등 LLM에 축적된 지식은 당연히 학습을 마친 시점부터 업데이트되지 않는다. 최신 정보를 물어도 “제 지식은 2021년 9월까지의 정보이기 때문에 최신 정보에 대해서는 파악하지 못했습니다”라고 답변한다.

이 한계를 넘어서기 위해 OpenAI는 외부 서비스를 담을 수 있는 ‘플러그인’이나 웹 브라우징 기능인 ‘Browse with Bing’을 추가했다. 이를 통해 최신 정보를 추론에 포함시켜 답변할 수 있게 되었다.

다만 여기서 얻은 정보는 플러그인이나 웹 검색한 결과를 담은 것에 한한다. 잘못된 검색 결과를 이용해 추론하고 있을 가능성이 있으므로 주의해야 한다.

-- 프롬프트와 환각에 주의 --
LLM은 주어진 문자열(프롬프트)에 대해 추론하고, 적절한 말을 출력해 나열한다. 이 때문에 특기 태스크는 어떠한 언어에 근거한 문장을 뽑아내는 것이다.

즉, 이쪽에서 필요한 정보를 주고, 거기에 근거해 어떠한 처리를 하게 하는 사용법을 추천한다. 다만 프롬프트에 민감한 정보를 입력하는 것은 피한다. 장차 다른 LLM의 학습에 사용될 우려가 있기 때문이다.

그리고 과거의 문장을 학습했다고 해서 과거에 일어난 일을 조사하는 용도로는 적합하지 않으므로 주의해야 한다. LLM에 기반한 생성 AI는 잘못된 내용의 문장을 그럴듯하게 생성하는 일이 있기 때문이다. 이를 '헐루시네이션(환각)'이라고 부른다. 과거 사례나 경위를 조사하거나 이용자가 검증할 수 없는 것을 생성시키는 것은 위험성이 높다.

Part 2. 활용 방법
5개의 경우에서 현장 지원, 주의사항을 숙지하고 도전


챗GPT를 비롯한 생성 AI의 현장 활용은 이제 막 시작한 단계다. 앞으로 네트워크 기술자들은 어떻게 활용해야 할까? Part1에서 본 대로 LLM에 기반한 생성 AI의 특기는 문장을 뽑아내는 것이다. 이 특징을 네트워크 관리나 보안 대응에서 활용할 수 있는 5가지 경우를 소개한다.

Part 3. 기술
LLM은 왜 환각을 보여주는가? 응답을 생성하는 구조를 파고들다


LLM은 잘못된 정보를 그럴듯하게 제시해 환각(헐루시네이션)을 보여주는 일이 있다. 이것이 LLM에 기반한 생성 AI는 '거짓말을 한다'고 말하는 이유이며, '검증이 필수다'고 말하는 이유이기도 하다. 왜 환각을 보여줄까? 그것은 LLM의 구조를 이해하면 잘 알 수 있다.

Part 4. 본격 이용을 위한 한 걸음
LLM의 응답 정확도를 높이다, 프롬프트는 구체적으로


생성 AI의 조류는 멈추지 않을 것이고, 머지않아 현장에서 사용할 수밖에 없게 될 것이다. 본격적인 이용을 위해서 필요한 스킬이나 노하우를 선점하자.

 -- 끝 --

Copyright © 2020 [Nikkei Network] / Nikkei Business Publications, Inc. All rights reserved.

TOP

목차

特集1

ニュースで理解

現場を知る

特集2

特別リポート

ネスペ試験で学ぶ ネットワーク技術のキホン

基礎から学ぶ

  •  
TOP