일본산업뉴스요약

챗GPT, Whisper, Otter, DeepL의 대단한 ‘영어 실력’ -- 해외 취재에서 그 절대적 효과 실감
  • 카테고리AI/ 로봇·드론/ VR
  • 기사일자 2023.3.24
  • 신문사 Nikkei X-TECH
  • 게재면 online
  • 작성자hjtic
  • 날짜2023-04-03 19:59:24
  • 조회수254

Nikkei X-TECH_2023.3.24

챗GPT, Whisper, Otter, DeepL의 대단한 ‘영어 실력’
해외 취재에서 그 절대적 효과 실감

미국 오픈AI(OpenAI)의 '챗GPT(ChatGPT)'를 비롯한 고도의 언어 AI(인공지능)가 국내외에서 큰 화제를 일으키고 있다. 영어와 일본어, 중국어 등 다국어를 구사하고, 사람이 한 말을 알아들을 수 있으며, 숙련된 문장을 쓰거나, 번역할 수 있다. 요즘은 매일같이 TV나 인터넷에서 이러한 언어 AI에 대한 뉴스를 볼 수 있다. 다양한 언어 AI를 사용해보면서 자신만의 활용법을 찾는 독자들도 적지 않을 것이다.

필자도 최근 취재 활동에서 챗GPT 등 언어 AI가 얼마나 도움이 되는지를 검증할 기회가 있었다. 그것은 필자가 처음으로 취재를 위해 참가한 모바일 최대 전시회 'MWC Barcelona 2023'(스페인 바르셀로나, 2월 27일부터 3월 2일까지). 세계 202개 국가 및 지역에서 8만 8,500명 이상이 참가한 이번 전시회에는 기본적으로 영어가 사용되었다. 컨퍼런스, 미디어를 위한 전시 부스 투어, 일대일 인터뷰 모두 영어로 진행되었다.

하지만 필자는 영어를 잘하지 못한다. 특히 영어로 문장을 작성하거나 말하는 것이 서툴러 이러한 환경은 필자가 취재하는 데 큰 장벽이었다. 그래서 챗GPT와 같은 언어 AI가 도움이 되지 않을까 생각했다.

구체적으로는 챗GPT뿐만 아니라, 같은 오픈AI의 고정밀 음성인식 AI 'Whisper, 미국 Otter.ai의 실시간 전사(음성을 문자로 변환)에 강한 음성인식 서비스 'Otter', 높은 정확도로 일본에서도 인기가 높은 독일 DeepL의 기계번역 서비스 'DeepL' 등, 모두 4개의 AI를 사용했다. 챗GPT와 Otter, DeepL에는 무료 버전과 유료 버전이 있는데 이번에 필자는 모두 유료 버전을 이용했다.

-- 챗GPT가 영문 메일 작성을 대행 --
결과부터 말하면 필자는 크게 세 장면에서 AI의 절대적인 효과를 실감했다. 첫 번째는 스페인으로 출발하기 전인 2월 초, MWC 취재허가증을 온라인으로 신청한 다음이다. MWC 운영사무국 홍보담당자로부터 절차 중인 취재허가증이 등록시스템의 오류로 발급받을 수 없게 되어 다른 유형의 취재허가증으로 전환해야 한다는 연락을 받았고, 이와 관련해 영문 메일을 여러 차례 주고받게 되었다.

필자는 처음에 직접 영문을 작성하거나 DeepL 등 번역 서비스를 이용하면서 사무국 측과 연락을 주고받았다. 하지만 평소에 영문을 쓸 기회가 적었기에 다소 힘들었다. 그래서 중간부터는 챗GPT가 메일 작성을 대행하도록 했다.

예를 들어, 챗GPT에게 일본어로 '당신은 영어를 잘하는 비즈니스맨입니다'라는 역할을 부여하고, '이하의 문장을 일본어에서 영어로 번역하고, 그 다음 비즈니스 메일에 어울리는 말을 보충해 주세요' 등을 명령. 이어서 '저는 내일 오후 3시에 행사장에 도착할 예정입니다' 등의 용건을 기술했다. 그러자 챗GPT는 아래와 같은 예문을 출력했다.

Dear [Name]

I want to inform you that I will be arriving at the venue tomorrow at 3 p.m. I hope this time is suitable for our scheduled meeting.

Please let me know if there are any changes or updates to the meeting agenda, and if there is anything you need from me in advance.

Thank you and I look forward to seeing you tomorrow.

Best regards,

[Your name]

이렇게 해서 메일의 바탕이 되는 문장을 챗GPT로 준비하고, 마음에 안드는 표현은 가필이나 수정을 해서 바로 상대방에게 송신했다. 영문 메일을 직접 작성하는 것에 비해 작업 시간이 크게 짧아져 원활한 메일 주고받기가 가능해졌다.

-- 영어 인터뷰에서는 Otter와 DeepL를 병용 --
두 번째 장면은 현지에서의 일대일 영어 인터뷰이다. 필자는 지금까지 여러 차례 해외 전시회에 참가해 사전에 영어로 된 질문을 꼼꼼하게 준비한 뒤 취재에 임해왔다. 하지만 취재 현장에서는 상대가 이야기한 내용을 알아듣지 못하는 경우가 있어, 내용을 깊이 있게 파고드는 것이 어렵다고 통감하고 있었다.

그래서 이번 영어 인터뷰는 듣기를 보완하기 위해 전사 서비스 앱인 Otter를 사용했다. 이 앱은 영어 강연이나 강의 등의 음성 데이터를 기록하면서 실시간 영문을 생성하는 기능을 가지고 있다. 여러 사람이 말하고 있어도 발화자를 식별한 뒤 기록할 수 있다는 것도 특징이다.

Otter에는 스마트폰용 앱과 PC에서 사용할 수 있는 웹 버전이 있다. 일대일 취재 중에 줄곧 스마트폰 화면만을 바라보고 있을 수는 없기 때문에 Otter 웹 버전을 노트북 디스플레이에서 동작시켜 전사 결과를 볼 수 있도록 했다.

또한, 인터뷰 중 일본어로 질문을 생각해 빠르게 영어로 번역하기 위해서 필요에 따라 번역 도구도 사용했다. 이 용도에 챗GPT를 사용하는 것도 고려했지만, 필자는 번역 결과를 보다 빠르게 표시할 수 있는 DeepL을 선택했다.

이렇게 Otter와 DeepL을 사용해 여러 차례 대면 영어 인터뷰를 했다. 이 두 개의 툴 모두 클라우드 서비스이기 때문에 응답 속도는 조금 불안했지만, 이 점은 상대방이 천천히 이야기하도록 함으로써 커버할 수 있었다. 적어도 혼자의 힘으로 하는 인터뷰보다 대화의 흐름을 잡기 쉬웠고, 대화가 원활하게 진행된다고 느꼈다.

-- 녹음 데이터의 전사는 Whisper를 활용 --
언어 AI가 도움이 된 세 번째 장면은 컨퍼런스나 인터뷰 등 녹음된 데이터의 전사이다. 앞서 언급한 Otter를 사용해도 상당히 정확한 결과를 얻을 수 있지만, 이번에는 오픈AI의 음성인식 AI인 Whisper를 중심으로 사용했다. 이전 Whisper를 이용한 일본어 전사를 시험한 적이 있었는데 그 정확도가 놀라웠기 때문이다.

Whipser를 이용하는 데 필요한 프로그램 실행 환경으로는 브라우저상에서 프로그래밍 언어 ‘Python’의 코드를 기술 및 실행할 수 있는 구글의 웹 서비스 ‘Google Colaboratory’를 이용했다. 오픈AI는 Whisper에 복수의 학습된 모델들을 마련, 필자는 가장 정밀도 높은 'large'를 사용했다.

참고로 동일한 녹음 데이터를 사용해 Otter와 Whisper로 전사를 시도해보니 조금 다른 결과가 나왔다. 예를 들어, CPU라는 말은 두 개 다 올바르게 인식했다. 한편, 미국 인텔이 2021년에 발표한 ‘IPU(Infrastructure Processing Unit)’와 같은 비교적 새로운 단어에 대해서는 Whisper에서 보다 정확한 결과를 얻을 수 있었다.

Whisper는 준비 및 데이터 처리에 약간의 시간이 걸리지만 고정밀이며, Otter는 준비가 쉽고 실시간 전사가 가능하다. 이용 장면에 따라 구분해서 사용하는 것이 좋을 것 같다.

이렇게 다양한 AI들을 활용하면서 치른 이번 MWC 취재. 이번 취재가 성공할 수 있었던 배경에는 현지 통신 환경이 양호했던 점도 있다. 모바일 전시회인 만큼 행사장 내 곳곳 무선랜을 사용할 수 있었고 4G(4세대 이동통신 시스템) 전파도 대체로 원활했다.

물론 유창한 외국어를 구사해 의사소통을 하는 것보다 더 좋은 일은 없겠지만, 그러지 못하더라도 대화를 포기할 필요는 없다는 것을 깨달은 것이 이번 취재를 통해 느낀 가장 큰 발견이었다.

-- 끝 --

Copyright © 2020 [Nikkei XTECH] / Nikkei Business Publications, Inc. All rights reserved.

목록