니케이 컴퓨터 2024/07/11(2) 애플과 마이크로소프트가 주력하고 있는 온디바이스 생성 AI의 가성비는?

책 커버 표지
목차

IT가 위험하다
'기술 지원 사기' 급속도로 악질화, 한 번에 100만 엔의 피해도
특집
시간 대비 효과를 높이는 '초압축' 업무 기술
‘태만한 재택 근무는 이제 그만’, 5가지 포인트로 탈피
주 3일 부업도 가능한 여유로움, 반복 작업을 0로

요약

Nikkei Electronics_2024.7.11 (p96)

애플과 마이크로소프트가 주력하고 있는 온디바이스 생성 AI의 가성비는?

30억 파라미터 규모의 SLM 탑재

애플과 마이크로소프트가 PC나 스마트폰 등의 디바이스 상(온디바이스)에서 가동하는 생성 AI(인공지능)에 주력하고 있다. 양사 모두 30억 파라미터 규모의 소규모언어모델(SLM)을 디바이스에 탑재할 방침이다. 과연 유저는 대규모언어모델(LLM)보다 성능이 떨어지는 SLM을 사용하기 위해 AI칩이 탑재된 최신 디바이스로 교체할 것인가? ‘가성비’가 과제가 될 것으로 보인다.

애플은 6월 10일(미국 시간)에 개최된 개발자 회의 WWDC 2024의 기조 강연에서 온디바이스 생성 AI ‘Apple Intelligence’를 발표했다. 문장 요약이나 문장 성형, 화상 생성 등과 같은 생성 AI 기능이 iPhone과 iPad, Mac 등의 디바이스 상에서 가동된다. 이러한 생성 AI 기능은 메일이나 문서 작성 등, 다양한 애플리케이션 상에서도 이용이 가능하다.

Apple Intelligence는 온디바이스로 가동되는 기반 모델과, 애플의 반도체인 Apple Silicon이 탑재된 클라우드 서버 Private Cloud Compute로 가동되는 기반 모델의 하이브리드이다. 애플은 6월 10일에 공개한 공식 블로그의 엔트리 ‘Introducing Apple's On-Device and Server Foundation Models’에서 온디바이스 버전 기반 모델이 30억 파라미터라고 밝혔다.

마이크로소프트도 30억 파라미터 규모의 SLM을 탑재한다는 방침을 발표했다. 마이크로소프트는 5월 20일, 온디바이스로 생성 AI를 이용할 수 있는 Windows PC ‘Copilot+PC’를 발표. 다음 날인 21일에 개최된 개발자 회의 Microsoft Build 2024에서 Copilot+PC에는 33억 파라미터의 SLM ‘Phi Silica’가 탑재된다는 것도 명확히 밝혔다.

-- 기준은 '40TOPS' --
온디바이스 생성 AI를 이용하려면 유저는 최신 AI 칩이 탑재된 디바이스를 구입해야 한다. 마이크로소프트는 Copilot+PC에 대해 AI 처리 성능이 40TOPS(초당 40조 회 연산) 이상인 NPU(Neural Processing Unite)를 탑재한 하드웨어라고 정의하고 있다. 6월 18일 Copilot+PC 발매 시점에서 이 요건을 충족하는 것은 SoC(System on a Chip)로 Snapdragon X Elite나 Snapdragon X Plus를 탑재한 제품뿐이다.

한편, Apple Intelligence를 이용할 수 있는 것은 iPhone에서는 하이엔드 기종인 iPhone 15 Pro와 iPhone 15 Pro Max. iPad와 Mac에서는 M1 이후의 칩이 탑재된 최신 기종에 한정된다. 애플의 최신 칩인 M4의 AI 처리 성능은 38TOPS. 30억 파라미터의 기반 모델을 온디바이스로 가동할 경우, 40TOPS 전후의 성능이 하나의 기준이 될 것으로 보인다.

챗GPT Plus 등 성능이 뛰어난 생성 AI를 월 20달러에 이용할 수 있는 가운데, 새로운 디바이스가 필요한 온디바이스 생성 AI는 가성비 측면에서 뒤처질 수 있다. 일본의 유저에게 ‘Apple Intelligence’가 당분간 영어로 밖에 이용할 수 없다는 점도 부정적인 요소이다. 일본어 등 다국어 대응은 2025년 이후 실시될 예정이다.

과연 유저는 온디바이스 생성 AI를 원할 것인지, 온디바이스 생성 AI가 PC나 스마트폰 수요를 환기시킬 수 있을 것인지가 올 후반기에 주목 받는 토픽이 될 전망이다.

 -- 끝 --

Copyright © 2024 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.

TOP

목차

목차 Nikkei Computer_2024.7.11

IT가 위험하다
'기술 지원 사기' 급속도로 악질화, 한 번에 100만 엔의 피해도
특집
시간 대비 효과를 높이는 '초압축' 업무 기술
‘태만한 재택 근무는 이제 그만’, 5가지 포인트로 탈피
주 3일 부업도 가능한 여유로움, 반복 작업을 0로
아이와 매일 함께 하는 저녁 식사, '작업 설계' 기술로 실현
업무를 지체시키지 않는다, ‘애매한 의뢰’에 대응하는 기술
일을 혼자서 감당하지 않는다, 미완 작업의 인계 기술
특집
지금이야말로 ‘탈(脫) 저임금’
IT 기술자 급여, 어떻게 올려야 하나?
포커스
빅파마에 도전하는 신약 개발 AI 'DAIA'의 실력
인터뷰
아마존웹서비스의 바레스 일본매니징디렉터
일본에 2조 엔 투자 및 고품질 인프라 제공, 고객에게 최적의 생성 AI를 제시
뉴스&리포트
- '견적이 지연', '유효화가 안 된다', 가격 인상뿐만이 아닌 VMware의 문제
- 호네부토노호신(骨太の方針) 2024가 각의 결정, '디지털을 통한 과제 해결'이 3대 핵심으로
- 모르는 사이에 주민등록 말소, 시즈오카 현 이와타 시에서 일어난 희귀한 사건의 이유
- AWS가 도쿄 리전에서 Claude 3 제공, 앤솔로픽의 LLM 활용 추진
- NTT데이터그룹이 생성 AI에 400억 엔 투자, 기술개발 및 해외 대기업과의 제휴 추진
- 마이크로소프트의 Copilot+PC 출시, 화제의 AI 기능 ‘리콜’은 연기
<난반사>
‘생성 AI로 코드 자동 생성', 향후 이용해야 할 기술 1위에 올라
데이터는 말한다
생성 AI 활용 효과, '기대를 크게 웃돈다'는 9%
케이스스터디
[JR 동일본]
앱 개발 인재 5,000명 육성, 현장의 과제를 디지털을 이용해 스스로 해결
CIO가 도전
이토추상사의 우라카미 준집행임원 IT·디지털전략부장
DX로 조직의 종적 관계를 타파, 기간 쇄신을 변혁의 기반으로
작동하지 않는 컴퓨터
[KADOKAWA]
랜섬 공격으로 '니코니코' 정지, 몸값 지불해도 데이터 복구 안돼
연재
<트러블을 통해 배우는 데이터베이스 구축 방법>
- 준비 부족이 초래하는 뜻밖의 트러블, 운용 단계 전에 원인 있어
<일본 기업의 DX를 방해하는 세 가지 오해>
- '디지털 도입이 DX'는 오해, 사원의 자주성에 의존하지 않는 구조를 만들어야
<'스킬의 가시화'가 여는 IT 업계의 미래>
- 구인 데이터 10억 건이 말해주는 다음 직업의 ‘스킬’과 ‘임금’
<사장의 의문에 답하는 IT 전문가의 대화기술>
- 12가지 행동으로 리더십 구현, 강한 시스템 부문을 만들다
키워드
트리아지(Triage)
오피니언
<극언정론>
- ‘메차코미'와 '라쿠텐트래블', 설립을 둘러싼 의외의 공통점
<모바일의 일도양단>
- 갑자기 중고폰 사용이 안 된다, '네트워크 이용 제한'의 향방은?
<GAFA 심층 분석>
- 애플과 마이크로소프트가 주력하고 있는 온디바이스 생성 AI의 가성비는?
<프로그래밍으로 가자>
- 프로그래밍 학습은 더 이상 무의미? 코드 생성 AI로 가속화되는 인력 부족
<'오늘도 누군가를 노린다'>
- 파리올림픽을 겨냥한 사이버 공격 격화되나? AI를 구사한 가짜 영상도 속속 등장
독자의 소리
편집 후기

 

-- 끝 --

TOP