니케이 컴퓨터 2024/07/25(2) 히노마루 LLM 전선에 후지쓰도 참여
日経コンピュータ- 목차
-
IT가 위험하다
데이터센터의 소비전력 급증, 초대규모 모델에 견딜 수 있을까
특집
・영원의 Java –‘이상의 COBOL’로서 반석의 지위 구축
・시스템 개발에서는 반석, 나쁜 이미지가 족쇄
・표기법의 간략화를 추진, 초보자 친화적인 언어로
요약
Nikkei Computer_2024.7.25 (p69)
히노마루 LLM 전선에 후지쓰도 참여
비책은 ‘약점 극복한 신형 RAG’
후지쓰는 2024년 7월부터 기업용으로 특화된 생성형 AI(인공지능) 서비스 ‘엔터프라이즈 생성형 AI 프레임워크’를 제공한다. 후지쓰의 AI 플랫폼 ‘Fujitsu Kozuchi’의 하나다.
NTT그룹이나 NEC 등 국내 대기업도 올해 봄 이후부터 생성형 AI 관련 사업을 전개하고 있어, ‘히노마루(일장기) LLM(대규모언어모델)’ 전선이 갑자기 격렬해졌다. 후지쓰가 어필하는 것이 ‘지식 그래프 확장 RAG(Retrieval Augmented Generation, 검색증강생성)’라고 부르는 기술이다.
-- 지식 그래프와 결합하다 --
지식 그래프 확장 RAG는 지식 그래프와 RAG를 접목한 기술이다. 지식 그래프란 다양한 지식(Knowledge)을 체계적으로 연결해 그래프 구조로 표현한 것이다. 지식 그래프 자체는 지금까지 많은 연구가 진행된 분야다.
RAG는 문서 내의 문장 덩어리(Chunk)를 닥치는 대로 검색해, 유사한 덩어리를 찾아내는 기법이다. 사용자가 프롬프트로서 입력하는 문자열의 특징량과, 그와 유사한 특징량을 갖는 Chunk를 문서 내에서 찾는다. 발견된 단편적인 Chunk 집합을 LLM에 돌려주고, LLM이 응답을 출력한다.
결과적으로 RAG는 입력된 프롬프트에 대해 히트한 정보밖에 제시하지 못한다는 과제가 있다. 후지쓰 인공지능연구소의 기쿠즈키(菊月) 시니어 리서처는 기존 RAG의 이미지에 대해 “[Ctrl+F]로 웹 사이트를 스팟 검색하는 이미지다”라고 말한다.
지식 그래프 확장 RAG는, 우선 문서 내에 나오는 Chunk의 관계성을 나타내는 지식 그래프를 생성한다. 그리고 그 지식 그래프를 바탕으로 Chunk의 관계성을 논리 추론한다. 정보를 무차별적, 단편적으로 추출하는 것이 아니라 관련성이 높은 정보도 추출할 수 있다. “필요한 정보만을 LLM에 제공할 수 있기 때문에 기존의 RAG와 비교해 정확도가 높다”(후지쓰 인공지능연구소 시라하타(白幡) 시니어 프로젝트 디렉터).
후지쓰에 따르면, LLM이 응답을 출력하기 위해서 처리하는 데이터량을 기존의 RAG에 비해 약 4분의 1로 억제할 수 있다고 한다. 데이터 처리량을 줄일 수 있다면 응답을 출력할 때까지의 시간을 기존 RAG보다 단축할 수 있고, 출력 내용도 보다 정확해진다.
후지쓰가 지식 그래프 확장 RAG의 적용 사례로 제시하는 것이, 네트워크 장해에 대한 대처법의 확인이다. 지금까지는 네트워크에 관한 지식과 함께 이용 제품의 사양서나 과거의 장애 기록 등을 대량으로 읽을 필요가 있었다.
그래서 후지쓰는 네트워크 기술자가 117건의 인시던트에 대해 현상, 원인, 대처법 등을 정리한 자연언어 리포트를 작성. 그 리포트를 사용해 지식 그래프를 만들었다고 한다.
-- 끝 --
Copyright © 2024 [Nikkei Computer] / Nikkei Business Publications, Inc. All rights reserved.
목차
Nikkei Computer_2024.7.25 목차
IT가 위험하다
데이터센터의 소비전력 급증, 초대규모 모델에 견딜 수 있을까
특집
・영원의 Java –‘이상의 COBOL’로서 반석의 지위 구축
・시스템 개발에서는 반석, 나쁜 이미지가 족쇄
・표기법의 간략화를 추진, 초보자 친화적인 언어로
・착착 진행되는 기능 강화, AI 개발을 전망하다
・갑작스러운 고액 청구의 덫, 라이선스에 주의
특집
・혼란한 정액 감세, 기업/지자체의 부담 증가, 문제시되는 정책 효과
포커스
거대 IT 기업의 생성형 AI 경쟁, 다음은 ‘온디바이스’
인터뷰
미국 데이터로봇(DataRobot)의 데반얀 사하(Debanjan Saha) CEO
예측 AI와 생성형 AI를 조합해 가치 향상, 도쿄에 데이터센터를 신설해 제공
뉴스 & 리포트
・미쓰비시UFJ가 시스템 회사 신설, 지방은행을 위한 메인 프레임을 일괄 조달
・'DX의 성과가 나오고 있다'는 60%대, 시스템 자체 제작에 주력하는 기업 증가
・일본 오라클, '속(續) VMware' 선언, 레거시 마이그레이션을 강화
・히노마루(일장기) LLM 전선에 후지쓰도 참여, 비책은 '약점 극복한 신형 RAG'
・GPT-4o를 2주 조금 넘는 시간에 초고속 구현, 머니 포워드가 베타 버전
・새 지폐 대응은 금융이나 철도가 선행, 투자액은 5000억엔 규모
・SBG가 의료 AI 벤처기업과 합작, 미국의 환자 데이터를 일본에서 활용
난반사
환갑을 맞이한 JBCC, 초고속 개발과 서브스크립션 사업으로 시프트
데이터는 말한다
랜섬웨어의 몸값 지불, 감염 후에 방침을 생각하는 기업이 약 50%
케이스 스터디
[Air Water]
처리 지연을 클라우드 리프트로 해소, V2V로 기간계 이행 기간을 반년 빠르게
도전자
tokuiten의 도요시 류이치로(豊吉 隆一郎) 대표이사
AI와 로봇으로 농업을 DX, 미니토마토 재배 지식 축적
움직이지 않는 컴퓨터
[사카이시, 가와사키시, 사이다마시 등]
정액 감세 처리에서 계속되는 오류, 짧은 준비 기간으로 검증 부족이 드러나다
연재
기업이 빠지는 5가지 AI 리스크
공들인 논문을 학회가 거부, 생성형 AI를 활용한 연구자의 오산
오류 투성이의 설계 리뷰
실은 2종류가 있는 AI 시스템, 정확하게 구분해 리뷰하자
실천 DX, 클라우드로 시작하는 데이터 매니지먼트
복잡해지는 데이터 기반 거버넌스, 데이터 메시로 통제하면서 최적화
사장의 의문에 답하는 IT 전문가의 대화술
중요 데이터를 정리하는 책임자, 데이터 스튜어드를 두자
키워드
AI 에이전트(AI agent)
오피니언
극언 정론
주목 받은 ‘프로세스 오피스’, DX를 고립시키지 않는 핵심
모바일 일도양단
‘도움이 되지 않는 가이드라인’, 고정 브로드밴드 품질 측정에?
나카타 아쓰시의 GAFA 깊이 읽기
업무 데이터 활용하는 생성형 AI 앱 어떻게 개발하나, 방법은 2종류
오모리 도시유키의 프로그래밍으로 가자
프로그래머의 '선민의식', 코드를 쓸 수 있는 것은 대단한 것인가
가쓰무라 유키히로의 ‘오늘도 누군가를 노린다’
링크되어 있는데 실재하지 않는 '팬텀 도메인'에 숨어 있는 함정
-- 끝 --