해동일본기술정보센터 | 해동일본기술정보센터

구글, 스마트폰 이미지인식 기능 강화 -- 문자 촬영 즉시 번역/ 음식 사진

Category사물인터넷/ ICT/ 제조·4.0
기사일자 2019.10.18
신문사 일경산업신문
게재면 5면
Writerhjtic
Date2019-10-27 15:11:48
Pageview314

구글, 스마트폰 이미지인식 기능 강화
문자 촬영 즉시 번역 / 음식 사진 촬영하면 입소문 평가 표시

미국 구글은 스마트폰 앱에서 사용할 수 있는 이미지인식 기능을 강화하고 있다. 4개의 앱에서 이 기능을 사용할 수 있도록 했다. 카메라로 문자를 촬영하면 바로 번역할 수 있는 기능이나 레스토랑 메뉴 사진을 촬영하면 입소문 평가를 볼 수 있도록 했다. 인공지능(AI)을 사용함으로써 주변에서 궁금했었던 사실을 그 자리에서 바로 알 수 있는 세계를 실현해 스마트폰의 새로운 용도를 제공해 나간다.

구글의 루 왕(Lou Wang) 프로덕트 매니저는 “최근 2년간 구글 렌즈를 개발하면서 어려운 기술적인 문제가 있었지만 많은 과정을 달성해 왔다”라고 말한다.

구글은 이미지인식 기능 ‘구글 렌즈’를 2017년부터 제공하기 시작했다. 당초에는 구글의 스마트폰 ‘Pixel’에만 탑재했다. 19년에 들어 구글의 기본소프트(OS) ‘안드로이드’를 탑재한 Pixel 이외의 스마트폰과 애플의 OS ‘iOS’를 탑재한 스마트폰에도 대응 가능하도록 했다.

4개의 앱에서 구글 렌즈를 이용할 수 있도록 했다. 안드로이드와 iOS에서 사용할 수 있는 사진 촬영 앱 ‘구글 포토’에 구글 렌즈를 내장했다. 구글 렌즈를 사용해 피사체를 실시간으로 확인하기 위해서는 안드로이드 단말에서는 전용 앱 ‘구글 렌즈’와 ‘구글 어시스턴트’, iOS용에서는 ‘구글’ 앱에서 대응한다.

구글 렌즈는 인물이나 사물과 같은 피사체의 특정뿐 아니라 텍스트를 인식하는 것도 가능하다. 문자 텍스트를 인식한 후에 실시간으로 번역할 수 있는 기능도 새롭게 갖췄다.

레스토랑의 요리 메뉴 사진을 촬영하면 구글맵의 입소문 평가가 표시된다. 캘린더에 예약을 추가하는 것이나 루트 검색, 전화를 거는 것도 카메라 촬영으로 실현할 수 있다. 구글이 제공하는 다양한 앱이나 서비스와 연동시키는 것도 가능하도록 했다.

구글 렌즈는 4개의 AI 기술을 바탕으로 다양한 기능을 제공하고 있다. 첫 번째가 ‘분류’라는 방법으로, 이미지에 포함되는 것을 라벨화해서 그 라벨의 확률을 산출한다. 예를 들면 생일 사진에서는 케이크가 93%의 확신을 가지고 케이크라고 결정을 내린다. 수백 만개의 이미지를 이용한 학습 결과를 이용하고 있다.

두 번째 방법이 ‘검출’이다. 분류를 통해 라벨화한 것이 이미지 내의 어디에 있는지 검출한다. 이를 통해 유저에게 장소를 제시해 주의를 촉구하거나 터치하면 검색을 하는 동작이 가능해진다.

‘분산 표현’이라는 방법에서는 이미지의 특징을 판단한다. 한 이미지와 다른 이미지가 어느 정도 닮았는지 산출할 수 있다. 사람이 이미지 특징을 파악할 때와 유사한 프로세스라고 한다. 예를 들면 복수의 자동차의 이미지를 색이나 모양, 방향이나 주위 풍경 등의 특징을 숫자로 표현해 닮은 이미지와 비교가 가능해진다. 구두 등 닮은 상품을 발견하기 위해 중요한 방법이다.

마지막 방법이 ‘모델 학습’이다. 3개 방법의 기술은 지금까지도 있었지만 모델 학습은 하드웨어나 서버에 부담을 줘서 시간이 걸렸기 때문에 실용화가 어려웠다. 구글은 ‘텐서 프로세싱 유닛’이라는 전용 하드웨어를 개발해 계산 시간을 대폭으로 삭감했다. 수개월이 걸렸던 모델 학습 시간을 수 시간으로 단축할 수 있도록 했다.

-- 비즈니스 용도도 보급 기대 --
인공지능(AI)을 사용한 이미지 인식은 비즈니스 용도에서도 급속하게 보급될 것 같다. 일본만 봐도 2018년도에 약 50억엔이었던 관련 서비스 시장은 23년도에는 1,500억엔으로 성장할 전망이다. 제조라인의 검품 검사나 소매점의 마케팅 등 폭넓은 업종에서 도입이 추진될 것으로 보인다.

스마트폰용으로 제공하는 ‘구글렌즈’를 사용한 서비스도 증가할 것 같다. “하이엔드 스마트폰을 갖고 있는 사람만이 아니라 많은 사람들이 구글 렌즈를 사용했으면 좋겠다”(루 왕 프로덕트 매니저). 메모리가 1기가바이트(기가는 10억) 이하의 저용량에 처리 능력이 낮은 단말에서도 움직이는 OS ‘안드로이드 Go’용으로 이미지에서 문자를 인식하는 기능에 특화된 렌즈도 준비했다. “신흥시장 중에는 문맹률이 높은 나라도 있다. 문장 이해에 도움이 되는 툴로 만들고 싶다”라고 말한다.

증강현실(AR)과의 연계도 추진한다. 구글 검색에서 AR 동물을 표시하는 기능을 추가했다. 예를 들면 구글 렌즈로 번역하고, 옆에 AR로 번역한 말에 해당하는 물체를 표시하는 것도 가능해질지도 모른다. 루 왕 프로덕트 매니저는 구글 렌즈에 대해 “현단계에서 수익에는 포커스를 맞추고 있지 않다. 당분간은 용도 개척을 우선할 생각이다”라고 말한다.

-- 끝 --

일본산업뉴스요약