검색엔진이란 무엇일까? 구글의 창업자 래리 페이지와 세르게이 브린은 "검색엔진이란 내가 원하는 것이 무엇인지 파악하고, 이를 정확하게 알려주는 것"이라고 정의했다. 이를 실현하기 위해 구글이 검색엔진 3.0 시대를 선언했다. 검색 창에 특정 키워드를 입력하면 단순히 키워드에 관련된 정보만 나열했던 기존 검색엔진에서 벗어나겠다는 의지를 담아서다.
구글이 제안한 검색엔진 3.0이란 무엇일까? 구글을 포함해 최초의 인터넷 검색엔진은 키워드를 검색하면 해당 키워드만 찾아줬다(검색엔진 1.0). 이러한 검색엔진이 연관 검색(검색엔진 2.0)으로 발전했다. 해당 키워드뿐만 아니라 키워드에 관련된 웹 문서, 블로그, 이미지, 동영상, 뉴스 등을 함께 찾아주는 기능이다. 구글, 빙, 야후, 네이버, 다음 등 포털의 검색엔진은 현재 이 수준에 머물러 있다.
구글은 검색엔진 3.0을 음성 검색, 그 가운데 '자연어 검색'으로 정의했다. 음성을 활용해 사람과 검색엔진이 (마치 사람끼리 대화하는 것처럼)자연스럽게 대화를 나누는 시대가 열렸다는 것이다. 구글이 제시한 미래의 검색엔진에 대해 좀 더 자세히 알아보자.
딱딱하게 물어보지 마세요, 자연스럽게 물어보세요
사실 구글이 음성 검색을 제공하지 않았던 것은 아니다. 지난 2008년 미국에서 구글 홈페이지를 통해 음성 검색 기능을 제공하기 시작했고, 국내에도 2010년 6월 도입했다. 하지만 키보드가 해야 할 역할을 음성으로 바꾼 것에 지나지 않았다. 이에 구글은 음성 검색의 활용도를 확장하기 위해 음성 대답과 음성 액션이라는 새로운 기능을 선보였다.
음성 대답(Answer)은 기존 음성 검색에서 한 단계 진보한 자연어 검색 기술이다. 단어로 구성된 키워드뿐만 아니라 구어체인 자연어 질문에 대한 답변도 해주는 기능이다. 예를 들어 "오늘 날씨는?", "295x37+8은?", "10마일은 몇 킬로미터?"같은 질문을 하면 "오늘은 맑고 쾌적합니다", "10923이요", "16.09344킬로미터입니다"라고 대답한다. 해당 문구로 검색을 해주는 것이 아니라 이에 대한 답을 화면에 보여주고, 이를 음성으로 읽어주는 것이다. 날씨의 경우 사용자 현재 위치를 파악해 해당 지역의 날씨를 알려주며, 다른 지역의 날씨를 물어보면 (예: 보스톤의 날씨는 어때?)그 지역의 날씨를 알려준다. 일부 답변은 화면뿐만 아니라 음성으로 말해주기도 한다(Talk back).
음성 대답의 핵심은 주어 또는 목적어가 생략된 질문도 전체 대화의 흐름 내에서 요지를 파악해 답변을 해준다는 것이다. "오바마의 나이는?"이라고 물어 본 뒤 "그의 키는 얼마나 돼"라고 물어봤다고 가정해보자. 기존에는 뒤의 질문을 이해하지 못했지만, 음성 대답은 앞의 질문에서 주어 또는 목적어를 파악해 정확한 답변을 제시한다. 추상적인 질문이나, 명쾌한 해답이 없는 경우에도 최선의 답을 찾아준다. "간장공장공장장은?"이라고 물어보면 간장공장공장장 발음 테스트에 맞게 "간 공장장이고, 된장공장..."라고 대답하고, "사랑해"라고 말하면 "저도요"라고 답변한다.
음성 액션은 스마트폰이나 태블릿PC속 앱과 기능을 실행 시키는 명령어 인식 기능이다. 기존 스마트폰 음성 실행 기능은 스마트폰에 대고 "검색", "지도앱 실행". "문자 전송", "전화걸기", "일정등록". "리마인드", "블루투스 켜기"라고 딱딱하게 말해야 했다. 이제 편하게 자연어로 말하면 된다. "남편에게 전화해줘"라고 말하면 남편에게 전화를 해주고, "홍길동에게 '지금 고속도로가 막혀서 회의에 늦을것 같아요'라고 문자 보내"라고 말하면 해당 내용을 문자 메시지로 발송해준다.
더욱 놀라운 것은 이 기능이 서드파티 앱에도 영향을 미칠 수 있다는 것이다. 구글은 음성 액션 API를 공개해 다른 개발사의 앱도 음성 액션을 적용할 수 있도록 했다. 예를 들어 "강일용에게 '기사 마감 똑바로 지켜'라고 카카오톡 메시지를 보내"라고 말하면 카카오톡으로 해당 독촉 메시지가 전달된다. 물론 이것은 어디까지나 예시에 불과하다. 개발사가 자신의 앱에 음성 액션 API를 적용하기 전까진 해당 앱을 실행하는 것만 가능하고, 해당 앱 속에서 특정 행동을 하라고 지시를 내리는 것은 불가능하다. (현재 카카오톡에는 음성 액션 API가 적용되어 있지 않다. 때문에 저렇게 말하더라도 실제로 구동되진 않으니 주의하자)
음성 대답과 음성 액션은 안드로이드 4.4 킷캣 이상으로 실행되는 안드로이드 스마트폰 및 태블릿PC와 구글 검색 앱을 설치한 아이폰, 아이패드에서 오늘(4일)부터 사용할 수 있다. (PC에선 아직 지원하지 않는다. 오직 모바일 전용이다)한국은 미국, 영국, 프랑스, 독일, 일본에 이어 음성 대답과 음성 액션 기능을 사용할 수 있는 여섯 번째 국가다. 사용법도 쉽고 간단하다. 구글 검색 위젯에서 음성 검색 버튼을 누르거나(안드로이드, iOS 공통), 홈 화면에서 "오케이 구글(시동어)"이라고 말하면 된다(안드로이드 전용).
모든 기기와 대와하는 시대 열린다
왜 하필 음성일까? 구글은" 키보드와 터치스크린(마우스 포함)을 대체할 수 있는 수단은 음성뿐이라며, 키보드와 터치스크린이 매우 정확한 입력 수단인 것은 사실이지만 공간이 협소하거나 사용자가 두 손을 사용하는데 제약이 따르는 장소에선 이용할 수 없다"고 지적했다. 대표적인 사례가 자동차와 웨어러블 기기다.
자동차를 운전하면 두 손과 눈은 자유롭지 못하다. 안전을 위해 모든 신경을 차량 운전에 집중해야 한다. 내비게이션에 목적지를 지정하거나 듣고 있는 음악을 변경하기 위해 손을 핸들에서 떼는 행위조차 위험한 것이 사실이다. 이때 음성 대답과 음성 액션이 요긴하다. "오케이 구글" > "김기사를 실행해" > "목적지는 신도림 테크노마트"라고 말하기만 하면 안전하게 안드로이드 스마트폰으로 내비게이션을 실행하고 목적지를 지정할 수 있다. 웨어러블 기기도 마찬가지다. 작은 화면을 꾹꾹 눌러가며 조작하는 것은 불편하기 그지 없다. 음성으로 조작하는 것이 편리하다. 두 손과 눈은 이제 쉬어도 된다. 구글의 웨어러블 기기인 안드로이드 웨어와 구글 글라스 역시 음성만으로 기기의 모든 기능을 조작할 수 있도록 하는 것이 목표다.
구글은 음성 검색에서 발생할 수 있는 문제점도 파악하고 있다. 기기가 칵테일 파티장처럼 시끄러운 장소에서도 사용자의 음성을 정확히 잡아내고, 사용자의 목소리를 분석해 다른 사람의 명령은 듣지 않도록 연구 중이다.
구글 스티브 쳉(Steve Cheng)모바일 검색 이사는 "구글은 많은 기술 개발을 통해 정확하고 빠른 음성 인식 서비스를 선보이려고 노력하고 있다. 음성 대답과 음성 액션도 마찬가지다. 사용자들이 음성 대답과 음성 액션을 쓰면 쓸수록 정확도가 향상된다. 많은 한국 사용자가 음성 대답과 음성 액션을 활용해주면 좋겠다"며, "가까운 미래에 모바일, 웨어러블 기기는 물론 자동차, 스마트TV와 같은 모든 기기와 자련스럽게 대화를 나누는 시대가 열릴 것"이라고 예상했다.
글 / IT동아 강일용(zero@itdonga.com)