-
음성인식 평가 기준IT Information/최신 기술 동향 2014. 7. 17. 12:50반응형
* 음성인식 평가 기준
우선 서드파티 앱에서 사용가능해야 할 것입니다. 음성인식이 정확성을 높이기 위해서는 학습이 뒷받침 되어야 합니다. 사람들이 어떤 발음을 하는지 어떤 질문을 하는지 그리고 그에 가장 적합한 대답은 무엇인지에 대한 것은 학습 없이는 얻어내기 힘든 데이터 입니다. 이 학습을 위해서는 다양한 앱에서 코타나를 사용할 수 있도록 해야 합니다.
그리고 자연어에 대한 인식율이 높아야 합니다. "오늘 날씨는 어때?", "근처에 맛있는 식당 좀 찾아줘!"와 같이 실제로 사람이 대화하는 듯이 말해도 알아 들어야 합니다. 지금의 음성인식은 '오늘 날씨', '교통상황', '맛집' 등과 같이 주요 키워드를 중심으로 말을 해야 인식이 되는 가능합니다. 하지만 이렇게 특정 키워드를 사용자가 학습을 하고 음성인식을 내려야 한다면 상당히 번거롭겠죠? 기계에 말을 하는 것도 불편하고 어색한데 말입니다.
항상 내 목소리를 듣고 있어야 합니다. 항상 스탠바이 상태가 되어야 하는데, 지금의 음성인식은 해당앱을 사용자가 실행시키고 이용해야 합니다. 애플의 시리도 홈버튼을 길게 눌러야 시리가 동작하는 것 처럼 말이죠. 좋은 예를 구글 보이스에서 찾을 수 있습니다. 구글 보이스는 "OK 구글"이라고 말하면 곧바로 음성명령을 내릴 수 있습니다. MS는 Xbox One에 해당 기능을 구현해 두었습니다. Xbox One에 전원이 꺼져 있더라도 음성명령으로 전원을 켤 수 있습니다. 물론 이 기능에는 배터리 소모에 대한 이슈가 있으니 어떻게 해결가능한지는 지켜봐야겠습니다.
구글나우가 가장 잘 구현하고 있는 것이 로컬 정보를 바탕으로 최적화된 정보들을 보여주는 것입니다. 내 일정에 맞춰 어디를 가야한다면 최적의 교통편이나 근처에 가볼만한 곳들을 알려주는 것입니다.(물론 구글나우는 한국 보다는 외국에서 제대로 진가를 확인할 수 있습니다.) 코타나 또한 GPS를 기반으로 하는 로컬 정보를 음성으로 알려주는 것이 필요합니다. 그래야 게임속의 스마트 AI 시스템과 같은 역할을 소화시킬 수 있으니 말입니다.
MS의 음성인식 서비스 코타나에 대해 바라는 점을 적다보니 현존하는 음성인식 서비스들로 부터 느꼈던 아쉬움들을 적어놓은 듯 합니다.^^ 그동안 애플과 구글 때문에 모바일 시장에서 큰 힘을 발휘하지 못했던 MS입니다. 루머에 따르면 MS가 파트너 제조사들에게 거대한 자본을 들여 지원을 한다는 소식도 있습니다. 올해는 윈도우폰을 포함해서 윈도우9까지 뭔가 대박을 칠수 있을지 주목해봐야 겠습니다.
반응형'IT Information > 최신 기술 동향' 카테고리의 다른 글
G3는 최고의 제품인가? (0) 2014.08.01 SW산업 분류, 상용소프트웨어 평가 항목 및 배점한도 (0) 2014.07.26 [번역] 프론트엔드 개발자는 왜 구하기 어렵나요? (0) 2014.07.11 농식품부-KT, 빅데이터 활용해 AI 방지 협력키로 (0) 2014.07.09 옴니채널이란(Omni-Channel) (0) 2014.07.09