과학과 세라믹,그리고 Ferrite

[사이언스타임즈] 미래의 스마트폰

FERRIMAN 2016. 8. 31. 15:05

- Sciencetimes - http://www.sciencetimes.co.kr -

음성인식, 터치스크린보다 정확

5년후 소리만으로 스마트폰 입력

스마트폰 같은 모바일 기기를 다루기 위해서는 손가락 움직임이 정확하고 빨라야 한다. 화면을 터치하는 방식을 적용하고 있기 때문이다. 지난 10년간 터치스크린(touch screen)은 모바일 기기에 있어 없어서는 안 될 중요한 요소가 돼 왔다.

그러나 최근 상황이 바뀌고 있다. 터치스크린을 업그레이드하거나 소리 등 다른 방식으로 완전히 대체할 수 있는 새로운 기술들이 속속 생겨나고 있다. 벤처기업 퀵쏘(Qeexo)에서 개발한 ‘핑거센스(FingerSense)’가 대표적인 경우다.

30일 ‘테크크런치’에 따르면 차세대 터치 플랫폼인 ‘핑거센스’는 손가락 끝, 손가락 관절, 손톱 및 스타일러스 펜을 이용한 터치스크린 입력을 각각 구분할 수 있는 기술을 선보이고 있다. 이를테면 손가락 관절로 화면을 두드리면 빠르고 쉽게 스크린샷 캡쳐가 가능하다.

손가락에서 제스처·음성인식 기술로

화면상의 원하는 부분을 손가락 관절로 표시해 화면 잘라내기도 할 수 있다. 손가락 관절로 두드리기만 하면 번거로운 ‘오래 누르기’가 실행된다. 이런 식으로 스타일러스 펜과 손가락 터치를 구분하면서 그 기능을 확대해나가고 있다.

스마트폰 등 모바일 기기의 터치스크린을 손가락 대신 제스처, 음성 등의 방식으로 제어할 수 있는 기술이 개발되고 있다. 특히 음성인식 기술은 5년 안에 실용화할 것으로 예상되고 있다.  ⓒblueprinteffects.com

스마트폰 등 모바일 기기의 터치스크린을 손가락 대신 제스처, 음성 등의 방식으로 제어할 수 있는 기술이 개발되고 있다. 특히 음성인식 기술은 5년 안에 실용화할 것으로 예상되고 있다. ⓒblueprinteffects.com

현재 이 기술은 중국의 화웨이(Huawei)를 통해 약 2000만 개의 스마트폰에 적용되고 있다. 퀵쏘와 파트너십을 체결한 화웨이는 조만간 핑거센서가 적용되는 스마트폰 ‘아너 8(honor 8)’을 미국에 상륙시킬 계획이다.

퀴쏘는 현재 ‘터치툴스(TouchTools)’란 타이틀을 내걸고 다양한 제스처 기술 시리즈를 개발 하고 있는 중이다. 양손을 사용하는 터치 제스처(touch gesture), 전자 화이트보드 지우개( whiteboard eraser), VMT(virtual measuring tape) 등.

이 기술들은 아이패드(iPad)에서 데모 앱(demo app)으로 활동 중이다. 퀵쏘에서는 ‘터치툴스’에 포함된 이들 기술들이 스마트폰을 비롯한 다양한 모바일 기기에 전 세계적으로 다양하게 활용될 수 있기를 고대하고 있다.

다른 기업들도 새로운 터치 기술 개발에 노력을 기울이고 있다. 모토롤라는 스마트폰을 보며 손목을 비틀면 그 안의 카메라 기능이 작동되는 기술을 개발했다. 제스처를 통한 터치 기술이지만 색다른 동작을 활용하고 있다.

구글, 애플 등 많은 기업들은 제스처를 넘어 소리만으로 모바일기기를 움직일 수 있는 방안을 찾고 있다. 현재 스탠포드, 워싱톤, 중국을 대표하는 검색 사이트인 바이두(Baidu) 등이 기존 터치 방식의 스크린을 대체할 기술을 개발 중이다.

특히 중국 기업들이 매우 적극적이다. 바이두의 연구책임자 앤드류 잉(Andrew Ng) 박사는 손가락만 사용할 이유가 없다며 “인간에게 가장 자연스러운 방법인 음성을 통해 모바일기기와 소통하는 방법을 찾고 있다”고 말했다.

다양한 중국 사투리 세밀하게 구분해

바이두에서는 새로운 터치 기술 개발을 위해 스탠포드 대에서 음성인식을 연구하던 잉 교수를 영입했고, 지금 ‘딥 스피치 2(Deep Speech 2)’란 기술을 개발 중이다. 현재 바이두 연구팀에는 스탠포드대, 워싱톤대 연구팀이 공동 참여 중이다.

연구팀은 음식인식 시스템의 가장 틈 난제인 음식인식 오류를 줄여나가고 있다. 최근 테스트 결과 영어를 사용했을 때 자판을 사용하는 것보다 오류가 날 확률이 20.4% 낮은 것으로 나타나고 있다. 중국어를 사용했을 때는 무려 63.4%의 낮은 오류 비율을 기록했다.

특히 중국어의 경우 북경어, 광동어와 기타 다수의 방언들을 정확히 구분해내는 수준에 도달했다고 알려지고 있다. 스탠포드대 제임스 랜디(James Landay) 교수는 “그동안 다른 음성인식 시스템을 접촉해오던 사용자들이 음성인식에 대한 큰 불신감에 빠져 있었다”고 말했다. “그러나 최근 연구를 통해 소리를 통해 이전보다 더 정확하게 메시지는 물론 다양한 정보들을 주고받을 수 있는 길이 열리고 있다”며 바이두와 함께 진행하고 있는 이 공동연구에 큰 관심을 가져줄 기를 기대했다.

1990년대까지만 해도 과학자들은 음성인식 시스템이 매우 부정확하다는 생각을 갖고 있었다. 가장 큰 고민은 사투리였다. 수많은 방언들을 다 소화해내기 힘들었다. 기술적인 문제도 작용했다. 사람의 소리 주변의 다양한 소음들을 구별하기가 어려웠다.

그러나 최근 과학자들은 이런 문제점들을 해결해나가고 있다. 카메라를 생각하면 된다. 과거 스마트폰 카메라를 보면 세밀한 부분까지 표현해내기가 매우 힘들었다. 그러나 최근 카메라를 보면 일반 카메라와 비견될 만큼 화소 수가 높아졌고 표현력도 매우 다양해졌다.

소리도 마찬가지다. 바이두에서는 강력한 슈퍼컴퓨터를 통해 인공지능 ‘딥 러닝’을 가동하고 있으며, 이를 통해 소리의 세미한 부분까지 모두 식별해내고 있다. 잉 박사는 “5년 후인 2021년이 되면 사람들은 자판 없이 소리만으로 화면을 조정할 수 있을 것이”라고 말했다.

지금도 많은 사람들이 스마트폰 속의 음성인식 시스템을 활용하고 있는 중이다. ‘2016 인터넷 트렌드 리포트’에 따르면 미국인 중 65%가 비록 부분적이지만 음성인식 시스템을 사용하고 있다고 응답했다.

그러나 바이두는 물론 세계 주요 모바일 기업들이 음성인식 기술에 뛰어들고 있어 조만간 소리만으로 스마트폰을 가동할 수 있는 시대가 올 것으로 전망된다. 음성인식 시스템이 마침내 모바일 시장에 영향력을 발휘하기 시작했다.

  • 이강봉 객원기자
  • 저작권자 2016.08.31 ⓒ ScienceTimes

Copyright © 2014 Sciencetimes. All rights reserved.