探索“智慧語音”未來的香港“王博士”

新華社廣州4月27日電(記者陳寂)當香港科技大學博士王昕決定離校赴深圳創業之時,她已投身語音識別研究10年之久。那是在4年前,30歲出頭的王昕曾權衡再三。

 

身處香港科技大學計算機科學及工程學系,浸淫國際前沿的科研環境與開闊的學術視野中,王昕本可選擇留校,享受優渥待遇,但做事喜歡做到極致的她卻覺得,自己研究的東西沒能很好地實現産業化運用。

 

“語音識別技術落地變成消費類産品的前提是要和産商結合,而深圳這點很厲害,技術從實驗室到産品的過程很快。”她説。

 

於是,王昕做了一個自稱“很欠揍”的選擇,在2012年與幾個創業夥伴北上深圳,在深港産學研基地成立了“深圳語音搜索及應用工程實驗室”,希望憑藉車載語音識別産品邁進內地車聯網市場。

 

“我感覺,開車時的語音識別不是錦上添花的應用,它必將成為一種必需品。”王昕説。深港産學研基地給了王昕一個免費的理想創業場地,在這個由深圳市政府、香港科技大學和北京大學共同創建的基地裏,很多人都叫她“王博士”。

 

因為這一研發方向契合深圳市的産業發展方向,“王博士”的實驗室還獲得政府數百萬元人民幣的資助。

 

“機遇大,但挑戰也是分分鐘的事情。”王昕創業之初,零經驗運作一個企業,招兵買馬,做計劃書,與政府、市場打交道……面臨許多未知,吃過許多閉門羹。數年間,創業團隊陸續有人離開,“不像在港科大,帶團隊都有學校支撐。現在每一年都要想著怎麼找錢,養活這麼多人。”

 

在各種新型智慧化設備日益廣泛地走進人們的工作和生活的今天,作為人機交互最自然的方式,語音識別成為了當今最便捷的人機交互使用方式。

 

“以前很多人不習慣對機器説話,而微信語音和siri服務改變了這點,現在手機上所有的語音功能,車上都能用了,並已發展到了隨心所欲的程度。”王昕解釋説,車載語音識別最大的挑戰在於控制噪音環境下的識別率,而這正是她公司的技術優勢所在。

 

現在,王昕的企業已擁有逾100名員工,年盈利數百萬元人民幣,産品覆蓋車載語音識別、政府部門人工客服等多個領域。與此同時,王昕的企業還借助大數據服務,搭建面向證券領域的高端商情服務系統,覆蓋近900家擬上市企業,實現對擬上市企業從初審到上市這一敏感時期全天24小時、多種信息來源的輿情監控。

 

“當一個社會熱點事件發生之後,互聯網相關的新聞會涌出很多,人看到的只是一個一個片段,但機器會搜索和呈現完整的一個時間軸和發散途徑。”王昕以天津港爆炸事故為例解釋説,機器會在事故發生後立即挖掘數據庫,會發現停放有汽車的企業是哪些、背後涉及哪些保險公司、居民樓又是哪些房地産商的……機器會分析連接起所有的線索,形成完整的知識圖譜。

 

“人下一秒會説什麼,人工智能是通過對之前説的很多話的大數據積累來預測的。股票也是一樣,人工智能也可以根據大數據來預測。”王昕説,她的實驗室將會把大數據的挖掘與證券行業和金融行業做結合。

 

國家“十三五”規劃裏提到“人工智能”,也讓王昕對未來充滿期望。“我們的發展還是和國家大局契合的。”她告訴記者,語音識別不僅要能“聽清説了什麼”,還得“理解説了什麼”,這方面提出的挑戰,今後將從後臺數據上發力應對。

 

在她看來,有了“深度學習”能力的人工智能,將來在語音識別上不僅能回答“今天天氣多少度”,還要能回答“今天天冷麼”這樣的問題。