張國仁:云語音技術,超強訊飛語音輸入法詳解 |
發布時間: 2012/8/1 15:50:29 |
昨天參加了一場科大飛訊舉辦的發布會,這是讓我比較興奮的一場發布會,甚至不亞于9月份見到喬布斯的激動。應該是我這兩年來唯一感覺有意思,愿意聽到最后的一場產品發布,原因正是技術的魅力。發布的產品叫“云語音”,與現在很多人討論虛無的云計算相比,科大訊飛的云語音是很實在的云計算例子,你可以現場就能體驗到語音輸入、語音合成、語音搜索帶來的技術快感。
【安裝這個輸入法之后可以在所有輸入的地方啟用】 對科大訊飛這個公司,也許你和我一樣,聽著很陌生,就像我第一次聽到他們PR人員邀請一樣,還反復求證了一下是哪家公司。后來讓我有去看看沖動的是他邀請的兩位嘉賓,一位是中國科協名譽主席周光召老先生、在我之前就職于一家科技雜志社的時候,久仰過老科學家的大名、另一位則是聯想董事局主席柳傳志先生。 其實,對科大訊飛公司,我們很多人實際上是使用過他的技術的,比如我們在撥打中國移動、中國聯通客服的時候,自動應答客服自動合成的語音技術就是來自這家公司,這是一家源自中國的世界級頂尖語音技術公司,占據國內80%的市場,有11年歷史,已經上市。 即便這樣,他還是提不起我更大的興趣,但是他今天展示的一個核心應用讓我不得不佩服,他們這次推出的“云語音”主要是定位在移動互聯網應用的,也就是我們用手機上網的時候會用到,最典型的例子就是語音輸入法,現在已經有支持Android和iPhone版本的Beta版輸入法。 ![]()
【座無虛席的會場中大部分人在探著頭認真聽 在國內產品發布中很少見此情景】 在科大訊飛董事長劉慶峰博士的發布演講中,展示的幾項應用讓我非常佩服,特別是在輸入方面,現場就是用一臺Android手機演示,隨便說出一些日常的話語,就可以很快地輸入為文字,這些語音識別的方法是將手機接收到的語音信息發回到云服務器后發回出文字結果。直到發布會結束后,我都有這樣的疑惑,劉董事長現場演示的內容肯定是事先準備好的,所以準確率是百分之百,后來回家親自下載Android版的訊飛輸入法在Nexus One上試用后,不得不佩服,想我這樣發音不是很準的南方口音,識別率都是很驚人的,而且可以自動識別短句。 除了這一項,其實劉董事長介紹的另幾項應用也非常具有實用性,比如: 一、語音搜索 只要搜索一個關鍵詞,比如一個人名,他可以搜索到內容中含有這個人名的視頻。 二、語音客服系統 我們以后撥打10086或者10010的客戶號碼不需要聽一下然后拿開手機選擇按鍵到下一個菜單,只要說話告訴客服系統,選擇什么操作、返回上一級菜單等就可以了。 三、語音模擬 現場隨機模擬一段中央電視臺新聞聯播播音員李瑞英的聲音,惟妙惟肖 四、語音遙控器 這個應用最常用的地方是在IPTV電視,只要在遙控器上添加一個按鍵,就可以用這個按鍵來輸入語音,操作電視,可以拿著遙控器直接說話尋找某個節目。 此外,還了解到科大訊飛有幾項了不起的成績: 一、用于普通話級別考試的自動打分系統就是他們做的,因為這個涉及到個人的就業,所以要大大實用的標準,是要求非常高的。 二、從2005年起,科大訊飛在國際上的多個語音技術競賽中比歐美日本的公司還要牛,曾經多次獲得冠軍,競爭對手就包括Google、蘋果、IBM這些國外的科技巨頭。 在劉博士的介紹中,觀眾曾多次自發地多次響起掌聲,而且知道最后都很少有人提前離開,我想大部分人是為這種出色的技術所迷住了的。 那科大訊飛這家公司到底是什么來頭呢?后來了解原來是源于安徽中國科技大學,里面的大部分核心技術人員,包括前面提到的總裁劉慶峰董事長,都是來自安徽的中國科學技術大學,也就是大家所熟知的有少年班的那所知名學校。 ![]()
【我們熟悉的這些3G應用實際上都滲透了中文語音技術】 語音識別方面,其實使用過Android或蘋果手機的用戶已經體驗到蘋果和Google提供的技術了,但實用性還不是很高,科大訊飛的語音輸入法可以說完全達到了實用階段,這也是為什么令我震驚的最大原因。 在中文計算機化方面國內還有一個出色的企業是漢王,漢王的長處是在手寫方面,2009年當我第一次用到漢王的多字手寫識別技術時,也是非常驚嘆,現在看到科大訊飛的語音識別技術,深感技術發展之神速,也為這是我們國人開發的技術而自豪。 很難想像,有了這樣易用的語音輸入技術,有多少我們不能使用拼音、筆畫甚至手寫輸入信息、上網的父輩們都可以享受到互聯網帶來的信息便利了。 本文出自:億恩科技【www.sunshares.net】 |