雖然語音識別被認為是目前應用最多的人機交互方式之一,但它的體驗似乎並不理想,識別速度慢、準確率又低,這是很多用户對語音識別的印象。然而,研究人員的測試表明,和手機屏幕上手動打字相比,語音識別能更快的、更準確的組織文本消息。
來自斯坦福大學、華盛頓大學以及百度的計算機科學家最近做出了一項測試:以iPhone作為硬件設備進行了中英文打字比賽實驗,一方是以百度矽谷人工智能實驗室去年發佈的“Deep Speech 2”軟件為代表,另一方是32名年齡介於19歲至32歲的打字高手,錄入速度和準確率都由後台測試軟件記錄。
斯坦福大學計算機科學系教授詹姆斯·蘭迪表示,“這些人從小打字,所以我們讓語音識別軟件與這些人所擅長的打字比拼”。
結果顯示,不論是英語還是中文,語音識別的速度以及準確率都比傳統鍵盤輸入要好。
引用英語:語音識別比打字快三倍,並且錯誤率低20.4%;中文普通話:語音比打字快了2.8倍,錯誤率則低了63.4%。
參與研究的斯坦福大學計算機科學系博士研究生阮珊珊表示,“我們之前知道語音識別的效果還不錯,預期的識別速度會比鍵盤打字快一些,但結果且讓人驚訝,這一速度幾乎快了3倍。”
當然百度的Deep Speech 2並不只是個例,對其它語音識別軟件來説同樣適用。蘭迪表示,“過去兩至三年間,得益於大數據和深度(人工智能)學習,語音識別確實改善不少,可以取得更快和更精確的結果。”
所以這些研究人員認為,其他一些新版本高準確度語音識別軟件也能達到上述效果。
推薦閲讀:
語音識別的痛點在哪,從交互到精準識別如何做?
全球最大語音識別公司Nuance的衰落與自我救贖
資料來源:雷鋒網
作者/編輯:程弢
請按此登錄後留言。未成為會員? 立即註冊