地方頻道:
您的當前位置:首頁>科技
成人機交互最自然的方式
2016-11-25 21:10:34   來源:環球網

斯坦福大學計算機科學專業教授James Landay


傳統的輸入方式大多數是通過鍵盤來實現的。而這是我們所能選擇的唯一方式嗎?近日,百度與百度、斯坦福大學和華盛頓大學共同完成的一項研究告訴我們:語音或許將能夠成為新的輸入方法。11月23日,在百度語音開放平臺上線三周年之際,該研究項目的負責人,斯坦福大學計算機科學專業教授James Landay在接受環球科技采訪時詳細介紹了此次研究的結論,雖然語音輸入法仍然有局限性,但基于語音識別技術,從速度、準確性來說,語音輸入的表現已經超過了傳統的鍵盤輸入。

而百度首席科學家吳恩達對語音識別技術的描述是:“人機交互最自然的方式”。

此次研究從19到32歲年齡段的人群中挑選了16名以英語為母語和16名以漢語(普通話)為母語的測試者,其中一半為女性一半為男性。

根據研究結果顯示,相比于傳統的鍵盤輸入,語音輸入方式在速度及準確率方面更具優勢。利用語音輸入英語和普通話的速度分別是傳統輸入方式的3.24倍和3.21倍。此外,通過加入糾錯功能后,語音輸入英語及普通話的準確率進一步提高,達到96.43%和92.35%,輸入速度仍為傳統方式的3倍和2.8倍。

事實上,根據以往的經驗來看,語音輸入無論從準確性來說還是從速度上來說,都比不過鍵盤輸入。但隨著深度學習技術的發展,語音識別開始獲得發展,越來越多的語音應用開始受到關注。

2016年在《麻省理工科技評論》“十大突破性技術”盤點中,語音接口技術便成功入選。麻省理工科技評論認為:通過該技術,可將語音識別和自然語言理解相結合,為全球互聯網市場創造切實可用的語音接口。語音識別將成為人機交互的重要方式。

語音識別技術的進步已經讓語音輸入完美了嗎?

雖然基于技術的進步,語音識別已經展現超越鍵盤輸入法的優勢,但Landay教授對環球科技坦言,語音輸入法對于使用者的使用環境有著較多的要求,應用場景往往受到限制。比如在會議中,即使語音輸入法有著再多的優勢,使用者也不可能使用語音來進行輸入。

“不同的環境適應不同的輸入方式,某些環境下確實無法使用語音輸入,而在某些緊急的情況下,語音輸入則優于傳統的鍵盤輸入。目前來看,兩種輸入方式是分開的,而我們正在考慮如何將兩者更好的融合在一起,這也是未來的一個研究方向。”Landay教授說道。

在其看來,并沒有所謂的最好的人機交互模式。而是如何能夠實現最為自然的人機交互模式。而目前來看,語音識別是最適合的方式。人的大腦向身體發送指令,使得人可以遵從自己的意愿進行活動,而在交流過程中,神秘的大腦來進行復雜的信息處理,這些都是機器難以實現的。

如何讓機器更夠更好的獲得并分析人類所下達的指令,語音識別技術為這一目標的實現創造了可能。

而這也是百度正在考慮的事情。吳恩達認為:這些技術有很大的潛力,可以改變人機交互的效率和辦法。這也是百度不斷發力百度大腦,大力投入語音識別技術deep speech的原因。

而此次,Landay教授能與百度共同合作來完成項目的研究,一方面是由于他和吳恩達是舊識,而更大的原因是他認為百度在語音識別方面的技術水平已經達到了世界級標準。

“我從吳恩達哪里了解到了許多百度的發展情況,當他提起這個項目的時候,我覺得真的可以來看看語音識別和鍵盤輸入究竟有多大的差別,試試語音識別現在究竟能做到怎樣的程度。”

而研究結果也說明了語音識別技術的快速發展。“近兩年,受益于大數據和深度學習技術的不斷發展,語音識別技術突飛猛進,速度及準確性都有了長足進步。”Landay教授說道。

百度的技術團隊一直在不斷地優化語音識別系統:在2012年開始使用DNN模型,之后開始用Sequence Discriminative Training,也開始使用LSTM模型,加上CTC,2016年更是開發了Deep CNN模型,效果在不斷進步。

目前,僅從百度的產品來看,包括手機百度、百度地圖、百度輸入法在內的很多百度產品中,都已經支持語音輸入,。

而這些技術旨在解決用戶在使用語音交互的場合時,普遍感到困擾的一些關鍵問題。例如,百度情感合成技術主要聚焦在為合成語音“加入情感”,目前可達到接近真人發聲效果,百度今年早些時候曾利用此技術,復原已逝明星張國榮的聲音。

類似地,開發者還可以利用新的接口,使語音識別距離增加到3-5米,將設備的語音喚醒率提升到95%以上同時更省電誤報更少,或提升長時間語音識別的準確率問題。這將為語音技術帶來遠比現在更多的想象空間,而不只是遙控電視或解鎖手機。

今年2月,百度深度語音識別系統Deep Speech 2入選MIT 2016十大突破技術。包括語音技術在內的百度大腦,入選2016第三屆烏鎮世界互聯網大會15大領先科技成果

“這些技術有很大的潛力,去徹底改變人機交互的效率和辦法。未來語音技術在很多應用場景有很好的機會,將為人機交互帶來巨大的改變。”吳恩達表示。


技術支持:湖北報網新聞傳媒有限公司

今日湖北網版權所有 鄂ICP備2020021375號-2 網絡傳播視聽節目許可證(0107190) 備案號:42010602003527 違法和不良信息舉報中心

亚洲乱码国产乱码精品精,国产曰批视频免费观看完,中文字幕无码人妻777网,欧美特黄激情视频一区一区
在线可以免费观看的Av | 亚洲无线码高清在线观看 | 欧美华人在线视频 | 日韩最新综合一区二区 | 日韩欧美另类一区精品在线 | 亚洲最新永久观看在线 |