自動(dòng)語音識(shí)別技術(shù),簡(jiǎn)單來說就是利用計(jì)算機(jī)將語音信號(hào)自動(dòng)轉(zhuǎn)換為文本的一項(xiàng)技術(shù)。這項(xiàng)技術(shù)同時(shí)也是機(jī)器理解人類言語的第一個(gè)也是很重要的一個(gè)過程。近幾年隨著物聯(lián)網(wǎng)不斷發(fā)展,智能家電市場(chǎng)有了爆發(fā)性的成長(zhǎng)。尤其在智能家庭加入語音助理之后,更上一層樓。然而語音識(shí)別+智能家電普及入家庭真的準(zhǔn)備好了么?

語音識(shí)別類家電硬傷
對(duì)于語音識(shí)別、語音處理許多公司正在不斷研發(fā)新的算法和技術(shù)使得識(shí)別更準(zhǔn)確,各家大廠如亞馬遜、蘋果、Google、三星、海爾等服務(wù)或家電制造業(yè)者紛紛相互結(jié)盟,并展出最新智能家庭產(chǎn)品,許多國(guó)內(nèi)公司甚至針對(duì)不同地區(qū)的方言推出了不同識(shí)別模式。然而這些年過去,語音識(shí)別系統(tǒng)雖然進(jìn)步頗多,但仍有些“硬傷”仍然存在。
一是語音交互的穩(wěn)定性,當(dāng)你在進(jìn)行語音交互時(shí),設(shè)備時(shí)而能控制、時(shí)而不能控制,或有時(shí)反應(yīng)快有時(shí)反應(yīng)慢,這樣就不利于養(yǎng)成用戶使用語音交互的習(xí)慣,甚至體驗(yàn)感很差;第二個(gè)在語音交互得到一定普及之后,馬上會(huì)面臨的問題——設(shè)備的通用性。目前做語音識(shí)別和處理設(shè)備平臺(tái)的很多,如果我們買的智能空調(diào)是跟A企業(yè)合作的,而B企業(yè)的音箱或語音交互平臺(tái)不能兼容這款智能空調(diào),這對(duì)消費(fèi)者來說,將無法隨心所欲的選購(gòu)心儀的智能產(chǎn)品。
安全性為重要考量
影響語音控制類智能家電進(jìn)入家庭或其他應(yīng)用領(lǐng)域的原因還很多,包括使用者的習(xí)慣是否被建立、是否提供更多“控制”功能以外的附加價(jià)值、是否有更“特別”的應(yīng)用出現(xiàn),以及安全性問題。其中,安全性可說是消費(fèi)者最為關(guān)注的部分。
語音控制因?yàn)闋可娴骄W(wǎng)路傳輸,勢(shì)必會(huì)引發(fā)消費(fèi)者對(duì)其安全性的疑慮。不過現(xiàn)在各傳輸技術(shù)都有其獨(dú)特的加解密方式,消費(fèi)者不必過分擔(dān)心。更何況,駭客會(huì)選擇對(duì)其“有用”的內(nèi)容,做入侵、擷取或破解的動(dòng)作,一般的家電控制命令語音,對(duì)駭客的吸引力可能相對(duì)較低。但令人擔(dān)憂的不僅是駭客,智能音箱能否忽略錯(cuò)誤的指令,或是識(shí)別正確的說話者,如小朋友惡作劇亂下指令、小偷用語音開啟家中門鎖等狀況,也是讓使用者相當(dāng)擔(dān)憂的安全性問題。如何解決這個(gè)問題?語音控制結(jié)合聲紋辨識(shí)或許是個(gè)辦法,加入聲紋辨識(shí)不但可提高安全度,也可以讓產(chǎn)品制造商推出更“個(gè)性化”的專屬產(chǎn)品,因此可預(yù)期未來市面上也會(huì)出現(xiàn)加入聲紋辨識(shí)技術(shù)的語音控制產(chǎn)品。
未來路更長(zhǎng)遠(yuǎn)
未來智能家庭語音控制會(huì)如何變化?殺手級(jí)應(yīng)用又會(huì)出現(xiàn)在哪里?業(yè)內(nèi)普遍認(rèn)為,語音控制若不只是被動(dòng)的收音、下指令,而能轉(zhuǎn)變?yōu)殡p向的溝通,并可提供更多資訊,例如針對(duì)天氣給予使用者穿衣服的建議、提供食譜等?;蛘卟幌抻趩我坏闹悄芤粝洌欠稚⒂诙鄠€(gè)裝置,進(jìn)一步解決控制命令無法“翻墻”傳輸?shù)搅硪粋€(gè)房間的問題,這樣將可更提高使用者的使用意愿。其次目前語音控制應(yīng)用的大宗在手機(jī)上的就是看天氣、行事歷、打電話與播放音樂,而在手機(jī)以外的裝置上,幾乎還是以音箱控制為大宗。差異化產(chǎn)品的出現(xiàn)可能會(huì)使語音識(shí)別類家電更易推廣。
另外,語音控制在居家照護(hù)、聽聲辨位等方面也可望有更大的發(fā)揮空間;BMW就宣布將在2018年車款加裝語音助手,協(xié)助駕駛應(yīng)付更多行車狀況,讓駕駛員開車時(shí)不再手忙腳亂。其次智能家電在語音控制之外,結(jié)合視覺的應(yīng)用,將有更多發(fā)展空間,如門鈴結(jié)合語音與人臉辨識(shí),可提供多重的安全保障,有望提高消費(fèi)者接受度。
結(jié)語:隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,尤其是移動(dòng)終端的小型化、多樣化變化趨勢(shì),語音識(shí)別成為區(qū)別于鍵盤、觸屏的人機(jī)交互手段之一。隨著語音識(shí)別算法模型、自適應(yīng)性的加強(qiáng),相信在未來很長(zhǎng)一段時(shí)間內(nèi),語音識(shí)別系統(tǒng)與智能家電的結(jié)合應(yīng)用將更加廣泛與深入,更多豐富的移動(dòng)終端語音識(shí)別產(chǎn)品將普及入人們的日常生活。