還能怎麼辦?當然是原諒它啊!語音識別用戶如是說
這年頭,什麼都系不帶上智能元素,似乎都賣不出去了,就算再高端的家居互聯繫統,如果不帶語音控制,照樣像段子里如來嘲笑玉皇大帝那樣被嫌棄。語音識別、語音控制對我們大家來說都不算新鮮的東西,但這一功能現在更多的功能還是為了提升產品的逼格,而真正得到使用的少之又少。究其原因,還是不好用。
語音識別功能被廣泛普及 但使用者少之又少
智能生活、智能人機交互的理念在很早之前就被提出,甚至在不少影視作品中都出現了能夠直接通過語音控制的設備、系統,尤其無論使用者在多麼嘈雜的環境中,語音識別系統都能快速、準確的識別使用者的語音。
電影中的人工智慧無論是對話還是講笑話無所不能
那麼,我們現在的語音識別技術發展到了什麼程度?現在確實有非常多的智能設備都使用了語音操控的功能,但是無論是蘋果的Siri還是亞馬遜的Alexa,亦或是各家廠商推出的智能設備,在宣傳自己產品時都宣稱自己的語音識別系統識別率多高,內置了多少種語言,但在用戶使用時,會非常普遍的出現無法識別的問題。並且這一問題出現的範圍非常廣泛,不僅僅只發生在小廠家身上,前段時間一個美國用戶向亞馬遜投訴Alexa系統,原因是Alexa無法識別她母親稍帶口音的英文。
「罪魁禍首」Alexa
為了驗證這個問題,筆者在辦公室里請同事們用方言、外語無限轟炸筆者的蘋果Siri,發現在設定普通話後,Siri完全無法識別各種方言,無論是閩南語、四川話、粵語甚至連與普通話非常相近的北京話也無法有效識別,就更不要提其他語種的語言了。
那麼,為什麼本應該非常好用的語音識別系統變得這麼弱?最主要的原因就是,方言和口音太多了,我們先不說外語語系裡都有多少種方言,就說中國就有多少種方言?如果是與普通話比較相近的方言還好,真遇上如閩南語、紹興話、馬鞍山話之類比較難懂的方言,什麼樣的語音識別系統都沒辦法。
從「倒鴨子」上就能看出口音對語音識別系統的影響
即使語音識別系統想收錄這些方言也不是一件簡單的事兒,畢竟方言種類真的很多,光是大的語言分類就有官話、晉語、湘語、贛語、吳語、閩語、粵語、客語八種,每種大類方言下面又有多種區域性的方言,還有一些因為族群遷移與地方方言結合的變種方言,單從數量上來講,收錄這些語言就是一項非常龐大的工作。但如果硬性要求所有的用戶都說普通話,也是比較不現實的,首先中國普通話多少年了?在北京的街頭上依然能聽到各種各樣的方言。另外,學習普通話,對於年輕人來說可能不是什麼太大的問題,對於年齡稍大一點的用戶來說,重新學習一種新的語言完全不現實。
從用戶使用的角度來說,現有的語音識別系統存在較大的矛盾,年輕人能夠比較快的接受新生事物,對新出現的智能產品、系統能夠以較快的速度接受,語音識別系統對他們來說只是一種讓操作更加快捷或更加節省時間的操作模式。而年齡較大的用戶,他們並不能較快的接受新的智能產品,在操作時會遇到各種各樣的問題(各位想想,父母有沒有在我們回家的時候舉著手機說有什麼功能不會用了,讓我們教他們用),他們會更加希望依賴操作和理解起來都比較簡單的語音操作。但是上邊我們也說過了,這些年齡較大的用戶在學習普通話這件事上同樣困難重重,所以本應非常好用的語音系統對於他們來說同樣不好用。
事實上 真正需要語音識別系統的是年齡較大的用戶
如果單獨是因為口音問題,現在這麼多在研究語音識別系統的公司,如果合作起來,只要資源共享,這應該不是個問題。那麼,制約語音識別發展的最主要原因來了,各家公司語音識別系統的源數據並不共享。語音識別中最重要的就是對語音的採集和分析,這是項工作量非常龐大的內容,如果想要構建支持不同口音的語音識別系統,這一工作量還將呈幾何倍數驟增。所以,即使是對於蘋果或亞馬遜這樣的超大型公司來說,也不可能支持無限語種的採集和分析。因此,各家研究語音識別系統的公司對源數據的保密控制堪稱苛刻,想弄到其他公司的語音源數據也是根本不可能的。
語音採集是一項非常繁複的工作
除去口音問題和源數據不共享的問題,語音識別系統的分析能力和雲計算能力也是嚴重製約語音發展的重要因素。當用戶在使用語音系統時,設備端收集到語音,需要通過識別系統的雲計算能力進行運算和分析。雲計算能力和支持雲計算的硬體、傳輸網路都不是一個非常好解決的問題,需要較長時間的積累不斷完善優化。
或許我們很快就能看到真正智能的語音識別系統
很多人都覺得現在使用的語音識別系統並不好用,完全達不到我們想像中那種能夠僅憑藉語音就能實現所有操作,或者能夠幫我們節約大量時間的程度。更多時候,我們會感覺面對的不適一個智能的語音識別系統,而是家中聽不懂我們在說什麼的寵物或者小孩子,需要我們放慢語氣、用最標準的普通話、一遍一遍的和他們慢慢說。不過別著急,現在的語音識別系統還真就是個孩子,它正在以非常快的速度進步著,相信不久以後,真正好用的語音識別系統就會出現在我們身邊。


※鑫谷十年踐行這一基本原則
※值北京一套房 拍馬拉松要帶這麼多相機鏡頭?
※縱享飯後好時光!這些洗碗機總有一款適合你
TAG:中關村在線 |
※如果這條語音是你愛的人發的,你還會討厭聽嗎?
※這個乾貨一般人我不說:智能語音識別與關鍵詞識別有什麼關係?
※如果我們不熟,請別給我發語音
※絕地好聲音開賽啦!說一說你吃雞用的是哪個語音包吧!
※雷神從什麼時候開始看鋼鐵俠不爽的?還記得那個語音識別助手嗎?
※王菊媽媽語音鼓勵女兒,這恐怕就是不是王菊粉都看哭了的原因!
※經常給你發這些語音的男人,看來他並不打算真心待你,你要明白
※很多手機都有智能語音助手,可你知道背後原理嗎?
※你會在什麼情況下給對方發語音?你又在什麼情況下討厭語音?
※用語音控制的站立桌來了,但我們可能不需要它
※語音 UI 是未來?羅永浩其實沒說錯,但關鍵是時間不對
※《求醫不如求己》語音講解,真正的醫生是自己!收好慢慢聽!
※LOL:女友為打遊戲開語音全然不顧我感受,只想問還能要嗎?
※為什麼你們可以發語音?
※網戀的對象,一直不肯接視頻,只願意語音,這是什麼心理?
※移動跟隨,智能AI,語音對話,攝像頭還能這樣?
※「你為什麼不接我的語音電話?」
※為什麼大部分的語音助手都是女聲?答案你很難想得到
※當語音文本轉換系統也能被黑,Alexa可能聽不懂你說啥了……
※LOL新版劍魔嘲諷語音曝光,佐伊對你做了什麼?你竟如此恨她?