沒有屏幕的翻譯機,你真敢用嗎?
什麼樣的科技產品是好的?相信很多人有各種答案,但是其中一個答案相信沒人能反駁:那就是能給你帶來「安全感」的產品……那麼,今天我們將介紹一個黑科技——人工智慧翻譯機的正確打開方式。
實時反饋的背後 無處不在的安全感
相信在日常生活中你經常會遇到類似的場景:當你在餐館點餐完畢之後,有時服務員沒有重複一遍所有菜名來和你確認就下單,這時會有上錯菜的情況;當你帶著耳機唱歌或者說話的時候,通常旁邊的人會覺得有失水準或者聲音很大。這是因為你發出的聲音沒有傳到自己耳朵,失去對聲音的實時反饋,而無法校驗和調整導致的。
這些行為其實都是人們要獲得對於事物行為過程中的實時反饋而帶來的安全感。如果人失去了實時反饋都會變得如此糟糕,那麼,人工智慧翻譯機失去對語音識別的確認的話,會是多麼恐怖的一件事啊。
智能語音翻譯機 離「放心」還有多遠?
判斷科技產品是否好用,其實是考察其「放心」程度。比如在當前非常火爆的人工智慧語音交互領域,語音識別是否準確,用戶說的話能否被準確執行都是考察產品的核心要素。
然而作為溝通藝術的語言本身,是具有多樣性和多義性,在真實地應用場景中還有許多複雜的情況,如環境噪音,用戶的語氣情緒,上下文語境、方言、口語等。那麼在當前語音識別準確率還沒有達到100%的時候,顯然語音識別會出現錯誤的情況。
比如某款翻譯機產品,四川阿姨出國游,找酒店服務員說:「我找不到我的鞋(hái)子了」,翻譯機識別為「我找不到我的孩子了」,如果有屏幕的話,就可以及時的校驗和糾正,免了一場誤會;如果沒有屏幕的話,會直接翻譯為」I can』t find my baby.」,這會讓酒店人員大為驚慌,也許,就開啟了一場人在囧途的旅行。
那麼,用戶如何才能實時發現和修改呢?通過前文的分析,我們可以知道,這需要一個實時回饋糾錯機制來解決。這也是我們是否能夠獲得足夠的安全感和放心的一個關鍵因素所在。
帶屏幕的智能機器 絕不是為了好看
盤點目前中國的人工智慧翻譯機行業,主要有分音塔科技的準兒翻譯機和科大訊飛的曉譯、譯唄翻譯機,二者在中英互譯上準確率不相上下。而準兒翻譯機在實際使用體驗上的準確率則更高,這就得益於分音塔科技行業首推的帶屏幕智能翻譯機。
分音塔科技歷經兩年,進行了4次迭代的智能硬體產品——準兒翻譯機,配置LED觸摸屏可直接校準識別內容(轉化為漢語),可以規避在某些特定場合答非所問出現尷尬的情況;另一方面,還可以通過屏幕有助於加深理解對方的表達。如本來是點餐說「水餃多少錢」,而機器卻識別成了「睡覺多少錢」,結果翻譯成英文的「How much is sleep」,如果有屏幕就可以及時發現並糾正,免得鬧出了笑話。像這種還算是普通的小錯誤,如果重要事情識別錯誤可能會造成更大的麻煩。
分音塔也計劃推出離線翻譯功能。離線識別和離線翻譯的準確率由於數據和運算能力的原因,要遠低於在線識別和翻譯。那麼屏幕就更加重要了。因為識別率越低,出錯的概率就越大。如果離線翻譯沒有屏幕進行校對,鬧笑話的可能性就大大增加了。
除了智能翻譯機,在語音交互其它智能領域也都不同程度佐證了「帶屏」這一現象。
亞馬遜的智能音箱Echo 大賣,第一代和第二代Echo音箱沒有屏幕,Echo雖然擁有上千種功能,但是大部分功能用戶並不會使用,用戶使用亞馬遜Echo的最多功能是鬧鐘、查天氣和播放歌曲三個功能。可最近最新的Echo第三代增加了顯示屏幕,它沒有脫離 Echo 系列語音交互的本質,但卻通過一塊屏幕對前者的缺點進行了有力補充。讓語音交互本身的便利性得以發揮的同時,又能保證信息反饋的直觀性和準確性。
還有,Vinci 近日宣布推出升級版 1.5 版本,一款帶有屏幕的自帶音樂播放功能的智能耳機。顯然,屏幕是 Vinci 語音交互的一種重要補充。
綜上,在人工智慧語音交互現初級階段,屏幕就是針對語音識別部分建立的一個校驗糾錯機制,是現階段人工智慧語音智能產品是否「靠譜「的判斷標準之一。
點擊展開全文


※他是劉強東房東開出549家分店市值700億,造就60名億萬富翁
※劉強東股份降至15.8%,憑什麼牢牢控制京東?股權結構有哪幾種?
※一加5餘熱未盡,一加6配置曝光
※馬雲火的不止有無人超市,「背後護手」辰森世紀同樣值得關注?
※諾基亞高層:在中國,不要說6GB,就是8GB運存也不夠用!
TAG:湯都是個哥哥 |