當前位置:
首頁 > 科技 > 教智能音箱學一門新語言,為什麼這麼難?

教智能音箱學一門新語言,為什麼這麼難?

在全球範圍內,智能音箱正在成為越來越多消費者家中的新寵。得益於以小米小愛音箱與阿里的天貓精靈為首的眾多國內智能音箱生產商,幸運的中國用戶們不僅趕上了這一波潮流,還不用面對國外許多科技愛好者們面對的窘境——許多非英語區的用戶還在苦苦等待智能音箱能夠聽懂他們的語言。

聽起來似乎很不可思議。智能音箱能夠控制智能家居、回答問題、安排行程,卻無法理解一門被普遍使用的語言?然而這的確是事實。

上個星期,Google Home 發布了西班牙語的語言包。單就發布新的語言包可能聽起來沒什麼,但在此之前,Google Home 花了將近兩年才讓 Home 學會西班牙語,至於市場份額佔據最大的 Amazon Echo,則至今也未能學會西語,目前它僅僅掌握三門語言:英語、德語與日語。

教智能音箱學一門常用語言,為什麼需要這麼長的時間?

其背後的原因之一在於,語言遠比文字要複雜多變。

居住在不同地區的人口也許使用著同樣的書面文字,但口音上卻天差地別。對於發音特點更加鮮明、使用人數也更少的方言,絕大多數廠商則表示暫時無能為力。因此,對於所有智能音箱廠商而言,培養機器的語義理解能力都是巨大的挑戰。

廠商需要在用戶的使用過程中沉澱大量語音數據,排出優先順序讓音箱學習,進而慢慢理解以前聽不懂的句子。相比之下,直接輸入的文字很容易就能被機器轉化為有意義的信息。正是因為如此,文字翻譯軟體處理起小眾的蘇格蘭高地語也能得心應手,而Google Home用了將近兩年才學會被廣泛使用的西班牙語。

火狐的開放商 Mozilla 的機器學習部門負責人 Kelly Davis 認為,即使聽懂了句子中的每一個單詞,也不意味著機器理解了這門語言。與親密朋友或與泛泛之交打招呼的用詞有什麼區別?某個笑話在某門語言內是否無傷大雅?要讓智能音箱學習一門語言,還需要教它深入地理解語言背後的文化意涵。

另外一個原因,則是智能音箱廠商們出於商業考慮的優先排序。

廠商們優先開發使用人數多、消費能力強的地區的語言包,搶佔更有利潤可挖的市場,這不難理解。但這樣的選擇,也意味著失去眾多以這些不被重視的語言為第一語言的潛在用戶。

仍然以西語為例。

根據維基百科的數據,截至 2017 年,全球將西語作為母語的人口達到 4.77 億人,全球有 23 個國家和地區將西語作為官方語言。在美國,西語是第二廣泛使用的語言,將其作為家庭主要語言的人口達到3550 萬。

由於西班牙及拉美地區足球水平的強勢,西語是全世界球迷中最普及的語言之一。僅僅在美國國內,就有超過 20 個西語的體育頻道或體育網站。然而在 Home 支持西語之前,智能音箱們無法理解用西語提問的哪怕是最簡單的足球問題,也無法與網路上豐富的西語體育資源對接。

為了收回這些前期戰略性放棄的失地,廠商們正在發力迎頭趕上。

Google 計劃在今年內讓 Google Home 支持超過30種語言。Amazon 則在A mazon Echo 中加入了Cleo 功能,鼓勵用戶向語音助手 Alexa 傳授更多語言。

加入更多語言包的意義並不止步於賺取利潤。Davis 表示,有很大一部分小眾語言使用者來自於欠發達地區,他們受教育水平不高,也許甚至不會讀寫。之前的那些電子產品以文字為基礎,且操作較為複雜,使得這一部分人群很難享受到科技發展的便利。以語言為交互方式且易於上手的智能音箱,也許能夠真正走進並改變他們的生活。

總而言之,智能音箱目前還算不上是個語言通,但它能夠聽懂更多語言的未來,還是值得我們期待一下。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 36氪 的精彩文章:

董明珠:明年格力空調全用自研晶元,股票下跌是決心的證明
阿里雲找了一批國際新夥伴,想要擴建生態體系

TAG:36氪 |