當前位置:
首頁 > 最新 > 阿里為什麼要做一款語音交互的人工智慧音箱?

阿里為什麼要做一款語音交互的人工智慧音箱?

「我們不想把它停留在實驗室。AI應該是具體的產品和服務。」

作者 王付嬌

7月5日,阿里巴巴第一款人工智慧音箱:天貓精靈X1正式落地。

此前界面新聞報道過這款人工智慧音箱的定價、基本硬體參數。阿里人工智慧實驗室負責人陳麗娟告訴界面新聞記者,這款音箱除了市場上常見的內容播出、提醒設置、鬧鐘天氣等,它在購物場景上更會領先行業均值。比如,179.99美元的亞馬遜Echo在購物上還是停留在以加入購物車為主,而阿里的這款「天貓精靈X1」音箱已經能夠完成從回溯購買記錄、挑選下單到最後支付的整個過程。這主要得益於其搭載了內置第一代中文人機交流系統AliGenie。這是阿里第一次正式發布智能音箱產品和中文人機交流系統。這款音箱的誕生也代表阿里對語音交互的重視,體現了其試圖搶佔物聯網入口的企圖。

淘寶上的商品成千上萬,一款語音交互產品如何能挑選出消費者想要的商品?陳麗娟表示,該款產品擁有「決策力」,它會學習消費者的購物習慣、了解用戶畫像,然後再進行興趣推薦。阿里在電商領域長期積累起來的技術優勢可以直接用在語音交互場景下。

中美的居家環境有很大差異,所以直接將亞馬遜的Echo、蘋果的HomePod搬到中國市場來可能並不是很接地氣。美國人使用智能音箱頻率最高的場景是在廚房,做菜時需要訂一個倒計時等。到了國內市場,智能硬體設備千差萬別、中國用戶更需要一個助手級的、對中文語音交互友好的「全能產品」。

語音交互拆解來看,可以分成語音識別、語音合成和自然語言處理等,每一個大塊又可以分成更細節的處理步驟。而國內做語音行業的公司,多半停留在語音輸入法(如科大訊飛),或語音搜索。真正能將語音交互商用的仍十分有限。除了產品層面,自然語音處理技術(NLP)仍是人工智慧行業最有挑戰的部分。

阿里正是看中了這樣的市場機會和行業風口。

阿里人工智慧實驗室負責人陳麗娟是淘寶最早的一批產品經理。按照阿里慣常的方法,這款人工智慧音箱也是採用了「淘寶模式」,即對開發者足夠友好,開放API介面,接入各種智能設備和軟體App。這與蘋果的HomePod完全不同,蘋果公司為了安全考慮,要求所有接入Homekit平台的設備都要裝入特殊的MFi晶元,這無意間抬高了硬體創業公司接入蘋果設備的成本。

據界面新聞記者了解,阿里大生態環境的支持將成為這款音箱最核心的優勢。在軟體層面,阿里音箱有阿里文娛體系下內容的支持,比如優酷的視頻內容轉錄;目前第三方App在陸續適配,例如健身軟體Keep和喜馬拉雅FM等。在硬體上,有阿里智能IoE的接入,目前正在談得包括古北科技、塗鴉科技等;品類總量在100家以上。阿里大生態環境的支持將成為這款音箱最核心的優勢。

阿里鼓勵用戶建立自己的「語音公眾號」,這部分更針對個人。在輔助的App里,用戶可以錄入自己的音頻文件,直接在後台播放,未來還可能嘗試付費模式。鼓勵用戶充分建立自己的語音信息,運用到具體的場景里。

雖然這款產品的名字是掛在「天貓」下面的,但足夠可以看出阿里對於語音交互的重視。在這場幾乎所有互聯網公司都已經入場的技術大戰中,阿里不希望落後。

在阿里巴巴技術團隊中,流傳著這樣一句話:「阿里巴巴的商業掩蓋了技術光芒。」不論正確與否,至少這代表了阿里的技術自信。

阿里巴巴的語音識別技術早就存在,只是一直沒有對外公布。最早的應用在客服體系中,因為客服是接觸語音最多的部門,客戶每天會打電話進來,在客服的質檢抽查中,人工質檢效率低下,就需要語音技術識別、轉化成文字版本,這是語音技術的第一個應用場景。

在天貓淘寶App中,都已經嵌入了語音搜索功能,神馬搜索中也使用到了語音搜索技術。雖然識別的準確率有待提高,但這些都表明,阿里的語音交互產品是多年積累下來的技術,可以用在各個產品和場景中。

在接受採訪時,陳麗娟強調,阿里巴巴所採用的供應商思必馳只是用了它六個麥克風陣列的架構設計,語音交互是阿里的核心技術之一。在語料的搜集上,都是使用阿里生態各產品中的語料,淘寶有4.5億的月活,其中如果只有1%的使用語音搜索,其可訓練語料都非常可觀;也有一些語料採用了眾包購買的方式。

未來,除了這款音箱,語音交互可能更多用於阿里生態中的購物充值、汽車操作系統、TTS語音轉換(Text to Speech)等場景中。

在天貓精靈X1發布的同一天,百度也公布了基於自然語言處理的DuerOS語音系統,這與阿里巴巴的語音交互系統Ali Genie形成正面競爭。

在評價競爭對手時,陳麗娟說,「今天我們的天貓精靈大家手上就能拿得到,上手可用。但是DuerOS這個東西大家買過嗎?它的差距不光只是說技術層面的,我們要把這個路都跑通,成功了才會有更多這樣的合作夥伴跟我們一起玩。」

這話更直白一點,意思就是,儘管李彥宏已經坐著有人駕駛的「無人駕駛汽車」在五環上上路,DuerOS距離完全可商用產品的面市還有一段時間。

阿里智能音箱是阿里巴巴人工智慧實驗室出手的第一台商用產品,是語音交互能力的集中體現。

在最開始,阿里並沒有想做一款語音硬體產品,因為硬體產品供應鏈長。但後來團隊發現一款智能音箱涉及的關鍵環節太多,阿里放棄了完全代工的模式,轉而自主研發。整個研發周期前後跨度一年,最大的難點就在於每條鏈路都是單線的。

比如,麥克風陣列裡面需要密封,第一版產品密封性不好,稍微漏氣就會影響到ASR(自動語音識別),ASR不準確會進一步影響到NLP(自然語言處理),進而影響到全局,是一個線性增長放大的蝴蝶效應。

從2017年開始,阿里巴巴正在不斷加強對人工智慧的人力投入,挖來前南洋理工大學終身教授王剛,還找來亞馬遜資深主任科學家(Senior Principal Scientist)任小楓擔任人工智慧團隊iDST的副院長和首席科學家等。

從組織架構上,阿里的人工智慧實驗室組織劃分也更加明確。2013年前後成立的iDST是AI基礎技術研究機構,也是2016年成立的人工智慧實驗室(AI Labs)的前身,其研究成果來源於iDST的技術積累,並應用於阿里巴巴的各個產品線。

在大框架上,實驗室內部分為終端實驗室、硬體實驗室、代碼實驗室,並不是完全按照產品線劃分。以人工智慧領域很重要的計算能力來講,在不同實驗室里,計算能力又分為在雲端計算和在終端上的計算能力。

AI實驗室看起來更應該從事底層技術研究,阿里巴巴也沒有太多硬體傳統,更多定位於一家大數據驅動的公司。在解釋阿里為什麼會做硬體時,陳麗娟這樣表述:「我們不想把它停留在實驗室。AI應該是具體的服務,應該給用戶帶來新的體驗。哪怕淘寶第一版購物體驗很差,但相比於線下購物,仍然能給用戶帶來不一樣的感覺。今天AI應該是技術產品還是產品技術,這是一個問題。」

· END ·

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 界面 的精彩文章:

無人零售店來了:家電經銷商的老套路快點拋棄
印度醫院潛規則觸目驚心 拉一個病人回扣高達60%
會做菜的男人超級帥,花臂大叔教你做經典美食
想減肥,快滾去睡覺
美國服裝設計師是如何打破法國設計師的壟斷地位的?

TAG:界面 |

您可能感興趣

除了智能音箱 語音技術到底還有什麼用?
手機語音助手與智能音箱功能衝突?有了語音助手還要智能音箱嗎?
教智能音箱學一門新語言為什麼這麼難?
沒想到,小米小愛音箱有的智能語音交互,這款骨傳導耳機居然也有
教智能音箱學一門新語言,為什麼這麼難?
蘋果的智能音箱為什麼干不過別人?
智能音箱、隨身翻譯、陪護機器人,那麼多「人工智慧」,誰才靠譜?
怎麼選一款適合自己的智能音箱
智能音箱怎麼選,比普通音箱好在哪?
「老炮」馮小剛也搞人工智慧了:這次他要聯手馬化騰發力智能音箱
SU顏相薦|感受音樂的內涵!您需要一套聆聽黑膠的書架音箱系統
連李彥宏小女兒都愛用,這款帶屏智能音箱有什麼魔力?
小米生態鏈副總裁邀你一起聊:做智能音箱,人工智慧和內容誰為王?
海爾AWE將發布多款智能音箱 打開智慧家庭語音交互入口
華為AI音箱體驗記,教你如何選擇一款好用的智能音箱
四大智能音箱語音助手測試 誰最聰明?
買蘋果智能音箱的都是什麼心態?
語音交互之後,谷歌為他們的智能音箱加上了一塊屏幕
亞馬遜和阿里巴巴都看錯了:智能音箱用戶不喜歡語音購物
這款「嘻哈風」的藍牙音箱,會是你的菜嗎?