當前位置:
首頁 > 最新 > 打開天窗說亮話

打開天窗說亮話

GIF

情不知所起一「網」而

汽車圈子最初對擁抱互聯網頗為踟躕。就像未過門的媳婦,心裡清楚遲早要嫁給互聯網,既欣喜於未來夫家的米,又惶恐於嚴厲的公婆。特別是在那些自我經營許久,家境殷實的巨頭們,對巨大的流量紅利眼饞不已,又對需要信徒版的互聯網改造心生忌憚。可世間事大抵如此,得與失,不能拘於眼前,塞翁失馬,焉知非福。

確認過眼神,遇到對的人

2013年,上汽與阿里打響了第一槍,可以把這個事件定義為起點,有詩為證,金風玉露一相逢,便勝卻人間無數。(秦大人應該不會告侵權吧)

從5年後的今天往回看,對於上汽來說,這一舉動無疑是遵義會議般的轉折意義的節點。

2016年,「結婚」三年第一款孩子——榮威RX5面世,迅速在SUV這個市場搶佔了互聯網概念的先發優勢。

接下來就是各路互聯網汽車叢生,演變到現在人人追捧的智能網聯汽車。

一輛車就像一個男人,丰神俊朗也好,平平無奇也罷,其實更多地看的還是氣質,腹有詩書氣自華,沒人會在意蘇軾是不是油頭粉面。

GIF

車的里子變了,就搖身成了互聯網汽車,那到底增加了什麼屬性呢?

在這之前,汽車有兩個屬性——駕駛與運載。加上了智能與網聯這兩個個性鮮明又有著時代氣息的詞之後,我們就很容易推演,所謂智能網聯汽車,大抵就是智能駕駛和網聯新終端。事實也正是如此。

車聯上了網,人與車的交互與體驗會有哪些質的改變呢?

先看看兩段對話(閱讀完不用做題,請放心)

第一幕:

老婆,你悶不悶?

不悶啊,怎麼啦?

熱不熱?

還行吧

那我打開天窗吧!

隨你……

你好,斑馬

打開天窗!

第二幕:

爸,您戒煙了?

沒呢?我看你新車,憋著呢!

你抽吧,沒事

好吧…….

你好,斑馬!

打開天窗!

GIF

這是小編在提車之後興奮期的表現,像是孩子在炫自己心愛的玩具的情形,頗有些為賦新詞強說愁的趕腳。其實,從一開始,「你好,斑馬,打開天窗」。這句給上汽帶來經典印記的語句就把我征服。

語音控制應用於汽車,究竟是怎麼實現的?

整個過程分為5步,容小編娓娓道來——

1

第一步,喚醒

功耗限制,不可能讓車機24小時處於激活狀態。

開啟語音交互第一步,就是讓處於休眠狀態下的設備直接進入到等待指令狀態。

如同我們在手機上說「hello,siri」一樣,我們需要設定固定的短語喚醒詞,一般四字合適,這樣設置的原因是太長顯得繁瑣,太短容易誤觸發。諸如「你好,斑馬」、「小度小度」此類。

目前針對固定喚醒詞的識別方式,有基於DNN(深度神經網路)進行端到端的喚醒詞建模,這種方法取得了非常低的誤喚醒率。

面向車機直接說出預設的喚醒詞,就能激活車機的識別引擎,從而真正實現全程無觸控的語音交互。

2

第二步,本地解析&上傳

車機處於接受命令狀態,你說的話被車機接受為語音信號,車機本地端的語音模塊會先進行解析,但車機端是嵌入式指令,好處是對簡要指令能夠快速響應,但對複雜語音指令識別不好。因此,除非在離線狀態,一般情況語音信號都會同時上傳TSP(服務端),這是因為受限於車機端計算能力,無法布置更精細的語音識別引擎,這部分通常布置在雲端。

3

第三步,雲端分析

語音識別的過程如下:語音信號經過前端信號處理、端點檢測等處理後,逐幀提取語音特徵,傳統的特徵類型包括MFCC、PLP、FBANK等特徵,提取好的特徵送至解碼器,在聲學模型、語言模型以及發音詞典的共同指導下,找到最為匹配的詞序列作為識別結果輸出。

隨著深度學習的興起,使用了接近30年的語音識別聲學模型HMM(隱馬爾科夫模型)逐漸被DNN(泛指深度神經網路)所替代,模型精度也有了突飛猛進的變化。

聲學建模和語言建模部分是最關鍵的一環,雲端可以構建更加精細的聲學模型和語音模型,用於處理複雜的語音指令,所以雲端識別的結果是要優於本地端的。正因為如此,所以當我們說「我要看星星」,「有點悶」這些語句時,我們依然實現「打開天窗」同樣的效果,前提是車機信號暢通。

4

第四步,回傳本地

雲端將識別的結果回傳本地端,車機基於正則表達式檢索本地指令庫,匹配相應的指令。

【正則表達式通常被用來檢索、替換那些符合某個模式(規則)的文本】

5

第五部,執行

車機發送打開天窗指令上傳CAN匯流排上,再傳遞給BCM(車身控制模塊)完成天窗的開啟。

【CAN(Controller Area Network)即控制器區域網,是一種能夠實現分散式實時控制的串列通信網路。目前在汽車上使用的高速網路系統採用的都是基於CAN匯流排的標準。】

【BCM(車身控制模塊)分為分散式和集中式,是汽車的控制模塊,能夠實現電動門窗控制、中控門鎖控制、遙控防盜、燈光系統控制等等,其功能在不斷擴充。】

「打開天窗」這個功能大致的過程基本如此。當然,在語音識別當中,還有沒有提到的各種技術,比如,麥克風陣列(遠場語音識別)、播放狀態打斷、喚醒目標檢測(判斷是誰在髮指令)、分詞、自適應學習個性化識別、方言識別等等。各位看官,如有興趣,可自行查閱。

打開天窗說亮話,一方面說的是實現過程和技術概述,另一方面是想表達好的技術如何結合汽車場景落地為有競爭力的創新產品,而後者才是本文更多的用心。提升用戶體驗,創新用戶交互的產品絕不是無根之水,空中樓閣,而是好的創意與好的技術完美地對接的產物,兩者相輔相成、缺一不可。

正如榮威RX8上搭載的征服者功能,憑藉RX8強大的硬體技術實力,提供6種駕駛模式選擇與相應狀態顯示,並整合有胎壓、胎溫、車外溫度、海報與指南針等參數的實時顯示。

這就是很好的詮釋。

長按識別下方的二維碼關注我們

獲取更多有趣、有料的ICAC資訊

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 上汽智行 的精彩文章:

TAG:上汽智行 |