更「主動」和「乖巧」的 Siri,能成為語音交互的最新發動機么?
摘要:在我們都以為作為語音助手的 Siri 正被亞馬遜和谷歌遠遠地甩在身後時,蘋果卻已經對 Siri 有了更深遠的思考。
被詬病「不好用」的 Siri,曾一度因為 HomePod 的發布迎來更加糟糕的風評。
作為「智能音箱」,HomePod 的音質收穫了幾乎所有人的一致讚美,但代表其「智能」這部分的 Siri 卻表現欠佳。在亞馬遜 和 Google 兩家巨頭將智能語音助手之爭演變成軍備競賽的這兩年里,Siri 始終沒有什麼存在感。相比 Alexa 和 Google Assistant,Siri 常常被用戶吐槽「聽不懂,做不到」,整體的指令識別成功率偏低。同時,Siri 的第三方開發的生態也不如 Alexa 和 Google 那麼豐富,用戶也很難通過向 Siri 下達指令來獲取第三方服務。
但這一次,蘋果不想再讓用戶久等。就在各種批評聲音還未散去之時,蘋果在 WWDC 18 上針對 Siri 交出了一份答卷。蘋果為 Siri 體系帶來了一個全新的自動化工具:Shortcuts,這相當於給 Siri 配上了一台全新的發動機。Shortcuts 讓用戶可以將指令和動作依照自己的需求綁定起來,也讓 Siri 可以更細緻地獲知用戶的需求,並且主動給出推薦。通過 Shortcuts,蘋果希望讓 Siri 能聽懂用戶的指令,接入到儘可能多的服務,最終融入豐富廣闊的 iOS 開發生態。
在 Siri 和第三方 App 間搭起一座橋
這並不是蘋果第一次為 Siri 的開放費盡心思。
在 2016 年的 WWDC 上,蘋果就發布了 SiriKit。這是蘋果第一次將 Siri 開放給第三方開發者,希望用戶可以藉助 Siri 訪問更多第三方服務。開發者可以基於自己的 App 功能定義指令,然後蘋果會將這些指令集成到 Siri 里,當用戶發出的語音指令中包含正確的觸發詞時,App 內的功能就會被觸發。
但這個功能一直存在著一個隱患。自然語言里的關鍵詞極為有限,如果少數的重要關鍵詞比如「叫車」、「訂餐」被少數的開發者所把控,這是會比「域名爭奪」更可怕的一件事。因此,蘋果在此事上一直保持著謹慎的態度。針對 SiriKit,蘋果最初僅僅開放了包括簡訊和通話在內的 6 類服務,允許開發者接入。雖然蘋果後續又陸續開放了一些服務,但真正得以接入 SiriKit 的 App 數量少得可憐。另一方面,即便是接入了 SiriKit 的 App,也因為開發者定義的指令不能廣泛契合大多數用戶發出語音指令的方式,很難讓用戶流暢使用。
不過,蘋果並沒有放棄這方面的努力,並且在仔細思考,如何在 Siri 開放的過程中利用好自身優勢。去年 3 月,蘋果宣布收購 Workflow。基於泛化的網址系統(包括一切 url 和 url scheme)。這個 iOS 上的著名自動化 App 可以讓用戶可以將不同的指令、動作串聯起來,編寫自動化操作。
在被蘋果收購之後,iOS 商店裡 Workflow 的價格從之前的 18 - 45 元人民幣變為免費,整個開發團隊也得以加入蘋果。當時外界普遍認為,蘋果是希望基於 Workflow 來為 iOS 打造一款類似 macOS 上 Automator 的生產力工具。但蘋果顯然著更深層次思考,在收購 Workflow 之後,蘋果將整個團隊整合進了 Siri 團隊,在過去的一年多時間裡,基於 Workflow,這個新融合的團隊開發出了 Shortcuts。
在智能鑰匙扣的 App 里,讓鑰匙扣響鈴就變成了一個 Intention。
脫胎於 Workflow 的 Shortcuts 在「第三方服務接入」這件事上獲得了一個質的飛躍。任何開發者都可以在自己的 App 內定義一些名為「Intention」的動作:比如用戶用星巴克 App 點咖啡,星巴克的開發團隊就可以將「點咖啡」這個動作定義為一個 Intention。而這些 Intention 最終都可以被用戶手動加入到 Siri。App 開發者也不再需要去思考「用戶會說什麼關鍵詞來觸發我的服務」,而是只需要將用戶在自家 App 上進行的動作總結、精鍊出來,接入到 Shortcuts 就行了。
Shortcuts 使任何 iOS 開發者都可以輕鬆地將自己的 App 接入 Siri,滿足用戶的需求。它相當於一座橋樑,將豐富而廣闊的 iOS 應用生態,和不夠完善的 Siri 進行了一種連接。
當 Alexa 和 Google Assistant 正各自試圖將自家的語音助手打造成一個獨立的平台、並拉攏新開發者時,蘋果正試圖利用 iOS 本身的優勢來完成一次超越。
Siri 的主動推薦有了更豐富的細節
2016 年,隨著 iOS 9 的問世,蘋果推出了「Proactive Siri」(Siri 主動推薦)功能。蘋果希望 Siri 不僅僅是一個被動接受並執行指令的「語音助手」,而是想讓它成為一個能主動預測用戶需求的智能私人助手。藉由 Siri 主動推薦功能,用戶在特定的地點和時間,會在多任務界面看到推薦打開的 App;連上車載藍牙之後 iPhone 會自動給出回家的路線規劃和行程預測;Siri 會自動識別規律性日曆項發生的地點,提前預測路況,提醒你該出發了;插上耳機之後 iPhone 會自動推薦打開你常用的音樂或視頻 App……
但就過去兩年,就在 Google Assistant 和 Alexa 高歌猛進時,Siri 的主動推薦功能並沒有成為 iOS 下的「殺手級功能」,甚至都不怎麼為人所知。背後的一個重要原因是,其針對第三方 App 的支持僅僅只能停留在「推薦用戶打開 App」這樣一個很淺的層面上,它既無法從 App 中獲取到更深層次的信息,也無法一步深入到 App 內的某個行為上。其中真正有意義的深度推薦都是基於蘋果自家 App 的,這就大大限制了 Siri 主動推薦的發揮空間。
現在,蘋果希望 Shortcuts 的出現徹底改變這個困境。
Siri 會自動分析你的需求給出動作推薦
在 Shortcuts 中,由開發者定義的「Intention」將會被整體接入到 Siri 主動推薦中。開發者可以定義這個動作的關鍵參考要素,比如時間、地點…… 這樣 iOS 就會在後台對用戶進行這些動作時的關鍵參考要素進行觀察,比如用戶每天早上都會用某個 App 點咖啡,那麼 Siri 就會以通知的形式在早上主動推薦用戶執行這個動作,用戶只需要在鎖屏界面點擊一下,App 就會接到指令,自動幫忙點好咖啡。同時,這些 Shortcuts 也會在 Apple Watch 的 Siri 錶盤上顯示,並可以在智能手錶上執行。
這套機制讓 Siri 可以更精細地洞察用戶的需求,提供更多方便的快捷方式。更「貼心」的一點是,蘋果在進行這一系列創新時,已經自覺站在了用戶那邊,它周全的考慮了用戶隱私的問題:這些和用戶需求相關的數據收集和處理全部都由 iOS 在本地執行,開發者並不能獲取到詳細的用戶行為數據。
讓用戶自己來訓練和教導 Siri
除了自動推薦,蘋果當然也沒忘了 Siri 最初的起點——語音控制。
在 iOS 12 之前,人們對 Siri 最大的不滿,並非在於 Siri 聽不懂他們在說什麼——事實上,Siri 大部分時候都能夠將聲音比較準確地轉換為文字。但將不同用戶心中各不相同的自然語言習慣轉換成正確的命令,才是 Siri 一直沒有跨越的門檻。
在 Twitter 上,著名科技評論人莫博士曾經毫不留情的吐槽過 Siri 理解指令的能力:在控制播放音樂時,用戶必須按照標準的句式,準確地說出歌名、專輯名、歌手名,Siri 才能正確地理解你想聽的是什麼,否則就很容易表現成「人工智障」。
自然語言處理是計算機領域幾十年來的難題,也是智能語音助手想要真正進入更複雜場景時必須跨越的巨大障礙。現在,蘋果在這件事上做出了一個關鍵選擇。它不再完全讓 iOS 團隊或第三方 app 開發者來決定 Siri 對自然語言的理解,而是把訓練和教導 Siri「聽話」的權利交給用戶。
也就是說,用戶現在可以將各種 app 的動作編寫成 Shortcuts,然後自己設置一個觸發詞來執行 Shortcuts。一個典型的場景是,用戶可以將「打開家裡的空調」、「向家人發一條簡訊告知自己晚上回來吃飯」、「叫一輛回家的 Uber」三件事連在一起編寫成一個 Shortcut,將 Siri 關鍵詞設置成「下班回家」,在晚上離開辦公室前,對 Siri 說一句「下班回家」,Siri 就會自動完成開空調,發簡訊以及叫 Uber 三個動作。
我們使用手機的方式是很複雜的,即使業界高喊著 voice-first,語音交互真正能接管的,還是很少的一部分場景。而 Shortcuts 要做的,就是把那些具有一定複雜性但有規律可循的任務,讓用戶去自定義設置程序並教給 Siri。進而把一個非常複雜的流程變成一句語音指令就可以搞定的事。用戶不再需要去「不斷嘗試」什麼樣的指令是 Siri 能聽懂的,而是可以像做一個 Workflow 一樣把很多不同的動作變成一種「一觸即發」的體驗。
這種機制讓 Shortcuts 可以在 Apple Watch 和 HomePod 上被輕鬆觸發,Apple Watch 和 HomePod 會將執行 Shortcuts 的指令發送到 iPhone。同時也讓多語言的 Siri 變得有可能。對於中國用戶來說,需要用到多語言的情況還是挺常見的,而通過 Shortcuts,類似「用中文 Siri 無法控制播放英文歌曲」的問題都可以通過自己設定 Shortcuts 來解決,你可以用中文指令去控制播放英文的歌單、播客,也可以用英文指令去觸發中文 App 里的訂餐、打車以及發簡訊。
在我們都以為作為「語音助手」的 Siri 正被亞馬遜和谷歌遠遠地甩在身後時,蘋果卻已經對 Siri 有了更深遠的思考。很顯然,蘋果正希望 Siri 超越語音助手的定位,成為一個能夠聽懂指令,且能夠主動理解用戶需求的「綜合性 AI 助手」。只不過,想要達成這個目標很困難,在過去的幾年裡,蘋果的嘗試沒有取得太多成功。
而 Shortcuts 的問世,讓開發者和用戶被放到了各自合適的位置上,將一個遠大卻有點虛無縹緲的目標,轉化成了一種更實際的應用機制。它讓更多的第三方服務有機會輕鬆接入 Siri,也讓 Siri 能夠調用 App 內更深層次的動作,並且讓用戶能夠主動控制這件事。
擁有這樣一個全新的發動機後,Siri 需要達成的目標不再「神奇」,已經開始變得更加「實際」。這或許是我們在 iOS 12 中看到的最令人興奮的更新之一。 ■


※雷軍 2011 年訪談實錄,在這裡聽懂他做小米的初心
※玩完這個遊戲,我整個人都「方」了
TAG:極客公園 |