當前位置:
首頁 > 科技 > 圖靈測試在評估對話式 AI 方面毫無價值!

圖靈測試在評估對話式 AI 方面毫無價值!

作者:Puneet Mehta是msg.ai的創始人兼首席執行官,msg.ai是面向營銷、商業和客戶服務的對話式AI平台。

圖片來源:iStock/BahadirTanriover

AI正成為新的用戶界面。從自動駕駛汽車和亞馬遜Alexa到機器人顧問和面部識別鎖,消費者正以前所未有的方式與AI進行互動。而這僅僅是個開始。

長期以來,AI愛好者使用圖靈測試(Turingtest)作為開發對話式機器人的指南。1950年開發出來的圖靈測試側重於可信度,分析機器的行為與人類無法區別的能力;研究人員歷來認為通過圖靈測試就是AI的終極目標。然而,這個基準測試是在AI不常見的時代搞出來的,那時候各團隊研製機器的目的是研製克隆人類的機器。

在過去的幾十年,好萊塢在《Her》和《我,機器人》等影片中盡情描繪AI,也試圖複製人類特徵。好萊塢影片展現的場景遠超出了當今商業技術所能達到的水平,但我們仍然似乎以這些虛構的解讀來衡量AI的現代應用。

解決問題,不僅僅是模仿人類

今天,我們介於圖靈測試和好萊塢咄咄逼人的機器人之間。AI在診斷疾病等方面超越人類的能力。這項技術在幕後支持消費者技術市場中一些最先進的應用,我們處於即將實施的階段。

在現代AI的應用中,首要目標是解決問題。複製人類特徵只是精心設計複雜而高效的AI的一個方面,許多人類特徵甚至產生了相反的效果。不過我們仍看到工程師在開發對話式AI響應方面時間延遲之類的機制,以便看起來好像機器人在「思考」,並採用類似策略好讓技術設法通過圖靈測試。

航空工程師當初設計747飛機時,測試了飛機是否可以飛越大西洋,他們沒有試圖製造一隻機械鴿。與之相仿,自動駕駛汽車以一種獨特的方式來學習,其行為與人類駕駛的汽車大不相同。為什麼AI非得遵循人類模式不可呢?

由於對話式AI日益重要,對於我們認為成功的系統、我們認為未滿足今日標準的系統有一種普遍的、實際的認識,這至關重要。AI會犯不同於人類的一系列錯誤,也會以不同的方式從這些錯誤中學習。這意味著我們衡量機器成功的方式要不同於衡量人類成功的方式。

衡量AI成功的新標準

那麼,我們如何為對話式AI的實際應用來更新圖靈測試呢?我們需要擺脫AI讓人覺得多「先進」,而是專註於首要目標:效率。我們應該認為AI在今天我們解決問題方面提供了一種好得多的選擇。隨著我們不斷前進,還需要擴大範圍,涵蓋對於最終用戶有用的所有智能行為。研究人員可以運用以下幾個關鍵績效指標(KPI),更準確地衡量AI的成功。

它如何感知情境:AI並不在真空環境下工作,而是應該可以感知環境。對話式AI能夠越來越多地接觸各種情景信息,有望定製體驗;它們擁有得天獨厚的條件,以人類未必可行的方式來利用這些數據。比如說,作為一名消費者,如果真人客戶服務代表知道我具體在哪裡,我可能反而覺得不適。換成AI,我可能覺得這很酷,如果它為我提供精準的服務就更酷了。

它如何逐漸學習:AI應該從每一次交互中學習。比如說,研究人員應考慮機器人是否根據個人的反應和語氣提供了正確的信息。他們還可能希望更仔細地分析機器無法回答的用戶問題。判斷一個AI好不好,關鍵不是看頭一天的最佳性能,而是看逐漸上升的曲線。

它的綜合性和關聯性多好:迄今為止,大多數「優秀」的對話式AI其實擅長於處理一項任務,這從長遠來看不實用。AI需要連接不同系統以覆蓋整個客戶旅程,好讓客戶在一個地方就能完成所有事情。比如說,零售商AI需要提供個性化的產品推薦、管理客戶關係管理(CRM)系統、執行訂單、提供狀態更新以及管理客戶支持。

它的記憶力有多好:人不應該再次自我介紹。對話式AI要有短期記憶和長期記憶,記住某個人過去喜歡的東西,並採取相應行動。今天當你致電客戶服務、發送電子郵件或走進一家商店時,你是陌生人;你的偏好、過去購買的商品以及關於某品牌的社交評論都是未知的。出色的AI會根據某人在整個對話過程中提供的信息來採取相應行動。

它如何預測需求:AI需要利用預測型演算法,根據歷史情景和當前情況,預測消費者可能需要什麼。AI應分析匯總的數據,從類似情況下導致最積極情緒的信息來確定最佳的行動方案。

它有多靈活:消費者在哪裡,AI就需要在哪裡。好的AI不是只出現在聊天、網站或語音通話等途徑中。區別成功的AI與其他AI的將是跨平台的表現以及在每個接觸點保持同一知識庫的功能。

AI不是人類,人類也不是AI。總會有一些事情是人類更勝一籌的,擁有同理心和解決複雜的首次問題就是幾個典例。只有當AI展示它能夠比人類更快速、更智能地解決問題時,我們才能開始飛越海洋,避開機械鴿的藍圖。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲頭條 的精彩文章:

中興:已提交暫停執行美國禁令申請,夜再長也有盡頭
ZFS on Linux 引發數據丟失,幸好新版本發布神速

TAG:雲頭條 |