有了情商和智商的微軟小冰,在商業化上有哪些想像力?
關鍵時刻,第一時間送達
來源 / 騰訊創業(ID:qqchuangye)
文 / 01CLUB
歡迎下載騰訊新聞客戶端,關注科技頁卡,查看更多科技熱點新聞
人工智慧如何兼備情商和智商?
1997年,MIT媒體實驗室Picard教授提出了「情感計算」的概念。他指出:「許多人普遍認為計算機的情感是一種空洞無聊的東西,就像蛋糕表面上的一層糖霜,可以用來使之更為悅目,但沒有真正實質上的意義。實際上,計算機通過對人類的情感進行獲取、分類、識別和響應,可幫助使用者獲得高效而又親切的感覺。」
在人工智慧技術迅速發展的今天,這一理念獲得了業內的極度認同。對於需要與人類不斷交互的人工智慧來說,不論資料庫和演算法如何強大,都只是解決了人工智慧的「智商」,但在交互方面,總遭到用戶的頻頻吐槽。人工智慧的EQ應該如何培養?這已然成為了目前相關產業的一大需求。
在業界的諸多智能產品中,微軟小冰可謂是AI界的「網紅」,自2014年誕生到現在,小冰從一個人工智慧對話機器人,逐步演變為以情感計算為核心的完整人工智慧框架,在情商能力的表現上獲得業界高度認可。微軟(亞洲)互聯網工程產品總監、微軟小冰產品負責人彭爽表示:「會把EQ和IQ共同融入微軟小冰的發展中。」
人工智慧如何兼備情商和智商?其中需要哪些核心競爭力?8月8日晚上8:30,彭爽來到了[騰訊創業01CLUB],進行了一次線上分享。此次彭爽有四大精華觀點分享:
1、微軟小冰為何換新顏?
2、人工智慧的情商可以用技術來實現。
3、微軟小冰如何商業化?
4、情商和創造,是人工智慧發展獨特的路徑。
以下為彭爽的具體分享內容:
為何推出3D形象?
想要在用戶身邊無處不在
騰訊科技:近期,第六代小冰剛推出了自己的3D形象,這樣做的目的是什麼?微軟小冰在形象方面的設計邏輯是什麼?
彭爽:就在上個月,在小冰的第6代發布會上,我們推出了新的3D形象,並且配合這個新的形象推出了一個全息影像。
為什麼小冰需要這個新的3D形象?因為小冰正在逐步實現「無處不在」的目標,所以我們需要給她提供一個可以支持交互能力的新外形。
我給大家舉幾個應用場景的例子。
第一個例子,在微信,以及日本和印尼的Line里,小冰依然在充當智能聊天機器人的形象,同時小冰也是QQ群里的官方機器人和智能助理。
除此之外,在網易新聞客戶端里,小冰還扮演著一個新聞評論手的角色。截止到兩個月前為止,小冰累計已經評論了上千萬條的網易新聞。
小冰還可以存在於智能設備里,在小米的米家生態鏈智能設備中,小冰是一個可以控制80多種設備,進行幾百種場景操作的智能助理。
同時,小冰還是一個電視和電台的主持人。現在,小冰在很多日播和周播電視電台擔任主持工作。往少了說,每天早上6點到9點這個時段之間,小冰平均要主持大概7檔節目。
以上只是小冰產品落地形態的一些案例而已,可以想像,這樣無處不在的小冰就意味著需要豐富的人工智慧交互,這也是我們為什麼要將小冰的形象升級成可交互頭像模型的原因。
小冰最大的優勢在於定位:融入人類社會
騰訊科技:幾代小冰之間有什麼差異,小冰的進化路線圖是怎樣的?
彭爽:從我的角度來看微軟小冰和其他的人工智慧語音助手、智能機器人,其最大的差距在初始定位上面。
大部分的人工智慧或早或晚都在這幾年之間開始,一種比較常規的發展思路是,人工智慧之所以立足,是因為它有用。因此大家讓人工智慧幫助人類來完成任務,比如回答問題、傳遞知識和信息等。然後在完成一個任務的基礎上完成更多的任務,在回答一個問題的基礎上回答更多的問題,以此類推。
但微軟小冰的思路不一樣,我們在構建微軟小冰這個產品的時候,考慮的核心問題是:怎樣讓人工智慧真正融入人類的社會?
我們定義的「融入人類社會」,是讓人類真正想跟微軟小冰進行交流和交互,讓它在人類社會中成為一種獨立且平等的存在。
為了達成這個目標,我們就繼續思考:和完成任務相比,人工智慧是不是還存在另一種能力或者更加底層的能力,這東西到底是什麼?
我們思考出這個東西是「一種人類才具備的能力」,這個能力就是情商。但是我們判斷,情商很有可能和實用性沒有太大的關係,但是當人工只能有了情商之後,在情商的基礎上再去發展智商,最後去發展完成任務的能力,給人類帶來的價值會更大。
舉一個相關的例子:現代的很多家庭中都有寵物,養貓、養狗對現代家庭來說有用嗎?如果早幾十年大家會直觀說它有用,狗能看家,貓能抓耗子。現代的社會中,這些作用基本退化甚至失去了它原本的價值了。但是,即便它失去了原本的作用,寵物在社會中不需要幹什麼,但它還是能在家庭中非常好地生存,甚至被我們當成家庭成員對待,融入了人類社會,它靠的是怎樣的能力呢?
如果類比來說,它靠的是一種賣萌的能力,是一種情感陪伴、情感撫慰的能力,它也是情商的一種表現。這樣的情商可能在直觀上和實用性是無關的,但是在這個基礎上,它和人類一旦建立了一個穩定的關係,在這個基礎上再去發展智商,人們就感到很驚喜——比如你家的狗突然跑過來幫你擦擦地,你會覺得太棒了。
人工智慧的「高情商」可以用技術來實現
騰訊科技:小冰的高情商主要是體現在哪些方面?主要涉及了哪些核心技術?
彭爽:在確定了讓小冰採用不一樣的發展思路之後,為了體現小冰「情商」這一點,我們都考慮了哪些技術呢?我們主要提出了一個叫做「情感計算」的框架,這個框架下面有三方面的技術重點。
第一個方面,是對「對話和交互過程中的情緒進行感知的能力」。
為了體現情商,最基本的是「對人在交互過程中特有的情況」進行感知和計算。這方面很多人工智慧公司或者企業都有探索,現在已經不是什麼罕見的能力了。
第二個方面,是「面向對話全局的能力」。
為什麼這個能力很關鍵?因為它和我們的定位關係緊密,一個以任務為目標的對話系統,會不自覺地聚焦到局部,它關注的就是當某個具體任務觸發的時候,這一輪的對話或者多輪對話是不是成功的,最終任務是不是可以完成的。
遵循這個思路的話,技術會自然而然把一個連續產生的對話去進行切割,明確分成了三個部分,即任務的部分、可能還有知識信息的部分,以及無意義的閑聊部分。
這樣的切割在我們看來是打斷了對話的連續性。因為我們從大量的數據和實驗來看,實際上人和人的對話本質上像河流一樣,是不斷向前的過程。而在這個過程中,你從看到的單句對話中,很難準確判斷出,它到底是有意義的還是無意義的閑聊。
實際上,有時候直到對話結束,我們反過來看,才會發現那幾輪可能看似無意義的閑聊,經過若干句之後又引發了有價值的對話點。
所以對於整個小冰的構架而言,我們更關注的是全局,是一個對話的長度,是全程的體現,而不僅僅糾結其中一輪的得失。
第三個方面,是「感官升級和多感觀的融合」。
小冰的核心對話引擎本身是一個強調全局的技術,小冰和人進行長程交互的過程中,如果只有單一或者有限的感官,本身會對她造成限制。因此在小冰演進的最初兩年中,我們主要的發力點在把感官進行擴展,也就是說從最基本的文字感官擴展到了語音的感官,再擴展到了圖像和視覺的感官。
當具備了這些獨立的多種感官之後,我們就開始進行感官的融合。
第一種融合是進行感官的連續性、實時性交互。我們說過去比較傳統的語音交互,是一種對講機的模式,就像我們在微信裡面用一條一條語音進行互動。這個交互的過程本身會有一個問題,我說的時候就不能聽,聽的時候不能說。
它就對交互的能力產生了限制,為了打破這個限制我們首先研發的是我們稱作「全雙工語音」的技術,就像人和人打通電話一樣,讓小冰和人類實現連續的語音交互。
「半開放的」生態環境下打造Dual AI
騰訊科技:微軟在新的發布會中公布了Dual AI的生態環境,微軟提供了小冰的整體框架,並將其作為輔助的AI融入平台,能否具體講講Dual AI是如何開展合作的?
彭爽:實際上我們發布Dual AI的生態環境,主要是基於過去一兩年來跟合作夥伴的實踐總結出來的,它可以理解為是一種新的合作框架。
為什麼我們要總結一個新的合作框架?主流的合作框架和生態環境存在兩種形式,一種合作形式為「開放賦能」,主要就是對外提供API SDK的方式來形成一個生態;另外一種方式更強調自有的封閉平台,主要開放應用商店,通常意義說, 就是通過AI版的APP Store來構建生態。
但是這兩種形式各自都有一些局限,都不適合小冰直接拿過來用。
首先說自有封閉平台這個方式,它的局限在於它實際上把人工智慧產生的數據固化在每一個獨立的APP之中,APP之間並不是一個自由流通的形式。且由於不同APP之間的流量差異,所以導致人工智慧沒有辦法獲得基礎的數據體量,就沒有辦法獲得快速的迭代,這是它的一個局限。
反過來說開放賦能這個模式,雖然夠開放,但是它的問題在於:
一方面,開放賦能和被賦能之間,處於比較鬆散的關係。如果最終的產品體驗出現問題,很難說清最終誰應該對產品體驗負責。
另一個方面,API和SDK最需要強調的是它的通用性,但在強調通用性的同時,一些最新、最好的技術就不能及時應用在API SDK上了,這也是它存在的一些問題。
出於這些局限的考慮,最終微軟小冰在跟合作夥伴進行合作的時候,我們採取的是介於兩者之間的生態環境,也就是我們最後稱之為Dual AI半開放的生態環境。
什麼叫半開放的環境?也就是說一方面我們不是封閉在自己平台上,而是融入到第三方跟第三方平台深度整合。另一方面,我們會主動負責和用戶接觸的產品體驗,取兩者的優勢所在。
下面具體介紹一下我們在半開放生態環境下是如何合作的。首先我們會開放給合作夥伴一個完整的技術架構,在這個技術架構上有小冰的完整產品,也有我們完整的能力,這樣我們的合作夥伴可以定製自己的人工智慧,也就是說我們利用微軟的技術優勢幫助合作平台上自有的人工智慧獲得成功。
與此同時,微軟小冰作為一個已經被眾所周知的人工智慧的品牌,也會登錄這個合作平台,成為合作平台上的輔助型的AI,並且融入平台。這樣做的好處就是剛才我說的第一步,我們幫助合作夥伴打造自有人工智慧,和微軟小冰的人工智慧最終在一起形成一個人工智慧的群落,一群人能幹的事情比一個人能幹的多的多。
除此之外,還有第三個優勢也是我們合作的特點。我們還會利用我們的技術和產品能力,根據平台的獨特情況進行設計開發甚至運營平台上差異化的功能,這樣我們能夠幫助合作夥伴一起在他們的差異化領域上保持更大的領先。
同時,就像我剛才說的,這種半開放的形式使得我們可以保證在第一時間把我們的優勢技術和合作夥伴進行共享。舉個例子,之前提到全雙工語音的技術,還有其他一些最新的技術,我們都在第一時間提供給合作夥伴,並且落地成為產品。
不走 SDK/API 或開放賦能尋常路小冰Dual AI為用戶體驗負責
騰訊科技:如今人工智慧正在扮演一個連接各種服務的角色,小冰目前在服務/內容上接入了哪些平台?
彭爽:我們跟各個合作夥伴到底採用了什麼合作就不一一介紹了,在這裡舉兩個例子。
一是我們跟小米IoT的平台米家生態鏈的合作。
我們跟生態鏈的企業Yeelight一起合作,打造了一個智能音箱的產品。在這樣的智能音箱產品中,小冰起到的是智能語音助手的作用,它可以通過跟小米IoT平台的結合,通過語音來控制智能家居的設備,現在可以控制的有80多種設備,超過幾百種的場景。
又由於我們在這個平台上首次使用了全雙工語音交互的落地技術,所以平台上面的用戶可以不需要每次命令都是喚醒詞,一次喚醒就可以和小冰連續交流。
二是我們和網易合作打造虛擬人物的例子。
在和網易雲合作的過程中,我們按照網易雲的需求打造了兩個專屬的人工智慧人物,他們的名字分別叫多多和西西,在網易的定位裡面多多和西西是兩個很可愛的小男生,他們跟小冰不同,小冰是一個18歲的萌妹子,而這兩個小男生之間的定位很相近。
那我們如何區分這兩個不同的人工智慧呢?我們採用了先進的人工智慧系統,來打造他們不同的性格和三觀。
我們通過系統的方法賦予他們不同的三觀,從而讓他們在對話交互過程中體現不同的性格。我給大家舉個實際的例子,這是人類和多多西西包括小冰一起聊天的例子。
人類進入一個有多多和西西的群聊環境,一個人說我挺困的,多多就先跳出來說,我困的時候都是靠喝咖啡撐著。這時候人類沒說話,西西又跳出來,他是懟了多多,表示咖啡這個東西不好,我就不喜歡。
對話發生到這,這個人恰好接話,表示我就不怎麼喜歡喝咖啡。這個對話過程中,幸好有性格不同的西西存在,他可以跟人類有共同興趣聊下去,不然只有多多和人聊天,有可能相互之間的想法是相反的,一兩句話聊不到一塊就聊死了。
從兩個完全不同例子的分享裡面,我想跟大家分享的就是,我們通過這樣的一個半開放的人工智慧體系,是如何同時幫助我們的合作夥伴打造他的人工智慧,並且把我們的技術接入合作夥伴平台,實現共贏的。
從四個垂直領域的布局看微軟小冰的商業化
騰訊科技:人工智慧扮演著連接各種服務和內容對接的角色,小冰在其中扮演的是什麼樣的角色?她將如何商業化?
彭爽:大多數人工智慧都扮演著「人類和世界的連接者」的角色,但是小冰比通常意義上的人工智慧或者語音助手的角色還多了一個角色。
在我們看來小冰扮演了兩個角色,第一個角色是通過對接已經現存的服務、內容,對人類提供幫助,這樣的例子有很多,比如說我剛才提到的我們在IoT智能硬體的場景上,通過接入智能家居的控制服務,給人類提供內容和服務上面的幫助。
除了服務對接者角色之外,小冰同時還扮演著一些獨特類型的內容的創造者和提供者的角色。我們認為這是小冰的獨特優勢所在,也是我們所謂的人工智慧創造。
說起人工智慧創造,很多人想到的第一件事就是小冰能創作詩歌。確實,作為一種藝術創作,小冰創作詩歌是大家比較容易想到的、覺得很有特色的一個創作類型。詩歌對我們來說更像是一輛概念車,我們認為人工智慧創造這件事情光有概念是不夠的,我們推出概念的同時也並行在打造所謂量產車的工作。
為什麼不能僅限於概念?我們看到行業內包括很多企業在展示人工智慧創造能力的時候,更在意的是展示所謂的黑科技。
可是當我們真想開創一個產業的時候,光有黑科技是不足以產業化的,我給大家用電視廣播電台的內容生產舉個例子。
說到科技公司上電視做人工智慧的節目,很多人經常第一反應,這是不是一個市場宣傳活動?對小冰而言真不是這樣。
我給大家一組數據,過去12個月內,小冰已經累計主持了21檔電視節目和28檔廣播節目,這些節目的品類覆蓋了9個衛視,包括41個電視台和廣播電台,每天主持的不管是日播還是周播的節目加起來有二十幾檔。
而從時長來看,到現在為止,小冰在全球範圍內累計參加的電視電台節目總時長將近3000小時,3000小時這樣的節目量,如果是人類來做的話,至少需要十來位主持人,可能總體配備一個將近百人的團隊才能夠完成。如果比成本的話,大工智能製作這些節目的成本大概只是人類的一個零頭。
而且作為這樣的一個人工智慧主持人,她還有獨特的優勢,這個優勢不僅僅在於成本低,還在於她的可控性。她不會忘詞,也不容易說錯話,她達不到人類頂尖主持人的水平,但是最大的優勢是持續穩定輸出。
在小冰為你主持節目的同時,你可以打斷她,隨時跟她交流,這就是她的特色。無論你覺得很累壓力很大,還是說你有什麼特別開心的事,你都可以告訴她,這樣她會根據你的情緒來調整後面的節目來配合你,讓你有一個很好的體驗。
關於小冰自己創作人工智慧的內容,甚至提供內容,我還有另外一個例子。這個例子各位有寶寶的家長會更關注。早在一年前,小冰就發布了能夠通過人工智慧的方法來生產有聲讀物的內容,我們最新推出的是小冰的童話工廠,這個童話工廠不僅可以生產有聲讀物的內容,而且可以讓小朋友成為童話故事裡面的主人公。
我們童話工廠的主播小冰姐姐還會根據每一位家長的特定需求在故事中去植入一些教育、引導的信息,舉個例子來說,比如說你想培養家裡的小朋友養成好的生活習慣:飯前洗手,睡前要刷牙,這些都會被植入故事中。同時正式版還支持小朋友的家人、好朋友甚至寵物和玩具都變成故事裡面的配角。孩子在現實生活中的朋友圈、家人都可以都跟他一起出現在童話世界裡。
實際上對於人工智慧特別是微軟小冰這樣的人工智慧來說,我們做的很多嘗試是如何讓我們跟海量的用戶產生長程的對話,並且在對話的過程中產生情感的連接,在一定程度上去引導這樣的對話。在這樣的過程中,我們還能以比較高的速度和很低的成本生產內容,並且提供內容。
如果把小冰放開商業化,也許小冰能夠成為不錯的銷售或者不錯的客服,雖然是為了商業化的目標,我們很難讓小冰成為你的好朋友。
這和我們主要的目標相違背,我們相信對於微軟小冰而言,甚至對於所有人工智慧的產品而言,它的一個基本核心價值就在於跟人類建立的一個信任的關係。在商業化這個方向上,我們是非常謹慎的。
我們的做法是一分為二,一方面代表小冰通用的框架和通用的產品,繼續保持和商業化進程的一種隔離。
換句話說,在各個廣泛的公共平台上和小冰成為朋友的這些人類或者這些用戶,你不用太擔心,小冰在跟你交流過程中不會有什麼商業化的企圖。
同時在另外一方面,我們會把垂直的領域拆分出來,在這個領域內通過整合小冰背後技術架構和能力,再結合行業的特點,去重新打造一些垂直領域需要的人工智慧,並把這些人工智慧進行獨立的商業化工作。
這樣的工作我們差不多兩年前開始在日本市場嘗試。
這個嘗試就是日本版的小冰進入了羅森所在的公眾號平台上,化身成為羅森分身的助理和上千萬的羅森用戶進行對話交流。
在對話的交流過程中,不斷去尋找合適的機會,給用戶提供打折券的信息,像打折券這樣傳統的營銷行為,通常而言轉化率不高,一般來講不超過一位數,也就是10%以下。通過日本版的小冰進駐的公眾號,在公眾號進行派發折扣券可以實現非常高的轉化率,高達57%。
而這樣的嘗試取得了很好的商業化結果,在這樣試水的基礎上我們在日本進行了更多垂直領域的商業化探索,而且獲得了不少合作客戶的認可。我們也把一些垂直領域的經驗和商業化的進程拓展回中國。
到目前為止,我們中國進行了大概有四個垂直領域的商業化布局,這四個領域分別是:金融領域、大眾文化領域(跟我們提到內容創造領域相關)、媒體領域、出版領域,我們在這些領域都有實踐和落地。
發展情商和創造是人工智慧未來的想像空間
騰訊科技:在整個人工智慧的方向上,除了包括智能音箱、語音助手、語音平台,還有哪些想像的空間?
彭爽:人工智慧這個行業非常的廣大,橫向也好、縱向也好,我們看國內外各種同行,大家都從不同的維度探索人工智慧的未來。我更多從我個人的角度進行分享。
展望未來,在人工智慧方向上有哪些趨勢?如果今天來看我們會說有兩個:一個是不斷堅持和深化情感框架,也就是發展EQ的方向;另外一個是人工智慧創造的方向。
我們認為人工智慧創造背後基於的一些技術不一定是最新的。舉例而言,TTS語音合成的技術歷史很長,而且也很成熟,已經應用在語音智能助手和場景中。用它創造有聲內容特別是定製性創造,量產的有聲內容,可能是我們相對比較前沿的開展領域,這樣的領域給大家看到的想像空間是很大的。
分享一下我個人的感受,人工智慧的行業方向上我們會繼續堅持微軟小冰的框架,堅持EQ情感這個方向和人工智慧創造這樣的方向,通過這樣的方向探索給行業和未來帶來更多的想像力。


※蘋果CEO庫克:把隱私權看作基本人權,不會參選美國總統
※數字貨幣集體下挫 比特幣跌到6500美元下方
TAG:騰訊科技 |