當前位置:
首頁 > 科技 > 製造「愛情工廠」:假如丘比特是個程序員 | 演算法密碼

製造「愛情工廠」:假如丘比特是個程序員 | 演算法密碼



?

圖片來源:pixabay.com



「演算法密碼」系列第4篇


《知識分子》科學新聞實驗室第14篇


 


撰文 | 葉偉民(《知識分子》科學新聞實驗室特邀作者)


責編 | 黃永明


 


 

 




大學時,我有兩個很要好的計算機系朋友。我們常常在周五晚上結伴去英語角。


 


這是一個充滿社交默契的地方,人們先三五成群地聊,再過渡到一對一交流,男女搭配是最理想的局面。但事實是,現場總不乏尷尬收場或不歡而散的狀況。


 


老K是我們仨中唯一修過博弈論的。他告訴我們,這事關一個穩定配對的演算法——「蓋爾—沙普利演算法」

[1]

。如果我們三個男生要在現場和三個女生實現一一匹配,最幸運的情況是每個男生「各」選其一,最糟糕的是每個男生「都」選其一。

 


絕大多數情況是,三位女生的邀請者數量分別為2、1、0。老K是這樣用「蓋爾-沙普利演算法」來解決配對的——收到2名男生

(A和B)

邀請的女生

(1)

選其一

(如B)

,收到1名男生

(C)

邀請的女生

(3)

暫時接受,被拒絕的A轉而向其第二人選發出邀請,如選女生

(2)

,問題解決;如選女生

(3)

,則再重複開始的流程,直至女生沒有收到新的邀請為止。


 

最後一位接到邀請的女生可能略有不快,但這的確是最優的結果了。「蓋爾—沙普利演算法」最直觀的應用就是高校招生。考生志願和學校錄取標準的最終匹配,相當部分要歸功於它。其發明者也獲得2012年諾貝爾經濟學獎。


 


雖然在經濟領域大放異彩,「蓋爾—沙普利演算法」的起點卻是愛情。源自兩位數學家關於「穩定婚姻問題」的爭論,它因此也被稱為「求婚演算法」。


 


在數學家介入前,思索愛情主要是哲學家和文學家的任務。它在李清照凄婉的詩詞中,在羅密歐與朱麗葉相遇的四天里,在梁山伯與祝英台的墳前,也在泰坦尼克號沉入深海的前夜。


 


人類數千年的謳歌為愛情樹立了精神上的傳奇,卻無法改變現實中婚姻制度的式微。在美國,16歲以上人口的單身比例超50%

[2]

,這既有生活方式和婚姻觀念演變的因素,也有社交變異的因素。


 


科技力量正嘗試解決這道超級難題。大數據和演算法正取代丘比特之箭,神秘浪漫的情感變得如公式般可計量預測。昔日妙不可言的「緣」,也正被準確製造於一座座永不停息的「愛情工廠」。

 


愛情這道數學題


 

五年前,洛杉磯的麥克金雷和北京的阿雲都是孤獨的人。前者35歲,是加州大學的數學博士,常年待在實驗室。23歲的阿雲剛離開故鄉安徽,孤懸異地,是一名網站編輯。


 


他們都用OkCupid,一款基於演算法的相親網站。


 


在婚戀市場上,麥克金雷是個十足的失敗者,身材幹瘦、頭髮稀少,相親網站的收件箱永遠是空的。阿雲對婚姻倒沒有那麼著急,她剛迷上攀岩,若能找到一個願意和她懸在峭壁上看藍天的伴兒,也是不錯。


 


OkCupid誕生於2004年,創始人是四名哈佛大學數學專業的學生,他們認為一個人能否找到靈魂伴侶,不是宿命,而是數學題。


 


他們的方法是這樣的:讓會員們回答15道必答題和若干附加題

(最多可以達數百道)

,內容涵蓋政治、宗教、寵物、酒量、債務甚至戰爭觀。比如「宗教/上帝在你的生活中有多重要」,「嫉妒是不是一種健康關係」等。

 


這些問題不僅需要自己回答,還要為未來伴侶回答,即你希望對方在同一問題上持什麼看法,最後還要為這個問題選擇「重要度」

(從「完全不重要」到「必不可少」共5檔,分別對應不同的分數)


 


回答的問題越多,用戶畫像就越清晰。最終OkCupid的演算法會自動測算兩個會員間的匹配值,100%就是數學意義上的「靈魂伴侶」。


 


數學博士麥克金雷卻栽在了這道「數學題」上,他的答案如「怪咖」般不受歡迎。在有近10萬名女性使用OkCupid的洛杉磯,他的匹配結果很可悲。系統為他推薦了數十個「般配」的女性,麥克金雷非常認真地給她們發了自我介紹,但毫無迴音。


 


在北京的阿雲,因為是女生,而且很陽光健康,收到的搭訕會多一些,其中一位顯示與她匹配度還高達94%。她很高興,決定回應。對方是個外國人,雖然阿雲並不守舊,但沒聊幾句還是把她嚇著了——對方提出玩「Cyber Sex」

(網路性愛)

 


「這是我最討厭的類型。」阿雲感到被冒犯,「但機器卻看好我們。」


 


人造緣分


 


人類之愛如神話一般古老,兼具至高的浪漫主義色彩、犧牲精神和穿越時間的永恆之義。甚至宗教諸神,「愛神」也有一席——東方為「月老」,西方則是「維納斯」。


 


愛情的本質在「不可知論」中徘徊千年後,現代科學也參與探尋,並誕生了「愛情物質」等理論,即認為愛情是苯基乙胺、多巴胺、去甲腎上腺素等化學物質綜合作用的結果。


 


然而,如何讓這種反應發生,也就是讓玄而又玄的「緣分」降臨,則是概率學的範疇了,這是數學家的領地。2010年,英國數學家彼得·巴克斯按照自己的擇偶標準,用「費米估演算法」

[3]

估算出全世界願意與他交往的女人數量是——26個,與科學家估算的銀河系智慧文明的數量

(約一萬個)

相比都少得可憐。


 


既然自然發生率如此低微,一些聰明的腦袋就著手研究「人造緣分」。早在1963年,兩名哈佛大學學生就想到了用計算機幫忙。他們設計了75個問題讓調查對象回答,並用一台IBM1401電腦計算出每個人的「最合適」的約會對象。它還有商業模式:拿到對方的聯繫方式前,每個人需繳納三美元。


 


這就是OkCupid等演算法相親應用的雛形。到麥克金雷開始使用的2012年,它已成為全美最受歡迎的約會網站之一,號稱每天撮合初次約會近三萬次。


 


這些數字越熱鬧,麥克金雷就越沮喪。現實中,他才華橫溢且經歷非凡。9·11發生時,他是世貿中心北塔91層一家公司的職員,只因每天下午兩點上班而躲過浩劫。他後來又加入麻省理工以高智商著稱的「黑傑克團隊」,利用速算能力和團隊配合縱橫賭場。


 


一個夏天的凌晨,寫著代碼的他突然意識到,他一直以己之短搏他人之長,雖不擅搭訕,但擅計算,他就應該像數學家一樣去相親。


 


「既然任何事情都有最優策略,約會也不例外。」麥克金雷說。


 


這位數學博士先註冊了12個OkCupid賬號,並通過一個Python腳本來控制它們。這些賬號會自動尋找他的目標

(25歲到45歲之間的異性戀和雙性戀女性)

,並抓取她們的公開信息和回答過的問題。


 


然而,只收集了1000個賬號資料後,麥克金雷的賬號就接連被封了。OkCupid有防濫用系統,以防止此類數據收割。麥克金雷又編寫了一個程序,讓這些賬號能模擬真人點擊滑鼠和敲打鍵盤。這一次他成功騙過系統。


 


三個星期後,麥克金雷收集了符合其初選條件的兩萬個姑娘,600萬個問題及其答案。


 


人變成了齒輪


 


當麥克金雷在他的數據斬獲前興奮不已時,阿雲仍為上一次不愉快的配對耿耿於懷,她後來成為一名科技記者,對相親網站背後的演算法問題有了更發自職業的關注。


 


全球在線約會產業從1990年代中期起步,創辦於1995年的Match是最早的試水者。現在,全球在線約會產值已達30億美元。最大的付費市場在美國,中國的產業規模增長最快,用戶數已超2億人。

[4]


 


技術對人類情感的滲透從未停止。早期,約會平台的模式相對原始,大多基於搜索和標籤篩選。爾後,LBS

(基於地理位置服務)

技術被納入應用。進入移動互聯時代後,演算法匹配又漸成主流。


 


用演算法作為婚介驅動,OkCupid不是唯一,類似的還有eHarmony,它出現於更早的2000年。過去17年間,不同演算法基礎的相親網站都來爭奪市場,還演化出基因匹配、面部識別匹配等看似更酷的玩法。


 


一款名為「奇緣」的移動應用則走中間路線,保留了邂逅之美。它分析每個人的性格、偏好及社交圖譜,當「合適」的匹配對象出現在有效範圍內,雙方的手機就會發出警報,並通過藍牙交換信息。


 


阿雲發現了OkCupid還有個博客,內容為用大數據指導人們約會。例如「第一次約會應該提什麼問題?」OkCupid的建議是,可以「彎彎繞」地聊一些外圍話題,例如「啤酒的味道」——計算顯示,喜歡啤酒的人有60%或以上概率擁有更開放的性觀念。


 


隨後的一次線下約會,阿雲就發現被「套路」了。OkCupid推薦的是一位美國波特蘭的男生,經歷非常豐富,是個有意思的怪咖。但那些帶有性暗示的試探讓阿雲很不舒服。


 


「在這個應用里,我感覺人變成了齒輪,微妙的東西變得非常直白。」阿雲說,「生命的樂趣在於對未知的好奇,在於生命里的偶遇和驚喜。而這些,我不覺得OkCupid能明白。」


 


麥克金雷沒有這種東方式的浪漫,他仍寄望於他的數學實驗。現在,他要從搜集來的兩萬名女性的600萬個問題及答案中尋找某種規律,不斷縮小選擇範圍。他開始嘗試不同的演算法,當他找到貝爾實驗室的「K-Modes演算法」時,覺得正是所需。


 


這個演算法最初用作黃豆災害的原因分析,能夠根據數據特徵,將研究對象細分為不同類型。他認為人群分類也應同理。果然,兩萬名異性被分為了七組。這在麥克金雷看來是關鍵的一步,他為此欣喜若狂。


 


麥克金雷繼續做減法,例如將年齡過大或宗教觀不太相符的組別排除,最後剩餘兩組。一組是25歲左右的女性,大多為音樂家和藝術家

(A組)

;另一組年紀稍大,大多從事編輯或設計師等創造性職業

(B組)

。他決定都試一試。


 


此時,演算法已經幫他提煉出兩個類別里最受歡迎的500個問題。基於對未來婚姻的忠誠原則,他如實回答了這些問題,但讓機器幫助他選擇重要程度,以提高匹配分數。


 


他還耍了一點小心思,例如介紹里自稱是「數學教授」。較年輕的A組,他用攀岩的照片做頭像,B組則是彈吉他的文藝照。最後,他讓電腦程序去自動訪問這兩組女性的賬號,對方根據系統提醒就會看到他。


 


很快,一個前所未有的局面發生在這個情場失敗者的面前。他主頁的回訪量激增,最多時一天能有400人,他的收件箱也湧入很多問候。


 


「我從來沒有見過跟我匹配度這麼高的人。」一位女士寫道,「我感覺你應該有些故事……」另一個則毫不掩飾地稱讚麥克金雷的吸引力:「我想我們會有很多共同點,雖然數學上不是,但其他方面像得驚人。」


 


「是我找到了你」


 


麥克金雷終於可以離開實驗室。他先到大學體育館痛痛快快地洗了澡,然後去見這些問候者。他的策略是兩組女士交叉見面。


 


第一位是A組一位具有藝術家氣質的設計師,他們共進午餐,禮貌有加,但雙方都沒動心。第二天他見B組的一位博客寫手,可是對方消極陰鬱的氣質讓他很難提起興趣。到第20次約會時,他發現A組很多人都有紋身,或養中大型犬,他均不能接受。於是,他停止了和A組的約會,專心B組。


 


但情況很糟糕。一直到約會了55人,願意見第二面的人才有3個,見第三次面的才1個。麥克金雷感覺很不好,開始懷疑自己的演算法,更開始懷疑人生。


 


遠在北京的阿雲也有了變化。她將剩餘的耐心給了OkCupid上的幾個邀約,還真找到了一個男朋友。一開始阿雲感覺不錯,慢慢卻發現對方患有抑鬱症。相互痛苦了一段時間後,他們還是分開了。


 


而且她還發現一個更隱蔽的問題,身邊用此類約會軟體的朋友都變得玩世不恭。「愛情變得容易了,人們有了問題不是去解決,而是換下一個。」阿雲說,「那種感覺好像是:反正池塘里還有這麼多魚,再撈就是。」


 


阿雲不想再陷在這個被演算法操控的遊戲里了。她決定註銷OkCupid賬號,永久地。


 


麥克金雷也幾乎要放棄了,他已經約會了87次,仍一無所獲。他覺得一切計算手段,在雨果所說的「比天空更弘大」的人類內心面前,如投入深海的細沙,毫無波瀾。


 


然而,一個叫克莉絲汀的亞裔姑娘這時出現了。她發來問候信,說正在加州大學讀藝術,希望能找到一個身高180cm左右、長著藍眼睛的傢伙。最後,OkCupid給她推薦了麥克金雷,匹配度91%。


 


到了見面的時間,當麥克金雷走進雙方約好的壽司店,見到克莉絲汀,一種前所未有的電光火石般的感覺在心中迸裂。他們從書籍談到了音樂,麥克金雷還把他的「愛情演算法」和盤托出。


 


「這事兒確實有些神經質。」克莉絲汀說,「不過我喜歡。」


 


阿雲的另一段故事也開始了。她越來越愛攀岩,也越來越討厭大城市。2015年,她辭職去了大理,後經朋友介紹,遇到了來自加拿大的攀岩嚮導德恩。德恩當時很窮,衣服上都是破洞,但他很善良,會毫不猶豫地幫街邊小販撿散落的東西。


 


像麥克金雷的壽司店奇遇那樣,阿雲也被一種毫無因由的觸電感俘獲。他們相愛了,在此後的一年多時間裡,他們開著德恩爺爺留下的老爺車,穿越北美,白天攀岩,晚上睡車裡,沒錢時還要撿超市的過期食品。


 


「相比我身邊的網上情緣,我們會更珍惜彼此。」阿雲說,「因為它來得更真實,更強烈,無法像一個虛擬賬號那樣輕易刪除。」


 


麥克金雷和阿雲只是數億網路相親人群的縮影。技術和人類情感的關係也進入人文學者的研究列表。雖然互聯網婚介已成為一門全球好生意,但學者們的主流觀點認為,不必擔心愛情像芭比娃娃那樣被複制。


 


「計算機不可能有感情。」麻省理工學院精神分析學家雪莉·特克爾在她的《群體性孤獨》一書中說,「我們只有設身處地為對方考慮,通過生老病死、婚喪嫁娶等相同的人類體驗建立彼此間的聯繫,我們的感情才具有真實性。」


 


在一次媒體採訪中,麥克金雷和克莉絲汀也就這個問題爭論過。麥克金雷仍為他的演算法沾沾自喜,克莉絲汀卻不同意,她認為演算法只是他們故事的前傳,真正的挑戰是從相遇之後開始。


 


「你沒有找到我,是我找到了你。」克莉絲汀敲著男友的手肘說。麥克金雷思考良久,最終承認她是對的。


 


關於作者


葉偉民,媒體人。畢業於蘭州大學核物理專業。曾任ZAKER總編輯,《南方周末》特稿編輯、記者。現從事互聯網,同時是多家平台的簽約作者和寫作導師。




注釋


[1] 蓋爾-沙普利演算法,數學家蓋爾和沙普利為了尋找一個穩定匹配而設計出的市場機制。該演算法的一個關鍵之處在於,合意的要約不會立即被接受,而是「延遲接受」,直至沒有新的要約發出為止,最終達到相對最優最穩定的結果。


[2] 據2014年9月《青年參考》報道。


[3] 費米估演算法,也稱「費米問題」,即在科學研究中用來做量綱分析、估算和清晰地驗證一個假設的估算問題。著名案例如估算芝加哥鋼琴調音師的數量,通過分解城市總人口、擁有鋼琴家庭比例、調音頻次等元素,一步步推導出近似結果。


[4] 數據綜合自美國在線統計數據門戶Statista及中國市場諮詢機構艾瑞。


 


譯名對照表


麥克金雷        Chris·McKinlay


彼得·巴克斯    Peter·Backus


克莉絲汀        Christine Tien Wang


雪莉·特克爾    Sherry·Turkle





點擊圖片,查看「科學新聞實驗室」過往文章





?

你可能活在一個假的世界裡 | 演算法密碼







?

託兒所時期,孩子需要怎樣的愛? | 36個月





?

樹上騎個猴,地上一個猴,加一起幾個猴? | 事關智慧和笑





?

比你更了解你:演算法已經無可匹敵了嗎? | 演算法密碼





?

如何避免成為受害者:章瑩穎案心理分析 | 罪案遺蹤




製版編輯: 許逸





本頁刊發內容未經書面許可禁止轉載及使用


公眾號、報刊等轉載請聯繫授權


copyright@zhishifenzi.com


歡迎轉發至朋友圈




▼點擊查看相關文章


非虛構寫作

|馬丁之死|蘭花進化謎團|天問專欄


青蒿素

|可燃冰|P值爭論|許晨陽

|博士後

|潘建偉


張毅|王曉東

|張啟發

|崔維成

|

張鋒

|

楊振寧

|

李佩


盧煜明

|

王小凡

|吳文俊

|袁鈞瑛

|

張純如

|劉若川



知識分子

為更好的智趣生活

ID:

The-Intellectual

投稿:

zizaifenxiang@163.com

授權:

copyright@zhishifenzi.com

長按二維碼,關注知識分子







▼▼▼

點擊「閱讀原文」,了解課程詳情,立享限時特惠!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 知識分子 的精彩文章:

演算法密碼之製造「愛情工廠」:假如丘比特是個程序員
天問專欄:超級地球,解謎行星誕生的鑰匙?
2017年度羅德學者正式揭曉
有房,就有了一切?|繆斯夫人

TAG:知識分子 |