打開演算法「黑盒子」,是向全社會釋放紅利
撰文| 麥徒
「演算法」已成熱詞。
《未來簡史》作者赫拉利,就有個大膽的論斷:生物就是演算法,生命就是進行演算法處理;人類將環境參數作為輸入數據,經過認知能力的處理,輸出感受和決策等數據,從而決定了我們的喜怒哀樂以及行動。這只是基於數據主義的概念轉譯。
但毋庸諱言,作為智能技術的演算法,確實已深度嵌入人們的生活。
當下,演算法分發已是搜索引擎、瀏覽器、資訊客戶端等互聯網產品的標配。
那,「演算法」究竟是什麼?
1月11日,國內最大的信息分發平台今日頭條,以分享交流會的形式,首度對外公開了自己的演算法原理。這是國內互聯網企業公布演算法原理的首例。
今日頭條資深架構工程師曹歡歡博士,在現場詳細介紹了演算法模型設計維度與策略,包括如何在線訓練大規模推薦模型,典型召回策略的設計方法,多目標如何融合等核心問題。以及今日頭條的內容安全機制及相關舉措,並公開了風險內容識別技術以及泛低質內容識別技術。
來自中央電視台、新華社、人民日報等媒體機構的從業者,和來自阿里巴巴、騰訊、百度、美團、新浪、網易等科技公司的演算法工程師、產品經理等100多人參與了交流。
作為「第一個吃螃蟹的」,此舉聚攏了無數眼球。而這背後,則是一個行業「獨角獸」對肩上責任的主動認領,這份責任指向對整個行業發展層次的拉升,對技術紅利增量的供給。
將「獨門絕技」拆解給外界看,挺需要魄力
首例意味著沒有先例。為什麼公開演算法原理方面沒有先例?究其原因,是演算法歷來屬於企業機密。對很多以演算法立身的企業來說,這屬於「核心技術」,也是競爭力之源。
正因如此,基於數據挖掘的推薦引擎型產品,在「演算法信息分發」應用上堪稱一騎絕塵的今日頭條,能將演算法原理對行業、社會公開,難能可貴。
正如有些人說的,演算法原理之於今日頭條,就相當於七十二絕技之於少林、太極拳之於武當,是「獨門絕技」。
將「本門絕技」亮給外界看,猶如把獨家「秘方」公布給其他「廚師」,沒點魄力不行——要知道,台下很多都是一線互聯網公司演算法工程師、技術大拿。郭德綱同志老說:同行間才是赤裸裸的仇恨。將演算法原理「一招一式」都拆解給他們看,「心夠大」。
例如在現場,京東的工程師提問:「做演算法推薦,如何在符合用戶興趣之外給用戶創造驚喜?」曹歡歡回應稱,這是今日頭條做了兩年的事情:「干預模型非常難。你先畫一個興趣圖譜,根據用戶的興趣圖譜的覆蓋度去探索從來沒有探索過的東西。我們甚至曾經做過指標體系的圖象,實際發現不夠好,這塊的幫助確實沒有那麼大。」
可以說,今日頭條開行業風氣之先地公開演算法原理,著眼的本就是大格局,而非一己一時之得失:這次公開,既是釋疑,旨在消除不少人對演算法的誤解與歧見;也是問診,冀望更多人給現有的演算法模型挑刺、建言,以裨補闕漏、改善演算法。
公開演算法原理,是釋疑,是問診,更是賦能
如今,雖然很多人都在跟演算法驅動的技術打交道,但對演算法並不了解。不了解所以也就有了誤解。有些人覺得,演算法就是「機器說了算」,是機器引導人而非人引導機器;有些人認為,演算法就沒有價值取向,只圍繞流量轉;還有人直言,演算法開啟的是潘多拉的魔盒,而不是阿里巴巴的寶庫。
這些誤解可以理解,作為企業也有責任去矯正那些偏頗認知。事實上,演算法完全可以優化設計,來克服推薦的「准」和信息繭房的矛盾;演算法也有價值觀,可以將「有意思」和「有意義」結合。
正如今日頭條副總編輯徐一龍在現場說的,演算法也是一種「法」,都是通過一定的規則和方法,達成預期的一種效果;演算法和法律法規一樣,如果施行得好,都很高效,也都要求透明。此次交流會中也講到,今日頭條會不斷糾偏,設計、監督並管理演算法模型,並建立了內容安全機制及相關舉措,有著風險內容識別技術以及泛低質內容識別技術。也就是說,其「演算法分發」模式也有價值介入,而非一切交給機器。
就此看,將演算法原理公開,也是一種技術釋疑。讓公眾增進對演算法本身的了解,消除許多疑慮。
將演算法原理公開,還是一次開門聽診。人無完人,技術也是。演算法技術培育至今,離徹底成熟仍有距離。通過技術公開診斷問題、徵詢意見,也能通過外部力量推動內部變革,更有力地改進演算法。
演算法也是「法」,法者必須與時俱進,演算法也要適時改進。「演算法分發」變以往的「大海撈針」式信息獲取方式為「私人定製」模式,讓信息供需匹配來得更及時,接下來,如何將滿足個性化細分需求和實現有價值的信息引導,進而更高效地為用戶服務,為社會創造更大價值,值得探討。
將演算法原理公開,更是一種技術賦能。今日頭條是國內極具代表性的信息流平台和技術公司,其模式也被很多後來者借鑒,而身為領跑者的它,則成了這類企業中名副其實的「獨角獸」。
就像班級里的「學霸」幫助同學,是比獨善其身更高的境界,獨角獸做大了賦能同行及其他領域的「小夥伴」,在幫助別人中成就自己,也是更好的路徑選擇。
所謂賦能,就是說從行業領跑者變成「高速公路」搭建者,通過技術和其他資源的開放,去幫助其他企業等成長、發展和獲益,實現「你好我好大家好」。
國外有學者將企業分為兩種:一種是線型公司(Pipeline),就是自己衝上賽道;另一種是平台型公司(Platform),主要鏈接核心價值的創造者和用戶兩端,它們通常是網路技術公司,輕資產經營,對海量訊息資源串連。這類平台型企業,要做的就是對平台上企業的「賦能」,而不是跟它們賽跑。
今日頭條生來就是平台型公司,以往也利用演算法和收益分成機制,對那些原創內容生產者們進行了賦能。而今,把演算法原理開放給業內,則是面向整個社會的技術賦能:通過告訴外界自己是如何給用戶畫像的,演算法模型應有怎樣的設計維度與策略等,供同行參考,改善自身的技術或模式。
這次對演算法原理頗具標誌性意義的公開,公開力度不小。頭條使用的五種推薦演算法(傳統的協同過濾模型,監督學習演算法Logistic Regression模型,基於深度學習的Factorization Machine,以及DNN和GBDT),輸入給演算法的四類最重要的用戶特徵(相關性特徵,環境特徵,熱度特徵,協同特徵),都被大幅公開。這些技術開放了,必然能提升互聯網企業在演算法上的整體水平,進而最大化地裨益社會。
打開了「黑盒子」,釋放了技術開放的紅利
向社會公開演算法原理,也跟「更開放」的節拍呼應。
「開放」,和「自由、協作、共享」是互聯網精神的核心要素。互聯網誕生之前,IP協議將各式終端互聯,寫下了互聯網「開放」的序曲。也正是順承著「開放」精神,很多互聯網產品設計之初就內嵌了「開源基因」。
眼下隨著PC時代的遠去和移動時代的紅利式微,中國互聯網正在開啟由人工智慧主導的下一幕。有人預判:人工智慧技術的未來必定是開放透明的。IBM CEO弗吉尼亞·羅曼提就呼籲,人工智慧的發展要更加透明,「(對於人工智慧帶來的許多新問題)要解答也需要時間、研究和開放的討論態度」。
而演算法正是人工智慧成長的重要動力,當下演算法分發也在很多引擎類互聯網產品中得到廣泛應用,且其應用面會越來越廣。在此情景下,作為行業先行者的今日頭條,主動將演算法原則公開,也體現了這種開放態度,這展示了一個商業公司反哺互聯網行業的「正確姿勢」,也展現了一家技術平台的責任感。
今日頭條方面表示,人工智慧發展帶來的挑戰,是人類此前沒有遭遇過的;當企業發展壯大時,有責任也有義務,與行業一道積極思考與研究新技術可能帶來的機遇和風險。
將演算法透明化,對今日頭條是「有責任也有義務」,對社會來說,則既會給無法跳脫演算法的人工智慧研究提供更多數據憑依,也會對演算法應用乃至整個互聯網行業起到積極推動作用,進而在促進行業協同發展、共榮共贏的同時,也改善其產品和服務,進而更好地對接人們服務體驗升級等訴求,滿足人們對美好生活的嚮往。
所以,公開演算法原理,打開的是演算法的「黑盒子」,釋放的是技術開放的社會紅利。
這樣的主動公開,無疑多多益善。可以預見,當更多企業都能在「成全社會,成就自己」的價值擔當中,做技術開放的增進者,那必然會攢下更大的社會能量,帶來更可觀的技術紅利。


TAG:鳳凰科技 |