當前位置:
首頁 > 科技 > 想做世界頂級的技術,需要怎樣的團隊和契機

想做世界頂級的技術,需要怎樣的團隊和契機

大家好我叫劉凱鵬,花名治平,是阿里媽媽的演算法專家和技術總監,今天我來和大家聊一聊搜索營銷演算法模型的演進。

1

平台:大舞台提供接近夢想的機會

在阿里,人人都會有一個花名,我的花名很簡單,取自「修身齊家治國平天下」中的治平兩字,藉此表達一下對古代詩人家國情懷的憧憬之情。

我與阿里的緣分也一樣的簡單,從哈工大博士畢業以後就進入了阿里,一路也算順風順水,只不過區別在於,我畢業的時候工業界還是以傳統機器學習方法為主,而到了現在,短短六七年間人工智慧已經遍地開花,這給業界造就了巨大的機會,也衍生出了大量的挑戰,因此我才來此討論這樣的一個話題。

在入職阿里之前,我在很多國內外的互聯網公司實習過,在經過了多個角度的審視感覺,淘寶這一領域將來肯定會有所發展,我入職阿里後的 7年里就見證其從一個簡簡單單的購物網站,發展成今天的巨大規模。

在阿里工作的技術人普遍更關心兩個方面,一是在今天的環境下,所面臨的數據業務到底是怎樣的,阿里有著豐富完整閉環的大數據體系,能夠隨時看清行業會面臨著哪些挑戰,這是我工作中最興奮的一點;電商是一個以數字化為基礎的商業設施,技術是其不斷發展的核心驅動力,這給技術人提供了一個廣闊的舞台。

舉例來講,我初入阿里時是從事模型類的工作,會接觸到大量的數據特徵,從特徵量級和樣本量級等方面都無法達到世界頂尖,但在師兄的引導下,我所在的團隊不斷思考應該如何達成世界頂級的技術,數據規模、訓練平台、數據處理方案不斷的討論,結果發現好像事情也沒有想像中的困難,經過了幾個月的討論和著手模型製作之後甚至發現我們的一些技術甚至已經達到世界頂尖。

我覺得這並非因為我們是天才,而是因為我們獲得了這樣一個舞台,夢想、舞台和這些條件激發了我們的潛力,阿里這種世界級的舞台就為那些聰明皮實樂觀自省、有技術基礎、技術熱情和技術成果的人敞開大門。

2

技術變革:前事不忘後事之師

我的團隊主要負責阿里的搜索營銷業務。傳統購物需要人找貨,當用戶在平台搜索想買的商品時,搜索引擎會找用戶感興趣的產品進行展現,這些商品就獲得了展現流量。商家獲取流量只能通過被動的分配。搜索營銷業務就是希望給商家提供一些主動獲取流量的手段,加快其觸達到用戶的速度和發展速度。提高購物效率,幫助商家完成貨找人的過程。

搜索營銷並非一開始就能達到這一目的的,其發展分為了三個階段。第一個階段是傳統的基於競價詞營銷階段。商家購買關鍵詞,系統通過關鍵詞來完成用戶匹配,通過排序模式運作,在這個時代里最核心的工作是對於關健詞的理解,把用戶的意圖去改寫成相關的關鍵詞進行匹配,進行點擊率的預估,然後去把最終的排序做到面向平台收益最大化。這種模式的問題很明顯,在相對較小的樣本規模和特徵下才能完成。

第二階段是伴隨著移動時代所造成的個性化服務時代。這個時代面臨的兩大難題一在於如何讓匹配和排序有個性化表現;二則是如何幫助商家更好的定位消費者。這就需要深入的理解用戶意圖,個性化的分配流量;同時,還要幫助商家解決好流量的控制問題,幫助他們更好的表達營銷意圖。在受眾選擇、出價、預算、創意製作等各方面適應個性化變化?。

第三個階段以人工智慧技術為代表的智能營銷時代。這個時代深度學習驅動新工具和技術理解非結構化數據,以用戶整個的行為序列完成基於記憶的深度學習,推動購物體驗的完善;在商家層面,對用戶意圖更好的理解,對長中短用戶興趣的刻畫都會更精準,營銷更高效。

但這個時代依然有很多挑戰,比如如何利用深度學習的技術對用戶認知過程進行更好的建模和學習、如何更精準的了解商家訴求、如何進行宏觀調控、如何優化市場機制等問題依然存在,在這種情況下,技術與業務將會結合的更為緊密。

3

結合業務:技術的應用與發展

我們現在面臨的很多業務問題都需要最頂尖的技術手段來解決,所以同工業界和學術界保持良好的互動關係就很有必要。希望能形成一個學習、應用到創新循環。

第一,從業務問題出發,去研究界找到最佳匹配研究領域,把研究成果應用到業務問題里,這就是一個借鑒過程。第二就是應用的過程,把它具體應用到我們業務里,然後產生自己的想法,能夠去讓整個業務發展的更好;第三,從本身的業務問題出發,找到所借鑒技術可提升的點,基於豐富的數據和技術平台得到更加具有創造性成果,進而反饋到學術界,這樣就形成了一個循環。在這種方式下,對團隊個人的技術能力成長會有很強的驅動力,對團隊的業務目標貢獻也會形成正向循環。

那麼應當如何理解阿里媽媽的技術水平在世界上的地位呢?我認為技術應該是能夠完整、系統化解決業務問題的。阿里媽媽的技術是依託於阿里的閉環數據和業務挑戰而產生的,這是世界上獨一無二的業務場景,因而我們構建了一個完整的技術棧,從最底層的數據處理到中間的實時系統、訓練平台、模型應用再到一系列的平台分析等,從而形成一個完整的技術圖譜。在搜索營銷的場景中,建立了高水準的技術體系,回饋到業務訴求中。

如果來看未來技術的發展趨勢,我覺得可以從搜索的趨勢來入手就會明晰。最初的 PC時代,搜索承載著互聯網的絕大部分流量,而移動時代到來後,場景碎片化、數據個性化使得獲取信息的方式趨向於推薦等被動獲取。但隨著技術的發展,被動獲取信息並不是最高效的一種手段,因此在未來隨著人工智慧的發展,甚至是語音交互、人機交互等方式的普及,主動獲取信息將又成為主流。屆時,搜索可能會再次成為主流,這時可以結合物聯網等新的技術讓用戶更主動更好的獲取所需信息, 搜索營銷也會有相應的變化。

4

團隊構建:重學習、能創新、有夢想

技術的發展越來越快,想走在時代的前沿就需要不斷的學習。我個人學習的方式比較簡單,一種是知識驅動,一種是問題驅動。所謂知識驅動就是在當前最流行的領域,緊跟時代的發展學習各類知識、演算法和編程語言等。但我個人更看好的是問題驅動,這需要去看當前面臨的核心問題是什麼,解決這個問題需要怎樣的知識網路。從問題出發不僅可以幫助建立健全的知識體系,彌補不足,還可以進而激發自身潛力結合到實踐當中。

對於技術人來講,我希望大家能夠做到聽的清楚,想的深刻,說的明白,乾的認真。也就是說能夠在任何場景下聽清楚別人說的話,然後進行思考,想通問題所在,接下來去訓練自己,去讓別人也能夠聽清楚,過程中可以通過別人的反饋完成對自己能力的提升,最後投入到實幹之中,以認真的態度完成業務,不斷進步。

以我目前的團隊來看,目前分為了演算法策略團隊和工程架構團隊。演算法策略團隊主要負責深度學習、強化學習、自然語言處理、圖形處理等技術領域,然後將這些技術應用到業務場景中,一方面幫助用戶找到合適的商品,另一方面幫助商家提升營銷效果和效率。而工程架構團隊則主要負責解決高並發條件下如何提升系統服務性能,保障系統服務的穩定性。這就包含了機器學習的內容,如從簡單的線性模型的機器學習升級到深度模型的機器學習,增強計算力應對更大挑戰。

在團隊的人才培養方面,首先會建立團隊的願景和使命,需要讓所有人都明確我們的願景使命是什麼,然後再制訂出團隊的文化。我們鼓勵個人自我超越,讓個人找到自我超越的方向,然後給予動力,幫他們找到自己成長的主要舞台。另一方面整個團隊希望能夠共同成長。團隊中有各種各樣的分享機制,內部分享的內容可以接受團隊成員的意見,建立團隊內部的共同學習共同成長的機制,形成這樣的循環。在團隊的共同願景下,達到共同成長這樣一個循環,讓團隊成員能夠找到成長的路徑。而且,目前團隊的成員基本上都是來自國內外頂尖的學校和公司,有超過百分之三四十的同學都是博士畢業的,這種情形可以幫助團隊快速的成長。

在公司層面來看,阿里對人才有一個通用的描述:聰明、皮實、樂觀、自省。而我們團隊對人才的觀念是,第一要有創新力。目前團隊面臨巨大的數據挑戰,日新月異的業務變化場景下,團隊希望所有人有對技術和業務高度的敏感性,這種情況下創新力尤為重要;第二能夠有信念力。相信技術的力量,相信技術能夠改變世界,也相信世界能夠因為我們這樣的人而變得不同。

5

一個契機:國際廣告演算法大賽

近日,我們阿里媽媽聯合國際人工智慧聯合會議(IJCAI-2018)以及阿里雲天池平台舉辦了國際廣告演算法大賽。賽題是搜索營銷場景下的轉化率預估。轉化率是衡量商家營銷效果的一個重要指標。對轉化率的準確預估是我們提高平台營銷效率的重要一環。在這次大賽中,我們會提供平台積累的海量真實交易數據,希望和學界、業界一起來探索這裡面的技術問題。

我發起這次大賽的初衷有三個。第一,我希望通過這樣的一個演算法大賽去讓更多的業界和學界能夠了解我們的業務形態和我們在這裡面真正關心的一些核心的技術問題。第二。從工業界和學界關係來講,學界沒有數據,他們很少能拿到數據,我們把這些數據脫敏,讓大家可以利用這些數據來進行研究。從中看到挑戰在哪,技術的關注點在哪,這裡面重點難點是什麼樣的,這樣能夠吸引大家對技術關注。同時也希望通過這個去對外輸出阿里媽媽的一些技術成果,擴大和大家的交流合作,把技術做的更好。第三,我們希望能夠鼓勵創新,也能發現人才,這次的賽題與我們工作中的很多題目類似,我們希望能夠發現一些隊伍和選手有更多新的想法,也希望能夠找到優秀的人才。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 InfoQ 的精彩文章:

成為架構師的路上,看這一篇文章就足夠了,因為……
這是你第幾次對別人說「我沒有其他照片了」?

TAG:InfoQ |