當前位置:
首頁 > 最新 > 科技谷CEO陳思恩:用數據驅動決策,需要把演算法和運籌學結合起來

科技谷CEO陳思恩:用數據驅動決策,需要把演算法和運籌學結合起來

雷鋒網消息,2017 年 7 月 8 日,由 CCF (中國計算機學會)主辦,雷鋒網與香港中文大學(深圳)承辦的全球人工智慧與機器人峰會 CCF-GAIR 大會進入第二天。科技谷CEO陳思恩博士進行了題為「交通出行大數據——引爆智能商業新浪潮」的演講。他表示,公路、鐵路和民航等交通方式具有巨大的出行量,每年有數十億的需求,這其中就存在 AI 和大數據的需求,AI 落地的場景會逐步在出行的領域滲透。

陳思恩還認為,演算法必須要和運籌學結合起來,因為最終實現的是數據驅動決策,真正的AI是要跟大數據有一個有效的融合,去解決用戶的痛點。

以下為陳思恩演講實錄,雷鋒網做了不改變原意的修改。

陳思恩:大家好,今天上午的最後一個環節由我給大家介紹一下 AI+交通出行的方向,其實大家看到這個命題就知道在這個領域裡面肯定不會是一個偽命題,也不會是一個偽賽道,因為現在無論是創業公司還是投資機構都擔心做的方向錯了。科技谷公司選擇的方向是在公路、鐵路和民航的出行上。大家知道一年鐵路有 30 億人次的出行量,民航大概有 5 億人次,公路總共有 30 億人次,在這裡面有大量優化的需求。也就是說他會存在 AI 和大數據的需求。隨著 AI 和大數據的推演, AI 落地的場景會逐步在出行的領域滲透。

傳統的智能改造方向已經產生很多的應用,從早期的人工智慧到現在的機器學習。機器學習是實現人工智慧的一種方法,而深度學習是對機器學習技術的推進。科技谷本身專註在交通出行和大數據方向,在這個方向裡面,不管是航空公司還是機場都有大量的需求,大家可以看到,在運營方面還是在收益、營銷的體系建設方面都有需求所在,同時大數據的引入需求也是比較旺盛的,所以我們選擇的點主要是在收益優化和安防方向,也就是維穩這個方向。

可以看到在交通大數據和 AI 這個方向的結合是比較好的,因為交通數據比較容易開放,而且開放完以後比較容易產生價值。首先它也是需要遵循一定的規則,大數據前面這一波的熱潮出來之後使得很多交通數據形成了堆積,無論是使用什麼樣的大數據廠商提供的服務,都把數據匯總起來了,這是很關鍵的。後面就用統計和機器學習的方法去建立相關的模型,為演算法做一些準備。我們認為演算法跟運籌的最優解可以結合,因為最終是要實現某一個供應鏈的配置,比如說通過客流、民航、鐵路和公路找到最優解。同時能夠增加多種收益,比如說收放倉的控制,這種環節都需要用到一些比較核心的 AI 的演算法,而且能夠自動化控制。

我們認為在交通出行領域需要三個要素才能夠比較好地實現整個環節,也就是說它首先是需要有大量的數據,無論是內部還是外部的,這裡面需要有大數據的掌控公司,同時還需要有大數據的中間商,也就是買賣、交易,現在國內做了很多的交易所,還有一種是大數據的技術公司,可能是從統計部分的機器學習,再加上計算機的原理去實現大數據的架構,到後面需要用深度學習的方法去落地,所以三個環節是很重要的,一個是大數據本身,另外一個是大系統,也就是前期在推使用的演算法,要用什麼樣的構架來跑,還有你的伺服器用什麼方式來做。後面就是演算法跟運籌優化這一塊結合,解決一些比較實際的用戶的痛點。

為什麼會跟運籌這一塊結合起來?因為你最終實現的是數據驅動決策,真正的AI是要跟大數據這一塊有一個有效的融合,去解決用戶的痛點,比如說如何更好地實現它的票價,更好地最優,會員日的如何更好地把優惠券以合理的價格、合理的時間推送到真正有需求的用戶手上,這些都是真正去解決它的實際痛點。

在交通出行這一塊的分布,我們也是採用了漸進式的方式。什麼叫漸進式?就是說它會採用除了PDCA形成一個閉環,然後逐步 AI 實現的就是人工介入部分,把大數據落地。然後用工程的方式來做,所以我們把國外很多facebook、推特這些可以觸達旅客的點結合起來,比如說航空公司在訂票的時候,他根本不知道他的哪些顧客來自facebook,哪些來自推特。但是通過我們和他們合作,可以找到機票的用戶從哪裡來,下一次有優惠信息的時候可以推薦到他的行程上。把國外的數據源帶到國內,對大的航企、12306都有很大的幫助,也就是直接帶客源進去,他在整個大數據的連接上面產生價值之後,就需要開始去做內部的數據深挖,這時候就需要用機器學習的方法,甚至是一些AI深度學習的方法去做。

外部的數據引入之後,就需要對某個人或者某個事件做畫像,這個航線要怎麼畫像,客源是怎麼來的,這些都要有深度的識別,對我們來說是上百個維度的識別。這些推演的背後就是機器學習,它是人工智慧很好的實現方法,同時深度學習也是對機器學習很好的實現,就像《黑鏡》裡面的女主角通過機器學習的方式,在社交網路上模仿她的男朋友的語態。你要更了解你的客戶,才能真正實現更好的策略。

剛才講的是大數據的數據部分,接下來是系統部分,微軟在這一塊有HD inside,我們也有自己的inside套裝,我們認為在企業需要混合雲來搭,就像12306在出行高峰的時候用阿里雲的資源,降低它的主機的負荷。所以分布式架構用混合雲的架構會長期存在,而且對雲端的依賴會加大,就像華為進入公有雲的市場,中興通訊也有它的雲,國內是阿里雲比較有名,我們也把我們的系統搭建在亞馬遜的雲上,通過混合雲的架構幫助客戶實現大系統的搭建。

接下來這是我們的大系統的架構,因為要跟雲結合,裡面包含了各種技術的組合,然後有我們自己的 SDK,封裝了很多方式,這種方法已經用在國內的很多大型的航空公司和鐵路的12306,這裡面還包括一些推薦的引擎和演算法,這完全是To B的架構,但是它做的是B2C的方向。

這裡面有兩個重要的東西,一個是平台,在這個點上跟其它的平台是大同小異的,但是它會偏行業,因為行業的東西是比較不一樣的,特別是數據清洗這個環節,還包括在數據建模。因為演算法跑起來,模型是很重要的,還有約束條件、建模的方式都是不一樣的。另外inside這一塊是比較有特點的,也就是我們的套裝化之一,這裡面含了畫像的場景、關係圖譜。知識圖譜裡面很重要的一個就是建RDF,也就是整個關係建立的套件,還有推薦引擎和演算法。這裡面涉及到數據建模的優化和神經網路的東西,所以這個套件我們花了大概三四年的時間,而且這個很需要在大的資料庫裡面去練。因為我們做得比較早,在這個領域裡面,像12306,中國大的企業都是我們的客戶,所以我們這個產品得到了很好的歷練,它相對來說是能夠接受體量很大的數據場景去找最優解。

在這個之上,它這裡面涉及到大量的運算方式,比如說畫像的場景,它可以支持上千個維度的自動化,它是通過參數配置的,自動化形成多種演算法的場景。同時在推薦系統上也是多種關聯,時間節點、分布式演算法,同時對用戶行為進行預測。

之後我們關注在我剛才提到的三個要素,一個是數據,第二個是平台,第三個是演算法。演算法我們選擇的是收益這個環節,我們能夠真正幫用戶實現收益,也就是 AI 這一塊新的優化。就像星河互聯的傅總講的,航空這一塊的自動化程度高,但是對創業公司也不意味著沒有太多的機會,國外做這一塊的就有好幾家公司,但是國產化的公司還沒有,酒店行業現在有幾家起來了,但是航空產業基本上是沒有的,我們會從航空和鐵路的收益環節去做,把大量的運算放在雲端,客戶用租用的方式就可以實現對演算法的採購,用許可的方式和服務費、訂閱費的方式去支付我們的產品費用。

收益這一塊,我們也是大概6個月的時間可以幫助客戶實現從大數據的引入到平台的建設,到收益優化演算法的建立。所以現在已經有比較大的合作夥伴在用這套系統,而且這個平台可以直接用於更多的平台性的客戶,比如說阿里的飛豬、美團、滴滴,它需要做求解器,收益有關場景的用戶都會去用,我們會先從航空和鐵路這方面的客戶做起。

這裡面具體做什麼?在航空領域,它的 NO-SHOW 的模型也是要改變的,因為天氣數據現在都是開放的,這些維度的數據要實時的整合,你的演算法現在不是靜態模型,而是需要動態模型,同時你在外部的行為都是動態的,這些環節都需要導入,導入完以後你對NO-SHOW這個環節,包括座位分配的環節,都要重新用機器學習的方式去做,最終實現一個最優化。對航空公司來說,雖然是最優化,但是它是基於機器學習的,最終它的 AI 對比就是說我算得比別人更准,我的收益提高得比別人更高,最終它就達到了結果,而且全面國產化是一個很好的趨勢,因為很多央企也都非常支持這個事情,我們這個公司現在就是在立足做國產化的收益求解器。同時我們在做的時候是用工程的方式落地,而不是把產品推過去用雲的方式落地。針對大的企業級用戶,任務分解必須做得很細。這裡面需要航旅類的企業配合,需要IT、營銷人員參與,當然任何做 AI 和大數據方向的都是公司的戰略決策,無論是首席數據官還是首席信息官,或者是 CEO 都要參與這個事情。中間它就需要我們的大數據工程師和數據科學方面的人一起整合去做這個事情,長期迭代服務才能夠建立比較有效的環節,同時還要導入一些外部的數據,因為企業內部的數據遠遠是不夠的,包括 12306 都不敢稱自己是大數據公司,當然BAT是真正的大數據公司,因為它的數據夠多元化。

對科技谷來說最主要的是要幫客戶創造商業價值,帶來創新。真正使這套技術落地,給客戶變現帶來收益,所以我們也是立足這個方向,持續做這個市場相關的東西。

通過這幾年的積累,我們也建立了非常多的合作夥伴和客戶,因為要成就一個比較好的公司,它需要有一個完整的上下游的產業鏈配套,很多是我們的兄弟公司一起推動,對這種大的企業,單打獨鬥是很難在一個市場立足的。

我的報告就到這裡,謝謝大家。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 輕芒 的精彩文章:

潛水的女孩,普通又不普通——7.15女性潛水員日專題
黑色真絲灰蕾絲花邊丁字褲
我說了!我真的是用白菜價在畫畫!
繼康師傅後燕京啤酒宣布關閉部分工廠,輕資產模式燒到了啤酒行業?
長裙翩翩,舞出浪漫之夏

TAG:輕芒 |

您可能感興趣

優秀的UI設計師需要掌握的設計技巧
ARM新架構發布:整合SIM技術、手機不再需要實體卡
ARM新架構發布:整合SIM技術、不再需要實體卡
谷歌發布小型智能相機,通過人工智慧及演算法識別可能需要的圖像自動拍攝
產品經理機器學習手冊:什麼樣的產品需要利用機器學習來解決?
科爾:NCAA需要改革,可以參考奧運會模式
5G需要合力:大唐移動、是德科技在MWC成功演示5G-NR技術
LOL:免費領永久皮膚的兩個活動,需要動手和動腦!
谷歌CEO桑達爾·皮查伊:技術教育需要持續不斷的再培訓
谷歌硬體老闆:研究不同的AR形式,仍需要時間讓技術成熟
VR技術需要學什麼知識?
FDA和EU的互認協議—您需要知道的內容
大數據在雲端的應用需要改變IT技能集
斯坦福教授張首晟:IT產業能夠發展,既需要物理學,又需要數學
手機攝影需要開HDR嗎?
豬場管理也在進步,需要新的經營理念、管理模式
GMP文件體系需要不斷的完善
手機還需要工業設計師嗎?
社論:治理體系現代化需要機構改革
印度總理莫迪:「顛覆創新性」的區塊鏈技術需要加速落地 或成「數字盧比」的核心推動力