劉克:數據支持的物流科學決策
6月27日,在全球智慧城市高峰論壇智慧物流分論壇上,中科院數學與系統科學研究所研究員、中國運籌學會秘書長劉克在會上劉克教授發表主題為「數據驅動下的科學原理」的演講,以下是演講記錄:
今天我將從四個方面來給大家做一個介紹,首先是「科學決策的理念」,其次是「數據、經驗的支持」,第三是「共識的形成」,最後是「模型、數據的支持和AI的作用」。
科學決策的理念。首先決策是必然的,上至國家層面,下至每個人的日常生活,都是在不斷地做決策。首先回憶一下人是怎麼做決策的,人肯定要根據當時的現狀和觀察到的環境,把諸多因素考慮進來以後,選擇一個最合適的決策方案並加以實施,這就是決策形成的過程。
在這個計算過程中存在幾個關鍵因素。
第一個就是決策者對周圍環境的認知和對當前自身狀態的認知,這個認知在決策中實際上是通過數據來顯示。早期的時候人們在做這種決策的時候往往是憑經驗,根據人們對現實狀況的總結和自身經驗的融合,最終產生一個決策方案。這裡邊反映了人們通過經驗總結出來的一定的客觀規律,這個往往是非常難以量化;
第二個就是依賴於決策理論技術的發展,經驗決策的科學依據必然不如依靠決策理論技術做出的決策。隨著科技的發展和新技術的出現,一些決策行為逐漸的變得越來越科學。當然還有一點必須要提的就是人是懶惰的,科技進步的發展都是為了讓人更懶惰一點,因此人為了更懶惰,必然要去挖掘更新的方法來使得人們的決策行為越來越容易。
下面我們來談談「數據經驗的支持」。首先給大家舉個例子,我們知道農民種莊稼這個事情很古老,在刀耕火種的時候就已經存在了,那麼農民在往一個坑裡播種子的時候要播三粒種子,那麼為什麼要下三粒種子呢?這實際上就是他做決策的一個經驗總結,如果種子播少了,將來長出來的苗可能就不那麼健全,甚至一個苗都沒長出來,如果種子播多了,就造成種子的浪費。所以播三粒種子是最為合適的,這就是最早的科學決策的形成。
這裡面體現了兩個關鍵點,第一是大量實踐經驗的總結,第二是效果的評估。你對決策的效果要做出評估,這裡面包括兩種評估,一種是後評估,就是當決策效果發生以後,需要對決策效果進行評估。還有一種是在做出決策以後就要對未來預期的效果做出評估,所以也涉及到評估的技術。
不同的決策者在反覆的決策過程中,經驗得到不斷的積累,最後一批具有同樣經驗的人將逐漸具有一些共識,這樣就形成相對比較合理的選擇方案。
我給大家舉個例子,庫存問題是物流裡面最常見的一個問題,早期人們在研究庫存問題時是研究「報童問題」。當年英國有個報童每天從事賣報紙工作,因此每天報童的第一件事是到批發商那兒批發一定量的報紙,報紙數量的多少是由報童自己決定的。那麼會有什麼樣的結果呢?一個結果是報紙買多了,然後沒法賣出去,這樣會帶來一些經濟損失。另外一個結果就是報紙不夠賣,從而損失了銷售機會,這也是一種損失。所以報童要通過平衡這兩個損失來選擇一個最佳的訂貨點。對於這樣一個問題,報童通過每天的嘗試,最終逐漸地形成一個最優策略,這個和定量分析出來的結果是一致的。後來人們考慮到由於訂貨的時候需要一個固定的支付費用,這個費用與訂貨量是沒有關係的,這個一旦考慮到這個固定費用,這個訂報紙的問題就不是一個標準的經濟批量訂貨問題了,它變成了一個Ss策略(Ss策略就是說現在缺少貨物但不馬上補貨,而是等到小s和大S那個差額量,這個差額量的產品賣出去所帶來的利潤正好覆蓋了固定費用,這樣才值)。
早期的時候人們通過經驗總結得到Ss策略的結論,而當時有個諾貝爾獲獎者叫Arial也一直倡導庫存的研究,而他當時也在用Ss策略。這個Ss策略還有一個典型的例子,1957年在美國一個關於庫存研究的學術交流會上,然後當時有三個來自東歐的學者,提出了一個反例說明Ss策略不是最優的。當時庫存界的所有人全部都震驚了,人們開始懷疑之前通過經驗得到的結論不一定是對的。後來有個叫Scaff的人,他是一個數學系還沒畢業的學生,他當時也參與了這個學術交流會,聽到他回家做了一番功課,第二天來了以後他說:「你們的這個問題我給你們解決了」。他提出一個叫做「K-two」的新概念,如果這個費用函數滿足「K-two」的性質,從理論上可以證明Ss策略的是最優的,當時Arial就回去趕緊查閱自己的所有文獻,發現所有的文章都滿足「K-two」性質,於是他說道:「我的文章至少不是錯的,只是有些地方不完善而已」。
下面我給大家舉個如何去治理假冒偽劣產品的實例。為了限制假冒偽劣產品,我們建立了非常細緻的數學數學模型,模型的結果為:商家可以購買兩種產品來滿足需求,一個是正規產品一個是假冒產品,工商部門通過工商檢查,一旦查出假冒偽劣產品,沒收假冒偽劣而不考慮其他處罰。下面這張圖表示了這種情況下作為商家的最優策略是什麼呢?這個圖上有四個區域,白色區域的叫O,當處於這個區域內時,最優策略是商家既不進正規產品也不進假冒產品,只是用當前的貨來滿足需求;當處於曲線下方O12的區域內時,這時候庫存水平從O12的點提升到S1和S2的點,提升到這個點是它的最佳的訂貨策略,這個時候商家既要進一部分正規產品也要進一部分假冒產品來應付隨機的抽查,同時滿足需求,這是它的期望收益最大化。同樣在O1和O2區域也是類似的結論。
下面我們通過一個數值例子來驗證,這個數值例子中用到了CPU的市場價格,並使用了海龍大廈採集到的數據。底下這兩張圖表示的是隨著檢查概率從0到1變化的過程中商家庫存水平的變化,當檢查概率逐漸增加時,庫存水平會從比較高的水平逐漸下降,直至下降到0.5的時候達到最低水平。這張圖表明當檢查概率在0.4以下時,市場上全部都是假冒偽劣產品,也就是商家購買假冒偽劣產品所獲得的利潤超過檢查所帶來的需求不滿足的損失;當檢查概率超過0.5的時候,這時候市場上只有真貨沒有假貨,在檢查概率0.4和0.5之間的時候是一個真假貨並存的,上面這個例子中檢查概率為0.4時,S1是真貨的庫存水平,S2是假貨的庫存水平。如果要限制假冒產品,可以通過增加檢查概率來限制。根據這個例子我們要把它延展為更為普適性的情況。
下面我給大家舉一個多階段的例子,這個例子是一個數據支持的例子。這個例子最早期是一個叫Haora的一個人,他面臨這一家叫Sears的公司如何銷售的一個問題。Sears的銷售形式是通過郵局系統郵寄產品目錄到客戶手裡,客戶根據產品目錄去勾選、寫信並支付支票,再通過郵局把產品目錄寄回來形成銷售的銷售形式。這種銷售形式下我們可以發現美國在上個世紀60年代前後Sears公司就擁有所有客戶的銷售數據,也就是在那個時候它們對於數據的收集就已經極其重視了,而且數據量相當大,所以叫不叫大數據這件事情其實在很多行業裡面倒無所謂,只是現在由於收集數據的技術水平越來越高,瞬間被收集更多的數據,所以現在把它突出成為一個大數據。大數據最早是奧巴馬提出來的,他提出大數據概念的時候只提出了前半部分的辭彙,還有後半部分的辭彙沒提出來。當時奧巴馬提出大數據時,叫「big data and decision making」。最關鍵的在於「decision making」,也就是做決策,而大數據只是為更好的決策提供更有效的保障。
通常來說,在做決策過程中都會有風險,所謂風險就是說你預期是這樣一個數值,但實際上可能跟這個數值的偏差會很大。在這種狀況下,如何把大數據和模型建立聯繫就變得至關重要,早期依靠經驗總結,這個過程中模型是隱含的。當分析技術越來越先進的時候,我們可以把很多經驗總結變成模型抽取出來,並考慮模型的各個條件是否符合現實規律,這樣我們就能通過建立模型來分析並做決策。
如果決策的依據足以夠你做決策,這時候你並不需要大數據,那麼為什麼會需要大數據呢?正是因為現實中決策過程受到很多外界不確定因素的干擾,使得決策系統變化莫測,於是我們只能採取統計的方法、各種各樣先進的技術和可獲得的一些數據來支持,但這些數據都不是確定的數據,這時候我們希望用大數據來支持。
我給大家舉個例子,「深藍」機器人是下國際象棋的,由於國際象棋的變化不夠大,因此只要人走一步,它就能把後面的步數算出來。而在AlphaGo與人的圍棋對戰中,儘管目前很多人認為計算能力已經相當大,但是依然無法把圍棋的所有情況都考慮在內。那麼在這種情況下AlphaGo要怎麼做呢?第一,通過拍照把目前的圍棋圖拍下來,通過識別白子和黑子的位置判斷目前的局勢,之後選擇一個接近於高手的走法。在下完棋子後要分析局勢的變化,然後往後模擬幾步並進行評估,之後在選擇步數的時候就需要「深度學習」。所謂「深度學習」就是通過幾層神經網路模擬人腦的學習技術。但是實際上目前人們對於神經網路的「深度學習」還是理解不夠,人們無法指出其最終一步是什麼,其計算出什麼結果人們就要接受什麼結果,這與前面「深藍」的計算原理有明顯區別。「深藍」我們可以把它看成決策樹最終導致的結果,是可預見性的結果,因此人們無法戰勝「深藍」,但是「AlphaGo」並不是不可戰勝的,如果我們無法戰勝「AlphaGo」,只能說明我們的知識儲備不夠。
還有一個例子叫「金沙賭場:不要跟賭場說謊,它真的比你老婆還了解你」,這是一個做人工智慧方面的人寫的,它說的是很多新技術早在一些領域裡面應用了,它能夠把你所有的消費數據、所有的活動數據都收集起來,並通過數據判斷你的各種情況,也就是說它真的比你老婆還了解你自己。所以我們可以看出來西方在很多地方已經把新技術應用得很廣泛了,因此我們不能從概念上去談,我們要通過實踐去做,也就是說我們要去找一些物流企業,它們到底有什麼需求?我們怎麼去挖掘這些需求?
下面我們來談談物流中的AI,物流實際上主要是提供服務,那麼物流的智能體現在什麼地方?從我的角度來講,我個人感覺是能夠更有效地為物流企業提供決策方案,也就意味著給他們提供的方案應該是最好的。從這個物流企業角度來講是一個什麼狀況呢?目前我們有很多不同的物流園區(也就是說我們有相應的倉庫),有很多不同的生產廠家(產品產出地),各個倉庫之間的距離、運輸費用和存儲費用也都不一樣,等顧客的訂單下來以後,商品通過什麼樣的流程最終送到客戶手裡?這整個是一項非常複雜的運算流程。有一個哥倫比亞大學的教授,他們曾經就單品類產品來做這樣一個運算流程時就很困難,現在我們知道新加坡國立大學等有些教授已經開始做這方面的東西,而且有一些很優秀的結果,我希望這些這些決策方案將來都有助於我們物流平台的建設。
今天的報告就做到這裡,謝謝大家。
來源:智慧物流空間
物流技術與應用編輯整理
大家都在看
物流技術與應用
權威傳媒,只為物流


※2017中國物流企業綜合競爭力100強出爐!看看有沒有你的公司?
※王繼祥:中國物流技術裝備選型基本原則分析
※國外成功快時尚企業是如何做供應鏈管理的?
※沃爾瑪的新零售玩法,推出大型O2O自助提貨亭
※家家悅:將冷鏈物流標準化貫穿供應鏈
TAG:物流技術與應用 |
※數據科學進階之路:了解數據科學工作,管理數據科學家團隊
※數據科學與數據科學家
※數據科學對科學研究的影響
※數據科學的大坑
※大數據研究項目中數據科學家需要掌握遷移學習
※愛的科學題-數學和基因的擇偶和夫妻之道
※數據科學、機器學習和AI的區別
※邏輯哲學、數學哲學和科學哲學的關係
※霍金:科學的巨匠
※AI視野:讓數據科學家做人類該做的事、人工智慧和機器學習對交易和投資的影響、人工智慧大幅降低機場行李處理費
※藝術與科學——科學主義批評潮流的啟示
※大數據作為互聯網項目與人工智慧需要科學全面的執行和發展
※北大女科學家:科學思維比科學知識的傳播更重要
※10個數據科學、機器學習和人工智慧播客
※關於數學與科學的哲學問答
※清華大學公管學院、數據科學研究院共同助力國家數據治理,國家數據與治理聯盟在京成立
※【量化歷史研究】斷絕交流對科學研究的負面影響
※數秦科技首席科學家 王毛路:大數據和金融科技,新驅動,新連接
※劉翠霞:科學的形象、劃界與普及
※《科學史與科學哲學導論》