當前位置:
首頁 > 最新 > 數據科學之七個數據實驗室最佳實踐

數據科學之七個數據實驗室最佳實踐

也許您正在尋找更好的方法來執行數據實驗並促進數據發現和數字化創新。 或者你正在嘗試開始使用機器學習來通過數據實驗室發現更多的業務創新機會。

當然,數據實驗室就是一個很好的開始。 數據實驗室使數據科學和新數據的實驗更加可行。 機器學習等複雜分析可能會對生產系統的服務水平造成壓力。但擁有數據實驗室可確保您的數據科學家可以根據需要進行實驗和運行分析,而不會對系統造成壓力並面臨來自其他團隊的投訴。

對於許多人來說,建立和實施數據實驗室是一個新項目。事實上,您甚至可能在公司建立了第一個數據實驗室。

那麼如何確保數據實驗室獲得成功的呢? 在本文中,我們列出了七個數據實驗室的最佳實踐。 請記住,這些最佳實踐旨在讓您超越體系結構和實現的細節,以及更廣泛的獲得支持和採用。

數據實驗室最佳實踐#1:快速獲勝

和三四個月後有三個產出相比,兩個月甚至更短時間有一個產出更好。您的數據實驗室可能是一個對領導而言高度可見,並且昂貴的項目。 人們希望證明它正在發揮期望的作用,並且立即就想看見。所以不要試圖只玩數據沙箱。相反,請牢記需要有一個與關鍵業務利益相關者的目標一致的業務目標。

您需要從IT和業務角度展示數據實驗室的價值,以獲得儘可能多的支持。

對於IT,請證明您最大限度地減少了實驗室對生產系統的壓力。對於企業而言,現在可以通過簡單的方式展示公司開始省錢或最大化收入的方式。如果您沒有任何想法,請與該部門的業務負責人會面並進行頭腦風暴。 這裡有一些可以參考的點:

如何設計服務以最大化廣告收入?

最佳的數據組合是什麼能幫助讓客戶更有可能接受移動優惠推薦?

我需要哪些數據? 我該如何組合這些數據呢? 我從哪裡得到它?

專註於快速獲勝,但要記住未來的改進和更複雜的項目。

數據實驗室最佳實踐#2:考慮從現有數據開始

請記住,即使您一直在收集或清理新數據,現有數據也會有價值。如果您已經有可用的標記數據,請考慮創建一個用例,以便您可以更快地開始使用。有時這可能圍繞重組您的項目範圍。讓我們說理想情況下,您的業務部門希望360度全方位地了解客戶,以獲得更有效的客戶促銷。這是一個複雜的項目,需要大量的數據。

例如英國的國民健康服務使用現有數據來幫助加速他們的快速獲勝。他們將付款,其他交易和客戶投訴視為要調查的欺詐案例的首批數據。停止欺詐或恢復欺詐性索賠通常是一個很好的快速獲勝。

一旦你獲得了一些快速獲勝的應用點,你就可以開始處理需要更多資源或更多種類數據的更複雜的項目。但特別是在早期階段,重要的是要記住大多數企業不會關心機器學習演算法的複雜性或創新性。

他們想要結果。 他們獲得這些結果的速度越快越好。

數據實驗室最佳實踐#3:嘗試在候選應用隊列中擁有更多實驗項目

我們已經說過你應該有一些快速的勝利。我們還說過你應該從現有數據開始。現在我們想說你應該嘗試在候選的應用隊列中嘗試安排更多項目(但也不要太多 - 需要保持平衡)。

您應該記住,並非每個數據探索項目都會產生可行的結果。如果這個想法只能說明漸進式變化,那麼它可能無法顯示出足夠的成本節約和易於實施的想法以獲得領導層的吸引力。僅僅展示數據實驗室確定價值的多種方式對您來說是不夠的。執行團隊想知道有多少這些想法得到了實施了。

這就是為什麼你應該在管道中有很多候選數據項目,以減少失敗的機會。但是也要嘗試一些重點。

數據實驗室最佳實踐#4:保持管理層對你項目的支持

我們假設你有一些行政管理層的支持來實現這一目標。 但是你需要持續保持他們的參與度。 這也與之前的觀點有關 - 提供一些快速的勝利。

但不要止步於此。 看看你可以加入哪些業務高管。你能在其他地區快速獲勝嗎? 你不想讓自己和你的資源過於緊張。但與此同時,理想的願景是一家滿是高管要求更多機器學習項目的公司,並為您的數據實驗室提供大量支持,因為它被視為公司的重要組成部分。為此,您可以提供有關機器學習可以執行哪些業務操作的管理層對話,以及關於如何幫助其他業務部門擴展的想法。是的,這確實需要額外的工作,但如果您決心讓您的數據實驗室成為業務的基石,那麼它是非常值得和重要的。

數據實驗室最佳實踐#5:操作數據

你可能會認為你的數據科學工作在尋找到業務見解就結束了。但事實並非如此。 您需要推動您的高管和其他業務負責人將您的發現付諸實施。 看看您正在為之工作的業務部門或業務負責人。他們讚美你的發現但從未實施過嗎? 如果是這樣的話,是時候應該認真的開展對話了,甚至應該找到一個業務團隊進行合作。

考慮您可以創建的可操作報告,或提出現有應用程序和流程的改善建議。 您的發現可能會影響全新的服務,應用或產品的創建。請記住,數據實驗室,並不是要發現有多少見解。 您的企業關心的是節省了多少資金以及創造了多少收入。 如果您能指出團隊產生的實際收入,那就最好了。

數據實驗室最佳實踐#6:確保您擁有可擴展的平台

請記住,雲是數據實驗室這種類型的應用的理想平台。 您可以在那裡配置實驗室,存儲大量數據,並根據需要啟動和降低靈活的分析工作負載。 最好的情況下,您只需支付所使用的費用,從而最大限度地降低您的成本和風險。

除了擁有可擴展的平台之外,您還需要資源和人才來執行。 如果不這樣做,您可能會從第一天開始積壓大量數據項目。這就導致了最佳實踐#7。

數據實驗室最佳實踐#7:支持您的數據科學家

一個優秀的數據科學家是能值得他或她的黃金價值的。確保您的數據科學家獲得足夠的支持並為他的工作成功提供足夠的保障。將他們聚集在才華橫溢,多元化的團隊中。為他們提供想要的工具。 並確保您的管理層容忍風險。 您的數據科學家可能需要一段時間才能找到每個人都在尋找的深刻的業務勝利。因此,相應地設定期望,同時確保您可以找到快速輕鬆的勝利,讓每個人都開心。

結論

這就是我們實施成功的數據實驗室的七個最佳實踐。 數據科學可能並不容易,但擁有數據實驗室可以讓您更輕鬆對開始這一切 - 我們希望本文能夠幫助您更輕鬆地獲得成功。

如果您想再向我們提問,請隨時與我們聯繫。

分享:


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 實驗 的精彩文章:

智能輸送設備虛擬實驗系統-虛擬模擬軟體系統設計
你是不是也被凈水器商家的小實驗迷惑過?

TAG:實驗 |