當前位置:
首頁 > 最新 > 模型治理是數據治理的關鍵

模型治理是數據治理的關鍵

近日,銀監會發布了《銀行業金融機構數據治理指引(徵求意見稿)》,猶如一石激起千尺浪,幾個圈內朋友紛紛來電,討論這次新的契機以及國家下一步的動向。然而作為一個了解國外和國內數據治理狀況的從業者,我卻在冷靜的思考著,我欣喜國家戰略層面的推動,同時也擔憂這會是又一次運動式的數據治理,熱潮過後只是泛起一些塵埃。

我們國家的金融和電信業是數據治理的先驅,我現在讀的幾本數據治理書籍也是我國第一代數據治理精英撰寫。那個時代的關係資料庫和現在的大數據一樣火熱,那一代人都熟讀資料庫原理,用著Erwin/PowerDesigner工具,謙虛的學著國外的數據開發方法。後來互聯網熱潮了,我不知道從何時起,資料庫再也不建主外鍵關係了,資料庫設計都直接ORM了,甚至變成了程序的一部分了。再後來又大數據了,然後就焦慮了,焦慮自己都有些什麼數據,大數據平台放什麼,於是乎就開始風起雲湧的治理了。

說起來挺有趣兒,突然覺得有點像工業與環境的關係,先污染才能發展,發展了再治理。好吧,也許這是社會發展的規律使然。那麼說回來,我們過去的數據治理的問題是什麼,如何讓這次契機能夠影響深遠,真正促進國民企業走入數據化經營時代,這是每一個行業相關者應該思考的問題。

那麼我先來拋磚引玉,說的偏頗,歡迎拍磚

首先,我要問一個問題,在企業數據的生命周期(調研,開發,生產,應用,分析)中,哪一個環節造成的數據問題最多? 毋庸置疑,作為一個十幾年的開發者深信,大多都是開發階段直接造成或間接埋下的,因為開發階段,決定了未來數據的輸入方式,形態,格式,甚至質量等。所以把開發環節控制好,就從根本上扼住了數據治理問題的源頭。在開發環節上,數據模型是其中最最關鍵一環。說到此,我也不僅頓足,國內現在還有很多大型企業還在用Excel/Word來進行數據字典的管理,比起20年前感覺還退步了。一個數據字典僅有數據描述,數據關係統統漏掉,資料庫又沒有主外鍵。到進行數據分析時候,這都是致命傷啊,恢復關係是個成本很高的工作。

有時候,我在想這是我們在長線思維上的缺陷,還是這些建模工具太貴太不適合國人了。相比,我見過一些做的好的企業,系統而體系的使用模型工具,每天報表自動監控模型的修改,數據字典都是從模型導出。對於他們來說,數據治理真的是一項面向更高數據價值挖掘的工作,而不是諸如梳理數據字典,還原曾經是數據真相的主題,當然還有猜出來的數據關聯,這些費力不討好的活兒。

數據治理的方法論無疑是偉光正的,然而落地實施確實是多方掣肘的難題。大家都知道數據治理實施的核心三要素是政策流程、工具、監管,只有三管齊下,才能保證有效的執行,缺一不可。

如何做好數據治理?

這個三角中,我國的經濟和企業體制下,最擅長的無疑「政策」這一環,英明的領導們開個動員會,發個紅頭文件,是最容易做的。不過從歷史經驗看,這些活動都屬於運動式的治理活動,上層轟轟烈烈,下面的廣大碼農仍然在用自己的名字命名欄位。數據的上下兩張皮問題,沒有從根本上解決。有一些企業制度了流程規範,但是對於開發者來說,這些規範都是有一些為了治理而治理的流程,執行起來是有抵觸的,註定效果也是不好的。基於這一點,我們不能再怪領導沒有決心,員工不太積極了,我們需要新的思維走出人治的陳舊方式。

正如前言,我認為國內企業在工具這一項上是最弱的,國外的工具還是偏貴的,免費版的東西,自己也不敢認真用,最終造成模型工具都是個人行為,而非企業統一的規範。這也造成了源頭治理在我國大部分企業沒有做好,處於一個治標不治本的狀態。所以我認為高大上的政策需要有效的工具將其落實到正常工作環節中,尤其要輕流程,讓大家付出儘可能少的成本,隨手把工作做了最好。

監管這一塊,強於政策,弱於工具,敗於成本。國外有句名言,no measurement,no management (無法衡量,就無法管理),沒有自動工具的輔助,淪為人治困境,勞民傷財,不可持續,結果可想而知。

文至此,提幾條建議:

1. 從今天起,開發團隊的發布和上線,必須有模型,取代Excel版本的數據字典,Excel數據字典應該是只讀,不能作為維護元數據的工具。這個應該不難。

2. 自動監管起來,保證元數據的更新機制,模型和資料庫的一致性。這個是對數據生產和管理的關鍵,沒有自動工具,這個數據治理是失控的。

3. 如果老闆有錢,給團隊買個建模工具,成系統的推廣使用,從習慣上培養數據治理文化和流程。人很多時候,對一件事情認不認真,就取決於花沒花那個錢。

總結

目前大部分企業在數據治理上還是初級階段,首先是解決存量數據的理解問題,這個是數據應用的關鍵。雖然全公司投入數據治理活動固然是難能可貴,但是要真的想長期解決問題,還是要更多的參與方形成操作共識,目前這個共識就是模型工具,作為國內首家模型工具提供商,我們集成了模型管理工具和數據目錄平台,可以自動完成模型多人共享,和數據目錄平台的監管集成。一站式數據治理,簡單有效,讓大家都輕鬆完善數據,讓公司的數據逐漸沉澱出業務內涵,發掘數據價值就是水到渠成了。

———— / END / ————

感謝閱讀本文章,歡迎留下評論及個人見解!

原創文章作者

朱金寶CTO

前ERwin總架構師,10年ERwin研發經驗. 負責產品全生命周期的發布,豐富產品發布和架構設計經驗,多個大數據建模專利所有者和技術文章作者


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 全球大搜羅 的精彩文章:

化妝新手必buy!
這裡的陽光似情人——泰國曼谷芭提雅五日遊記

TAG:全球大搜羅 |