當前位置:
首頁 > 最新 > MAS首席數據官:監管如何迎接數據科學挑戰

MAS首席數據官:監管如何迎接數據科學挑戰

本文翻譯自新加坡金融管理局首席數據官David Hardoon博士於2017年8月24日在第七屆Sim Kee Boon研究所數據科學進展與商業影響會議上的主題演講。

在實踐中數據科學和機器學習對我們意味著什麼,今天我將就此展開。

回顧過去

在過去的兩個月里,我們的團隊已經做了相當多的信息收集和探索:

我們一直在與金融管理局的各個部門合作,看看如何更加智能地使用數據和分析工具來加強我們履行職能的方式——無論是金融監管還是中央銀行或行業發展。

我們還與MAS(新加坡金管局)以外的各種組織和個人進行了交流,包括學術界、金融機構、其他政府機構、服務和軟體提供商、初創企業等——一同建立探討協作、試點測試、信息共享和數據方面的合作夥伴關係。

我們現在開始建立必要的工具、基礎設施和技能組合,利用數據科學的力量發掘洞察力,加強對風險的監控,加強合規性並改變我們的工作方式。Alan Turing在他的1950年的論文中首次介紹了圖靈測試的概念——圖靈測試是一個可以輔助人們區分他是正在與機器還是與人交談的測試。在這份1950年的論文指出「我們只能看到前方很短的距離,但是我們可以看到很多需要做的事情。」

快進到2017年,我們仍然在努力用1950年的一篇論文寫出一個概念。

我們將與大家分享一些關於我們如何計劃實現這些目標的想法,以及MAS和未來數字經濟的金融部門的定位。

定義

我想首先定義「數據科學」的含義,這並不是一個絕對的定義。

對我們來說,「數據科學」是通過演算法從數據中獲取見解的業務。這與人工智慧不一樣——洞察力和數據本身不是「智能的」。我們所要做的是以更智能,更系統的方式獲取數據驅動方面的見解。

組成

我們在這方面看到了四個組成部分:

首先,正如人們所期望的那樣,按順序獲取數據。這不僅涉及到我們所需要的數據,而且涉及數據的必要過程。

其次,部署適當的工具或技術能力。這包括機器學習,自然語言處理和網路分析演算法等,以找出數據對於模式和行為所表達的或可能表達的。

第三,建立必要的基礎設施,以促進我剛才提到的兩個組成部分。這需要做出使用方面的決定:

a. 數據收集和提交的統一平台

b. 雲技術運行數據分析

c. 可重複使用的工具和代碼庫

d. 用於傳播數據的可伸縮性API

第四,在這些領域培養相關的技能人才,這樣我們不僅可以在正確的基礎設施上使用正確的演算法,而且可以理解演算法在做什麼,以及結果對於決策的意義。這超越了數據清理的科學,需要理解演算法背後的數學。這是將演算法輸出為語境化的藝術。出於這個原因,我個人認為只是成為一名數據科學家是不夠的,而是要渴望成為一名數據藝術家。

組件

現在我們簡要介紹四個組件——數據、工具、基礎架構和技能。

我們將這四個組件視為任何成功的數據科學創建的基石,這些基礎構建塊是基礎性的,因為如果這些組件中的任何一個缺失,我們就無法獲得良好的數據驅動的見解。這四個組件也是相互關聯的,因為我們對這些組件的選擇取決於我們對其他組件的選擇。

這些是我們的主要觀點,現在我把後面的談話集中在實際的實施上,特別是我們計劃在MAS和其他金融部門實施數據科學的方法。我們看到了將數據科學和機器學習付諸實踐的兩個主要組成部分——一個是夥伴關係,另一個是實驗。我們試圖同時採用。

Hub-and-Spokes合作

在MAS內部,DAG與MAS部門合作,我們稱之為「中心輻射」模式。

首先,雖然DAG可能具有機器學習、自然語言處理和網路分析演算法方面的一些分析和技術專業知識,但是MAS中具有專業知識的各個部門都是如此。作為中心,DAG正在與各個部門一起合作,真正的去了解問題,了解我們要解決的問題的類型,然後找出解決這些問題的適當工具。盲目應用先進的演算法而不了解實際問題將對解決問題沒有任何幫助。在任何情況下,分析如何與專業領域的知識融合將使我們能夠找到新的、更有效的工作方式。

其次,數據科學不應該是一個獨立的概念——它應該成為每個人的業務和工作的組成部分。無論是現在還是未來的願景,以及是否明確地稱其為「數據科學家」。為了真正運作,我們需要認識到數據科學的要求會因人而異,而不是一個普遍適用的情況。所以,將數據科學視為單一群體的專業領域是沒有意義的。

我們計劃與金融領域的其他部門以類似「中心—輻射」的方式開展工作,並且我們希望能夠儘可能多地與利益相關者進行合作。

SupTech-RegTech的聯繫

通過接觸RegTech或Regulatory Technology(監管技術)來解釋這個問題可能更容易一些。RegTech或Regulatory Technology技術是應用技術來提高金融機構監管合規性的方式。SupTech基本上是同一枚硬幣的另一面——應用技術來提高金融管理局執行金融監管職能的方式。

舉例來說,RegTech的潛在應用是在反洗錢和反恐融資(簡稱AML / CFT)領域,其中高風險的AML / CFT案例可用於培訓機器學習演算法以識別潛在的未來金融機構可以進一步調查的案件。明確的驅動因素可能有助於我們更詳細地了解風險分布、行為、干預的有效性以及錯誤或錯誤否定。

我之所以說RegTech和SupTech是同一枚硬幣的兩面,是因為這不是MAS與金融機構之間的競爭。恰恰相反,由於在RegTech—SupTech領域應用數據科學有利於單個金融機構和整個金融系統,我們在DAG內部建立了專門的監管科技辦公室(SupTech,Office)。

RegTech方面——促進金融行業的數據分析能力,促進創新,並使法規遵從更加高效和有效。

SupTech方面——與監管部門合作進行數據分析,加強對金融機構的監管。

我們希望雙方相互促進,使金融體系中的風險能夠在個體和集體兩個層面得到更加有效率和有效果的管理。

對於金融機構的高級管理人員,我強烈建議您不要僅僅將合規職能視為成本中心,而是將其作為方法論和洞察力的豐富來源。找到方法利用合規數據來尋找一些聯繫和模式可以幫助您更好地了解客戶和業務活動。探索在合規領域的技術方法,以增強其他業務活動的功能。我們希望與您共同分享方法和見解,以便我們每個人都可以改進我們的工作方式。

我們積極地想要消除影響整體提升數據分析能力方面的摩擦—這可能是最重要的工作,包括當我們提前不知道答案時,在監管沙箱的環境中共同工作。

目前,SupTech-RegTech包括工具和技能,這是數據科學四個關鍵成分中的兩個。現在讓我談談我們將如何解決其他兩個問題,即數據和基礎設施問題。

促進數據流動

我認為,我不需要不斷強調獲取數據以便有意義地應用數據科學的重要性。然而,處理數據通常是數據科學過程中最被低估,繁重和耗時的部分。我們想要做的和應該做的是儘可能無縫、輕鬆地處理數據。鑒於數據量只會增加,我們必須正視這些核心的數據處理工作,並在此過程中使數據處理工作變得有趣。

我們計劃做更多的工作,使金融機構和研究人員更容易使用數據進行自己的分析。當然,這也需要恰當的控制措施同步實施,因為在某些情況下,我們可能無法分享詳細的數據,但我們可以分享總體情況。我們也會反饋我們從數據中得出的見解,增加行業內的思想共享,營造知識共享的環境。

在DAG中,這是數據治理和架構辦公室(Data Governance and Architecture Office)將投入最多努力的地方。它將負責MAS的數據治理和管理。它將尋求金融業的切入口,看看我們如何能夠加強MAS的數據收集和簡化管理流程,並落實必要的基礎設施和平台的建設來實現這一目標。它也將努力向公眾發布更多的數據和報告。

強化MAS的內部功能

最後,我們將落實我們的發言,將MAS中的所有關鍵要素數據、工具、基礎設施和技能集合到MAS中,以推動數據文化。我們也將嚴格遵守我們所期待整個金融界達到的標準。DAG的專家分析和可視化辦公室(The Specialist Analytics and Visualisation Office)正是負責這個目標,以推動整個MAS的分析議程。當我們建立數據文化並推動我們的能力建設時,我們希望金融機構比我們做得更好。

作為媒人(matchmaker)的MAS

這將我帶入了我們「中心與輻射」合作的最後一個要素。由於我們都在共同研究如何最好地採用數據科學來改進我們的工作方式,所以我們相信最有效的方法就是分享想法和專業知識。

為此,MAS將扮演matchmaker的角色。在過去的兩個月里,我們不僅向金融機構伸出援助之手,還向學術界和其他政府機構等其他利益相關者伸出援助之手。我們希望建立一個志同道合的從業者和研究人員社區,以促進數據科學理念在金融領域的交叉融合和實驗。

這是我的一個反思,這個反思是數據科學時代,人的而不是機器的作用。

在我們採用數據科學的過程中,數據科學家將接管所有的工作,這是一個共同的擔憂。除此之外,還有對機器人也將接管我們的工作的恐懼。不僅是金融領域還是在其他工業領域,這是人們非常真切的擔憂。我想明確地提出這個問題,並且看看我們如何共同合作來持續不斷地解決這些問題。

在這之前,讓我講述一個一百五十多年前的故事,那是在十九世紀六十年代,印表機被發明出來,並開始在市場上銷售,用於專業和商業通信。知道如何打字最初是一種難得的技巧,打字被認為是一門局限於少數人的專門技能。隨著印表機的使用越來越普遍,每個人都想成為一名打字員——而現在,編輯word文檔被認為是許多工作的基本要求。

我想說的是,無論我們喜不喜歡,技術進步都會發生。我們不應該抵制變革,而應該擁抱它,做我們能做的事情,並且必須為未來的變化做好準備。毫無疑問,技術和數據科學,機器學習等等都會改變當前工作的性質,但這並不意味著工作就沒有了。事實上,我相信會有大量的工作,其中一些我們還沒有想到。

正如我在發言之初提到的那樣,人們將持續在把數據科學的結果放到對應的環境中發揮非常重要的作用。我們仍然需要人們查看複雜的機器學習演算法的輸出,解釋結果,決定它的實際意義,以及決策和政策制定的建議。要弄清楚我們試圖解決的問題的最終目標是什麼,以及我們應該使用的演算法和技術的合適選擇是什麼。洞察力可能來自於已經通過最複雜的演算法處理過的數據,但是最終我們人類需要把分析放在特定背景下,從中汲取意義,並做出最終的決定。

展望

我們正在轉型,為這些變化做好準備,為金融業做好準備。在MAS內部,DAG的一部分職責是為MAS員工開發數據分析培訓計劃,以便我們能夠利用數據科學來加強我們的工作流程。

我們正在反映這些在金融行業其他領域的再技術化和技能提升方面的努力。當我們探索和推動技術的研究和發展來改變金融領域的工作流程時,我們不會忽視評估採用這種技術對勞動力的影響的必要性。我們已經並將繼續與這些問題的工業界和學術界進行接觸,並呼籲建立彼此之間的合作夥伴關係。

此外,我們將研究如何更好地推動我們增強金融業專業人士能力的倡議。金融部門發展基金(FSDF)有幾個現有的計劃來支持金融服務部門所需的技能和專業知識的發展升級。僅舉幾例:

金融獎學金計劃為新加坡人提供專業金融領域的研究生課程的資助。

「金融行業技能未來研究獎」支持金融專業人士參加課程或課程,以精進他們的技能,特別是在工業專業知識仍然短缺的領域,包括數據科學領域。

有許多資金計劃已經到位,但是我們希望看到我們可以做更多的事情,以確保金融部門的勞動力在這個數字化轉型之旅中繼續保持領先。

此外,銀行和金融學會將推出移動學習平台、數字意識、數據驅動型決策、以人為本的設計、敏捷思維、未來交流等領域移動學習內容的傳播,以及數字世界的風險治理。數字化在銀行和金融流程中扮演著更為重要和不可或缺的角色,這六大未來具備的核心技能將有助於提升金融部門的勞動力流動性,並增強其應對行業變化的能力。

結論

艾薩克·阿西莫夫曾經說過:「我不害怕電腦。我擔心它們的缺乏。「考慮到我們今天是如此的依賴計算機和演算法,我無法想像如果我們要回到打字機生成文檔和打孔來處理數據的時代的話,金融界會變成什麼樣子。

先進的計算和數據科學在金融領域的應用將不可避免地繼續下去,這無疑將改變我們的工作方式,改變金融機構的運作方式。

我們將與大家——學術界、初創企業和行業從業者一起,共同創造一個具有必要的數據、工具、基礎設施和技能的環境,來改進數據的利用,並以此獲得新的見解,改進決策,使得新加坡的金融業適合未來的數字經濟。

(本資料由亞太未來金融研究院研究團隊編譯製作。)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 亞太未來金融研究院 的精彩文章:

何大勇:Fintech的國際發展趨勢與監管動態

TAG:亞太未來金融研究院 |