當前位置:
首頁 > 最新 > 提升政府治理能力大數據應用技術國家工程實驗室副主任夏虎:以大數據技術服務國家教育與人才戰略

提升政府治理能力大數據應用技術國家工程實驗室副主任夏虎:以大數據技術服務國家教育與人才戰略

2018 年4月13日,教育部印發《教育信息化2.0行動計劃》,提出要實施「教育治理能力優化行動」,充分利用雲計算、大數據、人工智慧等新技術,構建全方位、全過程、全天候的支撐體系,助力教育、管理和服務的改革發展。為了解大數據技術在助力我國高校吸引高水平人才、教師隊伍管理方面的應用情況及發展潛力,我刊特專訪提升政府治理能力大數據應用技術國家工程實驗室副主任、電子科技大學教育大數據研究所所長夏虎。

大數據技術可以讓高校快速地找到符合要求的目標人才

《世界教育信息》

尊敬的夏所長,您好!很高興您能接受本刊的專訪。當今時代,人才被視為第一資源,中國高校也亟需國外人才資源為己所用。您認為大數據技術會對高校精準引進人才產生什麼樣的影響?

夏虎:高校要提高辦學水平和質量,必須依靠大量的優秀人才。隨著高校的快速發展,尤其是「雙一流」建設的開展,高校人才競爭愈演愈烈。各高校使出渾身解數,爭搶「院士、萬人、千人、傑青、長江、四青」等有「頭銜」的高端人才,而海歸人才在關注領域、創新思維、研究方法上有其獨到之處,能夠幫助國內高校在某一學科或領域迅速開闢新的陣地;其掌握的國際學術資源和語言優勢,亦可成為高校國際化發展的一大助力。國內高校引進一定比例的海外博士,對提升高等教育教學質量,推動國內高校教育國際化進程,具有非常積極的作用。然而,在人才引進方法上,目前我們缺乏科學性與精準性。例如,在高校官網上搜索潛在對象,然後通過郵件、電話、陌拜的形式與潛在人才進行接觸。這樣的方式往往是投入了大量的時間成本和人力成本,但收效甚微。

互聯網出現以後,我們在網上敲擊的每個字、每個操作都會被記錄在信息系統中,當數據積累足夠多時,便形成了大數據,數據開始變成資源,人們開始利用數據「淘金」。現如今大數據的應用非常廣泛,常見的便是企業通過對於客戶的畫像來實現精準營銷、降低營銷費用,通過對內部設備等的精準掌控來降低設備的維護修理費用等。高校人才也不例外——他們發布的每一篇文章、經歷、科研成果、參與會議的數據都會被記錄在信息系統中,將這些數據整合、分析,便能對高校人才進行精準的畫像,清晰地展現人才的經歷、成果、影響力等,這需要一個大數據分析系統來完成,也就是我們的教師畫像系統。教師畫像系統採集互聯網上公開的論文、專利、人才簡曆數據,分析人才的學習經歷、聘任經歷、教學成果、科研成果等,來形成人才的全面畫像,更清晰地展示人才的優勢、特長領域和課題、興趣愛好等,幫助高校識別哪種人才是自己最需要的。六度分隔理論告訴我們,社會網路中人與人的距離大約平均為6,也就是說,最多通過六個人,你就能夠認識任何一個陌生人。而學術圈層本身小於社會圈層,這個平均距離會更小。因此,在人才全面畫像的基礎上建立各人才之間的人際關係拓撲,通過目標人才關係的一層一層延伸,可以快速地找到適合高校的目標人才突破口,從而避免花費大量的人力和時間在搜索目標人才、建立與目標人才的聯繫上面。

大數據技術通過刻畫人才的全面畫像、建立人才圈層網路來精準引進和挑選人才

《世界教育信息》

如何利用大數據技術精準地作出人才「畫像」,精準地引進和挑選人才?

夏虎:首先是人才的全面畫像。前期調研發現,超過70.6%的科研人員至少有一篇個人主頁,其中85.6%來自高校,剩餘14.4%來自公司企業,這也使得我們採集到的科研成果數據是豐富多樣的。教師畫像系統部署了包括Linkedin、AMiner、國外知名高校官網、國內外知名期刊會議論文網站等數十個爬蟲,以獲取人才相關的信息,它們包括專利、論文、高校聘任經歷、學習經歷、所獲獎勵、職稱等。但僅僅靠互聯網數據的採集並不能形成全面的、準確的人才畫像,這是由於互聯網上的數據分散、孤立、缺乏關聯性,能得到的信息都是片面的、瑣碎的,甚至有重名、歧義等。為實現以人才為主體的信息聚合,建立隱馬爾科夫模型(HMM),自動從科研成果中抽取科研成果的作者信息,包括姓名、學校、年份、研究方向、其引用情況等信息,科研成果代表模型中的可觀察輸出,擁有該科研成果的作者為模型中的隱含狀態,科研成果之間的引用關係為隱含狀態之間的依賴,之後採用維比特演算法求解模型上的最大概率,得到科研成果的歸屬作者,由此建立人才的個人完整信息庫,分析人才的主要成果、研究領域、影響力等,形成人才的全面畫像。多個人才的全面畫像彙集,可以構建一個高質量的人才庫,學校便可以找到符合學校條件的人才名單,迅速地搜索到目標人才,這就完成了學校人才引進的第一步:挑選人才。

其次是人才圈層網路建立。引進人才是高校的最終目的,那麼在構建的人才圈層庫如何快速地獲得與人才接觸的方式?在人才庫的基礎上,我們構建了人才圈層網路,挖掘人才與校內外人才之間的關聯和親密程度。由於科研人才之間呈現出集群特性,總是存在熟人圈或朋友圈,其中每個成員都認識其他成員。集群程度的意義是網路集團化的程度,連通集團概念反映一個大網路中各集聚的小網路分布和相互聯繫的狀況。真實世界中的網路結構時常變換,因此,本系統採用社區發現演算法(Community Detection)來檢測社區,構建高校學術圈層網路。

高校學術圈層網路即「社交網路」中的「親密團體」,也即演算法中提到的社區,如果兩個科研人員在科研上互動頻繁,那麼兩者之間的社交關係密切,而親密的社交關係往往蘊含著更相似的研究方向,進而可能擁有較強的線下社交關係。在社區發現演算法中,每個個體都有一個關係鏈,這條關係鏈以自己為中心,屬於星型結構,在學術圈層的構建過程中,科研成果之間的引用關係、科研人員的研究方向及所屬單位等關聯信息都是關係鏈的體現,為不同類型的關係鏈分配不同的權重,就形成了具有權重的有向圖,而當眾多關係鏈聚合在一起,就形成了輻射狀樹形結構。首先將複雜網路的鄰接矩陣作為輸入,利用社團親近度演算法來判斷該科研人員存在於哪個學術圈;再利用社團密度演算法作為評價社團的標準,用這個密度演算法可以很好地「去噪」,得到更加精確的結果。結合上述兩個演算法,最終建立可靠的高校科研人才網路。利用該網路可以快捷查找各個學科不同研究方向的優秀人才,並了解不同人才的發展傾向。同時,沿著人才關係脈絡(合作者、校友、同學、師生等),從人才A順藤摸瓜找到人才D,避免陌生拜訪反饋不積極的問題。

《世界教育信息》

引進人才的全過程需要了解人才各方面的情況,而不單單是一段時間所取得的學術成就。您認為如何利用大數據技術了解和預測人才的各方面情況,如生活方式、習慣、即將在某方面取得的成果等?

夏虎:高校引進人才的目的多種多樣,或是加強本校優勢專業建設,或是提升教學質量,或是提升科研成果,總之是為了本校發展,因此,人才隊伍的建設是高校建設的重中之重。人才引進來以後著重的則是人才的產出:是否能達到當初引進人才的目標?人才的發展現狀是什麼?是否存在人才流失?這是高校必須要面對並且解決的問題。通過教師畫像系統,則可以清晰地看到引進人才的發展軌跡,預測人才未來的成果。

通過一系列指標對比,例如海歸博士教師入校以來首次產出科研成果的年限、海歸博士教師的科研成果與入校年限之間的關係、海歸博士教師成才率與特別優秀教師成才率、海歸博士教師入校前三年科研成果產出優秀情況與特別優秀情況、海歸博士教師的外文產出平均水平與全校外文產出平均水平對比等指標來判斷引進的海外人才對高校發展的貢獻,並以此預測人才未來將在哪些方面有更大的作為,是否可以承擔更重要的課題研究等。

大數據技術在校內教師人才隊伍管理方面應用廣泛

《世界教育信息》

大數據技術對於校內教師人才隊伍管理有什麼作用?

夏虎:大數據技術是一種趨勢,它的應用場景很多。通過近兩年的發展,我們切實看到了大數據帶給民生的便利,從國家到普通百姓。2015年,國家發布《促進大數據發展行動綱要》;2016年,出台《促進大數據發展三年工作方案(2016-2018)》;2017年,教育部印發《關於全面推進教師管理信息化的意見》,指出形成教師隊伍大數據,將教師隊伍大數據作為教師工作決策的基礎支撐和重要依據。利用大數據進行多角度、多層面、多方位的關聯分析、融合利用,評價教師隊伍發展狀況,找准教師隊伍發展問題,研判教師隊伍發展趨勢,確定教師隊伍發展重點,提升教師工作決策的科學性、針對性和有效性,這是各大高校未來發展的趨勢。

傳統的教師發展研究主要停留在經驗層面,傳統的教師信息系統只能看到單一的信息,教師畫像除了在人才引進方面能提供給高校高效的渠道和思路以外,還能對本校的教師進行精準刻畫,分析教師發展軌跡,進行個性化培養和引導。教師畫像系統通過資料庫接入、數據開放介面、離線數據導入等多種形式接入校內各部門的數據,如人事系統、科研系統、財務系統、教務系統、各學院、圖書館、留學基金委等系統,並且對接入的數據按照教育部發布的教育信息化行業數據標準和高校自身的實際情況,建立符合校情的數據標準,進行數據補全、冗餘去除、數據關聯、格式規範等數據治理,然後經過自建模型的分析和預測,得到我們想要的結果。

為教師發展提供決策依據。通過系統分析經過標準化後的數據,形成高校校內教師的畫像,可以清晰地量化教師工作績效,如教學工作成果、科研成果影響力及轉化率、同行評價等,再結合高校內部的評價體系,為教師的入職、晉陞、聘任、培訓和獎懲提供定量化決策依據。避免了傳統教師績效評估受到的人為因素影響,使得評估結果更加客觀、準確,同時也能激發教師們的積極性,營造公平、活躍的競爭環境。

預測校內潛在教師新星。教師畫像分析教師發展軌跡,基於教師基礎信息數據(包括學習經歷、海外經歷、工作經歷、崗位聘任經歷、科研項目、學科成果等),圍繞教師職業素養、專業知識、專業能力、工作績效等多方面構建教師成長軌跡,建立特定教師群體的分析,找出影響教師的發展因素,從而制定個性化成長方案。根據教師發展軌跡,預測發表論文數量、能否入選人才計劃和優秀青年教師、更擅長教學還是科研等,尋找教師個人發展意願和潛在能力的平衡點、融合點,制定適合教師的個性化發展路線,培養多樣化、個性化的教師隊伍,引導教師可持續發展,實現教師個人與學校發展的「雙贏」。

例如,通過觀察和分析本校教師的海外經歷與教學/科研成果的對比、海歸博士的外文產出平均水平與全校外文產出平均水平對比,學校可調整海外人才引進比例,或者增加本校教師海外進修比例,探索教師隊伍規模與高校發展匹配程度。通過觀察本校教師入校年限、學歷、級別、高水平論文、科研成果產出分析,預測本校年度論文產出、科研成果數量,匹配合適的項目經費。

快速組建高質量科研隊伍。高校的科研項目會跨學院、跨專業,尤其是重大的國家和省級課題,需要多方協調合作,因此科研團隊的組建非常關鍵。通過教師畫像系統可以迅速地為項目匹配到合適的科研人才,組建高質量的科研隊伍,隊伍成員各司其職、發揮所長,合理配置校內人才資源。

大數據技術在應用之時可以做到保護人才的隱私和安全

《世界教育信息》

大數據技術應用過程中的隱私和安全問題備受關注。在您看來,應如何保證人才的隱私和安全?

夏虎:如今,「大數據」已滲透到生活的各個領域。首先,學校做數據收集,不會去強調每個人的情況,而是察看教師整體的發展狀況,為學校的決策提供數據支撐;其次,數據接入時,所有的敏感信息(包括身份證號等信息)都會被進行匿名處理,即為每一個教師建立虛擬ID,形成教師真實信息與虛擬信息的唯一性映射。之後再根據數據源存儲環境的不同,採用不同的數據遷移與同步方案,將處理後的數據接入畫像系統的數據池。再次,無論來自於校內還是校外的數據,均需要經過五重加密保護;最後,數據不會對外公開,僅僅開放給教師畫像系統使用。系統將按照用戶角色進行許可權控制。

以市場需求引導技術創新和創新合作模式是促進教育大數據產業快速發展的關鍵

《世界教育信息》

您認為應該如何增強產學研用結合,為促進大數據產業尤其是教育大數據快速發展?

夏虎:高校屬於學術圈層,能夠產出很多科研成果,但是這些成果往往都待在實驗室里、論文里。只有將高校這些成果轉化到實際的社會生產中,科研才能為人類文明發展貢獻力量。

增強產學研用結合,首先是堅持企業的主導地位,以市場需求引導技術創新。把科學發現、技術發明從大學和科研機構的實驗室里解放出來,把科研人員的內在驅動力激發出來,堅持「企業為主體,市場為導向,產學研用相結合」的價值理念。突破產、學、研、用各自為政的壁壘,立足於社會發展和國家利益,將隸屬於各個不同管理體系的科技人才和資源進行有機的結合,從而實現科研產出的最大效應。因此,推動和促進產學研用結合,就必須進一步解放思想,解放科技人才,改變「先有成果,再找企業」的思維模式,進一步明確應用科研要以市場為導向,緊盯需求,形成以企業為主體的「產-學-研-用」的機制,實現產學研用的「無縫鏈接」,在與企業緊密合作的基礎上推動科研創新和人才培養。

然後是創新合作模式。以成都尋道科技有限公司為例,2014年,它依託電子科技大學教育大數據研究所,突破傳統產學研合作模式,成為國內首個教育大數據領域產學研一體化的平台。目前,公司規模已達70人,4位創始人都是博士,研發團隊裡面50%以上都是碩士。此外,研究所還擁有一個70人的研究團隊,包括2名「青年千人計劃」入選者、5位教授,由他們來保持教育大數據研究的先進性。經過三年的發展,這種模式體現出了以下優勢:第一,實體模式的公司運作方式使該類合作有了落地的平台,有利於研究所科研團隊與公司研發團隊的積極性,為實現共同利益追求而緊密協作;第二,將所里的人才資源優勢與企業的產業優勢相結合,能夠有效整合和集成雙方在高校的資源和力量,實現科研與產業相結合以及應用研究、產品開發、生產營銷一條龍,加快了高新技術成果轉化和產業化的步伐;第三,通過產學研一體化,降低了公司技術創新成本,掌握了核心技術或專利技術,能夠迅速建立技術壁壘,而公司產品的快速落地實踐,也為研究所提供了技術驗證的平台以及海量的實測數據,為師生的實踐創新提供了良好的平台;第四,一體化的創新模式打破了產學研之間的封閉隔絕狀態,促進了各方創新要素優化組合、核心能力整合以及人員的雙向流動,提高了雙方整體的技術創新能力。

採訪、整理/張力瑋 杜永軍 郭偉

來源:世界教育信息雜誌2018年第12期

轉載請註明來源:世界教育信息微信公眾號


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 實驗 的精彩文章:

從青山研究所到空白實驗室,最近甜品店都不做美食改做實驗了?
DCC攜手共識實驗室 千萬社群流量助力全球普惠金融生態構建

TAG:實驗 |