數字中國建設進入高峰期,如何成為領跑者?
我們正處在難得的歷史機遇期,數字化、智能化已經出現拐點。
4月21-25日,百分點受邀參加首屆「數字中國建設峰會」,為了契合「成果展示平台「的定位,特展示了人民日報和人民數字聯合百分點推出的「中國智能作詩詞機器人——AI李白「。值得強調的是,在峰會同期邀請到了《中國詩詞大會》總冠軍——外賣小哥雷海為,與機器人現場斗詩,最終孰勝孰負?
從產業角度看,從政府到企業到人民百姓,發展數字經濟成為各方認可的方向。那麼,在人工智慧應用爆發、數字中國建設高峰期,人工智慧領域還需要實現哪些技術突破?如何領跑數字經濟?
01
人機大戰再次升級
此次斗詩是人機大戰的升級,是一場人類高手與AI作詩的較量,更是一次人工智慧認知層的突破。
相較以往的人機大賽,無論是圍棋大戰還是德州撲克對決,大都是基於數據驅動,是隨著演算法和計算力的提升而取得的機器勝利。
然而目前在語義理解上,突破者甚少。百分點將深度學習引入到自然語言處理技術中,並結合動態知識圖譜,基於對80萬首詩詞文章的學習,可根據不用的語境智能生成唐詩以及五十多個詞牌的宋詞,對傳統文化與最新的人工智慧技術進行了創新融合。
實際上,AI李白的首次曝光是在春節期間,主要圍繞新年送祝福主題。此次峰會上展出了第二個版本,不僅可以讓人體會到「一秒變李白」的神奇,還能與人互動對「飛花令」,將《中國詩詞大會》由線上轉到線下真實場景中,讓人工智慧應用普惠到更廣泛人群中。並且更好玩有趣,機器人可識別觀眾語音,根據語音生成個性化的詩和詞。
也因此,在人民日報旗下人民直播平台上,全程直播了這場AI李白挑戰雷海為的斗詩賽,結果不出意料,人類高手雷海為贏得比賽。直播的同時,基於樂調查的實時在線投票中,支持AI李白的觀眾反而佔了一多半。
對此,百分點董事長兼CEO蘇萌博士認為,在即興創作詩詞的挑戰賽中,人機各領風騷。在全文邏輯和情感細膩度上,人類高手更勝一籌;在寫作效率和短文本的用詞上機器後來居上。
經典古詩詞是語言中的精華,充滿人類情感,可以使語言思維得以升華。這就如同AI李白,也是通過NLP和知識圖譜對古典詩詞進行語義理解,自動學習發現詩詞中的特徵和規律,捕獲上下文複雜的語言依賴關係,從而訓練出智能作詩的模型。未來在深度學習演算法持續升級換代後,系統也會持續進行自學習、自優化。
蘇萌博士表示,這場斗詩賽,意味著機器已經走進藝術領域,可以理解人類,進行一些創造性突破。希望今後可以用大規模盲測的方式量化評估人與機器的詩詞創作水平。
02
未來突破
AI正在以人類無法想像的速度演進。
最近幾年,隨著大數據技術、演算法以及GPU計算能力的大幅度提升,使得神經網路的計算效率得到了顯著的提升,深度學習在圖像、人臉識別等感知層已經實現明顯突破,比如峰會現場「刷臉」入場採用的人臉識別技術,其準確度高達99.7%,已超越人類。
蘇萌博士認為,智能是解決實際問題的智能,智能進化三部曲包括感知、認知、決策,其中智能決策是其終極智能。然而,從感知到認知再到決策,每一步突破都會越來越難。尤其是NLP被比爾·蓋茨形容為「人工智慧皇冠上的明珠」,處於認知智能最核心的地位,一旦技術突破將會推動人工智慧整體的進展。
但是目前,NLP目前依然處於基於淺層語義的分析階段,缺少對現實的理解及對現實通用知識的掌握,在效果提升上已遇明顯瓶頸。
百分點早在2016年將深度學習引入自然語言處理上後已意識到此問題,便著手在知識圖譜結合自然語言上進行探索研發。目前百分點在分詞識別準確度已經達到98.97%、實體識別準確度達到91.45%,已走在了行業前沿。通過自然語言處理技術,理解人類的語言、思維,語言是人類文明傳承的載體,一旦機器學會人類語言思維,可以推動知識圖譜的進一步發展,機器可以更好的「讀懂」人類。
此次斗詩大賽,說明了百分點在自然語言生成技術(NLG)方面實現了突破,也是人民日報社聯合百分點引領國內媒體率先探索智能采編業務的體現。在認知層,百分點將持續投入研發,實現更多突破。
在會上,人民日報數字傳播有限公司董事長徐濤表示,已與百分點達成深度戰略合作關係,希望將百分點在人工智慧領域的突破性技術應用到人民日報數字屏幕上,給社會提供更多的數字文化產品。
各種人機頻繁上演的背後,實際上是意味著我們已經進入到人機共生的未來社會新常態。如果說90後屬於互聯網原住民,那麼現在的青少年,就是人工智慧爆發期的原住民。因此,展館中處處可以看到「帶娃參會」的場景,更有中小學校組織學生來參觀。
未來,AI2.0時代產生的各種應用產品,會讓人類生活更加美好,另一方面,不善於使用人工智慧的,會真正被同齡人拋棄。
03
領跑數字化轉型
在峰會主論壇上,國家網信辦發布了《數字中國建設發展報告(2017年)》。報告指出,我國數字經濟規模已經位居全球第二,尤其是「互聯網+政務」讓人民群眾獲得感顯著增強。無論是政策層還是實際應用場景都已明晰,未來將進入加速跑階段。
那麼需要思考的是,如何才能領跑?在數字中國建設進入高峰期之時,所處的是數據密集型和知識密集型時代,數據是數字經濟最基本的物質基礎,人工智慧技術是其技術手段,以其為代表的新一代信息技術將成為拉動數字經濟的新動能。
百分點自2015年開始深耕數字化轉型,為解決企業機構實際問題,基於大數據全棧技術和人工智慧認知技術進行雙輪驅動,通過語義理解將信息知識化,從語義到知識,最終支撐政府進行智能決策。
目前,百分點已經覆蓋主流媒體出版機構、政府公務事務、智能製造、零售等龍頭企業,並建設了海外國家級大數據和人工智慧平台,是國內實體經濟數字化轉型和數字經濟國際合作方面的先行者。
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
TAG:百分點 |