當前位置:
首頁 > 新聞 > 機器人的數學高考輸在語文上 自然語言識別成難題

機器人的數學高考輸在語文上 自然語言識別成難題

11個黑色方盒子被裝在一台一人多高的機櫃里,身後連著密密麻麻的電線、網線,設備嗡嗡作響,信號燈不停閃爍,旁邊兩台空調正在抓緊工作。如果室溫超過25攝氏度,這11台伺服器將可能宕機。這是6月7日傍晚,發生在成都高新區一個創業園區內的場景。「



準星數學高考機器人」AI-Maths在這裡迎來了屬於它的2017年文科數學「高考」。


這是人工智慧向人類發起的最新一場挑戰。此前,谷歌公司旗下DeepMind公司研發的人工智慧機器人AlphaGo先後戰勝頂尖棋手李世石和柯潔,引發了人們對人工智慧會不會超越人類這一話題的熱議。

斷網、斷題庫,閉卷考試


AI-Maths是在一個與互聯網隔絕的空間進行答題的。研究人員強調,AI-Maths不是依靠數量龐大的題庫進行比對、作答的,它主要靠系統學習知識點,形成邏輯推理能力後進行自主解題。


由於涉及試題保密,機器人無法與全國考生同時、同場競技。考試現場,數十位工作人員在緊張「備戰」,焦急地等待網路上更新高考試卷。記者的長槍短炮已經包圍了這些可能的信息來源。現場緊張感十足,哪怕一點響動都能吸引一批人探尋的目光。


研發AI-Maths的成都準星雲學科技有限公司負責人稱,這是人工智慧第一次向複雜綜合推理技術發起挑戰。此前,研究人員為它設定的考試目標是110分。而在今年2月的一次模擬考試中,它只獲得了93分,剛過及格線。


在過去3個多月的魔鬼訓練里,AI-Maths的做題數量從起初的100套試卷增加到大約500套試卷。


這是它「一個人的高考」。考場中只允許它獨處,不能有任何人為干涉。它不能像其他機器人小夥伴一樣,靠連接網路資料庫和題庫獲得答案,一切都憑藉那11台伺服器。它必須獨立完成讀解、計算,與普通考生無異。


成都準星雲學科技有限公司CEO、清華大學蘇州研究院大數據中心主任林輝向記者表示,聯網、聯題庫的狀態下答題,就像一位考生在自由開放環境下的開卷考試,目前市場上已有很多應用。但AI-Maths要做的是模仿考生封閉環境的閉卷考試,現場到處貼著「所有設備斷網斷庫」。


為了讓這場考試對人類更公平,林輝邀請了三位專家擔任「監考官」,從斷網情況到用於拷貝試題到伺服器上的U盤是否夾帶「小抄」,他們都在眾多直播鏡頭下現場完成檢查。

17時45分,一位工作人員在會場最後方的錄題區域喊了一聲:試題來了!工作人員當即宣布,AI-Maths將挑戰的首套高考試卷是文科數學北京卷。十幾位錄題、檢查人員在會場後方,抓緊將從網上獲取的圖片格式試題輸入進WORD文檔。再過一會兒,這份「考卷」將進入AI-Maths的「大腦」。


為了這次實戰,錄題的工作人員試驗過多次。林輝向中國青年報·中青在線記者介紹,就在正式考試幾天前,第一次錄題時,很多工作人員曾緊張得雙手發抖,頻頻出現失誤。一旦錄題不準確,AI-Maths的「高考」將失去價值。


在林輝看來,工作人員的緊張再正常不過。在很多人心中,跟人工智慧機器人的對戰顯得有點「悲壯」。在今年2月AI-Maths與成都某知名中學學生的「對戰」前,一名學生甚至感覺自己是「代表人類在作戰」。


機器人的失分之處在於無法讀懂自然語言


18時28分,AI-Maths正式開始作答北京卷。在會場前方的8台電腦承擔著向「考場」內11台伺服器導入試題和導出答卷的功能。

大屏幕上原本顯現的AI-Maths孤零零佇立在考場中的畫面,變成了答題過程的實時呈現。從選擇題開始,屏幕迅速滾動,答案就實時展現在真題的右方。


到了解答題,現場的氣氛更加緊張。此前,大家從沒見過AI-Maths將如何讀解包含眾多文字描述的大題。它會寫過程嗎?能得到過程分嗎?它的解題思路跟人類一樣嗎?


1、2、3……AI-Maths將每一個步驟用數字順序標明。如果第五步使用的是第一步和第三步的結論,它將顯示為:「由條件(1)和(3)得」,後接運算結果。


按照AI-Maths過去的「倔強勁兒」,它可能有時會卡在一道題目上幾小時不止。那時它沒有知難而退的意識,對於解不出的難題,一種方法不行,它就會嘗試下一種方法,有時甚至會為一道題嘗試好幾百次。所以研發團隊專門設置了一個放棄程序,以確保AI-Maths不卡在一道題目上而耽誤了後面的解題進程。

22分鐘後,工作人員宣布AI-Maths已完成北京卷。他們迅速列印它的答卷,並在鏡頭的見證下交由坐在會場左側等待判卷的3位數學教師。他們都是來自成都幾所知名中學的教學帶頭人。


在北京卷的判卷過程中,第二套試卷全國II卷也開始了人工錄入階段。


19時許,現場工作人員宣布了AI-Maths的首套高考答卷的成績:105分!選擇題滿分!現場響起了熱烈的掌聲。


105分的數字通過現場觀眾擴散到了網上。看到這個成績,一些網友留言表示「我這輩子都沒到過105分」,也有人質疑:為什麼AI-Maths不答難度更高的理科數學?早早地做完題為什麼不檢查一下錯題?


19時19分,AI-Maths開始作答全國II卷。林輝拿著AI-Maths的答卷現場解析它在一些題目中得零分的原因。比如北京卷第14題,林輝覺得自己初次讀題都「有點暈」。


他認為,題干中「教師人數的兩倍多於男學生人數」的表述並不常見,AI-Maths很可能由於無法理解這種描述,故而無法解答,得了零分。「主要是自然語言理解出現了問題。」林輝表示。


在林輝介紹間隙,工作人員宣布,19時29分,AI-Maths僅用10分鐘便完成了答題。現場爆發出一片驚嘆聲。很快,閱卷結束,這次AI-Maths的得分是100分。


這次,AI-Maths的答卷上紅叉落在了選擇題第九題上。這是一道講述甲乙丙丁4人向老師詢問成語競賽成績的邏輯推理題。除了「2位優秀、2位良好」的信息涉及數字,其他都是純文字表述。


閱卷老師隨後告訴記者,AI-Maths的失分主要在於概率統計題等文字表述較為複雜的題目。它主要問題還是出在了讀不懂題上。用參與閱卷的數學老師的話說,AI-Maths要考好數學,還得先學好語文。


儘管沒能達到110分的目標,研究團隊依然感到驕傲。科大訊飛研究院院長鬍國平說,據他所知,這是人工智慧第一次在斷網斷庫的情況下完成自動解題。類比聞名世界的AlphaGo,前者更多地屬於計算智能的範疇,AI-Maths要解決的是認知智能層面的問題,也是目前人工智慧與人類差距最大的領域。


研究人員相信,經過更多的訓練和學習以後,未來AI-Maths會取得更好的成績。林輝透露,在過去一年中,公司在複雜邏輯推理、直覺觀察推理、計算機演算法、深度學習上都進行了深入攻關。


「思維能力就像是人在成長時的肌肉,要先訓練力量,再去訓練招式、套路。」林輝說。接下來,他們將繼續讓AI-Maths「復讀」,做更多的題進行訓練。「待它更強大時,再進行聯網、聯資料庫。否則AI-Maths靠的都是人的經驗,永遠無法超過人類!」


林輝希望,AI-Maths有朝一日能完成從學生到出題人、閱卷人身份的轉變。他告訴中國青年報·中青在線記者,本次使用11台伺服器,為的不是展示技術的力量,而是希望AI-Maths可以用更接近日常生活的設備條件來發展自己,從而便於未來更廣泛地應用於日常生活。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 cnbeta 的精彩文章:

蘋果發新廣告 借天文學家之口暗諷特朗普退巴協定
日本新型網吧一夜走紅 單身妹子最心動

TAG:cnbeta |

您可能感興趣

語文成績難有效提高,這是廣大語文教師和學生深感困惑的問題
語文難,還是數學難
語文基礎知識|不能帶賓語的成語類型
數學好的語文真的不會差,記成語原來可以用算數,真神奇!
數學成績不理想,是你語文沒學好!
王源寫的文章被編成語文考題,難度還不小
語文難度不夠,數學題目來湊,今年數學有多難
熟練掌握語文閱讀技巧,考高分也變得容易
語文好歹能增長你的文學知識!英語能讓你與鬼佬交流
為什麼要學語文
董卿力薦:無數尖子生被「坑」多的古詩詞題,吃透語文成績低不了
考生自信走出考場 直言:數學比語文更簡單
為什麼補習英語、數學,你卻看不上語文!
我們為什麼要學習語文
想學《易經》,那你不要在乎文憑中語文成績曾有的虛榮
漢語考試逼瘋老外,中國人都表示:我可能學了假語文,只能交白卷
人教版二年級下冊語文、數學學年結業試題,題型不錯,值得一做
網易雲熱評真的有才,他們的語文成績應該很高吧!
語文教學是簡單的、自然的,我們沒有必要人為地把它搞得那麼複雜
數學為什麼可愛?語文不好的人無法理解