當前位置:
首頁 > 最新 > ICPR 2018 OCR挑戰賽啟動 開放首個網路圖片數據集

ICPR 2018 OCR挑戰賽啟動 開放首個網路圖片數據集

近期,由阿里巴巴「圖像和美」團隊聯合華南理工大學共同舉辦ICPR MTWI (Multi-Type Web Image)2018 挑戰賽正式開啟,並開放業內第一個基於網路圖片的中英混合數據集——MTWI數據集。大賽聚焦OCR領域相關實用知識點的突破與解決,旨在與全球AI科研人才一起共同推動OCR在工業界的應用和發展。

互聯網世界中,圖片是傳遞信息的重要媒介。特別是電子商務、社交、搜索等領域,每天都有數以億兆級別的圖像在流動傳播。基於深度學習的圖片文字識別(OCR)技術正飛速發展,並深刻影響著信息的交互和傳遞方式,乃至改變相關行業的生產方式。而在學術領域,圖片中的文字識別(OCR)同樣也是研究重點,但目前業內依舊缺少基於網路圖片的、以中文為主的OCR數據集。

本次大賽發布的MTWI數據集來源於真實網路場景,以「來源於實踐,且高於實踐」為構建理念,既考慮到學術價值同時也兼顧工業適用性。

不同於純文檔圖片和場景文字圖片,MTWI數據集中的圖片多為作者設計或者二次加工所得。整體上看,這類圖片不僅包含部分場景圖片和文檔圖片,更多的是在這些圖片基礎上添加設計好的文字而成的新圖片。

左一:空心字,切斷字,中英混排;左二:封面印刷文字,離散單字,重疊字;左三:實拍,自然場景,藝術文字;左四:大字中鑲嵌小字,不同字型大小混排

從數據場景上看,本數據集涵蓋了數碼合成、物體表面、封面類印刷的中英文以及少量日文、韓文等類型的文字。而從文字版式上來看,包含了各種字體類型的單字、橫排、豎排、傾斜排列、曲線排列、複雜混排(不同字型大小、不同字體、不同字間距的混合排布)等。

因此,本次大賽發布的數據集既有圖片文字識別的共性也有本身的特性,突出覆蓋前沿技術尚未解決或者遺漏的樣例,並基於OCR領域乃至計算機視覺領域的前沿指標,設置文本檢測,文本行識別,端到端的整圖文字識別三個層次的賽題,對相關技術點的解決以及在工業領域的信息數字化應用將具有直接的推動作用。

本次ICPR MTWI 2018 挑戰賽基於天池數據眾智平台,目前已開啟報名通道,吸引了來自國內外2000餘支隊伍報名參賽,其中不乏OCR研究領域的知名院校團隊。賽事組委會將在2018年6月1日評出獲獎名單,並於ICPR2018大會期間在北京進行頒獎。

阿里巴巴「圖像和美「團隊是阿里巴巴從事圖像技術歷史最悠久的團隊,在OCR領域,多年來不斷整合前沿技術和行業經驗,打磨出了能夠承載跨行業應用的技術架構,形成了完備的圖像文字定位、識別和理解的人工智慧技術體系。目前已在阿里巴巴集團內部的圖片管控,搜索,智能審核等領域扮演重要角色,並推出「讀光」OCR雲產品,包括文檔圖片,網路圖片,表格圖片和卡證照圖片的文字識別服務,正致力於為政務、司法以及金融等行業提供安全高效的OCR解決方案。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 光明網 的精彩文章:

多練肌肉防摔倒
男子海邊遇到擱淺鯊魚,周圍人的舉動讓人憤怒

TAG:光明網 |