當前位置:
首頁 > 知識 > 場景文字圖像增廣工具 Scene Text Image Transformer

場景文字圖像增廣工具 Scene Text Image Transformer

Scene Text Image Transformer是用於場景文本數據增強的工具。 我們提供的工具可以避免過度擬合併獲得模型的穩健性。

目前我們專註於裁剪場景文本圖像的形狀。 檢測和識別任務的下一個版本將在稍後發布。


項目地址:

https://github.com/Canjie-Luo/Scene-Text-Image-Transformer

環境要求

GCC4.8.*

Python2.7.*

Boost1.67

OpenCV2.4.*

我們推薦使用Anaconda去管理你的依賴環境。例如:


安裝

建立目錄:

Augment.so複製到目標文件夾,然後按照demo.py的樣例使用該工具。


演示

Distortion - 變形

Stretch - 伸展

Perspective - 透視

速度

使用2.0GHz的CPU轉換大小(H:64,W:200)的圖像僅需3ms不到。 可以通過動態調用多進程批處理採樣器來加速該過程,例如在PyTorch中設置"num_workers"。


識別上的改進

我們比較了僅使用相應的小訓練集訓練CRNN的準確性。


引用

致謝

該工具是@cxcxcxcx"simgwarp-opencv和@Yati Sagade"sopencv-ndarray-conversion的結合。 謝謝你們的貢獻。

代碼主要提交者:Canjie-Luo,來自SCUT DLVC-Lab(華南理工大學深度學習與視覺計算實驗室)


注意事項

該工具僅用於學術研究目的。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI研習社 的精彩文章:

任務型對話中的跨領域&個性化&遷移學習
一文帶你讀懂計算機視覺

TAG:AI研習社 |