場景文字圖像增廣工具 Scene Text Image Transformer
知識
12-11
Scene Text Image Transformer是用於場景文本數據增強的工具。 我們提供的工具可以避免過度擬合併獲得模型的穩健性。
目前我們專註於裁剪場景文本圖像的形狀。 檢測和識別任務的下一個版本將在稍後發布。
項目地址:
https://github.com/Canjie-Luo/Scene-Text-Image-Transformer
環境要求
GCC4.8.*
Python2.7.*
Boost1.67
OpenCV2.4.*
我們推薦使用Anaconda去管理你的依賴環境。例如:
安裝
建立目錄:
將Augment.so複製到目標文件夾,然後按照demo.py的樣例使用該工具。
演示
Distortion - 變形
Stretch - 伸展
Perspective - 透視
速度
使用2.0GHz的CPU轉換大小(H:64,W:200)的圖像僅需3ms不到。 可以通過動態調用多進程批處理採樣器來加速該過程,例如在PyTorch中設置"num_workers"。
識別上的改進
我們比較了僅使用相應的小訓練集訓練CRNN的準確性。
引用
致謝
該工具是@cxcxcxcx"simgwarp-opencv和@Yati Sagade"sopencv-ndarray-conversion的結合。 謝謝你們的貢獻。
代碼主要提交者:Canjie-Luo,來自SCUT DLVC-Lab(華南理工大學深度學習與視覺計算實驗室)
注意事項
該工具僅用於學術研究目的。
※任務型對話中的跨領域&個性化&遷移學習
※一文帶你讀懂計算機視覺
TAG:AI研習社 |