場景文字圖像增廣工具 Scene Text Image Transformer

知識 12-11

Scene Text Image Transformer是用於場景文本數據增強的工具。我們提供的工具可以避免過度擬合併獲得模型的穩健性。

目前我們專註於裁剪場景文本圖像的形狀。檢測和識別任務的下一個版本將在稍後發布。

https://github.com/Canjie-Luo/Scene-Text-Image-Transformer

GCC4.8.*

Python2.7.*

Boost1.67

OpenCV2.4.*

我們推薦使用Anaconda去管理你的依賴環境。例如：

建立目錄：

將Augment.so複製到目標文件夾，然後按照demo.py的樣例使用該工具。

Distortion - 變形

Stretch - 伸展

Perspective - 透視

使用2.0GHz的CPU轉換大小（H：64，W：200）的圖像僅需3ms不到。可以通過動態調用多進程批處理採樣器來加速該過程，例如在PyTorch中設置"num_workers"。

我們比較了僅使用相應的小訓練集訓練CRNN的準確性。

該工具是@cxcxcxcx"simgwarp-opencv和@Yati Sagade"sopencv-ndarray-conversion的結合。謝謝你們的貢獻。

代碼主要提交者：Canjie-Luo，來自SCUT DLVC-Lab（華南理工大學深度學習與視覺計算實驗室）

該工具僅用於學術研究目的。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI研習社 的精彩文章: