又一篇CVPR 2022論文被指抄襲，平安保險研究者控訴IBM蘇黎世團隊

科技 06-28

機器之心報道

編輯：張倩

「他們並不是照抄文本，而是剽竊想法。」

昨天，有人在 reddit 上發帖稱，IBM 蘇黎世研究中心剽竊了自己的論文，而且還被 CVPR 2022 接收了。

這位發帖者寫道：

我叫 Xianbiao Qi，是一位有十多年研究經驗的計算機視覺研究者。我寫這個博客是為了投訴一個嚴重的案例：IBM 蘇黎世研究中心的員工蓄意剽竊我們的論文。他們並不是照抄文本，而是剽竊想法。

Qi 提到的疑似被抄襲的論文題為「PingAn-VCGroup"s Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML（平安 VCGroup 為 ICDAR 2021 科學文獻解析競賽任務 B 提供的解決方案：HTML 表格識別）」，作者來自平安保險和平安科技，上傳 arXiv 的時間是 2021 年 5 月份，2021 年 7 月份公布了代碼，2021 年 9 月發布了 Tablemaster 預訓練模型，2021 年 11 月發布了 tablemaster_mmocr docker 環境。論文中提到的競賽是 2021 年 4 月結束的，由 IBM 的另一個團隊主辦。

論文鏈接：https://arxiv.org/pdf/2105.01848.pdf

如論文標題所述，這篇文章為 ICDAR 2021 科學文獻解析競賽任務 B（HTML 表格識別）提供了一套解決方案。具體來說，他們將表格內容識別分為四個子任務：表格結構識別、文本行檢測、文本行識別和框分配。表格結構識別演算法是基於一種魯棒的圖像文本識別演算法 MASTER 定製的。PSENet 用於檢測表圖像中的每個文本行。文本行識別模型也建立在 MASTER 之上。最後，在框分配階段，他們將 PSENet 檢測到的文本框與通過表結構預測重構的結構項相關聯，並將文本行的可識別內容填充到對應項中。

被指抄襲的 IBM 論文題為「TableFormer: Table Structure Understanding with Transformers（TableFormer：用 Transformer 理解表結構）」，上傳 arXiv 的時間是 2022 年 3 月份，提交給 CVPR 的時間未知。

論文鏈接：https://arxiv.org/pdf/2203.01017.pdf

在這篇論文中，IBM 的研究人員提出了一種新的表結構識別模型，它從兩個方面改進了最新的端到端深度學習模型（即來自 PubTabNet 的 encoder-dual-decoder）。首先，他們引入了一種新的目標檢測解碼器用於表格單元格。通過這種方式，他們可以直接從 PDF 源中獲取編程式 PDF 的表格單元格內容，從而避免了定製 OCR 解碼器的訓練。這種架構上的改變帶來了更精確的表格內容提取。其次，他們將 LSTM 解碼器替換為基於 transformer 的解碼器。

Qi 表示，IBM 的這篇論文剽竊了他們的方法論、預處理、後處理、可視效果、推理、系統級解決方案、代碼、預訓練模型等內容，但「為了不被抓住」，他們沒有引用 Qi 等人的論文。