當前位置:
首頁 > 新聞 > 對話碼隆科技 CTO 碼特:應對商品識別獨有挑戰,技術研發實力是根本

對話碼隆科技 CTO 碼特:應對商品識別獨有挑戰,技術研發實力是根本

雷鋒網 AI 科技評論按:隨著人工智慧的發展步入加速期,以計算機視覺為代表的人工智慧技術也逐漸落地到行業場景中,開始在安防、教育、金融、物流等行業大顯身手,並從中衍生出一批新的應用場景,如新零售、無人駕駛等等,在科技巨頭以及人工智慧初創企業中都激起了千波浪。

然而,行業應用場景中的一系列計算機視覺底層技術,仍存在較大的挑戰,就比如說商品識別技術,相較於人臉識別、場景識別等技術相比,它因其特殊屬性而面臨著其獨有的挑戰,比如商品包裝雷同問題、商品上新問題等等,對於該細分行業的玩家在技術實力以及技術產品化方面都提出了更高的要求。

作為一家在商品識別領域深耕四年多的創業公司,碼隆科技憑藉其在行業內深厚的技術積累以及豐富的產品商業化經驗,業已成為該細分領域的領先者。本次,雷鋒網 AI 科技評論聚焦 AI 商品識別技術這一主題,與該公司的 CTO 碼特(Matt Scott)進行了一次對話,碼特也從碼隆科技在技術研發、產品化方面積澱下來的經驗出發,為大家分享了在商品識別這一細分領域中的一些思路。

應對商品識別的獨有難題,技術研發實力是根本!

碼隆科技成立於 2014 年,在當時無論是科技巨頭還是人工智慧創業公司紛紛青睞人臉識別、自動駕駛等領域的背景下,創立之初便另闢蹊徑,選擇了商品識別這一賽道,而這一開始也為碼隆科技此後在該領域的發展贏得了先機。

對於公司成立之初的這一決定,碼特回憶道:「當四年前我們剛剛成立並做出這個決定時,還沒有其他公司完全專註於人工智慧商品識別這一領域。在這五年的時間裡,我們專註技術研發,並同時兼顧核心科研成果的實際場景落地,可以說,如今即便在世界範圍內,我們都是將深度學習技術應用於商品識別這一領域的引領者。雖然在該領域,我們目前也面臨著一些競爭對手,但是碼隆在研發、工程、數據和國際客戶、合作夥伴方面,都有著先天優勢。」

而實際上,相比於一般場景中所用到的人臉識別、場景識別而言,商品識別技術存在許多其獨有的難題,在場景落地中面臨著更大的挑戰,對此,碼特詳細介紹道:「例如,商品有海量的庫存單位(SKU, Stock Keeping Unit),其中有很多都是細粒度的,存在的差異是很難分辨出來的。不僅如此,即使是同一種商品或者庫存單位,在不同的情境下也有可能呈現出非常不同的外觀,比如針對同一種商品的電商賣家秀和買家秀,往往外觀效果大有不同。此外,商品識別技術還需要解決的一個基本問題是:因為商品外部包裝經常更新,需要保證高效的庫存單位更新能力,也就是上新的問題。」

對此,碼隆科技倚靠紮實的技術研發實力,從不同的技術路徑來解決這些問題。「比如針對商品上新問題,我們自主研發了弱監督學習演算法 CurriculumNet,能夠有效處理有噪音數據和數據不均衡的情況,讓我們僅需 20 張圖像數據進行訓練就能取得與訓練成百上千張圖像相同的效果,從而極大地減輕了其數據收集和標註的壓力和成本。另外對於不同商品的包裝相似問題,我們研究的細粒度分類(Fine-grained Classification)技術能夠讓 AI 系統做出判斷達到與人類根據視覺觀察做出正確判斷同樣的水準,在某些場景中,機器識別的正確率甚至更高。」

零售是最優先落地商品識別技術的行業

作為一家注重商品識別技術研發和商業化並駕齊驅的公司,碼隆在技術產品化方面也是不遺餘力地投入。自創立以來,碼隆科技打造了一系列 AI 商品識別產品,其中就包括其最早大眾化的產品——商品識別基礎技術平台 ProductAI??。

據介紹,ProductAI? 集成了包括商品圖像的搜索、檢測、分類、分析、標註以及色彩分析和文字識別等多種基礎技術,涉及弱監督學習、課程學習、目標跟蹤、細粒度分類、物體檢測等等的計算機視覺核心演算法。「同時,碼隆科技也正在進行前沿深度度量學習(Deep Metric Learning)的研究,作為細粒度分類、檢測和追蹤技術的補充。現在這些演算法都已應用於圖像或視頻處理的商品識別場景。」

在場景中的實際落地情況,以智能貨櫃為例,其在整個流程中充當的角色是:對消費者來說,該技術主要用於自動結算這一環節,可以根據消費者的拿取商品前後的變化識別出消費者具體購買了哪些商品,並以此為依據進行結算;對商戶來說,一是商品識別技術能夠使商家實時了解智能貨櫃的運營狀態,二是後台會有銷售大數據分析系統,可以為商家提供一些銷售洞察作為決策參考,如哪些商品在什麼樣的布點位置銷售情況更好等等。

對於碼隆的商品識別技術的整個落地情況,碼特介紹道:「線上和線下零售是我們最優先落地的場景。在線下零售方面,我們目前將智能貨櫃作為實體零售的主要落地場景,此外還有商超資產保護、智能稱重等應用場景。而在線上零售方面,我們的商品識別技術也已經通過 API 調用的形式賦能了很多電商平台和時尚應用。」

作為在該行業有著合作夥伴積累的碼隆來說,在 AI 商品識別技術的場景落地合作夥伴的選擇上,也有著自己的考量點 :「我們的策略是選擇那些垂直行業的龍頭玩家去進行合作,他們能在更宏觀的角度看待產業發展,深知行業痛點,同時對新技術的布局意識也更勝一籌。比如,在將商品識別與智能貨櫃結合的探索中,我們選擇和世界頂級冰櫃製造商海爾進行合作。在 AI 技術落地的過程中,一定是有很多困難的,這就需要行業內的廠商相互配合、各自發揮優勢進行一點一點地打磨。」

不斷用現有的學術基準來測試、挑戰自己的技術

作為一家以技術研發為長的公司,碼隆科技也時刻關注著學術界在該領域的動態,比如包括細粒度分類、弱監督學習、深度度量學習以及檢測追蹤演算法等等。同時,碼隆也會緊隨學術動態,將自己的研究成果搬到學術界去進行測試:一方面是通過學術界一系列商品識別評估標準進行自我檢驗;另一方面,碼隆科技也樂於向 CVPR、ICCV 和 ECCV 等計算機視覺世界頂級行業會議投遞論文,去接受該領域的國際權威評審。

例如,在 CVPR 2019,碼隆科技就發表了一篇關於多相似度損失的論文:「Multi-Similarity Loss with General Pair Weighting for Deep Metric Learning」。據碼特介紹,該論文提出使用 GPW(General Pair Weighting)框架來從底層來理解圖像檢索中的損失函數,並在該框架下提出了多相似度損失(Multi-similarity Loss, MS Loss)函數,顯著提高了圖像搜索的性能——該損失函數在世界上所有主要的圖像檢索基準上都獲得了領先的結果。

不僅如此,碼隆科技甚至還創建了自己的評估標準。「今年,我們舉辦了一項有關商品識別的比賽 iMaterialist Challenge on Product Recognition,截至目前,全球已有近一百支代表隊參賽,比賽結果將在 CVPR 研討會上公布。在比賽中,我們開放了史上數據量最大,商品種類最多元的資料庫,比賽涵蓋 2019 個 SKU 超過一百萬張圖像數據,每個 SKU 都有超過 200 張圖片,是 CVPR 迄今數據規模最大、種類最多的商品識別競賽。同時,我們也和谷歌研究院一起合作將該挑戰賽列入了谷歌 CVPR 研討會『the Sixth Annual Workshop on Fine-Grained Visual Categorization』的一部分。」

商品識別技術未來發展的期望

作為前微軟亞洲研究院高級研發主管、現任碼隆科技 CTO 的碼特,在其學生時代就已在計算機視覺領域勤耕,如今選擇聚焦商品識別領域展開研究,對於這項技術未來的發展自然充滿了期待:「與計算機視覺其他相關任務一樣,我們同樣也期待機器能夠在這一細分領域以超越人類的水平實現持續學習和推理。未來,這項核心技術將會對零售等行業帶來變革性的影響,在讓商業更加高效運營、提升利潤的同時,也改變和優化人們購物和生活的方式。」

而具化到碼隆科技上,碼特表示,現在和未來,碼隆科技依舊會聚焦於商品識別這一領域,同時會不斷開發和優化相關的底層演算法,並以此為基礎推動技術與更多行業的結合,最終落地到實際場景中給人們帶來便利。此外,碼隆科技也從研究層面去探索該技術在其他行業應用中更多的可能性,而具體的細節,也將會在不久後對外公布。 雷鋒網

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

150個中國高管:意外停機多久我能忍?
阿里潛心布局多年,丹鳥終於初試啼聲

TAG:雷鋒網 |