當前位置:
首頁 > 新聞 > 不只鑒黃,這款產品要提供所有 AI 識別的閉環服務

不只鑒黃,這款產品要提供所有 AI 識別的閉環服務

雷鋒網按:近日,UCloud 的媒體 AI 產品 UMAI 入選雷鋒網發布的「AI 最佳掘金案例年度榜單」,並獲得最佳內容審查獎,本篇即為對這款產品的相關內容介紹。

不只鑒黃,這款產品要提供所有 AI 識別的閉環服務

今日頭條,這家以機器分發技術驅動的超級獨角獸近日陷入了尷尬境地——招聘 2000 名內容審核編輯。

是的,它被網信辦點名了,並嚴厲要求部分內容頻道停更。風波的源頭是人工智慧技術尚處發展初期,它不能對色情、低俗信息等進行有效過濾的「原罪」。

由此導致的便是人力不降反增,而媒體和科技工作者曾一度以為通過機器學習審核內容會讓人類下崗,尤其隨著今年人工智慧技術的火熱發展,這種感覺可能會更加強烈。

但在某些方面,機器完全替代人力依然是個願景。就當下的技術審核水平而言,總有「漏網之魚」機器系統還不能完全識別,這是因為人工審核後的數據模型還並不足夠準確。

當然,在經過持續數據積累,模型訓練的足夠完美之後,會替代一部分人工這也是確定無疑的。UCloud 多媒體事業部研發總監曾凱源就認為,這 2000 個審核編輯,在兩年之內可能需要 200 個就已足夠。

不只鑒黃,這款產品要提供所有 AI 識別的閉環服務

一定程度上,UCloud 的媒體 AI 服務產品 UMAI 所要解決的問題與今日頭條是相似的。

這是一款幫助用戶提供了豐富的媒體處理及審查功能的產品,功能卻更豐富。具體來說,UMAI 解決方案的核心功能有以下 5 種:

1.圖片打標

通過計算機視覺的場景識別功能,可以將圖片隱藏信息挖掘出來,比如,讓圖片有更多關鍵字被更多場景檢索,發揮其作用。

2.圖像內容審核

支持圖片與視頻的涉黃、暴力等內容識別,通過調用 UMAI 介面來對內容做預處理,判斷圖片涉黃程度,將佔比為絕大多數的正常內容過濾掉,根據業務場景和返回的置信度分值對違規圖片進行處理。

3.圖片裁剪

按照指定規格和比例對圖片進行裁剪,支持用戶自定義裁剪比例。

4.人臉識別

人通過對圖片進行人臉的檢測,然後提取包括眼睛、鼻子等關鍵點,切分處理以後,再給到卷積網路提取特徵,最後再做人臉識別。

5.字幕識別

應用於身份證、發票等的識別,減少手寫錄入的工作量;而視頻字幕識別,則可以幫助計算機更好理解視頻的內容。

據曾凱源介紹,這款產品是由 UCloud 的雲服務客戶如圖普等多家 AI 公司合作而成,他們希望 UMAI 所提供的服務以 API 形式提供給媒體客戶。以此來看,UCloud 更像是為圖普擴充了一個渠道,而用 Ucloud 雲的媒體客戶,也可以更方便使用圖普的智能識別技術,這在很大程度上降低了對接成本。

對於媒體客戶而言,以往它們需要將內容過濾,但在使用 AI 公司智能識別功能時,首先要將內容外傳到 AI 公司,其中會面臨外網慢,傳輸帶寬費用甚至比 AI 成本更高的問題。

而現在當媒體客戶內容上了 UCloud 的雲服務之後,UMAI 就提供了整套鑒黃、鑒恐、語音等基於媒體 AI 的閉環服務,「哪怕是第三方也可以,不一定是 UCloud 自己做,也能滿足他們的需求,而不是在外部調用。 」

騰訊雲、阿里雲這些巨頭也在提供媒體 AI 服務,不過,與 UCloud 相比,它們所提供服務領域要更加寬泛。UMAI 與巨頭競爭要體現出差異化,而他們則瞄準了細分場景服務。比如智能鑒黃,由於提供媒體 AI 的供應商訓練的數據模型有所差異,所以 UCloud 綜合了這些 AI 廠商的識別內容,在精細化分類之後,大幅提升了圖像識別率。

智能識別準確率的問題,現在廠商們大多宣城達到了 99%,但你應該知道,那都是固定級測試數據。曾凱源認為,就通用識別率而言,UMAI 的識別率在實際使用中達到了 85%-90%,目前所有企業都還很難突破 90%。

不只鑒黃,這款產品要提供所有 AI 識別的閉環服務

而在視頻領域,流媒體客戶也具有字幕識別、同聲傳譯這樣的需求。曾凱源表示,UMAI 在這一領域的識別效果上已能達到客戶的基本要求,但由於其對準確性要求過高,人力輔助不可避免。同時,直播+語音可以增加企業分享的覆蓋率,他們會在這一領域持續發力。

此外,曾凱源告訴雷鋒網,他們會先擴大領域的廣度,然後再去做相同領域。「比如國內的公司都做鑒黃,大多數使用的是亞洲人數據訓練模型,這時候我們補全使用其他人種數據訓練的模型,就能完善整體的準確性。」因此,UMAI 的研發人員中大多都在研究機器學習,在各種深度學習的模型前增加機器學習邏輯,進行內容分類及學習各模型的細分準確性,整體做出更優效果。

他們希望 UMAI 的功能不只體現在鑒黃、鑒恐這些方面,而是所有基於 AI 的識別都能夠提供服務。比如零器件工業品質的拍照識別、智能車輛的定損。這也需要他們在各個細分場景里與掌握數據多的公司合作,把他們較為成熟的模型部署到 UMAI 平台上來,從而提供給有需求的客戶。

除了媒體 AI 客戶使用 UMAI 之外,他們還可以與 UFile 對象存儲連接使用,實現一站式多媒體數據的存儲及審核。用戶可以將內容存放在 UFile 中,獲得海量、安全、可靠的非結構化文件存儲服務,而在用戶上傳圖片到 UFile 後,UMAI 可以後台同步完成智能鑒黃,簡化處理流程,提高審核效率,這也為客戶省去了對接諸多 AI 廠商的時間。

據雷鋒網了解,目前 UCloud 已和多家 AI 平台對接合作,提供媒體 AI 服務。主要的服務客戶有懂球帝、滬江、蝸牛 VR、愛奇藝等公司。而收費模式有兩種,圖片識別按次數調用計費的,視頻和直播則按分鐘數計費。

AI 最佳掘金案例年度榜單介紹:

「AI 最佳掘金案例年度榜單」從商業維度出發,評選出 8 大行業中的 30 個最佳解決方案/產品。

雷鋒網根據企業提交的「解決方案/產品資料、商務合作(單個行業的業務統計)、企業自身情況」三個維度的信息,以 20 個明確評分項為標準,對參選企業進行首輪全面評估。

同時邀請多位傳統企業 CIO、系統集成商項目高管、AI 企業解決方案負責人、投資機構合伙人、學界教授等數十位評委,對參選企業和脫敏後的信息,進行了第二輪分析評審。

歷時兩個月,融合兩輪評選結果後,最終公布 30 強名單。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

TAG:雷鋒網 |