當前位置:
首頁 > 最新 > TalkingData 2018 美國大數據精研之旅第四天見聞

TalkingData 2018 美國大數據精研之旅第四天見聞

引言

美國大數據智能精研之旅源自由 TalkingData 發起的矽谷大數據精研之旅,定期於每年 3 月在美國矽谷舉辦,旨在促進中美兩國在大數據、人工智慧等領域的行業專家、企業領袖之間的對話與交流,了解和學習兩國的發展現狀,探索和挖掘跨域合作機會。

本期「美國大數據智能精研之旅」的主題為「數據智能價值」,由 TalkingData、Qualcomm China、Gplus 聯合承辦,從產、學、研、投不同視角視角切入,走訪全球頂尖的科技巨頭、大學研究室、 創業團隊以及創投機構。

與訪問團同行的還有 TalkingData梧桐計劃(可直接點擊)和數據科學精英夏令營中兩位綜合表現優異的同學王啟明和保善龑,兩位「前方記者」為我們帶來了矽谷大數據之旅的第四天的見聞。

精研之旅的第四天,TalkingData 訪問的主題是智能零售和數據安全。喜逢 TalkingData 矽谷全球創新研發中心建立一周年,在位於 Mountain View 的創新中心內,四家提供新零售解決方案的科技公司展示了他們在這一垂直領域的見解和成果。 下午 TalkingData 驅車前往 UC Berkley, 與人工智慧實驗室 RISELab 的 Down Song 教授討論交流了數據保護與數據安全的相關話題, 以下內容是對當日討論的詳細介紹

CrowdANALYTIX

CrowdANALYTIX 成立於 2012 年,是眾包部署 AI、NLP 和機器學習解決方案的平台。其 CEO Divyabh Mishra 介紹道,公司的運作主要由兩部分構成, 一部分是 CrowdANALYTIX 競賽平台,另一部分是 dataX AI 驅動平台,將這兩個平台結合起來, 為時裝行業提供由數據驅動營銷與品牌目錄管理方案。

首先, Divyabh 介紹了 CrowdANALYTIX 競賽平台, 這是一個類似於 Kaggle 的機器學習與人工智慧競賽平台。不同於 Kaggle 更注重提供數據科學的社交場景,CrowdANALYTIX 為競賽者提供更實際與逼真的商業場景,解決更為實際的問題。

通過 119 場競賽(累計到今天),近兩萬名競賽者為兩萬九千多個話題提供了解決模型。競賽中的優勝者不僅有機會得到獎金,更有機會讓自己做的模型被收購,直接或間接用於公司的業務。

除了 CrowdANALYTIX 之外, dataX 是公司的另一塊業務。它是一種用於為零售產品目錄自動創建上下文感知產品屬性和元標籤的 AI 驅動平台,通過圖像識別、NLP 等技術,從服裝圖片中提取出結構化的欄位,自動為商品生成並標記屬性,以此來為商品形成大量高質量結構化特徵。

對於不同的客戶需求,dataX 可以提供定製化的特徵方案,並且完成商品目錄的自動化建檔,對產品屬性的提取,dataX 可以做到 90% 以上的準確率,這個表現甚至優於 Google 的同款產品。

Mad Street Den

Mad Street Den 成立於 2013 年, 是一家基於計算機視覺的人工智慧初創公司。其團隊由來自斯坦福、CMU 和 MSFT 實驗室的神經科學家、數據科學和深度學習專家組成。

提及其核心產品 Vue.ai,負責人介紹稱 Vue 用三個階段來為時裝零售行業提供解決方案。首先,Vue 通過圖像識別和 NLP 等技術提取出可分類式的特徵,這樣做有 2 點優勢:

能夠為海量商品快速建立結構化的特徵

將圖像信息向量化後節省了大量的存儲空間

其次,通過計算機視覺技術來生成獨特的消費者模型,通過模擬消費者的體型數據來創建在線虛擬的購物環境,為企業節省市場和產品服務的費用。

接下來,Vue 能夠為消費者的購物提供實時的個性化,並幫助購物者發現他們喜愛的產品。Vue 的 AI 造型師會為消費者量身定製搜索結果,通過消費者網站、應用程序、電子郵件等個性化推薦策劃私人衣櫥和搭配。

在整個流程中,Vue 還做了大量的細節和優化。比如,當消費者想要搜索的產品售罄時,Vue 總能提供與該產品最為相似的產品(從外形、款式、價格等多方面),並且保證提供的相似產品是有庫存的。在 demo 展示中,Vue 顯示他們做這樣的相似性搜索花費的時間非常短。

另一個方面,除去單品的推薦,Vue 還提供搭配方案,其 AI 造型師不僅學習了大量的搭配的樣本,Vue 的團隊還邀請資深時裝專家提供業界經驗來保證最終的效果。

Jetlore

Jetlore 成立於 2011 年, 兩位 co-founder 都是斯坦福大學博士。他們的產品是將消費者行為映射到結構化屬性(如尺寸、顏色和樣式偏好)的預測平台。在業績方面,美國前 20 名零售商中的 5 家以及每個垂直領域的前 100 家全渠道零售商都在使用 Jetlore 的 AI 預測平台,其客戶包括 eBay、LG、優衣庫、Secret Escapes 等。

與前面兩家公司不約而同,Jetlore 同樣認為結構化的商品特徵是做人工智慧與零售業整合的重要途徑。 因此在這一方面他們也提供了相似的方法。

而與前者不同的是,Jetlore 更關心如何做精準營銷,因此他們結合了商品的結構化特徵與用戶的消費交易記錄。通過分析消費記錄所對應的商品,為客戶推薦他們會喜歡的產品,他們將這一過程稱之為 Predictive Layouts,它使營銷團隊能夠個性化每個用戶的電子郵件、網頁或移動端體驗,他們通過這些方式來為用戶做推薦。不限於單個產品,他們對每個用戶建模,對每個獨特的用戶建立其商品的 Predictive Ranking。而這個排序能夠幫助銷售團隊在產品列表組有效找到最佳產品組。

值得一提的是,Jetlore 的預測平台能夠提供近實時的預測,對於體量龐大的用戶,為每個人建模並且個性化,這對計算能力的要求是很大的考驗。

MintM

MintM 是一個通過引導標牌、自助服務終端和攝像機等普通設備的幫助,創造無摩擦體驗(friction-less experiences)的平台。MintM 由 MA 資助並由微軟加速推進,贏得了包括倫敦商學院、Tie Silicon Valley 和 Nasscom Emerge 50 在內的多個獎項,並與多家大公司合作,主要包括埃森哲、 Infosys。他們的 BOT 已部署超過 6 個國家。

在人工智慧的驅動下,MintM BOTs 可以識別客戶和物體,實現無縫的訪問者管理、足跡計數系統、客戶忠誠度評價、線上線下消費銜接、產品洞悉和顧客個性化促銷。

基於標準化的攝像頭的足跡統計和店內分析包括:足跡追蹤和人口統計分析,員工與顧客的不同對比分析。其中顧客店內分析主要內容為:重複訪客追蹤、花費時間、停留區域、畫像以及交互分析(touch interaction analytics)。智能 CMS 平台可提供消費者故事板(customer story boarding)。顧客評價體系的衡量方法(audience measurement)應用了人口學和其他特別的特徵(demographics and many other specialized features)。

MintM 的獨到之處在於:硬體兼容(hardware agnostic):API 埠可用(APIs and white-label available)、基於設備的 AI/邊緣計算(on device AI/Edge computing)、最佳機器視覺服務(best in class machine vision)、自動機器人可以離線工作(autonomous bots can work offline)、無間斷學習機制(constant learning)。

最後 MintM 提及,在智能資訊站無摩擦商業(frictionless business)中的應用的主要的挑戰是怎麼樣提高高價值產品的銷量,解決辦法是智能資訊站展示產品的模型,收集顧客反饋,然後傳遞個性化的信息給顧客。通過顧客的參與數據,結果顯示銷量增長了 6%。

UC Berkeley RISELab

加州大學伯克利分校計算機系教授 Dawn Song,講解了關於 AI 以及 AI 領域安全最新的應用。歷史表明,網路攻擊者經常緊跟新科技發展的步伐。在 AI 領域安全問題越來越受到關注。隨著 AI 控制越來越多的系統,攻擊者會對這個領域越來越敏感。隨著 AI 應用領域越來越廣,被攻擊者攻擊的後果將越來越嚴重。

當機器學習系統中存在攻擊者時會有兩個嚴重的後果。首先在公正性方面,學習系統會產生錯誤或者攻擊者設計的結果。其次被控制的 AI 系統可能被用來攻擊其他的系統,比如尋找其他系統的弱點,鎖定攻擊,實施攻擊。

目前各種保密與隱私方面的解決辦法在數據分析師提取數據進行分析與建模時可能會出現一些不被信任的編程行為,這時的解決方案是程序重寫以及驗證。在雲計算架構層面,有不被信任的架構,解決方案是安全計算(Secure Computation)。在輸出結果時可能會產生一些敏感的結果,這時的解決方案就是差別化隱私協議(Differential Privacy)。

Dawn Song 講解了機器學習系統安全在優步的應用,主要包括區別化的隱私,通用數據保護協議(GDPR)。未來計劃在 Public-Facing System 中應用。

最後是基於區塊鏈差別隱私保護框架的主要內容,豐富模型訓練和服務的協議包括被信任的硬體和安全多方計算(Secure Multi-Party Computation)。智能協議可以直接訪問用戶數據和模型包括經濟激勵去提高模型以及將微服務展示給用戶。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 TalkingData數據學堂 的精彩文章:

南京大學成立人工智慧學院
點擊參賽!歡迎參加 TalkingData 全球廣告反欺詐演算法大賽

TAG:TalkingData數據學堂 |