當前位置:
首頁 > 科技 > 進擊的「魯班」,和阿里人工智慧的野望

進擊的「魯班」,和阿里人工智慧的野望

給你一秒鐘,你能設計出 8000 張海報嗎?

不要那種粗製濫造的效果,而是能掛在雙十一淘寶網站,被上億人看到的那種,帶有獨特設計風格的作品,你能做到嗎?

不開玩笑,即便效率最高的設計師,也只能說這是 Mission Impossible,但一位 2015 年入職阿里巴巴的新員工魯班,只用了兩年多時間,就達到了這個效率,而且到今年雙 11 時,它將很可能成為具有阿里巴巴 P6 設計師水平的員工。這是什麼概念?在阿里,這個等級可以擔綱中等設計項目主創人員。

你可能猜到了,這位魯班並不是人,而是來自阿里巴巴的人工智慧產品,而它能擁有這樣速度,得益於人工智慧技術近年來的迅速崛起,就在今天下午(4 月 21 日),在 UCAN 大會上,我們見到了煥然一新的魯班系統,這一次,它給人帶來的想像更加豐富。

在 2015 年之前,淘寶商品推薦都是通過人工運營控制,但龐大的用戶需求和運營資源的不對等帶來的問題,需要通過技術解決。如果你是淘寶老用戶,你會發現如今的淘寶是「千人千面」的,每個人都會有屬於自己的商品首頁,而專屬於每個人的頁面信息,就需要大量的圖片支持,這就是魯班的誕生的原因。

和人學習的過程類似,作為 AI 設計師的魯班,也是從模仿開始,當輸入海量設計海報、Banner 等信息之後,它會對於其中的背景、主體、修飾等元素進行識別,由此理解它們間的關係。隨後,魯班會「照貓畫虎」一樣對這些素材進行組合,嘗試風格不同的組合後,這些隨機生成的圖片會通過機器來判斷並進行打分,因此生成一系列最優結果反饋給神經網路,並最終成為阿里電商平台對外展示的海報、banner 等圖像。

「2016 年的雙 11,魯班製作了 1.7 億張廣告 banner,如果全靠設計師人手來完成,假設每張圖耗時 20 分鐘,滿打滿算需要 100 個設計師連續做 300 年。」「魯班」創始人、阿里巴巴智能設計實驗室負責人吳春松(花名樂乘)告訴我們,因為每年雙 11 的海量設計需求,設計師需要有這樣的工具幫助提升效率。

實際上,從 2016 年以來,如果你打開淘寶,遇到雙 11 等大型活動,看到那些花花綠綠充滿設計風格的海報作品,不要懷疑,它們的確有不少是機器生成的,並且沒有一張完全一樣。到 2017 年,魯班一天就能完成 4000 萬張海報,平均每秒 8000 張。2018 年,從新手做起兩年時間後,魯班終於迎來了對外開放的時刻。

樂乘告訴我們,今年魯班將會改名「鹿班」,並在五月份把核心能力對外開放,其核心能力主要包含四個方面:

1,一鍵生成:將商品相關素材、文字輸入,選擇自己需要的海報尺寸、風格等,可自動生成符合要求的海報作品。

2,智能排版:將拍攝好的照片和需要的文字輸入,選擇尺寸,可自動生成帶有隨機風格的海報作品或產品展示。

3,設計拓展:將設計完成稿輸入,選擇需要拓展的尺寸,可自動生成相應拓展尺寸的結果。

4,智能創作:擁有自己獨特風格的設計師將自己創作好的系列作品輸入,可以訓練機器,並成為系統新的效果風格。

其中,前三點核心能力主要面向企業和商家,第四點能力則是面向設計師群體,讓他們用另一種方式賣出自己的作品,這樣既能夠讓設計靈感變現,同時也能為這套 AI 系統不斷升級。樂乘告訴我們,作為阿里巴巴的 AI 落地應用,開放後的「魯班」將會成為一個新的商業項目,而生產海報的費用相比人工來講會降低很多。

這裡面令人好奇的事情在於,作為一項將新的商業項目,海報生成的結果能否讓付費用戶滿意?每個人對於好不好看有自己的評價標準,「魯班」要靠什麼來達到這一標準?為了解決這個問題,「魯班」項目選擇和清華大學建立合作,清華大學計算機系「長江學者」特聘教授、人機交互研究所所長史元春教授,目前擔任「魯班」的視覺美學評估總負責,她表示:

「美學可以牽涉到很多問題,基本的是我看到一個東西,我總體的感官和它的主題,這對人的視覺感受來說,在心理學上已經有一些可以參考的依據,而這些依據可利用已有的大量數據驗證,並且成為構造演算法的依據。」

實際上這一套美學相關的判斷標準也經過阿里巴巴電商平台大數據的不斷反饋來進行調整,清華大學在這方面的研究也會得到進一步驗證,因此從商業場景考慮,AI 設計師「魯班」已經不再是試驗性質的產品。

目前,這套系統一端將對接商家和企業,另一端則連接設計師和一些素材庫,在和樂乘的溝通中,他告訴我們,目前已經合作的包括視覺中國、花瓣等圖片庫以及方正字型檔、漢儀字型檔等正版字型檔,因此從實用角度來看,生成的結果不會遜色於設計師,並且商家和企業也可以在使用時事先預覽結果,找到最滿意的結果再選擇付費。

不過,魯班並非要取代設計師的工作,即便目前功能如此好用,卻仍舊需要大量數據讓它成長起來,樂乘告訴我們,今天的人工智慧都是基於大數據規模結構化標註數據,設計行業在不斷變化,如果沒有辦法提供新的數據,那麼魯班就只能停留在過去的階段,畢竟只有人能夠主觀創造新的設計趨勢和風格,魯班的存在更多的是解決讓設計師感到繁重的體力工作。而訓練它還需要我們人類,這也是目前官方正在進行「馴鹿」計劃,讓設計師參與進來的重要原因。

在讓 AI 協助人類的這條路上,除了「魯班」系統,阿里巴巴這次還對外展示了全新的短視頻 AI 工具 Ailwood,這套工具也將會成為淘寶店家日後的重要利器。

Aliwood 是一個短視頻生成工具,它最重要的作用是通過自動分析淘寶商品詳情頁面,生成一段 20 秒內,帶有音樂、文字和圖像信息的短視頻。它的出現,可以說最大程度解決了淘寶店主商品展示的需求。

「我們發現在線下,一些有音樂和視頻展示的店,銷量會有2到5倍的增加,在線上,商品有音樂和視頻展示,分享率會增加40%左右,銷售量上的提升大概時18%左右,但淘寶目前有數十億計的商品,90%都是圖片+文字,商家要想做視頻,找專業的人做需要2萬左右一個,費用很高。」

阿里巴巴達摩院自然交互體驗實驗室負責人傅利民告訴我們,確立這樣的通過圖文轉短視頻的項目是基於真實需求場景來考慮的,而利用 Aliwood 這樣的工具,對於商家銷量將有很好的效果。

「純粹從時間看,如果把淘寶 20 億的商品,在一年內都生成短視頻,大概需要 50 萬的設計師,這樣是做不到的。我們萌生了這樣的想法,能夠真正幫助到商家做這樣的事情。從內容的提取,關鍵詞的抽取最後合成,包括裡面的情感計算,怎麼樣找到對的音樂能夠有正向情緒的延伸,最後合成在裡面。」

而說到視頻,不論是我們如今每天在刷的抖音或者快手,音樂和畫面的配合都在成為影響決定演算法的重要因素,音樂的使用很容易抓住用戶情感,而好的音樂來自於更強大的情感計算能力。浙大-阿里 IDEA Lab 負責人孫凌雲教授告訴我們,在 Aliwood 研發的過程當中,正因為音樂的添加,讓視頻信息量一下子增加了很多,而要做出這樣的知識圖譜,浙大的研究團隊去還從電影中去學習這這方面的內容。

在 Aliwood 這個工具中,音樂是通過基本元素庫和畫面相互匹配來生成的,「比如我們要剪一個服裝相關的小片子,這個過程中我們呈現的是模特的數據,下一秒有平緩的轉換,呈現得是這件衣服穿上身轉一圈的角色,這個轉換是對於音樂庫中某一中節奏或者是某一個特效有一個匹配關係。」孫教授告訴我們,但這只是一種方式,另一種方式是通過先找到合適的音樂,然後反向去組織短視頻的素材,在目前 Aliwood 這一工具中,兩種方式都在運用。

短視頻展示商品自然要比圖片更加直觀好看,而隨著網路帶寬的加強,流量成本降低無疑讓大家在購買商品時會更青睞於商品的視頻化展示,如果說魯班要做的是讓你第一眼就看到商品,那麼 Aliwood 要做的是讓你第二眼就能了解商品,對於阿里這一以電商業務為主的平台來說,這兩個 AI 工具的推出,正式把平台的上的數據,用更加效率化的方式展現給每一個用戶。

當然,這兩個工具目前還都只利用於阿里平台內(不過不局限於淘寶天貓),用樂乘的說法是「阿里的平台數據,學到的都是阿里的設計,有什麼樣的數據有什麼樣的智能,要用到企業設計風格的閉環,是一種數據挑戰。」我們有理由相信,隨著 AI 技術的更快速發展,我們會見到更多這樣實際的應用出現在我們身邊,而利用好這些工具,需要每一個人重新去理解人和 AI 之間的關係,正如微軟 CEO 納德拉說的那樣:

「每個人的基本需求是能夠更有效利用自己的時間,而不是讓 AI 說『讓我們來取代你。』」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 極客公園 的精彩文章:

新欄目上線,三個關鍵詞:Global, Inspiring, Weekly | TechBoard
大幅升級濾網之後,戴森的風扇新品更像空氣凈化器了

TAG:極客公園 |