當前位置:
首頁 > 新聞 > 新演算法藉助幾段文字創作視頻,電影很可能也將被人工智慧所顛覆!

新演算法藉助幾段文字創作視頻,電影很可能也將被人工智慧所顛覆!

沒能和著名電影製片廠合作、拿不到大筆預算和強大資源的電影編劇們可能很快會有另一種製作電影的方法——因為最近開發的一種演算法能夠通過分析一個(很短的)劇本,從而創作相應的視頻短片。這些由演算法構建出的電影雖然離奧斯卡影片還有很遠的距離,但是其應用場景不僅僅局限於電影產業。比如說,類似的計算機技術可以被警方利用,從而從目擊者的供詞中還原車禍或犯罪現場的場景。

目前,人工智慧(AI)在識別圖像內容與提供標籤這些方面已經獲得了長足的進步;可是相關的「生成」演算法反其道而行之,希望能從標籤(例如腦部掃描圖)中構建圖像。例如有的「生成」演算法能夠通過分析一幕電影截圖,推測下幾幕的劇情發展。但是將這些技術結合起來並不容易——先是需要從文字中構建一幅圖像,再是讓圖像中的物體切合實際地根據文字描述運動起來——這一計劃是史無前例的。

「據我所知,在文字轉化視頻的多次嘗試中,這是第一個可以帶來如此好的效果的演算法。這一演算法生產出的結果並不完美,但是至少它們看上去像是真實視頻。」比利時魯汶天主教大學的一名計算機科學家Tinne Tuytelaars這樣評價,「這是很不錯的成果。」Tuytelaars目前也致力於視頻預測工作。

這一新演算法是機器學習的一種,這就意味著它需要訓練。具體而言,這是一個神經網路,由多層的運算節點組成,以一種與人類腦神經處理信息的相似方式處理數據。在「訓練」過程中,演算法會記錄每一次計算後的正確與否,並且會運用記錄的結果改良網路中節點的權重,力求未來的計算更準確。

這種文字——視頻轉化神經網路的運行過程由兩個階段組成。研究者們描述其理念是「模仿人類藝術創作的過程」。第一階段是提煉文字,創造視頻內容的「梗概」,也就是創作一個視頻背景的模糊圖案,加上一個按照文字描述產生的簡略的運動過程。第二階段中,神經網路的作用是一個「鑒別者」。比如說, 前一階段的演算法生成了一個「在大海中駕駛帆船」的視頻。這個視頻將和實際拍攝的海上航行視頻放在一起,讓鑒別者選擇哪一個視頻是真實的。經過多輪訓練後,作為「鑒別者」的演算法會變得更加仔細,其反饋也對「生成」演算法生成的視頻提出了更高的標準。因此,「生成」演算法能夠逐步生產出更精細的視頻。

研究者們在演算法上訓練了10種場景,包括「在草地上打高爾夫」「在大海中風箏衝浪」等,演算法都按照文字生成了噪點很大的VHS視頻素材。儘管如此,研究者們在美國路易斯安那州新奧爾良人工智慧促進協會(the Association for the Advancement of Artificial Intelligence)的報告中稱,如果使用一個簡單的分類演算法從六個選擇中選擇正確的視頻內容,半數時間的選擇結果都是正確的(不過「帆船」和「風箏衝浪」經常被弄混)。除此之外,這個演算法還能夠創作出一些「不合理的行為」,比如「在雪地里駕駛帆船」和「在泳池裡打高爾夫」。

「他們這一方法結合了兩個階段,非常有趣。」馬里蘭大學巴爾的摩分校,同樣進行視頻預測研究的Hamed Pirsiavash這樣評價稱,「這是一個非常困難的問題,我很高興看到這些人取得了很好的進展。」

目前,這些演算法創作的視頻僅有32幀——大概持續一秒的時間——並且僅有64×64像素,大概郵票大小。該演算法論文的第一作者,杜克大學(Duke University)的Yitong Li表示,更大的解析度和更長的視頻長度都會減小準確性。與此同時,由於視頻中生成的人體形狀都非常扭曲,他下一步會使用人體骨骼模型來改善視頻中的人體運動。

Tuytelaars預測這種演算法在好萊塢以外有非常多的應用場景。視頻生成演算法能夠將電影進行進行更好的壓縮存儲,或者可以為其它機器學習演算法生成訓練數據。比如說,較為真實的視頻能夠訓練自動駕駛汽車規避一般情況下很難遇到的危險路況。Pirsiavash也說,深刻理解視覺世界的程序可以被用來開發從賽事裁判到視頻監控等一系列有用的應用程序。它們可以幫助自動駕駛汽車預測路上的一台摩托車將要去哪裡,或者訓練家用機器人打開冰箱。

由AI創造的好萊塢大片可能離我們還很遠,但是隨著AI在視頻產業中的發展,我們終於能知道「在草叢中風箏衝浪」是什麼樣子了。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

Tomaso Poggio解析下個「AlphaGo」線索,再談「深度學習鍊金術」
隱憂!「機器人醫生」正在偷走年輕醫生的培訓機會

TAG:DeepTech深科技 |