AI論文99%是灌水,99%的媒體在吹牛?AI從業者們怎麼看?
程序員的 8 點技術早餐
策劃|AI 前線
編輯|蔡芳芳、陳利鑫、小智
寫在前面
2017 年可以說是 AI 元年,幾乎所有的科技大事件都發生在 AI 領域。
還記得當初你被一個會後空翻的機器人支配的興奮嗎?
後來,OpenAI 的研究人員又突發奇想,讓機器人相互摔跤、踢足球、翻牆,據說效果非常不錯。這顫抖的小腿、風騷的走位是不是很萌?
會出汗冷卻系統的機器人,話說你真的需要健身減肥嗎?
以及不久前獲得了沙烏地阿拉伯居民身份的索菲亞,她會開「我要毀滅人類!」的玩笑話(驚出一身冷汗),還會暗戳戳嘲諷機器威脅論的忠實擁護者馬斯克。
自動駕駛技術也真正走到了聚光燈下,賺足了眼球!
事實上,這些比較具有輿論效應的全民熱議話題只是冰山一角,AI 領域在今年發生的變革隱藏在嘈雜噱頭之下,等待我們去挖掘總結。
為此,我們對 AI 領域的數十位開發工作者進行了採訪,問了問他們 AI 領域的哪些變化在他們眼裡可以被視為里程碑式的事件?對於有人諸如 AI 論文 99% 是灌水,99% 媒體是吹牛的言論,它們是怎麼看的等問題,來看看他們怎麼說的吧!
印象篇
「各大公司都在宣稱自己在 AI 方向的加註,以及民眾,媒體對"AI"的狂歡。」
2017 年,AI 領域給開發者人員留下最深刻印象的有哪些事件呢?
在各位開發人員的回復中,我們發現幾乎每個人對 2017 年 AI 領域印象最深刻的事件都包括 AlphaGo 和 AlphaGo Zero 戰勝人類圍棋選手這一歷史性事件。對此,也有人表示,「今年印象最深刻的莫過於 AlphaGo 了,雖然覺得其實結果沒太大意義,但帶來的影響確實大。」
另外,AI 程序打敗德州撲克專家、人臉識別、波士頓 Atlas 機器人後空翻、智能音箱、量子計算機、百度發布無人駕駛平台 Apollo 進行無人駕駛車輛測試、中國將人工智慧上升為國家戰略等事件也都給他們留下了深刻的印象。
也許一位微軟的語音工程師的回答最能從廣泛意義上反映出 AI 在國內的現狀:「最讓我印象深刻的,是各大公司都在宣稱自己在 AI 方向的加註,以及民眾,媒體對"AI"的狂歡。」
這是 AI 開發者對於 2017 年 AI 領域發生事件的印象,那麼對於普通大眾來說,這一年他們對於 AI 的印象是什麼樣的呢?
可能普通大眾對於 AI 的印象還是很高大上的東西,"民眾對 AI 的理解主要來自於科幻電影,而多數媒體為了生存和點擊率,需要寫民眾愛看的內容,那麼從主觀上就有吹牛的動機,從而失去了新聞工作者客觀的職業素養。所以現在網上充斥著「震驚!xxxx;重磅!xxx;恐怖!xxxx」這種文章。不可否認的是,這些文章的確提供了一些有用的信息,比如會提供一些有意思的工作的鏈接。不過通常過於浮誇的報道,會加劇民眾對 AI 不切實際的想像,以及影響一些經驗不足的從業人員,比如學生。"微軟的一位語音識別工程師說道。
炒作篇
「技術炒作這種事情,如果一點都沒有,也不見得就是好事。」
AI 在近幾年的炒作很厲害這一點無須否認,在這一領域工作多年的技術人員見證了 AI 是怎麼被炒火起來的過程。在他們的印象中,AI 領域都經歷過那些炒作呢?
移動電商 演算法工程師 ——圖像演算法技術研發
我參加工作 11 年了,有印象的技術炒作包括:智能家居、3D 列印、機器學習、人臉識別、VR、無人駕駛、虛擬試衣等。有的技術經過長時間的沉澱找到了應用場景,比如機器學慣用於推薦、人臉識別用於金融。有的技術估計還是概念,沒有落地。總的來看,炒作普及了大眾的技術視野,儘管有泡沫,泡沫過後總會留下一些東西,或者是技術的、或者是商業的,這些會長期支持技術商業化。
IBM 前端工程師 —— 雲計算,AI,Social,前端 +.Net
我在工作中見過的炒作包括前端框架、Vs studio 各種推陳出新等。對此,我的感悟是底層很重要,不管什麼框架,重點還是要會看原生的代碼。技術平均每年大更新一次,找准自己的方向,儘快轉型。看到做 mainframe 的同事眼睜睜看著自己的技術被淘汰,太遲轉型面臨失業降薪,很心痛,要吸取教訓。
Coupang 數據工程師 —— 電商
我工作已經超過 10 年,經歷過的 AI 炒作有 Java EE、開源、大型分散式電商平台、大數據、機器學習 / 深度學習、AI。我的感受是技術發展太快,需要學習的東西太多,有時候為了照顧廣度,就很難有深度;有些領域要深入需要一定的時間和實踐,如果太專註某個領域,又擔心技術過時,趕不上潮流。
BAT 研發工程師 —— 搜索 +AI DevOps、敏捷實施和落地
工作六年多,經歷過雲計算、容器、DevOps、AI 等技術理念的興起到成熟。
每年我都會關注 Gartner 的 Hyper Cycle,有點可惜的是,Gartner 的 Hyper Cycle 對中國不太熱衷,我們只能借鑒美國和印度市場的趨勢了。從這幾年看,中國 IT 的發展越來越貼近美國發展的趨勢。特別是從容器、DevOps、AI 的興起來看,我們真的沒有落後太多了。所以 Gartner 的 Hyper Cycle 差不多就是一張能告訴我們這波碼農,未來我們需要掌握什麼領域或者往那裡跳槽的風向標了。
而其他的技術,例如區塊鏈技術,還是要想好跟自己的工作能結合,才會去學習。
還有很多技術人員見證的炒作還包括數據挖掘、區塊鏈、量子計算、AlphaGo、無人駕駛、物聯網、AR/VR 等。
「感覺雖不靠譜,但是得有人無畏前行,人多自然能出結果」,「雖然各大公司都在努力的追求技術的創新,但是如何把新的技術在實際生產中應用,是目前應該解決的問題「,」技術炒作這種事情,如果一點都沒有,也不見得就是好事「,是這些技術人員在歷經無數熱潮時內心最真實的感受。
與 AI 結合技術門檻篇
「有一個名詞稱為奧卡姆剃刀,說的是假如有多個模型都能達到差不多的效果,選最簡單的。」
對於那些結合了 AI 的公司,他們是如何在工作中應用 AI 的?結合 AI 的過程有難度嗎?是否有技術門檻呢?
明略數據 AI 工程師 —— 文本挖掘
我在工作中做自然語言處理,總體來說,處理無結構的文本數據還是很有難度的,就算 AI 技術,也無法像一個成年人一樣,迅速理解各種靈活的表達方式和新詞。
蘑菇街 演算法工程師 —— 電商公司,面向年輕女性提供時尚化和社交化的購物平台
我目前負責圖像演算法技術的研發工作,工作中主要是結合圖像識別技術來改善電商平台的產品體驗。AI 有難度,也有技術門檻,不僅僅是指技術本身,而是指 AI 落地的門檻,要對應用場景有足夠的理解,有業務的敏銳感覺。
百度 AI 工程師 —— 搜索 手機百度 app 和簡單搜索 app 的圖像客戶端
本人負責百度移動端的 AI、圖像等工作,與 AI 緊密相關。2017 年以前移動和 AI 結合難度較大,瓶頸主要在於移動設備的性能較差無法承擔起較大的神經網路運行。隨著移動設備性能不斷增強,各大公司跟進開發框架。在軟硬體雙飛的未來,移動設備和 AI 結合已是大勢所趨。
騰訊 後台開發 —— 手機瀏覽器遊戲、app 個性化分發
我負責 QQ 移動瀏覽器內的遊戲、app 的個性化推薦,需要使用到較多的機器學習的演算法,和傳統後台相比,AI 的門檻還是比較高,尤其對非科班出身的同學,需要補齊大量的高數、概率統計、優化理論等數學基礎,還需要了解統計學習、深度學習等常用的演算法。
用一句話概括結合 AI 的技術門檻:「有的放矢,否則不僅毫無意義,而且難度很大」,也有人認為」傳統的技術和目前大熱的 AI 技術相結合,有一定的難度,掌握一些計算機基礎知識的人更容易入門 AI 技術。「
但也有人表示,「工作中與 AI 的結合不難,但是要做到準確率高、高並發響應很難」,「關鍵在於數據,技術難度不算太大」,但畢竟這種說法是少數的。
總之,大多數技術人員認為 AI 與目前的工作結合起來難度較大,技術門檻較高,而且難點在於與實際應用場景的結合。而在機器學習界,有一個名詞稱為奧卡姆剃刀,說的是假如有多個模型都能達到差不多的效果,選最簡單的。而用高端模型不一定能充分理解業務,反而是採用簡單模型的效果更好。因此,企業在實際應用場景中應該根據自己的業務類型,選擇適合自己的模型。
人才篇
現在,關於 AI 人才稀缺,院校畢業生剛出校門就可以年薪百萬千萬的消息刺激著不少人的神經,對於 AI 培訓課程趨之若鶩,面對高昂的培訓費用也非常捨得砸錢進修。那麼,AI 人才的缺口到底有多大?這些開發人員怎麼看待目前市場上 AI 人才的超高薪資和各類 AI 入門培訓課程呢?
在我們的採訪對象中,不少人表示自己並不是出身 AI 專業的,也沒有 AI 相關學歷,他們入門 AI 的方法主要是通過在實踐工作中積累經驗,加上觀看網路視頻教學課程、閱讀相關源代碼、技術博客等方式自學 AI,有著自學不息的精神。
對於十分火爆的 AI 培訓課程,其中一些回答描述非常與現實狀況實際上十分貼切,「近年來一些大數據的課程帶上 AI 的帽子會變得更加搶手,但實際上教授的還是大數據相關的東西。但課程本身如何還是基於個人需求。」
而這些課程是否真的對於入門 AI 有幫助呢?大部分回答持否定的態度,認為兩三個星期的培訓就可以從事門檻相對較高的 AI 工作有些不現實,AI 薪資虛高,課程質量也參差不齊。
明略 數據工程師
「AI 入門培訓都是在騙錢,收智商稅,想學的話踏踏實實補數學,踏踏實實看書看博客,精讀幾篇經典的 paper,github 上多復現幾個實驗。」
AWS 工程師 —— 雲計算
「泡沫太嚴重了,AI 還沒有實際創造那麼大價值。」
也有人表示離自己太遙遠,無法做出評價。
但也有人對 AI 課程火爆的現象給予了比較客觀的評價。
第四範式 工程師 —— 機器學習平台
AI 人才的高薪說明行業對這類稀缺人才的關注,實際上在任何行業頂尖的人才都是稀缺的,也會有所謂的超高薪的情況,這點我認為是正常的並且對我個人沒有太大影響。AI 培訓也是適應這個行業潮流所逐漸出現的,有意思的是以前宣言是大數據培訓的課程現近一般都會加上 AI 或者人工智慧這個招牌,但實際上還是培訓大數據相關的技術,不同人對這類課程的需求也是不一樣的,我個人更推薦通過參與開源設計以及實踐的方式來入門機器學習領域。
「這麼火,誰都會來分一杯羹的。就像當初大數據炒作一樣,超高薪是因為人才太少。入門課程還是很有用的,但是要有乾貨。」
也有人在校有過兩年相關科研經歷的碩士在讀生提醒在校生不要盲從,要根據實際情況和自己的需要選擇學習的方式。「目前 AI 技術是一個發展前景非常好的產業,各大公司不惜高薪來吸引 AI 人才的加入,但是隨著時間的推移,AI 人才的積累勢必會飽和,所以在校的大學生等也要有一些清晰的意識,不要盲從。如果說自己可以學習的東西就不需要培訓了,當然如果自學很吃力,可以考慮報輔導班。」
局限篇
「在真實的業務場景中,要落地機器學習模型的門檻還是比較高。」
當問及結合各自目前的工作中,AI 目前存在的最大局限是什麼時,這些開發人員的回答中不少都涉及到了 AI 落地難的問題,當然也有人提到了 AI 過於依賴於深度學習,方法單一、缺乏訓練數據、拓展性差、識別偽 AI 等問題。
明略數據 工程師
AI 在工作中最大的局限在於落地,真正落地賺錢的產品屈指可數,這個行業健康發展,還是要多接地氣,切實的為社會解決問題。」
第四範式 工程師
在真實的業務場景中,要落地機器學習模型的門檻還是比較高,用戶需要能夠把業務模型抽象成機器學習任務,並且完成數據接入、數據清洗、特徵抽取、模型訓練、參數調優等一些列過程,對於業務理解能力和開發能力都有很高的要求,而且除了模型訓練其他目前都難以使用 AI 來協助解決。因此我認為未來 AI 的發展應該向著低門檻的方向,通過演算法或者工程的優化,例如實現易用的數據引入和處理平台、實現 AutoML 和自動調參的演算法,讓更多人可以真正把 AI 落地實際業務中。
AWS 工程師
太依賴於深度學習了,方法單一,有些問題深度學習效果也不是很好,估計未來幾年學術界會出現比深度學習效果更好的方法。
浪潮軟體 數據採集工程師
對無規則事物的分析學習。畢竟圖像、圍棋、聲音都還是有一定之規的,仍需要人腦將抽取規則輸入給 AI。
蘑菇街 演算法工程師
目前所謂 AI,都是基於人類經驗或者積累的數據來工作的,只能做簡單的重複的工作,下圍棋也不例外,只是在人類能力上的複製。未來的 AI,應該是具有一定推理能力的,例如智能助理。
此外,騰訊的開發後台工程師則表達了對監管法規空缺的憂慮。
影響篇
「AI 的出現讓很多開發者心浮氣躁,但腳踏實地的人不多。」
AI 的火爆發展在開發人員眼裡是什麼樣的?他們如何看待 AI?AI 對於普通開發者的工作,是正面影響多還是負面影響多?綜合採訪對象的回答,我們得出結論,大多數人認為 AI 對他們的積極影響還是大於消極影響的。
「AI 是人們的合作夥伴,不可能取代人類。普通開發者,應該了解 AI,利用 AI 改善自己的工作,比如開發工具、開發技能,以及解決問題的思路。AI 不能取代開發者,但是可以輔助開發者。」——明略數據 工程師
「我還不知道,我覺得我現在做的工作(編程)將來可能會被 AI 取代。但是一定有新方向可以供我發展,雖然我還沒看到這個方向在哪裡。」——IBM 前端工程師
但也有人表示,AI 的出現讓很多開發者心浮氣躁,但腳踏實地的人不多。
「我覺得 AI 是一種技術,就像前端後端安卓 IOS 一樣,不希望大家跟風學,現在這個行業很浮躁,真正的腳踏實地的人很少,大部分都在仰望星空,這不是好現象,所以對於普通的開發人員來說,負面影響多,但是我還是看好這個行業。」——明略工程師 2
誤解篇
「人們認為 AI 可以上天入地,無所不能,彷彿很快就會有一支 AI 軍隊出現一樣。」
說起普通大眾對 AI 最大的誤解,可能就是認為 AI 比人更智慧,無所不能,認為機器和真人一樣會思考,超越人類,控制人類,取代人類的工作等。
就如 IBM 一位前端工程師所說:「人們認為 AI 可以上天入地,無所不能,彷彿很快就會有一支 AI 軍隊出現一樣。實際上,AI 是要 train 的!要 train 的!要大量的 training 的!重要的話說 3 次。AlphaGo 級別的 AI,需要有一個團隊加上很多高級計算機在 train,AI 不是隨隨便便找條流水線就能量產的。」
「人們認為人工智慧是來取代人的,會傷害人,這是很大的誤解。技術本身無對錯,這取決於怎麼使用 AI,誰來使用 AI。AI,也是人類智慧的產物。只是如果被壞人利用了的話,AI 會傷害人類的利益;比如隱私的泄露和濫用、甚至有 AI 武器的出現。」——蘑菇街演算法工程師
「目前大家對於 AI 技術感到新奇並帶有一點恐懼,主要因為不了解底層的原理和細節,誤以為是「自我覺醒」的模型。AlphaGo 並不是自學掌握圍棋規則的,也不會自己悄悄地用電腦下棋,其實它是一顆蒙特卡洛樹加上一個精心設計的神經網路模型,而這個程序只是接受棋盤信息作為輸入,然後輸出贏棋概率最大的落子點而已,本質上 AlphaGo 只是一些列浮點數而已。對於 AI 技術原理不了解,並且加上個人臆造的想像,是目前非 AI 從業者普遍的最大誤解。」——第四範式 工程師
最期待應用篇
「他們最期待的 AI 應用中無人駕駛的呼聲最高。」
對於這些專業的技術開發人員,他們對於 AI 應用的期待也是五花八門,多少也能代表一部分人的心聲。
未來,他們最期待的 AI 應用中無人駕駛的呼聲最高,很多受訪者不約而同看好無人駕駛的發展,甚至有人打趣道為了等待無人駕駛的到來至今沒有考駕照!也有不喜歡做家務的人表示希望擁有保姆、管家類 AI,可以分擔家務;也有不少人對 AI 音箱、自動編碼 AI、個人助理等表示很感興趣。
學習計劃篇
「多關注機器學習和深度學習,將之與目前的工作結合起來」
作為專業的開發人員,面臨層出不窮的新技術和工作要求,他們也有意識地在加強 AI 方面的學習,自我學習對其發展的重要性也越來越重要。那麼,在 2018 年,他們有什麼學習計劃呢?
結合各自的工作領域,他們分別在學習實變函數、泛函分析、量子力學、彙編、計算機視覺、js 全棧、最優化理論 +TensorFlow、機器學習基礎理論及 AI 在金融和醫療領域的應用等方面有學習的計劃。
總之,大多數技術人員認為多關注機器學習和深度學習,將之與目前的工作結合起來,是 2018 年他們需要做的事情。
最後,對於 AI 的宣傳,大多數採訪對象認為媒體有過分誇大之嫌,甚至有人認為 AI 的 paper 99% 是灌水,AI 的媒體 99% 是跟風,AI 的團隊 99% 存在著落地難,刷排名現象,背後有資本推動的原因。
對於媒體上部分宣傳,可能是行業外人士因為信息不對稱產生的誤解,比如之前誤報的 Facebook 機器人發明新語言的事,其實不過是模型訓練的時候跑飛了,普通的自動化工廠被宣傳為人工智慧無人工廠,而一些根據統計信息生成文本的程序也被捧為具有自我意識的人工智慧機器人,這些都存在過分誇大的成分。
但是,也有人認為目前 AI 已經真實來臨,這個事實不存在虛假或者吹牛成份。
AI 到底是灌水吹牛的成分多,還是會在 2018 年真切地來到我們的身邊呢?我們不妨靜靜等待,看 AI 在 2018 年將會帶來什麼驚喜!
***
今日薦文


TAG:InfoQ |