對話山世光:AI需要傻瓜式的平台 學AI到「藍翔」
文 | 丁廣勝
人物觀點:
希望人工智慧的研發可規模化,易於擴展,基於傻瓜式的AI研發平台,我們期望五到十年之後甚至高中學歷的人都可以研發AI。那時候我們或許會開玩笑說:學AI,到藍翔。
人工智慧落地的商業模式,我個人認為其實現在沒有人能看透,至少目前為止我個人的想像里,如果不結合應用場景,AI這個領域恐怕很難有機會可以發展出像BAT這樣的大公司。——山世光
周末的中科院顯得嚴肅安靜,有不少研究員還在伏案潛心鑽研。
雖然在北京銀谷大廈和杭州濱江區都設有辦公室,但已經雙跨學術和工業兩界一年的山世光仍然習慣在這裡辦公,他的辦公室不大,桌子被一排排書籍環繞著。
他也逐漸習慣了自己的雙重身份,既是中科院計算所的研究員,也是中科視拓的CTO,他認為工業界還是需要非常強的理論和方法作為支撐,所以對實驗室依然非常倚重。
山世光有著超過20年的計算機視覺研究經驗,在國內外刊物和學術會議上發表論文200餘篇,論文被谷歌學術引用12000餘次,研究成果獲2005年度國家科技進步二等獎,2015年度國家自然科學二等獎等。
對於只是擔任公司CTO的職位,他坦言,「我並沒有全職出來創業,而是我的幾個研究生畢業後全職創業,我更多是支持和輔助他們的角色。特別是公司CEO劉昕博士,他是沖在創業最前線的,實實在在地擔負著首席執行官的角色」。
在山世光看來,研究員和創業的不同在於,做研究的時候往往會更關注新問題、新理論和新方法。很多時候是在尋找新的理論問題,即使是問題明確之後,也需要很長的時間去摸索,而且很多時候可能都不一定做成,今天解決1%,明天解決5%,經常是個漸進的過程,而且做成了也未必馬上有用。而在工業界則首先需要理解用戶的需求,考慮可以滿足需求或者說馬上可以落地的方法和技術。從學術界到工業界,更接近應用落地了。
他還希望讓人工智慧的研發可規模化和可擴展,利用技術服務平台為B端客戶賦能。或許我們可以期待幾年後,基於傻瓜式的AI開發平台,高中學歷的人都可以研發AI,「那時候我們或許會開玩笑說:學AI,到藍翔」山世光笑著說到。
此外,當網易智能問到如何看待AI領域的商業發展模式時,山世光表示,我個人覺得其實現在沒有人能看透,至少到目前為止我個人的想像里,不結合應用場景,單純的AI科技領域恐怕很難有機會可以發展成像BAT這樣的大公司。
對於當前的行業現狀,他建議不要「過度承諾」,不要在宣傳的時候故意「隱藏前提條件」,政府、媒體的宣傳不要讓公眾產生誤解,比如人們看了AlphaGo,然後就說什麼都可以解決了,這是泡沫風險,從投資的角度,還會導致資本槓桿的失衡。
應對AI人才稀缺 打造新的技術發展模式
網易智能:作為一家非常年輕的公司,您如何定位自己和自己的團隊?
山世光:目前我們在北京有30多人,杭州子公司有20多人,總共接近50人的規模。
現在公司大概在做三個層面的事情,首先,杭州子公司主要做直接落地的產品,直接面向客戶,比如說一個單位,它要人臉閘機,人臉考勤、門禁和訪客系統,我們會從硬體到軟體提供全套解決方案。
第二個層面是北京團隊的演算法和技術服務,主要是to B,包括我們跟華為、平安科技、電信、移動等大客戶的合作,主要形態是深度的技術服務的形式,相當於把技術和演算法以SDK甚至源碼的方式授權給B端的客戶,他們又會拿著這些演算法,再去開發針對某一個具體需求的業務系統。
第三個層面,也是我們和其他公司非常不同的一點,我們不滿足於做項目制的技術服務,而是進一步往後端做to B的「技術服務」產品,或者說「賦能型」的產品。具體地說,我們開發了一個平台型的AI研發產品,可以為更多B端客戶服務,特別是面向難以組建AI研發團隊的中小微企業服務,我們把這個平台稱之為SeeTaaS。
網易智能:深度學習的平台開發工具很多,那為什麼還要做SeeTaaS?
山世光:打個比方,現在深度學習的開發,有點類似於照相領域,曾經的膠片時代,照相需要昂貴的專業相機、膠片、專業的相紙、相片沖印室,還需要一個懂曝光、對焦、取景的專業攝影師。這件事需要專業的基礎設施才能做,需要專業人士才能照。對應到AI就是,只有所謂的AI演算法工程師,深度學習演算法工程師,才能夠在TensorFlow,Caffe,MXNet等等這些專業的深度學習開發工具上,去生產用戶需要的一個某種AI引擎。
而我們現在進入了讀圖看臉的時代,因為我們有了傻瓜相機有了更智能的拍照手機,按一個鍵你就可以拍一張照片,我認為這個變遷同樣適用於AI引擎的開發,從只有專業人士可以AI技術,到越來越多非專業人士也可以開發AI技術的時代。但這需要一個新的平台,這種平台不能是像TensorFlow這樣專業化的工具,而應該是一個更傻瓜式的AI開發工具,這就是我們為什麼做SeeTaaS的原因。
不僅如此,做這個平台還有AI人才稀缺的考慮,專業的AI開發人員現在極度稀缺,直接表現就是AI人才奇貴,大多數公司要麼找不到這樣的人才,要麼雇不起這樣的人才。而另一個令人尷尬的現實是:AI應用落地的需求是非常碎片化的,現在還不存在一個包打天下的演算法,很多看起來相似的需求背後的技術也有差異。更要命的是,往往是A需求需要A的數據,B需求需要B的數據,C需求需要C的數據,何況背後的AI演算法還需要根據數據情況進行調整,所需要的時間動輒數月。需求千變萬化,如果每個需求都分配幾個AI專業人才去滿足,必然導致公司成為人力成本極高的企業。我們希望能夠把AI需求滿足過程變得更加自動化,而不是說每一個需求來了之後,都是一推專業人士去做。
我們重視SeeTaaS業務還有一個重要原因,那就是數據的敏感性。因為法律的原因,很多企業客戶對數據是非常敏感的。如果沒有SeeTaaS,我們就只能派AI研發工程師到客戶那裡進行客戶需要的AI引擎的開發,這就變成了一個非常繁重的研發模式。也就是說,針對很多需求,我們其實沒有數據,而客戶自己有數據卻不能或不願給我們。有了SeeTaaS,我們就可以提供給客戶一個私有的SeeTaaS雲平台,讓客戶自己放心的研發自己的AI。當然,也會有很多客戶對數據不敏感,可以把數據共享出來,那當然更好,我們只需要為他們提供共有的SeeTaaS雲服務就可以了。
AI將迎來規模化普及 學AI到「藍翔」
網易智能:您的目標是什麼?想把公司打造成一家怎樣的企業?
山世光:中科視拓的願景我們用兩句話概括,即「知人識面辨萬物,開源賦能共發展」。前一句對應公司名字視拓中的「視」字,概括的是我們主攻的技術範疇,即以計算機視覺技術為主,特別關注圖像或視頻中人的識別,人的意圖和情緒的感知,以及對其中萬事萬物的識別和理解。我們相信「會看的AI更智能」。
第二句話則概括了公司名字中的「拓」字,即我們期望不僅僅提供人臉識別、行人識別、車輛識別這樣的計算機視覺技術,這個其實能做的人很多,我們更希望以更高效的方式與大量B端客戶合作,讓AI的研發可規模化和可擴展,即有更好的可拓展性。
我為什麼強調現在AI技術的可擴展性不好?以讓機器人自動檢測小區里的垃圾為例,實際的需求是五花八門的,可能今天需要檢測狗屎,明天則需要檢測礦泉水瓶子,後天就是塑料袋或者爛白菜,你想想垃圾有多少種?
實際應用中可能會有數萬種物體要去識別,如果每認一樣物體,都要搜集大量樣本數據的話,這是非常高的代價。所以,長期來說我們希望能夠以一種可規模化、可擴展的方式去提供這種技術服務。未來五到十年,我們相信會有大量的勞動力進入AI研發市場,採用的就是傻瓜式的平台,或許到時候我們會開玩笑說:學AI,到藍翔。
當然,短時間內寄希望於這樣的平台解決所有問題也是不現實的。還需要針對不同的問題,開發全新的演算法,特別需要解決現在深度學習不能解決的問題。這也是我還花費很大一部分精力從事前沿學術研究的原因。
此外,關於AI領域的發展模式,我個人覺得其實現在沒有人能完全看透,至少目前為止我個人的想像里,如果不結合應用場景,AI這個領域恐怕很難有機會可以發展出像BAT這樣的大公司。縱觀國內外,做to B的大公司是非常少的。
網易智能:一年多以來,您有哪些創業感想?自己從研究員變為創業者,如何看待自己的這一轉變?
山世光:必須強調的是我的身份是雙重的,而且是學者為先,企業家在後。我們要實現的三個層次的使命中(第一個問題中提到的三個層次:產品落地、AI技術服務、SeeTaaS),第二層和第三層都需要非常強的理論和方法支撐,所以我在中科院計算所的實驗室的支持是不可或缺的。
更重要的是,中科視拓的CEO並不是我,而是我去年畢業的博士劉昕,另外我還有幾個畢業生也全職在公司工作。我在公司的身份是CTO,主要專註技術。特別值得強調的是,劉昕博士不僅僅懂技術,也懂商業和管理,他作為公司的CEO,是沖在創業最前線的,實實在在地擔負著首席執行官的角色。
當然,這一年,因為更多的接觸工業界和關注應用問題,我對技術落地的認知是有提高的。畢竟做基礎研究時,很多時間是在尋找新的學術問題,即使是問題明確之後,也需要很長的時間去摸索,而且很多時候可能還不一定做成,今天解決1%,明天解決5%,經常是個漸進的過程。而在工業界則首先需要理解用戶的需求,考慮可以滿足需求或者說馬上可以落地的方法和技術。從學術界到工業界,肯定要更重視可以應用落地的技術和方法了。
網易智能:中科視拓現在有什麼最新進展,新的計劃是什麼?
山世光:大家對我們可能有誤解,我們不只是一家人臉識別公司,我們以人臉識別為出發點,然後是在技術服務方面發力,特別會主推SeeTaaS服務,這是我們2018年的重點。
營收方面,中科視拓2017年已經有千萬級的收入,明年計劃是三倍以上的營收預期。規模方面,我們也需要招募更多的人才,希望到明年底的時候公司規模可以擴大一倍。當然,在大家都沒有摸索的非常清楚的情況下,我們比較謹慎的控制著規模。
「沒有絕對的安全,人臉識別支付也是如此」
網易智能:人臉識別領域是AI非常火的細分門類,國內有很多類似的公司深耕其中,都在持續發力,您如果面對競爭因素?
山世光:顯然是有競爭的,人臉識別就是一個紅海市場了,但從另外一個角度來講,這個市場非常大,現在至少還有一定的時間窗口,每一個公司都有成長的空間。
整個人類社會其實就是以身份識別為基礎的,如果一個社會每個人都不能知道對方是誰,這個社會是沒法兒運行的。幾乎所有的信任關係,所有的交換,所有的交易,全都要基於大家知道誰是誰這個條件。
網易智能:您如何看待目前人臉識別技術的發展?是否足夠成熟?
山世光:人臉識別技術肯定會非常快速的在相對成熟的領域落地,現在最成熟的就是1:1的人臉認證,成熟度可能高達98%或者更高。
比如說iPhone X手機裡面,它就是典型的1:1認證應用場景,其實也是人臉識別領域最容易的一個場景,這款手機的攝像頭和普通攝像機是不一樣的,它可以看到近紅外圖像和深度圖。
近紅外圖就是它上面有一個近紅外的光源,會發近紅外光,因為是近紅外,我們人眼是看不到的。還有一個是深度圖,它測量的是攝像頭離你臉上的每一個點的距離,這些信息綜合起來進行人臉識別。
網易智能:您覺得人臉識別絕對安全嗎?這些技術在安全領域會有哪些問題?
山世光:沒有絕對的安全。例如,蘋果官方表示iPhone X的FaceID錯誤率是百萬分之一,但蘋果也建議同卵雙胞胎最好不要用FaceID。如果有人願意花上足夠的成本,也是可以攻破它的,已經有一些案例了。惡意攻擊者雖然可以偷到一個人的手機,但有手機主人精確的面部信息的可能性並不大,所以其危害基本是可控的。
現在很多車站都開始應用人臉識別進站了。錯誤識別的風險當然也還是有的,但這個風險是極低的:因為拿別人的身份證冒充他刷臉,成功的概率可能只有千分之一。換句話說,不法分子得「偷」1000個人的身份證,試刷臉1000次才有一次可能成功,顯然不會有人這麼去做的。
相對不成熟的應用是黑名單人員的監控,即用大街上等各種公共場所的監控攝像頭來識別犯罪嫌疑人,由於攝像角度、光線環境、偽裝和老化等諸多因素,導致這種場景下人臉識別的難度比較大。當然,這方面技術的進步也是非常快的,越來越多的人臉識別系統已經開始在公安實戰中發揮重要作用。
網易智能:您認為人工智慧行業有泡沫嗎?健康的行業環境應該是怎樣的?會議邀請一個接著一個,您會感覺這個大環境浮躁嗎?
山世光:從技術的角度來講,所謂的泡沫就是「過度承諾」,所謂的過度承諾是你只能做到60%,你說成做到90%,或者是宣傳的時候故意「隱藏必要的前提條件」,非技術人員可能過分解讀你展示的數據。
此外,從政府、媒體、大眾解讀的角度,語言其實是不統一的,這種不統一可能會導致對技術的誤解,特別是過度泛化,比如有些人看了AlphaGo之後,就說什麼都可以解決了,這是有泡沫風險的。從投資人的角度講,大家都看好AI,誰都不想落下,也可能會導致資本的槓桿作用失衡。
從人才價格的角度,如果說按照商業規律、經濟規律的話,物以稀為貴,所以現在人才貴也正常。但從這些人才短期內可創造的價值的角度看,恐怕是有泡沫的,我個人判斷會有回調的可能性。(完)


TAG:網易科技 |