當前位置:
首頁 > 最新 > 5位行業大咖激辯「CV+傳統行業」的機遇與挑戰

5位行業大咖激辯「CV+傳統行業」的機遇與挑戰

雷鋒網按:2018 全球人工智慧與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了寶安區政府的大力指導,是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智慧領域最具實力的跨界交流合作平台。

雷鋒網CCF-GAIR 2018 延續前兩屆的「頂尖」陣容,提供 1 個主會場和 11 個專場(仿生機器人專場,機器人行業應用專場,計算機視覺專場,智能安全專場,金融科技專場,智能駕駛專場,NLP 專場,AI+ 專場,AI 晶元專場,IoT 專場,投資人專場)的豐富平台,意欲給三界參會者從產學研多個維度,呈現出更富前瞻性與落地性相結合的會議內容與現場體驗。

大會第二天的計算機視覺專場大咖雲集,ICCV 2011與CVPR 2022主席權龍、微軟亞洲研究院副院長張益肇、飛利浦中國CTO王熙、曠視科技首席科學家孫劍、中科院分子影像重點實驗室主任田捷、國際頂級醫學影像分析大會MICCAI 2019聯合主席沈定剛等重磅嘉賓紛紛發表精彩演講。

嘉賓演講後是備受期待的圓桌討論環節,五位來自計算機視覺不同細分領域的重磅嘉賓:

匯醫慧影創始人兼CEO柴象飛(醫療)

圖普科技創始人兼CEO李明強(零售與圖像審核)

睿視智覺CEO龔純斌(工業)

中國科學院計算所副研究員趙地(醫療)

中科院深圳先進技術研究院副研究員王魯佳(駕駛)

在大數金融CTO兼首席科學家、IEEE Fellow王強的穿針引線下,圍繞技術、產品、資本、競爭等話題展開跨界思想交鋒。

以下是圓桌討論的全部精彩內容,雷鋒網做了不改變原意的整理與編輯:

王強:首先我想問下,各位用1-2分鐘介紹自己在各自領域中遇到了哪些技術或非技術層面的瓶頸。

匯醫慧影CEO柴象飛:影像領域最大的技術難點在於:一、數據量不夠;二、數據不全。這意味著我們要在小數據底下建模。剛才沈老師(沈定剛)提到,有3000例數據就很震驚了,有的疾病只有幾百例數據。這給我們提出了巨大挑戰。

另外還有數據質量問題。醫療影像AI中有一個很關鍵的環節——標註,工程人員都不懂。這裡邊如何做質控,把流程標準化、統一化,也是一個很重要的問題。

中科院趙地:我覺得還有計算力的問題。剛才我在報告里也提到,要做三維、四維甚至五維影像處理,參數量隨著維數直線上升。以三維病理影像為例,一個GPU內存只有12G,連一張病理影像都放不下。我們有很多好的想法和設計,但現有的計算能力和硬體設備無法支撐,這是影像行業面臨的一個非常現實的問題。

匯醫慧影CEO柴象飛:我補充一句。醫學影像方面,我們用過英特爾的產品,英特爾共享內存的方式對三維神經網路還是比較有用的,它突破了顯存的限制,可以達到256G內存。它在二維領域優勢可能不明顯,但在三維領域還是有所突破的。

圖普科技CEO李明強:我們耕耘的是互聯網和新零售行業。我覺得這個行業最大的挑戰在於沒有標準答案。醫療領域,一個人有沒有病是有標準的。互聯網內容審核領域也有一些標準,但標準在不斷變化,我們需要不斷用新技術解決人的複雜行為和低俗的識別問題,這是非常困難的。有時候我們會感到茫然,客戶提出一個問題,需求很明確,但我們發現這不是某一個現成技術可以解決的。

我們在新零售領域走的路前人沒有走過。如何用計算機視覺分析門店中的視頻從而獲取數據?可以獲取哪些數據?客戶需要什麼樣的數據?這些數據對他有怎樣的價值?

除了技術的邊界,還有產品和成本的邊界。假如不計成本地做一件事,也許可以做到;但現實中我們不僅要考慮成本還要考慮穩定性。我覺得很多難點都源於這種平衡。

中科院王魯佳:從自主駕駛的落地來看,主要瓶頸在於計算機視覺對計算力的要求。系統的穩定性和功耗等問題,在實驗室做研究的人是體會不到的。如果讓自主物流車或園區車連續在真實場景運行,尤其是在深圳這種天氣炎熱的地方,功耗就會成為一大挑戰,而功耗又會帶來穩定性、散熱等實際問題。

睿視智覺CEO龔純斌:我們遇到的挑戰是技術落地後的產品化。我們不可能把每一個項目做成保姆式服務,所以我們一直在探索產品的交付問題。

我們也在縮小應用範圍,先在某個動態體系內形成智能大腦部署後,再將演算法、算力標準化。下一步我們計劃把IP做到英特爾的S10上,形成超強算力部署。未來AI一定是中心和邊緣同步部署,在小環境內形成產品化部署後,比較容易帶來好的商務回報。

主持人王強:那麼我再把技術上的瓶頸再往深挖一下。大家都知道,計算機視覺領域,分類器的設計特別麻煩。清晰圖像和不清晰圖像的分類器設計不同,哪位嘉賓有興趣談談圖像上的多層次分類器設計?這個分類器不僅要能定位到人,還要能分割出臉、眼睛、睫毛等細節。

睿視智覺CEO龔純斌:睿視的核心演算法是圖片測量理解,我們先提取圖片中的標籤,再進行理解。但在工業應用中,它不是標準模型,不一定非得設計到1000層。比如,去年我們解決一個工業問題,發現到7層的時候就已經夠用了。產品落地的時候不一定要追求深層次,而是看怎麼實用。當然,在學術領域,各位專家可以做更深層次的研究。

主持人王強:龔總很實際,你的分類器不一定要做得多深,而是更追求實用性。下面我想請王博士談談,為什麼設計分類器時神經網路層次更多的演算法更好。

中科院王魯佳:我認為未來分類器的應用主要在決策層。我們現在做的是園區內的產品,對障礙物的分類還不太細,基本是從動態物體和靜態物體的角度來分類,從實用角度出發。我認為後續可以從決策者——比如駕駛員的角度來分,看他更關注哪一類東西。

中科院趙地:在醫學影像領域我經常遇到一個問題,大家會問什麼樣的模型是最好的。在我看來,一個模型好不好,不是看層數有多少,也不是看網路有多複雜,而是看它的結構是否和這個領域的專業知識結合得最好。所以,並沒有唯一的答案。

沈老師(沈定剛)剛剛的報告中提到很多多通道模型。以肺結節識別模型的設計為例,設計模型前我們會先看一下片子,有一個整體印象。如果數據量足夠大,且有足夠強的算力,使用深層次模型肯定能表達更豐富的信息。但它終歸是有極限的,所以醫生和軟體設計者還要考慮其他因素,包括結節的外形等。我們需要使用其他通道,結合前處理演算法,去識別相應的結構特徵。

總而言之,能體現專業知識的模型才是最好的。

匯醫慧影CEO柴象飛:趙老師說得對。醫學影像領域受限於數據量,不可能迅速把網路層級做得很深。通常只有幾十層,最多可能只有150層。多維度聯合模型也不是特別合適,比較可行的做法是,獨立選擇多個不同尺度的分類器並行執行,最後再做總的決策。這種做法也有弊端,就是幾個模型需要跑了一遍又一遍,不過也可以解決。另外一種做法是,在全連接層的最後一層把額外信息加進來做整體判斷,不光是圖像信息。

圖普科技CEO李明強:分類問題是內容審核領域的基礎。裡面有很多玄學般的東西,但總的來說,數據量肯定是越大越好,特別是有價值、有難度、能擴充品類的數據。所以我們會找到那些有難度的數據,同樣是1億張(圖片),這1億張跟另外1億張肯定是不同的。

再一個,你還要分析模型的作用。分類有很多方法,你做出一個模型後,要看看它是否有價值。如果模型有效,說明它觀察到了有價值的部分,雖然我們不知道它是怎麼觀察到的。然後我們可以用它進行其他方向的嘗試,雖然固定的方法不一定好,但我們可以通過這種方法嘗試。

主持人王強:希望通過幾位大咖的介紹,大家能對分類器和神經網路層次的選擇有所了解。面對不同問題需要選擇不同的演算法。有些神經網路演算法對搜索層次要求很深,比如下圍棋,它是在優先規則內進行多層次搜索、聚焦,找到分類的層次,因此需要多層次,甚至需要高達150層。但對醫學影像來說,癌細胞跟普通細胞形態不同,很好判別,沒必要再把癌細胞分離成不同類型的癌細胞。這個領域的問題在於醫生無法準確測量腫瘤的大小,但AI可以。將AI測量出的腫瘤直徑和醫生的臨床診斷結合,就可以判斷病人的病情屬於中期還是晚期。當年我離開沃森時,它已經能夠正確判斷癌症是否屬於晚期了。

十幾年前在CMU讀博期間,我導師(圖靈獎得主羅傑·瑞迪)告訴我,當你發現改變一件事情很難時,不要嘗試一下改變所有,只要改變一點就好了。所以我想請教各位,你們在研發過程中遇到問題時,試圖去改變一點和去做大量改變,分別意味著什麼?

睿視智覺CEO龔純斌:我覺得可以從兩個維度來看:一是技術維度,二是產品維度。從技術維度來說,產品應用是結合實際應用場景通過多個技術模塊來共同運行的,每一個模塊進行優化後,才能形成產品競爭力的極大突破。從產品維度來說,站在實際應用的角度,都是從項目走向產品。尤其是在我們集中部署的工業製造領域,需求都是業務倒灌,都是產線的實際需求,一個點一個點的凸顯,一個點一個點的去落地。當需求達到一定數量、覆蓋面達到一定範圍的時候,一個適用於企業的演算法平台就成形了,產品也就出來了。這個由點及面、從項目到產品的過程肯定是艱難的,但是我們也不能盲目的去加速、去大幅改變,因為事務的發展本身需要一定的周期,而且AI的真正落地最終也一定是數據、演算法、算力的合力提升,而不是單點的改變,這都是我們要遵循的規則。

主持人王強:龔總不愧是一個企業家,跟我們思考的方式不同。下面我想請教各位,你們在To B領域,畏懼BAT這些巨頭嗎?

匯醫慧影CEO柴象飛:我們並不畏懼。百度搞過醫療,但他們去年已經撤銷了醫療事業部。百度也搞過醫療影像,成立了一個小團隊,現在他們的首席科學家已經回美國去了。阿里健康也搞過一段時間,後來也轉型了。現在唯一還在布局的是騰訊覓影,我不知道它還能做多久。但不管怎樣,它和我們的角度是不一樣的,它有更大的戰略和更多元化的需求。

對於初創公司來說,最重要的是深入臨床問題,而醫療臨床恰恰是非常分散的,不是靠資金或某些技術就能通吃的。它需要在場景中持續打磨,不斷迭代,這樣一件事情非常適合能深入行業的創業公司來做。因為它對速度、人才等方面的要求和BAT是不一致的。所以具體到醫療這個細分行業,我們並不畏懼BAT。它們入局這個行業也很好,大家可以一同推進行業發展,並不會立刻對我們造成巨大競爭。

主持人王強:但是BAT有錢。

匯醫慧影CEO柴象飛:它們雖然有錢,但人才稀缺,不是花錢就能迅速彌補的。另外,病種非常豐富,也不是它們能迅速覆蓋的。除此之外,也要看它們在醫療業務上願意投入多少,這是本質。

中科院趙地:具體到醫療領域,我同意柴總的觀點。中國市場的需求實在太大了,可研究的課題實在太多,我不認為任何一家企業有能力把所有課題都做完。甚至所有互聯網企業聯合起來也未必能做完。包括醫療的很多特殊領域還需要大量基礎研究,這不是互聯網公司願意花大精力去做的。總而言之,大家要各司其職,各有所長。

圖普科技CEO李明強:我想把「害怕」這個詞換成「重視」,因為害怕也沒用,我們已經跳進了這個行業。我覺得我們應該像毛主席說的那樣,在戰術上重視,在戰略上藐視它們。

我之前在騰訊待過很多年,2005年加入騰訊,2013年底才離開。我離開騰訊時已經是T4級專家,當時騰訊總共只有幾十位T4級專家。

我害不害怕這些巨頭?我當然知道一個有資源團隊以創業公司的方式做起事情來很可怕。但如果金錢可以等價轉化成任何東西——激情、時間、效率,那世上就不會有創業公司了。

中科院王魯佳:從學術界的角度來看,從這一點來說,企業確實錢多,資源整合能力更強,但學校也有它的優勢,更加自由。

這跟市場環境也有關,現在有一些行業出現了「過熱」,受到資本和社會的過度關注。這促使一些學術專家和技術大牛決定去嘗試更多的領域。但就像前面幾位嘉賓說的,每個行業都有它的特點。工業界偏實用和產品化,學術界研究的是更「遙遠」的東西,二者還是有差別的。我認為隨著熱度退去,大家最終都會回歸。

創業公司和BAT也是一樣,各有特點。大企業的優勢在於資源豐富、整合能力強,但因為「大」,轉型能力較差;發現新的挑戰點後,深入做下去的靈活度小一些。這方面創業公司比較有優勢。另外,創業公司也可以提供一些錢以外的東西。

睿視智覺CEO龔純斌:我覺得可以從兩方面來看:一是壁壘,二是生態。

我一直認為,技術壁壘不是壁壘,只有形成了產品和對應的商務市場,才是真正的壁壘。我不太贊成「賦能百業」的說法,你能把一業做好,肯定就能在BAT之外有一席之地。

再來說生態。BAT有自己的生態系統,睿視也是亞馬遜、英特爾、華為在AI圖像解析領域的技術合作夥伴。華為去年提出「5朵雲計劃」,也就是說未來只有谷歌、微軟、亞馬遜、阿里、華為這5朵雲。

我認為,只要存在生態,就有我們的立足之地。我不認為BAT對我們是完全碾壓,相反,我們有很多互利共贏的地方。他們需要我們提供服務體系,我們也能把英特爾的板卡和實際產品結合。我們可以從生態中找到利益點。

另外,我們也不要把BAT看成一個整體,我們只是在跟其中一個團隊作戰。我可以集中睿視所有的資源做同一件事,但BAT可能只有一個20-50人的小團隊,我們面對的就只是這個小團隊。

總的來說,從壁壘和生態這兩個維度來說,我們是可以跟BAT共存的。

主持人王強:沒錯,小公司是能夠與大象共舞的。最後我們再談談融資的問題,我想請三位企業家談談,你們未來融了資想做什麼?現在好融資嗎?

匯醫慧影CEO柴象飛:我感覺今年在收緊,融資越來越難了。我的投資人朋友告訴我,下半年還會持續收緊。這個信號已經很明確了,大家無論從匯率變化還是民間借貸都可以感覺到,全球的銀根都在收緊。

融了錢想做什麼呢?我覺得還是應該用在落地和商業化方面。資金越緊張,越是考驗產品化和自我造血能力。對於AI企業——無論頭部玩家還是其他企業,商業化都是一個重要問題。

主持人王強:如果能融到錢,你還想融嗎?融到了錢準備幹什麼?

匯醫慧影CEO柴象飛:我前面提到,醫療產品面臨的不單是技術問題。我們目前在申請國內的CFDA認證、歐洲的CE認證,以及美國的FDA認證,這一塊是非常大的花銷。另外是病種的擴充,任何一家公司擴充任何一個病種,它的邏輯、執行和合作單位都是比較獨立的。擴充病種一方面要自己研究,一方面要對外合作,都挺花錢的。

中科院趙地:我來自科研單位和學校,就不談融資的問題了,我談談拿項目。不管融資還是拿項目,都是拿投資方的錢,我們的投資方是科委、自然基金。

主持人王強:有沒有橫向拿企業的錢?

中科院趙地:也有一些,但不多。科研單位和學校有它的評價體系,錢不是白拿的,拿了錢要做事,有考核指標,要完成項目。在我看來,項目也不是越多越好,因為你的工作和業務能力不一定能完全滿足投資方的需求。而且,工作以外也要抽出時間來生活。我覺得如果能在自己熟悉的領域做深、做好,經費或投資都不會是大問題。

圖普科技CEO李明強:我們目前也正在準備下一輪融資,主要會用於研發和人才引入。很多業內的創業者會說融資不像之前那麼容易了,其實,融資並不是變難了,而是人工智慧技術現在不是一個只講概念的時期,投資人更在意的是能否應用、能否落地,所以投資人會更謹慎一些。如果你想套投資人,可能會越來越難。如果你想把青菜賣出水果的價錢,甚至把爛菜葉包裝成新鮮大白菜賣,肯定越來越困難,因為大家對AI已經看得越來越明白了。這對於行業而言是好事,用心鑽研的好項目會更容易獲得青睞。總體上來說,我們已經實現盈利,目前的經營狀況和收入狀況都挺不錯,還是持樂觀態度的

中科院王魯佳:我們合作了一個科大出來的團隊,他們最近剛剛完成融資,所以我也分享一點看法。

我感覺現在經濟形勢確實不太好,會影響到投資。另外,AI領域已經火了好幾年,已經過了拿一個ppt就能融到錢的階段。不過,投資人越謹慎,好的項目反而更容易出來。所以融資對我們合作的團隊來說不算難。

睿視智覺CEO龔純斌:我們上半年也有一些融資。我認為,貼近應用,把營收做起來,對創業公司特別重要。

我們拿了錢想做什麼呢?目前的想法是項目產品化以及加速FPGA研發。我們早期沒有投入硬體,用的是亞馬遜的F1,能省則省。上半年的融資就是為了擴大對下半年產品化和技術化的支撐。

王強:今天的討論到此結束,非常感謝5位嘉賓。

附:圓桌嘉賓介紹

大數金融CTO兼首席科學家,PAMI和TIP編委,IEEE Fellow:王強

王強,大數金融CTO兼首席科學家。1998年-2009年,王強任IBM GBS美國設計合作部門總裁、IBM Thomas. J Waston研究院主任研究員。回國後,先後出任建設銀行信息技術部門核心與智能交易系統首席專家兼西安銀博副總經理(建行全資子公司)、美國Fiserv公司東亞及東南亞董事總經理兼總裁、TCS中國高級副總裁兼首席研究員。

學術研究層面,王強自2009年起任UC Berkeley 機器人與工程實驗室講座教授,在國際Top期刊發表90餘篇論文,同時是4屆CVPR論文評委和兩大國際頂刊PAMI、TIP的編委。2006年獲卡內基梅隆大學機器人博士學位,師從圖靈獎得主羅傑·瑞迪教授。

王強於2017年當選IEEE Fellow。

匯醫慧影創始人兼CEO:柴象飛

斯坦福大學博士後、荷蘭阿姆斯特丹大學醫學物理學博士。師從美國科學院院士候選人邢磊、世界頂級圖像引導科學家Marcel van Herk、CT重組演算法奠基人之一Paul Suetens,曾於美國斯坦福大學癌症中心、荷蘭癌症研究所和比利時魯汶大學放射科等世界頂尖的醫學影像機構工作學習。在人工智慧、圖像處理以及數據分析領域擁有超過10年的跨學科科研和工程經驗,掌握影像的分割、識別、分析以及深度學習的核心技術。

圖普科技創始人兼CEO:李明強

人工智慧產品專家。原騰訊廣研張小龍團隊核心成員、騰訊T4技術專家,QQ郵箱技術負責人,微信創始團隊成員之一。

2014年初創辦圖普科技,為企業提供圖像識別雲服務,涵蓋了圖像審核、商業智能、安防監控、增強現實等多個領域,現日均處理圖像數據近10億次,是互聯網最大的圖像識別雲服務平台。李明強帶領團隊運用先進的人工智慧和計算機視覺技術,賦能線上線下,讓圖普科技成為國內人工智慧領域最具影響力的創業公司之一。

睿視智覺CEO:龔純斌

龔純斌曾任職聯想集團和美圖秀秀,多年大型自研項目全程開發管理工作經歷,具有極強的技術產品化能力和豐富的團隊管理經驗。2014年進入計算機視覺領域,憑藉對技術、資源、市場的敏銳判斷完成了初步資源儲備和全球化事業培養。2015年創辦睿視智覺,2017年個人被評為「深圳羅湖菁英人才」。現已帶領團隊進入AWS、英特爾、華為人工智慧生態合作體系,並與國內外多家製造業巨頭達成深度戰略合作。

中國科學院計算所副研究員:趙地

美國路易斯安娜理工大學計算機與應用數學專業博士。趙地曾在美國哥倫比亞大學醫學中心和美國俄亥俄州立大學醫學中心從事博士後研究工作。主持北京市自然科學基金重點項目一項,參與國家重點研發計劃一項和北京市科委「腦科學研究」專項二項。

趙博士在「深度學習與醫學影像分析」方面具有深厚的研究經驗,發表多篇學術雜誌論文與學術會議論文,並擔任國際雜誌《Annals of Multicore and GPU Programming》編委。

中國科學院深圳先進技術研究院副研究員:王魯佳

香港中文大學機器人方向博士,新加坡南洋理工大學博士後、瑞士蘇黎世聯邦理工大學(ETHZ) 訪問學者。深圳市孔雀人才計劃。主持多項國家自然基金、科技部、廣東省及深圳市基礎研究學科布局項目。四次獲得IEEE 國際會議最佳論文獎及提名獎次獲最佳論文提名獎。主要研究方向為多感知融合的自主系統、大數據驅動的智能、多機器人協作以及雲機器人等。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

144家AI公司參展!看此次CES Asia有哪些有意思的AI產品
DOSS再開先河,發布全球首款語音互動式超級藍牙音箱

TAG:雷鋒網 |