當前位置:
首頁 > 最新 > 深度:一篇文章即可了解何為人工智慧及其發展現狀

深度:一篇文章即可了解何為人工智慧及其發展現狀

[文/逗不逗 山哥看財經原創文章,轉載請註明出處]

我們總會對陌生的事物產生抵觸心理。

其實也不無道理,比如菜鳥網路在天津的倉庫利用計算機視覺技術,代替了原來250名倉庫管理人員。峰會論壇利用機器翻譯代替了人工同傳、速記等崗位。

所以有不少人擔心未來自己會不會丟飯碗,不過人們過分擔憂,我們會受到國外科幻電影的影響,認為機器人無所不能,甚至他們一定會毀滅人類。其實在現實中,能做到像電影中的高科技還是有一定很長的路要走,另外,有恐懼說明我們對人工智慧還不完全了解。

筆者將圍繞計算機視覺和語音語意理解方面簡要介紹當前的技術發展狀況和可能遇到的問題。

何為人工智慧?

在一個酒吧里,男孩發現不遠處有一個美女,於是他準備上前搭訕,很幸運他加上了女孩的微信,成為好友後他們不斷的聊天、約會,他們談起了戀愛。這個過程,一個男孩被女孩吸引,他首先感受到了女孩的美,於是大腦產生思考的過程,再做出搭訕的行為,執行了大腦的反應,對於機器來說也是類似的,機器在訓練後,也可以做到,簡單總結一下這個循環便是便是「感知-認知-決策-執行-學習-感知」這樣一個閉環。讓機器依據這個閉環並且做一切符合社會核心價值觀的行為,這樣的機器或者系統就叫人工智慧。

所以這樣看,人工智慧是一個很大的概念,這包含多種領域:計算機視覺、自然語言理解與交流、認知和推理、機器人學、博弈與理論、機器學習。

因為我們人在認知這個世界靠的最主要的還是眼睛,所以今天說計算機視覺會多一些。

計算機視覺能做什麼?對我們有什麼影響?

就目前來看它已經滲透到我們生活的方方面面,常見的比如公司日常刷臉打卡、手機刷臉解鎖、支付。如果說2015年的時候我採訪的公司還在談概念,但在今年,可以看到有很多項目有具體落地。

說到計算機視覺,我們現在日常能看到的應用比如膚質檢測、手勢識別、證件識別、銀行卡識別、文字識別、人臉對比、情緒識別、顏值評分,大一點方面在公共應用上比如監控旅遊景點人數、監測交通擁堵情況等等,所以計算機視覺可以滲透到安防、生活娛樂、金融、農業、教育等多種行業。

以上的例子比較寬泛,以具體的零售為例,看看計算機視覺技術如何賦能零售。

以前我們逛街進到實體店,絕大部分的營業員不了解潛在顧客的喜好,只能強推。現在,消費者經過商店,商店門口如果擺放攝相機,通過機器捕獲人臉,店員第一時間知道你是不是商場VIP會員,判斷你的性別和年紀,通過機器學習若干與你相似年齡女孩的喜好數據,會分析推斷你可能會喜歡產品。如果你看到屏幕的時候,機器會從頭到腳自動推薦該店適合你的商品。目前,科學家正在研究如何讓機器讀懂人的情緒,希望顧客進門後服務員通過人臉識別,或者表情識別可以知道你對哪件商品滿意,讓店員提供細緻入微的服務。反過來對於商家,通過攝像頭匯總消費者大數據比如性別,年輕分布,流動性、停留時間、消費者看了什麼樣的商品,通過大數據的分析告訴他們這個店的物品怎麼樣擺放最優的,商品如何擺放銷售量最高,讓商家更好做決策。但是也有保守者認為這種做法多此一舉,或者擔心自己泄露了隱私。

說白了,大數據起到了巨大作用。在線上我們國內有引以為豪的阿里、京東、小米這樣的公司,但在線下目前來看7-11便利店利用大數據是做的最好的。他們如何搜集數據呢?原來,每個用戶在完成購物後,電腦上有專門的按鍵提供給店員,讓其來選擇消費者的性別和年齡等信息,7-11會有專門的數據分析人員,用數據去輔助運營做商品或者店鋪的優化。

其它領域,比如汽車,研究人員現在也在試圖讓汽車了解自己的駕駛員,比如他們喜愛的音樂、習慣的座椅角度等等。

存在的問題

不過,技術雖然發展特別快但是對於商業落地需要磨合調試的,目前還有一些值得探討的邊界問題,比如演算法是否具有可行性,因為機器接受人的指令目前還沒有推理的能力,所以機器參與的工作仍需要人去做決策,另外作為人工智慧至關重要的就是數據量,小型創業公司可能雖然有技術,但是可能遇到缺少數據的問題影響產品的準確性。還有就是行業的邊界,比如在醫療領域,計算機視覺是否真的是有助於醫生在影像分析上有絕對的幫助,因為對於醫院來說最本質的需求是影響分析的準確性,要減少或避免誤診,而不是快速每天完成成百上千的病人的影像分析。另外在滲透到各行業中時,也要考慮到場景問題,是一鎚子買賣還是可以復用?行業門檻有多高?落實後技術的可持續有多久?這都是值得討論的。

騰訊翻譯君在博鰲出糗是技術不行嗎?

再來說說自然語言理解和語意,在剛剛過去的兩會,科大訊飛劉慶峰在部長通道向媒體展示了他們的翻譯機產品,同樣在博鰲亞洲論壇,騰訊也很有勇氣的展示他們的同傳翻譯君,但尷尬的是把「one belt one road」(一帶一路)翻譯成「一個腰帶和一條路」。搜狗在兩會後也發布自己的翻譯硬體產品,對於語音類研究很早以前就有,只不過在兩千年初技術停滯了有長達十年,現在的翻譯技術有巨大突破歸根到底是得益於深度學習,機器能能抓取句子的意思了,深度學習技術大大促進了翻譯功能的進步。

為什麼說騰訊有勇氣,主要是看自然語言理解領域什麼最難,這肯定是「語意理解」,他們敢放在公開場合使用,其實對於技術團隊來說是一次很大的檢驗。語意理解背後需要很多知識,包括嘗試和具體的物理世界的知識,數字知識等等才能讓語言變的更豐富有足夠的意義,要想突破這個技術需要對知識和其他常識聯繫起來做理解分析,其背後邏輯關係也很強,所以這不僅僅是國內的互聯網公司遇到的技術問題,國外的研究院也在做提升準確性的努力。無論任何人工智慧的產品,數據是最關鍵的要素,相比較多家產品,購物決策可以看背後的公司,一家公司如果有大量數據積累,比如他是做搜索、做翻譯等,再做翻譯產品準確度會有優勢。不過這裡還有一點要注意,各家的用語測試的資料庫大小還都不一樣,筆者期待著翻譯類產品能直接用手機就行了,不用單獨買一款硬體,不過目前對於手機來說,收聲是最關鍵的,對聲音質量有要求,還要考慮對話者所處環境,是否有雜音等,有公司試圖做一款插入手機的小硬體,但後來考慮市場空間等因素後來放棄了。

語音在產業的融合也有很多領域可以看到,比如人機對話服務機器人,前不久獵豹移動發布了若干機器人,有適合辦公的也有適用於家庭的,還有小米的智能音響,雖然現在看這些產品並不是剛需,也許是為了搶佔入口。對於服務型企業來說客服是一個非常重要的環節,無論售前售後,曾經與新零售公司的人討論過如何讓機器更了解潛在用戶,這個問題目前有的公司做售前機器人,他們想通過售前與用戶的對話來不斷了解用戶需求,從而推薦產品並配合今後的營銷工作,但用戶有沒有耐心與機器人交流,在售後上用戶往往是帶有情緒的如果售後客服機器人機械式的處理會加深用戶的不滿,所以現在各大企業紛紛建立AI實驗室,有一部分任務就是讓機器人更好的理解人,從語氣、視覺觀測到到人的情緒。

以上是筆者近一個月參與行業活動、與行業專家交流所得出的感悟,感興趣本領域的讀者,歡迎與筆者探討,可在微信後台留言。(逗不逗為資深科技記者,目前關注人工智慧領域)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 山哥看財經 的精彩文章:

美國決定一顆晶元也不給中興 中國高端製造業能突破重圍嗎?

TAG:山哥看財經 |