Gartner：亞馬遜、谷歌、IBM以及微軟的「雲」人工智慧服務

最新 05-24

當前，國際上一些典型企業推出基於雲的人工智慧服務，包括機器學習、語言處理和計算機視覺。在過去的兩年里，人工智慧基於雲的拓展應用，提高了其服務的廣度和深度，這一趨勢預計還會持續下去。許多企業在決定是在現場部署生產解決方案，還是在雲中部署產品解決方案，都要使用雲AI組合來進行項目的試驗和原型的開發。主要供應商在機器學習、語言處理、計算機視覺等領域及其支持工具等方面，都存在著功能和重點的顯著差異。

對於企業用戶來說，一是通過使用完全相同的數據集對不同的AI組合功能進行實驗，然後選擇一個滿足自身需求的雲策略，從而提高成功實現雲AI策略的機會。通過選擇能夠嵌入數據科學、開發人員和基礎設施專業知識的AI雲服務，最大限度地利用組織的專業知識。本文重點介紹四家領先供應商：亞馬遜(Amazon)、谷歌(Google)、IBM和microsoft提供的機器學習、語言處理或計算機視覺「雲」人工智慧服務。

一、三類應用分析

1.機器學習

機器學習是CSP（雲服務提供商）提供的人工智慧組合服務的核心。這些服務能夠幫助開發人員、數據從業人員和架構師們生成自己的模型，評估這些模型、訓練自己的數據，實現最常見的機器分析類型。這些類型包括分類、聚類和回歸。在機器學習中，有一些服務構建得非常簡單。當然，簡化解決方案可能意味著靈活性或功能限制較小。

雲AI服務中的機器學習系統是通用的，這與計算機視覺和語言處理服務是不同的。計算機視覺服務是預先培訓的，具有特定功能的API，用於提取情感或在識別目錄中添加人臉。相比之下，機器學習服務可以用於任何分析。自AI CSP的機器學習打包方案統一了端到端的工作流，通過對項目所有階段的集成訪問，來擴展獨立機器學習的引擎功能。但是，需要注意的是，這些機器學習的雲服務只是在雲中運行的一種方式。雖然CSP可以提供帶有統一API的打包機器學習服務，但在該提供商的雲中運行機器學習系統也可能有無數的選項和體系結構。有兩種開發雲機器學習的思路：一種關注方便適用，另一種需要結合強大的數據工具。然而這些方法都需要提供一個完整的機器學習環境，一個專用的介面主要用來服務準備數據、開發演算法、培訓和部署。

影響機器學習雲服務的關鍵要素包括：機器學習具體演算法、實時處理能力、數據準備、數據可視化、任務特徵、實例類型、演算法市場、訓練集生成、電腦硬體等。

2. 語言處理

語言處理類別包含用於文本和音頻分析的人類語言的雲服務和API。在大多數情況下，這些服務為幾種語言提供支持。例如，在與計算機視覺類別關聯的服務中，語言處理服務及其機器學習模型被分割成不同域，每個服務解決語言處理問題的一個或多個方面。該服務從數字錄音中分析和提取語音，而其他服務則支持開發會話介面、多種語言之間的翻譯或大文本之topeech處理。這些服務可以單獨用於解決一個直觀具體的問題，例如將文本字元串轉換為一個數字音頻文件，用於文本到語音的使用。或者，這些服務可以協同使用來構建豐富的會話人機界面。在這些服務中，會話平台主導了客戶的興趣。

自然語言處理(NlP)服務提供的會話介面需要大量數據，需要憑藉數據來完成會話任務。因而，在設計會話平台時，請將自然語言系統完全視為介面。以旅行社部署聊天機器人幫助客戶預訂旅行為例。聊天機器人並不取代後端預訂系統、客戶資料庫或與外部旅行系統的集成。聊天機器人只是介面-它將網頁或移動應用程序替換為客戶定義其事務和與其事務相關的數據的介面。這種區別很重要，因為它定義並闡明了聊天機器人與現有數據和服務的關係。一些AI CSPs提供額外的語言服務，包括翻譯、語音到文本(STT)、文本到語音(TTS)和說話人識別等。

影響語言處理服務的關鍵包括：每個機器人的最大意向數、每個意向的最強話語、最大實體數、預定義實體、條目驗證、情感分析、上下文管理、缺失話語管理、意圖和實體的介面、語言支持（英語、法語、中文等）。

影響會話體驗的關鍵因素包括：支持意圖的數目、維護上下文的能力、捕捉失聯缺失意圖的能力、對有條件對話的支持程度。

3. 計算機視覺

計算機視覺服務提供的API允許將數字圖像或數字視頻傳遞給經過預先訓練的機器學習演算法進行分析。不同的目的構建的服務可能凸顯在不同的分析對象上，比如一種計算機視覺演算法可以被訓練用於光學字元識別(OCR)以從數字圖像中提取文本，再比如用於圖像中的人臉檢測的訓練的演算法，此演算法可以分析被檢測人的情感。當然，在此種演算法支撐之下，也可以執行檢測圖像中的人臉，並對其進行分類以供識別。此外，還有是在成千上萬個預先訓練的對象目錄中執行廣義對象識別或場景檢測。

AI CSP提供廣泛的計算機視覺服務，在解決方案組合中包括以下功能：標籤提取、面部識別、面孔識別、自定義分類器、人臉匹配、面部情感、光學字元識別、手寫識別、相似圖像搜索、圖像屬性、圖像描述、標誌檢測、內容調節、名人識別、地標檢測、自動種植等。AI CSP提供額外的視覺服務，包括光學字元閱讀器(OCR)、識別潛在不合適的內容或令人反感的圖像、名人識別以及地標和標識檢測等。

4. 其它應用

除了計算機視覺、語言處理和機器學習這三大類之外，AI CSP包括與AI應用程序相關的安全服務；特定領域的應用程序任務；以及端到端的知識探索、搜索和發現服務；雲中基於機器學習的應用程序的某些體系結構模式；包括由單個軟體組件構建並使用機器學習引擎的應用程序，如apache mxnet或caff.這些其他方法當然是完全有效的，對於需要深入數據科學的複雜解決方案，它是首選的方法。但是，以上不是本文討論的重點。

二、主要企業

雖然人工智慧服務是作為多個提供商的獨立解決方案單獨提供的，但企業通常更願意為其所有的AI項目與單一的人工智慧提供商合作。隨著企業對技術和自身目標的熟悉，他們可能會選擇遷移到不同的、獨立的提供者，從而更好地滿足特定的需求。

1. 亞馬遜

Amazon的AI平台提供一系列成熟且易於使用的機器學習功能，作為一個完全託管的服務。如下圖所示，亞馬遜提供的服務分為三層。這些解決方案允許具有不同經驗的開發人員和數據科學家使用人工智慧服務。服務包括託管的、經過預先培訓的即插即用API以及用於自定義高級項目的工具性應用。

2. 谷歌

谷歌雲的人工智慧服務基於谷歌雲平台(GCP)，該平台由一組物理硬體和虛擬計算資源組成。谷歌雲的功能得到了其開源計劃的補充支持，包括用於預測建模的kaggle平台和Kubernetes平台。google的AI產品如下圖所示。除參考指南外，許多google API還包括快速啟動和如何指導指南、示例和教程。

3. IBM

IBM在其雲品牌下提供了範圍廣泛的AI服務，如下圖所示，中間是Watson studio，它提供了一種直觀的用戶體驗，可以訪問機器和下面的深入學習計算基礎設施和智能目錄；上面是針對LOB和眾多行業垂直的預先構建的AI解決方案。解決方案的一個核心要素是Watson Studio提供管理和部署預測模型的集成工具和服務。

4. 微軟

微軟產品設置在蔚藍雲中，分為三部分：人工智慧服務、人工智慧基礎設施和人工智慧工具。在人工智慧服務領域，培訓服務為開發人員提供了一個起點，可以在不需要廣泛的人工智慧背景的情況下開發和培訓模型。培訓服務分為以下幾類：視覺、語音和語言、知識和搜索。

三、幾點討論

一是所有機器學習服務都試圖統一機器學習項目和實現系統的端到端的工作流。但是，它們在目標受眾和創建成功項目所需的專門知識方面有所不同。對於很少或根本沒有數據科學專業知識的技術專業團隊，自動化演算法選擇和培訓集創建等功能將減輕項目的一些複雜性，並利用現有的AI CSP實現分類、聚類、回歸和異常檢測。然而，由於統計建模的不透明性和實例的局限性。技術人員會發現這些服務最適合於不需要定製演算法開發或硬體加速的通用分析問題。

二是每個供應商的語言處理目錄包括一個會話平台及自然語言交付介面應用程序。最先進的NLP要求架構師和開發人員明確定義意圖，以及每個意圖的示例語句和實體。然而，面對不同供應商的產品值得對聊天介面的目標和平台的功能進行深入地比較。請記住，非常簡單的介面通常會產生非常簡單的結果。所以，雖然易於使用的平台可能很有吸引力，但是處理不了複雜案例。

三是針對廣義圖像分析中標籤提取的不確定性處理方案。令人印象深刻的圖像分析是從進行標籤點的提取，走向未來的開放式數據分析。當前，在圖像中檢測到的對象缺乏確定性，將需要策略來輔助。該解決方案被設計為能夠創建自定義分類器，以增強現有的訓練並聚焦圖像分析。這種增量式訓練是解決確定性不足的首選方法，因為它既能集中分析，又能提高檢測和分類的準確性。當服務不支持增強訓練時，用戶可以嘗試通過消除圖像中分散注意力的對象來縮小分析的差異，從而改善確定性。除此之外，確保圖像清晰、集中且光線充足，可以確保檢測演算法的運行，不必糾纏於圖像中的數據質量問題。

本文由上海市科學學研究所產業創新研究室副研究員孟海華根據Gartner相關報告翻譯撰寫。文章觀點不代表主辦機構立場。

◆◆◆

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 三思派 的精彩文章:

※著力打造長三角創新共同體
※曹聰：中國科技創新的人才挑戰

TAG:三思派 |