2018排名前10的AI開源項目,速來圍觀!
來源/ 優達學城Udacity(ID:youdaxue)
譯/ 李大狗
來源/ datamation.com
目前,人工智慧和機器學習仍在風頭浪尖上。IDC 諮詢去年 9 月做出預測, 2017 年全球在認知和人工智慧解決方案方面的支出約為 120 億刀。這一總額可能會以 50.1% 的複合年增長率(CAGR)增長到 2021 年,屆時市場將高達 576 億刀。
在其 2018 年的報告中,機構預測今年「人工智慧將會重塑分析和商業創新」,同時「人工智慧將會作出決策並且對20%的機構提出實時指導」。然而它也提出了警告——「 2018 年,CIO 們認識到,要在 AI 這樣的新技術上發展,就需要繁重的工作。」
對於許多組織來說,大部分繁重的工作的第一步都是學習機器學習框架和人工智慧框架。根據 Gartner 的報告,59% 的組織還在收集信息以構建他們的人工智慧戰略。
大部分信息收集可能圍繞著開源解決方案。許多領先的人工智慧工具都可以通過開源許可證獲得,許多尖端的研究和開發工作都在這些開源項目上進行。
那麼,我們應該研究哪些開源 AI 解決方案?本文重點介紹 10 種最受歡迎的開源人工智慧和機器學習工具,趕緊收藏起來吧~
1 TensorFlow
由 Google 創建的 TensorFlow 已經成為當今最廣泛使用的機器學習框架之一。該項目的 GitHub 頁面擁有超過 87,700 顆 stars,並且已經 fork 超過 42,700 次。2017 年的 GitHub Octoverse 報告表明,這一開源 AI 工具是最多 fork 的項目之一,在「最多貢獻者榜單」中排名第5,在「最多討論榜單」中排名第 10。它在基於雲的服務中大受歡迎。同時,亞馬遜網路服務、微軟 Azure、和谷歌雲平台均提供與 TensorFlow 協同工作的支持和(或)或服務。 據該項目網站稱,使用它的公司包括 Airbnb、NVIDIA、Uber、SAP、Dropbox、eBay、Google、Intel、可口可樂、twitter 等等。TensorFlow 不愧是機器學習框架界的大佬了~
2 Scikit-Learn
Scikit-Learn 是一個重點在於「數據挖掘與數據分析」的 Python 機器學習工具。基於另外三個開源項目—— NumPy、SciPy 和 matplotlibe 之上,它提供了分類、回歸、聚類、降維、模型選擇和預處理的演算法。其用戶包括 Spotify,Evernote,OKCupid 和 Change.org 等等。起初時,它是谷歌的夏季代碼項目。隨後的開發得到多個組織的資助,其中包括 INRIA,Paris-Saclay 數據科學中心,紐約大學,Télécom Paristech,哥倫比亞大學,Alfred P. Sloan 基金會和悉尼大學。在 Github 上這個項目擁有了多於 25,300 的 stars 和多於 12,900 的 forks。
3 Caffe
Caffe 是 Yangqing Jia 的創意。他創建了這個項目,作為他在在加州大學伯克利分校的博士工作的一部分。伯克利人工智慧研究所(BAIR)正在進行這個項目的開發。項目網站將其描述為「由意識的表現、速度和模塊化構成的深度學習框架」。Caffe 的主要特徵為表現性架構、可擴展代碼、快性能以及一個包括學術和行業用戶的大型社區。在 GitHub 上,該項目在 GitHub 上擁有 22,600 多個 stars 和 13,800 多個 forks。
4 Microsoft Cognitive Toolkit
微軟認知工具包(以前稱為 CNTK )自稱為「免費,易於使用的開源商業級工具包,可以訓練深度學習演算法,以像人類大腦一樣學習。」 這個 AI 解決方案是由微軟內部開發的,在 2016 年以開源許可的形式發布。它的主要特徵為支持 Python/C++/BrainScript 的工具、增強學習、生成對抗網路以及有監督和無監督的學習、有效資源使用、與 NumPy 相互協作以及與 Microsoft Azure 集成。該項目在 GitHub 上擁有 13,700 多個 stars 和 3600 多個 forks。
5 PredictionIO
作為一個 Apache 項目,PredictionIO 是一個開源的機器學習伺服器,它利用了許多其它 Apache 大數據工具,如 Hadhoop、HBase 和 Spark。公司經常使用它來實現 lambda 體系架構,該網站將其作為包括 Apache Spark,MLlib,HBase,Spray 和 Elasticsearch 的完整機器學習技術棧的一部分提供。該項目的目標是幫助數據科學家和開發人員快速創建可作為 Web 服務部署的預測引擎。該項目在 GitHub 上擁有 10,900 多個 stars 和 1,777 多個 forks。
6 Deeplearn.js
正如你可能從名字中猜出的那樣,deeplearn.js 是一個深度學習的 JavaScript 庫(JS 無所不能!)。它允許用戶在瀏覽器中訓練神經網路。像本文中其它的幾個開源 AI 項目一樣,它的起初可追溯到谷歌大腦團隊,並且谷歌在繼續支持這個項目。Deeplearn.js 包含兩個獨立的 API ——與 NumPy 相似的即時執行模型和更像 TensorFlow 的延遲執行模型。該項目在 GitHub 上擁多有 6000 個 stars 和 550 多個 forks。
7 Pattern
Pattern 由安特衛普大學計算語言學和心理語言學(CLiPS)研究中心創建。它提供多種人工智慧方面的功能,包括數據挖掘、自然語言處理、機器學習、網路分析和可視化,並基於 Python 捆綁了超過 50 個示例和超過 350 個單元測試。該項目在 GitHub 上擁多有 6000 個 stars 和 1100 多個 forks。
8 Turi Create
Turi Create 旨在允許非專家創建自己的機器學習模型,而無需編寫大量代碼。其包括用於分類、回歸、圖形分析、聚類、最近鄰、主題模型等方面的演算法,對於創建推薦引擎,圖像分析工具和文本分類引擎非常有用。蘋果公司最近(2017 年 12 月)才在 GitHub 上發布了這個工具,但它已經引起了很多興趣,該項目在 GitHub 上擁多有 5700 個 stars 和 490 多個 forks。
9 Aerosolve
Aerosolve 由 Airbnb 創建,是一種特別擅長處理地理數據的人工智慧工具。它聲名遠揚的原因是它的設計「人性化」。主要特徵為基於節約原則的特徵表現、特徵轉換語言、可調試模型、對 Java 和 Scala 的支持以及包含圖像內容分析代碼。該項目在 GitHub 上擁有 4200 多個 stars 和 550 多個 forks。
10 DSSTNE
DSSTNE(發音像「Destiny」)由亞馬遜創建,代表「Deep Scalable Sparse Tensor Network Engine」(深度可擴展的稀疏張量網路引擎)。這是電商大佬用來創建自己的推薦引擎的 AI 工具,這引起了其他零售商和在線組織的很大興趣。它的開發人員聲場,它對於機器學習培訓數據稀缺的用例特別有用。該項目在 GitHub 上擁有 4000 個 stars 和 660 多個 forks。
好啦,以上就是 2018 年排名前 10 的人工智慧/機器學習框架,快快學起來吧~
關注劉鵬看未來(ID:lpoutlook)
比別人早一步看見未來!


TAG:劉鵬看未來 |