一文了解 2018年最火爆的30個機器學習項目

科技 03-08

關鍵時刻，第一時間送達！

機器學習是當前最為火爆的話題之一，機器學習的開源項目也層出不窮，讓人目不暇接。本文從受歡迎程度方面，對比以及挑選出了去年發布的30個最火的機器學習項目。

下面，讓我們一起來看看，2018年究竟有哪些機器學習的開源項目最受開發者的喜愛吧。

FastText

Github代碼庫：https://github.com/facebookresearch/fastText

Github給星：13,004個（Github平均給星為3,558個）

FastText是由Facebook的AI研究實驗室創建的代碼庫，可以高效地學習詞語表示(word representation)和句子分類，還可以將文本轉化成連續的向量，供各種語言處理相關的任務使用。FastText由C++編寫，但提供了python bindings。

Deep-photo-styletransfer

Github代碼庫：https://github.com/luanfujun/deep-photo-styletransfer

Github給星：10,333個

Deep-photo-styletransfer的創建者是康納爾大學的Fujun Luan。它可以將原始圖像轉換為指定的風格，比如把白天的風景轉換成夜景等，並在現有的圖像風格轉換（photographc style transfer）的基礎上深入一步，生成的圖像非常接近真實的照片。如果想要深入了解詳細信息，可以查看相關的論文：https://arxiv.org/pdf/1703.07511.pdf 。

Face_recognition

Github代碼庫：https://github.com/ageitgey/face_recognition

Github給星：11,554個

Face_recognition號稱是「世界上最簡單的面部識別API」，可以通過Python或命令行調用。該項目基於dlib的面部識別，在LFW數據集(Labeled Faces in the Wild，該數據集包含一萬三千多張來源於互聯網的人臉圖像，並且全部標註了人名。詳見http://vis-www.cs.umass.edu/lfw/)上達到了99.38%的準確率。

Magenta

Github代碼庫：https://github.com/tensorflow/magenta

Github給星：9,030個

Magenta是Google Brain團隊的研究員們發起的一個研究項目，目的是探索利用機器學習生成美術和音樂作品。它的深度學習和強化學習演算法可以生成歌曲、圖像、繪畫和其他作品。

Sonnet

Github代碼庫：https://github.com/deepmind/sonnet

Github給星：6,205個

Sonnet是個基於TensorFlow的庫，可以幫助你建立複雜的神經網路。該項目由Deepmind的Malcolm Reynolds創建。

Deeplearn

Github代碼庫：https://github.com/PAIR-code/deeplearnjs

Github給星：6,589個

deeplearn.js是個開源的JavaScript機器學習框架，支持硬體加速。通過它可以在瀏覽器里直接訓練神經網路模型，或利用訓練好的模型進行預測。它也是由Google Brain PAIR團隊發起的項目。

Fast Style Transfer in TensorFlow

Github代碼庫：https://github.com/lengstrom/fast-style-transfer

Github給星：5,556個

該項目基於TesnorFlow，可以快速地轉換任何圖像的風格。據該項目自己的測試，在2015 Titan X顯卡上將一幅MIT Stata Center的照片(1024x680)轉換成弗朗西斯·畢卡比亞（Francis Picabia）的油畫《Udnie》的風格只需要100毫秒。其速度之快甚至可以逐幀轉換視頻併合成一個可以播放的視頻。該項目由麻省理工大學的Logan Engstrom創建。

Pysc2

Github代碼庫：https://github.com/deepmind/pysc2

Github給星：4,238個

Pysc2的全稱是「星際爭霸2學習環境」（StarCraft II Learning Environment），它把暴雪的「星際爭霸2機器學習API」(https://github.com/Blizzard/s2client-proto)包裝成Python強化學習環境，以便進行深度學習的研究。該項目由DeepMind的Timo Ewalds創建。

AirSim

Github代碼庫：https://github.com/Microsoft/AirSim

Github給星：4,483個

AirSim是微軟AI研究部門創建的模擬器，用於模擬無人機、汽車等駕駛環境。基於Unreal引擎，可以作為插件在任何Unreal環境下運行。它還支持硬體控制，你可以利用手頭的無人機手柄、汽車方向盤等像玩遊戲一樣控制模擬器里的無人機和汽車。作為一個AI研究平台，它也提供了獲取數據和控制無人機和汽車的API，人們可以通過這些API自動生成訓練數據，並在其中實驗各種深度學習、強化學習、計算機視覺等演算法。

Facets

Github代碼庫：https://github.com/PAIR-code/facets

Github給星：3,962個

Facets可以將機器學習數據集可視化，以方便分析和研究。它是個Ploymer組件，因此可以很容易集成到Jupyter notebooks中或者網頁上。

Facets包含兩部分：Facets Overview和Facets Dive。前者能夠以可視化的方式按照特徵展示數據集的統計分析，還能夠比較多個數據集之間的統計情況。支持數字特徵和字元串特徵。利用Facets Overview可以方便地發現數據集中的問題，如非法特徵值、特徵值丟失、訓練數據或測試數據的傾向性等。而Facets Dive則可以用交互方式展示最多一萬個數據點，用戶可以自由地選擇數據點的特徵以對數據點進行分類。

Style2Paints

Github代碼庫：https://github.com/lllyasviel/style2paints

Github給星：3,888個

Style2Paints基於TesnorFlow，可以根據給出的樣例給素描線稿上色，甚至可以不參照任何樣例自行決定上色方案。

Tensor2Tensor

Github代碼庫：https://github.com/tensorflow/tensor2tensor

Github給星：3,508個

Tensor2Tensor是一組深度學習模型和數據集的集合，旨在讓人們更方便地使用深度學習，並能夠更快速地進行深度學習的研究。該項目由Google Brain團隊的研究員和工程師以及許多社區用戶進行維護。

該項目的主頁上還提供了一個iPython notebook，運行在Google的虛擬機上，因此無需安裝就可以親身體驗一下。

Image-to-image translation in PyTorch

Github代碼庫：https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

Github給星：3,486個

這個項目是PyTorch版的CycleGAN。CycleGAN利用對抗式生成網路實現圖像到圖像的轉換，例如將莫奈、梵高的油畫轉換成風景照片，將夏季的照片轉換成冬季，將照片中的蘋果轉換成橙子等。作者的網站上有更為詳細的介紹(https://junyanz.github.io/CycleGAN/)。

Faiss

Github代碼庫：https://github.com/facebookresearch/faiss

Github給星：3,254個

Faiss是Facebbok AI Research開發的一套函數庫。它可以有效地實現相似搜索和稠密向量的聚類。它包含的演算法可以有效地搜索任何大小的向量集合，甚至是比內存還大的集合。它還包含一些用於評價和調參的輔助函數。Faiss基於C++實現，帶有Python/numpy的wrapper。

Fashion-mnist

Github代碼庫：https://github.com/zalandoresearch/fashion-mnist

Github給星：3,121個

Fashion-MNIST是一個類MNIST的數據集。它包含的不是手寫數字的圖片，而是一組時尚圖片，包括裙子、西服、襯衣、鞋子等。圖片尺寸為28x28，包含60000個訓練數據和10000個測試數據，甚至連文件命名和打包方式都與MNIST完全一致，因此MNIST的代碼可以原封不動地轉移到Fashion-MNIST上運行。

由於原始的MNIST手寫數字數據集就像Hello, World已成為AI、機器學習和數據科學領域事實上的標準測試數據，被廣泛地用來測試各種演算法。但問題是由於MNIST過於簡單，許多在MNIST上運行良好的演算法實際上並不能在其他數據上獲得滿意的結果。因此作者創建了這套以時尚為主題的數據集來代替原始的手寫數字。

ParlAI

Github代碼庫：https://github.com/facebookresearch/ParlAI

Github給星：2,955個

ParlAI是個Python的對話模型研究框架。它的目標是為研究者提供一套統一的框架以便分享、訓練和測試對話模型，並「一站式」地提供許多流行的數據集，方便研究者撰寫各種演算法；還提供了與Amazon Mechanical Turk的無縫集成，方便對數據集進行人工驗證。目前支持20多個常見任務，包含SQuAD、bAbI tasks、MS MARCO、MCTest等流行的數據集。

Fairseq

Github代碼庫：https://github.com/facebookresearch/fairseq

Github給星：2,750個

Fairseq由Facebook AI Research創建，是個基於Tourch序列到序列（sequence-to-sequence）的學習工具集。它實現了卷積NMT模型，以及標準的基於LSTM的模型。

如果希望使用PyTorch，可以使用fairseq-py項目(https://github.com/facebookresearch/fairseq-py)。

Pyro

Github代碼庫：https://github.com/uber/pyro

Github給星：2,994個

Pyro是個靈活、可擴展的深度概率編程庫，基於PyTorch。它的特點有：

通用：Pyro是個通用的概率編程庫，可以表示任何可計算的概率分布；

可擴展：Pyro可以擴展到大型數據集，而帶來的額外開銷與手寫代碼相差無幾；

最小化：Pyro非常小巧，便於維護。它的內核由一組強大、可互相組合的抽象組成；

靈活：Pyro會根據你的需要提供自動化或控制。它為生成式和推斷式模型提供了高層抽象，同時也為高級用戶提供了易於使用的介面。

iGAN

Github代碼庫：https://github.com/junyanz/iGAN

Github給星：2,607個

iGAN全稱是「通過生成式對抗網路進行互動式圖像生成」，是UC伯克利和Adobe CTL開發的一個研究實驗項目。只需寥寥勾勒幾筆，iGAN就可以根據用戶的描繪實時生成媲美照片的圖像。它可以用於實現能根據用戶的顏色和形狀提示自動生成圖像的智能繪圖程序，也可以作為可視化調試工具，幫助理解和調試深度生成模型。

Deep-image-prior

Github代碼庫：https://github.com/DmitryUlyanov/deep-image-prior

Github給星：2,693個

Deep Image Prior利用深度卷積網路來實現一些常見的圖像逆操作，如去噪、提高解析度、圖像修復等。

Face_classification

Github代碼庫：https://github.com/oarriaga/face_classification

Github給星：2,392個

這是個實時面部檢測的模型，還能對錶情、性別進行分類。基於keras CNN模型和openCV實現，在IMDB數據集上進行性別分類的測試準確率為96%，fer2013數據集上的表情分類測試準確率為66%。

Speech-to-Text-WaveNet

Github代碼庫：https://github.com/buriburisuri/speech-to-text-wavenet

Github給星：2,222個

Speech-to-Text-WaveNet是個利用TensorFlow實現語音識別的項目，基於DeepMind的WaveNet(https://arxiv.org/abs/1609.03499)。與ibab、tomlepaine等WaveNet的實現不同，該項目實現了從語音轉換成文字。

StarGAN

Github代碼庫：https://github.com/yunjey/StarGAN

Github給星：2,247個

StarGAN的全稱是「用聯合生成式對抗網路實現多領域的圖想到圖像轉換」(https://arxiv.org/pdf/1711.09020.pdf)，通過單一的模型實現多種圖像轉換功能，例如轉換人物的發色、性別、年齡、膚色，甚至表情等。

Ml-agents

Github代碼庫：https://github.com/Unity-Technologies/ml-agents

Github給星：2,252個

Unity ML Agents可以讓研究者和開發者利用Unity Editor創建遊戲或模擬作為訓練環境，利用強化學習、神經進化或其他機器學習演算法來訓練AI。它還提供了簡單易用的Python API。

DeepVideoAnalytics

Github代碼庫：https://github.com/AKSHAYUBHAT/DeepVideoAnalytics

Github給星：1,757個

Deep Video Analytics是個視頻分析平台，能夠從視頻和圖像中抽取並索引信息。可以用於視頻搜索、視頻識別檢測、OCR等。

OpenNMT

Github代碼庫：https://github.com/OpenNMT/OpenNMT

Github給星：1,621個

OpenNMT是個開源的神經網路機器翻譯系統，用Torch實現。其設計目標是簡單易用、易於擴展，同時保證效率和一流的翻譯準確性。它的特點有：

專門為高性能GPU上的訓練進行了速度優化和內存優化；

簡單易用的通用介面，只需要提供源數據和目標數據文件；

翻譯器用C++實現，易於部署；

支持擴展，以實現其他序列生成的任務，如文本總結、圖像標註等。

Pix2pixHD

Github代碼庫：https://github.com/NVIDIA/pix2pixHD

Github給星：1,648個

Pix2PixHD是高清照片級圖像轉換(https://arxiv.org/pdf/1711.11585.pdf)的pytorch實現。它可以將標籤圖轉換成照片級別的圖像，或根據面部標籤圖合成人物肖像。

Horovod

Github代碼庫：https://github.com/uber/horovod

Github給星：1,699個

Horovod是個TensorFlow的分散式訓練框架，其目標是加速分散式深度學習的過程，並使其更容易使用。根據項目網站提供的數據，Horovod比官方的Distributed TensorFlow有顯著的性能提高，在使用128個GPU時甚至能達到Distributed TensorFlow兩倍的速度，幾乎接近理論上限。

AI-Blocks

Github代碼庫：https://github.com/MrNothing/AI-Blocks

Github給星：1,185個