Github 年度精選:從 8,800 個專案中挑出 30 個最酷、最流行的機器學習專案!

【我們為什麼挑選這篇文章】2017 年,機器學習是各界極盡關注的領域之一,也推動了更多人投入開發。這篇文章從 2017 一整年近 8800 項開源的機器學習專案中,自反饋和評價中擇優挑選了前 30 名,並附上了 GitHub 網址,助你節省搜索的瑣碎時間。透過閱讀其他人的專案,你可以在前人的基礎上開發出更加強大且齊備的專案。別遲疑,繼續閱讀了解更多!(責任編輯:杜維)

2017 年是機器學習應用全面開花的一年 ,驚為天人的想法和項目層出不窮。我們比對了過去一年中近 8800 個開源機器學習專案,並挑選了其中較好的 30 個(Top 0.3%)列舉於此。

這是一份極具競爭性的列表,它 精挑細選了發表於 2017 年 1 月-12 月份的機器學習庫、數據集和應用類的優質專案 。我們通過流行度、參與度和時近性來對其質量進行評級。有一項數據可以讓你對表單質量有一個直觀印象:這些專案的 GitHub 平均 stars 數是 3558。

開源專案對於數據科學家而言是很有意義的。 你可以通過閱讀源代碼,在前人的基礎上構建更加強大的項目。 你可以盡情嘗試一下這些可能在去年與你失之交臂的機器學習項目。

No.1 – FastText:快速文本表示/分類庫

GitHub stars 數:11786 個

來源:Facebook 研究

網址:https://github.com/facebookresearch/fastText

以及【Muse:基於 FastText 的多語言無監督/監督詞嵌入(GitHub stars 數:695 個)】

No.2- Deep-photo-styletransfer:康奈爾大學 Fujun Luan 論文《Deep Photo Style Transfer》的代碼與數據

GitHub stars 數:9747 個

網址:https://github.com/luanfujun/deep-photo-styletransfer

No.3 – face recognition:世界上最簡單的適用於 Pyhthon 的面部識別 api 以及命令行

GitHub stars 數:8672 個

來源:Adam Geitgey

網址:https://github.com/ageitgey/face_recognition

No.4 – Magenta:機器智慧音樂與藝術生成器

GitHub stars 數:8113 個

網址:https://github.com/tensorflow/magenta

No.5 – Sonnet:基於 TensorFlow 的神經網路庫

GitHub stars 數:5731 個

來源:DeepMind 成員 Malcolm Reynolds

網址:https://github.com/deepmind/sonnet

No.6 – deeplearn.js:網頁端硬件加速機器學習庫

GitHub stars 數:5462 個

來源:Google Brain 團隊 Nikhil Thorat

網址:https://github.com/PAIR-code/deeplearnjs

No.7 – Fast Style Transfer:TensorFlow 快速風格轉換

GitHub stars 數:4843 個

來源:MIT 的 Logan Engstrom

網址:https://github.com/lengstrom/fast-style-transfer

No.8 – Pysc2:星際爭霸 II 學習環境

GitHub stars 數:3683 個

來源:DeepMind Timo Ewalds 等人

網址:https://github.com/deepmind/pysc2

No.9 – AirSim:微軟 AI 和研究院出品的基於虛幻引擎的開源自動駕駛模擬器

GitHub stars 數:3681 個

來源:微軟的 Shital Shah

網址:https://github.com/Microsoft/AirSim

No.10 – Facets:機器學習數據集可視化工具

GitHub stars 數:3371 個

來源:Google Brain

網址:https://github.com/PAIR-code/facets

No.11 – Style2Paints:AI 漫畫線稿上色工具

GitHub stars 數:3310 個

網址:https://github.com/lllyasviel/style2paints

No.12 – Tensor2Tensor:用於廣義序列-序列模型的工具庫

GitHub stars 數目:3087 個

來源:Google Brain 的 Ryan Sepassi

網址:https://github.com/tensorflow/tensor2tensor

No.13- 基於 PyTorch 的圖像對圖像轉換工具(如 horse2zebra, edges2cats,等)

GitHub stars 數:2847 個

來源:UC Berkeley 朱俊彥博士

網址:https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

No.14 – Faiss:用密集向量高效相似性檢索與聚類的工具庫

GitHub stars 數:2629 個

來源:Facebook

網址:https://github.com/facebookresearch/faiss

No.15 Fashion-mnist:一個類似於 MNIST 的時尚產品數據集

GitHub stars 數:2780 個

來源:Zalando Tech 的 Han Xiao

網址:https://github.com/zalandoresearch/fashion-mnist

No.16 – ParlAI:適用於在各類公開的對話數據集上訓練與評估 AI 模型的一個框架

GitHub stars 數:2578 個

來源:Facebook Research 的 Alexander Miller

網址:https://github.com/facebookresearch/ParlAI

No.17 Fairseq:序列到序列工具包

GitHub stars 數:2571 個

來源:FAIR

網址:https://github.com/facebookresearch/fairseq

No.18 Pyro:使用 Python 和 PyTorch 進行深度通用概率編程

GitHub stars 數:2387 個

來源:Uber AI Labs

網址:https://github.com/uber/pyro

No.19 iGAN:基於 GAN 的交互圖像生成器

GitHub stars 數:2369 個

網址:https://github.com/junyanz/iGAN

No.20 Deep-image-prior:使用神經網路進行圖像恢復,然而無需學習過程

GitHub stars 數:2188 個

來源:Skoltech 的 Dmitry Ulyanov 博士

網址:https://github.com/DmitryUlyanov/deep-image-prior

No.21 Face_classification:基於 Keras CNN 模型與 OpenCV 的實時面部檢測和表情/性別分類,訓練與 fer2013/imdb 數據集

GitHub stars 數:1967 個

網址:https://github.com/oarriaga/face_classification

No.22 Speech to Text WaveNet:使用 DeepMind 的 WaveNet 和 TensorFlow 構成的端到端句級英語語音識別

GitHub stars 數:1961 個

來源: Kakao Brain 的 Namju Kim

網址:https://github.com/buriburisuri/speech-to-text-wavenet

No.23 StarGAN:用於多領域圖像-圖像轉換的統一生成對抗網路

GitHub stars 數:1954 個

來源:韓國大學的 Yunjey Choi

網址:https://github.com/yunjey/StarGAN

No.24 MI-agents:Unity 機器學習智慧體

GitHub stars 數:1658 個

來源:深度學習 Unity3D 的 Arthur Juliani

網址:https://github.com/Unity-Technologies/ml-agents

No.25 Deep Video Analytics:分佈式可視化搜索和可視化數據分析平台

GitHub stars 數:1494 個

來源:康奈爾大學的 Akshay Bhat

No.26 OpenNMT:Torch 上的開源神經機器翻譯

GitHub stars 數:1490 個

網址:https://github.com/OpenNMT/OpenNMT

No.27 Pix2PixHD:使用條件 GAN 合成和處理 2048×1024 分辨率的圖像

GitHub stars 數:1283 個

來源:英偉達 AI 科學家 Ming-Yu Liu

網址:https://github.com/NVIDIA/pix2pixHD

No.28 Horovod:分佈式 TensorFlow 訓練框架

GitHub stars 數:1188 個

來源:Uber 工程團隊

網址:https://github.com/uber/horovod

No.29 AI-Blocks:強大而直觀的 WYSIWYG 界面,可讓任何人創建機器學習模型

GitHub stars 數:899 個

網址:https://github.com/MrNothing/AI-Blocks

No.30 Voice Conversion with Non-Parallel Data:基於 TensorFlow 的深度神經網絡語音轉換(語音風格轉換)

GitHub stars 數:845 個

來源:Kakao Brain 人工智慧研究團隊的 Dabi Ahn

網址:https://github.com/andabi/deep-voice-conversion

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈我们对比了 GitHub 上 8800 个开源机器学习项目,并选出了其中的 Top30〉。)

延伸閱讀

想做機器學習模型卻不知從何著手?介紹三個 Google AI 工具給不同需求的你
總結 2017 年 Google Brain 成果:機器學習的各種應用、開源都在這!
2017 年度盤點:在 Github 上最熱門的 15 個機器學習項目總整理


我們正在找夥伴!

2019 年我們的團隊正在大舉擴張,需要你的加入跟我們一起找出台灣創新原動力! 我們正在徵 《採訪社群編輯》、《助理編輯》,詳細職缺與應徵辦法 請點我

點關鍵字看更多相關文章: