2017年机器学习开源项目TOP30

258 阅读5分钟
原文链接: click.aliyun.com

在 2017年,我们比较了将近8800个开源的机器学习项目,并从中选出了前30名(0.3%的几率)。

这是一个极具竞争力的排行,我精心挑选了2017年1月至12月发布的最好的开源机器学习库、数据集和应用程序。Mybridge AI通过考量受欢迎程度、参与度和新近度来等指标来评估这些参选项目的质量。为了给你一个关于质量的参考,GitHub星的平均数量是3558颗。

开源项目对数据科学家来说非常有用。您可以通过阅读源代码进行学习,然后在已经存在的项目上构建自己的东西。现在让我们轻松地学习过去一年你可能错过的机器学习项目吧。

推荐相关学习书籍名单 :

A) 神经网络

3ad6aa57e07ca7cd7f818194518479901855ec3f 

深度学习A-Z:动手的人工神经网络(Deep Learning A-Z: Hands-On Artificial Neural Networks)

[68,745条推荐,4.5/5星]

B) TensorFlow

a999afa196b99aa393850d7823e22eb872c3e3f7 

用Python进行深度学习的TensorFlow完整指南(Complete Guide to TensorFlow for Deep Learning with Python)

[17,834条推荐,4.6/5星]

 

开源项目排行榜

第 1 名

FastText:快速文本表示/分类库。

[在Github上有11786颗星] 由Facebook Research提供

894c4a4c89360ec39efc0b5c54ad7203915fbb1d 

[Muse: 基于快速文本的多语言无监督或监督词嵌入。在Github上有695颗星]

第 2 名

Deep-photo-styletransfer :论文《深度照片风格转移》(Deep Photo Style Transfer)的代码和数据。

[在Github上有9747颗星星] 由康奈尔大学 Fujun Luan 博士提供

76ad03cc546e87b4e4dd92572313be4db0bf7b4d 

第 3 名

face recognition :最简单的 Python 命令行面部识别 API。

[在Github上有8672个星] 由Adam Geitgey提供

aa2a2528846628c2fdc265f0cd2ef0561ee80faa 

第 4 名

Magenta:机器智能音乐与艺术生成器。

[在Github上有 8113颗星]

56cac1c7dbab68c642ab98d10b871c52f3589fc3 

第 5 名

Sonnet:基于TensorFlow的神经网络库。

[在Github上有5731颗星]。 由Deepmind公司的Malcolm Reynolds 提供

885ec3a7e0cd9bbc804739e12233d8c536779a42 

第 6 名

deeplearn.js:一种用于web的硬件加速机器智能库。

[在Github上有5462颗星]。 由Google Brain的Nikhil Thorat提供

05275c5bf71d815bde61411b8e44d46c1d278c8c 

第 7 名

Fast Style Transfer :TensorFlow的快速风格转换。

[在Github上有4843颗星] 由MIT的Logan Engstrom提供

93eb21b2c4149a5adee81d2c73cc80bc14c48125 

第 8 名

Pysc2:星际争霸II学习环境。

[在Github上有3683颗星星] 由DeepMind的Timo Ewalds提供

9ea02e577da32aef02bbc7bf151221f281f9d941 

第 9 名

AirSim:基于Unreal Engine的开源模拟器,用于微软AI&Research自主车辆。

[在Github上有3861颗星]。 由Microsoft的Shital Shah提供

5ee1fcabb3b0e3c6f840ea37c2ee828782134e49 

第 10 名

Facets: 机器学习数据集可视化工具。

[在Github上有3371颗星] 由Google Brain提供

7cd43fb3657a434a0d262266e19b2bcbe5c573cd 

第 11 名

Style2Paints:人工智能图像彩色化。

[在Github上有3310颗星]

18787f42265f10c98c5e4ad9df55baa1ec10067e 

第 12 名

Tensor2Tensor:用于广义序列-序列模型的工具库

[在Github上有3087颗星] 由Google Brain的Ryan Sepassi提供

e4e27778511893a0dc5905ced56f5b69f7832d97 

第 13 名

CycleGAN and pix2pix in PyTorch :基于 PyTorch 的图像-图像转换工具(例如horse2zebra,edges2cats等)。

 [在Github上有2847颗星] 由伯克利的Jun-Yan Zhu博士提供

cefa9c476cafc2bbbc19e8acc7a759bec509d78f 

第 14 名

Faiss:用于密集向量高效相似性搜索和聚类的库。

[在Github上有2629颗星]。 由Facebook Research提供

6232e58bce5fe7d055625efec74239683c06b2c4 

第 15 名

Fashion-mnist :一种类似于MNIST的时尚产品数据集。

[在Github上有2780颗星星] 由Zalando Tech的研究科学家Han Xiao提供

de89a2bbef7be4f8163ee583468c6dd1aadf2265 

第 16 名

ParlAI:用于在各种公开可用的对话数据集上训练和评估人工智能模型的框架。

[在Github上有2578颗星]。 有Facebook研究院的Alexander Miller提供

61fcb5c01be8f9fc3acececb1741144b5223ca37 

第 17 名

Fairseq:Facebook人工智能研究序列-序列的工具包。

[在Github上有2571颗星]

eb3eb3ad04f6322607ee96b2c54d76cfb8184ff6 

第 18 名

Pyro:使用Python和PyTorch进行深度通用概率编程。

[在Github上有的2387颗星] 由Uber Engineering提供

448f03cb20aa3647bdde450d61b652c67e885cca 

第 19 名

iGAN:由GAN支持的交互式图像生成器。

[在Github上有2369颗星]

a341cc32b02df126bb5b9017a52a2e1e172e3707 

第 20 名

Deep-image-prior :使用神经网络进行图像恢复,但无需学习神经网络。

[在Github上有2188颗星] 由Skoltech博士Dmitry Ulyanov提供

fb6f6991db331a4760a011fb71578b7c4c0ae89f 

第 21 名

Face_classification :使用fer2013/imdb数据集与keras CNN模型和openCV进行实时人脸检测和情感/性别分类。

[在Github上有1967星]

166b9434fee65fb0a4bf03137f3fa4ad2fc943be 

第 22 名

Speech-to-Text-WaveNet :使用DeepMind的WaveNet和tensorflow构成端到端的句级英语语音识别。

[在Github上有1961星] 由Kakao Brain的Namju Kim提供

ddb7cd8212e3eac413d778c41c03490e9f274bee 

第 23 名

StarGAN:用于多领域图像-图像转换的统一生成对抗网络。

[在Github上有1954颗星] 由韩国大学的Yunjey Choi提供

4ccee1811397595f5b21198d77eebacc87a67c84 

第 24 名

Ml-agents:Unity机器学习代理。

[在Github上有的1658颗星] Deep Learning at Unity3D 的Unity Juliani提供

7e882acf383e1e7556fa0190fb7f3f997c5994a5 

第 25 名

DeepVideoAnalytics :分布式可视化搜索和可视化数据分析平台。

[在Github上有1494颗星] 由康奈尔大学的Akshay Bhat博士提供

b0caa3226574f683d289629c479190365fd6d430 

第 26 名

OpenNMT:Torch上的开源神经机器翻译。

[在Github上有1490颗星]

d9720e3394bcf3edff03fc340e462c2321f7e5f0 

第 27 名

Pix2pixHD:使用条件GANs合成和处理2048×1024分辨率的图像。

[在Github上有1283颗星] 由Nvidia的AI Research 科学家 Ming-Yu Liu提供

4f7f29457de750d45f7e9d5f543c63c1b111319c 

第 28 名

Horovod:TensorFlow的分布式训练框架。

[在Github上有1188颗星] 由Uber Engineering提供

e618cf0201e73db0d180aca8228fd38fc7380cfb 

第 29 名

AI-Blocks: 一个强大而直观的所见即所得的界面,能够允许任何人创建机器学习模型。

[在Github上有899颗星]

 e450a10c8aede35b6675c1b06ff40a0a14a87fe2

第 30 名

Voice Conversion with Non-Parallel Data :基于Tensorflow的深度神经网络语音转换(或语音风格转换)。

[在Github上有845颗星] 由AI Kakao Brain的AI 研究院的Dabi Ahn提供

ba08320eb0ed2351f75492d948ee04aecefa993d 

 

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《30 Amazing Machine Learning Projects for the Past Year (v.2018)》

作者:Mybridge

译者: 奥特曼 ,审校:袁虎。

文章为简译,更为详细的内容,请查看原文