Github上Top20 Python与机器学习开源项目推荐

281

TensorFlow

TensorFlow是一个端到端的机器学习开源平台。由工具、库和社区资源组成的全面、灵活的生态系统,使开发人员能够轻松地构建和部署基于ML的应用程序。

TensorFlow最初是由谷歌机器智能研究组织的谷歌大脑团队的研究人员和工程师开发的,用于进行机器学习和深度神经网络研究。该系统具有足够的通用性,可以广泛应用于其他领域。

![](https://upload-images.jianshu.io/upload_images/3016913-22832ae6bbf42161.png?imageMogr2/auto-orient/strip|imageView2/2/w/634/format/webp)

(1)URL:

www.tensorflow.org/

(2)Github URL:

github.com/tensorflow/…

Scikit-learn

Scikit-learn是用于数据挖掘和数据分析的简单而高效的工具,每个人都可访问,并可在各种环境中重用,它建立在NumPy、SciPy和matplotlib之上,是开源的,商业上可用的。

(1)URL:

scikit-learn.org/

(2)Github URL:

github.com/scikit-lear…

Keras

Keras是一个高级的神经网络API,用Python编写,能够在TensorFlow、CNTK或Theano上运行。

![](https://upload-images.jianshu.io/upload_images/3016913-ebfa0d0cf9831fda.png?imageMogr2/auto-orient/strip|imageView2/2/w/692/format/webp)

(1)URL:

keras.io/

(2)Github URL:

github.com/keras-team/…

PyTorch

Python中具有强大GPU加速和动态神经网络

![](https://upload-images.jianshu.io/upload_images/3016913-33fb14f0fcc84312.png?imageMogr2/auto-orient/strip|imageView2/2/w/672/format/webp)

(1)URL:

pytorch.org/

(2)Github URL:

github.com/pytorch/pyt…

Theano

Theano是一个Python库,允许开发者高效地定义、优化和计算涉及多维数组的数学表达式。它可以使用gpu进行高效的符号微分。

(1)URL:

deeplearning.net/software/th…

(2)Github URL:

github.com/Theano/Thea…

Gensim

Gensim是一个免费的Python库,具有可伸缩的统计语义、分析纯文本文档的语义结构、检索语义相似的文档等功能。

(1)URL:

radimrehurek.com/gensim/

(2)Github URL:

github.com/RaRe-Techno…

Caffe

Caffe是一种深度学习框架,它考虑了表达式、速度和模块化。由伯克利视觉与学习中心(BVLC)和社区贡献者开发的。

(1)URL:

caffe.berkeleyvision.org/

(2)Github URL:

github.com/BVLC/caffe

Chainer

Chainer是一个基于python的、独立的开源框架,用于深度学习模型。Chainer提供了一种灵活、直观、高性能的方法来实现全方位的深度学习模型,包括最先进的模型,如递归神经网络和变分自动编码器。

![](https://upload-images.jianshu.io/upload_images/3016913-aac729e1a22438c1.png?imageMogr2/auto-orient/strip|imageView2/2/w/685/format/webp)

(1)URL:

chainer.org/

(2)Github URL:

github.com/chainer/cha…

Statsmodels

Statsmodels是一个Python模块,允许用户研究数据、估计统计模型和执行统计测试。描述统计、统计测试、绘图函数和结果统计的广泛列表可用于不同类型的数据和估计。

(1)URL:

www.statsmodels.org/stable/inde…

(2)Github URL:

github.com/statsmodels…

Shogun

Shogun是机器学习工具箱,提供了广泛的统一和有效的机器学习(ML)方法。允许轻松地组合多个数据表示、算法类和通用工具。

(1)URL:

shogun-toolbox.org/

(2)Github URL:

github.com/shogun-tool…

Pylearn2

Pylearn2是一个机器学习库。它的大部分功能都建立在Theano之上。这意味着开发者可以使用数学表达式编写Pylearn2插件(新模型、算法等),Theano将为其优化和稳定这些表达式,并将它们编译到你选择的后端(CPU或GPU)。

(1)URL:

deeplearning.net/software/py…

(2)Github URL:

github.com/lisa-lab/py…

NuPIC

NuPIC是一个基于新大脑皮层理论的开源项目,该理论被称为分级时间记忆(HTM)。HTM理论的部分内容已经实现、测试并在应用中使用,HTM理论的其他部分仍在开发中。

![](https://upload-images.jianshu.io/upload_images/3016913-b716cfa4b5d90adb.png?imageMogr2/auto-orient/strip|imageView2/2/w/460/format/webp)

(1)URL:

numenta.org/

(2)Github URL:

github.com/numenta/nup…

Neon

Neon是Nervana基于python的深度学习库。它提供了易用性,同时提供了最高的性能。注意:Intel已经不再支持Neon了,但是你仍然可以通过Github来使用它。

(1)URL:

github.com/NervanaSyst…

(2)Github URL:

github.com/NervanaSyst…

Nilearn

Nilearn是一个Python模块,用于对神经成像数据进行快速、简单的统计学习。它利用scikit-learn Python工具箱进行多元统计,应用程序包括预测建模、分类、解码或连接性分析。

(1)URL:

nilearn.github.io/

(2)Github URL:

github.com/nilearn/nil…

Orange3

Orange3是面向新手和专家的开源机器学习和数据可视化工具。具有大型工具箱的交互式数据分析工作流。

(1)URL:

orange.biolab.si/

(2)Github URL:

github.com/biolab/oran…

Pymc

Pymc是一个python模块,它实现了贝叶斯统计模型和拟合算法,包括马尔科夫链蒙特卡罗。它的灵活性和可扩展性使其适用于大量的问题。

(1)URL:

pymc-devs.github.io/pymc/README…

(2)Github URL:

github.com/pymc-devs/p…

Deap

Deap是一种用于快速原型设计和思想测试的新型进化计算框架。它试图使算法显式和数据结构透明。它与并行机制(如多处理和凸勺)完美地协调工作。

(1)URL:

pypi.org/project/dea…

(2)Github URL:

github.com/deap/deap

Annoy

Annoy创建了大型的基于只读文件的数据结构,这些结构被映射到内存中,以便许多进程可以共享相同的数据。

(1)URL:

pypi.org/project/ann…

(2)Github URL:

github.com/spotify/ann…

PyBrain

PyBrain是Python的一个模块化机器学习库。它的目标是为机器学习任务提供灵活、易于使用但仍然强大的算法,以及用于测试和比较算法的各种预定义环境。

(1)URL:

pybrain.org/

(2)Github URL:

github.com/pybrain/pyb…

Fuel

Fuel是一个数据管道框架,它为你的机器学习模型提供它们需要的数据。它计划用于模块和Pylearn2神经网络库。

(1)URL:

fuel.readthedocs.io/en/latest/

(2)Github URL:

github.com/mila-iqia/f…

关于更多机器学习、人工智能、增强现实、Unity、Unreal资源和技术干货,可以关注公众号:AIRX社区,共同学习,一起进步!AIRX三次方:超酷的开发者学习服务与交流平台(专注ARVR、Unity、Unreal、CV、AI领域)学ARVR开发,来AIRX三次方!!!