原文作者:Matthew Mayo
原文地址:GitHub Python Data Science Spotlight: AutoML, NLP, Visualization, ML Workflows
下面一起来了解一下这些新兴的热门Python库吧,希望本文对你的工作能有所帮助:
- Auto-Keras自动机器学习库
Auto-Keras是用于自动机器学习(AutoML)的开源软件库。自动机器学习的最终目标是让仅拥有一定数据科学知识或机器学习背景的行业专家可以轻松地应用深度学习模型。Auto-Keras提供了很多用于自动研究深度学习模型架构与超参数的函数。
- Finetune Scikit-Learn风格的自然语言处理模型微调器
入门指南:finetune.indico.io
Finetune提供了“通过生成式预训练改进对语言的理解”的预训练语言模型,并扩充了OpenAI/finetune-language-model库。
- GluonNLP - 让自然语言处理变得更简单
入门指南: github.com/dmlc/gluon-…
GluonNLP可以使文本处理、数据加载及构建神经模型变得更容易,加快自然语言处理研究的速度。
- animatplot - 基于Matplotlib的Python动图库
文档:animatplot.readthedocs.io/en/latest
入门指南: animatplot.readthedocs.io/en/latest/t…
请注意,本库文档里的例子比较简单,本文引用的是该库在GitHub上列出的功能更全、形式更酷的示例图。
- MLflow - 机器学习生命周期的开源平台
入门指南:mlflow.org/docs/latest… MLflow是用来管理机器学习整体生命周期的开源平台,这个平台提供了以下主要三个功能:
- MLflow Tracking:跟踪实验,以用来记录和比较机器学习的参数。
- MLflow Projects:以可复用、可再现的形式,将机器学习的代码进行打包,以便分享给其他数据科学家或传递给生产环境。
- MLflow Models:管理各类机器学习库中的模型,并部署到不同的模型服务及应用平台。
MLflow通过访问REST API和CLI实现其功能,所以它不依赖于某个库,并且支持多种机器学习库与编程语言,为了使用方便,它还内置了Python API。