你不应该忽略的五个机器学习项目一览随着人工智能和深度学习的兴起，网络上存在的学习资源以及开源项目也越来越多。本文精选了的

随着人工智能和深度学习的兴起，网络上存在的学习资源以及开源项目也越来越多。本文精选了的五个项目，都含有潜在新的机器学习想法，且全都是用Python实现。下面简单介绍
下这五个项目，感兴趣的可以自己上手复现一下，说不定会对自己的项目产生一些新的想法。

1.实时损失曲线图（Live Loss Plot）

在训练模型的时候最好不要只关注最终的结果，耐心观察整个训练过程，查看每个epoch的训练结果，弄清楚模型的训练曲线是否正常，是否出现过拟合等现象。
PiotrMigdał等人开发了一个Python源代码包，可以为Keras，PyTorch和其他框架提供实时训练损失的曲线。
当使用的是Keras深度学习框架时，实时损失曲线图可以简单地通过以下回调函数调用：

from livelossplot import PlotLossesKeras
model.fit(X_train, Y_train,
          epochs=10,
          validation_data=(X_test, Y_test),
          callbacks=[PlotLossesKeras()],
          verbose=0)

2.Parfit

该项目由Jason Carpenter开发，他是旧金山大学数据科学专业的硕士，目前是Manifold的机器学习实习生。
该项目是用于并行化Sklearn机器学习模型的拟合和灵活评分的数据包，具有可视化的功能。一旦导入该数据包，就可以自由使用bestFit()或其他功能。

代码示例：

from parfit import bestFit # Necessary if you wish to use bestFit

# Necessary if you wish to run each step sequentially
from parfit.fit import *
from parfit.score import *
from parfit.plot import *
from parfit.crossval import *

grid = {
    'min_samples_leaf': [1, 5, 10, 15, 20, 25],
    'max_features': ['sqrt', 'log2', 0.5, 0.6, 0.7],
    'n_estimators': [60],
    'n_jobs': [-1],
    'random_state': [42]
}
paramGrid = ParameterGrid(grid)

best_model, best_score, all_models, all_scores = bestFit(RandomForestClassifier(), paramGrid,
                                                    X_train, y_train, X_val, y_val, # nfolds=5 [optional, instead of validation set]
                                                    metric=roc_auc_score, greater_is_better=True, 
                                                    scoreLabel='AUC')

print(best_model, best_score)

3.Yellowbrick

Yellowbrick是一款促进机器学习模型选择的视觉分析和诊断工具。具体来说，Yellowbrick是一套名为“展示台（Visualizers）”的视觉诊断工具，它扩展了scikit-learn API，以便人为地指导模型选择过程。简而言之，Yellowbrick将scikit-learn与matplotlib结合在一起，且具有模型生成可视化的效果。

可以在这里查看Github代码示例以及使用文档介绍。

Magnitude是一个快速、简单的矢量嵌入实用程序库。它也是一种功能丰富的Python软件包和矢量存储文件格式。通过Plasticity以快速、高效的方式开发机器学习模型。它主要是为Gensim提供一个更简单、更快捷的替代方案，但也可以用作NLP之外域的通用关键向量存储。
该项目提供了各种流行的嵌入模型的链接，这些嵌入模型已经以.magnitude格式准备好以供使用，还包括将任何其他文字嵌入文件转换为相同格式的说明。
使用以下代码可以将其导入：

from pymagnitude import *
vectors = Magnitude("/path/to/vectors.magnitude")

此外，Github上有更多的信息，包括熟悉的用于使用预先训练的简化库的起步和运行的所有信息。
以上是五个器学习或机器学习相关的项目简介，你可能还没有听说过，但可能要考虑要动手实践一下，部分项目可能会对你此时的项目有所帮助。

数十款阿里云产品限时折扣中，赶紧点击领劵开始云上实践吧！

作者信息

Matthew Mayo，机器学习研究者
个人主页：www.linkedin.com/in/mattmayo…
本文由阿里云云栖社区组织翻译。
文章原标题《5 Machine Learning Projects You Should Not Overlook, June 2018》，译者：海棠，审校：Uncle_LLD。
文章为简译，更为详细的内容，请查看原文。

你不应该忽略的五个机器学习项目一览

1.实时损失曲线图（Live Loss Plot）

2.Parfit

3.Yellowbrick

4.textgenrnn

5.Magnitude

数十款阿里云产品限时折扣中，赶紧点击领劵开始云上实践吧！

作者信息