在本文中,我们将介绍机器学习的十个必备开源工具。这些工具将帮助您改善工作流程。
10 个必备的机器学习开源工具
对于非程序员
如果您不熟悉编程或机器学习,则需要使用与您的经验相匹配的工具。对于初学者,我们建议使用这两个工具。
Knime : Knime 是一款出色的工具,可让您执行端到端的数据科学工作流,而无需编写一行代码。
为了帮助新手,它带有一个拖放界面。界面清晰,您可以使用它进行创建和生产。
第一步是使用该工具进行数据收集和转换。
完成后,您可以创建模型并将其可视化。在生产方面,您可以部署和管理您的数据科学项目。
最后,您可以通过使用 Knime 产生洞察力来利用您的实施。
Uber Ludwig : Uber Ludwig 是另一个适合初学者的优秀工具。有了它,您可以快速测试和训练深度学习模型。编写代码是可选的,您可以充分利用拖放界面。
首先,您需要先加载 CSV 文件来训练数据。通过使用预先训练的模型,您可以预测输出目标。最后,您可以使用可用的可视化选项可视化您的数据。
如果您是编程初学者,您还可以使用他们广泛的 API 并在 Python 中训练模型。
对于模型部署
模型部署是机器学习的关键方面之一。为了在此过程中为您提供帮助,我们列出了以下工具。
TensorFlow.js - TensorFlow.js 可让您直接从网络构建和部署机器学习模型。它使用 JavaScript 在网络上运行。
您也可以为此使用 Node.js。有了它,您不仅可以运行现有模型,还可以重新训练现有模型。
它提供直观的 API,让您可以使用 JavaScript 构建和训练模型,也可以在 Web 浏览器上进行。
如果您想在移动设备上进行开发,也可以查看 TensorFlow Lite。
MLFlow : MLFlow 可让您处理端到端的机器学习生命周期。它包含三个主要组件。
- MLflow Tracking - 通过记录和比较结果和参数来处理实验
- MLflow 项目 - 让您将项目打包成可重复使用的形式供其他成员使用
- MLflow 模型 - 帮助您在不同平台上部署和管理 ML 库
MLFlow 的另一个惊人特性是它与库无关。这意味着您可以将它与其他机器学习库一起使用,而不会出现任何兼容性问题。为了实现库竞争行为,它利用 REST API 和 CLI。
对于 NLP、计算机视觉和音频
还有其他方便的工具可以用来在机器学习中做不同的事情。
Detectron: 如果您正在寻找最先进的物体检测算法,那么 Detectron 绝对不会出错。
它由 Facebook 开发,是其 AI Research 软件系统的一部分。它利用 Caffe2 深度学习框架和 Python。
SimpleCV : SimpleCV 是一个开源框架,可让您构建计算机视觉应用程序。它类似于 OpenCV,使您能够访问高级计算机视觉库。这意味着您不必担心复杂的概念。
有了它,您就可以制作计算机视觉项目,而无需在基础知识上投入太多时间。毕竟,它被命名为 SimpleCV 是有原因的。
Tesseract OCR: Tesseract OCR 是一款功能强大的光学字符识别软件,可让您识别语言。
它支持 100 多种语言,还可以通过编程来识别新语言。
对于强化学习
如果你想训练智能代理,那么你需要借助强化学习。
Open AI Gym : Open AI Gym 让您可以训练您的智能体做几乎任何事情,包括走路、玩游戏等等。它借助易于使用的强化学习任务套件来完成。
Unity ML Agents : Unity 提供了他们的开源 unity 插件,Unity ML agents 让你开发可以在游戏中使用的智能代理。
用于数据挖掘
如果您希望为您的数据科学项目收集数据,您可以使用以下工具。
Weka: Weka 用于数据挖掘任务。它借助专为数据挖掘设计的机器学习算法来完成。有了它,你可以找到很多东西,包括分类、准备、回归、聚类、可视化和关联规则挖掘。
该项目是开源的,并获得 GNU 许可。
结论
机器学习正在改变我们与世界互动的方式。它使我们的生活更轻松,并确保我们建立一个未来主义的世界。