你可能不知道的Python库

569 阅读4分钟

你可能不知道的Python库

在这篇文章中,我提出了一些许多人不知道的Python中的少有的库。这些库在执行特定任务方面非常出色。因此,对它们有一些接触是很好的。

让我们开始吧!

1.模式

这个Python库Pattern 是一个开源的库,用于自然语言处理、网络挖掘和基于机器学习的数据分析任务。这个库的主要重点是它对用户的易用性。

这个库可以执行各种任务,如文本处理数据挖掘和从各种来源提取数据。这个库的语法非常简单明了。因此,属于科学和非科学背景的用户都可以轻松使用它。

安装方法

pip install pattern

例子

from pattern.en import sentiment

情感评分和主观性已经作为输出返回。

给定句子的情感分数是0.75,这意味着它是一个高度积极的句子。主观性0.8意味着给定句子是用户的个人意见。

2.Eli5

Eli5 是一个有用的Python库,它是用来调试和检查机器学习分类器并解释这些分类器的预测结果。它支持各种机器学习包和框架,如Kerasscikit-learnLightGBMXGBoostCatBoost 等。

使用这个库有两种方法来理解机器学习模型。

  1. 通过分析模型的权重来了解模型的global性能。
  2. 通过分析单个样本的预测来了解模型的local 性能。

安装方法。

pip install eli5

3.CatBoost

在Python中,CatBoost 是由Yandex公司开发的一种开源机器学习算法。CatBoost由两个词组成,Category和Boosting

这个库可以用来处理不同类别的数据,如图像、文本、音频和其他分类数据。Boost是指这个库是基于梯度提升库的,与其他提升算法如XGBoost的工作原理相同。

这个库的优点是无需调整参数就能提供很高的精度,而且它还提供GPU支持以加快训练速度。

安装方法

pip install catboost

例子

import numpy as npfrom catboost import CatBoost, Pool

这就是我们如何使用这个算法来进行预测。

4.Bokeh

Bokeh 是Python中的一个数据可视化库,用于创建交互式图表、绘图和图形。这个库的输出和可视化可以用于各种媒介,如Notebook、HTML和Flask,以及基于Django的网络应用。

通过Boken,我们可以创建各种可视化,从简单的图到复杂和高端的仪表盘。它还可以让我们在不写JavaScript代码的情况下创建由JavaScript驱动的可视化效果。

安装方法

pip install bokeh

例子

from bokeh.plotting import figure, output_notebook, show

输出

图片由作者提供

用Bokeh进行可视化是相当简单和直接的。

5.StatsModels

这个StatsModels 库是对数据进行统计分析的最有用的模块之一。这个库允许用户执行统计测试和探索数据。

这个库是建立在Numpy和Scipy库之上的。如果你想对数据进行统计分析和估计统计模型,这个库是一个很好的工具。

安装方法

pip install statsmodels

例子

import numpy as npimport statsmodels.api as sm

输出

6.SpaCy

spaCy 是一个Python的开源库,用于分析和处理数据的自然语言处理。它有很多内置功能,因为它是用Cython编写的。它有用户友好的API,使用起来非常简单。

安装方法

pip install -U pip setuptools wheel

例子

我们将通过一个语篇标签的例子来看看spaCy的运行情况。语音部分或PoS标签是自然语言处理中的一项常见任务。

import spacy nlp = spacy.load('en_core_web_sm')

输出

Apple --> PROPN is --> AUX the --> DET first --> ADJ U.S. --> PROPN public --> ADJ company --> NOUN to --> PART reach --> VERB a --> DET $ --> SYM 1 --> NUM trillion --> NUM market --> NOUN value --> NOUN

结论

这篇文章就讲到这里。在这篇文章中,我们讨论了一些不是很流行但对执行特定任务很有用的Python库。

这些库对于那些对Python编程和它的库没有太多接触,但想执行特定任务的人来说也很方便。由于这些库的语法简单明了,因此对他们来说是很方便的。

谢谢你的阅读!