你可能不知道的Python库
在这篇文章中,我提出了一些许多人不知道的Python中的少有的库。这些库在执行特定任务方面非常出色。因此,对它们有一些接触是很好的。
让我们开始吧!
1.模式
这个Python库Pattern 是一个开源的库,用于自然语言处理、网络挖掘和基于机器学习的数据分析任务。这个库的主要重点是它对用户的易用性。
这个库可以执行各种任务,如文本处理、数据挖掘和从各种来源提取数据。这个库的语法非常简单明了。因此,属于科学和非科学背景的用户都可以轻松使用它。
安装方法
pip install pattern
例子
from pattern.en import sentiment
情感评分和主观性已经作为输出返回。
给定句子的情感分数是0.75,这意味着它是一个高度积极的句子。主观性0.8意味着给定句子是用户的个人意见。
2.Eli5
Eli5 是一个有用的Python库,它是用来调试和检查机器学习分类器并解释这些分类器的预测结果。它支持各种机器学习包和框架,如Keras 、scikit-learn 、LightGBM 、XGBoost 、CatBoost 等。
使用这个库有两种方法来理解机器学习模型。
- 通过分析模型的权重来了解模型的
global性能。 - 通过分析单个样本的预测来了解模型的
local性能。
安装方法。
pip install eli5
3.CatBoost
在Python中,CatBoost 是由Yandex公司开发的一种开源机器学习算法。CatBoost由两个词组成,Category和Boosting。
这个库可以用来处理不同类别的数据,如图像、文本、音频和其他分类数据。Boost是指这个库是基于梯度提升库的,与其他提升算法如XGBoost的工作原理相同。
这个库的优点是无需调整参数就能提供很高的精度,而且它还提供GPU支持以加快训练速度。
安装方法
pip install catboost
例子
import numpy as npfrom catboost import CatBoost, Pool
这就是我们如何使用这个算法来进行预测。
4.Bokeh
Bokeh 是Python中的一个数据可视化库,用于创建交互式图表、绘图和图形。这个库的输出和可视化可以用于各种媒介,如Notebook、HTML和Flask,以及基于Django的网络应用。
通过Boken,我们可以创建各种可视化,从简单的图到复杂和高端的仪表盘。它还可以让我们在不写JavaScript代码的情况下创建由JavaScript驱动的可视化效果。
安装方法
pip install bokeh
例子
from bokeh.plotting import figure, output_notebook, show
输出


图片由作者提供
用Bokeh进行可视化是相当简单和直接的。
5.StatsModels
这个StatsModels 库是对数据进行统计分析的最有用的模块之一。这个库允许用户执行统计测试和探索数据。
这个库是建立在Numpy和Scipy库之上的。如果你想对数据进行统计分析和估计统计模型,这个库是一个很好的工具。
安装方法
pip install statsmodels
例子
import numpy as npimport statsmodels.api as sm
输出


6.SpaCy
spaCy 是一个Python的开源库,用于分析和处理数据的自然语言处理。它有很多内置功能,因为它是用Cython编写的。它有用户友好的API,使用起来非常简单。
安装方法
pip install -U pip setuptools wheel
例子
我们将通过一个语篇标签的例子来看看spaCy的运行情况。语音部分或PoS标签是自然语言处理中的一项常见任务。
import spacy nlp = spacy.load('en_core_web_sm')
输出
Apple --> PROPN is --> AUX the --> DET first --> ADJ U.S. --> PROPN public --> ADJ company --> NOUN to --> PART reach --> VERB a --> DET $ --> SYM 1 --> NUM trillion --> NUM market --> NOUN value --> NOUN
结论
这篇文章就讲到这里。在这篇文章中,我们讨论了一些不是很流行但对执行特定任务很有用的Python库。
这些库对于那些对Python编程和它的库没有太多接触,但想执行特定任务的人来说也很方便。由于这些库的语法简单明了,因此对他们来说是很方便的。
谢谢你的阅读!