携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第 16 天,点击查看活动详情
Python 是一种用于进行数据分析的出色语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。Pandas就是其中之一,它使导入和分析数据变得更加容易。
可以在 pandas 系列上执行一些重要的数学运算,以简化使用 Python 进行数据分析并节省大量时间。
要获取使用的数据集,请单击此处。
s=read_csv("stock.csv", squeeze=True)
#reading csv file and making series
功能 | 用法 |
---|---|
s.sum() | 返回系列中所有值的总和 |
s.mean() | 返回系列中所有值的平均值。等于 s.sum()/s.count() |
s.std() | 返回所有值的标准差 |
s.min() 或 s.max() | 从系列中返回最小值和最大值 |
s.idxmin() 或 s.idxmax() | 返回系列中最小值或最大值的索引 |
s.median() | 返回所有值的中位数 |
s.mode() | 系列的返回模式 |
s.value_counts() | 返回具有每个值频率的序列 |
s.describe() | 根据传递的数据的 dtype 返回一系列信息,如均值、模式等 |
代码#1:
# 导入 pandas 以读取 csv 文件
import pandas as pd
# 读取 csv 文件
s = pd.read_csv("stock.csv", squeeze = True)
#使用 count 功能
print(s.count())
#使用 sum 功能
print(s.sum())
#使用 mean 功能
print(s.mean())
#计算平均值
print(s.sum()/s.count())
#使用 std 功能
print(s.std())
#使用 min 功能
print(s.min())
#使用 max 功能
print(s.max())
#使用 count 功能
print(s.median())
#使用 mode 功能
print(s.mode())
输出:
3012
1006942.0
334.3100929614874
334.3100929614874
173.18720477113115
49.95
782.22
283.315
0 291.21
代码#2:
# 导入 pandas 以读取 csv 文件
import pandas as pd
#读取 csv 文件
s = pd.read_csv("stock.csv", squeeze = True)
#使用 describe 功能
print(s.describe())
#使用 count 功能
print(s.idxmax())
#使用 idxmin 功能
print(s.idxmin())
#值为 3 的元素的计数
print(s.value_counts().head(3))
输出:
dtype : float64
count 3012.000000
mean 334.310093
std 173.187205
min 49.950000
25% 218.045000
50% 283.315000
75% 443.000000
max 782.220000
Name: Stock Price, dtype: float64
3011
11
291.21 5
288.47 3
194.80 3
Name: Stock Price, dtype: int64
意外输出和限制:
- .sum()、.mean()、.mode()、.median() 和其他此类数学运算不适用于字符串或除数值以外的任何其他数据类型。
- 字符串系列上的 .sum() 会给出意外的输出,并通过连接每个字符串返回一个字符串。
本篇文章到此就结束了,相关文章:
- Python 教程之数据分析(1)—— 使用 Bokeh 进行数据可视化
- Python 教程之数据分析(2)—— 探索性数据分析
- Python 教程之数据分析(3)—— Python中不同图表的数据可视化
- Python 教程之数据分析(4)—— 使用 Python 进行数据分析和可视化 | 第 1 套
- Python 教程之数据分析(5)—— 使用 Python 进行数据分析和可视化 | 第 2 套
感谢大家的阅读,有什么问题的话可以在评论中告诉我。希望大家能够给我来个点赞+收藏+评论 ,你的支持是海海更新的动力!后面我会持续分享前端 & 后端相关的专业知识。