pandas的使用①--环境、数据结构与I/O
-
pandas环境基础:Anaconda里的jupyter notebook + Python 3.7的运行环境
-
数据地址: 某百度网盘链接,暂时没放出来
-
推荐学习地址: Bilibili大学,本校课程,出版书...
话不多说,直接开整
Pandas的安装
首先需要下载Anaconda, www.anaconda.com.
接着打开Jupyter Notebook,新建一个Python3笔记本,在命令行输入 pip install pandas或是conda install pandas,即可完成pandas的安装,这里也需要安装一下我们还会用的两个包:numpy和matplotlib,同样输入pip install numpy/conda install numpy和pip install matplotlib/conda install matplotlib就能完成这些包的安装了.
数据结构
- Pandas数据结构Series:基本概念及创建
- Pandas数据结构Series:索引
- Pandas数据结构Series:基本技巧
- Pandas数据结构Dataframe:基本概念及创建
- Pandas数据结构Dataframe:索引
- Pandas数据结构Dataframe:基本技巧
”一维数组“ Serise
1.基本概念及创建
- 基本概念: Series是一种类似于一维数组的对象,它由一组数据(不同数据类型,即整数,字符串,浮点数,Python对象等)以及一组与之相关的数据标签(即索引)组成。 series可以看作是一个自带索引index的数组 → 一维数组 + 对应索引。 series和dict相比,更像一个有顺序的字典(dict本身不存在顺序),其索引原理与字典相似(一个用key,一个用index)
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#导入需要的包
- 创建
#series的创建
s0 = pd.Series([1,2,'a','b']
#输出s0
s0
左边是索引,右边为数据
2.索引
- 索引获取
s0.index
s0.values
可以看到,这里s0的索引类型是范围索引
- 标签索引
s1 = pd.Series([1, 2, 'a','b'], index=['x','y','m','n'])
s1
3.基本技巧
--未待完续--
哈哈
嘿嘿嘿