pandas的使用①--环境、数据结构与I/O

pandas环境基础:Anaconda里的jupyter notebook + Python 3.7的运行环境
数据地址: 某百度网盘链接,暂时没放出来
推荐学习地址: Bilibili大学,本校课程,出版书...

话不多说,直接开整

Pandas的安装

首先需要下载Anaconda, www.anaconda.com. 接着打开Jupyter Notebook,新建一个Python3笔记本,在命令行输入 pip install pandas或是conda install pandas,即可完成pandas的安装,这里也需要安装一下我们还会用的两个包:numpy和matplotlib,同样输入pip install numpy/conda install numpy和pip install matplotlib/conda install matplotlib就能完成这些包的安装了.

数据结构

Pandas数据结构Series：基本概念及创建
Pandas数据结构Series：索引
Pandas数据结构Series：基本技巧
Pandas数据结构Dataframe：基本概念及创建
Pandas数据结构Dataframe：索引
Pandas数据结构Dataframe：基本技巧

”一维数组“ Serise

1.基本概念及创建

基本概念: Series是一种类似于一维数组的对象，它由一组数据（不同数据类型,即整数，字符串，浮点数，Python对象等）以及一组与之相关的数据标签（即索引）组成。 series可以看作是一个自带索引index的数组 → 一维数组 + 对应索引。 series和dict相比，更像一个有顺序的字典（dict本身不存在顺序），其索引原理与字典相似（一个用key，一个用index）

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#导入需要的包

创建

 #series的创建
 s0 = pd.Series([1,2,'a','b']  
 #输出s0
 s0

截屏2021-09-23 下午12.21.08.jpg 左边是索引,右边为数据

2.索引

索引获取

s0.index
s0.values

截屏2021-09-23 下午12.29.25.jpg 可以看到,这里s0的索引类型是范围索引

标签索引

s1 = pd.Series([1, 2, 'a','b'], index=['x','y','m','n'])
s1

截屏2021-09-23 下午12.31.32.jpg

3.基本技巧

                   --未待完续--

哈哈

嘿嘿嘿

机器学习基础之pandas的使用①

pandas的使用①--环境、数据结构与I/O

Pandas的安装

数据结构

”一维数组“ Serise