机器学习基础之pandas的使用①

129 阅读2分钟

pandas的使用①--环境、数据结构与I/O

  • pandas环境基础:Anaconda里的jupyter notebook + Python 3.7的运行环境

  • 数据地址: 某百度网盘链接,暂时没放出来

  • 推荐学习地址: Bilibili大学,本校课程,出版书...

话不多说,直接开整

Pandas的安装

首先需要下载Anaconda, www.anaconda.com. 接着打开Jupyter Notebook,新建一个Python3笔记本,在命令行输入 pip install pandas或是conda install pandas,即可完成pandas的安装,这里也需要安装一下我们还会用的两个包:numpy和matplotlib,同样输入pip install numpy/conda install numpypip install matplotlib/conda install matplotlib就能完成这些包的安装了.

数据结构

  • Pandas数据结构Series:基本概念及创建
  • Pandas数据结构Series:索引
  • Pandas数据结构Series:基本技巧
  • Pandas数据结构Dataframe:基本概念及创建
  • Pandas数据结构Dataframe:索引
  • Pandas数据结构Dataframe:基本技巧

”一维数组“ Serise

1.基本概念及创建

  • 基本概念: Series是一种类似于一维数组的对象,它由一组数据(不同数据类型,即整数,字符串,浮点数,Python对象等)以及一组与之相关的数据标签(即索引)组成。 series可以看作是一个自带索引index的数组 → 一维数组 + 对应索引。 series和dict相比,更像一个有顺序的字典(dict本身不存在顺序),其索引原理与字典相似(一个用key,一个用index)
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#导入需要的包
  • 创建
 #series的创建
 s0 = pd.Series([1,2,'a','b']  
 #输出s0
 s0 

截屏2021-09-23 下午12.21.08.jpg 左边是索引,右边为数据

2.索引

  • 索引获取
s0.index
s0.values

截屏2021-09-23 下午12.29.25.jpg 可以看到,这里s0的索引类型是范围索引

  • 标签索引
s1 = pd.Series([1, 2, 'a','b'], index=['x','y','m','n'])
s1

截屏2021-09-23 下午12.31.32.jpg

3.基本技巧

                   --未待完续--

哈哈

嘿嘿嘿