《Python数据分析》之查看数据

124 阅读2分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第25天


  • DA1 用pandas查看牛客网用户数据

image.png

参考代码如下:

import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.head(6))

需了解的知识点:
pandas是python的一个数据库,在使用数据库的时候需要输入 import pandas as pd 引入,
df = pd.read.csv("文件路径"):这是利用pandas数据库读取CSV文件的方法,如果读取EXCEL文件或者其他文件,csv文件换成其他文件的格式。
df.dtypes:如果在文件中有字符型数据返回object
df.head(n):表示将前n行数据显示出来,默认是显示前五行
df.tail(n):表示将后n行数据显示出来,默认后五行


  • DA2 牛客网用户数据集的大小

image.png

参考代码如下:

import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.shape)

shape函数的作用是查看行数和列数
其功能是查看数据集的大小,返回行列元素个数 换个思路;这样来做也是可以的:
a = len(Nowcoder)
b = len(Nowcoder.columns)
print((a,b))


  • DA3 牛客网的第10位用户

image.png

参考代码如下:

import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.loc[10])

解析:

  • loc :  Selection by Label ,按标签取数据, 
    loc[行索引,列名/column]
    (如果第二个参数的个数是全部即 : ,可以省略不写)。
    例: print(df.loc[1,'name'])    # 索引1(行),名为‘name’的列\
  • iloc :  Selection by Position,即按位置选择只接受整型参数。
    不接受列字段名称作为参数,只支持列字段的位置索引作为参数。
    iloc[行索引,列索引](没有逗号及以后就是默认列为所有列)
    例: print(df.iloc[1,0])   # 第2行第1列的值
  • DA4 统计牛客网部分用户使用语言

image.png

import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
#print(Nowcoder.iloc[10:20,5])
print(Nowcoder.loc[10:20,'Language'])  #loc[行索引,列名/column]