携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第25天
- DA1 用pandas查看牛客网用户数据
参考代码如下:
import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.head(6))
需了解的知识点:
pandas是python的一个数据库,在使用数据库的时候需要输入 import pandas as pd 引入,
df = pd.read.csv("文件路径"):这是利用pandas数据库读取CSV文件的方法,如果读取EXCEL文件或者其他文件,csv文件换成其他文件的格式。
df.dtypes:如果在文件中有字符型数据返回object
df.head(n):表示将前n行数据显示出来,默认是显示前五行
df.tail(n):表示将后n行数据显示出来,默认后五行
- DA2 牛客网用户数据集的大小
参考代码如下:
import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.shape)
shape函数的作用是查看行数和列数
其功能是查看数据集的大小,返回行列元素个数 换个思路;这样来做也是可以的:
a = len(Nowcoder)
b = len(Nowcoder.columns)
print((a,b))
- DA3 牛客网的第10位用户
参考代码如下:
import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.loc[10])
解析:
- loc : Selection by Label ,按标签取数据,
loc[行索引,列名/column]
(如果第二个参数的个数是全部即:,可以省略不写)。
例: print(df.loc[1,'name']) # 索引1(行),名为‘name’的列\- iloc : Selection by Position,即按位置选择只接受整型参数。
不接受列字段名称作为参数,只支持列字段的位置索引作为参数。
iloc[行索引,列索引](没有逗号及以后就是默认列为所有列)
例: print(df.iloc[1,0]) # 第2行第1列的值
- DA4 统计牛客网部分用户使用语言
import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
#print(Nowcoder.iloc[10:20,5])
print(Nowcoder.loc[10:20,'Language']) #loc[行索引,列名/column]