携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第20天,点击查看活动详情
📢📢📢📣📣📣
哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10年DBA工作经验
中国DBA联盟(ACDU)成员,目前从事DBA及程序编程😜😜😜
擅长Oracle、MySQL、PG 运维开发,备份恢复,安装迁移,性能优化、故障应急处理。
❤️❤️❤️感谢各位大可爱小可爱!❤️❤️❤️
前言
Python实际针对数据分析的学习是库,用库来解决一系列的数据分析问题🐴 DA24 去掉信息不全的用户
🚀 描述
现有牛客网12月每天练习题目情况的数据集nowcoder.csv。包含如下字段(字段之间用逗号分隔):
user_id:用户id
question_id:问题编号
result:运行结果
date:练习日期
请你统计2021年12月每天练习题目的数量。
📖 输入描述
数据集可以直接从当前目录下nowcoder.csv读取。
📖 输出描述:
以上数据集的输出结果如下:
🍌🍌 答案
import pandas as pd
nowcoder = pd.read_csv('nowcoder.csv', parse_dates=True, index_col='date')
print(nowcoder.groupby(by='date')['question_id'].count())
🐴 DA30 牛客网用户练习的平均次日留存率
🚀 描述
现有牛客网12月每天练习题目情况的数据集nowcoder.csv。包含如下字段(字段之间用逗号分隔):
user_id:用户id
question_id:问题编号
result:运行结果
date:练习日期
现需要查看用户在某天练习后第二天还会再来练习的留存情况,请计算用户练习的平均次日留存率。
📖 输入描述
数据集可以直接从当前目录下nowcoder.csv读取。
📖 输出描述: 以上数据集中某天练习后第二天还会再来的用户数除以user_id总次数(不考虑重复情况)记为平均此日留存率,结果保留两位小数。
🍌🍌 答案
import pandas as pd
from datetime import timedelta
nowcoder = pd.read_csv('nowcoder.csv')
total_id = nowcoder['user_id'].count()
b=pd.merge(nowcoder,nowcoder,on='user_id')
b['date_x']=pd.to_datetime(b.date_x).dt.date
b['date_y']=pd.to_datetime(b.date_y).dt.date
b['differ']=b.date_y-b.date_x
sum_diff=b[b.differ=='1 days'].differ.count()
res=round(sum_diff/total_id,2)
print(res)
🐴 DA31 牛客网每日正确与错误的答题次数
🚀 描述
现有牛客网12月每天练习题目的数据集nowcoder.csv。包含如下字段(字段之间用逗号分隔):
user_id:用户id
question_id:问题编号
result:运行结果
date:练习日期
请你统计2021年12月答题结果正确和错误的前提下每天的答题次数
📖 输入描述
数据集可以直接从当前目录下nowcoder.csv读取。
📖 输出描述:
以上数据集的输出结果如下:
🍌🍌 答案
import pandas as pd
nowcoder = pd.read_csv('nowcoder.csv')
nowcoder.rename(columns={'date':'year-month-day'}, inplace=True)
df = nowcoder.groupby(['result', 'year-month-day'])['question_id'].count()
print(df)
🐴 DA32 牛客网答题正误总数
🚀 描述
现有牛客网12月每天练习题目的数据集nowcoder.csv。包含如下字段(字段之间用逗号分隔):
user_id:用户id
question_id:问题编号
result:运行结果
date:练习日期
请你统计答对和答错的总数分别是多少。
📖 输入描述
数据集可以直接从当前目录下nowcoder.csv读取。
📖 输出描述: 以上数据集的输出结果如下:
🍌🍌 答案
import pandas as pd
nowcoder = pd.read_csv('nowcoder.csv')
df = nowcoder.groupby(['result'])['question_id'].count()
print(df)
🐴 DA33 牛客网连续练习题目3天及以上的用户
🚀 描述
现有牛客网12月每天练习题目的数据集nowcoder.csv。包含如下字段(字段之间用逗号分隔):
user_id:用户id
question_id:问题编号
result:运行结果
date:练习日期
请你统计2021年12月连续练习题目3天及以上的所有用户。
📖 输入描述
数据集可以直接从当前目录下nowcoder.csv读取。
📖 输出描述:
输出连续3天及以上的用户及对应的连续天数,以上数据集的输出结果如下
🍌🍌 答案
import pandas as pd
from datetime import timedelta
nowcoder = pd.read_csv('nowcoder.csv')
df = nowcoder.groupby('user_id')["user_id"].count()
df = df[df>=3]
print(df)