Python | 练习题 <18>

38 阅读6分钟

题目 1:便利店销售数据统计分析

“便利店销售数据.csv” 包含字段:“订单编号”“销售日期”“商品类别 (零食 / 饮料 / 日用品 / 速食)”“销售数量”“单品单价 (元)”“折扣率 (%)”“支付方式 (微信 / 支付宝 / 现金)”。

请使用 pandas 和 matplotlib 完成以下任务:

  1. 读取 CSV 文件数据,计算订单实际金额(销售数量 × 单品单价 × (1 - 折扣率 / 100)),添加为新列。
  2. 按 “销售日期” 提取小时信息(0-23 时),统计每小时的订单量和平均订单金额。
  3. 计算销售数量的标准差、均值和 80 分位数。
  4. 按商品类别分组,统计每组的总销售额和平均折扣率,绘制柱状图。
  5. 保存折扣率>10% 且商品类别为饮料的订单数据为 “饮料折扣订单.csv”(不含索引)。

分解代码:

请使用 pandas、numpy 和 matplotlib 完成以下任务:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

1. 读取 CSV 文件数据,计算订单实际金额(销售数量 × 单品单价 × (1 - 折扣率 / 100)),添加为新列。

运行结果:

2. 按 “销售日期” 提取小时信息(0-23 时),统计每小时的订单量和平均订单金额。

运行结果:

3. 计算销售数量的标准差、均值和 80 分位数。

运行结果:

4. 按商品类别分组,统计每组的总销售额和平均折扣率,绘制柱状图。

运行结果:

5. 保存折扣率>10% 且商品类别为饮料的订单数据为 “饮料折扣订单.csv”(不含索引)。

运行结果:

完整代码:

题目 2:生鲜电商订单数据分析 “生鲜订单数据.csv” 包含字段:“订单 ID”“下单日期”“品类 (蔬菜 / 水果 / 肉类 / 水产)”“购买重量 (kg)”“单价 (元 /kg)”“配送费 (元)”“是否次日达 (是 / 否)”。

请使用 pandas 和 matplotlib 完成以下任务:

  1. 读取 CSV 文件数据,计算订单总金额(购买重量 × 单价 + 配送费),添加为新列。
  2. 按 “下单日期” 提取月份信息,统计各月份的总购买重量和平均配送费。
  3. 计算购买重量的变异系数(标准差 / 均值)和 95 分位数。
  4. 按品类分组,统计每组的平均订单金额和次日达订单占比,绘制柱状图。
  5. 保存购买重量>5kg 且品类为肉类的订单数据为 “大额肉类订单.csv”(不含索引)。

分解代码:

请使用 pandas、numpy 和 matplotlib 完成以下任务:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

1. 读取 CSV 文件数据,计算订单总金额(购买重量 × 单价 + 配送费),添加为新列。

运行结果:

2. 按 “下单日期” 提取月份信息,统计各月份的总购买重量和平均配送费。

运行结果:

3. 计算购买重量的变异系数(标准差 / 均值)和 95 分位数。

运行结果:

4. 按品类分组,统计每组的平均订单金额和次日达订单占比,绘制柱状图。

运行结果:

5. 保存购买重量>5kg 且品类为肉类的订单数据为 “大额肉类订单.csv”(不含索引)。

运行结果:

完整代码:

题目 3:咖啡店经营数据分析 “咖啡店数据.csv” 包含字段:“订单号”“消费日期”“咖啡类型 (美式 / 拿铁 / 卡布奇诺 / 冷萃)”“杯数”“单杯售价 (元)”“附加费用 (元)”“消费时段 (早 / 中 / 晚)”。

请使用 pandas 和 matplotlib 完成以下任务:

  1. 读取 CSV 文件数据,计算订单总金额(杯数 × 单杯售价 + 附加费用),添加为新列。
  2. 按 “消费日期” 提取星期信息(周一至周日),统计每周各日的订单量和平均杯数。
  3. 计算附加费用的四分位数(25%、50%、75%)和总和。
  4. 按消费时段分组,统计每组的平均订单金额和拿铁咖啡的订单占比,绘制分组柱状图。
  5. 保存咖啡类型为冷萃且消费时段为晚的订单数据为 “晚间冷萃订单.csv”(不含索引)。

分解代码:

请使用 pandas、numpy 和 matplotlib 完成以下任务:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

1. 读取 CSV 文件数据,计算订单总金额(杯数 × 单杯售价 + 附加费用),添加为新列。

运行结果:

**2. 按 “消费日期” 提取星期信息(周一至周日),统计每周各日的订单量和平均杯数。 **

运行结果:

4. 计算附加费用的四分位数(25%、50%、75%)和总和。

运行结果:

5. 按消费时段分组,统计每组的平均订单金额和拿铁咖啡的订单占比,绘制分组柱状图。

运行结果:

6. 保存咖啡类型为冷萃且消费时段为晚的订单数据为 “晚间冷萃订单.csv”(不含索引)

运行结果:

完整代码:

题目 4:宠物用品店销售数据分析 “宠物用品数据.csv” 包含字段:“订单编号”“销售日期”“用品类型 (食品 / 玩具 / 洗护 / 窝具)”“销售数量”“单品价格 (元)”“会员折扣 (%)”“宠物类型 (猫 / 狗 / 其他)”。

请使用 pandas 和 matplotlib 完成以下任务:

  1. 读取 CSV 文件数据,计算订单金额(销售数量 × 单品价格 × (1 - 会员折扣 / 100)),添加为新列。
  2. 按 “销售日期” 提取月份信息,统计各月份的总销量和平均订单金额。
  3. 计算销售数量的标准差、均值和 85 分位数。
  4. 按宠物类型分组,统计每组的总销售额和用品类型为食品的订单占比,绘制并列柱状图。
  5. 保存用品类型为玩具且销售数量≥5 的订单数据为 “宠物玩具批量订单.csv”(不含索引)。

分解代码:

请使用 pandas、numpy 和 matplotlib 完成以下任务:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

1. 读取 CSV 文件数据,计算订单金额(销售数量 × 单品价格 × (1 - 会员折扣 / 100)),添加为新列。

运行结果:

2. 按 “销售日期” 提取月份信息,统计各月份的总销量和平均订单金额。

运行结果:

3. 计算销售数量的标准差、均值和 85 分位数。

运行结果:

4. 按宠物类型分组,统计每组的总销售额和用品类型为食品的订单占比,绘制并列柱状图。

运行结果:

5. 保存用品类型为玩具且销售数量≥5 的订单数据为 “宠物玩具批量订单.csv”(不含索引)。

运行结果:

完整代码: