实战 0~1 用GPT打工系列 数据清洗实践:从杂乱无章到井然有序的产品目录

504 阅读1分钟

GPT新增Code Interpreter功能后,一直没有机会实战一下,刚好需要把手上的一份产品Catalog整理归类并添加销售价格,一起来看看$20/月的GPT打工仔能否胜任

工作总结(GPT生成)

1. 任务描述: 用户提供了一个包含多种产品的Excel目录,每个产品的信息包括图片、产品名称、容量和盒子数量。用户希望从此目录中提取并整理所有的产品名称和描述信息。

2. 执行步骤

  • 打开并查看提供的Excel文件,了解其结构。
  • 根据用户提供的信息和数据的观察,设计并应用策略提取产品信息。
  • 通过多次迭代和优化,确保提取的信息准确无误。
  • 将提取的信息保存为新的Excel文件供用户检查。

3. 结果: 成功从原始目录中提取了产品名称、容量和盒子数量,并保存为一个新的Excel文件。

总结一下,经过几次的交互,数据最终完美提取出来,但还没有完成询价的任务,询价需要借用其他gpt plugin来实现

最终整理出来的产品有576个,源Excel大概有2.5兆,所有内容都放在一个sheet,并且是混合排版,图片/文字,还有大量的合并行,合并列,软回车符号。附上源文件内容:Excel Preview

和GPT交互过程,我以截图的方式展现