如何提取数据?

3 阅读4分钟

一:给 ai 的结果怎么样?

Pasted image 20260323214506.png

二:问答区

①我需要怎么操作?三部曲 我准备好了现成的提示词可以直接用以及如何训练你自己的提示词

  (1.上传你需要的提取数据的图片)+(2.提示词给 ai )
    

Pasted image 20260323220956.png

(3.下载 csv 格式导入 excel 或者直接复制粘贴到 excel)

Pasted image 20260323222539.png

③我已经做好的成品的提示词(promt)如下:

提示词内容:

你需要处理一张包含「总线设备检查信息」的屏幕截图 / 表格图片,严格按照以下规则输出:

  1. 标题要求

    • ### 总线设备检查信息 作为标题(若图片有其他标题则沿用图片原标题)。
  2. 表格提取规则

    • 必须使用 Markdown 表格 格式呈现数据。

    • 表头必须与图片中的列名完全一致(如:编码二次码设备类型/特性注释信息)。

    • 逐行识别图片中的每一行数据,确保:

      • 编码、二次码、设备类型 / 特性、注释信息 100% 与图片文字一致,无错字、漏字、顺序颠倒。
      • 不遗漏任何一行数据,不添加任何图片中不存在的行。
    • 表格排版整齐,列对齐清晰,无空行、无多余符号。

  3. 底部状态信息规则

    • 若图片底部有状态文字(如 “自动禁止手动允许喷洒允许监控状态”):

      • 在表格后添加 --- 分割线。
      • 加粗 格式完整展示该状态文字,内容与图片完全一致。
    • 若图片无底部状态文字,则省略此部分。

  4. 额外约束

    • 不解释任何数据含义,不添加任何无关内容(如分析、备注、建议等)。
    • 仅做信息提取与格式整理,输出必须简洁、专业、可直接复用。

输入图片后,AI 应输出类似以下格式的内容:

### 总线设备检查信息

| 编码 | 二次码 | 设备类型/特性 | 注释信息 |
|------|--------|----------------|----------|
| N031 | 911031 | 点型感温 A1R   | 负一层茶餐厅 |
| N033 | 911033 | 手动按钮 02  | 负一层茶餐厅 |
| N034 | 911034 | 手动按钮 02  | 负一层茶餐厅 |
| N035 | 911035 | 手动按钮 02  | 负一层茶餐厅 |
| N037 | 911037 | 讯响器 电平    | 负一层茶餐厅 |
| N038 | 911038 | 讯响器 电平    | 负一层茶餐厅 |
| N039 | 911039 | 讯响器 电平    | 负一层茶餐厅 |
| N040 | 911040 | 消火栓 电平    | 负一层茶餐厅 |
| N041 | 911041 | 消火栓 电平    | 负一层茶餐厅 |
| N042 | 911042 | 消火栓 电平    | 负一层茶餐厅 |

---
**自动禁止 手动允许 喷洒允许 监控状态**

②如果我有其他不一样的图片需要给豆包进行识别,我需不需要换提示词?

答:需要。但是整体的思路不变。

给 ai 描述你的需求和效果是什么?---->让ai消化你的内容-------->让ai向你提问,去补充完成工作需要的信息---->生成提示词
拿到提示词就ok了。直接发送图片和提示词给ai就行了

③我应该如何正确的问 ai 训练出属于自己的提示词 prompt ??:

模板如下:

  1. 目前已知的所有信息如下:我有大量的图片,图片里面有很多的业务数据。

  2. 我是这个领域的小白,但是我想达到:提取图片里面的数据,你生成对应的表格,我下载成 csv 格式然后导入 excel 的效果,这是我的原始想法和参考素材,请你不要先生成内容,先消化这些信息

  3. 基于你刚才理解的,如果我需要完成这个任务,你需要我补充哪些背景和哪些信息,或者利用你自身的知识,帮我把这些大白话翻译成结构清晰且逻辑严密的 promt.

三:视频版

如下: