医院供应链智能化:AI图片识别批量提取医疗器械铭牌信息实战

0 阅读7分钟

随着人工智能技术的发展,特别是深度学习和计算机视觉的突破,医疗器械的铭牌识别已经迈入了批量自动化时代。这不仅极大地提升了医疗物资的管理效率,更为手术安全和患者权益筑起了一道技术屏障。本文就是来解决如何借助AI工具来解决一键批量识别  “医疗器械铭牌” 的信息。

一、需求引入

有一批 “医疗器械铭牌” 图片, 需要批量去识别提取一些关键信息到excel表格,案例图片如下:

需要提取的结果如下:

也就是需要提取图片上的 “设备名称识别,设备型号识别,生产日期识别,生产厂家识别,使用年限识别,报废时间计算,设备序列号识别,医疗器械注册证号” 。

如果是一张图片,我们用人工处理就行了, 但如果有上百个图片,那就跟着我往下面看,如何解决。

二、解决方案详解

这是一个专业AI批处理的解决方案, 支持本地断网使用模型。 首先在主界面上找到 Excel AI批处理:

可以到我们宫中*&^浩:“老罗软件” , 获取到这个解决方案。 打开后, 我们找到 “文件AI提取 这个智能体:

首先我们需要设置一个AI模型,点击右上角可以设置对应的模型,这里推荐DeepSeek ,如果你需要断网使用,那就用本地模型,但是本地模型可能提取效果不佳,就需要自己不断微调提示词。

设置好模型之后,我们点击文件,输入你要处理的 “医疗器械铭牌” 图片文件。

然后点击提示词图标, 选择到提示词:

然后下拉选中 “AI自定义提取” , 输入自己的提示词。

下面我将用一个章节来详细讲解提示词。

三、提示词详解

提示词可以用豆包来直接生成,我下面已经生成了一个提示词了,你可以参考,如下:

帮我根据下面的规则提取字段:“设备名称识别,设备型号识别,生产日期识别,生产厂家识别,使用年限识别,报废时间计算,设备序列号识别,医疗器械注册证号”。

规则如下:

一、设备名称识别
**规则:**
1. 识别设备法定名称,优先采用铭牌标注的完整名称
2. 遵循《医疗器械分类目录》标准术语(如:"数字减影血管造影系统")
3. 保留品牌名与技术标识(如:"西门子SOMATOM Force 双源CT")

**输出示例:**  
全自动生化分析仪 AU5800

二、设备型号识别
**规则:**
1. 完整提取型号所有字符(含空格/连字符/特殊符号)
2. 区分大小写(如"iCT 256" ≠ "ICT256")
3. 多型号标注需完整记录(如:"主机型号ABC-123,探头型号DEF-456")

**输出示例:**  
Mindray Resona I9

三、生产日期识别
**转换规则表:**

| 原始格式     | 标准格式      | 处理原则               |
|--------------|---------------|------------------------|
| 15/04/2023   | 2023-04-15    | 日月年转年月日         |
| MAR 2022     | 2022-03-01    | 无具体日时默认当月首日 |
| 2025.12      | 2025-12-01    | 补充最低位日期         |

**输出示例:**  
2023-07-01(原始标注:Jul/2023)

四、生产厂家识别
**标注规范:**
1. 中英文对照需完整保留(例:深圳迈瑞生物医疗电子股份有限公司/Shenzhen Mindray Bio-Medical Electronics Co., Ltd.)
2. 区分制造商与注册人(格式:"制造商:A公司,注册人:B集团")
3. OEM设备需标注原始生产商(例:"华为技术有限公司(代工方:富士康科技集团)")

**输出示例:**  
GE Medical Systems, LLC(通用电气医疗系统有限公司)
五、使用年限识别
**推断优先级:**
1. 铭牌直接标注 > 注册证有效期 > 行业强制标准 > 制造商建议
2. 特殊设备参照标准:
   - 大型影像设备:8-10年
   - 生命支持类设备:5-7年 
   - 高风险植入器械:按单次使用计

**输出示例:**  
7年(依据《医疗器械使用期限指导原则》第5.2条)

---

六、报废时间计算
**计算公式:**  
报废日期 = 生产日期 + 使用年限(精确到日)

**特殊情形处理:**
- 跨年度计算时考虑闰年(例:2020-02-29 +1年=2021-02-28)
- 无具体生产日期时默认当年7月1日(医疗器械行业惯例)

**输出示例:**  
2030-06-30(生产日期2023-06-30,使用年限7年)

---
七、设备序列号识别
**防误判措施:**
1. 易混淆字符验证(如:Z/2、B/8、O/0)
2. 多码关联时标注层级关系:
   ```
   设备序列号:SN-2023A0875
   └─主机编号:MT-2023A0875-01
   └─配件编号:AC-2023A0875-02
  └─出厂编号:2025-2023
   ```
3. 加密二维码需备注(例:"序列号:*****(详见加密二维码区域)")

**输出示例:**  
PHX-CT2023#7A8B9C
八,医疗器械注册证号
1.医疗器械注册证号(如 “豫械注准 20222070XXX”“国械注进 2021307XXXX”,需完整提取字母、数字及符号)
2.格式合规校验:
注册证号:按国家药监局编码规则验证(如 “国械注准 + 4 位年号 + 1 位产品管理类别 + 4 位产品分类编码 + 4 位首次注册流水号”),若识别错误(如数字 “0” 与字母 “O” 混淆、“1” 与 “I” 混淆),自动列出疑似错误项并提示用户确认;
3.信息完整性提示:若未识别到关键信息(如注册证号、序列号),在结果中用 “【未识别到】” 标注,并提示用户 “建议补充拍摄铭牌 XX 区域(如右上角注册信息区)以完善数据”。

如果你不想拿上面的提示词,也可以直接这样向豆包索要提示词:

四、提示词编写关键总结

编写提示词时,需要注意下面几点:

  1. 提示词首先需要描述清晰要提取哪些字段,这些字段会在excel的表格里面变成标题列。
  2. 需要分别描述清晰每一个字段的具体规则,最好列出案例。
  3. 当结果效果不佳时,请看 “OCR可信度”字段,如果值很高,则就是你的提示词的问题,需要不断微调提示词。

五、信息安全

用户数据是绝对安全的, 软件执行是由2个步骤组成:
1. OCR图片识别: 将图片上的文字进行识别,是由本地大模型来进行AI识图的,不进行网络传输数据,断网也可以识别。
2. 信息提取:  这个也支持本地文本大模型,但是效果可能不佳,也支持联网deepseek等,但是需要将OCR结果传递到deepseek官方。

六、结语

感谢大家,我们正处在AI高速发展的时代,AI不仅仅可以用来娱乐,也能催生很多软件,帮我们大大提高生产力, “鲸闲办公”就是借助AI专门来解决批量办公问题的。希望大家多提意见,让我们做的更好,祝您生活愉快。