识别一张分子检查报告单,所有大模型都败北了

33 阅读3分钟

做一个需求,帮客户识别患者的检查报告,想用视觉大模型;开始用的是千问开源模型,不太行;然后又改用了千问 的付费模型,还是不太行;今天几乎把所有的的大模型都试了一下,都不太行,这个任务这么难吗?

哎——,叹声气,先记录一下……

有做模型的能解释一下吗,是因为大量看似无意义的基因位点编号干扰了模型,让它以为是乱码?

报告单是这样(个人隐私信息已经打码)的:

image.png

阿里云 qwen-qvq-max

千问的所有视觉模型,我都试过了,就没有能识别对60%的,还有吃了炫迈根本停不下来的情况……

image.png

元宝识别结果:

直接偷懒,没能输出完全基因位点名

image.png

Kimi是最勤快的

注意进度条,完全停不下来...

image.png

努力10分钟,还在继续努力,是个勤奋的孩子:

image.png

百度的

我只能说,不知道是什么鬼……

# 分子检测报告单

‌**病理号**‌‌**原病理号**‌‌**姓名**‌:(未提供)  
‌**性别**‌:男  
‌**送检医院**‌‌**送检科室**‌‌**收到日期**‌‌**住院号**‌
‌**标本部位**‌:右额及右岛叶  
‌**临床诊断**‌:颅内占位性病变,症状性癫痫

## 检测内容

### 基因点突变、插入、缺失检测
- 共检测173个基因,包括但不限于:AKT3, APC, ARID1A, ARID1B, ASCL1, ATM, ATRX, BAP1, ACVR1, AHNAK, AKT1, CDC42EP1, CD79A, BCOR, BCORL1, BRAF, BRCA1, BRCA2, CARD11, CCM2, CCND1, CDK4, CDK6, CDKN2A, CHEK2, CIC, CREBBP, CTDNEP1, CTNNB1, CYSLTR2, DAXX, DCC, DDR1, EPCAM, ERBB2, DDX3X, DEPDC5, DGCR8, DICER1, DROSHA, EED, EGFR, ELP1, EP300, GLI2, EZH2, FBXW7, FGFR1, FGFR2, FGFR3, FGFR4, FUBP1, GFI1, GFI1B, GLI1, GLI3, GNA11, GNAQ, GNAS, H3-3A, H3-3B, H3C12, H3C14, H3C2, H3C6, H3C8, KMT2C, KMT2D, H3C3, HSPG2, IDH1, IDH2, KBTBD4, KDM6A, KIT, KLF4, KLLN, KMT5B, KRAS, KRIT1, LATS1, LATS2, LZTR1, MAP2K1, MAP2K2, MAPK1, MDM2, MDM4, MYC, MYCL, MEN1, MET, MLH1, MSH2, MSH3, MSH6, MTOR, MYB, MYBL1, PALB2, MYCN, MYD88, NF1, NF2, NOTCH1, NPRL2, NPRL3, NRAS, NTRK2, NTRK3, PMS1, PARP1, PBRM1, PDCD10, PDGFRA, PEG3, PIK3CA, PIK3CB, PIK3R1, PIM1, PLCB4, POU2F2, PPM1D, PRDM1, PRDM6, PRKAR1A, PRKCA, PTCH1, PMS2, POLD1, POLE, POLR2A, PTCH2, PTEN, PTK2, PTPN11, QKI, RAF1, RB1, RBM10, RELA, RET, RHEB, SDHB, SDHD, SEC23B, SLC35A2, SMARCA1, SMARCA2, SMARCA4,

image.png

智谱清言

也有大量错误,但是应该是效果最好的……

image.png

chatGPT

错得也挺多的,看来国外的和尚也不太会文本识别😄

image.png

Claude 3.7 Snonet

AI编程的扛把子,当红榨汁机,也还是不行,直接摆烂……

image.png