识别一张分子检查报告单，所有大模型都败北了报告单是这样（个人隐私信息已经打码）的：阿里云 qwen-qvq-max 元

做一个需求，帮客户识别患者的检查报告，想用视觉大模型；开始用的是千问开源模型，不太行；然后又改用了千问的付费模型，还是不太行；今天几乎把所有的的大模型都试了一下，都不太行，这个任务这么难吗？

哎——，叹声气，先记录一下……

有做模型的能解释一下吗，是因为大量看似无意义的基因位点编号干扰了模型，让它以为是乱码？

报告单是这样（个人隐私信息已经打码）的：

阿里云 qwen-qvq-max

千问的所有视觉模型，我都试过了，就没有能识别对60%的，还有吃了炫迈根本停不下来的情况……

元宝识别结果：

直接偷懒，没能输出完全基因位点名

Kimi是最勤快的

注意进度条，完全停不下来...

努力10分钟，还在继续努力，是个勤奋的孩子：

百度的

我只能说，不知道是什么鬼……

# 分子检测报告单

&zwnj;**病理号**&zwnj;：
&zwnj;**原病理号**&zwnj;：
&zwnj;**姓名**&zwnj;：（未提供）  
&zwnj;**性别**&zwnj;：男  
&zwnj;**送检医院**&zwnj;：
&zwnj;**送检科室**&zwnj;：
&zwnj;**收到日期**&zwnj;：
&zwnj;**住院号**&zwnj;
&zwnj;**标本部位**&zwnj;：右额及右岛叶  
&zwnj;**临床诊断**&zwnj;：颅内占位性病变，症状性癫痫

## 检测内容

### 基因点突变、插入、缺失检测
- 共检测173个基因，包括但不限于：AKT3, APC, ARID1A, ARID1B, ASCL1, ATM, ATRX, BAP1, ACVR1, AHNAK, AKT1, CDC42EP1, CD79A, BCOR, BCORL1, BRAF, BRCA1, BRCA2, CARD11, CCM2, CCND1, CDK4, CDK6, CDKN2A, CHEK2, CIC, CREBBP, CTDNEP1, CTNNB1, CYSLTR2, DAXX, DCC, DDR1, EPCAM, ERBB2, DDX3X, DEPDC5, DGCR8, DICER1, DROSHA, EED, EGFR, ELP1, EP300, GLI2, EZH2, FBXW7, FGFR1, FGFR2, FGFR3, FGFR4, FUBP1, GFI1, GFI1B, GLI1, GLI3, GNA11, GNAQ, GNAS, H3-3A, H3-3B, H3C12, H3C14, H3C2, H3C6, H3C8, KMT2C, KMT2D, H3C3, HSPG2, IDH1, IDH2, KBTBD4, KDM6A, KIT, KLF4, KLLN, KMT5B, KRAS, KRIT1, LATS1, LATS2, LZTR1, MAP2K1, MAP2K2, MAPK1, MDM2, MDM4, MYC, MYCL, MEN1, MET, MLH1, MSH2, MSH3, MSH6, MTOR, MYB, MYBL1, PALB2, MYCN, MYD88, NF1, NF2, NOTCH1, NPRL2, NPRL3, NRAS, NTRK2, NTRK3, PMS1, PARP1, PBRM1, PDCD10, PDGFRA, PEG3, PIK3CA, PIK3CB, PIK3R1, PIM1, PLCB4, POU2F2, PPM1D, PRDM1, PRDM6, PRKAR1A, PRKCA, PTCH1, PMS2, POLD1, POLE, POLR2A, PTCH2, PTEN, PTK2, PTPN11, QKI, RAF1, RB1, RBM10, RELA, RET, RHEB, SDHB, SDHD, SEC23B, SLC35A2, SMARCA1, SMARCA2, SMARCA4,

智谱清言

也有大量错误，但是应该是效果最好的……

chatGPT

错得也挺多的，看来国外的和尚也不太会文本识别😄

Claude 3.7 Snonet

AI编程的扛把子，当红榨汁机，也还是不行，直接摆烂……