做一个需求,帮客户识别患者的检查报告,想用视觉大模型;开始用的是千问开源模型,不太行;然后又改用了千问 的付费模型,还是不太行;今天几乎把所有的的大模型都试了一下,都不太行,这个任务这么难吗?
哎——,叹声气,先记录一下……
有做模型的能解释一下吗,是因为大量看似无意义的基因位点编号干扰了模型,让它以为是乱码?
报告单是这样(个人隐私信息已经打码)的:
阿里云 qwen-qvq-max
千问的所有视觉模型,我都试过了,就没有能识别对60%的,还有吃了炫迈根本停不下来的情况……
元宝识别结果:
直接偷懒,没能输出完全基因位点名
Kimi是最勤快的
注意进度条,完全停不下来...
努力10分钟,还在继续努力,是个勤奋的孩子:
百度的
我只能说,不知道是什么鬼……
# 分子检测报告单
‌**病理号**‌:
‌**原病理号**‌:
‌**姓名**‌:(未提供)
‌**性别**‌:男
‌**送检医院**‌:
‌**送检科室**‌:
‌**收到日期**‌:
‌**住院号**‌
‌**标本部位**‌:右额及右岛叶
‌**临床诊断**‌:颅内占位性病变,症状性癫痫
## 检测内容
### 基因点突变、插入、缺失检测
- 共检测173个基因,包括但不限于:AKT3, APC, ARID1A, ARID1B, ASCL1, ATM, ATRX, BAP1, ACVR1, AHNAK, AKT1, CDC42EP1, CD79A, BCOR, BCORL1, BRAF, BRCA1, BRCA2, CARD11, CCM2, CCND1, CDK4, CDK6, CDKN2A, CHEK2, CIC, CREBBP, CTDNEP1, CTNNB1, CYSLTR2, DAXX, DCC, DDR1, EPCAM, ERBB2, DDX3X, DEPDC5, DGCR8, DICER1, DROSHA, EED, EGFR, ELP1, EP300, GLI2, EZH2, FBXW7, FGFR1, FGFR2, FGFR3, FGFR4, FUBP1, GFI1, GFI1B, GLI1, GLI3, GNA11, GNAQ, GNAS, H3-3A, H3-3B, H3C12, H3C14, H3C2, H3C6, H3C8, KMT2C, KMT2D, H3C3, HSPG2, IDH1, IDH2, KBTBD4, KDM6A, KIT, KLF4, KLLN, KMT5B, KRAS, KRIT1, LATS1, LATS2, LZTR1, MAP2K1, MAP2K2, MAPK1, MDM2, MDM4, MYC, MYCL, MEN1, MET, MLH1, MSH2, MSH3, MSH6, MTOR, MYB, MYBL1, PALB2, MYCN, MYD88, NF1, NF2, NOTCH1, NPRL2, NPRL3, NRAS, NTRK2, NTRK3, PMS1, PARP1, PBRM1, PDCD10, PDGFRA, PEG3, PIK3CA, PIK3CB, PIK3R1, PIM1, PLCB4, POU2F2, PPM1D, PRDM1, PRDM6, PRKAR1A, PRKCA, PTCH1, PMS2, POLD1, POLE, POLR2A, PTCH2, PTEN, PTK2, PTPN11, QKI, RAF1, RB1, RBM10, RELA, RET, RHEB, SDHB, SDHD, SEC23B, SLC35A2, SMARCA1, SMARCA2, SMARCA4,
智谱清言
也有大量错误,但是应该是效果最好的……
chatGPT
错得也挺多的,看来国外的和尚也不太会文本识别😄
Claude 3.7 Snonet
AI编程的扛把子,当红榨汁机,也还是不行,直接摆烂……