获得徽章 0
赞了这篇沸点
越睡越困 脑袋晕晕[黑脸]
7
赞了这篇沸点
试了一下 llama.cpp 最新支持的多模态大模型 LLaVA。能准确识别驾照上的信息,并输出为 json 格式。
借助图片识别能力的革新,后续估计会影响到 OCR 产品的识别准确度,以及无障碍应用,例如帮视障人士描述图片上的内容;还有 CMS 工具,上传一张图片后,能描述内容并写道 alt 标签内,获取图片搜索的流量。你还能想到哪些应用场景呢?
江昪于2023-10-24 16:53发布的图片
评论
关注了
#新人报道#
评论
个人成就
文章被点赞 1
文章被阅读 826
掘力值 26
收藏集
2
关注标签
0
加入于