首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Lm
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
7
文章 5
沸点 2
赞
7
返回
|
搜索文章
赞
文章( 5 )
沸点( 2 )
不是笨小孩的阿加西
1年前
举报
越睡越困 脑袋晕晕
上班摸鱼
分享
7
3
江昪
鼓励师 @掘金
·
2年前
举报
试了一下 llama.cpp 最新支持的多模态大模型 LLaVA。能准确识别驾照上的信息,并输出为 json 格式。
借助图片识别能力的革新,后续估计会影响到 OCR 产品的识别准确度,以及无障碍应用,例如帮视障人士描述图片上的内容;还有 CMS 工具,上传一张图片后,能描述内容并写道 alt 标签内,获取图片搜索的流量。你还能想到哪些应用场景呢?
收起
查看大图
向左旋转
向右旋转
大模型生态圈
分享
评论
4
个人成就
文章被点赞
1
文章被阅读
1,011
掘力值
27
关注了
9
关注者
1
收藏集
2
关注标签
0
加入于
2021-11-18