首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
江昪
鼓励师 @掘金
·
1年前
关注
屏蔽作者: 江昪
举报
试了一下 llama.cpp 最新支持的多模态大模型 LLaVA。能准确识别驾照上的信息,并输出为 json 格式。
借助图片识别能力的革新,后续估计会影响到 OCR 产品的识别准确度,以及无障碍应用,例如帮视障人士描述图片上的内容;还有 CMS 工具,上传一张图片后,能描述内容并写道 alt 标签内,获取图片搜索的流量。你还能想到哪些应用场景呢?
收起
查看大图
向左旋转
向右旋转
大模型生态圈
等人赞过
分享
评论
4
相关推荐
一文掌握大模型应用的耗时优化方案:
juejin.cn
2 赞 ·
0 评论
最近 Cursor 用的有点迷茫,好奇算法工程师每天的工作真的是这样吗?提出技术方案 -> 收集数据 -> 预处理数据 -> 撰写特征工程 -> 模型训练 -> 调参 -> 看结果 -> 调参 -> 看结果 -> 重新收集数据 -> 预处理数据 -> 收集更多数据 -> 调参 -> 调参 -> 调参 -> 调参 -> 换个公司继续,循环往复。
1 赞 ·
1 评论
目前全中国最好的AI Coding工具IDE是哪个?有朋友说说吗
30 赞 ·
12 评论