首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
开源星探
掘友等级
Python后端开发工程师
|
OPPO广东移动通信有限公司武汉分公司
一枚宅得不得了的Python爱好者 不定期分享技术干货 欢迎交流讨论
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
12K+ Star的离线语音神器!50MB模型秒杀云端API,隐私零成本,20+语种支持!
云端语音 API 虽功能强,但痛点明显:网络依赖、高昂费用、隐私风险。 如果有一款开源工具,既要轻量又能完全离线运行,还能识别人声,会不会让你的语音应用开发直接起飞呢。 一款由Alpha Cephei
轻量级语音模型Vui开源,支持本地部署,笑声停顿全拟真,4万小时练出人类对话感!
在语音交互技术飞速发展的今天,打造一个自然、逼真的语音对话模型是许多开发者和AI语音团队的梦想。 传统语音模型要么需要云端算力,要么缺乏语气词和情感,难以模拟真人对话。设备端轻量语音的兴起,像给AI装
3B小模型吊打72B巨头!轻量级文档解析OCR,性能超Gemini,高效且精准!
在文档解析领域,传统方法要么依赖复杂多工具流水线,要么受限于大型多模态模型的低效性。 近日,Yuliang-Liu团队在GitHub上开源了一款轻量级基于LLM的文档解析模型:MonkeyOCR。 它
PDF解剖大师来了!LandingAI开源神器,这个Python库让百页文档秒变结构化数据!
复杂文档处理是数据分析的痛点:表格嵌套、图表混杂、超长PDF,传统OCR(如Tesseract)或解析库(如PyMuPDF)常因布局复杂而失准。 LandingAI 团队在 GitHub 上开源了一款
这款开源神器把Excel翻译卷出新高度!免费、无限文件大小、公式精准!
翻译大型或复杂文档(如超大 Excel、PDF)一直是开发者和企业的痛点:免费工具要么效果差,要么限制文件大小,付费工具又成本高昂。 作为一名热衷挖掘开源工具的技术宅,给大家分享一款由 infrost
开源2天斩获3K标星!开源TTS新星Chatterbox盲测击败ElevenLabs!
文本转语音(TTS)技术近年来随着AI的快速发展突飞猛进,但要在真实感、情绪表达和实时性上达到顶尖水平,仍是巨大挑战。 但零样本TTS和情感控制的兴起,涌现了一大批优秀的TTS模型,让语音合成进入了新
字节开源多模态复杂文档解析模型!Dolphin:页面与元素并行解析,精准解析复杂文档!
多模态AI和文档解析的兴起,就像给OCR装上了“超级大脑”,通过视觉和语言的结合,精准理解文档结构。 以往用的一些OCR工具经常“翻车”,复杂的页面布局让解析结果面目全非。 而现在随着多模态AI技术的
AI开发者盛宴!NVIDIA DPU 黑客松助力想法变为现实!
程序员高能预警!全球最硬核的DPU算力狂欢节来了! 第三届NVIDIA DPU中国虚拟黑客松近期已开放报名,该竞赛是堪_比刷 LeetCode 更硬核的简历镀金术:在BlueField上留下你的git
从零到AI大师!又一款超酷的开源AI助手,支持本地知识库+联网搜索+智能体+一键分享!
对于想快速上手 AI 助手的开发者或新手来说,搭建一个支持本地知识库、联网搜索和智能体的工具往往门槛不低,配置复杂、文档晦涩让人望而却步。 开源AI客户端和一键部署的兴起,就像给AI装上了“傻瓜式开关
一站式PDF解析神器!统一封装Docling、PyMuPDF、LlamaParse,批量处理无压力!
在面临 PDF 文档解析功能实现时,开发者会去找文本、表格、图片提取等等不同的SDK(API)库,导致写的代码像“拼积木”,效率低还容易出错。 想提取文字,要用 PyMuPDF;想识别表格,还得上 p
下一页
个人成就
优秀创作者
文章被点赞
1,510
文章被阅读
240,996
掘力值
11,437
关注了
1
关注者
322
收藏集
5
关注标签
15
加入于
2022-04-19