首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
开源星探
掘友等级
Python后端开发工程师
|
OPPO广东移动通信有限公司武汉分公司
一枚宅得不得了的Python爱好者 不定期分享技术干货 欢迎交流讨论
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
AiPy 你的AI打工牛马来了!真正的开源Agent神器!
如果说2023年是 AI 元年的话,那么2025年一定是 AI Agent 元年,也就是大家经常提到的「 AI 智能体」。 今年我一直在折腾各种 Agent 工具或平台,包括最为火热的字节Coze、智
3分钟搭建 MCP 交易平台,这个开源项目帮你搞外快!
近年来大环境大家都懂,裁员、失业、降薪的消息层出不穷。与此同时,AI 却疯狂崛起,很多人都在想:我能不能把自己写的 API、MCP 工具、AI 插件,做成一个小服务,让更多人调用,顺便赚点副业收入?
12K+ Star的离线语音神器!50MB模型秒杀云端API,隐私零成本,20+语种支持!
云端语音 API 虽功能强,但痛点明显:网络依赖、高昂费用、隐私风险。 如果有一款开源工具,既要轻量又能完全离线运行,还能识别人声,会不会让你的语音应用开发直接起飞呢。 一款由Alpha Cephei
轻量级语音模型Vui开源,支持本地部署,笑声停顿全拟真,4万小时练出人类对话感!
在语音交互技术飞速发展的今天,打造一个自然、逼真的语音对话模型是许多开发者和AI语音团队的梦想。 传统语音模型要么需要云端算力,要么缺乏语气词和情感,难以模拟真人对话。设备端轻量语音的兴起,像给AI装
3B小模型吊打72B巨头!轻量级文档解析OCR,性能超Gemini,高效且精准!
在文档解析领域,传统方法要么依赖复杂多工具流水线,要么受限于大型多模态模型的低效性。 近日,Yuliang-Liu团队在GitHub上开源了一款轻量级基于LLM的文档解析模型:MonkeyOCR。 它
PDF解剖大师来了!LandingAI开源神器,这个Python库让百页文档秒变结构化数据!
复杂文档处理是数据分析的痛点:表格嵌套、图表混杂、超长PDF,传统OCR(如Tesseract)或解析库(如PyMuPDF)常因布局复杂而失准。 LandingAI 团队在 GitHub 上开源了一款
这款开源神器把Excel翻译卷出新高度!免费、无限文件大小、公式精准!
翻译大型或复杂文档(如超大 Excel、PDF)一直是开发者和企业的痛点:免费工具要么效果差,要么限制文件大小,付费工具又成本高昂。 作为一名热衷挖掘开源工具的技术宅,给大家分享一款由 infrost
开源2天斩获3K标星!开源TTS新星Chatterbox盲测击败ElevenLabs!
文本转语音(TTS)技术近年来随着AI的快速发展突飞猛进,但要在真实感、情绪表达和实时性上达到顶尖水平,仍是巨大挑战。 但零样本TTS和情感控制的兴起,涌现了一大批优秀的TTS模型,让语音合成进入了新
字节开源多模态复杂文档解析模型!Dolphin:页面与元素并行解析,精准解析复杂文档!
多模态AI和文档解析的兴起,就像给OCR装上了“超级大脑”,通过视觉和语言的结合,精准理解文档结构。 以往用的一些OCR工具经常“翻车”,复杂的页面布局让解析结果面目全非。 而现在随着多模态AI技术的
AI开发者盛宴!NVIDIA DPU 黑客松助力想法变为现实!
程序员高能预警!全球最硬核的DPU算力狂欢节来了! 第三届NVIDIA DPU中国虚拟黑客松近期已开放报名,该竞赛是堪_比刷 LeetCode 更硬核的简历镀金术:在BlueField上留下你的git
下一页
个人成就
优秀创作者
文章被点赞
1,596
文章被阅读
276,290
掘力值
11,840
关注了
1
关注者
341
收藏集
5
关注标签
15
加入于
2022-04-19