首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
开源星探
掘友等级
Python后端开发工程师
|
OPPO广东移动通信有限公司武汉分公司
一枚宅得不得了的Python爱好者 不定期分享技术干货 欢迎交流讨论
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
PDF解剖大师来了!LandingAI开源神器,这个Python库让百页文档秒变结构化数据!
复杂文档处理是数据分析的痛点:表格嵌套、图表混杂、超长PDF,传统OCR(如Tesseract)或解析库(如PyMuPDF)常因布局复杂而失准。 LandingAI 团队在 GitHub 上开源了一款
这款开源神器把Excel翻译卷出新高度!免费、无限文件大小、公式精准!
翻译大型或复杂文档(如超大 Excel、PDF)一直是开发者和企业的痛点:免费工具要么效果差,要么限制文件大小,付费工具又成本高昂。 作为一名热衷挖掘开源工具的技术宅,给大家分享一款由 infrost
开源2天斩获3K标星!开源TTS新星Chatterbox盲测击败ElevenLabs!
文本转语音(TTS)技术近年来随着AI的快速发展突飞猛进,但要在真实感、情绪表达和实时性上达到顶尖水平,仍是巨大挑战。 但零样本TTS和情感控制的兴起,涌现了一大批优秀的TTS模型,让语音合成进入了新
字节开源多模态复杂文档解析模型!Dolphin:页面与元素并行解析,精准解析复杂文档!
多模态AI和文档解析的兴起,就像给OCR装上了“超级大脑”,通过视觉和语言的结合,精准理解文档结构。 以往用的一些OCR工具经常“翻车”,复杂的页面布局让解析结果面目全非。 而现在随着多模态AI技术的
AI开发者盛宴!NVIDIA DPU 黑客松助力想法变为现实!
程序员高能预警!全球最硬核的DPU算力狂欢节来了! 第三届NVIDIA DPU中国虚拟黑客松近期已开放报名,该竞赛是堪_比刷 LeetCode 更硬核的简历镀金术:在BlueField上留下你的git
从零到AI大师!又一款超酷的开源AI助手,支持本地知识库+联网搜索+智能体+一键分享!
对于想快速上手 AI 助手的开发者或新手来说,搭建一个支持本地知识库、联网搜索和智能体的工具往往门槛不低,配置复杂、文档晦涩让人望而却步。 开源AI客户端和一键部署的兴起,就像给AI装上了“傻瓜式开关
一站式PDF解析神器!统一封装Docling、PyMuPDF、LlamaParse,批量处理无压力!
在面临 PDF 文档解析功能实现时,开发者会去找文本、表格、图片提取等等不同的SDK(API)库,导致写的代码像“拼积木”,效率低还容易出错。 想提取文字,要用 PyMuPDF;想识别表格,还得上 p
告别 Selenium 痛点!全新升级版 Selenium 自动化框架,斩获10.2K标星!
在使用 Selenium 编写 Web 自动化脚本时,元素加载时机问题总是让人抓狂:要么脚本跑得太快找不到元素,要么得手动加一堆 time.sleep() ,测试还经常因为浏览器驱动问题翻车。 好不容
字节开源了一款多模态神器!BAGEL上线,超越Qwen2.5-VL,媲美SD3!
多模态 AI 的发展已经进入了“融合纪元”,不再是“看图说话”或“图文转换”那么简单。 我们需要的是一个能理解图文视频、融合信息、做出复杂推理并生成内容的统一基础模型。 现在,字节跳动正式开源了他们的
微软发布多智能体 Web 操作系统!让 AI 成为真正“可控、协同、透明”的网页执行助手!
继 Magentic-One 后,微软在此基础上推出了新一代多智能体 Web 操作系统:Magentic-UI! 一个由多智能体系统驱动的 Web 自动化工具,能: 自动浏览网页、点击、填写表单等操作
下一页
个人成就
优秀创作者
文章被点赞
1,709
文章被阅读
387,167
掘力值
12,554
关注了
1
关注者
369
收藏集
5
关注标签
15
加入于
2022-04-19