首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
开源星探
掘友等级
Python后端开发工程师
|
OPPO广东移动通信有限公司武汉分公司
一枚宅得不得了的Python爱好者 不定期分享技术干货 欢迎交流讨论
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
从零到AI大师!又一款超酷的开源AI助手,支持本地知识库+联网搜索+智能体+一键分享!
对于想快速上手 AI 助手的开发者或新手来说,搭建一个支持本地知识库、联网搜索和智能体的工具往往门槛不低,配置复杂、文档晦涩让人望而却步。 开源AI客户端和一键部署的兴起,就像给AI装上了“傻瓜式开关
一站式PDF解析神器!统一封装Docling、PyMuPDF、LlamaParse,批量处理无压力!
在面临 PDF 文档解析功能实现时,开发者会去找文本、表格、图片提取等等不同的SDK(API)库,导致写的代码像“拼积木”,效率低还容易出错。 想提取文字,要用 PyMuPDF;想识别表格,还得上 p
告别 Selenium 痛点!全新升级版 Selenium 自动化框架,斩获10.2K标星!
在使用 Selenium 编写 Web 自动化脚本时,元素加载时机问题总是让人抓狂:要么脚本跑得太快找不到元素,要么得手动加一堆 time.sleep() ,测试还经常因为浏览器驱动问题翻车。 好不容
字节开源了一款多模态神器!BAGEL上线,超越Qwen2.5-VL,媲美SD3!
多模态 AI 的发展已经进入了“融合纪元”,不再是“看图说话”或“图文转换”那么简单。 我们需要的是一个能理解图文视频、融合信息、做出复杂推理并生成内容的统一基础模型。 现在,字节跳动正式开源了他们的
微软发布多智能体 Web 操作系统!让 AI 成为真正“可控、协同、透明”的网页执行助手!
继 Magentic-One 后,微软在此基础上推出了新一代多智能体 Web 操作系统:Magentic-UI! 一个由多智能体系统驱动的 Web 自动化工具,能: 自动浏览网页、点击、填写表单等操作
自主进化的多智能体!EvoAgentX:自动工作流生成、多种进化算法、任务调度、MCP支持!
在 AI 自动化时代,“执行力”已经不是智能体系统的唯一衡量标准。 面对医疗诊断、科研助理、电商运营等需要持续优化和多步协作的复杂任务,我们需要的不只是多个 AI Agent,而是一个会思考、会进化的
国产TTS模型双榜第一!MiniMax实现零样本语音复刻,支持32种多语言!
近期,语音AI领域迎来了一场全球性的震撼:MiniMax 旗下 Speech-02语音模型 ,一跃成为全球TTS双榜第一! 不仅登顶了Artificial Analysis Arena榜单,力压Ope
字节把 Coze 核心开源了!可视化工作流引擎 FlowGram 上线,AI 赋能可视化流程!
字节跳动(ByteDance)近期开源了其基于节点的流程构建引擎:FlowGram。而且也是在飞书工作流、扣子自动化 等产品中使用的核心可视化流程引擎。 是一款在线上产品中经过验证且极受用户青睐的强大
新型开源端到端 AI 语音模型!Voila:195ms 超低延迟引领全双工对话!
语音交互技术的进步正在改变人机对话的方式,但传统语音助手受限于高延迟、单向交互和缺乏情感表达。 Maitrix 团队最新发布的开源 AI 端到端语音模型:Voila,其以 195ms 超低延迟及全双工
英伟达开源语音识别模型!0.6B 参数登顶 ASR 榜单,1 秒转录 60 分钟音频!
英伟达在5月1日发布了一款开源语音识别模型:Parakeet TDT 0.6B V2,其以 600M 参数登顶 Hugging Face Open ASR 榜单。 平均词错误率(WER)仅 6.05%
下一页
个人成就
优秀创作者
文章被点赞
1,618
文章被阅读
303,292
掘力值
11,974
关注了
1
关注者
348
收藏集
5
关注标签
15
加入于
2022-04-19