首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
开源星探
掘友等级
Python后端开发工程师
|
OPPO广东移动通信有限公司武汉分公司
一枚宅得不得了的Python爱好者 不定期分享技术干货 欢迎交流讨论
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
月之暗面最新开源模型!Kimi-Audio:革新多模态音频处理,统一音频理解、生成与对话!
处理音频数据时,我们是不是经常要切换各种工具? 转写用 ASR(语音识别),转音频又得找稳定的 TTS 模型(工具)…… 几个小时前,月之暗面 Moonshot AI 正式开源了 Kimi-Audio
开源AI代理爆火!Suna:3天内新增5.5K+标星,自然对话驱动的自动化神器!
现代工作场景中,信息分散在多个平台,我们经常需要频繁切换多个网站,复制粘贴信息、整理报告的繁琐流程不仅耗时,造成人工整合效率低下。 一款在昨日登顶 GitHub Trending 的榜首项目:Suna
给AI装上全景雷达!NodeRAG:开源异构图 RAG 系统,革新检索与生成效率!
传统 RAG 系统依赖文本块检索,难以捕捉信息间的复杂关系,导致上下文缺失或无关信息干扰,效率低下。 而在 RAG 技术愈发流行的今天,如何让 AI 更聪明地 “理解信息之间的关系”,而不是仅仅“找一
告别OCR!这个AI文档神器直接"看懂"PDF,支持文档归类及多模态问答!
在解析处理 PDF 文档时,我们经常要借助 OCR 工具提取内容,用于搜索、问答或数据整理。 但大部分 OCR 工具存在许多痛点,比如:配置繁琐、模型庞大、图表识别差、精度低、识别结构乱、不能图文结合
开源TTS领域迎来重磅新星!Dia-1.6B:超逼真对话生成,开源2天斩获6.5K Star!
文本转语音(TTS)领域又迎来一位重磅新星! 由 Nari Labs 开发的 Dia-1.6B 以其超逼真的对话生成能力引发热议,仅开源两天便在 GitHub 收获 6.5K+ Star! 据说其能力
EasyDoc深度体验:让RAG开发者直呼好用的文档解析API(附案例详解)
在AI技术迅猛发展的今天,大语言模型(LLM)和检索增强生成(RAG)系统已成为开发者构建智能应用的核心工具。 然而,许多团队在落地过程中发现了一个关键痛点:AI模型的性能高度依赖于输入数据的质量。尤
这个开源神器终结了AI数据整合的噩梦!一键聚合网页、代码、论文到剪贴板!
在用大语言模型(如 GPT、Claude、DeepSeek 等)提问网页、GitHub 仓库、论文或视频时,手动整合内容既耗时又低效。 但是 AI 模型特别倚重高质量上下文,以便从多源数据中提取有用信
AI也能操作手机了!DroidRun 让 Agent 实现智能手机自动化操作!
继 BrowserUse 和 ComputerUse 席卷 AI 自动化领域后,手机操作类项目终于迎来重磅选手:DroidRun! 开源 AI 手机操作神器,解锁 Android 自动化新时代! 目前
情感语音的“开源先锋”!网易开源的一款TTS神器,2000种声音随意切换!
语音合成技术现已广泛应用于语音克隆、语音助手、配音服务、有声读物等领域,但如何让合成语音更具情感、更贴近人类表达,一直是语音行业研究的主要方向。 今天,推荐一款网易有道推出的 TTS 开源模型:Emo
免费开源的吉卜力风格图像神器,小模型掀起大浪潮!效果毫不逊色于GPT-4o!
自从 GPT-4o 上线图像生成能力后,引发了一大波创作浪潮,其中吉卜力风格图像深受欢迎,一时爆火! 但 GPT-4o 虽强,也确实存在一定限制。最直接的就是生成次数有限、版权问题、图像生成排队等等。
下一页
个人成就
优秀创作者
文章被点赞
1,709
文章被阅读
387,411
掘力值
12,554
关注了
1
关注者
369
收藏集
5
关注标签
15
加入于
2022-04-19