首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
蚝油菜花
掘友等级
微信公众号:@蚝油菜花。每日分享大模型与AI领域的最新应用和热点信息,提供开源实例和实用教程,帮助快速上手AI技术。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
蚝油菜花
1月前
关注
尽管提需求让AI帮你PS!Step1X-Edit:阶跃星辰开源图像编辑神器,自然语言指令秒改图!
Step1X-Edit是阶跃星辰团队推出的通用图像编辑框架,结合多模态大语言模型和扩散模型技术,通过百万级高质量数据训练实现多样化图像编辑能力。...
0
评论
分享
蚝油菜花
1月前
关注
1.5B参数吊打14B模型!OpenMath-Nemotron:英伟达开源数学推理模型,奥赛题自动出解题步骤
OpenMath-Nemotron是英伟达推出的开源数学推理模型系列,基于54万数学问题和320万推理步骤训练,支持从基础到奥林匹克级别的复杂数学问题求解。...
0
评论
分享
蚝油菜花
1月前
关注
实时分析视频,AI连体育赛事都能专业解说!LiveCC:字节联合新加坡国立大学开源的实时视频解说模型
LiveCC是由新加坡国立大学Show Lab团队与字节跳动联合开发的实时视频解说模型,基于自动语音识别字幕进行大规模训练,能够同步生成自然流畅的语音或文字解说,在实时视频...
0
评论
分享
蚝油菜花
1月前
关注
Kimi-Audio:月之暗面开源音频大模型,1300万小时训练重塑语音交互
Kimi-Audio是月之暗面推出的开源音频基础模型,基于1300万小时多样化音频数据训练,采用混合输入架构和流式解码技术,支持语音识别、情感分析等十余种音频处理任务。...
1
评论
分享
蚝油菜花
1月前
关注
阿里通义开源新一代混合推理模型 Qwen3:创新双模式推理,支持"思考模式"和"非思考模式"
Qwen3是阿里巴巴推出的新一代大型语言模型,支持119种语言和两种推理模式,采用四阶段训练流程和Apache 2.0协议开源,提供从0.6B到235B的多种模型配置。...
0
评论
分享
蚝油菜花
1月前
关注
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科...
0
评论
分享
蚝油菜花
1月前
关注
小米7B参数推理大模型首次开源!Xiaomi MiMo:数学代码双杀,超越32B巨头
小米开源的MiMo推理大模型通过联动预训练与强化学习算法,在7B参数规模下实现数学推理与代码生成能力的突破性提升,技术报告显示其性能超越部分32B级模型。...
0
评论
分享
蚝油菜花
1月前
关注
RAGEN:RL训练LLM推理新范式!开源强化学习框架让Agent学会多轮决策
RAGEN是一个基于StarPO框架的开源强化学习系统,通过马尔可夫决策过程形式化Agent与环境的交互,支持PPO、GRPO等多种优化算法,显著提升多轮推理训练的稳定性。...
0
评论
分享
蚝油菜花
1月前
关注
LongPort MCP:证券业首个券商MCP,AI赋能智能投资新时代,散户也能玩转机构级交易
LongPort MCP是长桥集团推出的证券行业首个券商模型上下文协议,通过标准化接口实现AI与金融服务的无缝对接,支持自然语言交互的智能投资服务。...
0
评论
分享
蚝油菜花
1月前
关注
Cooragent:清华 LeapLab 开源 AI Agent 协作框架,一句话召唤AI军团!
Cooragent 是清华大学 LeapLab 团队推出的开源 AI Agent 协作框架,支持基于简单描述快速创建 Agent 并实现多 Agent 协作,具备 Prom...
0
评论
分享
蚝油菜花
1月前
关注
Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
Open Avatar Chat是阿里开源的模块化数字人对话系统,支持文本/音频/视频多模态交互,采用可替换组件设计,平均响应延迟仅2.2秒,为开发者提供灵活高效的解决方案...
0
评论
分享
蚝油菜花
1月前
关注
让AI看懂3小时长视频!Eagle 2.5:英伟达推出8B视觉语言模型,长视频理解能力碾压72B大模型
Eagle 2.5是英伟达推出的8B参数视觉语言模型,通过创新训练策略在长视频和高分辨率图像理解任务中超越更大规模模型,支持512帧视频输入和多样化多模态任务。...
1
评论
分享
蚝油菜花
1月前
关注
让AI看懂图像每个像素!英伟达推出多模态大模型 DAM-3B:图像视频局部描述精度提升300%
英伟达推出的DAM-3B多模态大语言模型,通过创新的焦点提示技术和局部视觉骨干网络,实现了对图像和视频中特定区域的精准描述生成,为内容创作和智能交互领域带来全新可能。...
1
评论
分享
蚝油菜花
1月前
关注
OpenAI 最新多模态图像生成模型 GPT-image-1:一句话生成商业图+智能修图
GPT-image-1是OpenAI推出的新一代多模态图像生成模型,通过API提供专业级图像生成与编辑能力,支持多种分辨率、格式和艺术风格定制。...
0
评论
分享
蚝油菜花
1月前
关注
开源8B参数全能扩散模型Flex.2-preview:把线稿变商稿,还能边画边改!
Flex.2-preview是Ostris开源的80亿参数文本到图像扩散模型,支持512token长文本输入和多类型控制引导,内置修复功能并兼容主流AI绘画工具链。...
0
评论
分享
蚝油菜花
1月前
关注
高考理科题AI秒解!昆仑万维开源多模态推理模型 Skywork-R1V 2.0
Skywork-R1V 2.0是昆仑万维最新开源的多模态推理模型,通过混合强化学习和多模态奖励模型实现复杂推理任务,在理科题目解答和科研分析中展现出色性能。...
0
评论
分享
蚝油菜花
1月前
关注
让AI单次生成4万字!WriteHERE:开源AI长文写作框架,单次生成超长文本,小说报告一键搞定!
WriteHERE是基于异质递归规划技术的开源AI写作框架,能动态分解写作任务并管理任务依赖关系,支持单次生成超过4万字的专业报告。...
1
评论
分享
蚝油菜花
1月前
关注
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成高质量文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述...
0
评论
分享
蚝油菜花
1月前
关注
「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为
SocioVerse是由复旦大学联合小红书等机构开源的社会模拟框架,基于大语言模型和千万级真实用户数据构建,能精准模拟群体行为并预测社会事件演化趋势。...
0
评论
分享
蚝油菜花
1月前
关注
白板秒变IDE,草图直接生成可运行代码!Pad.ws:白板+代码编辑器深度结合,创意到实现无缝衔接
Pad.ws是一款创新的在线开发环境,将交互式白板与完整IDE工具深度结合,支持多人实时协作和多种编程语言,无需安装即可通过浏览器访问。...
0
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
318
文章被阅读
144,988
掘力值
7,803
关注了
0
关注者
135
收藏集
0
关注标签
17
加入于
2024-10-13