首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
马克学ai
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
马克学ai
2月前
关注
DeepSeek-OCR:重新定义文本处理的视觉处理效率
在人工智能领域,一场静默的革命正在发生。DeepSeek最新开源的OCR模型不仅突破了传统文字识别的边界,更提出了一个颠覆性的理念:用“看”代替“读”。这一创新正引发全...
0
评论
分享
马克学ai
2月前
关注
DeepSeek-OCR:AI多模态技术迎来效率提升
视觉与听觉的双重革命:AI多模态技术迎来效率突破 在人工智能快速发展的浪潮中,我们正见证着两个看似不同却同样深刻的技术革命同时发生。一边是DeepSeek-OCR通过视...
0
评论
分享
马克学ai
2月前
关注
Step-Audio 2:开启端到端大模型新格局
在人工智能快速发展的浪潮中,语音交互技术正迎来重要转折点。阶跃星辰最新开源的Step-Audio 2系列模型,凭借其创新的端到端架构和卓越的性能表现,为多模态语音领域树立了...
0
评论
分享
马克学ai
2月前
关注
Step-Audio 2:端到端语音大模型重塑人机交互新范式
近日,阶跃星辰推出的Step-Audio 2系列模型凭借其创新的端到端架构与多项SOTA性能,为多模态语音领域注入新动能。作为开源语音大模型的重要突破,该技术不仅实现了音频...
0
评论
分享
马克学ai
2月前
关注
国产多模态语音大模型再突破!Step-Audio 2 mini开源即登顶SOTA,解锁语音交互新可能
阶跃星辰正式推出开源端到端语音大模型Step-Audio 2 mini,并在国际权威评测中以多项SOTA成绩引发关注。这款模型不仅实现了语音理解、生成与推理的深度融合,更凭...
0
评论
分享
马克学ai
2月前
关注
国产语音大模型再突破!Step-Audio 2 mini 开源:1 秒懂方言辨情绪,翻译能力碾压 GPT-4o
在人工智能语音交互领域,国产技术正以令人惊叹的速度实现突破。2025 年 8 月 29 日,阶跃星辰公司正式开源的 Step-Audio 2 mini 端到端语音大模型,凭...
0
评论
分享
马克学ai
2月前
关注
阶跃 Step-Audio 2 :开源语音大模型天花板,端到端架构听懂 “弦外之音”,普通显卡也能跑
“请分析这段音频里的情绪,再翻译成龙虾的粤语说法”—— 放在半年前,完成这个需求需要调用 “语音识别 + 情绪分析 + 翻译” 三个模型,还得手动拼接结果;现在用阶跃星辰开...
0
评论
分享
马克学ai
2月前
关注
EchoMimicV3 深度解析:1.3B 参数干翻 13B 大模型,单卡速度提升 18 倍,数字人视频生成进入 “轻量时代”
当行业还在为 “13B 参数数字人模型能生成多逼真的动画” 争论时,蚂蚁集团甩出了一张 “王炸”——EchoMimicV3。这款仅 1.3B 参数的小模型,不仅在口型同步、...
0
评论
分享
马克学ai
2月前
关注
EchoMimicV3:免费整合包解锁全身数字人,15 分钟生成带手势的超真实动画,小白也能玩
在 AI 数字人领域,“头部动、身体僵” 曾是行业通病 —— 能让虚拟人张嘴说话不难,但要让它自然抬手、转身,甚至配合场景做手势,要么需要专业动捕设备,要么得手动调整几十组...
0
评论
分享
马克学ai
2月前
关注
蚂蚁 EchoMimicV3 实测:13 亿参数打破数字人制作壁垒,3 分钟出片,小白也能当 “虚拟导演”
“想做个虚拟主播带货视频,还要啥 3D 建模、动作捕捉?”—— 这是实测蚂蚁集团 EchoMimicV3 后最直观的感受。以前需要专业团队花 3 天制作的 1 分钟数字人视...
0
评论
分享
马克学ai
2月前
关注
蚂蚁 EchoMimicV3 实测:1.3B 参数颠覆数字人制作,单卡速度提升 18 倍,多模态生成太丝滑!
传统数字人视频制作有多难?想让虚拟主播念一段产品介绍,得先做 3D 建模、手动调表情,再让动作捕捉设备匹配语音,一套流程下来,1 分钟的视频可能要花 3 天;而现在用蚂蚁集...
0
评论
分享
马克学ai
3月前
关注
中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准
【北京,2025年10月】 在全球AI算力竞赛进入白热化的今天,一家中国公司打破了"国际巨头垄断高端AI算力"的市场格局。东方超算(AI-POWER)今日正式发布Deep ...
0
评论
分享
马克学ai
3月前
关注
告别机房时代!Deep X开创便携AI算力新纪元:巴掌大的盒子装下1.824P算力
【北京,2025年10月】 当建筑师王总背着一个公文包走进客户的会议室,没人能想到,这个巴掌大的设备里装着相当于传统AI服务器300kg重量的计算能力。5分钟后,客户提出的...
0
评论
分享
马克学ai
3月前
关注
东方超算正式发布Deep X G20系列:以便携超算重塑企业级AI算力标准
东方超算正式发布Deep X G20系列:以便携超算重塑企业级AI算力标准 【2025年10月·中国】 东方超算(AI-POWER)今日正式发布Deep X G20系列...
0
评论
分享
马克学ai
3月前
关注
打破"性能溢价"魔咒:Deep X让企业级AI算力不再是奢侈品
【北京,2025年10月】 "我们算了一笔账:如果继续用云GPU,3年要花360万;买5台Deep X,总成本20万,还能用5年以上。这不是一个数量级的差异。"深圳某量化私...
0
评论
分享
马克学ai
3月前
关注
从480分钟到8分钟:Deep X+AppMall.ai用软硬结合重新定义AI部署
【北京,2025年10月】 "我们用了两天时间,尝试在服务器上部署LLaMA 11B模型。安装Python环境,报错;配置CUDA,版本冲突;下载模型权重,网络超时;终于跑...
0
评论
分享
马克学ai
3月前
关注
B 站 IndexTTS2:让 AI 配音从 “机械音” 变 “演员级”,零样本双克隆 + 精准控时颠覆行业
给《甄嬛传》配一段英文台词,既要保留皇后的温婉音色,又要还原 “臣妾做不到啊” 的崩溃情绪,还得精准对齐原视频 5 秒的口型 —— 放在以前,这需要专业配音演员录制 + 后...
0
评论
分享
马克学ai
3月前
关注
B 站 IndexTTS2:零样本克隆声音 + 情绪,精准控时让 AI 配音比肩专业演员
给《让子弹飞》配一段英文台词,既要保留张麻子的粗犷音色,又要还原角色愤怒的情绪,还得精准对齐原视频 4.8 秒的口型 —— 放在半年前,这需要专业配音演员 + 后期团队花数...
0
评论
分享
马克学ai
3月前
关注
5 秒克隆声音,还能调情绪!B 站 IndexTTS2 实测:从玩梗到创作,AI 配音彻底平民化
“用 5 秒音频克隆朋友声音,再让 AI 用这个声音配一段‘委屈到哭’的台词”—— 放在半年前,这需要专业配音工具和复杂操作,现在用 B 站开源的 IndexTTS2,普通...
0
评论
分享
马克学ai
3月前
关注
IndexTTS2 技术深析:B 站如何用 “三大创新” 破解自回归 TTS 的十年难题?
自回归语音合成(AR-TTS)诞生十年间,始终被困在 “自然度” 与 “可控性” 的矛盾里 —— 能生成如真人对话般的韵律,却无法精准控制时长;能克隆音色,却让情感与声音绑...
0
评论
分享
下一页
个人成就
文章被点赞
2
文章被阅读
56,474
掘力值
723
关注了
0
关注者
7
收藏集
0
关注标签
3
加入于
2025-04-29