首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
努力犯错玩AI
掘友等级
前粗粮产品,AIGC爱好者,北漂20年,混迹各大互联网公司
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 3
沸点 1
赞
4
返回
|
搜索文章
最新
热门
Llama 4 来了!AI 快站助你一键极速下载,抢先体验 MoE + 多模态 + 超长上下文
人工智能领域再次迎来重磅消息!Meta 创始人兼 CEO 马克·扎克伯格亲自官宣,全新一代 Llama 4 系列大模型 震撼发布!这不仅是 Llama 家族的简单升级,更是一次彻底的重新设计,带来了混
秒级生成、细节拉满!探索阿里巴巴 LHM 开源模型,人人都是 3D 建模师
朋友们,想象一下,只需要一张普通的照片,短短几秒钟,就能变出一个细节爆棚、还能活蹦乱跳的 3D 数字人!听起来是不是像科幻电影里的情节?但现在,阿里巴巴通义实验室的 LHM (Large Animat
不止中英双语!港科大 LLaSA 模型让 AI 语音带上喜怒哀乐,15秒克隆你的声音!
今天我们要聊一个在人工智能语音合成(TTS)领域掀起波澜的开源新星——来自香港科技大学音频实验室 (HKUST Audio) 的 LLaSA 模型。你是否厌倦了那些平淡、缺乏感情的机器语音?是否梦想过
字节跳动 InfiniteYou 开源:1-4 张图打造你的高清数字分身
你是否曾想过,只需几张自己的照片,就能在数字世界中拥有一个与你别无二致、还能摆出各种姿势、穿梭于不同场景的高清“分身”?过去,这可能需要复杂的 3D 建模或大量的数据微调。但现在,来自字节跳动 (By
字节跳动 MegaTTS3 开源:0.45B 参数实现高质量中英双语 TTS 与语音克隆
导语 在人工智能的浪潮中,文本转语音(Text-to-Speech, TTS)技术正以前所未有的速度发展,让机器拥有自然、富有表现力的声音不再是遥不可及的梦想。近日,来自字节跳动(ByteDance)
开源3D生成新标杆:TripoSG如何实现“秒级”高精度三维建模?
想象一下,只需要一张普通的图片,短短半秒钟,就能变魔术般生成一个高质量的 3D 模型?这听起来像是科幻电影里的情节,但现在由 Tripo AI 打造的开源模型 TripoSR,正将这个梦想变为现实!对
双卡 RTX 5090 深度体验:AI 推理框架选择与性能限制实测
最近有幸拿到了一台配备双卡 NVIDIA GeForce RTX 5090 显卡的工作站PC,这无疑是许多追求极致性能的开发者梦想装备。不过,新硬件的到来往往伴随着一些挑战,尤其是在软件适配和性能表现
开源金融推理新标杆!Fin-R1以7B参数逼近DeepSeek-R1满血版,单卡4090即可部署
在金融这个高度依赖数据、逻辑和精确性的领域,人工智能(AI)的应用前景广阔,但挑战也同样巨大。数据碎片化、模型推理过程“黑箱”化、业务场景泛化能力弱……这些难题一直困扰着金融 AI 的落地。 我们要向
Step-Video-T2V技术深度解析:300亿参数模型实现8秒204帧视频的超清生成
随着人工智能技术的不断突破,文本到视频生成(T2V)正成为视频创作领域的一大热点。阶跃星辰开源的Step-Video-T2V模型,以其300亿参数的庞大规模和能够生成高达204帧(约8秒)的高清视频效
开源视觉语言模型MiniMax-VL-01:动态分辨率+4M超长文本,性能比肩GPT-4o
在人工智能领域,构建能够像人类一样理解、思考和行动的智能体(AI Agent)一直是研究人员的终极目标之一。而实现这一目标的关键在于模型是否具备足够强大的感知能力、记忆能力和推理能力。近期,国内人工智
下一页
个人成就
文章被点赞
110
文章被阅读
104,519
掘力值
4,424
关注了
1
关注者
60
收藏集
1
关注标签
7
加入于
2023-11-19