首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Lab4AI大模型实验室
掘友等级
无
|
北京九章云极科技有限公司
大模型实验室Lab4AI是拥有高性能GPU的AI实践内容社区。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
NeurlPS 2025!普林斯顿团队成果:InFlux首破动态相机内参逐帧真值难题,重塑3D视觉评估
NeurlPS 2025!普林斯顿团队成果:InFlux首破动态相机内参逐帧真值难题,重塑3D视觉评估 论文标题:InFlux: A Benchmark for Self-Calibration of
从 50 步到 4 步:LightX2V 如何把视频生成拉进20 秒时代?
从 50 步到 4 步:LightX2V 如何把视频生成拉进20 秒时代? 还在为高质量视频生成「又慢又重」头疼吗? 传统扩散式视频生成模型往往需要20~50步迭代过程,即便生成几十帧的短视频,也需长
ECCV 2024!面向领域泛化分割的文本查询驱动掩码Transformer| 语义分割 | 计算机视觉
ECCV 2024!面向领域泛化分割的文本查询驱动掩码Transformer| 语义分割 | 计算机视觉 01 论文概述 论文名称:Textual query-driven mask transfor
# CVPR 2025| 基于扩散变换器的自适应图像融合框架| 计算机视觉 | 图像编辑
论文名称:DreamFuse: Adaptive Image Fusion with Diffusion Transformer —— 基于扩散变换器的自适应图像融合框架
从帧到世界:面向世界模型的长视频生成
从帧到世界:面向世界模型的长视频生成 世界模型是一种能够“看懂”现实世界规则并“预测”其动态变化的生成式AI,例如理解“抛球会落地”或“太阳东升西落”等常识。其技术本质是通过大量数据学习物理规律、因果
CVPR 2024 | 赋能大语言模型以精准理解视频时序瞬间 | LLM | 时序预测
CVPR 2024 | 赋能大语言模型以精准理解视频时序瞬间 | LLM | 时序预测 论文名称:VTimeLLM: Empower LLM to Grasp Video Moments
CVPR 2022!经典论文!稳定扩散模型(Stable Diffusion)背后的革命性技术:隐空间扩散模型
CVPR 2022!经典论文!稳定扩散模型(Stable Diffusion)背后的革命性技术:隐空间扩散模型
VideoLLaMA 3新一代前沿多模态基础模型赋能图像与视频深度理解| LLM | 计算机视觉
VideoLLaMA 3是基于Llama 3的前沿多模态基础模型,深度融合视觉、听觉与语言理解能力,支持高分辨率图像和长视频的端到端分析。其核心技术包括统一的视听语言架构、高效长视频词元化和万亿级多
AAAI2025!北理工团队提出FBRT-YOLO:面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测
论文《FBRT-YOLO: Faster and Better for Real-Time Aerial Image Detection》提出了一种针对航拍图像目标检测的优化方法。
视频编辑的新成果!港科大&蚂蚁集团提出Ditto框架刷新SOTA!
论文标题:Scaling Instruction-Based VideoEditing with a High-Quality Synthetic Dataset 作者团队:香港科大、蚂蚁集团、浙江大
下一页
个人成就
文章被阅读
3,207
掘力值
517
关注了
0
关注者
0
收藏集
0
关注标签
17
加入于
2025-10-13