首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Lab4AI大模型实验室
掘友等级
无
|
北京九章云极科技有限公司
大模型实验室Lab4AI是拥有高性能GPU的AI实践内容社区。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
# CVPR 2025| 基于扩散变换器的自适应图像融合框架| 计算机视觉 | 图像编辑
论文名称:DreamFuse: Adaptive Image Fusion with Diffusion Transformer —— 基于扩散变换器的自适应图像融合框架
从帧到世界:面向世界模型的长视频生成
从帧到世界:面向世界模型的长视频生成 世界模型是一种能够“看懂”现实世界规则并“预测”其动态变化的生成式AI,例如理解“抛球会落地”或“太阳东升西落”等常识。其技术本质是通过大量数据学习物理规律、因果
CVPR 2024 | 赋能大语言模型以精准理解视频时序瞬间 | LLM | 时序预测
CVPR 2024 | 赋能大语言模型以精准理解视频时序瞬间 | LLM | 时序预测 论文名称:VTimeLLM: Empower LLM to Grasp Video Moments
CVPR 2022!经典论文!稳定扩散模型(Stable Diffusion)背后的革命性技术:隐空间扩散模型
CVPR 2022!经典论文!稳定扩散模型(Stable Diffusion)背后的革命性技术:隐空间扩散模型
VideoLLaMA 3新一代前沿多模态基础模型赋能图像与视频深度理解| LLM | 计算机视觉
VideoLLaMA 3是基于Llama 3的前沿多模态基础模型,深度融合视觉、听觉与语言理解能力,支持高分辨率图像和长视频的端到端分析。其核心技术包括统一的视听语言架构、高效长视频词元化和万亿级多
AAAI2025!北理工团队提出FBRT-YOLO:面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测
论文《FBRT-YOLO: Faster and Better for Real-Time Aerial Image Detection》提出了一种针对航拍图像目标检测的优化方法。
视频编辑的新成果!港科大&蚂蚁集团提出Ditto框架刷新SOTA!
论文标题:Scaling Instruction-Based VideoEditing with a High-Quality Synthetic Dataset 作者团队:香港科大、蚂蚁集团、浙江大
CVPR 2024 目标检测!开放词汇
CVPR 2024 目标检测!开放词汇 01 论文概述 论文名称:YOLO-World: Real-Time Open-Vocabulary Object Detection 会议名称:CVPR (2
【项目复现上新】突破推理瓶颈!LightLLM轻量化部署新范式,打造高性能法律智能体
本文探讨了LightLLM框架在法律智能体中的应用,解决大语言模型知识滞后和幻觉问题。通过RAG框架整合外部知识库,LightLLM实现轻量化部署与高效推理,支持多模型规模与量化策略。文章详细演示了在
【项目复现上新】LLaMA Factory 微调实践:从零构建苏东坡角色扮演大模型 | 附Lab4AI平台一键复现指南
【项目复现上新】LLaMA Factory 微调实践:从零构建苏东坡角色扮演大模型 | 附Lab4AI平台一键复现指南 这是微调后大模型的回答,随着人工智能的发展,虚拟角色不再只是冰冷的对话机器,而是
下一页
个人成就
文章被阅读
11,461
掘力值
823
关注了
0
关注者
1
收藏集
0
关注标签
17
加入于
2025-10-13