首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Weekly Papers
叶子的技术碎碎念
创建于2024-02-18
订阅专栏
每周AI论文速递,来源于Huggingface的Daily Papers,选择其中比较热门的论文。
等 21 人订阅
共61篇文章
创建于2024-02-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
每周AI论文速递(241223-241227)
Parallelized Autoregressive Visual Generation 并行化自回归视觉生成 自回归模型是视觉生成的一种强大方法,但由于其逐 Token 的序列预测过程,导致推理速
每周AI论文速递(241216-241220)
Apollo: An Exploration of Video Understanding in Large Multimodal Models Apollo: 大语言模型中视频理解探索 尽管视频感知
每周AI论文速递(241209-241213)
Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Sc
每周AI论文速递(241202-241206)
GRAPE: Generalizing Robot Policy via Preference Alignment GRAPE: 通过偏好对齐泛化机器人策略 尽管视觉-语言-动作 (VLA) 模型在多
每周AI论文速递(241125-241129)
TÜLU 3: Pushing Frontiers in Open Language Model Post-Training TÜLU 3: 推动开放语言模型后训练的前沿 语言模型后训练用于精炼行为并
每周AI论文速递(241118-241122)
LLaVA-o1: Let Vision Language Models Reason Step-by-Step LLaVA-o1: 让视觉语言模型逐步推理 大语言模型在推理能力上取得了显著进展,尤其
每周AI论文速递(241028-241101)
ROCKET-1: Master Open-World Interaction with Visual-Temporal Context Prompting ROCKET-1: 掌握开放世界交互与视觉
每周AI论文速递(241021-241025)
UCFE: A User-Centric Financial Expertise Benchmark for Large Language Models UCFE: 一个面向大语言模型的用户中心化金融
每周AI论文速递(241014-241018)
Baichuan-Omni Technical Report Baichuan-Omni 技术报告 GPT-4o 在多模态能力和交互体验方面的显著表现,使其在实际应用中扮演了重要角色,但目前尚无高性能
每周AI论文速递(241007-241011)
Addition is All You Need for Energy-efficient Language Models 加法即所需:高效能语言模型 大型神经网络在浮点张量乘法上耗费了大量计算资源。
每周AI论文速递(240930-241004)
Emu3: Next-Token Prediction is All You Need Emu3: 下一个 Token 预测的全部 尽管下一个 Token 预测被视为通向人工通用智能的有力途径,但在多
每周AI论文速递(240923-240927)
Imagine yourself: Tuning-Free Personalized Image Generation 想象你自己:无调优个性化图像生成 扩散模型在多种图像生成任务中表现出色。本研究中
每周AI论文速递(240916-240920)
InstantDrag: Improving Interactivity in Drag-based Image Editing InstantDrag: 提升基于拖拽的图像编辑中的交互性 基于拖拽的
每周AI论文速递(240909-240913)
How Do Your Code LLMs Perform? Empowering Code Instruction Tuning with High-Quality Data 你的代码大语言模型表现
每周AI论文速递(240902-240906)
SciLitLLM: How to Adapt LLMs for Scientific Literature Understanding SciLitLLM: 如何适应大语言模型以理解科学文献 科学文
每周AI论文速递(240826-240830)
Building and better understanding vision-language models: insights and future directions 构建与深化理解视觉-语
每周AI论文速递(240819-240823)
xGen-MM (BLIP-3): A Family of Open Large Multimodal Models xGen-MM (BLIP-3): 一个开放的大型多模态模型家族 本报告介绍了 x
每周AI论文速递(240812-240816)
VITA: Towards Open-Source Interactive Omni Multimodal LLM VITA:迈向开源交互式全模态大语言模型 GPT-4o 的卓越多模态能力和交互体验,
每周AI论文速递(240805-240809)
Medical SAM 2: Segment medical images as video via Segment Anything Model 2 Medical SAM 2: 利用 Segmen
每周AI论文速递(240729-240802)
每周AI论文速递系列已经创建GitHub仓库,欢迎star. SHIC: Shape-Image Correspondences with no Keypoint Supervision SHIC:
下一页