首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
特里斯丹_专注前沿深度学习算法
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
Seed1.5-VL Technical Report
SeedVL技术报告 Seed1.5-VL 代表了视觉语言建模方面的重大进步,解决了先前方法的关键局限性,同时在各种任务中建立了新的最先进的性能。该模型在 GUI 交互、游戏和视觉解谜等专业领域的优势
绝对零度:通过零数据强化自博弈推理
绝对零度:通过零数据强化自博弈推理 目录 • 引言 • 绝对零度范式 • 方法论 • 技术实现 • 实验结果 • 涌现行为 • 模型规模和性能 • 安全考量 • 局限性和未来工作 • 结论 引言 大型
VLM模型中高分辨率图像降低token数的几种方式
本文调研整理了VLM常用的高分辨率图像降低token数的方法,包括qformer、pooling、Ldp、s2wrapper等。
LLM中的强化学习:PPO、DPO、KTO等
LLM中的强化学习:PPO、DPO、KTO等。 为什么要用强化学习训练、强化学习算法发展脉络、常见的强化学习算法:PPO、DPO、KTO等等
RAG - Retrieval augmented generation 任务初探
RAG - Retrieval augmented generation 任务 什么是RAG 基于检索的方法从外部知识源(如数据库、文章或网站)访问和提取信息。生成模型擅长生成连贯且与上下文相关的文本
Deepspeed应用中涉及的知识点和tricks
本文记录了我在学习deepspeed应用中涉及到的相关知识点。 包括config重要参数解读、应用、tricks等等。
caption任务的几种评估指标:
本文调研整理了image caption 任务中几种评估指标,包括Bleu、Meteor、Rouge、Cider、Spice等。 这些指标通常不能单独使用,应结合使用以获得更全面的评估结果。
以DBRX 和 Mixtral 8*7B为例,介绍MOE模型
以DBRX 和 Mixtral 8*7B为例,介绍MOE模型。 包含MoE模型的负载均衡(辅助Loss)、router设计等。
深度学习-论文阅读笔记&开源代码
深度学习-论文阅读笔记&开源代码 深度学习-论文阅读笔记&开源代码 深度学习-论文阅读笔记&开源代码
个人成就
文章被点赞
2
文章被阅读
5,234
掘力值
211
关注了
0
关注者
3
收藏集
0
关注标签
17
加入于
2022-04-06