大模型原理

大模型原理

大模型原理

大模型基础原理，数学推导，论文介绍，训练介绍

等 2 人订阅共12篇文章创建于2024-04-18

Agent让大模型从“解释问题”到“解决问题”

背景大语言模型在解决对话类问题有了很大突破，然而在实际世界我们往往希望大模型能把各种言语“指令”、操作流程变成实际的产出。从解释问题到解决问题。举一个例子来讲：我们问大模型该怎么画一幅水彩画，大模型

1年前
480
1
评论

Agent让大模型从“解释问题”到“解决问题”

如何训练出模型的推理规划能力

背景近期opanai对AGI做了等级划分；等级划分意味着AGI有了一个考核定义，有了升级打怪的评价指标。并给出了目前openai正处在第一级，即将达到第二级的论断。预计在一年或者一年半内实现第二级，

1年前
253
1
评论

Qwen2-Audio产品说明

产品特点两种交互模式：Qwen2-Audio有两种不同的音频交互模式——语音聊天模式和音频分析模式。在语音聊天模式下，用户可以与Qwen2-Audio自由进行语音互动，无需文本输入。在音频分析模式下

1年前
555
点赞
评论

Qwen2-Audio产品说明

全同态加密在大模型上应用

密码学简介上文的图例基本展示了常见加密体系。加密体系，如果用比较正式的描述方法，无疑是做了三件事：首先，通过一个生成算法 𝐾𝑒𝑦𝐺𝑒𝑛(1𝜆) 来随机生成一对用于加密和解密的密钥 (𝐸𝑛𝑐𝐾𝑒𝑦,

1年前
435
1
评论

类人笔触的模型风格化绘画

摘要本文提出了一种图像到绘画翻译方法，该方法能够生成生动逼真的绘画艺术作品，并且具有可控的风格。与以往将图像到图像翻译方法视为像素级预测不同，我们在这个向量化的环境中处理这种艺术创作过程，并生成一系

1年前
706
1
评论

字就是图,实现语义排版

“字即图”是一种语义排版技术，其中的单词插图展示了单词意义的可视化，同时保持了其可读性。我们提出了一种自动创建“字即图”插图的方法。这项任务极具挑战性，因为它需要对单词的语义理解以及如何在视觉上令人愉

1年前
185
点赞
评论

无偏扭曲区域采样在可微分渲染中的应用

图1. 可微渲染计算光传输方程的导数。为了处理可见性的存在，最近的基于物理的可微渲染器需要显式地找到边界点[Li等人2018; Zhang等人2020]，或者通过启发式方法近似边界贡献[Loubet等

1年前
176
点赞
评论

无偏扭曲区域采样在可微分渲染中的应用

AIGC之视频生成--连贯动作序列生成

背景 2023年应该是AIGC走向大众视野，让大众可知可感并且参与其中的一年。但是从基于AIGC的创业的创意和产品来看，显然创业者对AIGC的理解还是过于保守，对于AIGC的发展历史技术的演进、平行的

1年前
368
1
评论

AIGC之视频生成--连贯动作序列生成

AIGC之图片生成——基于检索的图生成

项目代码：https://github.com/liangwq/Chatglm_lora_multi-gpu/tree/main/APP_example AIGC之图片生成——基于clip内容检索背

1年前
818
1
评论

AIGC之图片生成——基于检索的图生成

基于扩散的生成模型架构理论综述

现有的生成建模技术在很大程度上可以根据它们如何表示概率分布分为两类。1.基于似然的模型，通过（近似）最大似然直接学习分布的概率密度（或质量）函数。典型的基于似然的模型包括自回归模型、归一化流动模型、基

1年前
122
点赞
评论

基于扩散的生成模型架构理论综述

物理学视角讲解diffusion生成模型——混合高斯扩散模型

学习评分函数想要通过逆向扩散从某个目标分布中抽样——其功能形式未知，我们只能通过抽样来学习——但这需要我们知道对应于目标分布的评分函数。知道评分函数，即这个分布对数的梯度，似乎等同于知道分布本身。我

1年前
432
1
评论

物理学视角讲解diffusion生成模型——混合高斯扩散模型

物理学视角讲解diffusion生成模型——数学基础和一维度实现

从物理学的视角来看扩散过程模型。之所以整理这个系列是因为现在大部份讲生成模型的教程都是直接从加噪、去噪、然后代码实现角度来讲。然而为什么要这么加噪、去噪、为什么要高斯拟合，如果我不这么做会怎么样，后续

1年前
514
1
评论

物理学视角讲解diffusion生成模型——数学基础和一维度实现