transfromer理解 - WingDust的收藏集 - 掘金

transfromer理解

更多收藏集

31篇文章 · 0订阅

春哥的Agent通关秘籍05：工具调用 Function Calling【知识与思路篇】

LLM 问世之后，很长一段时间，人们发现了很多用例可以证明：AI不行啊，不是人工智能，而是人工智障。

摸鱼的春哥
2月前
912
12
评论

春哥的Agent通关秘籍05：工具调用 Function Calling【知识与思路篇】

17.1K star！两小时就能训练出专属于自己的个性化小模型，这个开源项目让AI触手可及！

🔥「只需一张消费级显卡，2小时完成26M参数GPT训练！」 🌟「从零构建中文大模型的最佳实践指南」 🚀「兼容OpenAI API，轻松接入各类AI应用平台」

小华同学ai
1年前
1.6k
20
1

17.1K star！两小时就能训练出专属于自己的个性化小模型，这个开源项目让AI触手可及！

Transformer : 深度神经网络中的残差连接 (Residual Connection)

** Transformer:深度神经网络中的残差连接 (Residual Connection)** 1. 概述随着深度学习的发展，神经网络的深度不断增加，以期获得更强的表达能力。然而，简单的堆叠

mwq30123
5月前
751
点赞
评论

Transformer : 深度神经网络中的残差连接 (Residual Connection)

通过“单词补全”演示 Transformer 原理（Python代码可运行）

我们来选一个简单、直观、适合教学的场景 —— 🎯 场景选择：字符级序列补全（Char-Level Sequence Completion）比如：输入："hel" → 输出："hello" 输入

Juchecar
7月前
327
5
评论

从GPT-1到GPT-2的性能飞跃及其驱动因素分析

从GPT-1到GPT-2的性能飞跃及其驱动因素分析摘要本文档旨在对OpenAI GPT系列模型从第一代（GPT-1）到第二代（GPT-2）所实现的显著性能飞跃，进行深入的技术原因剖析。GPT-1开

mwq30123
6月前
282
点赞
评论

一文讲清 PyTorch 中反向传播（Backpropagation）的实现原理

我们用生活化比喻 + 图解 + 代码示例 + 分步拆解，向初学者彻底讲清楚： 🎯 PyTorch 中反向传播（Backpropagation）的实现原理 —— 通俗易懂版一、生活化比喻：开餐馆调配方

Juchecar
7月前
408
2
评论

彻底搞懂 RoPE：位置编码的新范式

在 Transformer 架构中，位置编码是理解序列顺序的关键机制。自从 Google 提出原始的 Sinusoidal 编码以来，研究者一直在探索更高效、可泛化的方式。

aicoting
7月前
1.2k
1
评论

彻底搞懂 RoPE：位置编码的新范式

从原理到实战：RLHF（人类反馈强化学习）完整流程

RLHF（Reinforcement Learning with Human Feedback）是近年来推动大语言模型（LLM）快速发展的关键技术之一。

aicoting
7月前
685
1
评论

从原理到实战：RLHF（人类反馈强化学习）完整流程

全网最全的大模型分词器（Tokenizer）总结

你应该知道大模型的输入输出的单位是token，不是单词，也不是字母【在中文语境，不是词，不是字】，那么，token是什么呢？

居然JuRan
7月前
609
2
评论

全网最全的大模型分词器（Tokenizer）总结

亲手算一遍神经网络的反向传播，才算入门深度学习！

引言想象一下，你正在教一个孩子识别猫和狗的照片。刚开始，孩子总是搞错，把猫说成狗，把狗说成猫。但是每次犯错后，你都会告诉他："不对，这是猫！"然后孩子会调整自己的判断标准，下次遇到类似的照片时就能做

不惑_
7月前
514
2
评论

亲手算一遍神经网络的反向传播，才算入门深度学习！