首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
人工智能学习
mwq30123
创建于2025-07-23
订阅专栏
人工智能学习
等 1 人订阅
共19篇文章
创建于2025-07-23
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
RLHF :深入解析奖励模型 (Reward Model)
GPT-RLHF :深入解析奖励模型 (Reward Model) 从 ChatGPT 到 Claude,再到各种开源大模型,它们惊艳表现的背后,除了不断增长的参数规模,还有一个至关重要的技术——基于
GPT:GELU (Gaussian Error Linear Unit) 激活函数详解
GELU (Gaussian Error Linear Unit) 激活函数详解 1. 概述 GELU,全称为“高斯误差线性单元”,是一种高性能的、平滑的激活函数。与 ReLU 及其变体(如 Leak
Transformer: LayerNorm层归一化模块详解(PyTorch实现)
从零实现 LayerNorm:PyTorch 自定义层归一化模块详解 🧠 一、为什么要自定义 LayerNorm? 在深度学习模型中,归一化 (Normalization) 技术被广泛用于稳定训练和加
GPT-2技术范式解析:无监督多任务学习的概率视角
GPT-2技术范式解析:无监督多任务学习的概率视角 摘要 本文档旨在深入解析OpenAI GPT-2模型所提出的革命性思想:如何在一个统一的、无监督的生成式预训练框架下,实现多任务学习。我们将详细阐述
RNN 梯度计算详细推导 (BPTT)
RNN 梯度计算详细推导 (BPTT) 为了详细推导循环神经网络(RNN)中的梯度计算方法——沿时间反向传播(Backpropagation Through Time, BPTT),我们将使用一个最基
GPT vs BERT:一个是预言家,一个是侦探|深入理解语言模型的两大范式
GPT vs BERT:一个是预言家,一个是侦探|深入理解语言模型的两大范式 🧩 导语:AI 的“语言觉醒” 早期的自然语言模型(比如 Word2Vec、GloVe)非常“死板”: 每个词都只有一个固
GPT系列模型演进:从GPT-1到GPT-4o的技术突破与差异解析
GPT系列模型演进:从GPT-1到GPT-4o的技术突破与差异解析 自2018年OpenAI发布第一个GPT模型以来,生成式预训练Transformer(GPT)系列模型以其惊人的发展速度和不断突破的
从 Word2Vec 到 GPT:词向量的上下文进化史
🔍 从 Word2Vec 到 GPT:词向量的上下文进化史 在自然语言处理(NLP)的世界里,词向量(Word Embeddings)是最基础的构建块。它们不仅是“词语的数字化表示”,更承载着语义和上
AI模型的“返璞归真”:为何设计越来越简单,性能却持续爆发?
AI 模型的“返璞归真”:为何设计越来越简单,力量却越来越强? 如果你一直关注人工智能的发展,从 RNN、LSTM 到如今大放异彩的 Transformer、GPT、BERT,你可能会注意到一个有趣又
如何使用 OpenAI API 构建Agents
Agents 学习如何使用 OpenAI API 构建智能体 (Agents)。 原文 智能体 (Agents) 表示能够智能完成任务的系统,范围可以从执行简单的工作流到追求复杂的、开放式的目标。 O
Anthropic-构建高效的AI Agent
Anthropic-构建高效的AI Agent 原文 发布日期:2024年12月19日 摘要: 我们与数十个跨行业构建LLM Agent的团队合作过。一致的发现是,最成功的实现使用简单、可组合的模式,
全球AI竞赛:中美技术博弈与未来格局
全球AI竞赛2024:中美技术博弈与未来 人工分析智能指数包含7项评估:MMLU-Pro、GPQA钻石测试、人类终极考试、LiveCodeBench、SciCode、AIME和MATH-500。 截止
AI技术能力与ChatGPT发展
AI技术体系与ChatGPT发展全解析 一、AI的二元分类 分类维度 分析式AI(判别式AI) 生成式AI 本质特征 数据模式识别与决策 原创内容生成 技术范式 监督学习/分类模型 生成对抗网络/扩散
DeepSeek:中国AI推理领域的破局者与开源革命引领者
🚀 DeepSeek:中国AI推理领域的破局者与开源革命引领者 —— 重新定义大模型的效率与深度思考 🔍 一、DeepSeek是谁? 中国AI初创公司“深度求索”(DeepSeek)
国产AI大模型API入门指南:从文本生成到图片解析
国产AI大模型API入门指南:从文本生成到工具调用 在AI大模型爆发的今天,API已成为连接智能能力与现实应用的桥梁。无论是通义千问、DeepSeek还是百度文心,越来越多企业通过开放API,让开发者
AI Prompt提示词基本原则与核心技巧
1. 引言 生成式 AI 的快速发展,使我们与模型交互的方式变得尤为重要。提示词工程(Prompt Engineering)是一门关于如何精准引导大模型行为的技术。从最初的简单对话指令,到如今的多模态
使用Ollama本地部署DeepSeek大模型指南
🚀 使用Ollama部署DeepSeek大模型指南 下面是一篇面向中国国内实操的博客,系统地介绍 DeepSeek 大模型部署,涵盖硬件规划、部署方式(vLLM、Ollama),重点介绍Ollama
从规则到涌现:AI如何一步步逼近人类智能?
从规则到涌现:AI如何一步步逼近人类智能? *图:AI技术演进如同攀登能力阶梯 引言:AI的终极命题 人工智能的核心目标,是让机器能够执行需要人类智能的任务。这一看似简单的定义背后,隐藏着计算机科学界
如何写出好用的ChatGPT Prompt提示词?——从原理到实操,以“减肥食谱”为例全解析
如何写出好用的提示词?——从原理到实操,以“减肥食谱”为例全解析 ✨ 引言:提示词是使用AI的核心能力 生成式 AI(如 ChatGPT、Claude、通义千问等)已经成为内容创作、数据处理、健康生活