首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
mwq30123
掘友等级
Android工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
46
文章 46
沸点 0
赞
46
返回
|
搜索文章
mwq30123
Android工程师
·
2月前
关注
Transformer :前馈网络 (FFN) 深度解析
Transformer 前馈网络 (FFN) 深度解析 1. 概述与引言 前馈网络(Feed-Forward Network, FFN),在现代深度学习架构中,特指一个由两...
1
评论
分享
mwq30123
Android工程师
·
2月前
关注
GPT:GELU (Gaussian Error Linear Unit) 激活函数详解
GELU (Gaussian Error Linear Unit) 激活函数详解 1. 概述 GELU,全称为“高斯误差线性单元”,是一种高性能的、平滑的激活函数。与 Re...
0
评论
分享
mwq30123
Android工程师
·
2月前
关注
Transformer: LayerNorm层归一化模块详解(PyTorch实现)
从零实现 LayerNorm:PyTorch 自定义层归一化模块详解 🧠 一、为什么要自定义 LayerNorm? 在深度学习模型中,归一化 (Normalization...
1
评论
分享
mwq30123
Android工程师
·
2月前
关注
Transformer:多头自注意力机制详解 (PyTorch 实现)
Transformer:多头自注意力机制详解 (PyTorch 实现) 1. 概述 多头自注意力(Multi-Head Self-Attention)是 Transform...
0
评论
分享
mwq30123
Android工程师
·
2月前
关注
🚀 从 GPT-1 到 GPT-4:一场关于模型架构的宏伟演进
🚀 从 GPT-1 到 GPT-4:一场关于模型架构的宏伟演进 标签: #AI架构 #Transformer #GPT #大模型进化史 🧠 一、上下文窗口(Contex...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
AI的“物理学”:揭秘GPT-3背后改变一切的“缩放定律”
AI的“物理学”:揭秘GPT-3背后改变一切的“缩放定律” 引言:GPT-3的“魔法”时刻 2020年,当OpenAI的GPT-3横空出世时,整个科技界都为之震撼。它展现出...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
从GPT-1到GPT-2的性能飞跃及其驱动因素分析
从GPT-1到GPT-2的性能飞跃及其驱动因素分析 摘要 本文档旨在对OpenAI GPT系列模型从第一代(GPT-1)到第二代(GPT-2)所实现的显著性能飞跃,进行深入...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
GPT-2技术范式解析:无监督多任务学习的概率视角
GPT-2技术范式解析:无监督多任务学习的概率视角 摘要 本文档旨在深入解析OpenAI GPT-2模型所提出的革命性思想:如何在一个统一的、无监督的生成式预训练框架下,实...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
GPT系列模型演进:从GPT-1到GPT-4o的技术突破与差异解析
GPT系列模型演进:从GPT-1到GPT-4o的技术突破与差异解析 自2018年OpenAI发布第一个GPT模型以来,生成式预训练Transformer(GPT)系列模型以...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
从 Word2Vec 到 GPT:词向量的上下文进化史
🔍 从 Word2Vec 到 GPT:词向量的上下文进化史 在自然语言处理(NLP)的世界里,词向量(Word Embeddings)是最基础的构建块。它们不仅是“词语的...
0
评论
分享
mwq30123
Android工程师
·
3月前
关注
GPT vs BERT:一个是预言家,一个是侦探|深入理解语言模型的两大范式
GPT vs BERT:一个是预言家,一个是侦探|深入理解语言模型的两大范式 🧩 导语:AI 的“语言觉醒” 早期的自然语言模型(比如 Word2Vec、GloVe)非常...
1
评论
分享
mwq30123
Android工程师
·
3月前
关注
AI模型的“返璞归真”:为何设计越来越简单,性能却持续爆发?
AI 模型的“返璞归真”:为何设计越来越简单,力量却越来越强? 如果你一直关注人工智能的发展,从 RNN、LSTM 到如今大放异彩的 Transformer、GPT、BER...
1
评论
分享
mwq30123
Android工程师
·
3月前
关注
RNN 梯度计算详细推导 (BPTT)
RNN 梯度计算详细推导 (BPTT) 为了详细推导循环神经网络(RNN)中的梯度计算方法——沿时间反向传播(Backpropagation Through Time, B...
0
评论
分享
mwq30123
Android工程师
·
4月前
关注
如何使用 OpenAI API 构建Agents
Agents 学习如何使用 OpenAI API 构建智能体 (Agents)。 原文 智能体 (Agents) 表示能够智能完成任务的系统,范围可以从执行简单的工作流到追...
0
评论
分享
mwq30123
Android工程师
·
4月前
关注
Claude Code 自动提醒配置:让 AI 主动找你,不再盯屏等待
Claude Code 自动提醒配置:让 AI 主动找你,不再盯屏等待 用 Claude Code 写代码时,有没有这种烦恼: Claude 在后台跑任务时,你不知道它什么...
0
评论
分享
mwq30123
Android工程师
·
4月前
关注
Anthropic-构建高效的AI Agent
Anthropic-构建高效的AI Agent 原文 发布日期:2024年12月19日 摘要: 我们与数十个跨行业构建LLM Agent的团队合作过。一致的发现是,最成功的...
0
评论
分享
mwq30123
Android工程师
·
5月前
关注
Claude Code API 配置切换工具
Claude Code API 配置切换工具 (CCS) 一个用于在不同的Claude API配置之间进行切换的命令行工具。 功能 列出所有可用的API配置并提示选择 支持...
3
评论
分享
mwq30123
Android工程师
·
5月前
关注
🌈 Vibe Coding - Cursor AI Code Editor 入门指南:AI编程的新范式
🌈 Vibe Coding - Cursor AI Code Editor 入门指南:AI编程的新范式 随着 AI 助手的不断演进,编程已不再只是人类与代码的孤独对话,而...
0
评论
分享
mwq30123
Android工程师
·
5月前
关注
如何写出好用的ChatGPT Prompt提示词?——从原理到实操,以“减肥食谱”为例全解析
如何写出好用的提示词?——从原理到实操,以“减肥食谱”为例全解析 ✨ 引言:提示词是使用AI的核心能力 生成式 AI(如 ChatGPT、Claude、通义千问等)已经成为...
1
评论
分享
mwq30123
Android工程师
·
5月前
关注
AI Prompt提示词基本原则与核心技巧
1. 引言 生成式 AI 的快速发展,使我们与模型交互的方式变得尤为重要。提示词工程(Prompt Engineering)是一门关于如何精准引导大模型行为的技术。从最初的...
1
评论
分享
下一页
个人成就
文章被点赞
241
文章被阅读
144,099
掘力值
3,451
关注了
20
关注者
83
收藏集
2
关注标签
6
加入于
2017-10-23