首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
jtw1234
掘友等级
悉尼大学学生
Attention and my blog is all your need.....
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
12
文章 12
沸点 0
赞
12
返回
|
搜索文章
最新
热门
拆解大模型四:ChatGPT是怎么调教出来的???
拆解大模型四:ChatGPT 不是"训练出来的",是"驯化出来的" 很多人以为大模型的训练就是: 这个理解只对了三分之一。 真实的训练过程分三个完全不同的阶段,目标、数据、方法全不一样。理解这三个阶段
拆解大模型三:你不会真以为 Attention 是大模型的主角吧
拆解大模型三:你以为 Attention 是主角,其实它只占了一半参数 学完 Attention,很多人会有个错觉: 错了。 一个标准的 Transformer Block 里,FFN(前馈网络)占的
拆解大模型二:Transformer 最核心的设计,其实你高中就学过
拆解大模型二:Transformer 最核心的设计,其实你高中就学过 Attention 机制,很多人觉得它神秘、复杂、充满线性代数。 但如果我告诉你,它的核心运算——两个向量做点积,算相似度——是你
拆解大模型 《一》:语言模型到底在做什么?
拆解大模型1:语言模型到底在做什么? 2023年第一次用 ChatGPT 的时候,我有点懵。也有点不愿意接受和相信 它能帮我写代码、改文章、解释我没看懂的论文——感觉不像在用工具,更像在跟一个真人协作
尊重算法-->你就是下一个赋能哥
深度解析:无畏契约(VALORANT)的匹配机制与隐藏分系统 前言 作为一款战术射击游戏,《无畏契约(Valorant)》在竞技平衡性上做得极其严谨。许多玩家在经历「赢一场只加 13 分、输一场掉 2
【碎片八股文 #006】RunLoop 为什么能让主线程不退出?
【碎片八股文 #006】RunLoop 为什么能让主线程不退出? 一、面试题原文 面试官: 为什么 iOS 的主线程不会像普通线程一样执行完就退出?RunLoop 在其中起什么作用? 候选人: R
【碎片八股文 #005】Hermes 引擎和 JSC 有什么区别?
【碎片八股文 #005】Hermes 引擎和 JSC 有什么区别? 一、面试题原文 面试官: React Native 为什么要推出 Hermes 引擎?它和 JavaScriptCore 有什么区
【碎片八股文 #004】Activity 是如何从点击图标到启动界面的?
【碎片八股文 #004】Activity 是如何从点击图标到启动界面的? 一、面试题原文 面试官: 从用户点击桌面图标,到 Activity 界面显示出来,中间经历了哪些步骤? 候选人: 先启动应
【碎片八股文 #003】ARC 为什么能自动管理内存?
【碎片八股文 #003】ARC 为什么能自动管理内存? 一、面试题原文 面试官: iOS 的 ARC 是怎么实现自动内存管理的?它和垃圾回收(GC)有什么区别? 候选人: ARC 会自动释放对象吧
【碎片八股文 #002】Binder 是怎么实现跨进程通信的?
【碎片八股文 #002】Binder 是怎么实现跨进程通信的? 一、面试题原文 面试官: Android 中为什么要用 Binder 来做跨进程通信?它和传统的 IPC 方式有什么区别? 候选人:
下一页
个人成就
文章被点赞
45
文章被阅读
5,830
掘力值
379
关注了
1
关注者
20
收藏集
0
关注标签
10
加入于
2025-10-03