首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Pickup
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
10
文章 10
沸点 0
赞
10
返回
|
搜索文章
最新
热门
深度强化学习(一)术语概念
强化学习基本概念和术语解析。强化学习的理念是 Agent 通过与环境交互并获得正负反馈从而学习与环境交互的行为方式。
从零到一打造自己的大模型(四)SFT对话训练
前言 最近看了很多大模型,也使用了很多大模型。对于大模型理论似乎很了解,但是好像又缺点什么,思来想去决定自己动手实现一个 toy 级别的模型,在实践中加深对大语言模型的理解。
从零到一打造自己的大模型(三)模型训练
前言 最近看了很多大模型,也使用了很多大模型。对于大模型理论似乎很了解,但是好像又缺点什么,思来想去决定自己动手实现一个 toy 级别的模型,在实践中加深对大语言模型的理解。
从零到一打造自己的大模型(二)分词器
前言 最近看了很多大模型,也使用了很多大模型。对于大模型理论似乎很了解,但是好像又缺点什么,思来想去决定自己动手实现一个 toy 级别的模型,在实践中加深对大语言模型的理解。
从零到一打造自己的大模型(一)模型实现
最近看了很多大模型,也使用了很多大模型。对于大模型理论似乎很了解,但是好像又缺点什么,因此打算自己实现一下
LangChain真的好用吗?谈一下LangChain封装FAISS的一些坑
LangChain 真的有这么好用吗?我发现了 LangChain 在使用过程中的一些坑,他的过度设计让我觉得难用。
大模型训练中优化策略(数据并行、模型并行、ZeRO等)
大模型训练中的优化策略简述,包括数据并行、模型并行、ZeRO。首先分析显存占用,然后分析这些操作的原理。
Attention Is All You Need 阅读详记-结合代码实现
详细的阅读原文章,同时结合之前代码实现,希望能加深对模型结构的理解。 这次做到双语对照,以便之后回顾。
transformers 阅读:BERT 模型
想深入理解 BERT 模型,在阅读 transformers 库同时记录一下。 笔者小白,错误的地方请不吝指出。
Pytorch 从零实现 Transformer
之前虽然了解过 Transformer 架构,但是没有自己实现过。 最近阅读 transformers 库中 Llama 模型结构,于是想试着亲手实现一个简单的 Transformer。
下一页
个人成就
文章被点赞
81
文章被阅读
19,028
掘力值
553
关注了
2
关注者
55
收藏集
0
关注标签
10
加入于
2023-09-05