首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Tw_xxxx
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
6
文章 6
沸点 0
赞
6
返回
|
搜索文章
赞
文章( 6 )
沸点( 0 )
LangChain真的好用吗?谈一下LangChain封装FAISS的一些坑
LangChain 真的有这么好用吗?我发现了 LangChain 在使用过程中的一些坑,他的过度设计让我觉得难用。
从零到一打造自己的大模型(一)模型实现
最近看了很多大模型,也使用了很多大模型。对于大模型理论似乎很了解,但是好像又缺点什么,因此打算自己实现一下
从零到一打造自己的大模型(二)分词器
前言 最近看了很多大模型,也使用了很多大模型。对于大模型理论似乎很了解,但是好像又缺点什么,思来想去决定自己动手实现一个 toy 级别的模型,在实践中加深对大语言模型的理解。
从零到一打造自己的大模型(三)模型训练
前言 最近看了很多大模型,也使用了很多大模型。对于大模型理论似乎很了解,但是好像又缺点什么,思来想去决定自己动手实现一个 toy 级别的模型,在实践中加深对大语言模型的理解。
从零到一打造自己的大模型(四)SFT对话训练
前言 最近看了很多大模型,也使用了很多大模型。对于大模型理论似乎很了解,但是好像又缺点什么,思来想去决定自己动手实现一个 toy 级别的模型,在实践中加深对大语言模型的理解。
大模型训练中优化策略(数据并行、模型并行、ZeRO等)
大模型训练中的优化策略简述,包括数据并行、模型并行、ZeRO。首先分析显存占用,然后分析这些操作的原理。
个人成就
文章被点赞
2
文章被阅读
14,738
掘力值
107
关注了
1
关注者
4
收藏集
0
关注标签
0
加入于
2024-02-13