首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
夏沫的梦
掘友等级
后端开发工程师
|
京东科技控股有限公司
现入职于京东科技,负责京东金融的AI Infra和搜索推荐工作,曾在蔚来和深信服AI算力平台部。CSDN的Go领域新星创作者,稀土掘金的优秀创作者,相信自己的努力! 做好每一个阶段该做的事情。
获得徽章 15
动态
文章
专栏
沸点
收藏集
关注
作品
赞
109
文章 105
沸点 4
赞
109
返回
|
搜索文章
最新
热门
Checkpoint断点续训详解
一 Checkpoint定义 模型在训练过程中的中间状态和结果,是大语言模型在训练过程中进行容错的一种关键技术,通过将中间状态和结果作为checkpoint保存到持久化存储,在训练任务由于异常失败时,
quantize模型量化详解
一 quantize定义 模型量化,又称为模型压缩,是指以较低的推理精度损失将连续取值(通常为float32或者大量可能的离散值)的浮点型权重近似为有限多个离散值(通常为int8或int4)的过程。通
DeepSpeed模型训练加速详解
一 DeepSpeed定义 DeepSpeed是一个由微软开发的开源深度学习优化库,基于pytorch构建,旨在提高大规模模型训练的效率和可扩展性。它通过多种技术手段来加速训练,包括模型并行化、梯度累
Seldon Core大模型部署详解
一 Seldon Core定义 Seldon Core 目前是机器学习模型部署领域最受欢迎的方案之一,由 Seldon 公司开源和维护,旨在为不同框架下训练出来的模型(Tensorflow,Pytor
LoRA详解
一 LoRA定义 Low-Rank Adaption of Large Language Models,大语言模型的低秩适应,是一种PEFT(参数高效性微调方法),其核心思想是对大型模型的权重矩阵进行
ChatGLM详解
一 ChatGLM定义 ChatGLM是由清华技术成果转化的公司智谱AI发布的开源的、支持中英双语问答的对话语言模型系列,并针对中文进行了优化,该模型基于General Language Model(
LLaMA详解
一 LLaMA定义 Large Language Model Meta AI,由Meta AI公司于2023年2月发布的开放且高效的大型基础语言模型系列,共有7B、13B、33B、65B四种版本,旨在
LLM详解
一 定义 Large Language Model,称大规模语言模型或者大型语言模型,是一种基于大量数据训练的统计语言模型,可用于生成和翻译文本和其他内容,以及执行其他自然语言处理任务(NLP),通常
AI技术总览
为了方便大家对AI和大模型技术有更加深入的了解,接下来一段时间会开一个专题,专门用来介绍AI和大模型相关技术,专题介绍内容从以下AI技术总览展开。
如何挑选适合自己的Offer
1. 看平台: 公司背景: 了解公司的背景和声誉,包括公司规模、行业地位、历史和文化。选择一家稳定、有发展前景的公司可以为你的职业发展提供更好的保障。 团队氛围: 研究公司的团队文化和工作氛围,看看是
下一页
个人成就
优秀创作者
文章被点赞
1,333
文章被阅读
446,173
掘力值
9,660
关注了
15
关注者
382
收藏集
1
关注标签
5
加入于
2022-09-26