首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
周末程序猿
掘友等级
鹅厂程序猿
代码搬运工
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
101
文章 100
沸点 1
赞
101
返回
|
搜索文章
赞
文章( 100 )
沸点( 1 )
机器学习|从0开发大模型之Tokenizer训练
机器学习|从0开发大模型之Tokenizer训练 继续写《从0开发大模型》系列文章,本文主要介绍从头快速训练一个Tokenizer。 1、Tokenizer 什么是Tokenizer,作用是什么?对于
机器学习|从0开发大模型之模型预训练
继续写《从0开发大模型》系列文章,本文主要介绍预训练过程。 预训练是目的是让模型学习知识,需要将预处理的数据(《机器学习|从0开发大模型之数据预处理》)中生成的 pretrain_data.bin 文
机器学习|从0开发大模型之数据预处理
本文主要介绍数据的预处理。 1、找大模型的数据 前面写了一篇文章《ChatGPT|大语言模型训练有哪些开源数据集? 》(https://mp.weixin.qq.com/s?__biz=MzA3Njk
机器学习|从0开发大模型之SFT训练
继续写《从0开发大模型》系列文章,上一章主要数据数据预训练,让模型能学到句子接龙和部分语言理解能力,获取基座版本,但是用基座版本的模型的对话能力太弱了,需要用大量的数据微调,本文主要介绍如何用SFT训
机器学习|深度学习基础知识
最近在看深度学习的一些资料,发现有些基础知识比较模糊,于是重新整理了一下深度学习的基础知识。 1、基础知识 1.1 神经元 神经元是生物学的概念,神经网络的基本组成单元,神经元细胞有兴奋和抑制两种功能
云原生二十篇|Kubernetes实践
近期事情比较多,所以停更了半个月,非常抱歉,这半个月也在梳理一下自己的知识体系,寻找明年的一些规划。 今天还是继续《Kubernetes实践》,为了方便我和大家对一些知识点的理解,后续还是会在文章开始
云原生二十篇|Kubernetes基础知识
Kubernetes简称k8s,由于篇幅的原因,所以将k8s拆分为4篇文章: Kubernetes基础知识 Kubernetes核心原理 Kubernetes实践 Kubernetes源码解析...
ChatGPT|AI自制编程语言-词法解析
上一篇《ChatGPT|AI自制编程语言-从0开始》... 本文是《AI自制编程语言》系列词法解析部分,功能是将源代码中的字符序列转换为单词(Token)序列,实现主要分为如下步骤: 定义词法单元:根
“羊驼”又双叒叕升级了!LLaMA 2 Long 正式来袭!
LLaMA 2 刚发布没多久,Meta又推出了它的升级版,LLaMA 2 Long正式登场!性能上全面超越LLaMA 2。和其他竞争对手相比也丝毫不弱,甚至某些方面能超越ChatGPT(3.5)。 目
Linux高性能网络编程十谈|性能优化(网络)
上一篇文章讲了《性能优化(CPU和内存)》,这一节我们主要是聊聊网络优化。 ## 第一部分:网络性能度量 ### 1、设备度量 设备主要是指块设备,由于我们在开发过程中,需要磁盘操作,比如写日志等,所
下一页
个人成就
文章被点赞
251
文章被阅读
72,449
掘力值
2,720
关注了
81
关注者
157
收藏集
5
关注标签
41
加入于
2019-03-06