首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
one_day
掘友等级
developer
|
here we go
stay hungry. stay foolish
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
8
文章 5
沸点 3
赞
8
返回
|
搜索文章
最新
热门
深度学习进阶: 自然语言处理原理
文本分类原理讲解(类比手写数字识别) 核心思想对比: 手写数字识别:28×28像素图像 → 784维向量 → 神经网络 → 10个数字类别 文本分类:单词序列 → 词向量 → 神经网络 → 文本类别
深度学习入门:从感知机到手写数字识别实现
从感知机到神经网络:手写数字识别原理与实现 一、前置知识回顾 在深入理解神经网络之前,我们需要掌握几个关键的数学概念: 1. 向量与矩阵 向量:一维数组,可用于表示单个数据样本的特征 矩阵:二维数组,
SVD降维分解
核心思想:矩阵乘法的维度匹配 原始分解:A = U Σ Vᵀ A: m × n 矩阵 U: m × m 矩阵 Σ: m × n 对角矩阵 Vᵀ: n × n 矩阵 压缩过程的具体步骤 第1步:截断矩阵
反向传播
那么,反向传播到底“优化”了什么? 它优化的不是次数,而是每次迭代的“效率”和“方向性” 。 没有反向传播的“学习”是怎样的?那就好比: 随机猜测:厨师长对后厨喊:“菜不行!你们随便改点东西!”然后厨
为什么多层网络就能实现复杂图形的分类(非线性)
1、y = f(wx + b) 是一条直线,只能区分直线两侧分类,如果数据点不是线性的,则不能区分, 因为 wx + b 本身是一个线性运算(它定义了一个超平面)。激活函数 f 只是将这个线性运算的结
微调示例
原文地址 https://juejin.cn/post/7426343844595335168 1、执行微调时 需要cd切换到lora目录 MLX MLX是由苹果的机器学习研究团队推出的用于机器学习的
微调
一、如何微调 数据准备 收集高质量、领域相关的标注数据(如问答对、指令、对话等)。 清洗格式,确保数据适合大模型输入。 选择预训练模型 选择适合的开源/商业基础模型(如 Qwen、DeepSeek、L
智能体添加知识库的原理是什么
概念说明 1、微调:会改版模型参数,需要训练 通过额外训练修改模型内部参数 知识被"烘焙"到模型权重中 需要大量标记数据和计算资源 适合需要深度调整模型行为的场景 2、RAG: 检索增强生成 在运行时
python虚拟环境
直接安装numpy报错 解决办法 #``` 创建虚拟环境 激活虚拟环境 在虚拟环境中安装 numpy
大模型的参数对应感知机里面哪部分
一、感知机 1、x1到xn是输入信号,w1到wn是权重,b是偏置 2、大模型讲的参数是指,权重和偏置,x1-xn和b,总共n+1个参数。 大模型的参数本质上是所有神经元中所有权重和偏置的集合。 参数
下一页
个人成就
文章被点赞
251
文章被阅读
96,371
掘力值
3,577
关注了
50
关注者
73
收藏集
2
关注标签
15
加入于
2018-08-28