首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
千里足下
掘友等级
此为我得读书笔记专用小号。没必要关注。有需要请看原文。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
[笔记][大模型学习]25-deep-seek与多卡训练
deep seek与其他模型的区别 大模型多卡训练 vllm多卡推理 多头注意力 ---> 多头潜在注意力 DeepSeekMoE. 提出了一种负载均衡的辅助无损策略。 预训练的成本会很高,需要服务器
[笔记][大模型学习]24-多模态大模型
自然语义大模型 多模态大模型 模态与多模态的概念 多模态的典型任务 本地私有部署图文描述模型 本地私有部署文生图模型 大模型感知层 NLP大模型(大脑)--> 对数据理解与分析起到决定性因素 逻辑层A
[笔记][大模型学习]23-AutoGen_Studio搭建多智能体应用
大模型本质就是一个很大的深度学习模型。 Agent来源于强化学习(AI的分支) 图像 语音 自然语义 强化学习 前3个感知问题,让计算机理解人类社会中的真实数据。 幻觉问题。当用户的提问包含较复杂逻辑
[笔记][大模型学习]22-llama-index实现RAG
幻觉,我们的大模型,是特征提取器,具备感知的能力,本身并不具备判断力。要和人一样,需要做一层逻辑。 Agent,有一定的逻辑层。 想象成现实中工作的员工。 幻觉问题是不能杜绝,但是可以减少。 环境的本
[笔记][大模型学习]21-llama-index入门实操
llama-index 把数据和模型整合在一起。 sententence 如何选择enbeding 模型。 词 向量。只要保持相对正确的就可以了。起到查询和匹配的就可以。对RAG的影响不是很大。只要是
[笔记][大模型学习]20-llama-index核心组件
大模型应用 微调 功能: 能够让现有的开源大模型理解我们自己的(私有化)数据。 特点:需要做模型的二次训练(成本,风险) 应用场景:当需要去改变大模型自身特性时,就得用微调(风格),微调本身调整的是大
[笔记][大模型学习]19-OpenCompass大模型评估
量化 量化的逻辑,搞个函数,除以一个数,加一个数。 数据范围比较大,控制到一个范围内。 低精度处理。 量化和量化之后的结果,之间的误差不能过大。 每层的量化,都会引入量化误差,如果多层之后,误差太大,
[笔记][大模型学习]18-LMDeploy部署大模型
XTunnel,训练速度快一些。命令行比较方便。 LMDeploy ,高效且友好的LLMs部署框架。 高效的推理。动态拆分和融合张量并行。 可靠的量化 便捷的服务 有状态推理 卓越的兼容性 量化工具比
[笔记][大模型学习]17-Xtuner微调大模型
xTuner微调大模型 书生 浦语 大模型开源工具链 xTunner,对cuda貌似没啥要求。 验证的数据集需要自己粘贴进去。 xTunner侧重主观评估。 验证的主观评估,提几个关键问题。一般是甲方
[笔记][大模型学习]16-Qwen模型打包部署(HF转GGUF&ollama+open_webui部署)
一些报错的环境经验: 跟量化相关(训练,导出),一般会跟cuda版本相关 推理加速(vLLM) 最通用的cuda版本,cuda 11.8, 12.1 vLLM对 cuda, torch, transf
下一页
个人成就
文章被点赞
1
文章被阅读
508
掘力值
163
关注了
0
关注者
0
收藏集
0
关注标签
12
加入于
2025-03-28