千里足下

此为我得读书笔记专用小号。没必要关注。有需要请看原文。

赞

0

|

搜索文章

[笔记][大模型学习]18-LMDeploy部署大模型

XTunnel，训练速度快一些。命令行比较方便。 LMDeploy ，高效且友好的LLMs部署框架。高效的推理。动态拆分和融合张量并行。可靠的量化便捷的服务有状态推理卓越的兼容性量化工具比

11月前
92
点赞
评论

[笔记][大模型学习]17-Xtuner微调大模型

xTuner微调大模型书生浦语大模型开源工具链 xTunner,对cuda貌似没啥要求。验证的数据集需要自己粘贴进去。 xTunner侧重主观评估。验证的主观评估，提几个关键问题。一般是甲方

11月前
57
点赞
评论

[笔记][大模型学习]16-Qwen模型打包部署（HF转GGUF&ollama+open_webui部署）

一些报错的环境经验：跟量化相关（训练，导出），一般会跟cuda版本相关推理加速（vLLM）最通用的cuda版本，cuda 11.8, 12.1 vLLM对 cuda, torch, transf

11月前
116
点赞
评论

[笔记][大模型学习]15-Qwen模型打包部署（Lora模型合并&转GGUF模型部署）

LoRA模型合并什么是GGUF LLama Factory量化微调训练如何使用llama.cpp将模型转换为GGUF open-webui部署训练过程中，会去做验证，需要调到验证也能过的阈值，才

11月前
115
点赞
评论

[笔记][大模型学习]14-LLaMA-Factory模型评估与QLora微调

LoRA与QLoRA 什么事GGUF LLama Factory量化微调训练如何使用llama.cpp将模型转换为GGUF AI技术路线微小模型小模型大模型 LLama Factory 怎么做

11月前
348
点赞
评论

[笔记][大模型学习]13-LLaMA-Factory模型导出量化

LLama Factory模型量化环境配置 LLama factory模型评估 LLama Factory模型导出量化与效果对比如何用LLama factory基于之前训练的权重继续训练每一个大模

11月前
467
点赞
评论

[笔记][大模型学习]12-Lora模型合并与推理测试

LLaMa3 文本生成模型评估方法：客观评估主观评估 OpenCompass: 采用客观评测与主观评估结合的方法。分类任务中，有客观标准。但生成式任务重，客观标准没有。需要客观加主观综合一起。

11月前
80
点赞
评论

[笔记][大模型学习]11-Llama3.2模型微调

Ollama 主要是对个人用户。 Ollama上的所有大模型，都是量化版本，精度没有原始的高。对分布式推理比较弱企业一般用VLLM 只做大模型推理直接安装推理框架，调用大模型用的 transf

11月前
101
点赞
评论

[笔记][大模型学习]10-llama3大模型本地调用

上次回顾数据可视化：tensorboard 模型训练时候的加速方法：混合精度运算 Hugging Face 模型微调训练 GPT2-中文生成模型定制化内容输出 model.eval() 测试的时候，

11月前
149
点赞
评论

[笔记][大模型学习]09-远程GPU服务器

Model Scope在线训练平台介绍微调模式全量微调对所有参数进行微调对算力和显存要求高效果最佳局部微调只调整模型部分参数，例如输出层，输入层或某些特殊层对算力和显存要求一般增量微

11月前
121
点赞
评论

个人成就

文章被点赞 1

文章被阅读 4,101

加入于

2025-03-28