千里足下

此为我得读书笔记专用小号。没必要关注。有需要请看原文。

赞

0

|

搜索文章

8月前

[笔记]通义万相AI生视频—使用指南

原文提示词公式提示词用来描述视频中所包含的内容和运动过程，它是控制视频画面内容与效果的关键因素。提示词描述越完整，精确，丰富，生成视频的品质越高，且越贴近期望生成的内容...

0

评论

8月前

[笔记][大模型学习]26-基于本地大模型的AI试题系统（方案篇）

AI客服 AI聊天伴侣注重语气，风格，特色。题库：数学，历史，英语考试系统。试题讲解学院内部的AI试题 AI项目开发流程数据（需求）方案模型训练，评测 ...

0

评论

10月前

[笔记][每日追新]20250415

新开一个栏目，记录每天看AI资讯的内容。快速浏览内容。即梦也有多维表格使用controlnet可以控制视频生成。技术又发展了。...

0

评论

1年前

[笔记][大模型学习]25-deep-seek与多卡训练

deep seek与其他模型的区别大模型多卡训练 vllm多卡推理多头注意力 ---> 多头潜在注意力 DeepSeekMoE. 提出了一种负载均衡的辅助无损策略。预...

0

评论

1年前

[笔记][大模型学习]24-多模态大模型

自然语义大模型多模态大模型模态与多模态的概念多模态的典型任务本地私有部署图文描述模型本地私有部署文生图模型大模型感知层 NLP大模型（大脑）--> 对数据理解与...

0

评论

1年前

[笔记][大模型学习]23-AutoGen_Studio搭建多智能体应用

大模型本质就是一个很大的深度学习模型。 Agent来源于强化学习（AI的分支）图像语音自然语义强化学习前3个感知问题，让计算机理解人类社会中的真实数据。幻觉问题...

0

评论

1年前

[笔记][大模型学习]22-llama-index实现RAG

幻觉，我们的大模型，是特征提取器，具备感知的能力，本身并不具备判断力。要和人一样，需要做一层逻辑。 Agent，有一定的逻辑层。想象成现实中工作的员工。幻觉问题是不能杜...

0

评论

1年前

[笔记][大模型学习]21-llama-index入门实操

llama-index 把数据和模型整合在一起。 sententence 如何选择enbeding 模型。词向量。只要保持相对正确的就可以了。起到查询和匹配的就可以。对...

0

评论

1年前

[笔记][大模型学习]20-llama-index核心组件

大模型应用微调功能：能够让现有的开源大模型理解我们自己的（私有化）数据。特点：需要做模型的二次训练（成本，风险）应用场景：当需要去改变大模型自身特性时，就得用微调...

0

评论

1年前

[笔记][大模型学习]19-OpenCompass大模型评估

量化量化的逻辑，搞个函数，除以一个数，加一个数。数据范围比较大，控制到一个范围内。低精度处理。量化和量化之后的结果，之间的误差不能过大。每层的量化，都会引入量化误...

0

评论

1年前

[笔记][大模型学习]18-LMDeploy部署大模型

XTunnel，训练速度快一些。命令行比较方便。 LMDeploy ，高效且友好的LLMs部署框架。高效的推理。动态拆分和融合张量并行。可靠的量化便捷的服务有状态推...

0

评论

1年前

[笔记][大模型学习]17-Xtuner微调大模型

xTuner微调大模型书生浦语大模型开源工具链 xTunner,对cuda貌似没啥要求。验证的数据集需要自己粘贴进去。 xTunner侧重主观评估。验证的主观评估...

0

评论

1年前

[笔记][大模型学习]16-Qwen模型打包部署（HF转GGUF&ollama+open_webui部署）

一些报错的环境经验：跟量化相关（训练，导出），一般会跟cuda版本相关推理加速（vLLM）最通用的cuda版本，cuda 11.8, 12.1 vLLM对 cuda,...

0

评论

1年前

[笔记][大模型学习]15-Qwen模型打包部署（Lora模型合并&转GGUF模型部署）

LoRA模型合并什么是GGUF LLama Factory量化微调训练如何使用llama.cpp将模型转换为GGUF open-webui部署训练过程中，会去做验证，...

0

评论

1年前

[笔记][大模型学习]14-LLaMA-Factory模型评估与QLora微调

LoRA与QLoRA 什么事GGUF LLama Factory量化微调训练如何使用llama.cpp将模型转换为GGUF AI技术路线微小模型小模型大模型 LLa...

0

评论

1年前

[笔记][大模型学习]13-LLaMA-Factory模型导出量化

LLama Factory模型量化环境配置 LLama factory模型评估 LLama Factory模型导出量化与效果对比如何用LLama factory基于之前训...

0

评论

1年前

[笔记][大模型学习]12-Lora模型合并与推理测试

LLaMa3 文本生成模型评估方法：客观评估主观评估 OpenCompass: 采用客观评测与主观评估结合的方法。分类任务中，有客观标准。但生成式任务重，客观标准没有...

0

评论

1年前

[笔记][大模型学习]11-Llama3.2模型微调

Ollama 主要是对个人用户。 Ollama上的所有大模型，都是量化版本，精度没有原始的高。对分布式推理比较弱企业一般用VLLM 只做大模型推理直接安装推理框架，...

0

评论

1年前

[笔记][大模型学习]10-llama3大模型本地调用

上次回顾数据可视化：tensorboard 模型训练时候的加速方法：混合精度运算 Hugging Face 模型微调训练 GPT2-中文生成模型定制化内容输出 model...

0

评论

1年前

[笔记][大模型学习]09-远程GPU服务器

Model Scope在线训练平台介绍微调模式全量微调对所有参数进行微调对算力和显存要求高效果最佳局部微调只调整模型部分参数，例如输出层，输入层或某些特殊层 ...

0

评论

个人成就

文章被点赞 1

文章被阅读 4,707

加入于

2025-03-28