大模型部署微调 - sira的收藏集 - 掘金

大模型部署微调

更多收藏集

37篇文章 · 0订阅

Qwen3 Embeding模型Lora微调实战

最近qwen又有大动作，发布Qwen3 Embeding系列模型，而且MTEB排行榜上获取多个第一，最重要的还是模型全系列开源。不得不说qwen可能已经完成rag(Retrieval-Augment

AI大模型知识
11月前
525
点赞
评论

阿里云人工智能平台PAI开源EasyDistill框架助力大语言模型轻松瘦身

阿里云人工智能平台（PAI）推出了一款新的开源工具包——EasyDistill，旨在简化大型语言模型的知识蒸馏过程，助力参数量更小但性能卓越的大模型的实际应用。

阿里云大数据AI技术
11月前
331
点赞
评论

全球首个，最接近原版 DeepSeek 开源复现来了！R1 四个月狂飙 26 倍

就在最近，Hugging Face 联创、首席科学家 Thomas Wolf 表示——DeepSeek 的出现，是开源 AI 领域的 ChatGPT 时刻！

新智元
1年前
453
点赞
评论

vLLM 实战教程汇总，从环境配置到大模型部署，中文文档追踪重磅更新

随着大语言模型（LLM）逐步走向工程化与规模化部署，其推理效率、资源利用率以及硬件适配能力正成为影响应用落地的核心问题。2023 年，加州大学伯克利分校的研究团队开源 vLLM，通过引入 PagedA

神经星星
1年前
1.1k
点赞
评论

vLLM 实战教程汇总，从环境配置到大模型部署，中文文档追踪重磅更新

🧠5个AI工程师在第一次构建RAG时常犯的错误

📦 本文是我「RAG工程实战反思系列」的第1篇，如果你也在构建基于LLM的RAG系统，建议收藏本文。文末有资料领取方式，可快速搭建实战系统框架。

果冻人工智能
1年前
282
点赞
4

🧠5个AI工程师在第一次构建RAG时常犯的错误

图像编辑开源新 SOTA，来自多模态卷王阶跃！大模型行业正步入「多模态时间」

全球 AI 大模型智能涌现，现在正在进入 “多模态时间”。一方面，全球业内各式各样的技术进展，都围绕多模态如火如荼展开。另一方面，AI 应用和落地的需求中，多模态也是最重要的能力。

量子位
1年前
413
点赞
评论

RAG全流程冠军思路! 实习or跳槽or项目实战

打造顶尖RAG系统：企业RAG挑战赛的技术启示打造顶尖RAG系统：企业RAG挑战赛的技术启示检索增强生成（Retrieval-Augmented Generation，RAG）是一种将大型语言模型

阿东玩AI
1年前
548
2
评论

RAG全流程冠军思路! 实习or跳槽or项目实战

3小时+10G显卡=你的专属AI助手？MiniMind让语言模型训练"平民化"

还在为无法训练自己的语言模型而苦恼？MiniMind项目让你用普通电脑3小时就能训练出专属小GPT！本文详细介绍这个革命性工具，并手把手教你创建个人定制模型。

GetcharZp
1年前
937
2
评论

3小时+10G显卡=你的专属AI助手？MiniMind让语言模型训练"平民化"

阿里云Funasr语音识别大模型本地部署，效果远超OpenAI的Whisper

前言前段时间测试一下OpenAI的语音识别模型当时发现效率很低，今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大： Funasr的模型

土圭垚墝
1年前
8.2k
16
3

阿里云Funasr语音识别大模型本地部署，效果远超OpenAI的Whisper

大模型微调实战：通过 LoRA 微调修改模型自我认知

本文主要分享如何使用 LLaMAFactory 实现大模型微调，基于 Qwen1.5-1.8B-Chat 模型进行 LoRA 微调，修改模型自我认知。本文的一个目的：基于 Qwen1.5-1.8B-

探索云原生
1年前
547
点赞
评论