首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大模型部署微调
订阅
yanyuyao
更多收藏集
微信扫码分享
微信
新浪微博
QQ
38篇文章 · 0订阅
Qwen3 Embeding模型Lora微调实战
最近qwen又有大动作,发布Qwen3 Embeding系列模型,而且MTEB排行榜上获取多个第一,最重要的还是模型全系列开源。 不得不说qwen可能已经完成rag(Retrieval-Augment
阿里云人工智能平台PAI开源EasyDistill框架助力大语言模型轻松瘦身
阿里云人工智能平台(PAI)推出了一款新的开源工具包——EasyDistill,旨在简化大型语言模型的知识蒸馏过程,助力参数量更小但性能卓越的大模型的实际应用。
全球首个,最接近原版 DeepSeek 开源复现来了!R1 四个月狂飙 26 倍
就在最近,Hugging Face 联创、首席科学家 Thomas Wolf 表示——DeepSeek 的出现,是开源 AI 领域的 ChatGPT 时刻!
vLLM 实战教程汇总,从环境配置到大模型部署,中文文档追踪重磅更新
随着大语言模型(LLM)逐步走向工程化与规模化部署,其推理效率、资源利用率以及硬件适配能力正成为影响应用落地的核心问题。2023 年,加州大学伯克利分校的研究团队开源 vLLM,通过引入 PagedA
🧠5个AI工程师在第一次构建RAG时常犯的错误
📦 本文是我「RAG工程实战反思系列」的第1篇,如果你也在构建基于LLM的RAG系统,建议收藏本文。文末有资料领取方式,可快速搭建实战系统框架。
图像编辑开源新 SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
全球 AI 大模型智能涌现,现在正在进入 “多模态时间”。 一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。 另一方面,AI 应用和落地的需求中,多模态也是最重要的能力。
RAG全流程冠军思路! 实习or跳槽or项目实战
打造顶尖RAG系统:企业RAG挑战赛的技术启示 打造顶尖RAG系统:企业RAG挑战赛的技术启示 检索增强生成(Retrieval-Augmented Generation,RAG)是一种将大型语言模型
3小时+10G显卡=你的专属AI助手?MiniMind让语言模型训练"平民化"
还在为无法训练自己的语言模型而苦恼?MiniMind项目让你用普通电脑3小时就能训练出专属小GPT!本文详细介绍这个革命性工具,并手把手教你创建个人定制模型。
阿里云Funasr语音识别大模型本地部署,效果远超OpenAI的Whisper
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
大模型微调实战:通过 LoRA 微调修改模型自我认知
本文主要分享如何使用 LLaMAFactory 实现大模型微调,基于 Qwen1.5-1.8B-Chat 模型进行 LoRA 微调,修改模型自我认知。 本文的一个目的:基于 Qwen1.5-1.8B-