首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大模型入门到实战
居然JuRan
创建于2024-09-04
订阅专栏
大模型入门到实战
等 18 人订阅
共49篇文章
创建于2024-09-04
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Qwen3-8B vLLM 部署调用
Qwen3-8B vLLM 部署调用 vLLM 简介 vLLM 框架是一个高效的大语言模型推理和部署服务系统,具备以下特性: 高效的内存管理:通过 PagedAttention 算法,vLLM 实现了
从零开始学大模型之大语言模型
大语言模型 4.1 什么是 LLM 在前三章,我们从 NLP 的定义与主要任务出发,介绍了引发 NLP 领域重大变革的核心思想——注意力机制与 Transformer 架构。随着 Transforme
从零开始学大模型之预训练语言模型
预训练语言模型 3.1 Encoder-only PLM 在上一章,我们详细讲解了给 NLP 领域带来巨大变革注意力机制以及使用注意力机制搭建的模型 Transformer,NLP 模型的里程碑式转变
阿里云多模态大模型岗三面面经
阿里云智能多模态大模型岗三面面经(详细问题+感受) 最近面试了 阿里云智能集团 - 多模态大模型岗位,三轮技术面,整体体验还不错。问题整体偏常规,但对项目的追问比较细致。这里整理一下完整面经,供准备类
从零开始学大模型之Transformer 架构
随着 NLP 从统计机器学习向深度学习迈进,作为 NLP 核心问题的文本表示方法也逐渐从统计学习向深度学习迈进。正如我们在第一章所介绍的,文本表示从最初的通过统计学习模型进行计算的向量空间模型、语言模
全网最全的大模型分词器(Tokenizer)总结
你应该知道大模型的输入输出的单位是token,不是单词,也不是字母【在中文语境,不是词,不是字】,那么,token是什么呢?
10分钟理解大模型的量化
量化是大模型领域中的一项关键技术,它通过降低模型参数的精度,将浮点数转换为整数或定点数,从而实现模型的压缩和优化。这样做的主要目的是减少模型的存储需求、加快推理速度,并降低模型的计算复杂度,使得大模型
MCP:基础概念、快速应用和背后原理
当Claude桌面助手自动整理会议纪要、Midjourney插件实时读取本地设计稿时,你是否好奇这些AI工具如何突破"数字牢笼"实现人机协作? 这背后离不开一项革命性协议——模型上下文协议(Model
Agent设计范式与常见框架
Agent指的是一个能够感知其环境并根据感知到的信息做出决策以实现特定目标的系统,通过大模型的加持,Agent比以往任何时候都要更加引人注目
RAG系统开发中的12大痛点及应对策略
在人工智能技术飞速发展的当下,检索增强生成(RAG)系统凭借其 “检索外部知识 + 大语言模型生成” 的模式,有效弥补了大语言模型知识时效性差、幻觉生成等问题,在智能问答、知识助手、企业知识库等领域得
模型压缩“炼金术”:剪枝、量化、知识蒸馏大揭秘
模型压缩技术正是在这样的背景下应运而生,它旨在减少模型的参数量、计算量和存储需求,同时尽量保持模型的性能。模型压缩技术就像是给大型模型做了一次 “瘦身” 手术,让它们能够在资源有限的环境中高效运行
从LoRA到QLoRA再到全量微调
从 LoRA 到 QLoRA,再到全量微调,构成了一条大模型微调的进阶路线。这条路线并不是简单的技术升级,而是根据不同的应用场景和需求,提供了多样化的选择 。在实际应用中,我们需要根据自身的资源条件、
每天拆解一个AI知识: Context Engineering
在 AI 技术飞速迭代的当下,“Context Engineering(上下文工程)” 强势闯入大众视野,在 AI 圈掀起讨论热潮,连领域权威 Karpathy 都为其发声,足见其在 AI 发展进程中
LangGraph从0到1:开启大模型开发新征程
LangGraph 不仅仅局限于电商智能客服这一场景,在智能写作辅助、智能法律咨询、智能教育辅导等众多领域,都有着广泛的应用前景。它为大模型的落地应用开辟了新的道路,让我们能够更加充分地享受到大模型技
每天拆解一个AI知识点:Scaling Law
在 AI 领域,Scaling Law(缩放定律)可以说是一个相当重要的概念,它主要描述的是模型性能与模型规模(参数量)、数据集规模、计算资源三者之间的强相关关系。简单来讲,就是模型规模越大、数据集越
大模型微调面试题全解析
大模型微调绝非易事,它涉及到深度学习、自然语言处理、机器学习等多个领域的专业知识,需要面试者对模型架构、训练算法、数据处理等方面有深入的理解和丰富的实践经验
LangChain Memory:解锁大模型记忆奥秘,打造智能交互新体验
在实际应用中,记忆对于大语言模型至关重要。以智能客服为例,客户咨询产品问题时,往往是多轮对话。如果客服系统背后的大语言模型没有记忆,客户每次都要重复之前说过的信息,体验会非常糟糕
LangChain从0到1:解锁Tools工具的无限可能
在大模型开发的广阔天地中,LangChain 宛如一颗璀璨的明星,为开发者们提供了强大的支持和便利。它就像是一个万能的工具箱,里面装满了各种实用的工具,帮助我们更高效地构建基于大语言模型的应用程序
从0到1学LangChain之Agent代理
如果把大模型比作一个超级大脑,那么 LangChain Agent 代理就像是这个大脑的 “智能助手”。当我们向大模型提出一个复杂问题时,它不再只是单纯地凭借自身的知识储备来回答,而是借助 Agent
LangChain从0到1实战:手把手教你实现RAG
LangChain从0到1实战:手把手教你实现RAG 更多LangChain框架知识,搜索【码上有模力】GZH 一、引言 在大模型的广阔天地中,RAG(Retrieval-Augmented Gene
下一页