首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
私有化大模型系列
seeger
创建于2025-01-08
订阅专栏
私有化大模型系列
等 1 人订阅
共12篇文章
创建于2025-01-08
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
大模型私有化部署实践(十二):KTransformers部署满血671B的DeepSeek R1
专栏 私有化大模型系列 KTransformers 当前,无论是在国内还是海外市场,DeepSeek-R1的部署正掀起一股热潮,众多用户热衷于在自己的本地环境中尝试搭建完整的DeepSeek-R1系统
大模型私有化部署实践(十一):YOLO物体检测
专栏 私有化大模型系列 简介 YOLO物体检测实际上已经不太算是大模型的范畴,但因为是深度学习的领域,就放到一起说 YOLO是一种流行的实时物体检测算法,由Joseph Redmon等人在2016年提
大模型私有化部署实践(十):Prompt提示词工程
专栏 私有化大模型系列 Prompt实践,Cot以及FewShot 实践Pormpt, 这个实践相对是一个简化的流程没有使用function call或者tools, system是核心流程,用户输入
大模型私有化部署实践(九):大模型应用场景
专栏 私有化大模型系列 应用场景1 京东物流场景:大模型赋能小哥高效工作 在京东物流的日常运营中,快递小哥的工作涉及多个复杂环节,如扫码、查询详情、拨打电话、录入信息等。为了提高小哥的工作效率并优化用
大模型私有化部署实践(八):多模态大模型
专栏 私有化大模型系列 简介 多模态大模型(Multimodal Large Language Models, MLLMs)是人工智能领域的新星,它突破了传统单一模态模型的局限,能够像人类一样理解和处
大模型私有化部署实践(七):AGENT
专栏 私有化大模型系列 AGENT简介 LLM大模型相关的智能体是一种利用大型语言模型(LLM)进行复杂任务执行的人工智能系统。这些智能体通过结合LLM与关键模块,如规划和记忆,来自主感知环境、理解用
大模型私有化部署实践(六):RAG
专栏 私有化大模型系列 QAnything简介 QAnything 是一款基于 RAG(Retrieval-Augmented Generation)技术的智能问答工具,旨在通过结合检索与生成模型的能
大模型私有化部署实践(三):使用DeepSpeed多机多卡训练
DeepSpeed简介 DeepSpeed 是由微软开发的开源深度学习优化库,旨在加速大规模模型的训练和推理。它通过创新的内存优化、分布式训练技术和高效的通信策略,显著降低了训练大模型所需的计算资源和
大模型私有化部署实践(四):打造符合自身业务的垂类模型
前置 大模型私有化部署实践(一):从零开始的 Ollama 部署 大模型私有化部署实践(二):vLLM 分布式推理与性能优化 大模型私有化部署实践(三):使用DeepSpeed多机多卡训练 Llama
大模型私有化部署实践(五):蒸馏大模型
前置 大模型私有化部署实践(一):从零开始的 Ollama 部署 大模型私有化部署实践(二):vLLM 分布式推理与性能优化 大模型私有化部署实践(三):使用DeepSpeed多机多卡训练 大模型私有
大模型私有化部署实践(二):vLLM 分布式推理与性能优化
前置 前文提到大模型私有化部署实践(一):从零开始的 Ollama 部署,在私有化部署中,如果需要快速验证模型效果,Ollama 是一个不错的选择。然而,当面对生产环境的需求,尤其是在显卡资源有限或需
大模型私有化部署实践(一):从零开始的 Ollama 部署
ollama简介 Ollama 是一个开源的大模型私有化部署工具,旨在帮助企业和开发者轻松地将大型语言模型(LLMs)部署到本地环境中。随着大模型技术的快速发展,越来越多的组织希望能够在自己的基础设施