首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大模型
Galdradraumur
创建于2025-04-30
订阅专栏
大模型有关的
暂无订阅
共9篇文章
创建于2025-04-30
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
LangChain的问题
以下是关于LangChain中辅助函数行为不一致、隐藏细节以及数据类型互操作性问题的具体案例分析,结合代码示例说明: 一、辅助函数行为不一致且隐藏细节 案例1:load_qa_chain 与 Retr
数据倾斜,训练中断
在大模型开发和训练中,数据倾斜和训练中断是常见问题,可能导致训练效率低下、模型性能不佳甚至任务失败。以下是对这两个概念的详细介绍: 一、数据倾斜(Data Skew) 1. 定义 数据倾斜指数据集中的
Pipeline 在大模型中的应用
Pipeline 是将数据处理、模型训练、评估、部署等多个环节串联成自动化流程的机制。在大模型开发中,其核心作用包括: 标准化流程:确保数据处理、特征工程、训练、推理等环节的一致性和可重复性。 效率提
Hugging Face上值得关注的项目
Hugging Face 是当前最活跃的 AI 开源社区之一,涵盖了从预训练模型、数据集到工具库的全方位资源。以下分类整理值得关注的 模型、数据集、工具和社区项目,并附上具体案例和使用场景: 一、热门
Open AI 产品生态
OpenAI 提供了一系列强大的 AI 产品 和 插件,涵盖文本、图像、语音、代码生成等多个领域。以下是主要产品和插件的分类介绍: 1. 核心AI产品 (1) ChatGPT 功能:基于GPT模型的对
DeepSpeed 微调 LLaMA-2完整步骤
以下是使用 DeepSpeed 微调 LLaMA-2 的完整步骤,涵盖环境配置、数据处理、训练脚本编写和部署优化,适用于单机多卡或多机分布式场景: 1. 环境准备 (1) 硬件要求 最低配置:至少2张
Chain-of-Thought (CoT,思维链)
Chain-of-Thought (CoT,思维链) 是一种让大语言模型(LLM)分步骤推理的技术,通过模拟人类“逐步思考”的过程,显著提升模型在复杂问题上的表现。以下是通俗易懂的解释: 1. Cha
国内大模型竞争格局
国内大模型主要玩家分为 互联网巨头、AI独角兽、科研机构 三大阵营,竞争焦点从“技术突破”转向 “商业化落地”。以下是关键分析: 一、核心玩家与定位 1. 互联网巨头:资金+生态碾压 厂商 代表模型
国外主流的 大模型(LLM)云服务
以下是国外主流的 大模型(LLM)云服务 及其核心特点,按厂商分类整理: 1. OpenAI(微软合作) 服务名称:OpenAI API / Azure OpenAI Service 核心模型: GP