艾醒

鸽子区佛系博主，不定时掉落文章，可私信催更

赞

88

|

搜索文章

1月前

探索大语言模型（LLM）：大模型应用与对应的硬件选型一览表

大模型应用与硬件怎么选？看这几张表就够了。不同系列的显卡，适合的人群和做的事不一样，看下面的表就清楚啦。...

1

评论

1月前

大模型面试题剖析：大模型训练关键技术解析（从 RLHF 、RLAIH、DPO到 SFT）

在大模型的迭代优化过程中，如何让模型输出更符合人类预期、更适配特定任务，一直是技术研发的核心方向.。...

0

评论

1月前

探索大语言模型（LLM）：参数量背后的“黄金公式”与Scaling Law的启示

过去十年，人工智能领域最震撼的变革之一，是模型参数量从百万级飙升至万亿级。从GPT-3的1750亿参数到GPT-4的神秘规模，再到谷歌Gemini的“多模态巨兽”，参数量仿...

1

评论

1月前

探索大语言模型（LLM）：使用EvalScope进行模型评估（API方式）

EvalScope 是由阿里巴巴魔搭社区（ModelScope）开发的开源模型评估与性能基准测试框架，专注于为大语言模型（LLM）、多模态模型及其他 AI 模型提供系统化的...

1

评论

1月前

探索大语言模型（LLM）：大模型微调方式全解析

在大模型落地实践中，微调（Fine-tuning）是连接通用预训练能力与特定任务需求的关键环节。通过微调，我们能让在海量数据上预训练的模型“适配” 具体业务场景。本文将系统...

1

评论

1月前

大模型面试题剖析：深入解析 Transformer 与 MoE 架构

在人工智能大模型飞速发展的今天，Transformer 架构无疑是撑起整个领域的 “基石”，而 MoE架构则凭借其独特的 “稀疏激活” 思路，成为突破大模型参数的关键...

1

评论

1月前

探索大语言模型（LLM）：一文读懂通用大模型的定义、特点与分类

在人工智能技术飞速发展的当下，通用大模型无疑是最受关注的领域之一。它凭借强大的能力打破了传统 AI 模型的局限，为各行业的智能化升级提供了全新可能。...

1

评论

1月前

大模型面试题剖析：模型微调中冷启动与热启动的概念、阶段与实例解析

在人工智能模型的开发流程中，微调是让预训练模型适配特定任务、提升性能的关键环节。而在微调的启动方式上，“冷启动” 和 “热启动” 是两个高频出现但容易混淆的概念。...

1

评论

2月前

探索大语言模型（LLM）：Windows系统与Linux系统下的Ollama高级配置（修改模型地址、Service服务以及多卡均衡调用）

之前的文章中已经介绍了ollama在Windows环境下和Linux环境下的安装，在本篇中将重点介绍Ollama的常用配置...

0

评论

2月前

大模型面试题剖析：RAG中的文本分割策略

在大语言模型（LLM）驱动的应用场景中，检索增强生成（RAG）技术愈发关键。而文本分割，作为RAG流程里的核心环节，直接影响着整个系统的性能与效果。...

3

评论

2月前

探索大语言模型（LLM）：Open-WebUI的安装

Open-WebUI 是一款专为大模型设计的开源可视化交互工具，它通过类 ChatGPT 的直观界面，让用户无需代码即可管理、调试和调用本地或云端的大语言模型（LLMs）...

0

1

2月前

探索大语言模型（LLM）：Ollama快速安装部署及使用（含Linux环境下离线安装）

Ollama 是一个开源的本地化大模型运行平台，支持用户直接在个人计算机上部署、管理和交互大型语言模型（LLMs），无需依赖云端服务。而且其混合推理的特性也使得CPU和GP...

0

评论

2月前

大模型面试题剖析：大模型微调数据集构建

在大模型技术栈中，微调（Fine - tuning）是使预训练大模型适配特定领域任务的核心手段，而微调数据集作为模型训练的“燃料”，其构建的科学性与工程化程度直接决定微调效...

0

1

2月前

大模型面试题剖析：大模型多模态微调技术全解析

在人工智能领域，大模型多模态微调是让模型具备跨模态理解与生成能力的关键技术。它能使模型更好地适配特定场景，在视觉问答、医疗影像诊断等诸多领域发挥重要作用。...

1

1

2月前

大模型面试题剖析：大模型多机多卡微调全解析

在大模型时代，模型参数规模呈爆炸式增长，单卡训练已难以满足需求，多机多卡微调成为大模型训练与优化的关键技术。本文将从多机多卡微调的核心原理、实现方式、工程实践要点以及面临的...

0

1

2月前

大模型面试题剖析：全量微调与 LoRA 微调

在当今的人工智能领域，大模型已成为推动众多应用发展的核心力量。然而，预训练的通用大模型往往无法直接完美适配各种特定的下游任务。为了让模型在特定任务中展现出卓越性能，微调技术...

0

评论

2月前

大模型面试题剖析：PPO 与 GRPO 强化学习算法核心差异解析

在大模型与强化学习交叉的技术领域面试中，PPO（Proximal Policy Optimization）和GRPO这两种算法常常成为面试官考察候选人对强化学习算法理解深度...

0

评论

2月前

大模型面试题剖析：大模型微调与训练硬件成本计算

在大模型技术浪潮中，“大模型微调&训练硬件成本评估” 已成面试高频考点。从底层逻辑到工程实践，每一处细节都可能成为面试官考察你技术深度的切入点。本文结合多场景知识，拆解核心...

1

评论

2月前

大模型面试题剖析:Pre-Norm与Post-Norm的对比及当代大模型选择Pre-Norm的原因

在深度学习面试中，Transformer模型的结构细节和优化技巧是高频考点。其中，归一化技术（Normalization）的位置选择（Pre-Norm vs. Post-N...

0

评论

2月前

大模型面试题剖析：模型微调和蒸馏核心技术拆解与考点梳理

在大模型求职面试的赛道上，模型微调和模型蒸馏是绕不开的核心技术考点。这两项技术，一个聚焦模型能力的精细打磨，一个着眼于知识迁移与效率优化，深刻影响着大模型在实际场景中的表现...

0

评论

个人成就

文章被点赞 128

文章被阅读 54,065

掘力值 2,710

加入于

2022-03-20