首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
艾醒
掘友等级
鸽子区佛系博主,不定时掉落文章,可私信催更
获得徽章 4
动态
文章
专栏
沸点
收藏集
关注
作品
赞
88
文章 88
沸点 0
赞
88
返回
|
搜索文章
艾醒
19天前
关注
探索大语言模型(LLM): 大模型应用与对应的硬件选型一览表
大模型应用与硬件怎么选?看这几张表就够了。不同系列的显卡,适合的人群和做的事不一样,看下面的表就清楚啦。...
1
评论
分享
艾醒
19天前
关注
大模型面试题剖析:大模型训练关键技术解析(从 RLHF 、RLAIH、DPO到 SFT)
在大模型的迭代优化过程中,如何让模型输出更符合人类预期、更适配特定任务,一直是技术研发的核心方向.。...
0
评论
分享
艾醒
25天前
关注
探索大语言模型(LLM):参数量背后的“黄金公式”与Scaling Law的启示
过去十年,人工智能领域最震撼的变革之一,是模型参数量从百万级飙升至万亿级。从GPT-3的1750亿参数到GPT-4的神秘规模,再到谷歌Gemini的“多模态巨兽”,参数量仿...
1
评论
分享
艾醒
26天前
关注
探索大语言模型(LLM):使用EvalScope进行模型评估(API方式)
EvalScope 是由阿里巴巴魔搭社区(ModelScope)开发的开源模型评估与性能基准测试框架,专注于为大语言模型(LLM)、多模态模型及其他 AI 模型提供系统化的...
1
评论
分享
艾醒
26天前
关注
探索大语言模型(LLM):大模型微调方式全解析
在大模型落地实践中,微调(Fine-tuning)是连接通用预训练能力与特定任务需求的关键环节。通过微调,我们能让在海量数据上预训练的模型“适配” 具体业务场景。本文将系统...
1
评论
分享
艾醒
26天前
关注
大模型面试题剖析:深入解析 Transformer 与 MoE 架构
在人工智能大模型飞速发展的今天,Transformer 架构无疑是撑起整个领域的 “基石”,而 MoE架构则凭借其独特的 “稀疏激活” 思路,成为突破大模型参数的关键...
1
评论
分享
艾醒
26天前
关注
探索大语言模型(LLM):一文读懂通用大模型的定义、特点与分类
在人工智能技术飞速发展的当下,通用大模型无疑是最受关注的领域之一。它凭借强大的能力打破了传统 AI 模型的局限,为各行业的智能化升级提供了全新可能。...
1
评论
分享
艾醒
29天前
关注
大模型面试题剖析:模型微调中冷启动与热启动的概念、阶段与实例解析
在人工智能模型的开发流程中,微调是让预训练模型适配特定任务、提升性能的关键环节。而在微调的启动方式上,“冷启动” 和 “热启动” 是两个高频出现但容易混淆的概念。...
1
评论
分享
艾醒
1月前
关注
探索大语言模型(LLM):Windows系统与Linux系统下的Ollama高级配置(修改模型地址、Service服务以及多卡均衡调用)
之前的文章中已经介绍了ollama在Windows环境下和Linux环境下的安装,在本篇中将重点介绍Ollama的常用配置...
0
评论
分享
艾醒
1月前
关注
大模型面试题剖析:RAG中的文本分割策略
在大语言模型(LLM)驱动的应用场景中,检索增强生成(RAG)技术愈发关键。而文本分割,作为RAG流程里的核心环节,直接影响着整个系统的性能与效果。...
3
评论
分享
艾醒
1月前
关注
探索大语言模型(LLM):Open-WebUI的安装
Open-WebUI 是一款专为大模型设计的开源可视化交互工具,它通过类 ChatGPT 的直观界面,让用户无需代码即可管理、调试和调用本地或云端的大语言模型(LLMs)...
0
1
分享
艾醒
1月前
关注
探索大语言模型(LLM):Ollama快速安装部署及使用(含Linux环境下离线安装)
Ollama 是一个开源的本地化大模型运行平台,支持用户直接在个人计算机上部署、管理和交互大型语言模型(LLMs),无需依赖云端服务。而且其混合推理的特性也使得CPU和GP...
0
评论
分享
艾醒
1月前
关注
大模型面试题剖析:大模型微调数据集构建
在大模型技术栈中,微调(Fine - tuning)是使预训练大模型适配特定领域任务的核心手段,而微调数据集作为模型训练的“燃料”,其构建的科学性与工程化程度直接决定微调效...
0
1
分享
艾醒
1月前
关注
大模型面试题剖析:大模型多模态微调技术全解析
在人工智能领域,大模型多模态微调是让模型具备跨模态理解与生成能力的关键技术。它能使模型更好地适配特定场景,在视觉问答、医疗影像诊断等诸多领域发挥重要作用。...
1
1
分享
艾醒
2月前
关注
大模型面试题剖析:大模型多机多卡微调全解析
在大模型时代,模型参数规模呈爆炸式增长,单卡训练已难以满足需求,多机多卡微调成为大模型训练与优化的关键技术。本文将从多机多卡微调的核心原理、实现方式、工程实践要点以及面临的...
0
1
分享
艾醒
2月前
关注
大模型面试题剖析:全量微调与 LoRA 微调
在当今的人工智能领域,大模型已成为推动众多应用发展的核心力量。然而,预训练的通用大模型往往无法直接完美适配各种特定的下游任务。为了让模型在特定任务中展现出卓越性能,微调技术...
0
评论
分享
艾醒
2月前
关注
大模型面试题剖析:PPO 与 GRPO 强化学习算法核心差异解析
在大模型与强化学习交叉的技术领域面试中,PPO(Proximal Policy Optimization)和GRPO这两种算法常常成为面试官考察候选人对强化学习算法理解深度...
0
评论
分享
艾醒
2月前
关注
大模型面试题剖析:大模型微调与训练硬件成本计算
在大模型技术浪潮中,“大模型微调&训练硬件成本评估” 已成面试高频考点。从底层逻辑到工程实践,每一处细节都可能成为面试官考察你技术深度的切入点。本文结合多场景知识,拆解核心...
1
评论
分享
艾醒
2月前
关注
大模型面试题剖析:Pre-Norm与Post-Norm的对比及当代大模型选择Pre-Norm的原因
在深度学习面试中,Transformer模型的结构细节和优化技巧是高频考点。其中,归一化技术(Normalization)的位置选择(Pre-Norm vs. Post-N...
0
评论
分享
艾醒
2月前
关注
大模型面试题剖析:模型微调和蒸馏核心技术拆解与考点梳理
在大模型求职面试的赛道上,模型微调和模型蒸馏是绕不开的核心技术考点。这两项技术,一个聚焦模型能力的精细打磨,一个着眼于知识迁移与效率优化,深刻影响着大模型在实际场景中的表现...
0
评论
分享
下一页
个人成就
文章被点赞
127
文章被阅读
51,853
掘力值
2,705
关注了
6
关注者
20
收藏集
0
关注标签
13
加入于
2022-03-20