首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
coting
掘友等级
算法工程
分享是一种信仰,连接让知识更有温度
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 5
沸点 0
赞
5
返回
|
搜索文章
coting
算法工程
·
8天前
关注
数据并行训练实践:PyTorch&TensorFlow
在训练中等规模到大型深度学习模型时,单块GPU可能无法充分利用计算资源或处理足够的数据批次。数据并行是一种简单且高效的并行训练策略,通过在多张GPU上复制模型副本并分批处理...
0
评论
分享
coting
算法工程
·
8天前
关注
分布式训练原理与基础架构解析
随着大模型规模不断增长,单卡训练已经无法满足计算和存储需求。分布式训练成为模型训练的必备手段,从底层硬件基础架构到梯度同步与优化器机制,每一环节都直接影响训练效率和收敛效果...
0
评论
分享
coting
算法工程
·
9天前
关注
数据并行VS模型并行VS混合并行
随着深度学习模型规模不断增大,从几亿参数到上百亿甚至千亿参数,单块GPU已经难以承载模型训练的显存和计算需求。为了突破显存限制、提升训练速度,研究者提出了多种并行训练策略。...
0
评论
分享
coting
算法工程
·
9天前
关注
AI模型部署:从容器化到云原生架构
训练好的AI模型如果不能快速、稳定、弹性地部署到生产环境,那么再高的准确率也只是“实验室成果”。在实际工程中,我们需要应对多环境兼容、弹性伸缩、版本迭代、资源调度与监控等挑...
0
评论
分享
coting
算法工程
·
11天前
关注
一文搞懂量化、剪枝和知识蒸馏都是什么?
随着深度学习模型的参数量从百万级跃升至千亿级,部署和推理的计算、存储、带宽压力急剧增加。尤其在边缘设备和低延迟应用中,庞大的模型不仅占用显存,还拖慢推理速度。...
0
评论
分享
coting
算法工程
·
11天前
关注
AI训练中的混合精度计算技术详解
在大模型训练时代,模型参数规模动辄数百亿甚至上万亿,传统的 FP32 单精度训练 已经无法满足显存和速度的需求。混合精度技术通过在保持模型精度的同时使用更低位数的浮点格式,...
0
评论
分享
coting
算法工程
·
12天前
关注
AI训练要的数据这么多,怎么存?
训练好的AI模型如果不能快速、稳定、弹性地部署到生产环境,那么再高的准确率也只是“实验室成果”。容器化(Docker)与云原生正好为AI部署提供了统一打包、跨环境运行与自动...
2
评论
分享
coting
算法工程
·
12天前
关注
AI训练与推理的硬件需求有什么区别?
在人工智能项目的全生命周期中,训练(Training) 和 推理(Inference) 是两个至关重要的阶段。虽然它们都需要算力支持,但在计算资源、内存容量、存储系统和通信...
0
评论
分享
coting
算法工程
·
13天前
关注
GPU与TPU:AI计算硬件的核心对比
在人工智能,尤其是深度学习和大模型的浪潮中,算力已成为推动技术进步的核心引擎。GPU(图形处理器)和TPU(张量处理器)是两种主流的AI计算硬件,它们既有相似之处——都擅长...
0
评论
分享
coting
算法工程
·
13天前
关注
AI Infra-为什么AI需要专属的基础设施?
近几年,人工智能尤其是大模型的爆发式发展,让算力、存储、网络等基础资源的需求呈现指数级增长。传统的IT基础设施虽然支撑了互联网时代的业务运行,但面对AI训练和推理的超高计算...
0
评论
分享
coting
算法工程
·
14天前
关注
MCP vs A2A:理解代理系统的两类关键协议
在智能代理开发领域,随着多智能体系统和工具集成的普及,我们经常会遇到两个概念:模型上下文协议(MCP)和Agent2Agent 协议(A2A)。他们到底有什么区别,又各自有...
0
评论
分享
coting
算法工程
·
14天前
关注
Agent2Agent 协议:让智能体真正学会“对话”
在过去几年,人工智能的发展让单个智能体已经能完成越来越复杂的任务,比如写文章、做数据分析、甚至协助编程。但当任务变得更复杂、需要多个智能体分工协作时,我们就会遇到一个问题:...
0
评论
分享
coting
算法工程
·
15天前
关注
什么是Agent?
在大模型快速发展的今天,我们经常会听到一个词:Agent(智能体)。简单来说,Agent 就是一个基于大模型的“智能助手”,它不仅仅能回答问题,还能记住上下文、进行任务规划...
0
评论
分享
coting
算法工程
·
15天前
关注
Function Calling:让语言模型调用外部功能
在现代 AI 系统中,语言模型不仅可以生成文本,还可以直接调用外部功能或服务。这种机制被称为 Function Calling。Function Calling 的原理、工...
0
评论
分享
coting
算法工程
·
18天前
关注
场景驱动的大模型评估:行业落地的挑战与实践
在大模型快速演进的浪潮中,模型参数量、推理速度、通用能力已经不再是唯一的竞争维度。真正决定大模型商业价值的,是它能否在具体行业场景中稳定、高效、安全地落地运行。...
0
评论
分享
coting
算法工程
·
18天前
关注
大模型评估方法论:指标拆解与技术路径
本文将带你走进大模型评估的“方法论核心”,从指标拆解到技术路径,全面梳理业界常用的评估框架,帮你建立一套可落地、可复用的评估体系。...
0
评论
分享
coting
算法工程
·
19天前
关注
大模型的好坏怎么进行评估?
过去几年,大语言模型(LLM)像火箭一样发展,从几亿参数到千亿参数,从只能写几句短文到能写论文、写代码、画插图、做科研。它们的能力令人惊叹,但也让一个新问题浮出水面——它到...
0
评论
分享
coting
算法工程
·
19天前
关注
Serverless 架构下的大模型框架落地实践
随着大模型在企业场景中广泛应用,Serverless 架构因其按需弹性伸缩、免运维管理和成本优化的特点,成为大模型落地的理想选择。...
0
评论
分享
coting
算法工程
·
21天前
关注
大模型框架性能优化策略:延迟、吞吐量与成本权衡
在大模型应用和推理系统中,性能优化是关键环节。无论是 LangChain、vLLM 还是 RAG 系统,架构设计、推理策略和资源调度都会直接影响延迟、吞吐量和成本。...
0
评论
分享
coting
算法工程
·
22天前
关注
认识 Unsloth 框架:大模型高效微调的利器
在大语言模型(LLM)应用快速发展的背景下,如何高效地在消费级硬件上进行模型的微调与部署,成为了开发者们普遍关注的问题。Unsloth 框架正是在这样的需求下应运而生。...
1
评论
分享
下一页
个人成就
文章被点赞
18
文章被阅读
6,946
掘力值
1,400
关注了
0
关注者
8
收藏集
0
关注标签
23
加入于
2025-05-27