首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
人肉推土机
掘友等级
技术架构师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
12
文章 10
沸点 2
赞
12
返回
|
搜索文章
人肉推土机
关注了
京东云开发者
技术架构师
人肉推土机
关注了
华为云开发者联盟
技术架构师
人肉推土机
技术架构师
·
1年前
举报
周五啦,
分享
评论
点赞
人肉推土机
技术架构师
·
1年前
关注
大模型高效注意力机制全解析:FlashAttention 与稀疏注意力实战
当今数字化时代,大模型已然成为推动各领域创新发展的核心力量。从智能客服助力企业高效服务客户,到医疗影像识别辅助医生精准诊断病情,再到智能驾驶为出行安全保...
1
评论
分享
人肉推土机
技术架构师
·
1年前
举报
牛马们,下班了吗
分享
2
点赞
人肉推土机
技术架构师
·
1年前
关注
AutoGen 技术博客系列 (七):状态管理与组件序列化解析
在 AutoGen 的复杂技术架构中,状态管理与组件序列化宛如两大基石,对整个系统的稳定运行、高效协作以及功能扩展起着举足轻重的作用。接下来,就让我们深入探究其内部机制,通...
0
评论
分享
人肉推土机
技术架构师
·
1年前
举报
听说这里掘友是前端比较多?
分享
2
点赞
人肉推土机
关注了
掘金安东尼
技术架构师
人肉推土机
技术架构师
·
1年前
关注
AutoGen 技术博客系列 (六):SelectorGroupChat 的原理与实践
SelectorGroupChat 是 AutoGen 中 AgentChat 应用接口里一种预设的 Team 类型,在多智能体协作完成复杂任务的场景中扮演着关键角色。...
2
评论
分享
人肉推土机
技术架构师
·
1年前
关注
一步到位!7大模型部署框架深度测评:从理论到DeepSeek R1:7B落地实战
本文深入解析主流模型部署框架(Transformers、ModelScope、vLLM、LMDeploy、Ollama、SGLang、DeepSpeed),结合其技术原理、...
0
评论
分享
人肉推土机
技术架构师
·
1年前
举报
比亚迪全系标配智驾,你被背刺了吗?
分享
8
点赞
人肉推土机
关注了
神不在的星期天
技术架构师
人肉推土机
技术架构师
·
1年前
举报
上班,开工大吉
赞过
分享
评论
1
人肉推土机
技术架构师
·
1年前
关注
AutoGen 技术博客系列 (五):智能体团队协作的深度剖析与实践
本文将深入探讨 AutoGen 中的智能体团队协作机制,包括团队创建、运行控制、反馈机制以及终止条件等核心方面,并结合实际代码示例与执行结果进行详细分析。...
0
评论
分享
人肉推土机
技术架构师
·
1年前
关注
从13B到1.3B:Deepseek-R1工业级蒸馏实战,5倍推理加速完整指南
本文详解Deepseek-R1知识蒸馏全流程:从教师模型输出概率提取、学生模型轻量化设计,到动态温度调节和注意力对齐等核心技术,结合ONNX Runtime与移动端NNAP...
1
5
分享
人肉推土机
技术架构师
·
1年前
关注
DeepSeek为何能低算力实现高性能模型?
本文介绍Deepseek实现低算力成本高性能模型。在模型架构上采用稀疏注意力机制和混合专家系统;训练方式运用渐进式蒸馏和量化感知训练;推理优化使用自适应计算和混合精度推理;...
1
评论
分享
人肉推土机
技术架构师
·
1年前
关注
大模型蒸馏:如何让小模型“继承”大模型的智慧
文章探讨大模型蒸馏技术,介绍其将大模型知识迁移至小模型以降成本、提效率的原理,通过图像分类代码案例展示实现过程,分享进阶技巧与避坑指南,分析技术内涵,还列举应用案例并展望未...
10
4
分享
人肉推土机
技术架构师
·
1年前
举报
新年好呀,祝大家财源滚滚
分享
评论
点赞
人肉推土机
赞了这篇沸点
ROG枪神4070拥有者
1年前
举报
最后两天了,站好最后一班岗
等人赞过
分享
4
4
人肉推土机
赞了这篇沸点
栖木木家
Java
·
1年前
举报
明天还能一起摸鱼的朋友们集合了
给你们看看我钩的玩偶
她叫如花
收起
查看大图
向左旋转
向右旋转
上班摸鱼
等人赞过
分享
34
15
下一页
个人成就
文章被点赞
26
文章被阅读
22,252
掘力值
472
关注了
9
关注者
28
收藏集
3
关注标签
15
加入于
2021-10-20