首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
人工智能算法
订阅
cerf
更多收藏集
微信扫码分享
微信
新浪微博
QQ
12篇文章 · 0订阅
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述
大语言模型(Large Language Models, LLMs)在过去两年内迅速发展,涌现出一些现象级的模型和产品,如 GPT-4、Gemini、Claude 等,但大多数是闭源的。
知识蒸馏系列(一):三类基础蒸馏算法
0 前言 知识蒸馏(Knowledge Distillation,简记为 KD)是一种经典的模型压缩方法,核心思想是通过引导轻量化的学生模型“模仿”性能更好、结构更复杂的教师模型(或多模型的 ense
关于知识蒸馏,你一定要了解的三类基础算法
本文将对 response-based、feature-based 和relation-based 这三类基础 KD 算法进行重点介绍,为大家后续的深入研究、交流打下基础。
大模型实践总结
随着近期ChatGPT的迅速出圈,加速了的大模型时代变革。以Transformer、MOE为代表的大模型,传统的单机单卡训练模式肯定不能满足,这时候我们就需要
作为普通程序员,我们该如何学习大模型(LLM),学习路线和知识体系
人在不断的驱赶下依然还有新的立足之地,这些新领地恰恰是技术延展出来的百年前的纺织工人的后代并不会接着做纺织,他可能是一名铁路工人。
《深入浅出LLM基础篇》(一):大模型概念与发展
本作者推出全新系列《深入浅出LLM》专栏,分为基础篇、进阶篇、实战篇等,本文为基础篇具体章节如导图所示,分别从大模型模型概念、经典模型、创新点、微调、分布式训练、数据集、RAG、Agent及项目实站!
大模型推理优化技术-KV Cache
近两年大模型火出天际;同时,也诞生了大量针对大模型的优化技术。本系列将针对一些常见大模型优化技术进行讲解。
小白的大模型入门课-第一讲
作者介绍 姓名: 水拉 背景: 蚂蚁金服高级技术专家,有丰富的技术经验,从外包到大厂的技术人 公众号: 安琪拉的博客 文章主旨 标题: 花5分钟认识大模型,就5分钟 发布时间: 20
开发也能看懂的大模型:集成学习
集成学习(Ensemble Learning)是一种通过结合多个单一模型的预测结果,从而提升整体模型性能的机器学习方法。它的核心思想是“集体智慧”,即通过组合多个弱模型(weak learners)生
魔搭社区:解锁LLM大模型的无限可能 | 豆包MarsCode AI刷题
什么是大模型? 大型语言模型(LLM)是指那些拥有数十亿甚至上百亿参数的语言模型。这些模型通过深度学习算法,利用海量文本数据进行训练,能够理解和生成人类语言。LLM的核心优势在于其广泛的知识基础和强大