人工智能算法 - cerf的收藏集 - 掘金

人工智能算法

更多收藏集

12篇文章 · 0订阅

总结374篇相关工作，陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

大语言模型（Large Language Models, LLMs）在过去两年内迅速发展，涌现出一些现象级的模型和产品，如 GPT-4、Gemini、Claude 等，但大多数是闭源的。

机器之心
1年前
449
点赞
评论

知识蒸馏系列（一）：三类基础蒸馏算法

0 前言知识蒸馏（Knowledge Distillation，简记为 KD）是一种经典的模型压缩方法，核心思想是通过引导轻量化的学生模型“模仿”性能更好、结构更复杂的教师模型（或多模型的 ense

OpenMMLab
3年前
2.3k
1
评论

关于知识蒸馏，你一定要了解的三类基础算法

本文将对 response-based、feature-based 和relation-based 这三类基础 KD 算法进行重点介绍，为大家后续的深入研究、交流打下基础。

CV技术指南
3年前
2.3k
35
评论

大模型实践总结

随着近期ChatGPT的迅速出圈，加速了的大模型时代变革。以Transformer、MOE为代表的大模型，传统的单机单卡训练模式肯定不能满足，这时候我们就需要

吃果冻不吐果冻皮
2年前
18k
15
评论

作为普通程序员，我们该如何学习大模型（LLM），学习路线和知识体系

人在不断的驱赶下依然还有新的立足之地，这些新领地恰恰是技术延展出来的百年前的纺织工人的后代并不会接着做纺织，他可能是一名铁路工人。

代码邮递员
2年前
20k
201
23

作为普通程序员，我们该如何学习大模型（LLM），学习路线和知识体系

《深入浅出LLM基础篇》（一）：大模型概念与发展

本作者推出全新系列《深入浅出LLM》专栏，分为基础篇、进阶篇、实战篇等，本文为基础篇具体章节如导图所示，分别从大模型模型概念、经典模型、创新点、微调、分布式训练、数据集、RAG、Agent及项目实站！

GoAI
2年前
8.4k
63
8

《深入浅出LLM基础篇》（一）：大模型概念与发展

大模型推理优化技术-KV Cache

近两年大模型火出天际；同时，也诞生了大量针对大模型的优化技术。本系列将针对一些常见大模型优化技术进行讲解。

吃果冻不吐果冻皮
1年前
11k
15
3

小白的大模型入门课-第一讲

作者介绍姓名: 水拉背景: 蚂蚁金服高级技术专家，有丰富的技术经验，从外包到大厂的技术人公众号: 安琪拉的博客文章主旨标题: 花5分钟认识大模型，就5分钟发布时间: 20

安琪拉的博客
1年前
7.3k
48
15

开发也能看懂的大模型：集成学习

集成学习（Ensemble Learning）是一种通过结合多个单一模型的预测结果，从而提升整体模型性能的机器学习方法。它的核心思想是“集体智慧”，即通过组合多个弱模型（weak learners）生

三年之约
1年前
1.2k
1
评论

魔搭社区：解锁LLM大模型的无限可能｜豆包MarsCode AI刷题

什么是大模型？大型语言模型（LLM）是指那些拥有数十亿甚至上百亿参数的语言模型。这些模型通过深度学习算法，利用海量文本数据进行训练，能够理解和生成人类语言。LLM的核心优势在于其广泛的知识基础和强大

不是鱼
1年前
1.5k
51
18