从零到精通:2026年入门大模型学习资源推荐

180 阅读9分钟

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里

⬇️资源覆盖从入门到进阶的LLM学习需求,适合学生、开发者及研究者。入门推荐Karpathy和吴恩达的课程,易懂且系统;复习推荐Hinton、Kiela及清华大学课程,深入且具启发性。通过理论学习与实践结合,可全面掌握大模型的核心知识与应用技能。

1. 大学课程

斯坦福大学

  • CS25: Transformers United V5 (2025)

  • 内容:探讨Transformer最新突破,邀请Google DeepMind的Denny Zhou、OpenAI的Karina Nguyen、Hongyu Ren及Meta的Andrew Brown等讲者。
  • 形式:免费开放,现场旁听或Zoom直播(每周二太平洋夏令时间15:00-16:20,北京时间周三06:00-07:20),视频上传至YouTube。
  • 资源web.stanford.edu/class/cs25/, 第一期视频:www.youtube.com/watch?v=JKb…
  • 评价:前沿性强,适合跟踪最新研究动态,适合中高级学习者。
  • CS25: Transformers United (往期)
  • 评价:内容深入,适合中高级学习者复习LLM理论。
  • 链接:www.youtube.com/watch?v=mE7…
  • 评价:★★★★☆,复习RAG的绝佳资源,适合有基础的学习者。
  • 链接:www.youtube.com/watch?v=Xfp…
  • 评价:★★★★★,入门必看,简洁清晰,适合初学者快速掌握Transformer核心。
  • 链接:www.youtube.com/watch?v=CYa…
  • 评价:★★★★☆,适合复习Transformer理论局限及视觉领域扩展。
  • V2 - Geoffrey Hinton: Representing Part-Whole Hierarchies:提出GLOM模型,增强Transformer视觉任务表现,探讨自注意力机制瓶颈。
  • V2 - Andrej Karpathy: Introduction to Transformers:系统讲解自注意力、多头注意力及Vision Transformer。
  • V3 - Douwe Kiela: Retrieval Augmented Language Models:深入RAG技术,分析其解决幻觉和时效性问题的潜力。
  • V4 - Jason Wei & Hyung Won Chung:探讨LLM直观理解、扩展律及Transformer多模态潜力。
  • CS224N: Natural Language Processing with Deep Learning
  • 内容:全面NLP课程,覆盖深度学习技术及LLM。
  • 链接web.stanford.edu/class/cs224…
  • 评价:系统性强,适合中高级学习者深入学习NLP。
  • CS324: Large Language Models

卡内基梅隆大学

  • 11-711 ANLP: Advanced Natural Language Processing

  • 内容:涵盖语言模型、序列建模、Transformer、提示与微调,提供课件下载。
  • 链接phontron.com/class/anlp2…
  • 评价:内容全面,适合中高级学习者复习NLP核心技术。

其他大学

  • 普林斯顿 COS 597G (2022): Understanding Large Language Models
  • 约翰霍普金斯 CS 601.471/671: NLP: Self-supervised Models
  • 滑铁卢大学 CS 886: Recent Advances on Foundation Models
  • 台湾大学 Introduction to Generative AI (2024)
  • 密歇根大学 LLMs and Transformers (2024)

2. 在线课程与教程

DeepLearning.AI

  • Generative AI for Everyone (吴恩达)
  • 内容:生成式AI入门,介绍大模型概念与应用。
  • 链接www.deeplearning.ai/courses/gen…
  • 评价:★★★★☆,入门必看,通俗易懂,适合零基础学习者。
  • LLM Series (吴恩达)
  • 内容:全面LLM培训。
  • 链接learn.deeplearning.ai/
  • 评价:内容丰富,适合中级学习者。
  • Getting Started with Mistral
  • Knowledge Graphs for RAG
  • Multimodal RAG: Chat with Videos

OpenAI

  • OpenAI Academy

  • 内容:免费AI课程与社区,提供《提示词大师课》等,包含实时互动活动(仅英文)。
  • 链接academy.openai.com/public/even…
  • 评价:社区驱动,适合实践者与同行交流。
  • OpenAI Cookbook

Hugging Face

  • NLP Course
  • 内容:Transformer在NLP中的应用,包含代码示例。
  • 链接huggingface.co/learn/nlp-c…
  • 评价:★★★★☆,入门必看,实践性强,适合有编程基础的初学者。
  • AI Agents Course
  • Hugging Face Learn

微软

  • Generative AI for Beginners
  • State of GPT

其他

  • Coursera: Prompt Engineering for ChatGPT
  • Cohere LLM University
  • 链接cohere.com/llmu
  • 评价:聚焦嵌入技术,适合开发者。
  • Weights & Biases AI Academy
  • Comet: LLM Evaluation
  • Anthropic: Prompt Engineering Interactive Tutorial
  • Google: Generative AI for Developers

3. 开源资源与教程

  • Andrej Karpathy
  • 链接:www.youtube.com/watch?v=7xT…
  • 评价:内容全面,适合复习。
  • 链接:github.com/karpathy/LL…
  • 评价:适合中级开发者。
  • 链接:github.com/karpathy/bu…
  • 评价:实践性强,适合动手学习。
  • 链接:www.youtube.com/playlist?li…
  • 评价:★★★★★,入门与复习必看,理论实践兼备。
  • Neural Networks: Zero to Hero:神经网络与LLM系列。
  • Build nanoGPT:从头构建GPT模型。
  • LLM101n: Let’s Build a Storyteller:LLM开发实践。
  • Deep Dive into LLMs like ChatGPT:LLM深入讲解。
  • Mistral AI Cookbook:Mistral模型使用指南。
  • LangGPT:提示工程学习。
  • LLMs From Scratch (Datawhale):从零构建LLM。
  • Hands-on LLMs:金融顾问LLM开发。
  • LLM Interview Notes:LLM面试技术准备。
  • LLM Technical Primer:LLM概念科普。
  • LLMsBook:LLM资源集合。

4. 专题资源

  • RAG(检索增强生成)
  • 扩散模型
  • 视觉Transformer
  • 交互式可视化

5. 社区与中文资源

  • 清华大学NLP公开课(刘知远团队)
  • 内容:大模型原理、微调及中文NLP应用。
  • 链接www.bilibili.com/video/BV1UG…
  • 评价:★★★★☆,中文学习者复习必看,内容本地化。
  • PromptEngineering.org:提示工程资源。
  • LLM Agents Course:LLM代理开发。

入门与复习必看课程

入门必看

  1. Andrej Karpathy - Neural Networks: Zero to Hero
  • 理由:从零讲解神经网络到LLM,理论与代码结合,教学生动。
  • 适合:零基础或有编程背景的初学者。
  • 链接:www.youtube.com/playlist?li…
  1. DeepLearning.AI - Generative AI for Everyone
  1. Hugging Face - NLP Course
  • 理由:实践导向,结合Hugging Face工具,快速上手NLP任务。
  • 适合:有Python基础的初学者。
  • 链接:huggingface.co/learn/nlp-c…
  1. 斯坦福 CS25 V2 - Andrej Karpathy: Introduction to Transformers
  • 理由:40分钟精炼讲解Transformer核心,权威且清晰。
  • 适合:初学者快速掌握注意力机制。
  • 链接:www.youtube.com/watch?v=Xfp…

复习必看

  1. 斯坦福 CS25 V2 - Geoffrey Hinton: Representing Part-Whole Hierarchies
  • 理由:Hinton的GLOM模型提供Transformer局限性与未来方向的洞见。
  • 适合:有基础的学习者梳理理论。
  • 链接:www.youtube.com/watch?v=CYa…
  1. 斯坦福 CS25 V3 - Douwe Kiela: Retrieval Augmented Language Models
  • 理由:系统讲解RAG,涵盖理论与最新架构,巩固应用知识。
  • 适合:熟悉Transformer的学习者。
  • 链接:www.youtube.com/watch?v=mE7…
  1. 清华大学NLP公开课(刘知远团队)
  • 理由:中文讲解,覆盖大模型全貌及中文应用,适合本地化复习。
  • 适合:中文背景 Andrej Karpathy - Neural Networks: Zero to Hero
  • 理由:从零讲解神经网络到LLM,理论与代码结合,教学生动。
  • 适合:零基础或有编程背景的初学者。
  • 链接:www.youtube.com/playlist?li…
  1. DeepLearning.AI - Generative AI for Everyone
  1. Hugging Face - NLP Course
  • 理由:实践导向,结合Hugging Face工具,快速上手NLP任务。
  • 适合:有Python基础的初学者。
  • 链接:huggingface.co/learn/nlp-c…
  1. 斯坦福 CS25 V2 - Andrej Karpathy: Introduction to Transformers
  • 理由:40分钟精炼讲解Transformer核心,权威且清晰。
  • 适合:初学者快速掌握注意力机制。
  • 链接:www.youtube.com/watch?v=Xfp…

复习必看

  1. 斯坦福 CS25 V2 - Geoffrey Hinton: Representing Part-Whole Hierarchies
  • 理由:Hinton的GLOM模型提供Transformer局限性与未来方向的洞见。
  • 适合:有基础的学习者梳理理论。
  • 链接:www.youtube.com/watch?v=CYa…
  1. 斯坦福 CS25 V3 - Douwe Kiela: Retrieval Augmented Language Models
  • 理由:系统讲解RAG,涵盖理论与最新架构,巩固应用知识。
  • 适合:熟悉Transformer的学习者。
  • 链接:www.youtube.com/watch?v=mE7…
  1. 清华大学NLP公开课(刘知远团队)
  • 理由:中文讲解,覆盖大模型全貌及中文应用,适合本地化复习。
  • 适合:中文背景的学习者。
  • 链接:www.bilibili.com/video/BV1UG…
  1. DeepLearning.AI - Knowledge Graphs for RAG

学习路径建议

入门路径(1-2个月)

  1. 概念入门:学习《Generative AI for Everyone》(1周),快速了解大模型全貌。
  2. Transformer基础:观看《Andrej Karpathy - Introduction to Transformers》(1天),掌握自注意力机制。
  3. 实践上手:通过《Hugging Face - NLP Course》训练简单模型(2-3周)。
  4. 深入代码:完成《Andrej Karpathy - Build nanoGPT》,从头实现GPT(2-3周)。

复习路径(1个月)

  1. 理论梳理:重温《Geoffrey Hinton - Representing Part-Whole Hierarchies》(1天),理解Transformer局限性。
  2. RAG巩固:学习《Douwe Kiela - Retrieval Augmented Language Models》和《Knowledge Graphs for RAG》(1-2周)。
  3. 中文视角:复习《清华大学NLP公开课》,梳理本地化应用(1周)。
  4. 前沿跟踪:关注CS25 V5最新讲座(web.stanford.edu/class/cs25/),了解2025年进展。

其他建议

  • 实践驱动:利用nanoGPT、LLMs From Scratch等项目进行开发实践。
  • 社区参与:加入OpenAI Academy或Hugging Face社区,与专家交流。
  • 持续学习:定期关注DeepLearning.AI、斯坦福CS25等平台更新。

{  
   "target":"简单认识我",  
   "selfInfo":{  
        "genInfo":"大厂面试官,中科院自动化所硕士(人工智能),从事数据闭环业务、RAG、Agent等,承担技术+平台的偏综合性角色。善于调研、总结和规划,善于统筹和协同,喜欢技术,喜欢阅读新技术和产品的文章与论文",  
        "contactInfo":"abc061200x, v-adding disabled",  
        "slogan""简单、高效、做正确的事",  
         "extInfo":"喜欢看电影、喜欢旅游、户外徒步、阅读和学习,不抽烟、不喝酒,无不良嗜好"  
   }   
}

学习资源推荐

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里