【3】AI基础知识核心笔记(重点+易混淆点)

5 阅读2分钟

AI基础知识核心笔记(重点+易混淆点)

核心:提炼核心知识点、易混淆点,简洁不冗余,贴合SRE背景和AI实践,可直接保存、快速查阅记忆。

一、核心知识点(必记,衔接实践)

  • AI整体定位:核心是“机器类人感知、思考、决策”,大模型、Agent都是AI的落地形态,服务于场景化需求(如SRE运维)。

  • 核心分类(3层核心,舍弃冗余):

  • 传统AI(基础):ML(机器学习)→ DL(深度学习),是大模型底层;conda安装的pytorch、transformers是核心支撑库。

  • 生成式AI(主流):核心“生成新内容”,代表:Deepseek、GLM(开源,本地实践重点)、Anthropic Claude、扣子(闭源,辅助测试)。

  • Agent(进阶):自主拆解任务、调用工具,代表:Hello-Agents、Clawbot,贴合SRE运维场景。

  • 底层核心技术(4个重点):

  1. Transformer架构:大模型核心,替代CNN/RNN,并行计算强,Deepseek、GLM均基于此。

  2. 模型量化:INT4/INT8,降低内存占用,适配本地Ubuntu(无GPU也能运行)。

  3. NLP:文本处理核心,模型交互、文档问答均依赖,sentencepiece库是关键工具。

  4. 工具链:conda(环境)、Docker(部署)、Ollama(模型部署)、Prometheus(监控),衔接SRE技能。

  • 实践核心逻辑:框架补全 → 本地部署(Deepseek)→ 工具联动(LangChain/Agent)→ 优化运维(SRE技能)→ 项目闭环。

  • 工具优先级:开源大模型(Deepseek、GLM)> 工具链(conda、Docker)> Agent(Hello-Agents)> 闭源模型(辅助)。

二、易混淆点(重点区分,避免踩坑)

  • ML vs DL:ML是AI分支(机器从数据学规律),DL是ML的子集(基于神经网络),大模型属于DL范畴(研究生期间的模型训练是DL应用)。

  • 开源大模型 vs 闭源大模型:

  • 开源(Deepseek、GLM):可本地部署、自定义微调,适配Ubuntu+conda,是实践核心。

  • 闭源(Anthropic Claude、扣子):仅API调用,无法本地部署,适合快速测试。

  • Agent vs 普通大模型:

  • 普通大模型:需人工输入明确指令(被动执行)。

  • Agent:自主拆解复杂任务(主动规划、调用工具),如自动排查系统故障。

  • 模型训练 vs 模型量化:

  • 训练:让模型学数据规律(研究生超算工作)。

  • 量化:降低参数精度,适配本地低配置电脑(实践重点操作)。

  • 工具链定位:conda(环境管理,已配置)、Docker(容器化部署)、Ollama(快速部署模型),三者协同支撑本地实践,均需熟练使用。

三、SRE关联重点(贴合自身优势,快速记忆)

  • SRE技能适配AI场景:容器化部署(Docker)、环境监控(Prometheus)、故障排查,可落地AI模型运维、AIOps。

  • 实践关联:Docker部署大模型、Prometheus监控模型状态、用SRE思路排查模型部署/运行故障(如容器崩溃、环境异常)。

(注:文档部分内容可能由 AI 生成)