前端学AI:AI相关概念介绍
本文使用简洁易懂的话术来介绍下 AI 相关概念和专业术语,让大家对 AI 去魅。
供自己以后查漏补缺,也欢迎同道朋友交流学习。
引言
AI 这是一个很大的话题,好多人都不是很了解,那我最近想学习开发 AI 全栈应用,则需要对这些概念和专业术语有个基本的了解。
那本文就会介绍下 AI 相关基础概念和专业术语,希望对大家有帮助。
AI去魅
在了解 AI 概念之前,我们要先对 AI 去魅。
AI 是工具而非主体,而是人类认知世界的媒介。它不是万能的,它只是一个工具,它不能代替人类的思考和判断。
AI 擅长数据处理与模式识别,但人类独有的想象力、创造力与批判性思维,始终是技术无法替代的“终极壁垒”。
未来的 AI 应用一定是融入千家万户的“智能工具”,不会高高在上,就好像电、钢铁等一样普通,即使它本身很复杂,但用户使用起来绝对会很简单。
基础理论层
基础理论层是人工智能的根基,相当于“AI的底层操作系统”,它通过数学原理和认知逻辑为算法提供支撑,让 AI 具备从数据中学习、推理和预测的能力。这一层包含两大核心模块:
统计学——AI的数学语言
统计学是描述和分析数据的学科,通过数学方法总结规律。
统计学核心作用
-
规律发现:通过
历史数据挖掘隐藏模式。例如:- 电商平台:通过分析用户购物记录(如“买奶粉的用户常买尿布”),优化商品推荐策略。
- 医疗诊断:根据症状与疾病概率的统计关联(如咳嗽+发烧→70%概率为流感),辅助医生判断。
-
预测与决策:利用
回归分析、贝叶斯定理等工具预测未来趋势。例如预测房价波动、股票涨跌等。
统计学关键特点
-
数据驱动:统计学不依赖主观假设,而是通过数据验证结论。例如通过
A/B测试验证广告效果,而非“凭经验猜测”。 -
概率思维:接受不确定性,用置信区间、假设检验等工具量化风险。例如:
- 天气预报中“明天下雨概率60%”即为概率判断。
-
分层抽象:从
数据清洗到模型验证形成完整流程(描述统计→推断统计→决策支持)。
统计学实现方式
-
传统方法:如 Excel 分析销售数据,发现“买手机用户60%会买耳机”。
-
现代技术:结合
机器学习算法(如逻辑回归、聚类分析)处理海量数据。例如银行用异常交易统计模型检测金融欺诈。
行为模式——AI的“读心术”
行为模式是指个体在社会中行为的规律。
行为模式核心作用
-
用户理解:通过
行为痕迹构建用户画像。例如:- 社交媒体:根据
点赞、停留时长推断用户兴趣(如常看宠物视频→推荐宠物用品)。 - 安防系统:识别异常行为(如深夜多次刷卡失败→触发警报)。
- 社交媒体:根据
-
预测与干预:预判未来行为并引导决策。例如:
- 外卖平台:预测用户周五晚上可能点餐,提前调度骑手。
行为模式分类
| 类型 | 特点 | AI应用场景 |
|---|---|---|
| 时序行为 | 按时间序列记录(如健身App记录运动频率) | 健康管理、习惯养成 |
| 群体行为 | 分析群体共性(如节假日旅游热点预测) | 城市交通调度、疫情传播建模 |
| 交互行为 | 人与系统互动(如客服对话中的情绪识别) | 智能客服、用户体验优化 |
行为模式实现原理
-
数据采集:通过
传感器、日志记录等获取原始行为数据(如手机GPS定位、网页点击流)。 -
模式识别:
- 算法工具:马尔可夫链预测行为序列,聚类算法划分用户群体。
- 深度学习:用
RNN(循环神经网络)分析时序行为(如预测用户下一个点击的页面)。
-
动态修正:通过强化学习实时更新模型。例如根据用户反馈调整推荐策略。
统计学 vs 行为模式的协同关系
| 维度 | 统计学 | 行为模式 |
|---|---|---|
| 焦点 | 数据本身的分布规律 | 行为背后的动机与逻辑 |
| 方法 | 概率模型、假设检验 | 时序分析、模式匹配 |
| 典型应用 | 金融风险评估、药物疗效分析 | 个性化推荐、自动驾驶决策 |
| 互补性 | 为行为分析提供数学验证工具 | 为统计模型注入现实场景的语义解释 |
案例:Netflix的推荐系统同时使用统计学(分析用户评分分布)和行为模式(追踪观看中断/快进行为),综合预测用户偏好。
理论延伸
-
因果推理:下一代 AI 重点方向,区分“相关性”与“因果关系”。例如:
- 统计发现“冰淇淋销量与溺水人数正相关”,但真实原因是夏季高温→需因果模型排除干扰。
-
认知基模:人类认知模式对 AI 的启发。例如用“注意力机制”模拟人脑筛选关键信息的过程。
技术实现层
技术实现层通过机器学习的规则推理、神经网络模拟和试错优化三大方法,结合神经网络的分层特征提取(CNN处理图像、Transformer解析语言)及深度学习的自动学习能力,让 AI 学会识别与决策,支撑手机相册分类、语音转文字等智能应用。
机器学习:AI的三种学习方式
AI 通过规则推理(如医疗诊断)、神经网络模仿人脑(如人脸识别)、试错学习(如游戏闯关)三种方式学习
-
查字典式学习(符号主义)
- 原理:像背单词+记规则,比如“发烧+咳嗽=感冒”
- 例子:医疗软件按专家写的规则看病,但遇到复杂情况(比如有10种症状)就懵了。
-
模仿人脑学习(连接主义)
- 原理:用人工神经网络(像大脑细胞连接),看大量例子自己总结规律。
- 例子:人脸识别系统看几万张照片后,能认出戴口罩的你。
-
试错学习(行为主义)
- 原理:像训练小狗,做对了给奖励,错了就调整。
- 例子:游戏AI反复尝试,最终找到通关秘诀。
神经网络:AI的“大脑”
像多步骤流水线,从识别线条到组合成物体,核心是图片处理(CNN)和语言理解(Transformer)两大技术
- 工作原理:像流水线分步骤理解信息
- 第一层:看出图片中的线条
- 第二层:拼成眼睛、鼻子等形状
- 第三层:判断这是人脸还是动物
两大神器:
- 图片处理专家(CNN):用“放大镜”局部观察图片,比如先看猫耳朵,再看胡须。
- 语言理解高手(Transformer):读文章时先标重点,再联系上下文理解意思(比如知道“苹果”指手机还是水果)。
深度学习:AI的“开挂”技能
自动从数据找规律,手机相册分类、语音转文字等日常功能皆基于此,无需人工教特征
核心能力:
不用人教,自己从数据里找规律
- 传统方法:人告诉 AI “猫有胡须”,它才能识别
- 深度学习方法:给 AI 10 万张猫狗照片,它自己对比发现区别
常见应用:
- 手机相册分类:自动把照片分成“家人”“旅游”“美食”
- 语音转文字:你说方言它也能听懂,还能过滤背景噪音
系统架构层
系统架构层是由三大块组成的,大模型(学霸)+ RAG(资料库)+ AI Agent(执行者)三合一,让 AI 既能懂知识、又能查最新资料、还能自主完成任务,像人类团队一样协作。
| 组件 | 角色比喻 | 核心能力 | 举个栗子🌰 |
|---|---|---|---|
| 大模型 | 超级学霸 | 知识储备、语言理解 | 能聊《三体》剧情、写代码 |
| RAG | 随身图书馆管理员 | 实时查资料、防胡说 | 回答前先翻最新政策文件 |
| AI Agent | 全能秘书 | 感知→思考→行动 | 听你说"热",自动开空调 |
大模型——AI的学霸
相当于一个读过所有维基百科+图书馆藏书+互联网资料的"学霸",既能和你聊哲学,又能帮你写代码。
核心能力:
-
知识储备:
预训练时"啃"完海量数据(比如 3000 亿字的网络文本),建立通用知识框架。- 例子:
ChatGPT能聊《三体》剧情,因为它"读过"无数科幻小说。
- 例子:
-
灵活应变:通过
微调快速变身专家。- 例子:用法律文书微调后,大模型能像律师一样分析合同条款。
-
持续学习:像人类通过对话
积累经验。- 例子:你纠正大模型的错误回答后,它会记住并改进。
局限:
- 可能"一本正经地胡说八道"(
幻觉问题) - 需要强大算力(训练一次
耗电够家庭用一年)
RAG技术——AI的查资料能力
给 AI 装了个随时联网的电子书库,回答前先查资料,避免信口开河。
系统架构:
graph LR
A[用户Query] --> B(检索模块)
B --> C[向量数据库]
C --> D[Top-K相关文档]
D --> E(生成模块)
E --> F[生成响应]
核心组件:
-
检索器(Retriever):
双塔式稠密检索:使用BERT-like模型将Query和文档映射到 768 维向量空间(如 DPR 算法)。混合检索策略:结合关键词BM25与语义向量检索,提升召回率(Hybrid Search)。
-
生成器(Generator):
注意力融合机制:在Transformer解码层引入检索内容注意力头,动态加权外部知识。溯源验证:通过对比学习对齐生成文本与检索片段,标注可信来源。
优势对比:
传统AI | RAG增强AI |
|---|---|
| 全靠记忆回答 | 实时查资料+结合记忆 |
| 容易过时(如疫情政策) | 答案随资料库更新 |
| 可能编造数据 | 每句话都有依据 |
应用场景:
- 教育辅导:学生问"量子力学是什么?",AI自动调取教材+科普视频解释
- 旅游咨询:查实时航班+当地天气+网红餐厅,生成旅行攻略
AI Agent——AI的独立行动者
像钢铁侠的贾维斯,能看(摄像头)、听(麦克风)、想(分析)、做(控制设备)的全能助手。
-
核心能力:
- 感知层:像人用五官接收信息(摄像头+麦克风+传感器)
- 决策层:分析情况做决策(判断该回复消息还是先导航)
- 执行层:执行任务(自动订机票+发邮件确认)
-
典型应用:
- 自动驾驶汽车:看到红灯停,遇到障碍绕行
- 智能管家:根据主人作息自动调节空调温度
工作流图示
graph LR
A[用户提问] --> B{RAG查资料}
B -->|查政策/订单数据| C[大模型生成回答]
C --> D[AI Agent执行]
D --> E[创建工单+预约快递]
style B fill:#FFD700,stroke:#333
style C fill:#87CEEB,stroke:#333
style D fill:#98FB98,stroke:#333
技术演进图示
基础能力层
🌱 基础能力
├─ 📊 统计学(AI的"算数能力")
│ │ ※ 教会AI处理数据:回归分析/概率计算
│ └─ ➡️ 机器学习(AI的"自学能力")
│ │ ※ 模式识别:图像分类(CNN)/趋势预测(LSTM)
│ └─ ➡️ 行为分析(AI的"人性理解")
│ ※ 用户画像构建/情感识别(如客服对话情绪分析)
高级应用层
🚀 高级应用
└─ 🤖 智能助手 = 三大技术融合
│
├─ 🧠 大模型(知识脑)
│ ※ 通识能力:ChatGPT 级语言理解
├─ 🔍 RAG(资料眼)
│ ※ 实时检索:像人类查手册回答问题
└─ 🛠️ Agent(执行手)
※ 自动操作:订机票/写邮件/控设备
技术演进案例说明
电商价格预测系统:
graph TD
A[历史销售数据] --> B(统计学分析)
B --> C{机器学习训练}
C --> D[预测模型]
D --> E(RAG更新实时数据)
E --> F[Agent自动调价]
F --> G((动态定价))
style B fill:#F0E68C,stroke:#333
style C fill:#ADD8E6,stroke:#333
style F fill:#98FB98,stroke:#333
关键步骤:
- 统计学打底:分析历史数据分布(如正态分布检验)
- 机器学习建模:用
XGBoost训练价格-销量关系模型 - RAG增强:实时抓取竞品价格/促销活动数据
- Agent执行:根据模型输出自动调整商品标价