一、概述
1.1 AI是什么
就像给机器装了个"会学习的大脑",让它们能像人一样:
- 看懂世界(比如手机相册自动识别猫狗照片)
- 听懂人话(比如叫"Siri定个闹钟")
- 自己思考(比如围棋AI阿尔法狗下棋)
1.2 AI的三大超能力(用日常例子说明)
| 能力类型 | 具体表现 | 生活实例 |
|---|---|---|
| 学习能力 | 越用越聪明 | 抖音越刷推荐越准 |
| 推理能力 | 解决新问题 | 导航软件绕开堵车路段 |
| 创造能力 | 生成新内容 | AI绘画生成动漫头像 |
1.3 AI包含哪些技术?(类比学校课程)
计算机视觉 ➔ 机器的"眼睛"(人脸识别打卡)
自然语言处理 ➔ 机器的"语文课"(智能客服聊天)
机器学习 ➔ 机器的"自习课"(通过数据自己进步)
机器人技术 ➔ 机器的"体育课"(工厂机械臂)
1.4 AI有多重要?
- 科技地位:
- 20世纪三大尖端技术:登月火箭、核电站、AI
- 21世纪三大尖端技术:基因编辑(修改生命密码)、纳米技术(超级小材料)、AI
- 实际影响:
- 医疗:AI辅助看CT片(比医生看得更快)
- 交通:自动驾驶汽车(不用手握方向盘)
- 教育:智能作业批改(老师轻松多了)
1.5 AI发展小故事
- 1956年:AI概念在达特茅斯会议诞生,就像"AI的生日"
- 1997年:IBM深蓝打败国际象棋冠军,震惊世界
- 2016年:AlphaGo战胜李世石,开启AI新纪元
举个栗子🌰:现在的AI就像小学三年级学生,会算数会背课文,但还不会自己发明新知识。未来可能会成长为大学生,甚至超越人类哦!
1.6 AI大模型划分
一、按应用场景和功能分类(就像不同专业的"AI专家")
1.自然语言处理专家(NLP大模型)
- 做什么:专门处理文字工作
- 例子:
- 手机输入法的智能纠错(把"泥豪"改成"你好")
- 作文自动批改系统(能指出语法错误)
- 自动生成短视频文案(像写广告词的小能手)
- 常见任务:就像语文课代表,擅长阅读理解/写作/翻译
2.计算机视觉专家(CV大模型)
- 做什么:专门分析图片视频
- 例子:
- 学校门口的刷脸闸机(1秒认出学生)
- 美颜相机的自动瘦脸功能
- 自动驾驶汽车识别红绿灯
- 特殊技能:像美术老师,能看懂画作/照片里的内容
3.语音识别专家(ASR大模型)
- 做什么:处理声音相关任务
- 例子:
- 智能音箱(说"播放周杰伦"就放歌)
- 电话客服的语音菜单(说"转人工"就能转接)
- 英语跟读打分软件
- 工作原理:像耳朵+嘴巴,先听懂再回应
4.推荐系统专家
- 做什么:猜你喜欢什么
- 例子:
- 抖音的"猜你喜欢"视频流
- 淘宝首页推荐商品
- 网易云音乐每日推荐歌单
- 秘诀:像会读心术的朋友,记住你每次点赞收藏
5. 强化学习专家(RL大模型)
- 做什么:通过试错学习
- 例子:
- AlphaGo下围棋
- 游戏AI陪练(比如王者荣耀人机模式)
- 机器人学走路(像婴儿蹒跚学步)
- 特点:像打游戏通关,失败越多越聪明
二、按部署方式分类(就像"AI住所"不同)
1. 云侧大模型
- 特点:住在超级电脑里
- 优势:
- 像图书馆有海量知识库(比如百度搜索)
- 能处理复杂任务(如视频特效渲染)
- 缺点:需要网络,像在线游戏必须联网
2. 端侧大模型
- 特点:住在你手机/电脑里
- 优势:
- 离线也能用(像单机游戏)
- 保护隐私(数据不传上网)
- 例子:手机相册的宠物识别功能
三、按训练类型分类(像不同"学习方法")
1. 机器学习模型
- 学习方式:像做五年高考题
- 例子:
- 预测考试成绩的算法
- 垃圾邮件过滤器
- 特点:需要大量练习题(数据)
2. 深度学习模型
- 学习方式:像大脑神经网络
- 例子:
- 人脸识别门禁
- 语音转文字工具
- 特殊结构:像洋葱有层层"思考层"
3. 规则模型
- 学习方式:背公式手册
- 例子:
- 自动批改选择题的系统
- 红灯停绿灯行的交通控制
- 局限:遇到新题型就懵
4. 弱人工智能
- 特点:单项冠军
- 例子:
- 计算器(只会算数)
- 扫地机器人(只会清洁)
- 现状:目前大多数AI属于这类
5. 强人工智能(未来方向)
- 特点:全能学霸
- 想象场景:
- 既能辅导作业又会修电脑
- 可以自己学习新技能
- 现状:还在科幻电影阶段
四、重点补充:大语言模型(LLM)
- 本质:NLP专家中的"状元"
- 超能力:
- 续写故事(像帮你编作文)
- 解答百科问题(像活字典)
- 模仿写作风格(比如鲁迅体)
- 代表选手:ChatGPT/文心一言
举个栗子🌰:就像给AI看了整个图书馆的书,让它学会了所有写作套路,既能写诗歌也能编代码,但有时候会"一本正经地胡说八道"。
1.7 AI大模型生态
第一阶段:学基础工具(开发大模型算法)
就像学做机器人前要先学用工具🔧
- Python语言:你的"万能工具箱"
- 为什么学?👉 80%的AI项目都用它,就像80%的机器人用螺丝刀制造
- numpy(Python库):数学课的"超级计算器"🧮
- 功能:快速计算矩阵(比如算全班同学成绩总和)
- pandas(Python库):信息课的"Excel小助手"📑
- 功能:整理数据(比如统计全校学生身高体重)
| 维度 | numpy | pandas |
|---|---|---|
| 核心结构 | 多维数组(ndarray) | 表格型数据结构(DataFrame) |
| 擅长领域 | 数学运算/科学计算 | 数据清洗/分析/可视化 |
| 常用场景 | 图像处理/机器学习算法 | 成绩分析/销售报表 |
| 学习难度 | ⭐⭐ | ⭐⭐⭐ |
第二阶段:造"大脑"(模型阶段)
就像组装机器人的智能核心🧠
- PyTorch/TensorFlow:两种"组装工具"
- PyTorch:灵活乐高(适合实验室创新)
- TensorFlow:标准零件(适合工厂量产)
- 大模型LLaMA/DeepSeek:不同规模的"大脑"
- LLaMA:小狗级智能(能听懂简单指令)
- DeepSeek:人类级智能(能写诗编程)
| 模型 | 参数量 | 相当于 | 硬件需求 |
|---|---|---|---|
| LLaMA-7B | 70亿 | 小学生 | 游戏笔记本 |
| DeepSeek | 1300亿 | 博士生 | 8台服务器 |
第三阶段:让机器人工作(部署阶段)
就像给机器人安装身体和技能🤖
- ollama工具:一键安装包
- 功能:在自家电脑运行大模型(像安装游戏)
- 优势:不用联网/保护隐私
- 向量数据库:给机器人外接"记忆U盘"
- 场景:让AI记住你的日记/公司资料
- 开发框架:
- 手机APP(Flutter):做智能助手APP
- 网页端(React):做在线问答网站
第四阶段:机器人上岗(应用场景)
就像让机器人去不同地方工作🚀
| 应用方向 | 典型案例 | 使用技术 |
|---|---|---|
| 移动端 | 手机语音助手 | Flutter + 语音识别 |
| 网页端 | 智能客服系统 | React + 大模型API |
| 硬件端 | 智能音箱 | C++ SDK + 本地模型 |
如下图所示, 系统主要包含四大模块:
1.8 生态工具
一、开源大模型:可自由修改的“积木套装”
| 模型名称 | 特点 | 类比说明 | 适用场景 |
|---|---|---|---|
| DeepSeek-300B | 中文理解冠军/支持插件扩展 | 中文版百科全书+工具箱 | 教育/法律/医疗 |
| LLaMA-3-400B | 多语言专家/代码生成强 | 会编程的联合国翻译官 | 跨国企业/开发者 |
| Falcon-180B | 轻量化/手机可运行 | 装在口袋里的AI助手 | 移动端/智能穿戴 |
学生案例:用Falcon-180B在iPad上开发作业提醒APP(代码量<100行)
二、闭源大模型:即开即用的“智能家电”
| 服务商 | 代表产品 | 核心优势 | 计费方式 |
|---|---|---|---|
| OpenAI | GPT-4 | 多模态全能王 | $0.03/千token |
| Gemini Ultra | 实时联网搜索 | 广告+免费额度 | |
| 文心4.0 | 行业定制版 | 中文法律/医疗特化 | ¥0.02/千token |
企业案例: 某三甲医院用文心4.0医疗版:
- 诊断准确率提升37%
- 病历分析耗时减少80%