什么是AI?

654 阅读7分钟

一、概述

1.1 AI是什么

就像给机器装了个"会学习的大脑",让它们能像人一样:

  1. 看懂世界(比如手机相册自动识别猫狗照片)
  2. 听懂人话(比如叫"Siri定个闹钟")
  3. 自己思考(比如围棋AI阿尔法狗下棋)

1.2 AI的三大超能力(用日常例子说明)

能力类型具体表现生活实例
学习能力越用越聪明抖音越刷推荐越准
推理能力解决新问题导航软件绕开堵车路段
创造能力生成新内容AI绘画生成动漫头像

1.3 AI包含哪些技术?(类比学校课程)

计算机视觉 ➔ 机器的"眼睛"(人脸识别打卡)
自然语言处理 ➔ 机器的"语文课"(智能客服聊天)
机器学习 ➔ 机器的"自习课"(通过数据自己进步)
机器人技术 ➔ 机器的"体育课"(工厂机械臂)

1.4 AI有多重要?

  1. 科技地位
    • 20世纪三大尖端技术:登月火箭、核电站、AI
    • 21世纪三大尖端技术:基因编辑(修改生命密码)、纳米技术(超级小材料)、AI
  2. 实际影响
    • 医疗:AI辅助看CT片(比医生看得更快)
    • 交通:自动驾驶汽车(不用手握方向盘)
    • 教育:智能作业批改(老师轻松多了)

1.5 AI发展小故事

  • 1956年:AI概念在达特茅斯会议诞生,就像"AI的生日"
  • 1997年:IBM深蓝打败国际象棋冠军,震惊世界
  • 2016年:AlphaGo战胜李世石,开启AI新纪元

举个栗子🌰:现在的AI就像小学三年级学生,会算数会背课文,但还不会自己发明新知识。未来可能会成长为大学生,甚至超越人类哦!

1.6 AI大模型划分

一、按应用场景和功能分类(就像不同专业的"AI专家")

1.自然语言处理专家(NLP大模型)

  • 做什么:专门处理文字工作
  • 例子
    • 手机输入法的智能纠错(把"泥豪"改成"你好")
    • 作文自动批改系统(能指出语法错误)
    • 自动生成短视频文案(像写广告词的小能手)
  • 常见任务:就像语文课代表,擅长阅读理解/写作/翻译

2.计算机视觉专家(CV大模型)

  • 做什么:专门分析图片视频
  • 例子
    • 学校门口的刷脸闸机(1秒认出学生)
    • 美颜相机的自动瘦脸功能
    • 自动驾驶汽车识别红绿灯
  • 特殊技能:像美术老师,能看懂画作/照片里的内容

3.语音识别专家(ASR大模型)

  • 做什么:处理声音相关任务
  • 例子
    • 智能音箱(说"播放周杰伦"就放歌)
    • 电话客服的语音菜单(说"转人工"就能转接)
    • 英语跟读打分软件
  • 工作原理:像耳朵+嘴巴,先听懂再回应

4.推荐系统专家

  • 做什么:猜你喜欢什么
  • 例子
    • 抖音的"猜你喜欢"视频流
    • 淘宝首页推荐商品
    • 网易云音乐每日推荐歌单
  • 秘诀:像会读心术的朋友,记住你每次点赞收藏

5. 强化学习专家(RL大模型)

  • 做什么:通过试错学习
  • 例子
    • AlphaGo下围棋
    • 游戏AI陪练(比如王者荣耀人机模式)
    • 机器人学走路(像婴儿蹒跚学步)
  • 特点:像打游戏通关,失败越多越聪明

二、按部署方式分类(就像"AI住所"不同)

1. 云侧大模型

  • 特点:住在超级电脑里
  • 优势
    • 像图书馆有海量知识库(比如百度搜索)
    • 能处理复杂任务(如视频特效渲染)
  • 缺点:需要网络,像在线游戏必须联网

2. 端侧大模型

  • 特点:住在你手机/电脑里
  • 优势
    • 离线也能用(像单机游戏)
    • 保护隐私(数据不传上网)
  • 例子:手机相册的宠物识别功能

三、按训练类型分类(像不同"学习方法")

1. 机器学习模型

  • 学习方式:像做五年高考题
  • 例子
    • 预测考试成绩的算法
    • 垃圾邮件过滤器
  • 特点:需要大量练习题(数据)

2. 深度学习模型

  • 学习方式:像大脑神经网络
  • 例子
    • 人脸识别门禁
    • 语音转文字工具
  • 特殊结构:像洋葱有层层"思考层"

3. 规则模型

  • 学习方式:背公式手册
  • 例子
    • 自动批改选择题的系统
    • 红灯停绿灯行的交通控制
  • 局限:遇到新题型就懵

4. 弱人工智能

  • 特点:单项冠军
  • 例子
    • 计算器(只会算数)
    • 扫地机器人(只会清洁)
  • 现状:目前大多数AI属于这类

5. 强人工智能(未来方向)

  • 特点:全能学霸
  • 想象场景
    • 既能辅导作业又会修电脑
    • 可以自己学习新技能
  • 现状:还在科幻电影阶段

四、重点补充:大语言模型(LLM)

  • 本质:NLP专家中的"状元"
  • 超能力
    • 续写故事(像帮你编作文)
    • 解答百科问题(像活字典)
    • 模仿写作风格(比如鲁迅体)
  • 代表选手:ChatGPT/文心一言

举个栗子🌰:就像给AI看了整个图书馆的书,让它学会了所有写作套路,既能写诗歌也能编代码,但有时候会"一本正经地胡说八道"。

1.7 AI大模型生态

第一阶段:学基础工具(开发大模型算法)

就像学做机器人前要先学用工具🔧

  1. Python语言:你的"万能工具箱"
  • 为什么学?👉 80%的AI项目都用它,就像80%的机器人用螺丝刀制造
  1. numpy(Python库):数学课的"超级计算器"🧮
  • 功能:快速计算矩阵(比如算全班同学成绩总和)
  1. pandas(Python库):信息课的"Excel小助手"📑
  • 功能:整理数据(比如统计全校学生身高体重)
维度numpypandas
核心结构多维数组(ndarray)表格型数据结构(DataFrame)
擅长领域数学运算/科学计算数据清洗/分析/可视化
常用场景图像处理/机器学习算法成绩分析/销售报表
学习难度⭐⭐⭐⭐⭐

第二阶段:造"大脑"(模型阶段)

就像组装机器人的智能核心🧠

  1. PyTorch/TensorFlow:两种"组装工具"
    • PyTorch:灵活乐高(适合实验室创新)
    • TensorFlow:标准零件(适合工厂量产)
  2. 大模型LLaMA/DeepSeek:不同规模的"大脑"
    • LLaMA:小狗级智能(能听懂简单指令)
    • DeepSeek:人类级智能(能写诗编程)
模型参数量相当于硬件需求
LLaMA-7B70亿小学生游戏笔记本
DeepSeek1300亿博士生8台服务器

第三阶段:让机器人工作(部署阶段)

就像给机器人安装身体和技能🤖

  1. ollama工具:一键安装包
    • 功能:在自家电脑运行大模型(像安装游戏)
    • 优势:不用联网/保护隐私
  2. 向量数据库:给机器人外接"记忆U盘"
    • 场景:让AI记住你的日记/公司资料
  3. 开发框架:
    • 手机APP(Flutter):做智能助手APP
    • 网页端(React):做在线问答网站

第四阶段:机器人上岗(应用场景)

就像让机器人去不同地方工作🚀

应用方向典型案例使用技术
移动端手机语音助手Flutter + 语音识别
网页端智能客服系统React + 大模型API
硬件端智能音箱C++ SDK + 本地模型

如下图所示, 系统主要包含四大模块:

1.8 生态工具

一、开源大模型:可自由修改的“积木套装”

模型名称特点类比说明适用场景
DeepSeek-300B中文理解冠军/支持插件扩展中文版百科全书+工具箱教育/法律/医疗
LLaMA-3-400B多语言专家/代码生成强会编程的联合国翻译官跨国企业/开发者
Falcon-180B轻量化/手机可运行装在口袋里的AI助手移动端/智能穿戴


学生案例:用Falcon-180B在iPad上开发作业提醒APP(代码量<100行)

二、闭源大模型:即开即用的“智能家电”

服务商代表产品核心优势计费方式
OpenAIGPT-4多模态全能王$0.03/千token
GoogleGemini Ultra实时联网搜索广告+免费额度
文心4.0行业定制版中文法律/医疗特化¥0.02/千token

企业案例: 某三甲医院用文心4.0医疗版:

  • 诊断准确率提升37%
  • 病历分析耗时减少80%