Pytorch——人工智能与计算机视觉入门

720 阅读1分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第23天,点击查看活动详情


在之前的文章中,我们对神经网络的概念进行了解释,并且利用神经网络搭建了分类回归模型。

今天,我们来介绍人工智能与计算机视觉的概念,介绍了计算机视觉的任务,颜色空间,RGB彩色空间,HSV色彩模式和灰度图的概念。


  • 1.1 人工智能与计算机视觉

  • 人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科。

$REO1{RB@(MH7HD%LUJXSWR.png

QG_546_14)GTR07NCO$8D.png

数据包括语音、文字、图像、表格等形态

计算机视觉的任务:

  • 图像分类
  • 图像检索
  • 目标检测
  • 图像分割
  • 图像生成
  • 目标跟踪
  • 超分辨率重构
  • 关键点定位u
  • 图像降噪
  • 多模态
  • 图像加密
  • 视频编解码
  • 3D视觉
  • 等等

颜色空间

  • 颜色空间也称彩色模型,用于描述色彩
  • 常见的颜色空间包括:RGB、CMYK(纺织领域)、YUV、Lab、HSL和HSV/HSB等 )Y60$T6@~1F4TJF[~1F4]_9.png

RGB色彩模式

  • RGB色彩模式是工业界的一种颜色标准
  • 通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们之间的叠加来得到各式各样的颜色的
  • 红、绿、蓝三个颜色通道每种色各为256阶亮度

}}{(P@PYL48W5)GU9~}SY.png

HSV色彩模式

  • 色相(Hue):指物体传到或反射的波长。更常见的是以颜色如红色,橘色或绿色来辨识,取0到360度的数值来衡量
  • 饱和度(Saturaration):又称色度,指色彩的强度或纯度,取值范围为0%~100%
  • 明度(Value):表示颜色明亮的程度,取值范围为0%(黑)到100%(白)

1.png

灰度图

  • 灰度图通常由一个unit8、unit16、单精度零星或者双精度类型的数组描述

  • M*N的矩阵,矩阵中的每一个元素与图像的一个像素点相对应

  • 通常0代表黑色,1、255或者65635(为数据矩阵的取值范围上限)代表白色

    • 浮点算法: Gray= R0.3 + G0.59 + B*0.11
    • 整数方法: Gray= (R30 + G59 + B*11)/100
    • 移位方法: Gray= (R28 + G151 + B*77) >> 8
    • 平均值法: Gray= (R + G + B)/3
    • 仅取绿色: Gray= G `0O0(2J0YHY8OD((%2$@EBE.png
  • 只需要关注数据的纹理信息、模型对于颜色的变化不那么明显、当前的任务不需要用到彩色图,使用灰度图

9JQ4ZCQY3M({Q$KEN%9BFQX.png