35 计算机视觉(Computer Vision)

125 阅读3分钟

35. 计算机视觉-Computer Vision_哔哩哔哩_bilibili

1. 简介

在第 35 集中,视频主要介绍了“计算机视觉-Computer Vision”的基础知识和相关算法。计算机视觉的目的是让计算机能够从数字图像和视频中提取高层次的理解,用以完成各种任务,如面部识别、物体跟踪、边缘检测等。

2. 视觉的重要性

视觉是人类获取信息的最重要方式之一。大多数人依赖视觉来完成日常任务,如做饭、避障、读路牌、看视频等。计算机科学家们多年来一直致力于赋予计算机视觉能力,这个过程催生了 "计算机视觉" 这一领域。

3. 图像处理基础

3.1 像素与颜色

图像在计算机中以像素网格的形式存储,每个像素由红、绿、蓝三种基色定义,通过不同的组合可以表示任何颜色,这被称为 RGB 值。

3.2 简单的颜色跟踪算法

一个简单的计算机视觉算法是跟踪一个颜色物体,比如一个粉色的球。算法首先记录目标颜色的 RGB 值,然后在图像中逐个像素地找到最接近该颜色的像素。通过这样的像素匹配,可以在视频的每一帧中跟踪该物体的位置。

4. 边缘检测与卷积

4.1 边缘检测的原理

边缘检测是另一个重要的视觉算法,用于识别图像中的物体边缘。算法考虑像素的小区域,称为 "块"。比如,检测垂直边缘时,算法计算左右两个像素集合的颜色差异,差异越大,该像素越可能处于边缘。

4.2 卷积操作

卷积是指将一个称为“核”或“过滤器”的矩阵应用于一个像素块。这个操作可以用来执行多种图像变换,如图像锐化或模糊。不同的卷积核可以检测不同的图像特征,如垂直边缘、水平边缘或特定的形状。

5. 高级算法与卷积神经网络

5.1 Viola-Jones 人脸检测

Viola-Jones 是早期的人脸检测算法,通过组合多个弱特征检测器来实现准确的人脸识别。

5.2 卷积神经网络(CNN)

卷积神经网络是一种深度学习技术,通过多层卷积逐渐识别图像中的复杂特征。每一层神经元使用卷积操作提取特征,从简单的边缘开始,到最终识别整个面部或复杂物体。

6. 计算机视觉的实际应用

6.1 表情识别与情感分析

通过检测面部标志点(如眼睛、眉毛、嘴角等),计算机可以识别用户的情绪,如开心、伤心、沮丧等。

6.2 生物特征识别

面部标志点数据也可以用于生物特征识别,比如智能手机的面部解锁或政府使用 CCTV 摄像头进行人群监控。

6.3 更多应用

计算机视觉在各个领域有广泛应用,如条形码扫描、自动驾驶、健康检测等。

7. 总结

  • 视觉是人类获取信息的主要方式,计算机科学家致力于赋予计算机同样的能力。
  • 图像在计算机中以像素网格形式存储,颜色通过 RGB 值表示。
  • 简单的颜色跟踪算法和边缘检测是计算机视觉的基础。
  • 卷积是一种关键操作,用于多种图像变换和特征检测。
  • 卷积神经网络能够通过多层卷积识别复杂图像特征,是当前热门的深度学习技术。
  • 计算机视觉已在表情识别、生物特征识别等领域得到广泛应用,未来潜力巨大。