数字图像基础

基本概念

图像的离散化

连续图像: 人眼直接感受到的图像.
数字图像: 把连续图像数字化/离散化后的图像, 是连续图像的一种近似.

扫盲

像素Pixel: 图像中的最小单位.
位图bitmap: 通过记录每一个像素值来存储和表达的图像.
色彩深度/位深度: 位图中每个像素点要用多少个二进制位来表示.
BMP: Windows系统的标准位图格式.

二值图像

Binary Image, 每个像素只有两种可能的取值, 使用1位二进制来表示, 位深度为1.

计算: 存储512 x 512像素的二值图像需要多少内存?

解: 512 x 512 bit = 2^9 x 2^9 bit = 2^18 bit = 2^10 x 2^8 bit = 2^8 Kb = 256 Kb = 32 KByte

计算机进制: 2^10 = 1 K bit/8 = Byte

黑白灰

灰度图像: 黑白色调, 实际上由灰色描绘出细腻细节.

黑白图像: 只有黑色和白色, 细节丢失.

由于黑白图像只有黑色和白色两种颜色, 所以在图像处理和分析时, 常常对黑白图像进行二值化处理.

实际上, 只要是仅有两种颜色的图像, 都可以被称为二值图像.

灰度图像

每个像素使用1个字节表示, 位深度位8, 可以表示256种级别的灰度.

0表示黑色, 255表示白色. 数值表示光学强度, 255-光学强度最大状态, 0-黑色.

计算: 存储512 x 512的灰度图像需要占用多大内存?

解: 512 x 512 x 8 bit = 2^8 K x 1 Byte = 256 KB

Tip: 除了1000以下的Byte, 向上的单位是KB, MB. Byte被缩写了.

彩色图像

RGB, 每个像素都有红绿蓝三个分量.
一个像素点使用3个字节(一个颜色通道一个字节), 位深度为24位.
可以表示256 x 256 x 256 = 一千六百多万种颜色

RGBA图像

32位真色彩

RGB图像+8位透明度信息Alpha
1个像素使用4个字节, 位深度为32位

256色彩色图像

每个像素用8位表示, 是调色板中的索引值
对于不同的图像, 所对应的这256种颜色的集合不同
保存和加载此类图像时, 需要将调色板和图像一同保存和加载

图像压缩

适当降低图像质量来减少它所占用的空间
不同的图像压缩算法, 对应不同的图像格式

图像格式

BMP: 内存占用大, 不支持压缩, 不适用于网页
JPEG:
1. 优点: 有损压缩, 压缩率高, 内存占用小, 色彩丰富, 细节清晰细腻, 适合存储大图像
2. 缺点: 不适合颜色单一且有大块颜色相近的区域, 或亮度差异十分明显的简单图片(参考用单反拍晨曦, 颜色断层). 每次编辑都会降低图像质量, 不适合需要进行多次编辑的情况.
PNG: 无损压缩, 适用于有规律渐变色彩的图像(晨曦图)
GIF: 支持静态和动态, 动态图片由多幅图片保存为一个图片, 循环显示, 形成动画效果. 只支持256色, 适用于色彩简单/颜色较少的小图像
TIFF:
1. 定义了四类不同类型的格式:
  1. 二值图像TIFF-B
  2. 黑白灰度图像TIFF-G
  3. 带调色板的彩色图像TIFF-P
  4. RGB真彩图像TIFF-R
2. 优点: 支持RGN/JPEG等多种编码方式, 具有非常好的扩展性, 方便性, 可改性, 常用于印刷行业
3. 缺点: Web浏览器不支持TIFF格式

色彩模式

二值图像, 灰度图像, RGB图像, RGBA图像
CMYK(印刷四分色):
1. C: Cyan青色
2. M: Magenta洋红色
3. Y: Yellow黄色
4. K: blacK黑色
YCbCr:
1. Y: 亮度
2. Cb: 蓝色色度
3. Cr: 红色色度
HSI:
1. H; 色调
2. S: 饱和度
3. I: 亮度

图像类型

序列图像

时间上有一定的顺序和间隔, 内容上相关的一组图像.

其中的每幅图像称为帧图像
帧图像之间的时间间隔是固定的

深度图像

Depth Map:

三维场景信息的表达方式
每个像素点的取值代表这个点离摄像机的距离
采用灰度图表示, 每个像素点由一个字节表示
深度图像中, 像素点的取值并不代表实际的距离, 颜色的深浅只是代表相对距离的远近

计算机视觉: 数字图像基础