从RGB到YCbCr——视频色彩模型的演进、原理与工程实践视频色彩就像语言——RGB是计算机图形世界的“母语”，直接而精

一句话总结：

视频色彩就像语言——RGB是计算机图形世界的“母语”，直接而精确；而YCbCr则是为了高效交流（压缩传输）而发明的“世界语”，它聪明地将核心信息（亮度）和次要信息（色度）分开表述，大大节省了沟通成本。

一、 RGB：数字世界的色彩基石

原理：基于加色混光模型，将所有颜色都视为不同强度的**红(R)、绿(G)、蓝(B)**光混合而成。
角色：计算机图形系统的“原生语言” 。无论是UI渲染、游戏引擎还是图像编辑软件，其内部处理的都是RGB数据。显示器本身也是通过控制R/G/B三种颜色的子像素点来发光的。
优缺点：
- 优点：直观，精确，无需转换即可直接用于显示。
- 缺点：三个颜色通道高度相关，存在大量数据冗余（例如，一张黑白照片用RGB存储，其R/G/B三个分量的值是完全一样的），直接对其进行压缩，效率极低。

二、 YCbCr：为压缩而生的效率先锋

1. 历史渊源：为何要分离亮度和色度？

YCbCr模型的诞生，源于彩色电视广播时代的一个核心需求：必须向前兼容当时已普及的黑白电视机。

解决方案：将彩色信号分解为两部分：
- 亮度 (Luma, Y') ：一个完整的黑白图像信号。黑白电视机只接收这个信号，就能正常显示。
- 色度 (Chroma)：包含颜色信息的附加信号。彩色电视机则能解码出色度信号，并与亮度信号结合，还原出彩色画面。
  
  这个“亮度/色度分离”的绝妙设计，奠定了整个现代视频压缩技术的基础。

2. 澄清术语：YUV vs. YCbCr

在深入之前，我们必须厘清概念：

YUV：是模拟时代的技术名词。
YCbCr：是数字视频（包括所有网络视频、蓝光、数字电视）所使用的色彩模型。Cb代表蓝色差，Cr代表红色差。
结论：在当今的软件开发和视频工程中，当我们谈论“YUV”时，99%的情况下我们指的都是YCbCr。

3. 核心优势：利用人眼特性进行“降维打击”

人眼对亮度的敏感度，远高于对色度的敏感度。YCbCr正是利用了这一点，通过**色度二次采样（Chroma Subsampling）**来实现“视觉无损”的数据压缩。

原理：为所有像素保留完整的亮度信息（Y'），但让多个像素共享一套色度信息（CbCr）。
主流格式 (Y'CbCr 4:2:0) ：
- 布局：在一个2x2的像素块中，有4个独立的Y'值，但整个块共享同一组Cb和Cr值。
- 效果：相比于未经采样的Y'CbCr 4:4:4，色度信息的数据量被压缩到了1/4，而整体数据量几乎减半，但人眼主观上几乎察觉不到画质损失。你观看的所有在线视频，几乎都是4:2:0格式。

三、工程实践：色彩模型的“全链路之旅”与内存布局

一个视频信号从诞生到显示，其色彩模型会经历一次完整的“旅行”：

创作 (RGB) → 编码 (转为YCbCr 4:2:0) → 压缩 (H.264/HEVC) → 解码 (得到YCbCr 4:2:0) → 显示 (转回RGB)

内存中的色彩：Planar, Packed 与 Stride

内存布局：YCbCr数据在内存中有多种存储方式：
- Planar (平面模式) ：Y、Cb、Cr三个分量分别存储在三块连续的内存中（如I420/YV12格式）。
- Semi-Planar (半平面模式) ：Y分量单独存储，Cb和Cr分量交错存储（如NV12/NV21格式，这是移动端最常见的格式）。
步长 (Stride) ：无论是RGB还是YCbCr，它们在内存中存储时，一行的字节数（Stride）未必等于图像的有效宽度。为了硬件（CPU/GPU）处理效率，通常会进行字节对齐（如对齐到32或64字节），多余的部分称为Padding。开发者在进行内存操作时，必须使用Stride而非Width来计算下一行的地址。

结论：

RGB与YCbCr并非“竞争关系”，而是现代视频工程中处于不同生命阶段的“协作伙伴” 。RGB是创作和显示端的王者，保证了最终的视觉呈现；而YCbCr则是存储和传输端的效率核心，它通过巧妙地利用人眼视觉冗余，为高效的视频压缩铺平了道路。深刻理解二者的历史渊源、技术原理和在全链路中的角色转换，是每一位音视频工程师的必备内功。

从RGB到YCbCr——视频色彩模型的演进、原理与工程实践