计算机图形学基础笔记(9.1)

172 阅读8分钟

Category:Higher Mathematics & Computer Graphics Application

正文

9 信号处理

在图形中,我们经常处理连续变量的功能:图像是您看到的第一个示例,但是在继续探索图形时,您会遇到更多的示例。从本质上讲,连续功能不能直接在计算机中代表。我们必须以某种方式使用有限数量的位来表示它们。表示连续函数的最有用的方法之一是使用该函数的示例:只需将函数的值存储在许多不同的点上,然后在需要的时间和(如果需要)之间重建值即可。

您现在已经熟悉使用像素的二维网格来表示图像的想法 - 因此您已经看到了采样表示!

想想由数码相机捕获的图像:相机镜头形成的场景的实际图像是图像平面上位置的连续函数,并且该摄像机将功能转换为二维样品网格。从数学上讲,摄像机将类型R2→C(其中C是颜色集)的函数转换为二维颜色样本或类型Z2→C的函数。

采样表示形式的另一个示例是2D数字化平板电脑,例如平板电脑的屏幕或艺术家使用的单独的笔平板电脑。在这种情况下,原始功能是手写笔的运动,这是时间变化的2D位置,或类型R→R2的函数。数字化器在许多时间点测量了手写笔的位置,从而导致2D坐标的序列或Z型→R2的函数。运动捕获系统对于附在演员身体上的特殊标记的操作完全相同:随着时间的推移,它将标记的3D位置(R→R3)占据,并将其变成一系列瞬时位置测量值(Z→R3)。

在维度上,用于非侵入性检查人体内部的医用 CT 扫描仪测量密度作为体内位置的函数。扫描仪的输出是密度值的 3D 网格:它将身体的密度 (R3 → R) 转换为实数的 3D 数组 (Z3 → R)。

这些例子看起来不同,但实际上它们都可以使用完全相同的数学来处理。在所有情况下,函数都在一维或多维的格点处被采样,并且在所有情况下,我们都需要能够从样本数组中重建原始连续函数。

从 2D 图像的例子来看,像素似乎已经足够了,一旦相机将图像离散化,我们就不需要再考虑连续函数了。但是如果我们想让图像在屏幕上变大或变小,尤其是通过非整数比例因子呢?事实证明,执行此操作的最简单算法表现不佳,引入了明显的视觉伪影,称为混叠。解释为什么会发生混叠并了解如何防止混叠需要抽样理论的数学知识。生成的算法相当简单,但它们背后的推理以及使它们表现良好的细节可能很微妙。

当然,在计算机中表示连续函数并不是图形所独有的。采样和重建的想法也不是。采样表示用于从数字音频到计算物理的应用,而图形只是相关算法和数学的一个(而且绝不是第一个)用户。自 1920 年代以来,关于如何进行采样和重建的基本事实在通信领域中就已为人所知,并且以我们在 1940 年代使用它们的确切形式进行了说明(Shannon & Weaver,1964)。

本章首先使用数字音频的具体一维示例总结采样和重建。然后,我们继续介绍基础数学以及在一个和二维中进行采样和重建的基础的算法。最后,我们介绍了频域观点的详细信息,该观点为这些算法的行为提供了许多见解。

9.1数字音频:1D采样

尽管采样表示已经在电信中使用了多年,但随着过去十年中音频数字录音的增加使用,1982 年光盘的推出是第一个高度可见的采样消费应用。 image.png

在录音中,麦克风将声音(以空气中的压力波形式存在)转换为随时间变化的电压,该电压相当于对麦克风所在位置气压变化的测量值。该电信号需要以某种方式存储,以便稍后播放并发送到扬声器,扬声器通过与电压同步移动隔膜将电压转换回压力波。

记录音频信号的数字方法(图 9.1)使用采样:模数转换器(A/D 转换器,或 ADC)每秒测量数千次电压,生成可以轻松存储的整数流在任意数量的媒体上,例如录音室中计算机上的磁盘,或传输到另一个位置,例如便携式音频播放器中的内存。在播放时,数据以适当的速率读出并发送到数模转换器(D/A 转换器,或 DAC)。 DAC 根据其接收到的数字产生电压,并且,如果我们采取足够的样本来公平地表示电压的变化,那么从所有实际目的来看,所产生的电信号与输入相同。

事实证明,最终获得良好再现所需的每秒样本数取决于我们试图录制的声音有多高。如果我们尝试录制短笛或铙钹,则可以很好地再现弦乐贝司或底鼓的采样率会产生奇怪的声音结果;但是这些声音可以通过更高的采样率很好地再现。为避免这些欠采样伪影,数字音频记录器对 ADC 的输入进行滤波,以消除可能导致问题的高频。

另一种问题出现在输出端。 DAC 会产生一个电压,该电压会在新样本进入时发生变化,但在下一个样本之前保持恒定,从而产生阶梯形图形。这些楼梯台阶就像噪音一样,增加了高频,信号依赖性的嗡嗡声。为了删除此重建工件,数字音频播放器会过滤DAC的输出以使波形平滑。

image.png

9.1.1 采样伪影和混叠

数字音频录制链可以用作图形中发生的采样和重建过程的具体模型。相同类型的无底采样和重建伪影也会在图像中发生或其他采样信号发生,并且解决方案是相同的:在重建过程中再次采样和过滤之前进行过滤。

图9.2显示了可能由低样本频率产生的伪像的具体示例。在这里,我们使用两个不同的样品频率对一个简单的正弦波进行采样:每周周期的10.8个样品和底部的每个周期1.2个样品。较高的速率会产生一组显然可以很好地捕获信号的样品,但是较低的样品速率产生的样品与低频正弦波的样品没有区别 - 实际上,面对这组样品,低频正弦曲线似乎更有可能的解释。

一旦完成采样,就不可能知道两个信号中的哪一个(快速或慢的正弦波)是原始的,因此,在两种情况下都没有单一的方法可以正确重建信号。由于高频信号“假装为”低频信号,因此这种现象被称为混叠。

每当抽样中的缺陷和重建导致令人惊讶的频率下的伪影时,混叠出现。在音频中,混叠的形式是奇怪的额外音调 - 在8kHz采样后,铃铛响了10kHz,变成了6kHz的音调。在图像中,混叠通常采用Moire模式的形式´从样品网格的相互作用与图像中的常规特征(例如图9.34中的窗户百叶窗)相互作用。

合成图像中锯齿的另一个例子是熟悉的直线上的阶梯,仅用黑白像素渲染(图 9.34)。

这是小尺度特征(线条的锐利边缘)以不同比例创建伪影的示例(对于浅斜线,阶梯非常长)。

采样和重构的基本问题可以简单地根据特征过小或过大来理解,但一些更定量的问题更难回答: • 什么采样率足够高以确保获得好的结果?

• 什么样的滤波器适合采样和重建?

• 需要什么程度的平滑来避免混叠?

这些问题的可靠答案必须等到我们在第 9.5 节中完全发展了理论.