漫话“数字图像处理的发展史”

93 阅读7分钟

       最近在研究《数字图像处理》,初看像个工具箱,各种变换、滤波、增强、特征提取等等,感觉是围绕一个个具体工程问题发展而来的,囊括了大量的知识点,每个知识点背后又都藏着相当复杂的数学理论,很难啃也很难关联起来。一直到最近两天,在深究图像处理的三个重要支撑知识点:滤波、变换、基函数和基图像的底层关系过程中,从数字图像处理的技术发展简史角度出发,一下子发现这些知识点可以像葡萄一样相互缀合在一起的,有种豁然开朗的感觉。以下是本人的粗浅认识,分享给大家,希望能给大家学习有所帮助。

       数字图像处理的发展逻辑:从具体的滤波操作(解决表面问题),到借助变换拓展维度(工具升级),再到聚焦基函数揭示本质(原理深化) 。滤波、变换、基函数 / 基图像的出现顺序和逻辑扩展,正是这一过程的典型体现。这个过程既是问题复杂度推动的必然,也是人类对图像认知从现象到本质的逐步深入。每一步都不是对前一步的否定,而是在其基础上的扩展与升华 —— 滤波仍在广泛使用,变换是基函数应用的重要方式,而基函数则为整个领域提供了更底层的理论支撑。具体可以梳理为三个阶段的递进:

一、早期:以滤波为核心的 “直观操作阶段”

       最早的图像处理聚焦于解决最直接的视觉问题(如去噪、增强),滤波是天然的起点:

  • 原理简单:滤波本质是 “对图像像素的局部加权平均”(如均值滤波去噪、 Sobel 滤波边缘检测),符合人对 “平滑”“锐化” 的直观认知,容易通过硬件(如早期模拟电路)或简单算法实现。
  • 目标明确:当时的任务多是改善图像质量(如去除拍摄噪声、增强细节),滤波能直接作用于像素,快速达成目标,不需要复杂的数学框架。

       这一阶段的核心是 “用简单操作解决具体问题”,尚未上升到 “变换” 或 “基函数” 的抽象层面。

二、中期:以变换为核心的 “数学工具扩展阶段”

       随着问题复杂度提升(如压缩、频率分析),单纯的空域滤波逐渐力不从心,变换的引入成为必然:

  • 需求驱动:例如图像压缩需要 “去除冗余信息”,而冗余往往体现在 “频率相关性”(如相邻像素变化缓慢,对应低频成分);去噪需要区分 “信号” 和 “噪声” 的频率差异(如信号多在低频,噪声多在高频)。这些问题在空域(像素域)难以高效处理,必须转向频域或其他变换域
  • 数学支撑:傅里叶变换、余弦变换等工具被引入,本质是将图像从 “像素表示” 转换为 “基函数组合表示”(如傅里叶变换用正弦 / 余弦基),但此时的重点是 “变换后的域特性”(如频域的分离性),而非基函数本身的设计。

       这一阶段的核心是 “通过变换拓展处理维度”,基函数作为变换的 “隐含组件” 开始发挥作用,但尚未被单独聚焦。

三、后期:以基函数 / 基图像为核心的 “原理深化阶段”

       当任务进一步复杂化(如稀疏表示、自适应处理),研究者发现变换的效果本质由基函数的特性决定,于是基函数的设计与学习成为核心:

  • 从 “固定变换” 到 “定制基函数”:傅里叶、小波等变换的基函数是固定的,难以适配所有任务(如纹理、医学影像的特异性)。而字典学习、CNN 等方法直接针对任务学习 “最优基函数”(如纹理基、边缘基),让表示更高效。
  • 从 “数学工具” 到 “问题本质”:基函数的本质是 “图像的基本构成单元”,理解基函数如何刻画图像特征(如稀疏性、局部性),就能从根本上设计解决方案(如用稀疏基去噪、用语义基分类)。

       这一阶段的核心是 “通过基函数揭示图像本质”,实现从 “被动应用工具” 到 “主动设计原理” 的
跨越。

四、最新前沿发展

       目前已经有一些新的理论和方法在一定程度上超越了传统的基函数与基图像的概念,例如 Factor Fields(因子场)理论。

       Factor Fields 是一种用于建模和表示信号的新型框架,它将信号分解为多个因子的乘积,每个因子由经典场或神经场表示,并对转换后的输入坐标进行操作。这种分解方式形成了一个统一的框架,涵盖了 NeRF、Plenoxels、EG3D、Instant - NGP 和 TensoRF 等多种近期的信号表示方法,还允许创建新的强大信号表示,如 “字典场”(DiF)。实验表明,Factor Fields 在二维图像回归任务上能获得更好图像逼近质量,在重建 SDF(符号距离场)时具有更高的几何质量,在 NeRF 重建任务上具有更高的紧凑性。与传统的基函数与基图像方法相比,Factor Fields 提供了更灵活和强大的信号表示方式,能够更好地捕捉信号的复杂特征和结构。

       目前来看,因子场(Factor Fields)理论尚处于学术研究阶段,尚未有成熟的商业应用落地,主要原因包括:

  • 该理论提出时间较短(相关核心研究多在 2022 年后发表),技术细节仍在完善中,实际工程化验证和优化还需时间;
  • 其应用场景(如高质量图像重建、3D 场景表示等)目前更多集中在科研或高端技术领域(如虚拟现实、影视特效),尚未形成规模化的商业需求或成熟产品。

       此外,一些基于深度学习的方法,如卷积神经网络(CNN)、生成对抗网络(GAN)等,虽然不是直接替代基函数与基图像的理论,但它们通过自动学习特征和模式,在图像处理等领域取得了巨大的成功,也可以看作是图像处理理论和技术的重要发展方向。

五、信号处理也成为现代工科的 “通用基础工具”

       数字信号处理(DSP)的发展路径与数字图像处理高度相似,同样遵循 “从具体操作到抽象理论”,“从工具应用到原理深化” 的脉络,核心逻辑可以概括为:从直观的时域处理,到变换域分析,再到基函数 / 表示学习的深化,最终走向更灵活的自适应框架。这种发展既是由问题复杂度(从简单去噪到复杂信号建模)推动的,也是人类对信号本质的认知从 “现象描述” 到 “规律建模” 的逐步深入。

       信号处理的核心价值在于提供了一套普适的方法论:无论是电信号、光信号、声信号,还是图像、文本、传感器数据,本质上都是 “携带信息的物理量”,而信号处理的滤波、变换、特征提取、建模等技术,正是处理这些 “信息载体” 的通用工具。当工科各领域从 “机械执行” 升级到 “智能感知与决策” 时,必然依赖信号处理技术解决三大核心问题:

  • 去噪与增强:从噪声 / 干扰中提取有效信号(如雷达抗杂波、医疗设备去噪声);
  • 特征挖掘:从信号中提取关键参数(如声纹识别的频谱特征、工业传感器的振动频率);
  • 建模与预测:通过信号规律建模实现预测或控制(如自动驾驶的环境感知、电网的负荷预测)。

       信号处理的通用性,源于工科各领域对 “信息处理” 的共性需求。从传统的 electrical engineering(电子工程)到新兴的 AI、机器人、生物医学工程,只要涉及 “通过数据感知世界、通过处理实现功能”,就必然需要信号处理的理论和技术。可以说,信号处理是连接 “物理世界数据” 与 “工程应用需求” 的核心桥梁,其重要性会随着工科领域向 “智能化、高精度、复杂化” 发展而愈发凸显。