静态分析学习笔记01：静态分析初探PL的研究领域主要可以分为理论，环境和应用三大类，此处的理论主要是包括程序语言设计、

最近在看南京大学的软件分析课程，开个合集来记录一下

1.程序语言（PL）的研究领域

PL的研究领域主要可以分为理论，环境和应用三大类，此处的理论主要是包括程序语言设计、类型系统的相关问题，环境一般指代的是编译器、运行时系统的设计（支持程序运行的环境），而应用则是针对已有的程序提出以一系列方法，验证、分析程序，静态分析就是其中的一个例子。

2. 程序语言的分类

我们可以将编程语言分为三类范式

命令式编程语言：将逻辑拆解，每一条指令对应一个操作（JAVA/C），这类编程范式更加注重程序的具体步骤
函数式编程语言：用数学的方式来看待程序，将程序本体视为数学计算的过程这类编程范式更加注重程序的的结果，与逻辑式语言相通
逻辑式语言：声明式语言（PROLOG、sql）这类编程范式更加注重程序的的结果

3.静态分析的必要性：

本质上是在程序运行之前就对程序的可靠性、安全性进行测定

程序的可靠性（空指针定义、内存泄露）
程序的安全性（注入攻击、个人信息的泄露）
编译优化（无用代码优化、循环展开）
程序理解：让计算机理解程序的结构，例如IDE中的调用关系、类型推断。

4.静态分析的目的与边界

静态分析的本质是用一个程序P自动的分析另外一个程序P1、考察这个程序是否符合一些要求，这一切的考察必须建立P1尚未运行的情况下。

完备的静态分析需要满足 Sound和Complete，sound可以简单理解为一种更加严格的规范、宁可错报、不可漏报，而complete则是宁可漏报，不可错报

静态分析本身具有不完备性，莱斯定理确定了静态分析本身是无法针对一段程序给出确定的答案，换言之静态分析无法

以下是莱斯定理的原话

我们可以将任意程序看成从输入到输出上的函数(一个输入输出对的集合)，该函数描述了函数的行为。对于该函数/集合的任何 non-trivia 的属性，都不存在可以检查该属性的通用算法

简单来说，莱斯定理给出的结论为：一门主流的编程语言，其如何与运行时相关的特性的是无法给出准确静态分析

所以在实际的静态分析当中，往往会采用妥协的方式来进行解决，一般的妥协方式有两种

妥协soundness（Compromise soundness）：简单来说是将判断准则放宽，产生一定的漏报（false negative）
妥协completeness（Compromise completeness）：将判断准则收紧，产生一定的误报（false positive）

在目前的静态分析中，主要是以妥协completeness为主。

5. 稳健性（soundness）的必要性

这边结合一个例子来看，这里一共有两条数据流，我们如果此处只分析蓝色这一条数据流（妥协soundness），那么我们就可以得出此处的类型转换是安全的类型转换（safe Cast），但是这里此处如果程序触发了绿色数据流，这就可以发现这个类型转换是一个不安全的类型转换。故此在进行静态分析的时候如果采取妥协soundness的方式，往往会产生错误的结果