1. PL and Static Analysis
程序语言和静态分析。
2. Why We Learn Static Analysis?
- 提高程序的可靠性(空指针,内存泄漏)
- 提高程序的安全性 (隐私泄露,注入攻击)
- 编译优化(死代码删除)
- 程序理解(继承关系,类型提示)
3. What is Static Analysis?
静态分析分析程序 P,通过在运行 P 之前推断其行为并确定其是否满足某些属性。
- P 是否包含任何私人信息泄露?
- P 是否引用任何空指针?
- P 中的所有强制类型转换操作是否安全?
- 在 P 中,v1 和 v2 是否可能指向相同的内存位置?
- P 中的某些断言语句是否会失败?
- P 中的这段代码是否是无效的(以便将其删除)?
不幸的是,根据赖斯定理(Rice’s Theorem),没有一种方法可以确定 P 是否满足这类非平凡属性,即,不能给出确切的答案:是或否。
一个Perfect的静态程序分析是即Sound又Complete的。
Sound指包含所有的问题,但可能会存在假阳的情况(误报)。
Complete指指出的问题全部是正确的,但可能会存在假阴的情况(漏报)。
有用的静态分析(妥协其中的一方):
- Compromise soundness,变得不Sound,只包含一部分的Truth(false negative 漏报)
- Compromise completeness,变得不Complete,会包含一部分的假bug(false positive 误报)
- 一般上都是妥协completeness,(Sound但是不精确)虽然会造成误报(不准确),宁可多排查几个漏洞,但也不能放过一个漏洞
- 但是soundness对于一系列重要的(静态分析)应用程序,如编译器优化和程序验证,至关重要。
我们需要在确保soundness的情况下,确保分析的精度和分析的速度。
4. Static Analysis Features and Examples
两个词来总结静态分析:
“Abstraction + Over-approximation” 在程序分析和验证领域通常指的是一种方法或技术,其中同时使用了抽象(Abstraction)和过度逼近(Over-approximation)的策略。
• Abstraction
• Over-approximation
• Transfer functions
• Control flows
- Abstraction(抽象): 抽象是一种将复杂系统简化为更易于处理的形式的技术。在程序分析中,可以通过去除细节或简化计算来创建抽象模型,使得问题变得更易解决。这有助于降低分析的复杂性,但可能会损失一些精确性。
- Over-approximation(过度逼近): 过度逼近是一种保守的分析方法,它倾向于报告可能的属性而不是确切的属性。这种方法的目标是确保不会漏掉任何可能导致问题的情况,即使这可能导致一些误报。通过过度逼近,可以更容易地检测到潜在的错误或问题。