1. 架构概述
SpotBugs的架构设计主要围绕以下几个核心组件展开:
- 分析引擎:这是SpotBugs的核心,负责读取Java字节码(.class文件),并应用预定义的规则集来检测潜在的代码问题。
- 规则集:一组预定义的规则,用于识别特定的代码缺陷和错误模式。SpotBugs的规则集是可扩展的,允许用户添加自定义规则。
- 用户界面:提供与用户交互的界面,展示分析结果,并提供修改建议。SpotBugs支持多种集成方式,包括作为IDE插件、Maven/Gradle插件或独立应用程序。
- 插件系统:允许第三方开发者扩展SpotBugs的功能,通过添加新的检测器或规则集来增强其对特定类型错误的检测能力。
2. 分析引擎
分析引擎是SpotBugs架构中的核心部分,它执行以下关键任务:
- 字节码解析:SpotBugs首先读取Java字节码文件,这些文件包含了编译后的Java程序信息。
- 模式匹配:将解析后的字节码与预定义的错误模式进行匹配。这些模式基于常见的编程错误、空指针引用、资源泄漏、线程安全问题等。
- 问题报告:一旦检测到问题,分析引擎会生成详细的报告,包括问题的描述、位置、可能的影响以及修复建议。
3. 规则集与可扩展性
SpotBugs的规则集是其灵活性和可扩展性的关键。规则集定义了SpotBugs能够检测的错误类型,以及如何检测这些错误。
- 内置规则集:SpotBugs提供了丰富的内置规则集,覆盖了常见的编程错误和安全问题。
- 自定义规则:用户可以根据需要创建自定义规则,以检测特定的代码问题。这种机制使得SpotBugs能够适应不同的项目需求。
- 插件扩展:通过插件系统,第三方开发者可以添加新的检测器或规则集,从而扩展SpotBugs的功能。
4. 用户界面与集成
SpotBugs提供了多种用户界面和集成方式,以满足不同用户和开发环境的需求。
- IDE插件:SpotBugs可以作为Eclipse、IntelliJ IDEA等主流IDE的插件使用,方便开发人员在编写代码的同时进行静态分析。
- 构建工具集成:SpotBugs可以与Maven、Gradle等构建工具集成,作为构建过程的一部分自动执行静态分析。
- 独立应用程序:SpotBugs还提供了独立的应用程序版本,允许用户在不依赖IDE或构建工具的情况下进行静态分析。
5. 性能优化
为了提高分析效率和准确性,SpotBugs在架构设计中考虑了性能优化:
- 增量分析:SpotBugs支持增量分析,即只对新修改的代码进行分析,而不是对整个项目进行分析。这可以显著减少分析时间。
- 并行处理:SpotBugs利用多核处理器的优势,通过并行处理来提高分析速度。
- 缓存机制:SpotBugs采用缓存机制来存储分析结果,以便在后续分析中快速检索和重用。
源码解析
下面就从源码的角度,对 spotbugs 的工作原理一探究竟。
首先,从github下载源码 https://github.com/spotbugs/spotbugs.git
将源码导入到 IDEA 中,并构建 gradle 工程。
完成后,打开启动类 Driver:
从源码上,我们可以看到,spotbugs 本身是自带一套 GUI 的,不过 swing 框架的样式有点丑,不易于与自动化构建工具,配合,一般用的不是很多。
gui文件夹是spotbugs swing框架GUI的源代码:
GUI 启动后,文件 > 新建 弹出对话框:
概念解析
在这里需要介绍一下的是,spotbugs 引擎工作单元是project。
project 包括分析文件(jar),辅助文件,源码文件文件夹。
AnalysisPass: 分析贯穿整个执行计划。AnalysisPass 是要分析的类的检测器集合,包括 orderedFactoryList ,memberSet
点击 Analyze 按钮后,执行 edu.umd.cs.findbugs.gui2.AnalyzingDialog.AnalysisThread#run
BugLoader 在这里是个很重要的类,它将GUI和分析引擎有机的结合了起来。
/**
* Execute the analysis. For obscure reasons, CheckedAnalysisExceptions are
* re-thrown as IOExceptions. However, these can only happen during the
* setup phase where we scan codebases for classes.
*
* @throws IOException
* @throws InterruptedException
*/
@Override
public void execute() throws IOException, InterruptedException {
if (FindBugs.isNoAnalysis()) {
throw new UnsupportedOperationException("This FindBugs invocation was started without analysis capabilities");
}
Profiler profiler = bugReporter.getProjectStats().getProfiler();
try {
try {
// 获取一个ClassFactory对象,用于创建类路径、代码库和其他相关对象。
classFactory = ClassFactory.instance();
// 创建一个类路径对象。
createClassPath();
// 报告项目文件数量和辅助类路径条目数量。
progressReporter.reportNumberOfArchives(project.getFileCount() + project.getNumAuxClasspathEntries());
//启动分析器。
profiler.start(this.getClass());
// 创建一个分析缓存对象
createAnalysisCache();
// 创建一个分析上下文对象,该对象用于处理项目、应用程序类列表和其他相关信息
createAnalysisContext(project, appClassList, analysisOptions.sourceInfoFileName);
// 构建类路径,包括发现和枚举所有类路径上的代码库
buildClassPath();
// 构建应用程序类引用集合
buildReferencedClassSet();
// 设置应用程序类列表
setAppClassList(appClassList);
// Configure the BugCollection (if we are generating one)
FindBugs.configureBugCollection(this);
// Enable/disabled relaxed reporting mode
FindBugsAnalysisFeatures.setRelaxedMode(analysisOptions.relaxedReportingMode);
FindBugsDisplayFeatures.setAbridgedMessages(analysisOptions.abridgedMessages);
// Configure training databases
FindBugs.configureTrainingDatabases(this);
// Configure analysis features
configureAnalysisFeatures();
// 创建执行计划
createExecutionPlan();
//遍历插件,并执行以下操作:
//检查插件是否启用了默认的Bug报告装饰器。
//如果启用了,则将装饰器添加到bugReporter中。 p. 如果类筛选器不空,则创建一个委托BugReporter,该委托仅报告满足类筛选器条件的类。 q. 如果应用程序类列表为空,则根据analysisOptions中的设置处理情况:如果允许无类文件,则输出无警告的输出;如果不允许,则抛出一个IOException异常。
for (Plugin p : detectorFactoryCollection.plugins()) {
for (ComponentPlugin<BugReporterDecorator> brp : p.getComponentPlugins(BugReporterDecorator.class)) {
if (brp.isEnabledByDefault() && !brp.isNamed(explicitlyDisabledBugReporterDecorators)
|| brp.isNamed(explicitlyEnabledBugReporterDecorators)) {
bugReporter = BugReporterDecorator.construct(brp, bugReporter);
}
}
}
if (!classScreener.vacuous()) {
bugReporter = new DelegatingBugReporter(bugReporter) {
@Override
public void reportBug(@Nonnull BugInstance bugInstance) {
String className = bugInstance.getPrimaryClass().getClassName();
String resourceName = ClassName.toSlashedClassName(className) + ".class";
if (classScreener.matches(resourceName)) {
this.getDelegate().reportBug(bugInstance);
}
}
};
}
if (executionPlan.isActive(NoteSuppressedWarnings.class)) {
SuppressionMatcher m = AnalysisContext.currentAnalysisContext().getSuppressionMatcher();
bugReporter = new FilterBugReporter(bugReporter, m, false);
}
if (appClassList.size() == 0) {
Map<String, ICodeBaseEntry> codebase = classPath.getApplicationCodebaseEntries();
if (analysisOptions.noClassOk) {
System.err.println("No classfiles specified; output will have no warnings");
} else if (codebase.isEmpty()) {
throw new IOException("No files to analyze could be opened");
} else {
throw new NoClassesFoundToAnalyzeException(classPath);
}
}
// 分析应用程序。
analyzeApplication();
} catch (CheckedAnalysisException e) {
……
}
}
最为核心的部分,分析引擎启动,它主要用于以下几个步骤:
- 初始化一些变量,如passCount、profiler、badClasses等。 获取项目统计信息中的profiler对象。
- 启动分析过程,并预测分析次数。 遍历所有引用类,并实例化Detector2对象。
- 检查实例化过程中出现的异常,并将其添加到badClasses集合中。
- 根据是否为非报告的第一轮分析,决定是否将引用类集合(referencedClassSet)中的所有类添加到appClassList中。
- 按照调用图的顺序对应用程序类进行排序。 遍历appClassList中的每个类,并执行以下操作: a. 检查类是否符合类过滤器的要求。 b. 如果类过大,则报告一个错误。 c. 通知类观察者。 d. 开始分析当前类。 e. 应用所有Detector2对象到当前类。 f. 结束分析当前类。
- 调用每个Detector2对象的finishPass方法。
- 完成分析过程,并报告队列中的错误。
结束分析过程。
private void analyzeApplication() throws InterruptedException {
int passCount = 0;
Profiler profiler = bugReporter.getProjectStats().getProfiler();
profiler.start(this.getClass());
AnalysisContext.currentXFactory().canonicalizeAll();
try {
boolean multiplePasses = executionPlan.getNumPasses() > 1;
if (executionPlan.getNumPasses() == 0) {
throw new AssertionError("no analysis passes");
}
int[] classesPerPass = new int[executionPlan.getNumPasses()];
classesPerPass[0] = referencedClassSet.size();
for (int i = 0; i < classesPerPass.length; i++) {
classesPerPass[i] = i == 0 ? referencedClassSet.size() : appClassList.size();
}
progressReporter.predictPassCount(classesPerPass);
XFactory factory = AnalysisContext.currentXFactory();
Collection<ClassDescriptor> badClasses = new LinkedList<>();
// 初始化类信息:方法、字段等
for (ClassDescriptor desc : referencedClassSet) {
try {
XClass info = Global.getAnalysisCache().getClassAnalysis(XClass.class, desc);
factory.intern(info);
} catch (CheckedAnalysisException e) {
AnalysisContext.logError("Couldn't get class info for " + desc, e);
badClasses.add(desc);
} catch (RuntimeException e) {
AnalysisContext.logError("Couldn't get class info for " + desc, e);
badClasses.add(desc);
}
}
if (!badClasses.isEmpty()) {
referencedClassSet = new LinkedHashSet<>(referencedClassSet);
referencedClassSet.removeAll(badClasses);
}
long startTime = System.currentTimeMillis();
bugReporter.getProjectStats().setReferencedClasses(referencedClassSet.size());
for (Iterator<AnalysisPass> passIterator = executionPlan.passIterator(); passIterator.hasNext();) {
AnalysisPass pass = passIterator.next();
// The first pass is generally a non-reporting pass which
// gathers information about referenced classes.
boolean isNonReportingFirstPass = multiplePasses && passCount == 0;
// Instantiate the detectors
Detector2[] detectorList = pass.instantiateDetector2sInPass(bugReporter);
// If there are multiple passes, then on the first pass,
// we apply detectors to all classes referenced by the
// application classes.
// On subsequent passes, we apply detector only to application
// classes.
Collection<ClassDescriptor> classCollection = (isNonReportingFirstPass) ? referencedClassSet : appClassList;
AnalysisContext.currentXFactory().canonicalizeAll();
if (PROGRESS || LIST_ORDER) {
System.out.printf("%6d : Pass %d: %d classes%n", (System.currentTimeMillis() - startTime) / 1000, passCount, classCollection
.size());
if (DEBUG) {
XFactory.profile();
}
}
if (!isNonReportingFirstPass) {
OutEdges<ClassDescriptor> outEdges = e -> {
try {
XClass classNameAndInfo = Global.getAnalysisCache().getClassAnalysis(XClass.class, e);
return classNameAndInfo.getCalledClassDescriptors();
} catch (CheckedAnalysisException e2) {
AnalysisContext.logError("error while analyzing " + e.getClassName(), e2);
return Collections.emptyList();
}
};
classCollection = sortByCallGraph(classCollection, outEdges);
}
if (LIST_ORDER) {
System.out.println("Analysis order:");
for (ClassDescriptor c : classCollection) {
System.out.println(" " + c);
}
}
AnalysisContext currentAnalysisContext = AnalysisContext.currentAnalysisContext();
currentAnalysisContext.updateDatabases(passCount);
progressReporter.startAnalysis(classCollection.size());
int count = 0;
Global.getAnalysisCache().purgeAllMethodAnalysis();
Global.getAnalysisCache().purgeClassAnalysis(FBClassReader.class);
for (ClassDescriptor classDescriptor : classCollection) {
long classStartNanoTime = 0;
if (PROGRESS) {
classStartNanoTime = System.nanoTime();
System.out.printf("%6d %d/%d %d/%d %s%n", (System.currentTimeMillis() - startTime) / 1000,
passCount, executionPlan.getNumPasses(), count,
classCollection.size(), classDescriptor);
}
count++;
// Check to see if class is excluded by the class screener.
// In general, we do not want to screen classes from the
// first pass, even if they would otherwise be excluded.
if ((SCREEN_FIRST_PASS_CLASSES || !isNonReportingFirstPass)
&& !classScreener.matches(classDescriptor.toResourceName())) {
if (DEBUG) {
System.out.println("*** Excluded by class screener");
}
continue;
}
boolean isHuge = currentAnalysisContext.isTooBig(classDescriptor);
if (isHuge && currentAnalysisContext.isApplicationClass(classDescriptor)) {
bugReporter.reportBug(new BugInstance("SKIPPED_CLASS_TOO_BIG", Priorities.NORMAL_PRIORITY)
.addClass(classDescriptor));
}
currentClassName = ClassName.toDottedClassName(classDescriptor.getClassName());
notifyClassObservers(classDescriptor);
profiler.startContext(currentClassName);
currentAnalysisContext.setClassBeingAnalyzed(classDescriptor);
try {
Collection<Callable<Void>> tasks = Arrays.stream(detectorList).map(detector -> (Callable<Void>) () -> {
if (Thread.interrupted()) {
throw new InterruptedException();
}
if (isHuge && !FirstPassDetector.class.isAssignableFrom(detector.getClass())) {
return null;
}
LOG.debug("Applying {} to {}", detector.getDetectorClassName(), classDescriptor);
try {
profiler.start(detector.getClass());
detector.visitClass(classDescriptor);
} catch (MissingClassException e) {
Global.getAnalysisCache().getErrorLogger().reportMissingClass(e.getClassDescriptor());
} catch (CheckedAnalysisException | RuntimeException e) {
logRecoverableException(classDescriptor, detector, e);
} finally {
profiler.end(detector.getClass());
}
return null;
}).collect(Collectors.toList());
service.invokeAll(tasks).forEach(future -> {
try {
future.get();
} catch (InterruptedException e) {
LOG.warn("Thread interrupted during analysis", e);
Thread.currentThread().interrupt();
} catch (ExecutionException e) {
throw new AnalysisException("Exeption was thrown during analysis", e);
}
});
if (Thread.interrupted()) {
throw new InterruptedException();
}
} finally {
progressReporter.finishClass();
profiler.endContext(currentClassName);
currentAnalysisContext.clearClassBeingAnalyzed();
if (PROGRESS) {
long usecs = (System.nanoTime() - classStartNanoTime) / 1000;
if (usecs > 15000) {
int classSize = currentAnalysisContext.getClassSize(classDescriptor);
long speed = usecs / classSize;
if (speed > 15) {
System.out.printf(" %6d usecs/byte %6d msec %6d bytes %d pass %s%n", speed, usecs / 1000, classSize,
passCount,
classDescriptor);
}
}
}
}
}
// Call finishPass on each detector
for (Detector2 detector : detectorList) {
detector.finishPass();
}
progressReporter.finishPerClassAnalysis();
passCount++;
}
} finally {
bugReporter.finish();
bugReporter.reportQueuedErrors();
profiler.end(this.getClass());
if (PROGRESS) {
System.out.println("Analysis completed");
}
}
}
熟悉设计模式的同学,在 detector.visitClass(classDescriptor); 这行代码就能看到,spotbugs 使用了访问者模式,使执行与数据相分离,能有效地解耦。
detector 有2类,一类是Detector2 一类是Detector。并通过适配器实现了统一。
Detector 有如下实现:
而在运行中,会有DetectorToDetectorAdaptor 类的存在,如下图:
比较有意思的是,它是实现了Detector2 接口,接收 Detector 参数,并在 visitClass 方法中调用其方法,是个很经典的适配器模式的使用:
综上所述,SpotBugs的架构设计体现了高效性、可扩展性和易用性的原则。通过核心的分析引擎、丰富的规则集、灵活的用户界面和集成方式以及性能优化措施,SpotBugs为Java开发人员提供了一个强大的静态分析工具,帮助他们编写更高质量的代码。