感谢地心引力 ,有幸再次遇见你:
- 还记得 2020 年 07 月 22 日吗?
- 你撰写了第 1 篇技术博客:《遗传算法实例解析》
- 在这平凡的一天,你赋予了它不平凡的意义。
- 也许是立志成为一名专业 IT 作者、也许是记录一段刚实践的经验。
- 但在那一刻,你已在创作这趟旅程中出发。
- 今天,是你成为创作者的第1460天。
- 在这段时间里,相信你已经获得了更大的成长。
- 可能虽然日常忙碌但你还在坚持创作、可能初心还在但博客已良久未更新。
- 但创作这份心情,任何时刻你打开都新鲜。
- 不妨放下手中的工作,和大家分享在这段时间中的收获、你的技术成长。
- 我们也为你准备了专属「纪念勋章」作为感恩,以及「里程碑专区」 ,您的分享会像时间的脚印一样记录在纪念碑上。
文章目录
- 一、事件简述
- 二、瞎谈
一、事件简述
2024年7月19日,全球发生大规模蓝屏死机事件,此事件造成数以万计使用Microsoft Windows
系统的机器无法使用,问题原因指向CrowdStrike
的Falcon Sensor
产品。这次停机造成了广泛的全球影响,包括各地机场及航空公司电脑系统下线导致航班停飞延误、暂时性导致英国天空新闻台下线,以及影响美国911紧急呼叫中心。
全球受影响的Windows设备约为850
万台,虽然数量不及1%
,但影响却几乎"覆盖“全球。
国内绝大部分人是没影响的,外企工作的可能会遇到。(因为这是美国的安全软件)
CrowdStrike声明:
CrowdStrike
是位于美国加利福尼亚州森尼韦尔的计算机安全技术公司,提供端点安全、威胁情报和网络攻击的安全服务。该公司参与了多起备受瞩目的网络攻击的调查,包括2014年索尼影业黑客事件、2015-16 年针对民主党全国委员会 (DNC) 的网络攻击以及2016年美国民主党全国委员会邮件泄密事件。
二、瞎谈
2024 年 7 月 19 日 04:09 UTC,作为持续运营的一部分,CrowdStrike 向 Windows 系统发布了Falcon Sensor
配置更新。Falcon Sensor配置更新是 Falcon
平台保护机制的持续组成部分。此配置更新触发了逻辑错误
,导致受影响的系统崩溃和蓝屏 (BSOD)。
导致系统崩溃的Senor配置更新已于 2024 年 7 月 19 日星期五 05:27 UTC 修复。
作为 Falcon Senor 使用的行为保护机制的一部分。通道文件(Channel Files
,即前面提到的配置文件)的更新是Senor操作的正常部分,每天进行几次
,以响应 CrowdStrike 发现的新策略、技术和程序。这不是一个新过程;该架构自 Falcon 成立之初就已存在。
在 Windows 系统上,通道文件位于以下目录中:
C:\Windows\System32\drivers\CrowdStrike\
并且文件名以“ C-”开头。每个通道文件都分配有一个数字作为唯一标识符。此事件中受影响的通道文件为 291,文件名以“ C-00000291-”开头并以扩展名结尾.sys。虽然通道文件以 SYS 扩展名结尾,但它们不是内核驱动程序
。
通道文件 291 控制 Falcon 如何评估 Windows 系统上的命名管道执行。命名管道用于 Windows 中的正常、进程间或系统间通信。
具体如何触发了逻辑错误,还在分析中。
技术出错的细节是微观的、局部的、不可避免的。
互联网的兴起,使得一个人的影响力可以以毫秒级影响到世界的每一个角落。一个程序员的错误(或者一个不法分子的代码)可以在几分钟、几小时内,使得无数个机场、车站、酒店、医院等等企业的服务瘫痪。有人因此损失许多财富、有人因此丢掉生命(比如医院因此抢救不及时)。
这样的事故不可避免,就拿国内来说,云服务(当然,这不一定是软件的问题)的瘫痪是“常有”的事情,这你一定经历过,什么微信瘫痪、B站瘫痪、支付宝瘫痪等等。
如何降低这些错误带来的影响呢?做测试、加冗余…但这都会增加人力、财力、时间成本。人(企业)是贪婪和懒惰的,开发的东西、更新的东西,不可能都去做完美的测试。
这两年,公路上无人驾驶汽车,越来越多(重庆比较少🤭),几年后,这些汽车会遍布每一个角落。它们,都是联网的,车机系统会不会也出现今天这样类似的情况?
不会!做安全的专家们可以解决无人驾驶汽车的安全问题。
巧了,CrowdStrike
就是做安全的专家。
那无人飞机好像没出过事啊。
飞机的操控系统(飞控系统,Flight ControlSystem)本身通常是独立于外部网络的,以确保其安全性和可靠性。然而,现代飞机确实有其他系统连接到外部网络,这些系统包括但不限于通信、导航和娱乐系统。飞控系统是控制飞机飞行的关键系统,包括自动驾驶仪、飞行控制计算机、传感器和执行器等。这些系统的设计高度强调安全性和冗余,通常具有以下特点:
- 独立性:飞控系统与外部网络隔离,以防止网络攻击或其他外部干扰。通信、导航、娱乐系统是联网的。
- 冗余设计:关键组件具有多重备份,以确保在一个组件失效时,其他组件可以继续正常工作。
- 实时性:飞控系统需要实时响应飞行员的操作和传感器输入,因此其设计和运行环境要求非常严格,不能容忍任何延迟或不确定性。
而无人驾驶汽车的操控系统确是联网的:路况信息、车辆通信、软件更新等等(甚至还有运营商的远程控制用于紧急情况下的远程干预)。
冗余设计和网络安全肯定是有的,通常情况下,它比人类驾驶更加安全。但系统更新、车辆通信等操作确存在不可避免的隐患,即使大家都是“专家”。
万物互联的时代,更应该注重网络安全问题,这种安全问题不仅仅是系统被入侵了、信息泄露了,更重要的是网络安全会不会危及人的生命安全。手机、电脑、空调、摄像头联网无可厚非,常见的也就是光腚直播,但煤气灶你敢联网吗?
一个人、一个团队的小小的疏忽,可能会影响到全世界,这无法避免。
我们要做的不仅仅是如何降低错误,不仅仅是你应该怎样(人们很少去做应该做的事),而是:即使出了错,问题也不大,让那些应该安全的东西更安全,让它们与可能不安全的东西隔离开。
Reference:https://youtu.be/d9KcUziiF60