【Linux】解析键盘组合键产生信号的完整过程:从硬件中断到信号发送

news2025/1/19 14:20:56

前言

每一个了解Linux的都知道这样一个知识,Ctrl+C组合键能够终止一个进程。
在这里插入图片描述

个人了解进程相关知识之后知道,一个进程被终止只会有有三种情况:

  • 代码运行完毕,结果正确
  • 代码运行完毕,结果不正确
  • 代码运行异常,进程收到了信号,被强制终止。

然后,就去了解信号,发现存在键盘产生信号这一种方式,Ctrl+C组合键可以送2号信号SIGINT给进程,所以,上面的图片中的死循环被终止了因为进程收到了2号信号。

个人对于其中的原理非常好奇,所以经过研究就有了这一篇文章。

正文

Ctrl+CCtrl键和C键的组合,第一个问题是,计算机怎么知道有按键被按下了?

键盘上的每一个按键下方都配备了一个开关。这些开关通过刻画在电路板上的硬件电路以矩阵形式相互连接。在正常情况下,这些开关处于断路状态,这意味着没有电信号通过。然而,当按键被按下时,开关所在的电路就会连通,从而产生电信号,产生了电信号就意味着有一个按键被按下了。

第二个问题是,键盘上按键这么多,计算机怎么知道那些按键被按下了?

为了检测按键的按下和弹起,键盘内部配备了一个叫做键盘编码器(如i8048)的芯片。该芯片通过轮询的方式不断监控按键的状态,并将按键被按下或弹起而产生的相关信息向键盘控制器报告。这些信息被称为键盘扫描码,它们代表了按键的具体位置和状态。

关于键盘扫描码,现有的编码方式一共有三种,相应的也就存在三套键盘扫描码,现今的键盘大多数默认使用第二套键盘扫描码,但也不排除使用第一套和第三套的,所以为了兼容,键盘控制器会统统地将来自键盘编码器的扫描码转换为第一套扫描码。

关于第一套键盘扫描码,每个按键都有两个状态:按下和弹起,因此每个按键都会对应两个扫描码。按键按下时的编码称为通码 (makecode),而弹起时的编码称为断码 (breakcode)。大部分键的通码和断码都是用1个字节来表示的,但也有一些特殊键,如控制键(ctrlalt)、附加键(Insert)、小键盘区键(/)以及方向键等,它们的扫描码可能是2个字节甚至更多来表示的。这些多字节的扫描码通常以0xE0开头,只有Pause Break键的扫描码是以0xE1开头。

断码与通码之间存在一个简单的关系:断码 = 通码 + 0x80。从二进制表示来看,0x801000 0000,这意味着在8个比特中,最高位(第7位)表示按键的状态,0表示按下,1表示弹起。

举个例子,假设一个按键的通码是 0x45,那么它的二进制表示是 0100 0101。如果我们将它的最高位设为1,就得到断码 0xC5,对应的二进制表示是 1100 0101。这样,按键按下时发送的通码和按键释放时发送的断码之间的关系就清楚了。

这里再来说一下另一个与键盘有关的芯片——键盘控制器(i8042),键盘控制器并不位于键盘内部,而是被集成在主板的南桥芯片上。它的主要任务是接收键盘编码器发来的扫描码(第二套),解码(转换为第一套)后保存到自己的寄存器中,并通过中断控制器向CPU发送中断请求。

分别来说说这里涉及到的三个东西:南桥、键盘控制器内的寄存器、中断控制器。

南桥芯片是主板芯片组的一部分,主要负责系统的输入输出功能。在早期的计算机架构中,晶体管的数量相对偏少,处理器集成度较低,必须要由主板芯片组来承担大量功能,芯片组分为南桥芯片组和北桥芯片组两部分,北桥芯片负责CPU与内存的数据交换、图形处理以及CPU与PCIE数据交换,而南桥则负责系统的输入输出功能。然而,随着CPU制造工艺的进步和集成度的提高,许多原本由北桥芯片负责的功能现在已经被集成到CPU内部,导致北桥芯片逐渐被淘汰。现在的Intel芯片组只保留了南桥芯片,而AMD也只有早期的主板还保留了北桥和南桥。

键盘控制器内部拥有 4 个大小为 8 bits 的寄存器,它们的名称及作用分别如下:

  1. Status Register(状态寄存器)
    一个8位只读寄存器,任何时刻均可被cpu读取,各比特位定义如下:
    Bit7:奇偶校验错误。如果从键盘接收到的数据出现奇偶校验错误,此位将被置1。
    Bit6:当键盘控制器在接收数据时发生超时,此位将被置1。
    Bit5:当键盘控制器在发送数据时发生超时,此位将被置1。
    Bit4:如果为1,表示键盘未被禁用;如果为0,表示键盘被禁用。
    Bit3:如果为1,表示输入缓冲器中的内容为命令;如果为0,表示输入缓冲器中的内容为数据。
    Bit2:在加电启动时为0,在自检通过后置1。
    Bit1:如果为1,表示输入缓冲器已满,等待被 i8042 取走数据后将被清零。
    BitO:如果为1,表示输出缓冲器已满,等待 CPU 读取数据后将被清零。

  2. Control Register(控制寄存器)
    也被称作 Controller Command Byte (控制器命令字节)。各比特位定义如下:
    Bit7: 保留。应该始终为0。
    Bit6: 如果为1,键盘控制器将会将第二套扫描码翻译为第一套。
    Bit5: 如果为1,将禁止鼠标。
    Bit4: 如果为1,将禁止键盘。
    Bit3: 如果为1,将忽略状态寄存器中的 Bit4。
    Bit2: 如果为1,将设置状态寄存器中的 Bit2。
    Bit1: 如果为1,将启用鼠标中断。
    BitO: 如果为1,将启用键盘中断。

  3. Output Buffer(输出缓冲器)
    一个8位只读寄存器。键盘驱动程序从这个寄存器中读取数据。数据包括【扫描码】、【发往 i8042 命令的响应】、【间接的发往 i8048 命令的响应】等。

  4. Input Buffer(输入缓冲器)
    一个8位只写寄存器。缓冲键盘驱动程序发来的内容。内容包括【发往 i8042 的命令】、【通过 i8042 间接发往 i8048 的命令】、【以及作为命令参数的数据】等。

大致了解了这四个寄存器的作用之后,键盘控制器的工作过程就清晰了,键盘控制器接收到来自键盘编码器发送的通码或者断码,它会先把收到的这个通码或者断码解码转化成第一套扫描码,再放到输出缓冲器(Output Buffer)中,同时状态寄存器的 bit0 会被设置为1,表示键盘数据输入就绪,等待读取。然后键盘控制器回向中断控制器发送一个中断请求信号。

所以就涉及到接下来要将的第三个硬件——中断控制器。

中断控制器是计算机系统中的另一个硬件组件,负责管理各种设备控制器(比如键盘控制器、鼠标控制器、网卡控制器)发送过来的中断请求。中断控制器中较为流行的是Intel 8259A芯片,下面以8259A工作原理的例研究一下中断控制器干了什么:

  1. 8259A向CPU发送中断请求

8259A收到来自键盘控制器的中断请求,它会先检测内部的一个叫做 IMR 的寄存器(英文名称:Interrupt Mask Register,中文翻译:中断屏蔽寄存器),查看一下收到的这个键盘中断信号是否被屏蔽,如果没有被屏蔽,8259A就会向CPU的某个核心发送中断请求。

  1. CPU保存线程上下文数据。

大多数情况下,CPU的这个核心正在执行某一个线程的某一条指令(调度线程代码),由于中断请求的优先级比调度当前线程的优先级要高,所以CPU会停下当前线程的调度工作,转而进行中断处理,但是中断处理完之后,如果该线程的时间片没有过期,CPU就又得继续调度这个被暂停的线程,这个需求就又产生另一个问题,CPU必须知道这个线程被暂停之前执行到那一条指令了,执行这条指令需要的数据是什么,存储在CPU哪个寄存器内;

要知道,CPU内部的寄存器只有一套,如果中断处理过程中恰好用到了某个寄存器,这个寄存器恰好保存了被暂停线程的数据,这就会导致数据因为覆盖而丢失,所以CPU暂停线程后,还要将其在寄存器产生的所有信息保存操作系统内核中,这个过程就叫做“保存线程上下文”。

  1. CPU响应中断,并向8259A获取中断向量号。

CPU保存线程上下文之后,向8259A发送一个中断回复信号,8259A收到回复信号后,会在内部做一些处理,表示该中断正在被CPU处理,然后,CPU再次向8259A发送一个信号,表示想要获取中断向量号,8259A通过数据总线向CPU发送中断向量号,至此8259A或者说中断控制器的工作大致就完了,CPU会将中断向量号存储在某个寄存器中。

以上就是键盘产生信号的硬件部分的工作,往下就是软件部分的工作了,主要包括中断向量号,中断向量表,键盘驱动程序,键盘文件缓冲区和 shell 程序的工作了。

首先是中断向量号与中断向量表:

在操作系统内核中存在这样一张表,英文名称,Interrupt Vector Table,翻译过来就叫做中断向量表,这张表里存储的是中断源所对应的中断处理程序的入口地址, CPU会根据中断向量号在中断向量表中索引到处理该中断的中断处理程序的入口地址,通过地址找到中断处理程序然后执行该程序,这就是中断处理的大致流程。

翻译成人话就是,所谓中断向量表其实就是一个函数指针数组,里面存储的地址各种硬件设备驱动程序所提供的能够操作自身硬件的函数(关于驱动后面会谈到),这就是中断向量表的真面目,至于中断向量号,中断向量表不是个数组吗,数组不是有下标吗,所以中断向量号这个看起来高大上的东西说白了就是数组的下标。

其次是键盘驱动程序:

讲到键盘驱动程序就又得重谈一下硬件的设备控制器。我们都知道硬件与硬件之间的运作原理和机制之间的差别是非常大的,像键盘,硬盘,网卡这些就不是能够混为一谈的东西,为了屏蔽设备之间的差异,每个设备都有一个叫设备控制器(Device Control) 的组件,比如硬盘有硬盘控制器、显示器有视频控制器,键盘有键盘控制器等。

但是只有设备控制器还是不够,虽然设备控制器屏蔽了设备的众多细节,但每种设备的控制器的寄存器、缓冲区等使用模式都是不同的,所以为了屏蔽「设备控制器」的差异,引入了设备驱动程序。

设备控制器不属于操作系统范畴,它是属于硬件,而设备驱动程序属于操作系统的一部分,操作系统的内核代码可以像本地调用代码一样使用设备驱动程序的接口,而设备驱动程序是面向设备控制器的代码,它发出操控设备控制器的指令后,才可以操作设备控制器,不同的设备控制器虽然功能不同,但是设备驱动程序会提供统一的接口给操作系统,这样不同的设备驱动程序,就可以以相同的方式接入操作系统。

至此,内核通过驱动控制设备控制器,最后达成对硬件设备的统一管理,然后这也就是解释了,在了解键盘控制器(i8042)时,读取输出缓冲器的对象是键盘驱动程序。

驱动程序处理扫描码

再来梳理一下,键盘控制器中的数据已经准备好了,差的是通过通知键盘驱动程序来读取,而通知的手段就是硬件中断机制,接下来就是要理解键盘驱动程序如何读取或者说,读取到扫描符之后要做什么:

键盘驱动程序从键盘控制器的输出缓冲器读取一个字节大小的扫描码时,它首先会检查这个扫描码是否表示一个按键的按下(通码)或释放(断码)。接着,驱动程序会进行一系列的转换和检测:

首先,为了确保按键的稳定性和准确性,驱动程序会检查是否是真正的按键事件,而不是由于电气噪声或按键抖动引起的误报。这通常涉及到检测按键的多次按下和释放,并在一定时间内稳定后才认为是一个有效的按键事件。

然后,驱动程序会根据扫描码来判断它是普通字符数据(如字母、数字、标点符号等)还是属于命令(如Ctrl+CCtrl+D、Shift、方向键等)。

如果驱动程序判断当前读取的是普通字符数据,它会做这样的一件事:
键盘驱动程序会根据当前键盘的布局和状态(如大写锁定、数字锁定等)来确定具体的字符,并将其转换为对应的ASCII码或Unicode码,然后把它写入键盘的内核级文件缓冲区中。问题来了,键盘是硬件,怎么跟文件扯上关系了?这就不得不谈到Linux系统“一切皆文件”的设计理念了。

虽然键盘是硬件,但是在系统眼里,它被当成一个文件来处理,读取键盘数据在操作系统的运作逻辑里被当成是读取键盘文件的内容,既然键盘是文件,操作系统就会在内核中为其创建相应的 struct file 结构体对象,同时还有一段用于存储文件数据的内核级文件缓冲区,这个缓冲区是内核空间的一部分,用于在用户和内核之间传递数据。

当用户空间程序(如shell、文本编辑器等)需要读取键盘输入时,它们会打开相应的设备文件,并通过调用操作系统提供的系统调用从内核级文件缓冲区中读取数据。这些数据可能是字符、按键事件或其他类型的信息,具体取决于用户空间程序的需求。

如果驱动程序判断当前读取的命令,它会做这样的一件事:
驱动程序可能会产生特定的系统事件或调用特定的系统服务,而不是直接生成字符。

举个例子,我们都知道Ctrl+C组合键通常用于发送中断信号(SIGINT),用于终止当前正在运行的进程。假设按下的是Ctrl+C组合键,键盘驱动程序不会直接进行任何操作,它会通知操作系统内核,“通知”只是说法,其实也是一种中断机制,不过这是软件层面的中断,所以,操作系统内核接收到这个通知后,会调用相应的中断处理程序来处理这个中断事件。在中断服务例程中,内核会将Ctrl+C事件转换为相应的信号,通常是中断信号(如SIGINT)。内核接着会将这个信号发送给前台进程组中的所有进程,在大多数情况下,前台进程组只包含一个进程,即你当前在shell中直接运行的进程。

进程收到了信号之后,就会如果处理信号的动作没有被修改过的话,就会执行默认动作,SIGINT 信号的默认动作就是终止。

至此,键盘组合键产生信号的从硬件层面到软件层面的完整过程解析完毕。

参考文章

  1. 在键盘上敲了一个字母之后,电脑内部发生了什么?
  2. 《键盘敲入 A 字母时,操作系统期间发生了什么…》
  3. 《Intel 8042键盘控制器详细介绍》
  4. 《键盘是如何工作的?》
  5. 《从按键到响应,键盘的底层原理是什么?》
  6. 《主板上的南桥和北桥是什么意思?》
  7. 《什么是中断向量表》
  8. 《一文讲透计算机的“中断”》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1674269.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

广东省网络安全竞赛部分web,misc wp

我的队伍只做了5题,还是太菜了,本来不想发的,但是写都写了,还是水一篇博客吧 这里是我们队的wp misc1 给了一个压缩包,解压需要密码,用纯数字密码没跑出来,感觉可能不是要强跑,看…

海外媒体宣发:新加坡.马来西亚如何在海外媒体投放新闻通稿-大舍传媒

导言 随着全球化的进程加速,海外市场对于企业的发展越来越重要。而在海外媒体上宣传企业的新闻通稿,成为了拓展海外市场和提升企业知名度的重要手段之一。本文将介绍大舍传媒对于如何在海外媒体上投放新闻通稿的经验和策略。 准备工作:了解…

Patch-Wise Graph Contrastive Learning for Image Translation

Patch-Wise Graph Contrastive Learning for Image Translation 图像翻译中的逐块图对比学习 Chanyong Jung1, Gihyun Kwon1, Jong Chul Ye1, 2 Chanyong Jung,Gihyun Kwon,Jong Chul Ye 1, 2 Abstract 摘要 Patch-Wise Graph Cont…

CSS实现渐变色

渐变色分为线性渐变和径向渐变。 线性渐变linear-gradient(方向, 颜色1, 颜色2, … ,颜色n)径向渐变radial-gradient(颜色1 覆盖区域大小, 颜色2 覆盖区域大小, … ) 线性渐变的方向可以为: ​ 1、一个方向值时: to bottom 表示从上边到下边渐变 ​ 2、…

SpringAMQP 发布订阅-DirectExchange

DirectExchange: 路由模式模型 代码实现 直接通过注解方式绑定交换机和队列,这里边加了key也就是BingdingKey绑定key,可以看作交换机的路由规则,交换机收到消息后读取消息中指定的Routingkey发送到存有相应BingdingKey的队列中。 RabbitLis…

【Power BI】DAX语言 VS Power Query M语言

DAX(Data Analysis Expressions)和Power Query M语言是Microsoft Power BI和Excel中的两种强大的数据处理和分析工具。尽管它们在许多方面都有重叠之处,特别是用于数据建模和数据转换,但它们在用途、语法和功能上有显著的区别。本…

联想移动硬盘数据不见了?别急,分享4种实用恢复方法

在数字化时代,硬盘作为数据存储的核心设备,承载着大量的重要信息和文件。然而,有时我们可能会遭遇硬盘数据丢失的困境,特别是当这个问题发生在联想硬盘上时,更是让人倍感焦虑。本文将深入探讨联想硬盘数据丢失的可能原…

【热门话题】Vue.js:现代前端开发的轻量级框架之旅

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 Vue.js:现代前端开发的轻量级框架之旅一、Vue.js概览1.1 Vue.js的诞…

如何完美实现文件外发防泄漏,保护核心数据资产?

不管是大型企业,还是小型创业公司,不论企业规模大小,每天都会有大量的文件要进行内部传输协作和对外发送使用,数据的生产也是企业业务生产力的体现之一。因此文件外发防泄漏是企业信息安全中的一个重要议题,为了防止企…

关于‘==’与equals的区别

我写的也不清楚,有兴趣的可以看这位大佬的文章链接,说的很清楚 https://www.cnblogs.com/Latiny/p/8099581.html#!comments 与 equals 方法 判断两个变量是否相等有两种方式:一种是利用 运算符,另一种是利用equals方法。 注意…

YOLOv9全网最新改进系列::YOLOv9完美融合双卷积核(DualConv)来构建轻量级深度神经网络,目标检测模型有效涨点神器!!!

YOLOv9全网最新改进系列::YOLOv9完美融合双卷积核(DualConv)来构建轻量级深度神经网络,目标检测模型有效涨点神器!!! YOLOv9原文链接戳这里,原文全文翻译请关注B站Ai学术叫叫首er …

Flutter 依据JSON数据自动生成实体类

json自动化生成工具 点击这里可以跳转 页面是这样的 然后在左边输入你的json数据,它会自动生成对应的实体类 生成的实体类是如下: import package:json_annotation/json_annotation.dart; part merch_region.g.dart;JsonSerializable()class MerchReg…

Java面试八股之反射慢在哪里

Java反射慢在哪里 动态类型检查: 在反射过程中,Java需要在运行时确定类、方法、字段等的类型信息。这与编译时已经确定类型信息的常规对象访问不同,反射需要额外的类型查询和验证,增加了性能开销。 安全检查: 反射…

【流体模拟-01】如何模拟静态流(上)

文章目录 一、说明二、摘要三、简介四、稳定的纳维-斯托克斯4.1 基本方程4.2 解决方法 一、说明 关于流体物质的仿真和模拟,需要流体理论方面的一般知识。我们这里从基本流体方程入手,详细解释如何实现流体仿真的每一个具体步骤。 二、摘要 构建类似流体…

应急救灾北斗终端手机应用方案

在应对自然灾害和紧急救援的严峻挑战中,技术的力量从未如此重要。为了保障救援人员能够迅速、准确地响应灾情,提供及时有效的救助,顶坚应急救灾北斗终端手机应用应运而生。这款应用依托北斗卫星导航系统的高精度定位与通信功能,不…

企业OA办公系统开发笔记:2、MyBatis-Plus

文章目录 企业办公系统:2、MyBatis-Plus一、MyBatis-Plus1、简介2、主要特点3、依赖 二、MyBatis-Plus入门1、配置文件2、启动类3、实体类4、添加Mapper类5、测试Mapper接口6、CRUD测试6.1、insert添加6.1.1、示例6.1.2、主键策略 6.2、更新6.3、删除6.3.1、根据id删…

LoRA Land: 310个经微调的大语言模型可媲美GPT-4

摘要 低秩自适应 (LoRA) 已成为大语言模型 (LLM) 参数有效微调 (PEFT) 中最广泛采用的方法之一。LoRA 减少了可训练参数的数量和内存使用,同时达到了与全面微调相当的性能。该研究旨在评估在实际应用中训练和服务使用 LoRA 微调的 LLM 的可行性。首先,该研究测量了在 10 个基础…

学校为何更热衷于使用SOLIDWORKS教育版教学

在当今的教育环境中,SOLIDWORKS教育版因其独特的优势,越来越受到学校的青睐。为什么学校更热衷于使用SolidWorks教育版进行教学呢?本文将从以下几个方面进行阐述。 首先,SOLIDWORKS教育版为学生们提供了一个与实际工程应用紧密结…

java学习之zip炸弹攻击

一、概述 Zip炸弹是一种特殊类型的Zip文件,它包含了大量的无用数据。Zip文件格式允许使用压缩算法来减小文件的大小,但是如果Zip文件中的某些内容被重复压缩,就会导致文件大小急剧增加。Zip炸弹利用这个特性,将一些无用的数据多次…

vscode调试Electron+ts

调试Electronjs 调试Electronjs: https://www.electronjs.org/zh/docs/latest/tutorial/debugging-vscode 调试Electronts 首先看一下,我的目录结构。目录结构决定了launch.json中的路径部分。我将在项目根目录下进行调试,项目根目录下包含electron代码…