解析Linux键盘组合键产生信号的完整过程:从硬件中断到信号发送

news2025/1/11 6:00:24

前言

每一个了解Linux的都知道这样一个知识,Ctrl+C组合键能够终止一个进程。
在这里插入图片描述

个人了解进程相关知识之后知道,一个进程被终止只会有有三种情况:

  • 代码运行完毕,结果正确
  • 代码运行完毕,结果不正确
  • 代码运行异常,进程收到了信号,被强制终止。

然后,就去了解信号,发现存在键盘产生信号这一种方式,Ctrl+C组合键可以送2号信号SIGINT给进程,所以,上面的图片中的死循环被终止了因为进程收到了2号信号。

个人对于其中的原理非常好奇,所以经过研究就有了这一篇文章。

正文

Ctrl+CCtrl键和C键的组合,第一个问题是,计算机怎么知道有按键被按下了?

键盘上的每一个按键下方都配备了一个开关。这些开关通过刻画在电路板上的硬件电路以矩阵形式相互连接。在正常情况下,这些开关处于断路状态,这意味着没有电信号通过。然而,当按键被按下时,开关所在的电路就会连通,从而产生电信号,产生了电信号就意味着有一个按键被按下了。

第二个问题是,键盘上按键这么多,计算机怎么知道那些按键被按下了?

为了检测按键的按下和弹起,键盘内部配备了一个叫做键盘编码器(如i8048)的芯片。该芯片通过轮询的方式不断监控按键的状态,并将按键被按下或弹起而产生的相关信息向键盘控制器报告。这些信息被称为键盘扫描码,它们代表了按键的具体位置和状态。

关于键盘扫描码,现有的编码方式一共有三种,相应的也就存在三套键盘扫描码,现今的键盘大多数默认使用第二套键盘扫描码,但也不排除使用第一套和第三套的,所以为了兼容,键盘控制器会统统地将来自键盘编码器的扫描码转换为第一套扫描码。

关于第一套键盘扫描码,每个按键都有两个状态:按下和弹起,因此每个按键都会对应两个扫描码。按键按下时的编码称为通码 (makecode),而弹起时的编码称为断码 (breakcode)。大部分键的通码和断码都是用1个字节来表示的,但也有一些特殊键,如控制键(ctrlalt)、附加键(Insert)、小键盘区键(/)以及方向键等,它们的扫描码可能是2个字节甚至更多来表示的。这些多字节的扫描码通常以0xE0开头,只有Pause Break键的扫描码是以0xE1开头。

断码与通码之间存在一个简单的关系:断码 = 通码 + 0x80。从二进制表示来看,0x801000 0000,这意味着在8个比特中,最高位(第7位)表示按键的状态,0表示按下,1表示弹起。

举个例子,假设一个按键的通码是 0x45,那么它的二进制表示是 0100 0101。如果我们将它的最高位设为1,就得到断码 0xC5,对应的二进制表示是 1100 0101。这样,按键按下时发送的通码和按键释放时发送的断码之间的关系就清楚了。

这里再来说一下另一个与键盘有关的芯片——键盘控制器(i8042),键盘控制器并不位于键盘内部,而是被集成在主板的南桥芯片上。它的主要任务是接收键盘编码器发来的扫描码(第二套),解码(转换为第一套)后保存到自己的寄存器中,并通过中断控制器向CPU发送中断请求。

分别来说说这里涉及到的三个东西:南桥、键盘控制器内的寄存器、中断控制器。

南桥芯片是主板芯片组的一部分,主要负责系统的输入输出功能。在早期的计算机架构中,晶体管的数量相对偏少,处理器集成度较低,必须要由主板芯片组来承担大量功能,芯片组分为南桥芯片组和北桥芯片组两部分,北桥芯片负责CPU与内存的数据交换、图形处理以及CPU与PCIE数据交换,而南桥则负责系统的输入输出功能。然而,随着CPU制造工艺的进步和集成度的提高,许多原本由北桥芯片负责的功能现在已经被集成到CPU内部,导致北桥芯片逐渐被淘汰。现在的Intel芯片组只保留了南桥芯片,而AMD也只有早期的主板还保留了北桥和南桥。

键盘控制器内部拥有 4 个大小为 8 bits 的寄存器,它们的名称及作用分别如下:

  1. Status Register(状态寄存器)
    一个8位只读寄存器,任何时刻均可被cpu读取,各比特位定义如下:
    Bit7:奇偶校验错误。如果从键盘接收到的数据出现奇偶校验错误,此位将被置1。
    Bit6:当键盘控制器在接收数据时发生超时,此位将被置1。
    Bit5:当键盘控制器在发送数据时发生超时,此位将被置1。
    Bit4:如果为1,表示键盘未被禁用;如果为0,表示键盘被禁用。
    Bit3:如果为1,表示输入缓冲器中的内容为命令;如果为0,表示输入缓冲器中的内容为数据。
    Bit2:在加电启动时为0,在自检通过后置1。
    Bit1:如果为1,表示输入缓冲器已满,等待被 i8042 取走数据后将被清零。
    BitO:如果为1,表示输出缓冲器已满,等待 CPU 读取数据后将被清零。

  2. Control Register(控制寄存器)
    也被称作 Controller Command Byte (控制器命令字节)。各比特位定义如下:
    Bit7: 保留。应该始终为0。
    Bit6: 如果为1,键盘控制器将会将第二套扫描码翻译为第一套。
    Bit5: 如果为1,将禁止鼠标。
    Bit4: 如果为1,将禁止键盘。
    Bit3: 如果为1,将忽略状态寄存器中的 Bit4。
    Bit2: 如果为1,将设置状态寄存器中的 Bit2。
    Bit1: 如果为1,将启用鼠标中断。
    BitO: 如果为1,将启用键盘中断。

  3. Output Buffer(输出缓冲器)
    一个8位只读寄存器。键盘驱动程序从这个寄存器中读取数据。数据包括【扫描码】、【发往 i8042 命令的响应】、【间接的发往 i8048 命令的响应】等。

  4. Input Buffer(输入缓冲器)
    一个8位只写寄存器。缓冲键盘驱动程序发来的内容。内容包括【发往 i8042 的命令】、【通过 i8042 间接发往 i8048 的命令】、【以及作为命令参数的数据】等。

大致了解了这四个寄存器的作用之后,键盘控制器的工作过程就清晰了,键盘控制器接收到来自键盘编码器发送的通码或者断码,它会先把收到的这个通码或者断码解码转化成第一套扫描码,再放到输出缓冲器(Output Buffer)中,同时状态寄存器的 bit0 会被设置为1,表示键盘数据输入就绪,等待读取。然后键盘控制器回向中断控制器发送一个中断请求信号。

所以就涉及到接下来要将的第三个硬件——中断控制器。

中断控制器是计算机系统中的另一个硬件组件,负责管理各种设备控制器(比如键盘控制器、鼠标控制器、网卡控制器)发送过来的中断请求。中断控制器中较为流行的是Intel 8259A芯片,下面以8259A工作原理的例研究一下中断控制器干了什么:

  1. 8259A向CPU发送中断请求

8259A收到来自键盘控制器的中断请求,它会先检测内部的一个叫做 IMR 的寄存器(英文名称:Interrupt Mask Register,中文翻译:中断屏蔽寄存器),查看一下收到的这个键盘中断信号是否被屏蔽,如果没有被屏蔽,8259A就会向CPU的某个核心发送中断请求。

  1. CPU保存线程上下文数据。

大多数情况下,CPU的这个核心正在执行某一个线程的某一条指令(调度线程代码),由于中断请求的优先级比调度当前线程的优先级要高,所以CPU会停下当前线程的调度工作,转而进行中断处理,但是中断处理完之后,如果该线程的时间片没有过期,CPU就又得继续调度这个被暂停的线程,这个需求就又产生另一个问题,CPU必须知道这个线程被暂停之前执行到那一条指令了,执行这条指令需要的数据是什么,存储在CPU哪个寄存器内;

要知道,CPU内部的寄存器只有一套,如果中断处理过程中恰好用到了某个寄存器,这个寄存器恰好保存了被暂停线程的数据,这就会导致数据因为覆盖而丢失,所以CPU暂停线程后,还要将其在寄存器产生的所有信息保存操作系统内核中,这个过程就叫做“保存线程上下文”。

  1. CPU响应中断,并向8259A获取中断向量号。

CPU保存线程上下文之后,向8259A发送一个中断回复信号,8259A收到回复信号后,会在内部做一些处理,表示该中断正在被CPU处理,然后,CPU再次向8259A发送一个信号,表示想要获取中断向量号,8259A通过数据总线向CPU发送中断向量号,至此8259A或者说中断控制器的工作大致就完了,CPU会将中断向量号存储在某个寄存器中。

以上就是键盘产生信号的硬件部分的工作,往下就是软件部分的工作了,主要包括中断向量号,中断向量表,键盘驱动程序,键盘文件缓冲区和 shell 程序的工作了。

首先是中断向量号与中断向量表:

在操作系统内核中存在这样一张表,英文名称,Interrupt Vector Table,翻译过来就叫做中断向量表,这张表里存储的是中断源所对应的中断处理程序的入口地址, CPU会根据中断向量号在中断向量表中索引到处理该中断的中断处理程序的入口地址,通过地址找到中断处理程序然后执行该程序,这就是中断处理的大致流程。

翻译成人话就是,所谓中断向量表其实就是一个函数指针数组,里面存储的地址各种硬件设备驱动程序所提供的能够操作自身硬件的函数(关于驱动后面会谈到),这就是中断向量表的真面目,至于中断向量号,中断向量表不是个数组吗,数组不是有下标吗,所以中断向量号这个看起来高大上的东西说白了就是数组的下标。

其次是键盘驱动程序:

讲到键盘驱动程序就又得重谈一下硬件的设备控制器。我们都知道硬件与硬件之间的运作原理和机制之间的差别是非常大的,像键盘,硬盘,网卡这些就不是能够混为一谈的东西,为了屏蔽设备之间的差异,每个设备都有一个叫设备控制器(Device Control) 的组件,比如硬盘有硬盘控制器、显示器有视频控制器,键盘有键盘控制器等。

但是只有设备控制器还是不够,虽然设备控制器屏蔽了设备的众多细节,但每种设备的控制器的寄存器、缓冲区等使用模式都是不同的,所以为了屏蔽「设备控制器」的差异,引入了设备驱动程序。

设备控制器不属于操作系统范畴,它是属于硬件,而设备驱动程序属于操作系统的一部分,操作系统的内核代码可以像本地调用代码一样使用设备驱动程序的接口,而设备驱动程序是面向设备控制器的代码,它发出操控设备控制器的指令后,才可以操作设备控制器,不同的设备控制器虽然功能不同,但是设备驱动程序会提供统一的接口给操作系统,这样不同的设备驱动程序,就可以以相同的方式接入操作系统。

至此,内核通过驱动控制设备控制器,最后达成对硬件设备的统一管理,然后这也就是解释了,在了解键盘控制器(i8042)时,读取输出缓冲器的对象是键盘驱动程序。

驱动程序处理扫描码

再来梳理一下,键盘控制器中的数据已经准备好了,差的是通过通知键盘驱动程序来读取,而通知的手段就是硬件中断机制,接下来就是要理解键盘驱动程序如何读取或者说,读取到扫描符之后要做什么:

键盘驱动程序从键盘控制器的输出缓冲器读取一个字节大小的扫描码时,它首先会检查这个扫描码是否表示一个按键的按下(通码)或释放(断码)。接着,驱动程序会进行一系列的转换和检测:

首先,为了确保按键的稳定性和准确性,驱动程序会检查是否是真正的按键事件,而不是由于电气噪声或按键抖动引起的误报。这通常涉及到检测按键的多次按下和释放,并在一定时间内稳定后才认为是一个有效的按键事件。

然后,驱动程序会根据扫描码来判断它是普通字符数据(如字母、数字、标点符号等)还是属于命令(如Ctrl+CCtrl+D、Shift、方向键等)。

如果驱动程序判断当前读取的是普通字符数据,它会做这样的一件事:
键盘驱动程序会根据当前键盘的布局和状态(如大写锁定、数字锁定等)来确定具体的字符,并将其转换为对应的ASCII码或Unicode码,然后把它写入键盘的内核级文件缓冲区中。问题来了,键盘是硬件,怎么跟文件扯上关系了?这就不得不谈到Linux系统“一切皆文件”的设计理念了。

虽然键盘是硬件,但是在系统眼里,它被当成一个文件来处理,读取键盘数据在操作系统的运作逻辑里被当成是读取键盘文件的内容,既然键盘是文件,操作系统就会在内核中为其创建相应的 struct file 结构体对象,同时还有一段用于存储文件数据的内核级文件缓冲区,这个缓冲区是内核空间的一部分,用于在用户和内核之间传递数据。

当用户空间程序(如shell、文本编辑器等)需要读取键盘输入时,它们会打开相应的设备文件,并通过调用操作系统提供的系统调用从内核级文件缓冲区中读取数据。这些数据可能是字符、按键事件或其他类型的信息,具体取决于用户空间程序的需求。

如果驱动程序判断当前读取的命令,它会做这样的一件事:
驱动程序可能会产生特定的系统事件或调用特定的系统服务,而不是直接生成字符。

举个例子,我们都知道Ctrl+C组合键通常用于发送中断信号(SIGINT),用于终止当前正在运行的进程。假设按下的是Ctrl+C组合键,键盘驱动程序不会直接进行任何操作,它会通知操作系统内核,“通知”只是说法,其实也是一种中断机制,不过这是软件层面的中断,所以,操作系统内核接收到这个通知后,会调用相应的中断处理程序来处理这个中断事件。在中断服务例程中,内核会将Ctrl+C事件转换为相应的信号,通常是中断信号(如SIGINT)。内核接着会将这个信号发送给前台进程组中的所有进程,在大多数情况下,前台进程组只包含一个进程,即你当前在shell中直接运行的进程。

进程收到了信号之后,就会如果处理信号的动作没有被修改过的话,就会执行默认动作,SIGINT 信号的默认动作就是终止。

至此,键盘组合键产生信号的从硬件层面到软件层面的完整过程解析完毕。

参考文章

  1. 在键盘上敲了一个字母之后,电脑内部发生了什么?
  2. 《键盘敲入 A 字母时,操作系统期间发生了什么…》
  3. 《Intel 8042键盘控制器详细介绍》
  4. 《键盘是如何工作的?》
  5. 《从按键到响应,键盘的底层原理是什么?》
  6. 《主板上的南桥和北桥是什么意思?》
  7. 《什么是中断向量表》
  8. 《一文讲透计算机的“中断”》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1651234.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

alpine安装中文字体

背景 最近在alpine容器中需要用到中文字体处理视频,不想从本地拷贝字体文件, 所以找到了一个中文的字体包font-droid-nonlatin,在此记录下。 安装 apk add font-droid-nonlatin安装好后会出现在目录下/usr/share/fonts/droid-nonlatin/ 这…

【6D位姿估计】GDR-Net 单目几何引导的直接回归模型

前沿 本文介绍6D位姿估计的直接回归方法GDR-Net,它从单个RGB图像中确定物体在三维空间中的位置和方向。 它是一个端到端模型,与传统的间接方法不同,GDR-Net可以通过反向传播完全训练,简化了训练过程。 论文地址:GDR…

HCIP的学习(13)

第五章,重发布和路由策略 重发布 ​ 在路由协议的边界设备上,将某一种路由协议的路由信息引入到另一种路由协议中,这个操作被称为路由引入或者路由重分发。----技术本质为重发布。 条件 必须存在ASBR设备(路由边界设备&#x…

暗区突围进不去/游戏无法启动/掉帧卡顿/报错的解决方法

暗区突围是一款高拟真硬核射击手游,打造了全新的沉浸式暗区战局体验,发行商是腾讯公司。这个游戏名词虽然看起来有些陌生,但其本身的玩法内核毫无疑问的是,这款游戏在画面质量和枪械操作方面,都是手游市场上同类游戏中…

《构建高效的财务管理系统:设计与实现》

在当今数字化时代,企业财务管理系统的设计与实现至关重要。一个高效的财务管理系统不仅能够提高企业的运营效率,还能够增强企业的竞争力,为企业的发展提供有力支持。本文将探讨财务管理系统的设计与实现,为企业打造一套符合自身需…

Raft共识算法图二解释

下面是有关Raft协议中不同术语和概念的翻译及解释: 术语和概念: 任期号(term number):用来区分不同的leader。前一个日志槽位的信息(prelogIndex):这是前一个日志条目的索引&#…

【容器】k8s获取的节点oom事件并输出到node事件

在debug k8s node不可用过程中,有可能会看到: System OOM encountered, victim process: xx为了搞清楚oom事件是什么,以及如何产生的,我们做了一定探索,并输出了下面的信息。(本文关注oom事件是如何生成&传输的&a…

LeetCode-1463. 摘樱桃 II【数组 动态规划 矩阵】

LeetCode-1463. 摘樱桃 II【数组 动态规划 矩阵】 题目描述:解题思路一:动态规划一般有自顶向下和自底向上两种编写方式,其中自顶向下也被称为「记忆化搜索」。解题思路二:0解题思路三:0 题目描述: 给你一…

HBase 读写流程

HBase 读写流程 1. 读流程 Client先访问zookeeper,从zookeeper获取meta region的位置从meta region中读取meta表中的数据,meta中存储了用户表的region信息;根据namespace、表名和rowkey在meta表中找到对应的region信息;找到这个r…

深入剖析Spring框架:推断构造方法与@Bean注解的内部机制

你好,我是柳岸花开。 Spring框架作为Java开发中广泛使用的基础架构,其设计精巧、功能强大,尤其是其依赖注入(DI)和控制反转(IoC)特性,极大地提高了代码的可维护性和可测试性。本文将…

9. Django Admin后台系统

9. Admin后台系统 Admin后台系统也称为网站后台管理系统, 主要对网站的信息进行管理, 如文字, 图片, 影音和其他日常使用的文件的发布, 更新, 删除等操作, 也包括功能信息的统计和管理, 如用户信息, 订单信息和访客信息等. 简单来说, 它是对网站数据库和文件进行快速操作和管…

SpringBoot项目部署到阿里云服务器

部署步骤 步骤分以下: 将SpringBoot项目打包Linux上准备好Java环境、可用的MySql数据库项目上传到服务器启动项目停止项目 1.SpringBoot项目打包 数据库的链接,账户和密码需要和Linux上一致。 如上图打包即可。 2.Linux上准备好Java环境以及Mysql环境…

【数据结构】二叉树知识点详解

树的概念 树是一种非线性的数据结构,它是由n(n>0)个有限结点组成一个具有层次关系的集合有一个特殊的结点,称为根结点,根节点没有前驱结点除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、…

【busybox记录】【shell指令】expand

目录 内容来源: 【GUN】【expand】指令介绍 【busybox】【expand】指令介绍 【linux】【expand】指令介绍 使用示例: 把制表符转化为空格 - 默认输出 把制表符转化为空格 - 修改制表符转空格的个数 把制表符转化为空格 - 修改制表符转空格的个数…

git bash各分支修改内容不同但合并后不显示冲突问题

在跟着廖雪峰老师的git学习时,按部就班的执行明后,发现 而不是出现原文的结果 解决方法: 切换位feature分支,再合并 git switch feature1 git merge master 此时我们发现: 后面再跟着原文敲就可以了

CSS学习笔记之基础教程(二)

上节内容CSS学习笔记之基础教程&#xff08;一&#xff09; 6、边距 6.1 外边距&#xff1a;margin 6.1.1 外边距 marginmargin-topmargin-leftmargin-bottommargin-right <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8…

python-scrapy框架示例

参考&#xff1a;https://blog.csdn.net/qq_44907926/article/details/119531324 创建项目步骤&#xff1a; 1.目标网站:www.itcast.cn 2.安装虚拟环境 pip install virtualenv3.创建虚拟环境 virtualenv --always-copy --system-site-packages venv4.激活虚拟环境 venv\sc…

OCR文本识别模型CRNN

CRNN网络结构 论文地址&#xff1a;https://arxiv.org/pdf/1507.05717 参考&#xff1a;https://blog.csdn.net/xiaosongshine/article/details/112198145 git:https://github.com/shuyeah2356/crnn.pytorch CRNN文本识别实现端到端的不定长文本识别。 CRNN网络把包含三部分&…

推荐5个免费的国内平替版GPT

提起AI&#xff0c;大家第一个想到的就是GPT。 虽然它确实很厉害&#xff0c;但奈何于我们水土不服&#xff0c;使用门槛有些高。 不过随着GPT的爆火&#xff0c;现在AI智能工具已经遍布到各行各业了&#xff0c;随着时间的推移&#xff0c;国内的AI工具也已经“百花盛放”了…

简单了解泛型

基本数据类型和对应的包装类 在Java中, 基本数据类型不是继承自Object, 为了在泛型代码中可以支持基本类型, Java给每个基本类型都对应了一个包装类型. 简单来说就是让基本数据类型也能面向对象.基本数据类型可以使用很多方法, 这就必须让它变成类. 基本数据类型对定的包装类…