一篇分析Linux虚拟化KVM-Qemu分析之timer虚拟化

news2025/2/25 11:58:11

说明:

  1. KVM版本:5.9.1
  2. QEMU版本:5.0.0
  3. 工具:Source Insight 3.5, Visio

1. 概述

先从操作系统的角度来看一下timer的作用吧:

通过timer的中断,OS实现的功能包括但不局限于上图:

  • 定时器的维护,包括用户态和内核态,当指定时间段过去后触发事件操作,比如IO操作注册的超时定时器等;
  • 更新系统的运行时间、wall time等,此外还保存当前的时间和日期,以便能通过time()等接口返回给用户程序,内核中也可以利用其作为文件和网络包的时间戳;
  • 调度器在调度任务分配给CPU时,也会去对task的运行时间进行统计计算,比如CFS调度,Round-Robin调度等;
  • 资源使用统计,比如系统负载的记录等,此外用户使用top命令也能进行查看;

timer就像是系统的脉搏,重要性不言而喻。ARMv8架构处理器提供了一个Generic Timer,与GIC类似,Generic Timer在硬件上也支持了虚拟化,减少了软件模拟带来的overhead。

本文将围绕着ARMv8的timer虚拟化来展开。

 

  资料直通车:Linux内核源码技术学习路线+视频教程内核源码

学习直通车:Linux内核源码内存调优文件系统进程管理设备驱动/网络协议栈

2. ARMv8 Timer虚拟化

2.1 Generic Timer

看一下ARMv8架构下的CPU内部图:

  • Generic Timer提供了一个系统计数器,用于测量真实时间的消逝;
  • Generic Timer支持虚拟计数器,用于测量虚拟的时间消逝,一个虚拟计数器对应一个虚拟机;
  • Timer可以在特定的时间消逝后触发事件,可以设置成count-up计数或者count-down计数;

来看一下Generic Timer的简图:

或者这个:

  • System Counter位于Always-on电源域,以固定频率进行系统计数的增加,System Counter的值会广播给系统中的所有核,所有核也能有一个共同的基准了,System Counter的频率范围为1-50MHZ,系统计数值的位宽在56-64bit之间;
  • 每个核有一组timer,这些timer都是一些比较器,与System Counter广播过来的系统计数值进行比较,软件可以配置固定时间消逝后触发中断或者触发事件;
  • 每个核提供的timer包括:1)EL1 Physical timer;2)EL1 Virtual timer;此外还有在EL2和EL3下提供的timer,具体取决于ARMv8的版本;
  • 有两种方式可以配置和使用一个timer:1)CVAL(comparatoer)寄存器,通过设置比较器的值,当System Count >= CVAL时满足触发条件;2)TVAL寄存器,设置TVAL寄存器值后,比较器的值CVAL = TVAL + System Counter,当System Count >= CVAL时满足触发条件,TVAL是一个有符号数,当递减到0时还会继续递减,因此可以记录timer是在多久之前触发的;
  • timer的中断是私有中断PPI,其中EL1 Physical Timer的中断号为30,EL1 Virtual Timer的中断号为27;
  • timer可以配置成触发事件产生,当CPU通过WFE进入低功耗状态时,除了使用SEV指令唤醒外,还可以通过Generic Timer产生的事件流来唤醒;

2.2 虚拟化支持

Generic Timer的虚拟化如下图:

  • 虚拟的timer,同样也有一个count值,计算关系:Virtual Count = Physical Count - ,其中offset的值放置在CNTVOFF寄存器中,CNTPCT/CNTVCT分别用于记录当前物理/虚拟的count值;
  • 如果EL2没有实现,则将offset设置为0,,物理的计数器和虚拟的计数器值相等;
  • Physical Timer直接与System counter进行比较,Virtual Timer在Physical Timer的基础上再减去一个偏移;
  • Hypervisor负责为当前调度运行的vCPU指定对应的偏移,这种方式使得虚拟时间只会覆盖vCPU实际运行的那部分时间;

示例如下:

  • 6ms的时间段里,每个vCPU运行3ms,Hypervisor可以使用偏移寄存器来将vCPU的时间调整为其实际的运行时间;

3. 流程分析

3.1 初始化

先简单看一下数据结构吧:

  • 在ARMv8虚拟化中,使用struct arch_timer_cpu来描述Generic Timer,从结构体中也能很清晰的看到层次结构,创建vcpu时,需要去初始化vcpu架构相关的字段,其中就包含了timer;
  • struct arch_timer_cpu包含了两个timer,分别对应物理timer和虚拟timer,此外还有一个高精度定时器,用于Guest处在非运行时的计时工作;
  • struct arch_timer_context用于描述一个timer需要的内容,包括了几个字段用于存储寄存器的值,另外还描述了中断相关的信息;

初始化分为两部分:

  1. 架构相关的初始化,针对所有的CPU,在kvm初始化时设置:

  • kvm_timer_hyp_init函数完成相应的初始化工作;
  • arch_timer_get_kvm_info从Host Timer驱动中去获取信息,主要包括了虚拟中断号和物理中断号,以及timecounter信息等;
  • vtimer中断设置包括:判断中断的触发方式(只支持电平触发),注册中断处理函数kvm_arch_timer_handler,设置中断到vcpu的affinity等;
  • ptimer中断设置与vtimer中断设置一样,同时它的中断处理函数也是kvm_arch_timer_handler,该处理函数也比较简单,最终会调用kvm_vgic_inject_irq函数来完成虚拟中断注入给vcpu;
  • cpuhp_setup_state用来设置CPU热插拔时timer的响应处理,而在kvm_timer_starting_cpu/kvm_timer_dying_cpu两个函数中实现的操作就是中断的打开和关闭,仅此而已;
  1. vcpu相关的初始化,在创建vcpu时进行初始化设置:

  • 针对vcpu的timer相关初始化比较简单,回到上边那张数据结构图看一眼就明白了,所有的初始化工作都围绕着struct arch_timer_cpu结构体;
  • vcpu_timer:用于获取vcpu包含的struct arch_timer_cpu结构;
  • vcpu_vtimer/vcpu_ptimer:用于获取struct arch_timer_cpu结构体中的struct arch_timer_context,分别对应vtimer和ptimer;
  • update_vtimer_cntvoff:用于更新vtimer中的cntvoff值,读取物理timer的count值,更新VM中所有vcpu的cntvoff值;
  • hrtimer_init:用于初始化高精度定时器,包含有三个,struct arch_timer_cpu结构中有一个bg_timer,vtimer和ptimer所对应的struct arch_timer_context中分别对应一个;
  • kvm_bg_timer_expire:bg_timer的到期执行函数,当需要调用kvm_vcpu_block让vcpu睡眠时,需要先启动bg_timer,bg_timer到期时再将vcpu唤醒;
  • kvm_hrtimer_expire:vtimer和ptimer的到期执行函数,最终通过调用kvm_timer_update_irq来向vcpu注入中断;

3.2 用户层访问

可以从用户态对vtimer进行读写操作,比如Qemu中,流程如下:

  • 用户态创建完vcpu后,可以通过vcpu的文件描述符来进行寄存器的读写操作;
  • 以ARM为例,ioctl通过KVM_SET_ONE_REG/KVM_GET_ONE_REG将最终触发寄存器的读写;
  • 如果操作的是timer的相关寄存器,则通过kvm_arm_timer_set_reg和kvm_arm_timer_get_reg来完成;
  • 读写的寄存器包括虚拟timer的CTL/CVAL,以及物理timer的CTL/CVAL等;

3.3 Guest访问

Guest对Timer的访问,涉及到系统寄存器的读写,将触发异常并Trap到Hyp进行处理,流程如下:

  • Guest OS访问系统寄存器时,Trap到Hypervisor进行处理;
  • Hypervisor对异常退出进行处理,如果发现是访问系统寄存器造成的异常,则调用kvm_handle_sys_reg来处理;
  • kvm_handle_sys_reg:调用emulate_sys_reg来对系统寄存器进行模拟,在该函数中首先会查找访问的是哪一个寄存器,然后再去调用相应的回调函数;
  • kvm中维护了struct sys_reg_desc sys_reg_descs[]系统寄存器的描述表,其中struct sys_reg_desc结构体中包含了对该寄存器操作的函数指针,用于指向最终的操作函数,比如针对Timer的kvm_arm_timer_write_sysreg/kvm_arm_timer_read_sysreg读写操作函数;
  • Timer的读写操作函数,主要在kvm_arm_timer_read/kvm_arm_timer_write中完成,实现的功能就是根据物理的count值和offset来计算等;

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/146730.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RootPort的completion timeout为什么不能防止MCE

PCIe split transaction协议在解释completion timeout机制前,我们首先说一下PCIe split transaction协议是什么,以及为什么PCIe要选择split transaction?Split transaction协议是从PCI-X总线的引入的一个重要特性,该传输协议替代了…

微服务 分布式配置中心Apollo详解

微服务 分布式配置中心Apollo详解1. 配置中心概述1.1 配置中心简介1.2 配置中心特点1.3 配置中心对比2. Apollo概述2.1 Apollo简介2.2 Apollo特点3. Apollo设计实现3.1 基础模型3.2 架构设计3.3 Why Eureka3.4 模块说明4. Apollo安装部署4.1 部署说明4.2 环境准备3.3 下载安装包…

JavaScript奇技淫巧:隐形字符

JavaScript奇技淫巧:隐形字符 本文,分享一种奇特的JS编程技巧,功能是:可以使字符串“隐形”、不可见! 效果展示 如下图所示,一个字符串经物别的操作之后,其长度有621字节,但内容却…

[ 数据结构 ] 查找算法--------递归实现

0 前言 查找算法有4种: 线性查找 二分查找/折半查找 插值查找 斐波那契查找 1 线性查找 思路:线性遍历数组元素,与目标值比较,相同则返回下标 /**** param arr 给定数组* param value 目标元素值* return 返回目标元素的下标,没找到返回-1*/public static int search(…

ora-39083/01917报错

报错信息: Import: Release 11.2.0.4.0 - Production on Wed Dec 7 17:59:59 2022 Copyright (c) 1982, 2011, Oracle and/or its affiliates. All rights reserved. Connected to: Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production …

1、Javaweb_HTMLtable布局

web概念概述 * JavaWeb: * 使用Java语言开发基于互联网的项目 * 软件架构: 1. C/S: Client/Server 客户端/服务器端 * 在用户本地有一个客户端程序,在远程有一个服务器端程序 * 如:QQ,迅雷.…

Linux环境下安装 java / javac

目录 1、检查虚拟机或者服务器的位数 2、下载 jdk 3、解压jdk 4、添加全局环境变量 1、检查虚拟机或者服务器的位数 安装 java / javac 其实就是下载合适版本的 jdk,我们需要先确认虚拟机或者服务器的主机信息,来下载合适版本的 jdk。 输入 uname …

maven环境变量配置(超详细!)

下载地址: 官网地址 建议不要下载在C盘!! 配置过程 1.解压下载好的压缩包 2.此电脑–右键–属性–高级系统设置–环境变量 3.新建一个系统变量(点击系统变量的新建) 变量名:MAVEN_HOME 变量值&#x…

Python深度学习基础(八)——线性回归

线性回归引言损失函数解析解公式代码实例梯度下降理论随机梯度下降的手动实现代码torch中的随机梯度下降引言 我们生活中可能会遇到形如 yw1x1w2x2w3x3byw_1x_1w_2x_2w_3x_3byw1​x1​w2​x2​w3​x3​b 的问题,其中有y为输出,x为输入,w为权…

Java设计模式中工厂模式是啥?静态工厂、简单工厂与抽象工厂,工厂方法模式又是啥,怎么用,

继续整理记录这段时间来的收获,详细代码可在我的Gitee仓库SpringBoot克隆下载学习使用! 4.3 工厂模式 4.3.1 背景 若创建对象时直接new对象,则会使对象耦合严重,更换对象则很复杂 4.3.2 简单工厂 4.3.3 特点 不是一种设计模…

c语言 文件处理2 程序环境和预处理

对比函数 sprintf(把一个格式化数据转化为字符串) sscanf (从一个字符串中读一个格式化数据) struct S {char arr[10];int age;float f; };int main() {struct S s { "hello", 20, 5.5f };//把这个转化为一个字符串s…

idea调试unity里面的lua代码

前言 本人一名java后端开发,看到前端同事调试lua代码无脑print,甚为鄙视,百度加实操写一份调试unity的lua脚本文档 操作 1.安装lua lua官网下载页面 最终下载页面 2.idea安装插件 emmylua 3.idea打开unity的lua脚本 idea->file->op…

【面试题】面试如何正确的介绍项目经验

大厂面试题分享 面试题库前端面试题库 (面试必备) 推荐:★★★★★地址:前端面试题库1、在面试前准备项目描述,别害怕,因为面试官什么都不知道面试官是人,不是神,拿到你的简历的时候…

ospf双向重发布,LSA优化综合

目录实验分析ip地址划分写公网缺省路由区域0公网MGRE搭建各个区域ospf的宣告改变ospf接口工作方式和更改接口优先级ospf多进程及双向重发布减少LSA的更新量1,减少特殊区域的LSA更新量2,骨干区域的优化域间汇总域外汇总防环nat的设置实验分析 如图实际的…

VS Code 为 Clang for MSVC 配置 cmake cmake tools

介绍 在windows平台上,由于平台API差异过大,一般为linux设计的项目(POSIX兼容)无法通过MSVC的编译,而是会报非常多的头文件错误。如果要修改,工程量将巨大。Windows平台上,主要有两个类POSIX兼容…

【JavaScript】事件--总结

千锋 1.Event 对象 代表事件的状态&#xff0c;比如事件在其中发生的元素、键盘按键的状态、鼠标的位置、鼠标按钮的状态。 div{width: 200px;height: 200px;background-color: yellow;} </style> <body><input type"text" id"username"&…

JavaScript 事件

文章目录JavaScript 事件HTML 事件常见的HTML事件JavaScript 可以做什么?JavaScript 事件 HTML 事件是发生在 HTML 元素上的事情。 当在 HTML 页面中使用 JavaScript 时&#xff0c; JavaScript 可以触发这些事件。 HTML 事件 HTML 事件可以是浏览器行为&#xff0c;也可以是…

babel做兼容处理 到底怎么使用?

1.背景 日常项目开发中总是避免不了对低版本浏览器做一些兼容处理&#xff0c;最常见的手段就是结合编译工具使用babel来处理一些语法的兼容&#xff0c;但是每次使用的时候其实Babel的配置和使用到的相关库总是云里雾里&#xff0c;网上的各种推荐方案眼花缭乱不知道到底应该…

自定义DotNetCore 项目模板

在进行代码开发时候&#xff0c;各自的团队或者公司都会有服务自己要求的项目代码模板&#xff0c;再创建新的项目时&#xff0c;都需要按照模板规范进行定义&#xff0c;NET支持自定义项目模板&#xff0c;这样在进行项目创建时就会高效很多。 官方参考文档&#xff1a;dotne…

软测复习01:软件测试概述

文章目录软件测试的目的软件测试的定义软件测试与软件开发软件测试发展软件测试的目的 基于不同的立场&#xff0c;存在着两种完全不同的测试目的 从用户的角度出发&#xff0c;希望通过软件测试暴露软件中隐藏的错误和缺陷&#xff0c;以考虑是否可接受该产品。从软件开发者的…