快速求平方根

快速求平方根

news2026/2/7 12:55:23

1. 前置知识

建议首先阅读我的另外一篇文章《雷神之锤 III 竞技场》快速求平方根倒数的计算探究》。
建议大家自己看过《雷神之锤 III 竞技场》快速求平方根倒数的计算探究》学会快速求平方根倒数算法后，不看我这篇文章，自己推导一篇快速求平方根的算法，这也是对自己是否彻底掌握的一个测试。
本篇文章是《雷神之锤 III 竞技场》快速求平方根倒数的计算探究》基础上的继续推导，写出快速计算平方根的函数，要计算的公式如下：
$\sqrt{x} \\ y = x^{\frac{1}{2}}$

2. 计算过程

2.1第一步：对等式两边同时取以2为底的对数

$\log_2(y) = \log_2(x^{\frac{1}{2}}) \\ \log_2(y) = \frac12\log_2(x)$

2.2 第二步：浮点数取log的整数表达形式

《IEEE754 -浮点数的表示》提到浮点数的计算公式为： $(-1)^S*(1+\frac F{2^{23}})*2^{(E-127)}$

不考虑符号位。对其取对数
$\log_2\left(\left(1+\frac{\mathrm{F}}{2^{23}}\right)*2^{\mathrm{E}-127}\right)$
$\approx \frac{1}{2^{23}} (F +2^{23}*E)+u -127$

2.3第三步：将第二步带入第一步

化简一下公式
$log_2(y) = \frac12\log_2(x) \\ \frac{1}{2^{23}}(\mathrm{F}_{y}+2^{23}*\mathrm{E}_{y})+\mu-127=\frac{1}{2}\left(\frac{1}{2^{23}}(\mathrm{F}_{x}+2^{23}*\mathrm{E}_{x})+\mu-127\right) \\ ------\\ (\mathrm{F}_y+2^{23}*\mathrm{E}_y)=\frac12*2^{23}(127-\mu)+\frac12(\mathrm{F}_x+2^{23}*\mathrm{E}_x)$
结果已经呼之欲出了，如下图所示,红框代表的是 $y$ 的二进制值，蓝框代表的是 $x$ 的二进制值。

$y_{二进制} = \frac12*2^{23}(127-\mu)+\frac12(x_{二进制})$

令 $μ = 0.0450465679168701171875$ (这个数字是《雷神之锤 III 竞技场》快速求平方根倒数的计算探究》中所给出的魔数反推出来的）,计算出 新的魔数 。
$y_{二进制} = 0x1fbd1df5+\frac12(x_{二进制})$

3. 最后在使用牛顿迭代法再次逼近一次结果，提高精度

3.1 将 $\sqrt{x}$ 变换为 $f (x) = 0$ 的形式

消除根号 $\sqrt{x} \\y^2 = x$
整理一下,得到 $f (x) = 0$ 的形式： $y^2 - x = 0$
带入牛顿迭代法的通用公式 $y^2 - x\\f'(y) = 2y\\ -----------\\ y_{n+1}=y_n-\frac{f(y_n)}{f'(y_n)}\\ -----------\\ y_{n+1}=y_n-\frac{{y_n^2}-x}{2y_n} \\ -----------------------\\ y_{n+1}=\frac12\left(y_n+\frac x{y_n}\right)$

4. 代码实现

float Q_sqrt(float number) {
    int i;
    float x, y;
    const float half = 0.5f;
    x = number;
    
    // 1. 位级黑魔法：生成初始近似值
    i = *(long*)&x;           // 将浮点位模式转为整数
    i = 0x1fbd1df5 + (i >> 1); // 魔法常数调整
    y = *(float*)&i;         // 转回浮点数
    
    // 2. 牛顿迭代法优化精度
    y = half * (y + x / y);  // 第一次迭代
    // y = half * (y + x / y);  // 可选：第二次迭代
    
    return y;
}

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2328104.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

C语言基础要素(019)：输出ASCII码表

C语言基础要素(019)：输出ASCII码表

计算机以二进制处理信息，但二进制对人类并不友好。比如说我们规定用二进制值 01000001 表示字母’A’，显然通过键盘输入或屏幕阅读此数据而理解它为字母A，是比较困难的。为了有效的使用信息，先驱者们创建了一种称为ASCII码的交换代…

阅读更多...

CI/CD(九) Jenkins共享库与多分支流水线准备

CI/CD(九) Jenkins共享库与多分支流水线准备

后端构建零：安装插件 Pipeline: Stage View（阶段视图）、SSH Pipeline Steps（共享库代码中要调用sshCommond命令） 一、上传共享库二、Jenkins配置共享库 3、新增静态资源与修改配置如果是docker和k8s启动&#xf…

阅读更多...

pip安装timm依赖失败

pip安装timm依赖失败

在pycharm终端给虚拟环境安装timm库失败（ pip install timm），提示你要访问 https://rustup.rs/ 来下载并安装 Rust 和 Cargo 直接不用管，换一条命令 pip install timm0.6.13 成功安装简单粗暴

阅读更多...

详解隔离级别（4种），分别用表格展示问题出现的过程及解决办法

详解隔离级别（4种），分别用表格展示问题出现的过程及解决办法

选择隔离级别的时候，既需要考虑数据的一致性，避免脏数据，又要考虑系统性能的问题。下面我们通过商品抢购的场景来讲述这4种隔离级别的区别未提交读（read uncommitted） 未提交读是最低的隔离级别，其含义是…

阅读更多...

NO.63十六届蓝桥杯备战|基础算法-⼆分答案|木材加工|砍树|跳石头(C++)

NO.63十六届蓝桥杯备战|基础算法-⼆分答案|木材加工|砍树|跳石头(C++)

⼆分答案可以处理⼤部分「最⼤值最⼩」以及「最⼩值最⼤」的问题。如果「解空间」在从⼩到⼤的「变化」过程中，「判断」答案的结果出现「⼆段性」，此时我们就可以「⼆分」这个「解空间」，通过「判断」，找出最优解。这个「⼆分答案…

阅读更多...

深层储层弹塑性水力裂缝扩展机理

深层储层弹塑性水力裂缝扩展机理

弹性与弹塑性储层条件下裂缝形态对比参考： The propagation mechanism of elastoplastic hydraulic fracture in deep reservoir | International Journal of Coal Science & Technology

阅读更多...

循环神经网络 - 机器学习任务之异步的序列到序列模式

循环神经网络 - 机器学习任务之异步的序列到序列模式

前面我们学习了机器学习任务之同步的序列到序列模式：循环神经网络 - 机器学习任务之同步的序列到序列模式-CSDN博客本文我们来学习循环神经网络应用中的第三种模式：异步的序列到序列模式！ 一、基本概述： 异步的序列到序列模式…

阅读更多...

什么是检索增强生成（RAG）

什么是检索增强生成（RAG）

1、什么是检索增强生成（RAG） 1.1 检索增强生成的概念检索增强生成（Retrieval-Augmented Generation, RAG）是一种结合了信息检索和文本生成技术的新型自然语言处理方法。这种方法增强了模型的理解和生成能力。相较于经典生成…

阅读更多...

MATLAB 控制系统设计与仿真 - 33

MATLAB 控制系统设计与仿真 - 33

状态反馈控制系统 -全维状态观测器的实现状态观测器的建立解决了受控系统不能测量的状态重构问题，使得状态反馈的工程实现成为可能。考虑到系统的状态方程表达式，如果{A,B}可控，{A,C}可观，且安装系统的性能指标，可…

阅读更多...

企业管理系统的功能架构设计与实现

企业管理系统的功能架构设计与实现

一、企业管理系统的核心功能模块企业管理系统作为现代企业的中枢神经系统，涵盖了多个核心功能模块，以确保企业运营的顺畅与高效。这些功能模块通常包括： 人力资源管理模块：负责员工信息的录入、维护、查询及统计分析&#xff0c…

阅读更多...

覆盖学术、职场、生活的专业计算工具

覆盖学术、职场、生活的专业计算工具

软件介绍今天要给大家介绍一款超给力的工具软件——CalcKit 计算器。它就像是你口袋里的智能计算专家，轻松化解日常生活中的各类计算难题。无论是简单的数字加减乘除，还是复杂的专业运算，它都不在话下。这款软件内置了极为强大的计算功能…

阅读更多...

【大模型系列篇】大模型基建工程：基于 FastAPI 自动构建 SSE MCP 服务器 —— 进阶篇

【大模型系列篇】大模型基建工程：基于 FastAPI 自动构建 SSE MCP 服务器 —— 进阶篇

🔥🔥🔥 上期《大模型基建工程：基于 FastAPI 自动构建 SSE MCP 服务器》中我们使用fastapi-mcp自动挂载fastapi到mcp工具，通过源码分析和实践，我们发现每次sse请求又转到了内部fastapi RESTful api接口&…

阅读更多...

【python】Plot a Square

【python】Plot a Square

文章目录 1、功能描述2、代码实现3、效果展示4、完整代码5、涉及到的库函数更多有趣的代码示例，可参考【Programming】 1、功能描述用 python 实现，以 A和B两个点为边长，方向朝 C 绘制正方形思路： 计算向量 AB 和 AC。使用向…

阅读更多...

实战打靶集锦-37-Wpwnvm

实战打靶集锦-37-Wpwnvm

文章目录 1. 主机发现2. 端口扫描&服务枚举3. 服务探查4. 系统提权靶机地址：https://download.vulnhub.com/wpwn/wpwnvm.zip 1. 主机发现目前只知道目标靶机在192.168.37.xx网段，通过如下的命令，看看这个网段上在线的主机。 $ nmap -…

阅读更多...

三、GPIO

三、GPIO

一、GPIO简介 GPIO（General Purpose Input Output）通用输入输出口GPIO引脚电平：0V（低电平）~3.3V（高电平），部分引脚可容忍5V 容忍5V，即部分引脚输入5V的电压，…

阅读更多...

混杂模式（Promiscuous Mode）与 Trunk 端口的区别详解

混杂模式（Promiscuous Mode）与 Trunk 端口的区别详解

一、混杂模式（Promiscuous Mode） 1. 定义与工作原理定义：混杂模式是网络接口的一种工作模式，允许接口接收通过其物理链路的所有数据包，而不仅是目标地址为本机的数据包。工作层级：OSI 数据链路层&#x…

阅读更多...

[dp5_多状态dp] 按摩师 | 打家劫舍 II | 删除并获得点数 | 粉刷房子

[dp5_多状态dp] 按摩师 | 打家劫舍 II | 删除并获得点数 | 粉刷房子

目录 1.面试题 17.16. 按摩师题解 2.打家劫舍 II 题解 3.删除并获得点数题解 4.粉刷房子题解一定要有这样的能力，碰到一个新题的时候，可以往之前做过的题方向靠！ 打家劫舍问题模型: 不能选择相邻的两个数，并且要最终…

阅读更多...

DM数据库配置归档模式的两种方式

DM数据库配置归档模式的两种方式

归档模式，联机日志文件中的内容保存到硬盘中，形成归档日志文件(REDO日志)。采用归档模式会对系统的性能产生些许影响，然而系统在归档模式下运行会更安全，当出现故障时其丢失数据的可能性更小，这是因为一旦出现介质故…

阅读更多...

Agent TARS与Manus的正面竞争

Agent TARS与Manus的正面竞争

Agent TARS 是 Manus 的直接竞争对手，两者在 AI Agent 领域形成了显著的技术与生态对抗。一、技术架构与功能定位的竞争集成化架构 vs 模块化设计 Agent TARS 基于字节跳动的 UI-TARS 视觉语言模型，将视觉感知、推理、接地（grounding&#…

阅读更多...

【Tauri2】013——前端Window Event与创建Window

【Tauri2】013——前端Window Event与创建Window

前言【Tauri2】012——on_window_event函数-CSDN博客https://blog.csdn.net/qq_63401240/article/details/146909801?spm1001.2014.3001.5501 前面介绍了on_window_event，这个在Builder中的方法，里面有许多事件，比如Moved，Res…

阅读更多...

推荐文章

最新文章