您的位置:首页 > 理论基础

计算机与数学 —— 雷神之锤3源码中的快速逆平方根算法

2016-06-01 18:39 507 查看
这篇博客介绍了在雷神之锤3源代码中快速求逆平方根的算法。

源码

雷神之锤3中的逆平方根算法如下:

float Q_rsqrt( float number )
{
long i;
float x2, y;
const float threehalfs = 1.5F ;
x2 = number * 0.5F ;
y = number ;
i = * ( long * ) &y; // evil floating point bit level hacking
i = 0x5f3759df - ( i >> 1 ); // what the fuck?
y = * ( float * ) &i;
y = y * ( threehalfs - ( x2 * y * y ) ); // 1st iteration
//  y = y * ( threehalfs - ( x2 * y * y ) ); // 2nd iteration, this can be removed
return y ;
}


函数接受一个浮点数作为输入,输出的结果是平方根的倒数。

单精度浮点数

在计算机中,单精度浮点数使用32位来储存表示:



在这32位中,最高位为符号位,后面的8位为整数ex,代表浮点数的指数,而最后的23位表示的是小数部分mx,小数部分第一位表示2−12^{-1},第二位表示2−22^{-2}……

所以如果x是一个正浮点数,则有:

x=2ex(1+mx) x = 2^{e_{x}} (1+m_{x})

另外,如果需要把一个浮点数转化为整数形式,则需要做如下的运算:

Ix=EXL+Mx=L(ex+B+mx)Ix = E_XL + M_x=L(e_x+B+m_x)

在上面的公式中,L指的是指数部分需要的唯一次数,这里是2232^{23},B是127,而M是小数部分对应的整数版本。

牛顿法

牛顿迭代法(简称牛顿法),是用于计算机求解任意连续函数的根值的一种方法。

假设对于如下的函数,我们想要求这个函数的根:



该如何求得这个根呢?首先,我们先猜一个解x0x_{0},并且认为它是函数的解。

但是由于它其实并不是函数的解,那么现在,我们需要将这个解进行迭代,从而让其逼近真正的解。

在此处,我们可以在(x0,y0)(x_{0}, y_{0})处作其切线,求得该直线的方程:

y−f(x0)=f′(x0)(x−x0)y - f(x_0) = f'(x_0)(x - x_0)

并且求直线的根,此时会发现已经对于真正的解逼近了一步。

推广到n,继续迭代,就可以足够逼近真正的解了:

xi+1=xi−f(xi)f′(xi) x_{i+1} = x_{i} - \dfrac{f(x_i)}{f'(x_i)}

此时发现f(xi)f(x_i)与f′(xi)f'(x_i)可以被一个统一的函数g(xi)g(x_i)来表示:

g(x)=f(x)f′(x)g(x) = \dfrac{f(x)}{f'(x)}

令ε为当前的解与真正解r的距离:

ϵi=xi−r\epsilon_i = x_i - r

综合上面三个方程,可得:

ϵi+1=ϵi−g(xi)\epsilon_{i+1} = \epsilon_i - g(x_i)

因此只要ε值小于某个特定的值,我们可以认为此时的x和方程的解已经很接近了。

算法分析

如果需要求得一个浮点数的平方根倒数,方程如下:

y=1x√y = \dfrac{1}{\sqrt{x}}

转化为关于y的方程,有:

f(y)=1y2−x=0f(y) = \dfrac{1}{y^2} - x = 0

转化为牛顿发使用的方程,有:

yn+1=yn(3−xy2n)2y_{n+1} = \dfrac{y_n(3 - xy_n^2)}{2}

此时,对原本的方程等号两边同时取2的对数,就有:

log2y=−12log2(1+mx)\log_{2}{y} = -\dfrac{1}{2}\log_{2}{(1+m_x)}

因为mx≥0m_x\ge0并且mx<1m_x<1,那么在这个区间内,可以取近似为:

log2(1+mx)≈mx+σ\log_2(1+m_x)\approx m_x + \sigma

根据方差的计算,当σ=0.0430357\sigma=0.0430357时,整体的偏差是最小的,此时上面的等号两边应该相当。

因此,把上面的完全整合起来,最终的IxI_x可以写成:

Llog2x+L(B−σ)L\log_2{x}+L(B-\sigma)

则Iy≈32L(B−σ)−12IxI_y\approx \dfrac{3}{2}L(B-\sigma)-\dfrac{1}{2}I_x

最终,写成代码就是:

i = 0x5f3759df - ( i >> 1 );


32L(B−σ)=0x5f3759df\dfrac{3}{2}L(B-\sigma) = 0x5f3759df

<全文完>
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: