77百科网
当前位置: 首页 生活百科

浮点数归纳(张图带你深入理解浮点数)

时间:2023-05-28 作者: 小编 阅读量: 1 栏目名: 生活百科

张图带你深入理解浮点数大家好,我是站长polarisxu团队一直保持着分享的习惯,而我却分享的较少忘了当时同事分享什么主题,涉及到浮点数相关知识于是我决定分享一期关于浮点数的,而且Go之父RobPike说不懂浮点数不配当码。

大家好,我是站长 polarisxu。

团队一直保持着分享的习惯,而我却分享的较少。忘了当时同事分享什么主题,涉及到浮点数相关知识。于是我决定分享一期关于浮点数的,而且 Go 之父 Rob Pike 说不懂浮点数不配当码农。。。So?!

本着「要学习就系统透彻的学」这个原则,本文通过图的方式尽可能详细的讲解浮点数,让大家能够对浮点数有一个更深层次的认识。

本文目录:

0、几个问题

开始之前请思考如下问题:

  • 二进制 0.1,用十进制表示的话是多少?十进制的 0.1,用二进制表示又是多少?
  • 为什么 0.10.2 = 0.30000000000000004?
  • 单精度和双精度浮点数的有效小数位分别是多少?
  • 单精度浮点数能表示的范围是什么?
  • 浮点数为什么会存在 -0?infinity 和 NaN 又是怎么表示的?

如果现在不会,那这篇文章正好可以为你解惑。

1、什么是浮点数

我们知道,数学中并没有浮点数的概念,虽然小数看起来像浮点数,但从不这么叫。那为什么计算机中不叫小数而叫浮点数呢?

因为资源的限制,数学中的小数无法直接在计算机中准确表示。为了更好地表示它,计算机科学家们发明了浮点数,这是对小数的近似表示。维基百科中关于浮点数的概念说明如下:

The term floating point refers to the fact that a number's radix point (decimal point, or, more commonly in computers, binary point) can float; that is, it can be placed anywhere relative to the significant digits of the number.

也就是说浮点数是相对于定点数而言的,表示小数点位置是浮动的。比如 7.5 × 10、0.75 × 10² 等表示法,值一样,但小数点位置不一样。

具体来说,浮点数是指用符号、尾数、基数和指数这四部分来表示的小数。

2、IEEE754 又是什么

知道了浮点数的概念,但需要确定一套具体的表示、运算标准。其中最有名的就是 IEEE754 标准。William Kahan 正是因为浮点数标准化的工作获得了图灵奖。

The IEEE Standard for Floating-Point Arithmetic (IEEE 754) is a technical standard for floating-point arithmetic established in 1985 by the Institute of Electrical and Electronics Engineers (IEEE). The standard addressed many problems found in the diverse floating-point implementations that made them difficult to use reliably and portably. Many hardware floating-point units use the IEEE 754 standard.

本文的讨论都基于 IEEE754 标准,这也是目前各大编程语言和硬件使用的标准。

根据上面浮点数的组成,因为是在计算机中表示浮点数,基数自然是 2,因此 IEEE754 浮点数只关注符号、尾数和指数三部分。

3、小数的二进制和十进制转换

为了方便后面的内容顺利进行,复习下二进制和十进制的转换,其中主要涉及到小数的转换。

二进制转十进制

和整数转换一样,采用各位数值和位权相乘。比如:

(0.101)₂ = 1×2⁻¹0×2⁻²0×2⁻³ = (0.625)₁₀

记住小数点后第一位是从 -1 开始即可。

十进制转二进制

十进制整数转二进制采用“除 2 取余,逆序排列”法。例如十进制数 11 转为二进制:

11/2=5…余15/2=2…余12/2=1…余01/2=0…余1

所以 (11)₁₀ 的二进制是 (1011)₂。

但如果十进制是小数,转为二进制小数如何做?采用“乘 2 取整,顺序排列”。例如十进制小数 0.625 转为二进制小数:

0.625*2=1.25…取整数部分10.25*2=0.5…取整数部分00.5*2=1…取整数部分1

顺序排列,所以 (0.625)₁₀ = (0.101)₂。

为了方便大家快速的做转换,网上有很多这样的工具。推荐一个我觉得最棒的:https://baseconvert.com/,支持各进制的转换,还支持浮点数。

4、经典问题:0.10.2 = 0.30000000000000004

这个问题网上相关的讨论很多,甚至有专门的一个网站:https://0.30000000000000004.com/,这个网站上有各门语言的 0.10.2 的结果。比如 C 语言:

#include<stdio.h>intmain(intargc,char**argv){printf("%.17f\n",.1 .2);return0;}

Go 语言:

packagemainimport("fmt")funcmain(){vara,bfloat64=0.1,0.2fmt.Println(a b)}

结果都是 0.30000000000000004。

为什么会这样?这要回到 IEEE754 标准关于浮点数的规定。

5、浮点数的 IEEE754 表示

上文提到,浮点数由四个部分构成,那 IEEE754 标准是如何规定它们的存储方式的呢?

一般地,IEEE754 浮点数有两种类型:单精度浮点数(float)和双精度浮点数(double),还有其他的,不常用。单精度浮点数使用 4 字节表示;双精度浮点数使用 8 字节表示。在 Go 语言中用 float32 和 float64 表示这两种类型。

符号位不用说,0 表示正数,1 表示负数。着重看指数部分和尾数部分。(基数前文说了,固定是 2,因此不存)

尾数部分

前面提到过,浮点数名称的由来在于小数点是浮动的。但具体存储时,需要固定一种形式,这叫做尾数的标准化。IEEE754 规定,在二进制数中,通过移位,将小数点前面的值固定为 1。IEEE754 称这种形式的浮点数为规范化浮点数(normal number)。

比如十进制数 0.15625,转为二进制是 0.00101。为了让第 1 位为 1,执行逻辑右移 3 位,尾数部分成为 1.01,因为右移了 3 位,所以指数部分是 -3。因为规定第 1 位永远为 1,因此可以省略不存,这样尾数部分多了 1 位,只需存 0100(要记住,这是的数字是小数点后的数字,因此实际是 0.01,转为十进制是 0.25 — 没算未存的小数点前面的 1)。

因此对于规范化浮点数,尾数其实比实际的多 1 位,也就是说单精度的是 24 位,双精度是 53 位。为了作区分,IEEE754 称这种尾数为 significand。

有规范化浮点数,自然会有非规范化浮点数(denormal number),这会在后文讲解。

请牢记,尾数决定了精度,对于单精度浮点数,因为只有 23 位,而1<<23 对应十进制是 8388608,因此不能完整表示全部的 7 个十进制位,所以说,单精度浮点数有效小数位最多 7 位;双精度的有效小数位是 15 位;切记切记,有精度问题!!

指数部分

因为指数有正、有负,为了避免使用符号位,同时方便比较、排序,指数部分采用了 The Biased exponent(有偏指数)。IEEE754 规定,2ᵉ⁻¹-1 的值是 0,其中 e 表示指数部分的位数,小于这个值表示负数,大于这个值表示正数。因此,对于单精度浮点数而言, 2⁸⁻¹-1 = 127 是 0;双精度浮点数,2¹¹⁻¹-1 = 1023 是 0。

没看懂?举个栗子。

还是用十进制 0.15625 举例。上文知道,因为右移了 3 位,所以指数是 -3。根据 IEEE754 的定义,单精度浮点数情况下,-3 的实际值是 127 - 3 = 124。明白了吗?127 表示 0,124 就表示 -3 了。而十进制的 124 转为二进制就是 1111100。

如果你还不理解,想想这个问题。

如果让你用扑克牌(A ~ K,也就是 1 ~ 13)来表示支持负数的。怎么办?我们会选择一个中间的数,比如 7 当做 0,因此 10 就是3,4 就是 -3。现在理解了吧!

小结

结合尾数和指数的规定,IEEE754 单精度浮点数,十进制 0.15625 对应的二进制内存表示是:0 01111100 01000000000000000000000。

6、程序确认下 IEEE754 的如上规定

读到这里,希望你能坚持下去。为了进一步加深理解,我画一张图和一个确认程序。

一张图

这张图是单精度浮点数 0.15625 的内存存储表示。根据三部分的二进制表示,可以反推出计算该数的十进制表示。作为练习,十进制的 2.75,用上图表示的话,各个位置分别都是什么值呢?

程序确认单精度浮点数的内存表示

使用 Go 语言编写一个程序,能够得到一个单精度浮点数的二进制内存表示。比如提供单精度浮点数 0.15625,该程序能够输出:0-01111100-01000000000000000000000。

packagemainimport("fmt""math")funcmain(){varffloat32=0.15625outputFEEE754(f)}funcoutputFEEE754(ffloat32){//将该浮点数内存布局当做uint32看待(因为都占用4字节)//这里实际上是做强制转换,内部实现是:return *(*uint32)(unsafe.Pointer(&f))buf:=math.Float32bits(f)//加上两处-,结果一共34bytevarresult[34]byte//从低字节开始fori:=33;i>=0;i--{ifi==1||i==10{result[i]='-'}else{ifbuf%2==1{result[i]='1'}else{result[i]='0'}buf/=2}}fmt.Printf("%s\n",result)}//output:0-01111100-01000000000000000000000

你可以使用上述程序,验证下 2.75,看看你做对没有!提供了一个在线可运行版本:https://play.studygolang.com/p/pg0QNQtBHYx。

其实上面推荐的那个工具就能够得到十进制浮点数的二进制内存表示,地址:https://baseconvert.com/ieee-754-floating-point。

另外,在 Java 语言中也有类似的方法:Float.floatToIntBits(),你可以使用 Java 实现上面类似的功能。

6、再看 0.1 0.2 = 0.30000000000000004

有了上面的知识,我们回过头看看这个经典的问题。(讨论单精度的情况,因此实际是 0.1 0.2 = 0.300000004)

出错的原因

出现这种情况的根本原因是,有些十进制小数无法转换为二进制数。如下图:

在小数点后 4 位时,连续的二进制数,对应的十进制数却是不连续的,因此只能增加位数来尽可能近似的表示。

0.1 和 0.2 是如何表示的?

根据前面的讲解,十进制 0.1 转为二进制小数,得到的是 0.0001100… (重复1100)这样一个循环二进制小数,使用 IEEE754 表示如下图:

同样的方法,0.2 用单精度浮点数表示是:0.20000000298023223876953125。所以,0.10.2 的结果是:0.300000004470348358154296875。

7、特殊值

耐心的读者看到这里,你真的很棒!但还没完哦,继续加油!

单精度浮点数的最大值

讲解下一个知识点之前,请思考本文开始的一个问题:单精度浮点数的最大值是多少?

根据前面学到的知识,我们很容易想到它的最大值的内存应该表示是这样的。

即:01111111111111111111111111111111。然而我们把这个值填入 https://baseconvert.com/ieee-754-floating-point 中,发现结果是这样的:

什么?NaN 是个什么鬼?!我就是按照你上面讲过的思考的。。。

别急,因为凡是都有特殊。现在就讲讲浮点数中的特殊值。

特殊值 infinity(无穷)

当指数位全是 1,尾数位全是 0 时,这样的浮点数表示无穷。根据符号位,有正无穷和负无穷( infinity 和 -infinity)。为什么需要无穷?因为计算机资源的限制,没法表示所有的数,当一个数超过了浮点数的表示范围时,就可以用 infinity 来表示。而数学中也有无穷的概念。

在 Go 语言中,通过 math 包的 func Inf(sign int) float64 函数可以获取到正负无穷。

在 Java 语言中,通过 Float 或 Double 类中的常量可以获得:Float.POSITIVE_INFINITY、Float.NEGATIVE_INFINITY。

具体表示可以定义一个常量,比如:

正无穷:0x7FF0000000000000,负无穷:0xFFF0000000000000

和上面浮点数内存位模型强转 int 类似,这个执行相反操作(类似 Float64frombits 这样的函数),就得到了这个特殊的浮点值。可以看 Go 语言 math 标准库相应函数的实现。

特殊值 NaN

NaN 是 not-a-number 的缩写,即不是一个数。为什么需要它?例如,当对 -1 进行开根号时,浮点数不知道如何进行计算,就会使用 NaN,表示不是一个数。

NaN 的具体内存表示是:指数位全是 1,尾数位不全是 0。

和 infinity 类似,Go 和 Java 都定义了相应的函数或常量。

小结

现在清楚上面单精度浮点数最大值是不对的了吧,它是一个 NaN。画一张图,方便你更清晰的记住这些特殊值。

所以单精度浮点数的最大值应该能确认了,即:0 11111110 11111111111111111111111。

8、非规范化浮点数

接着用问题的方式继续:单精度浮点数的最小值是多少(正数)?

根据前面的知识,我们会得到这样的最小值:0 00000000 00000000000000000000001。根据前面规范化浮点数的规定,我们知晓该值是:2⁻¹²⁷×(1 2⁻²³)。

然而,最小值的内存表示没错,但算出来的结果是错的。(额头冒汗没?怎么又错了~)

为了避免两个小浮点数相减结果是 0(也就是规范化浮点数无法表示)这样情况出现,同时根据规范化浮点数的定义,因为尾数部分有一个省略的前导 1,因此无法表示 0。所以,IEEE754 规定了另外一种浮点数:

当指数位全是 0,尾数部分不全为 0,尾数部分没有省略的前导 1,同时指数部分的偏移值比规范形式的偏移值小 1,即单精度是 -126,双精度是 -2046。这种形式的浮点数叫非规范化浮点数(denormal number)。

因此单精度浮点数的最小值(正数)如下图:

有了非规范化浮点数,IEEE754 就可以表示 0 了,但会存在0 和 -0:即所有位全是 0 时是0;符号位是 1,其他位是 0 时是 -0。

9、IEEE754 浮点数分类小结

至此,浮点数相关的知识就介绍差不多了。为了让大家对整体再有一个更好的掌握,对浮点数的分类进行一些总结。

从上面的讲解,IEEE754 浮点数,指数是关键,根据指数,将其分为:特殊值、非规范化浮点数和规范化浮点数。

从上图规范化和非规范化浮点数的表示范围可以看出,两种类型的表示是具有连续性的。这也就是为什么非规范化浮点数指数规定为比规范形式的偏移值小 1(即单精度为 -126,双精度为 -2046)。

在数轴上,浮点数的分布:

10、总结

《深入理解计算机系统》这本书在讲解浮点数时说:许多程序员认为浮点数没意思,往坏了说,深奥难懂。经过本文的四千多字图文并茂的方式讲解,如果你认真看完了,我相信你一定掌握了浮点数。

此外,还有其他一些知识点,比如浮点数的运算、不满足结合律、四舍但五不一定入等,有兴趣的可以查阅相关资料。

现在是时候回过头来看看开始的题目了,你都会了吗?

最后,建议你结合你熟悉的语言更进一步补充相关知识。比如 Go 语言的 math 标准库;Java 的 java.lang.Float/Double 等包。

参考资料或相关链接
  • https://floating-point-gui.de/
  • https://www.geeksforgeeks.org/ieee-standard-754-floating-point-numbers/
  • https://baseconvert.com/
  • 这个交互式工具,很不错:http://evanw.github.io/float-toy/
  • https://bartaz.github.io/ieee754-visualization/
  • 柴大:https://mp.weixin.qq.com/s/0lCte3UD5qYcaBnebwnYrQ
  • 左神:https://mp.weixin.qq.com/s/QsEe34pcimNdqCb99h44cQ
  • 图书《程序是怎样跑起来的》
,
    推荐阅读
  • 老鼠洞里灌点点什么好(老鼠洞里放什么好)

    在墙洞里放樟脑丸,一次放几颗,挥发完后再放,就能达到防止老鼠在墙洞里安家的目的。往墙洞里灌汽油,也可以吹进液化气,然后迅速用铁丝网封住洞口点火烧,把老鼠活活烧死。可以在洞口设置捕鼠夹、捕鼠笼、粘鼠板、电子灭鼠器等机关,达到灭杀老鼠的目的。可以在墙洞口涂稠胶水,然后再在胶水上泼盐酸、硫酸、硝酸等强酸,一旦老鼠出入洞口,胶水会把强酸粘在老鼠四肢和腹部,让它的皮肤被腐蚀溃烂,把老鼠逼走或是慢性死亡。

  • 怎么样恢复电脑回收站清空的东西(清空回收站是不是永久删除)

    既然我们知道了电脑清空回收站并非永久抹消文件的存在,那么答案肯定是能恢复的。至于用什么方法,小编不卖关子了,各位下面一同见证一下。因为只有在重启过程中才会将你修改的数据更新过来。方法二:第三方软件恢复1.第一步当然就是要先下载安装啦!小编把删除的原理和找回的方法都交给大家啦!当然如果大家本来就有备份数据在电脑或者U盘的话就不需要用到哦!但学到等于赚到,技多不压身嘛。

  • 成人高考和统招专升本的考试难度(成人高考专升本和统招专升本差别有多大)

    02考情对比成人高考网络报名时间:8月底9月初;考试时间:10月下旬;组织形式:全国统一命题考试。统招专升本报名时间:需关注各省安排;考试时间:各省考试时间不一样;组织形式:省级统一招生标准选拔性考试。统招专升本的录取方式:统招专升本由本科招生院校规定的招生计划数,分数由高到低依次录取。统招专升本则需要在校生身份,已经毕业的考生是没有报考资格的。

  • 机油不足有什么表现(机油严重不足)

    与此同时没法立即对发动机开展制冷排热,会发生烧损、发动机拉缸等状况,长此以往,加快了发动机零件的脆化,减少了发动机的使用期限。因而,不要在机油不够或是沒有机油的情况下行车,这总是加剧发动机的压力,更为比较严重危害发动机,假如严重得话,检修起來必须很高的维修费。发动机是汽车的“心血管”,机油是汽车的“血夜”,是必不可少的。

  • 无花果怎么吃最好 吃无花果有什么好处

    无花果它的成长期应该是比较长的,结的果实也是属于偏少的那种类型,果实在夏秋季节渐次成熟,宜分批采收。充分成熟的果实,顶端小孔微开,外皮上网纹明显,风味最佳。放入电炖锅中,正常程序五个小时即可,喝的时候调入蜂蜜。可以选用晒干的无花果来进行熬制。粳米洗净加水适量煮粥,待粥煮至浓稠时,放入无花果和冰糖适量,煮30分钟,趁热食之。

  • 灵芝水的正确煮法(灵芝水的正确煮法介绍)

    最好是选择紫灵芝,然后把紫灵芝切片,用清水洗净,下面我们就来聊聊关于灵芝水的正确煮法?接下来我们就一起去了解一下吧!把洗净的紫灵芝,放入到装有清水的盆子内,浸泡一会时间。大火煮开以后,换文火继续煮20分钟时间,把灵芝水到出后,即可饮用。饮用的同时,如果不喜欢这种口味的话,可以加入适量的蜂蜜或是冰糖调味。

  • 房间有异味怎么办 潮湿天气房间有异味怎么办

    不同的异位该如何去除1、霉味屋内潮湿,衣箱、壁橱、抽屉常常会散发霉味。

  • 宝宝鞋底滑有什么妙招(宝宝鞋底滑有什么小妙招)

    以下内容希望对你有帮助!宝宝鞋底滑有什么妙招可以用玻璃胶增加鞋底的摩擦力,防止打滑,在鞋底的前端用玻璃胶画第一条波浪线。于是鞋底在玻璃胶波纹的摩擦力作用下,不会继续打滑了。等待玻璃胶干了就能穿了。

  • 牛大力和什么煲汤好(这样煲汤最营养)

    接下来我们就一起去了解一下吧!牛大力和什么煲汤好准备辅料食材,牛大力、土茯苓、薏米、蜜枣。薏米提前两个小时泡水。猪骨洗干净后,加入少量料酒过水一次,可以去腥。然后将所有的汤料洗净放入锅中,加入适量的水。大火煲开后,转小火一小时左右即可。时间到后,加入适量的盐调味。

  • 怎么最快3天瘦脸(科学快速的瘦脸锻炼方法)

    最近有几位读者留言问有什么方法健身计划可以快速瘦脸?对于这个问题我收集了一些靠谱的方法总结为饮食改善有氧训练脸部按摩刺激。如果你身体在增重怎胖那的脸部一定也是在长肉的,任何健身训练方法都没法帮助你,所以改善之前长胖的饮食习惯是很总要的。对于现在已经开始减肥健身的朋友无论你是男生还是女生做了下面的这套脸部锻炼动作后都能让你脸变得俊俏。