浮点数的二进制表示

浮点数的二进制表示学习笔记

2008-12-20 13:31:17 阅读2931 评论10 字号:大中小

因为要参加软考了(当然也只有考试有这种魅力),我得了概浮点数转化为二进制表示这个最难的知识点(个人认为最难)。俺结合大量的从网上收集而来的资料现整理如下,希望对此知识点感兴趣的pfan有所帮助。

基础知识:

十进制转十六进制;

十六进制转二进制;

IEEE制定的浮点数表示规则;

了解:

目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法,用符号、指数和尾数来表示,底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。下面是具体的规格: 符号位 阶码 尾数 长度

float 1 8 23 32

double 1 11 52 64

以下通过几个例子讲解浮点数如何转换为二进制数

例一:

已知:double类型38414.4。

求:其对应的二进制表示。

分析:double类型共计64位,折合8字节。由最高到最低位分别是第63、62、

61、„„、0位:

最高位63位是符号位,1表示该数为负,0表示该数为正;

62-52位,一共11位是指数位;

51-0位,一共52位是尾数位。

步骤:按照IEEE浮点数表示法,下面先把38414.4转换为十六进制数。 把整数部和小数部分开处理:整数部直接化十六进制:960E。小数的处理: 0.4=0.5*0+0.25*1+0.125*1+0.0625*0+„„

实际上这永远算不完!这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了。隐藏位技术:最高位的1不写入内存(最终保留下来的还是52位)。

如果你够耐心,手工算到53位那么因该是:

38414.4(10)=[**************]0.[***********][***********]0(2)

科学记数法为:1.[**************] [***********][***********]0,右移了15位,所以指数为15。或者可以如下理解:

1.[**************] [***********][***********]0×2^15

于是来看阶码,按IEEE标准一共11位,可以表示范围是-1024 ~ 1023。

因为指数可以为负,为了便于计算,规定都先加上1023(2^10-1),在这里,阶码:15+1023=1038。二进制表示为:100 00001110;

符号位:因为38414.4为正对应 为0;

合在一起(注:尾数二进制最高位的1不要):

01000000 11100010 11000001 110

01100 11001100 11001100 11001100 11001100

例二:

已知:整数3490593(16进制表示为0x354321)。

求:其对应的浮点数3490593.0的二进制表示。

解法如下:

先求出整数3490593的二进制表示:

H: 3 5 4 3 2 1 (十六进制表示)

B: 0011 0101 0100 0011 0010 0001 (二进制表示)

│←──────21─────→│

即:

1.[***********]0012×221

可见,从左算起第一个1后有21位,我们将这21为作为浮点数的小数表示,单精度浮点数float由符号位1位,指数域位k=8位,小数域位(尾数)n=23位构成,因此对上面得到的21位小数位我们还需要补上2个0,得到浮点数的小数域表示为:

1 0101 0100 0011 0010 0001 00

float类型的偏置量Bias=2k-1-1=28-1-1=127,但还要补上刚才因为右移作为小数部分的21位,因此偏置量为127+21=148,就是IEEE浮点数表示标准: V = (-1)s×M×2E

E = e-Bias

中的e,此前计算Bias=127,刚好验证了E=148-127=21。

将148转为二进制表示为10010100,加上符号位0,最后得到二进制浮点数表示[***********][1**********]00,其16进制表示为:

H: 4 A 5 5 0 C 8 4

B: 0100 1010 0101 0101 0000 1100 1000 0100

|←──── 21 ─────→ | 1|←─8 ─→||←───── 23 ─────→ |

这就是浮点数3490593.0(0x4A550C84)的二进制表示。

例三:

0.5的二进制形式是0.1

它用浮点数的形式写出来是如下格式

0 01111110 [***********]00000

符号位 阶码 小数位

正数符号位为0,负数符号位为1

阶码是以2为底的指数

小数位表示小数点后面的数字

下面我们来分析一下0.5是如何写成0 01111110 [***********]00000

首先0.5是正数所以符号位为0

再来看阶码部分,0.5的二进制数是0.1,而0.1是1.0*2^(-1),所以我们总结出来:

要把二进制数变成(1.f)*2^(exponent)的形式,其中exponent是指数

而由于阶码有正负之分所以阶码=127+exponent;

即阶码=127+(-1)=126 即 01111110

余下的小数位为二进制小数点后面的数字,即[***********]00000

由以上分析得0.5的浮点数存储形式为0 01111110 [***********]00000 注:如果只有小数部分,那么需要右移小数点. 比如右移3位才能放到第一个1的后面, 阶码就是127-3=124.

例四 (20.59375)10 =(10100.10011 )2

首先分别将整数和分数部分转换成二进制数:

20.59375=10100.10011

然后移动小数点,使其在第1,2位之间

10100.10011=1.010010011×2^4 即e=4

于是得到:

S=0, E=4+127=131, M=010010011

最后得到32位浮点数的二进制存储格式为:

0100 1001 1010 0100 1100 0000 0000 0000=(41A4C000)16

例五:

-12.5转为单精度二进制表示

12.5:

1. 整数部分12,二进制为1100; 小数部分0.5, 二进制是.1,先把他们连起来,从第一个1数起取24位(后面补0):

1100.[***********]00

这部分是有效数字。(把小数点前后两部分连起来再取掉头前的1,就是尾数)

2. 把小数点移到第一个1的后面,需要左移3位

(1.[***********]00000*2^3), 加上偏移量127:127+3=130,二进制是10000010,这是阶码。

3. -12.5是负数,所以符号位是1。把符号位,阶码和尾数连起来。注意,尾数的第一位总是1,所以规定不存这一位的1,只取后23位:

1 10000010 [***********]00000

把这32位按8位一节整理一下,得:

11000001 01001000 00000000 00000000

就是十六进制的 C1480000.

例六:

2.025675

1. 整数部分2,二进制为10; 小数部分0.025675, 二进制

是.[***********]1001,先把他们连起来,从第一个1数起取24位(后面补0):

10.[***********]1001

这部分是有效数字。把小数点前后两部分连起来再取掉头前的1,就是尾数: [***********]01001

2. 把小数点移到第一个1的后面,左移了1位, 加上偏移量127:127+1=128,二进制是10000000,这是阶码。

3. 2.025675是正数,所以符号位是0。把符号位,阶码和尾数连起来: 0 10000000 [***********]01001

把这32位按8位一节整理一下,得:

01000000 00000001 10100100 10101001

就是十六进制的 4001A4A9.

例七:

(逆向求十进制整数)一个浮点二进制数手工转换成十进制数的例子: 假设浮点二进制数是 1011 1101 0100 0000 0000 0000 0000 0000

按1,8,23位分成三段:

1 01111010 [***********]00000

最后一段是尾数。前面加上"1.", 就是 1.[***********]00000

下面确定小数点位置。由E = e-Bias,阶码E是01111010,加上00000101才是01111111(127),

所以他减去127的偏移量得e=-5。(或者化成十进制得122,122-127=-5)。 因此尾数1.10(后面的0不写了)是小数点右移5位的结果。要复原它就要左移5位小数点,得0.0000110, 即十进制的0.046875 。

最后是符号:1代表负数,所以最后的结果是 -0.046875 。

注意:其他机器的浮点数表示方法可能与此不同. 不能任意移植。

再看一例(类似例七):

比如:53004d3e

二进制表示为:

[***********][1**********]110

按照1个符号 8个指数 23个小数位划分

0 10100110 [***********]11110

正确的结果转出来应该是[1**********]2.0

该怎么算?

好,我们根据IEEE的浮点数表示规则划分,得到这个浮点数的小数位是:

[***********]11110

那么它的二进制表示就应该是:

1.[***********]111102 × 239

这是怎么来的呢? 别急,听我慢慢道来。

标准化公式中的M要求在规格化的情况下,取值范围1

正因为如此,我们才需要对原始的整数二进制表示做偏移,偏移多少呢?偏移2E。

这个“E”怎么算?上面的239怎么得来的呢?浮点数表示中的8位指数为就是告诉这个的。我们知道:

E = e-Bias

那么根据指数位:

101001102=>16610

即e=166,由此算出E=e-Bias=166-127=39,就是说将整数二进制表示转为标准

的浮点数二进制表示的时候需要将小数点左移39位,好,我们现在把它还原得到整数的二进制表示:

1 [***********]11110 [**************]0

1│←───── 23─────→│←─── 16───→│

23+16=39,后面接着就是小数点了。

拿出计算器,输入二进制数[***********][***********]0000 转为十进制数,不正是:[1**********]2么!

通过这例六例七,介绍了将整数二进制表示转浮点数二进制表示的逆过程,还是希望大家不但能掌握转化的方法,更要理解转化的基本原理。

浮点数的二进制表示学习笔记

2008-12-20 13:31:17 阅读2931 评论10 字号:大中小

因为要参加软考了(当然也只有考试有这种魅力),我得了概浮点数转化为二进制表示这个最难的知识点(个人认为最难)。俺结合大量的从网上收集而来的资料现整理如下,希望对此知识点感兴趣的pfan有所帮助。

基础知识:

十进制转十六进制;

十六进制转二进制;

IEEE制定的浮点数表示规则;

了解:

目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法,用符号、指数和尾数来表示,底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。下面是具体的规格: 符号位 阶码 尾数 长度

float 1 8 23 32

double 1 11 52 64

以下通过几个例子讲解浮点数如何转换为二进制数

例一:

已知:double类型38414.4。

求:其对应的二进制表示。

分析:double类型共计64位,折合8字节。由最高到最低位分别是第63、62、

61、„„、0位:

最高位63位是符号位,1表示该数为负,0表示该数为正;

62-52位,一共11位是指数位;

51-0位,一共52位是尾数位。

步骤:按照IEEE浮点数表示法,下面先把38414.4转换为十六进制数。 把整数部和小数部分开处理:整数部直接化十六进制:960E。小数的处理: 0.4=0.5*0+0.25*1+0.125*1+0.0625*0+„„

实际上这永远算不完!这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了。隐藏位技术:最高位的1不写入内存(最终保留下来的还是52位)。

如果你够耐心,手工算到53位那么因该是:

38414.4(10)=[**************]0.[***********][***********]0(2)

科学记数法为:1.[**************] [***********][***********]0,右移了15位,所以指数为15。或者可以如下理解:

1.[**************] [***********][***********]0×2^15

于是来看阶码,按IEEE标准一共11位,可以表示范围是-1024 ~ 1023。

因为指数可以为负,为了便于计算,规定都先加上1023(2^10-1),在这里,阶码:15+1023=1038。二进制表示为:100 00001110;

符号位:因为38414.4为正对应 为0;

合在一起(注:尾数二进制最高位的1不要):

01000000 11100010 11000001 110

01100 11001100 11001100 11001100 11001100

例二:

已知:整数3490593(16进制表示为0x354321)。

求:其对应的浮点数3490593.0的二进制表示。

解法如下:

先求出整数3490593的二进制表示:

H: 3 5 4 3 2 1 (十六进制表示)

B: 0011 0101 0100 0011 0010 0001 (二进制表示)

│←──────21─────→│

即:

1.[***********]0012×221

可见,从左算起第一个1后有21位,我们将这21为作为浮点数的小数表示,单精度浮点数float由符号位1位,指数域位k=8位,小数域位(尾数)n=23位构成,因此对上面得到的21位小数位我们还需要补上2个0,得到浮点数的小数域表示为:

1 0101 0100 0011 0010 0001 00

float类型的偏置量Bias=2k-1-1=28-1-1=127,但还要补上刚才因为右移作为小数部分的21位,因此偏置量为127+21=148,就是IEEE浮点数表示标准: V = (-1)s×M×2E

E = e-Bias

中的e,此前计算Bias=127,刚好验证了E=148-127=21。

将148转为二进制表示为10010100,加上符号位0,最后得到二进制浮点数表示[***********][1**********]00,其16进制表示为:

H: 4 A 5 5 0 C 8 4

B: 0100 1010 0101 0101 0000 1100 1000 0100

|←──── 21 ─────→ | 1|←─8 ─→||←───── 23 ─────→ |

这就是浮点数3490593.0(0x4A550C84)的二进制表示。

例三:

0.5的二进制形式是0.1

它用浮点数的形式写出来是如下格式

0 01111110 [***********]00000

符号位 阶码 小数位

正数符号位为0,负数符号位为1

阶码是以2为底的指数

小数位表示小数点后面的数字

下面我们来分析一下0.5是如何写成0 01111110 [***********]00000

首先0.5是正数所以符号位为0

再来看阶码部分,0.5的二进制数是0.1,而0.1是1.0*2^(-1),所以我们总结出来:

要把二进制数变成(1.f)*2^(exponent)的形式,其中exponent是指数

而由于阶码有正负之分所以阶码=127+exponent;

即阶码=127+(-1)=126 即 01111110

余下的小数位为二进制小数点后面的数字,即[***********]00000

由以上分析得0.5的浮点数存储形式为0 01111110 [***********]00000 注:如果只有小数部分,那么需要右移小数点. 比如右移3位才能放到第一个1的后面, 阶码就是127-3=124.

例四 (20.59375)10 =(10100.10011 )2

首先分别将整数和分数部分转换成二进制数:

20.59375=10100.10011

然后移动小数点,使其在第1,2位之间

10100.10011=1.010010011×2^4 即e=4

于是得到:

S=0, E=4+127=131, M=010010011

最后得到32位浮点数的二进制存储格式为:

0100 1001 1010 0100 1100 0000 0000 0000=(41A4C000)16

例五:

-12.5转为单精度二进制表示

12.5:

1. 整数部分12,二进制为1100; 小数部分0.5, 二进制是.1,先把他们连起来,从第一个1数起取24位(后面补0):

1100.[***********]00

这部分是有效数字。(把小数点前后两部分连起来再取掉头前的1,就是尾数)

2. 把小数点移到第一个1的后面,需要左移3位

(1.[***********]00000*2^3), 加上偏移量127:127+3=130,二进制是10000010,这是阶码。

3. -12.5是负数,所以符号位是1。把符号位,阶码和尾数连起来。注意,尾数的第一位总是1,所以规定不存这一位的1,只取后23位:

1 10000010 [***********]00000

把这32位按8位一节整理一下,得:

11000001 01001000 00000000 00000000

就是十六进制的 C1480000.

例六:

2.025675

1. 整数部分2,二进制为10; 小数部分0.025675, 二进制

是.[***********]1001,先把他们连起来,从第一个1数起取24位(后面补0):

10.[***********]1001

这部分是有效数字。把小数点前后两部分连起来再取掉头前的1,就是尾数: [***********]01001

2. 把小数点移到第一个1的后面,左移了1位, 加上偏移量127:127+1=128,二进制是10000000,这是阶码。

3. 2.025675是正数,所以符号位是0。把符号位,阶码和尾数连起来: 0 10000000 [***********]01001

把这32位按8位一节整理一下,得:

01000000 00000001 10100100 10101001

就是十六进制的 4001A4A9.

例七:

(逆向求十进制整数)一个浮点二进制数手工转换成十进制数的例子: 假设浮点二进制数是 1011 1101 0100 0000 0000 0000 0000 0000

按1,8,23位分成三段:

1 01111010 [***********]00000

最后一段是尾数。前面加上"1.", 就是 1.[***********]00000

下面确定小数点位置。由E = e-Bias,阶码E是01111010,加上00000101才是01111111(127),

所以他减去127的偏移量得e=-5。(或者化成十进制得122,122-127=-5)。 因此尾数1.10(后面的0不写了)是小数点右移5位的结果。要复原它就要左移5位小数点,得0.0000110, 即十进制的0.046875 。

最后是符号:1代表负数,所以最后的结果是 -0.046875 。

注意:其他机器的浮点数表示方法可能与此不同. 不能任意移植。

再看一例(类似例七):

比如:53004d3e

二进制表示为:

[***********][1**********]110

按照1个符号 8个指数 23个小数位划分

0 10100110 [***********]11110

正确的结果转出来应该是[1**********]2.0

该怎么算?

好,我们根据IEEE的浮点数表示规则划分,得到这个浮点数的小数位是:

[***********]11110

那么它的二进制表示就应该是:

1.[***********]111102 × 239

这是怎么来的呢? 别急,听我慢慢道来。

标准化公式中的M要求在规格化的情况下,取值范围1

正因为如此,我们才需要对原始的整数二进制表示做偏移,偏移多少呢?偏移2E。

这个“E”怎么算?上面的239怎么得来的呢?浮点数表示中的8位指数为就是告诉这个的。我们知道:

E = e-Bias

那么根据指数位:

101001102=>16610

即e=166,由此算出E=e-Bias=166-127=39,就是说将整数二进制表示转为标准

的浮点数二进制表示的时候需要将小数点左移39位,好,我们现在把它还原得到整数的二进制表示:

1 [***********]11110 [**************]0

1│←───── 23─────→│←─── 16───→│

23+16=39,后面接着就是小数点了。

拿出计算器,输入二进制数[***********][***********]0000 转为十进制数,不正是:[1**********]2么!

通过这例六例七,介绍了将整数二进制表示转浮点数二进制表示的逆过程,还是希望大家不但能掌握转化的方法,更要理解转化的基本原理。


相关文章

  • 浮点数加减运算
  • 如果一个二进制浮点数的尾数的绝对值小于1并且大于等于0.5,(1>|尾数|≥0.5),那么这个二进制浮点数就是一个规格化的浮点数. 用二进制补码表示1个规格化的浮点数,并且规格化的浮点数的尾数只有一个符号位时: 规格化的浮点数的尾数是 ...查看


  • 浮点数计算实例
  • 浮点数表示法示例 目前C/C++编译器标准都遵照IEEE 制定的浮点数表示法来进行float,double 运算.这种结构是一种科学计数法,用符号.指数和尾数来表示,底数定为2--即把一个浮点数表示为尾数乘以2的指数次方再添上符号.下面是具 ...查看


  • 浮点数在计算机中的表示法
  • 浮点数 1. 什么是浮点数 在计算机系统的发展过程中,曾经提出过多种方法表达实数.典型的比如相对于浮点数的定点数(Fixed Point Number).在这种表达方式中,小数点固定的位于实数所有数字中间的某个位置.货币的表达就可以使用这种 ...查看


  • 2.浮点数的存储原理
  • 问题:long 和float 类型都是四个字节,为什么存储数值的范围相差极大? 原因:因为两者的存储原理时不同的. 浮点数的存储原理 作者: jillzhang 联系方式:[email protected] 本文为原创,转载请保留出处以及作 ...查看


  • float的浮点表示法
  • 浮点表示法 此教程为ITjob 软件开发教程网提供,特此分享,互相学习! float 共计32位(4字节) 由最高到最低位分别是第31.30.29....... .0位 31位是符号位,1表示该数为负,0反之 30~23位,一共8位是指数位 ...查看


  • 16位浮点数编码器
  • 一.实验名称:16位浮点数编码器 二.实验要求: 1) 将一个16位的二进制数转化为含有4位有效数.4为指数的浮点数. 2) 输入为16为的二进制数,输出为4位尾数部和4位指数,暂时不考虑截断误 差. 三.实验原理: 1) 浮点数理论 浮点 ...查看


  • 浮点数除法器的FPGA实现
  • 第39卷 专辑2008年5月 * 太原理工大学学报 JO U RN A L O F T A IYU A N U N IV ER SIT Y OF T ECH N OL O GY V ol. 39Spec. Issue M ay 2008 文 ...查看


  • 计算机组成原理知识点总结--详细版
  • 计算机组成原理2009年12月期末考试复习大纲 第一章 1. 计算机软件的分类. P11 计算机软件一般分为两大类:一类叫系统程序,一类叫应用程序. 2. 源程序转换到目标程序的方法. P12 源程序是用算法语言编写的程序. 目标程序(目的 ...查看


  • 自考计算机组成原理课后习题答案
  • 习 题 2 参考答案(参见课本P.58) 1. 解释下列术语 解:可在课堂讲述的内容中寻找答案,也可参考课本下述段落的内容. 原码(P14.-7--5),补码(P15.-1-P16.1),反码(P17.17-18), 移码(P18.7-10 ...查看


热门内容