RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 734770
Accepted
Qwertiy
Qwertiy
Asked:2020-10-23 22:28:03 +0000 UTC2020-10-23 22:28:03 +0000 UTC 2020-10-23 22:28:03 +0000 UTC

在 long double 中丢失 1 位

  • 772

在关于实数的位表示的问题和我的回答之后。

我想以编程方式确定为任何实际类型分配了多少位用于尾数,以及多少位用于指数。为此,我编写了以下代码(其中,符号下的位与尾数分开考虑,因此数字少 1):

https://ideone.com/YuIWNc - C 代码(float、double、long double)
https://ideone.com/342B4S - C++ 代码(float、double、long double)
https://ideone.com/VURQnw - C++ 代码(float、double、long double、__float128)

#include <cstdio>

template <typename typed> void count(unsigned *result_m, unsigned *result_e)
{
  typed x = 1, exp;
  unsigned res, e;
  for (res=0; x!=0; ++res) x/=2;
  for (exp=1,e=0; exp*2<res; ++e) exp*=2;
  *result_e = e+1;
  *result_m = res-exp+1;
}

int main(void)
{
  unsigned f_m, f_e, d_m, d_e, ld_m, ld_e, f128_m, f128_e;

  count<float>(&f_m, &f_e);
  count<double>(&d_m, &d_e);
  count<long double>(&ld_m, &ld_e);
  count<__float128>(&f128_m, &f128_e);

  printf("              S    M   E   SZ\n");
  printf("float:        1  %3u  %2u  %3u\n",    f_m,    f_e, 8 * sizeof(float));
  printf("double:       1  %3u  %2u  %3u\n",    d_m,    d_e, 8 * sizeof(double));
  printf("long double:  1  %3u  %2u  %3u\n",   ld_m,   ld_e, 8 * sizeof(long double));
  printf("__float128:   1  %3u  %2u  %3u\n", f128_m, f128_e, 8 * sizeof(__float128));
}

结果是这样的:

              S    M   E   SZ
float:        1   23   8   32
double:       1   52  11   64
long double:  1   63  15  128
__float128:   1  112  15  128

对于float,double甚至__float128一切都有效(维基百科,IEEE 754-2008)。
但存在long double以下问题:

  1. 1+63+15 = 79- 79 位。而不是80。另一个位在哪里?
  2. long double表示 10 字节的数字,但sizeof返回 16。
    我怎样才能得到 10?
c++
  • 2 2 个回答
  • 10 Views

2 个回答

  • Voted
  1. Best Answer
    AnT stands with Russia
    2020-10-24T01:44:26Z2020-10-24T01:44:26Z

    由于在 x86 平台上,80 位浮点值与 32 位和 64 位 IEEE754 浮点值(float和double)在表示上存在一个根本区别,因此丢失了一位。

    float并在尾数中double使用具有隐式前导单元的表示。也就是说,在归一化表示中,尾数中的最高单元没有显式存储,而只是隐含存储。但是在扩展的 80 位浮点型long double中,尾数中的这个前导单元总是显式存储的。

    因此,存在差异。

    对于 and 类型float,double您的第一个循环首先遍历数字的规范化表示,其中显式尾数始终为零,并且指数从其最大值 ( 127for float) 的一半减小到值1:

    // Для `float`
    
    // Нормализованные представления: мантисса равна 0, а экспонента убывает от 127 до 1
    
    0x3F800000
    ...
    0x00800000  <- после 126 делений
    

    之后,您的循环继续遍历数字的非规范化表示,其中指数为0,并且尾数向右移动一个单独的单位。当这个单独的单元飞过尾数的右边缘时,它x变为零并且循环结束

    // Денормализованные представления: экспонента равна 0, а мантисса состоит
    // из движущейся вправо единицы
    
    0x00400000
    0x00200000
    ...
    0x00000001
    0x00000000  <- после 150 делений
    

    请注意,尾数中的 infloat和doubleone 仅出现在第一个非规范化值中,并贯穿尾数的所有位。事实证明,这种情况下非规范化的非零值的数量等于尾数中的位数。

    然而,当使用时,long double尾数中最高位的那个显然从一开始就一直存在。当long double您的循环中的指数达到零并且循环开始计算非规范化值long double时,尾数中的单位不会“突然出现”到尾数的最高位置(就像它在float和中一样double),而是已经最初出现在最高位置并从那里“开始”。正因为如此,计算非规范化值的循环部分少了一次迭代。


    顺便说一句,总结的奇怪方式——res指数范围的一半和尾数的宽度是充满问题的。然后,您计算一个值log2 res并期望该值正确描述指数中的位数。但是,如果在某些假设的浮点类型中尾数非常宽,则该值log2 res可能是错误的。

    • 6
  2. Lyth
    2020-10-24T00:45:42Z2020-10-24T00:45:42Z

    C/C++ 帮助提供了惊人的细节:

    long double是一种高精度浮点类型。不一定映射到 IEEE-754 类型。通常是 x86 和 x86-64 架构上的 80 位 x87 格式浮点类型。

    事实证明,实现的责任完全在于编译器。

    要检查去哪里和哪个位,您可以在“发现”所有位的过程中添加打印输出:

    #include <cstdio>
    #include <cstring>
    #include <cinttypes>
    
    template <typename typed> void count(unsigned *result_m, unsigned *result_e)
    {
      typed x = 1, exp;
      unsigned res, e;
      std::uint32_t bytes[4] {0,0,0,0};
      for (res=0; x!=0; ++res) {
        x/=2;
        std::memcpy(bytes, &x, sizeof(typed));
        printf("x(%3d): %08x %08x %08x %08x\n", res, bytes[0], bytes[1], bytes[2], bytes[3]);
      }
      for (exp=1,e=0; exp*2<res; ++e) exp*=2;
      *result_e = e+1;
      *result_m = res-exp+1;
    }
    
    int main(void)
    {
      unsigned f_m, f_e, d_m, d_e, ld_m, ld_e;
    
      count<float>(&f_m, &f_e);
      count<double>(&d_m, &d_e);
      count<long double>(&ld_m, &ld_e);
    
      printf("              S   M   E   SZ\n");
      printf("float:        1  %2u  %2u  %3u\n",  f_m,  f_e, 8 * sizeof(float));
      printf("double:       1  %2u  %2u  %3u\n",  d_m,  d_e, 8 * sizeof(double));
      printf("long double:  1  %2u  %2u  %3u\n", ld_m, ld_e, 8 * sizeof(long double));
    }
    

    因此,例如,对于 32 位数字:

    x(  0): 3f000000
    x(  1): 3e800000
    x(  2): 3e000000
    x(  3): 3d800000
    ...с номера 126 наступает денормализация:
    x(124): 01000000
    x(125): 00800000
    x(126): 00400000
    x(127): 00200000
    x(128): 00100000
    x(129): 00080000
    x(130): 00040000
    ...и далее перебор заканчивается:
    x(147): 00000002
    x(148): 00000001
    x(149): 00000000
    

    钻头消失的地方 - 有一个障碍。同样,所有未使用的位都将可见,这样您就可以估计类型的有效大小。

    长双的延续:

    x(    0): 00000000 80000000 00003ffe 00000000
    x(    1): 00000000 80000000 00003ffd 00000000
    x(    2): 00000000 80000000 00003ffc 00000000
    x(    3): 00000000 80000000 00003ffb 00000000
    ...денормализация:
    x(16379): 00000000 80000000 00000003 00000000
    x(16380): 00000000 80000000 00000002 00000000
    x(16381): 00000000 80000000 00000001 00000000
    x(16382): 00000000 40000000 00000000 00000000
    x(16383): 00000000 20000000 00000000 00000000
    ...
    x(16410): 00000000 00000004 00000000 00000000
    x(16411): 00000000 00000002 00000000 00000000
    x(16412): 00000000 00000001 00000000 00000000
    x(16413): 80000000 00000000 00000000 00000000
    x(16414): 40000000 00000000 00000000 00000000
    ...финал:
    x(16443): 00000002 00000000 00000000 00000000
    x(16444): 00000001 00000000 00000000 00000000
    x(16445): 00000000 00000000 00000000 00000000
    

    因此,根据关于扩展精度的英文维基百科,对于正常数字,一位确实总是设置为 1 - 并且在非规范化后变为 0。在“标准”32 位和 64 位表示中,该位被省略

    • 3

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    Python 3.6 - 安装 MySQL (Windows)

    • 1 个回答
  • Marko Smith

    C++ 编写程序“计算单个岛屿”。填充一个二维数组 12x12 0 和 1

    • 2 个回答
  • Marko Smith

    返回指针的函数

    • 1 个回答
  • Marko Smith

    我使用 django 管理面板添加图像,但它没有显示

    • 1 个回答
  • Marko Smith

    这些条目是什么意思,它们的完整等效项是什么样的

    • 2 个回答
  • Marko Smith

    浏览器仍然缓存文件数据

    • 1 个回答
  • Marko Smith

    在 Excel VBA 中激活工作表的问题

    • 3 个回答
  • Marko Smith

    为什么内置类型中包含复数而小数不包含?

    • 2 个回答
  • Marko Smith

    获得唯一途径

    • 3 个回答
  • Marko Smith

    告诉我一个像幻灯片一样创建滚动的库

    • 1 个回答
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Алексей Шиманский 如何以及通过什么方式来查找 Javascript 代码中的错误? 2020-08-03 00:21:37 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    user207618 Codegolf——组合选择算法的实现 2020-10-23 18:46:29 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5