eanmos Asked:2020-06-06 23:24:56 +0000 UTC2020-06-06 23:24:56 +0000 UTC 2020-06-06 23:24:56 +0000 UTC 什么是陷阱表示? 772 在对这个问题的答案的评论中。提到了术语“陷阱表示”: “即使使用额外的代码,实现也可以保留值 -2 63作为陷阱表示。因此,即使在二进制补码中也不能保证 -2 63的形式可表示性”(@AnT)。 这是什么? PS 我在 enSO 上找到了答案,但当然是英文的。 c 1 个回答 Voted Best Answer AnT stands with Russia 2020-06-07T01:41:23Z2020-06-07T01:41:23Z 陷阱表示是某种类型的对象表示中的字节组合,T不一定是任何类型值的有效表示T。尝试将此类表示视为类型值T会导致未定义的行为。 陷阱表示可以存在于类型表示中的原因有很多。在不声称完整的情况下: 类型的对象表示的非平凡结构 内部表示的非平凡结构通常会导致内部不变量的出现,违反内部不变量会产生陷阱表示。例如,即使是最简单类型的对象表示也可能包含奇偶校验位,旨在检查数据的完整性。违反由这些位给出的奇偶校验不变量的值是陷阱表示。 内部表示的非平凡结构也导致某些对象表示以自然的方式变成简单的“不必要”,毫无意义。它们是陷阱表示的直接候选者。例如,在 IEEE 754 浮点类型值表示中,有一些位组合表示信号 NaN(“Not-a-Number”)。使用适当的 FPU 配置,尝试使用这些值将立即导致异常。这也是陷阱表示的一个经典例子。 特别保留的值 实现有权自行决定拒绝使用一些看似“无辜”的相当琐碎类型的表示。例如,使用直接(有符号幅度)或反向(1 的补码)代码来表示负整数的平台有权拒绝使用“负零”表示,将其视为陷阱表示。使用二进制补码的平台可以自由地将位表示100...0视为陷阱表示。 正确性取决于外部因素的表示 在这些情况下,陷阱表示不是预先固定的。例如,不指向程序可访问内存的指针值可以被平台视为陷阱表示,即 在访问这样的指针值时已经导致未定义的行为,甚至在我们尝试访问内存本身之前。例如,在具有分段内存组织的平台上,尝试将不正确的段描述符值加载到段寄存器中可能会导致程序崩溃。同理,各种句柄、描述符等的值,紧密集成到平台中,可以认为是陷阱表示。 用于调试目的的有意陷阱表示模拟 许多现代实现提供了一种“清理”代码调试版本的方法。例如,尝试读取未初始化变量的值可能会导致程序立即中止并显示诊断消息。此行为是在软件级别人为和有意创建的陷阱表示的示例。 同时,一些硬件架构在硬件层面支持类似的功能。例如,Itanium 体系结构支持硬件寄存器的特殊状态 - NaT(“not-a-thing”、“nothing”),这与语言术语中的陷阱表示完全对应。(此状态主要用于指示寄存器未初始化。) 唯一保证没有陷阱表示的基本对象表示是类型的值unsigned char(以及char实现中的类型char是无符号类型)。因此,任何对象都可以重新解释为数组unsigned char [],您可以安全地查看此类数组的内容,而不必担心遇到陷阱表示。 类型对象的表示struct或union永远不会被视为陷阱表示,即使它的一个字段包含陷阱表示。那些。整体读取此类struct/union对象的内容不会导致未定义的行为,而读取包含陷阱表示的特定字段会导致。 PS关于相关主题: 在 C89/90 标准中,读取未初始化的值总是会导致未定义的行为。在 C99 标准中,规范的这一部分发生了变化:在 C99 中,未初始化的变量现在包含未指定的值或陷阱表示。在陷阱表示的情况下,会发生未定义的行为,但在未指定值的情况下,不会发生未定义的行为。如上所述,该类型unsigned char没有陷阱表示。也就是说,事实证明,在 C99 中,读取一个类型的未初始化值unsigned char只会产生一个未指定的值,并且保证不会导致未定义的行为。 然而,这违背了标准作者的初衷。 首先,引入了类型unsigned char没有陷阱表示的要求,以便unsigned char []可以通过数组查看内存中其他对象的“二进制”内容,而不是让类型变量unsigned char可以被“忘记”以进行初始化。 其次,它给 Itanium 架构及其 NaT 带来了问题:如果 Itanium 平台的实现想要将本地类型变量存储unsigned char在寄存器中,那么这些实现将不得不强制初始化此类寄存器以使它们脱离 NaT 状态,这与传统的 With 方法背道而驰。 最后,决定在 C11 版本中进一步改进语言规范(第 6.3.2.1/2 节):如果代码中所有使用局部变量的工作都满足存储类的要求register(即,该变量可能是存储在寄存器中),然后读取未初始化的此类变量的值会明确导致未定义的行为。这适用于未初始化的类型变量unsigned char和未初始化的类型变量struct。 特别是,规范的这一部分是通过相当奇怪的例子来说明的。 void foo() { unsigned char junk; unsigned char a = junk + 1; // неопределенное поведение struct { int i; } a, b; a = b; // неопределенное поведение } void bar() { unsigned char junk; &junk; unsigned char a = junk + 1; // неспецифицированное значение struct { int i; } a, b; &b; a = b; // неспецифицированное значение }
陷阱表示是某种类型的对象表示中的字节组合,
T
不一定是任何类型值的有效表示T
。尝试将此类表示视为类型值T
会导致未定义的行为。陷阱表示可以存在于类型表示中的原因有很多。在不声称完整的情况下:
类型的对象表示的非平凡结构
内部表示的非平凡结构通常会导致内部不变量的出现,违反内部不变量会产生陷阱表示。例如,即使是最简单类型的对象表示也可能包含奇偶校验位,旨在检查数据的完整性。违反由这些位给出的奇偶校验不变量的值是陷阱表示。
内部表示的非平凡结构也导致某些对象表示以自然的方式变成简单的“不必要”,毫无意义。它们是陷阱表示的直接候选者。例如,在 IEEE 754 浮点类型值表示中,有一些位组合表示信号 NaN(“Not-a-Number”)。使用适当的 FPU 配置,尝试使用这些值将立即导致异常。这也是陷阱表示的一个经典例子。
特别保留的值
实现有权自行决定拒绝使用一些看似“无辜”的相当琐碎类型的表示。例如,使用直接(有符号幅度)或反向(1 的补码)代码来表示负整数的平台有权拒绝使用“负零”表示,将其视为陷阱表示。使用二进制补码的平台可以自由地将位表示
100...0
视为陷阱表示。正确性取决于外部因素的表示
在这些情况下,陷阱表示不是预先固定的。例如,不指向程序可访问内存的指针值可以被平台视为陷阱表示,即 在访问这样的指针值时已经导致未定义的行为,甚至在我们尝试访问内存本身之前。例如,在具有分段内存组织的平台上,尝试将不正确的段描述符值加载到段寄存器中可能会导致程序崩溃。同理,各种句柄、描述符等的值,紧密集成到平台中,可以认为是陷阱表示。
用于调试目的的有意陷阱表示模拟
许多现代实现提供了一种“清理”代码调试版本的方法。例如,尝试读取未初始化变量的值可能会导致程序立即中止并显示诊断消息。此行为是在软件级别人为和有意创建的陷阱表示的示例。
同时,一些硬件架构在硬件层面支持类似的功能。例如,Itanium 体系结构支持硬件寄存器的特殊状态 - NaT(“not-a-thing”、“nothing”),这与语言术语中的陷阱表示完全对应。(此状态主要用于指示寄存器未初始化。)
唯一保证没有陷阱表示的基本对象表示是类型的值
unsigned char
(以及char
实现中的类型char
是无符号类型)。因此,任何对象都可以重新解释为数组unsigned char []
,您可以安全地查看此类数组的内容,而不必担心遇到陷阱表示。类型对象的表示
struct
或union
永远不会被视为陷阱表示,即使它的一个字段包含陷阱表示。那些。整体读取此类struct
/union
对象的内容不会导致未定义的行为,而读取包含陷阱表示的特定字段会导致。PS关于相关主题:
在 C89/90 标准中,读取未初始化的值总是会导致未定义的行为。在 C99 标准中,规范的这一部分发生了变化:在 C99 中,未初始化的变量现在包含未指定的值或陷阱表示。在陷阱表示的情况下,会发生未定义的行为,但在未指定值的情况下,不会发生未定义的行为。如上所述,该类型
unsigned char
没有陷阱表示。也就是说,事实证明,在 C99 中,读取一个类型的未初始化值unsigned char
只会产生一个未指定的值,并且保证不会导致未定义的行为。然而,这违背了标准作者的初衷。
首先,引入了类型
unsigned char
没有陷阱表示的要求,以便unsigned char []
可以通过数组查看内存中其他对象的“二进制”内容,而不是让类型变量unsigned char
可以被“忘记”以进行初始化。其次,它给 Itanium 架构及其 NaT 带来了问题:如果 Itanium 平台的实现想要将本地类型变量存储
unsigned char
在寄存器中,那么这些实现将不得不强制初始化此类寄存器以使它们脱离 NaT 状态,这与传统的 With 方法背道而驰。最后,决定在 C11 版本中进一步改进语言规范(第 6.3.2.1/2 节):如果代码中所有使用局部变量的工作都满足存储类的要求
register
(即,该变量可能是存储在寄存器中),然后读取未初始化的此类变量的值会明确导致未定义的行为。这适用于未初始化的类型变量unsigned char
和未初始化的类型变量struct
。特别是,规范的这一部分是通过相当奇怪的例子来说明的。