RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 605658
Accepted
MaximPro
MaximPro
Asked:2020-12-20 18:28:46 +0000 UTC2020-12-20 18:28:46 +0000 UTC 2020-12-20 18:28:46 +0000 UTC

西里尔字符的 sizeof

  • 772

我做了一些实验,但我无法解释为什么它会这样工作。

示例 1:

#include <stdio.h>
int main() {
    /// латиница
    printf("\n%d",sizeof('a')); /// 1
    /// кириллица
    printf("\n%d",sizeof('ф')); /// 4
    return 0;
}

示例 2:

#include <stdio.h>
int main() {
    char a = 'a'; /// латиница
    char b = 'ф'; /// кириллица
    printf("\n%d",sizeof(a)); /// 1
    printf("\n%d",sizeof(b)); /// 1
    return 0;
}

实在是不明白,求解释!PS 编译器 g++

c++
  • 3 3 个回答
  • 10 Views

3 个回答

  • Voted
  1. Harry
    2020-12-20T18:50:55Z2020-12-20T18:50:55Z

    sizeof- 形式上不是函数,而是在编译时给出类型大小的运算符 - 即 存储这种类型的变量需要多少内存。

    'a'从您获得拉丁文字值 1的事实来看,您不是按 C 编译,而是按 C++ 编译!在纯 C 中,字符文字被强制转换为int,您将得到 4。

    例如,您还必须假设您的源文件保存为 utf-8,以便将西里尔字母扩展为大于 的char内容,并将该内容转换为int并给出 4。

    最后几行接收的不是文字,而是类型的变量char,对于 C++ 来说,它是唯一的 - sizeof(char) == 1。

    就这样...

    PS 因为有些人坚持...... :) 从字符文字标准:

    包含可在执行字符集中表示的单个 c-char 的普通字符文字具有 char 类型,其值等于执行字符集中 c-char 编码的数值。包含多个 c-char 的普通字符文字是多字符文字。多字符文字或包含单个 c-char 的普通字符文字在执行字符集中不可表示,是有条件支持的,具有类型 int,并具有实现定义的值。

    • 15
  2. Best Answer
    αλεχολυτ
    2020-12-21T16:45:05Z2020-12-21T16:45:05Z

    程序代码中的字符(和字符串)文字以某种方式被编译器翻译成字节序列。这种转换的规则取决于源的编码(正如其他贡献者已经提到的),但也可能取决于许多其他因素(参见另一个问题的答案)。

    应该注意的是,当您尝试使用clang编译器进行编译时,您的代码的两个版本 都会导致错误:

    error: character too large for enclosing character literal type  
    char b = 'ф'; /// кириллица
    

    您正在使用的 gcc对带有字母的行给出了几个警告ф:

    warning: multi-character character constant [-Wmultichar]  
    warning: overflow in implicit constant conversion [-Woverflow]
    

    第一个是关于使用多字符文字(并非所有编译器都支持)。第二个是这个文字不适合char. 那些。该类型'ф'已被编译器解释为大于char,正如@Harry 的回答中已经提到的,这种类型是int:

    ...具有 type int,并且具有实现定义的值。

    基于以上,我们可以得出结论:

    • 4(例 1)得到,因为 多字符文字未被截断且其大小等于int,即 sizeof(int) == 4.
    • 1(例2) 得到,因为 多字符文字char在变量初始化时被截断为类型b,但sizeof(char) == 1根据定义。

    我会在这里回复你对另一篇文章的评论:

    我把多字节文字想象成复杂编码中的一个字符,比方说 'f' (UTF-8),这是 2 个字节,我们可以根据你的话写不超过 2x 'f' ...与 4 个字符不一致

    'ф'你真的不能写超过 2 。

    #include <stdio.h>
    int main() {
        printf("\n%d",sizeof('ффф')); 
    }
    
    warning: character constant too long for its type
    

    那些。事实上,该值被截断为sizeof(int).

    但是如果使用字符串文字,那么两个字节ф可能就足够存储了:

    #include <stdio.h>
    int main() {
        const char c[] = "ф";
        printf("%ld\n", sizeof(c)); 
    }
    

    3个

    输出一个数字3因为 分配 1 个字节用于终止零。

    • 7
  3. Abyx
    2020-12-20T21:14:32Z2020-12-20T21:14:32Z

    单字节字符文字的类型'q'是char,sizeof(char)等于 1。

    多字节字符文字的类型'qq'是int,sizeof(int)例如 4。

    如果源文件以 utf-8 编码保存,则字面'ф'量为两个字节,相当于'\xd1\x84'. 因此,它的类型是int.

    • 4

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    如何停止编写糟糕的代码?

    • 3 个回答
  • Marko Smith

    onCreateView 方法重构

    • 1 个回答
  • Marko Smith

    通用还是非通用

    • 2 个回答
  • Marko Smith

    如何访问 jQuery 中的列

    • 1 个回答
  • Marko Smith

    *.tga 文件的组重命名(3620 个)

    • 1 个回答
  • Marko Smith

    内存分配列表C#

    • 1 个回答
  • Marko Smith

    常规赛适度贪婪

    • 1 个回答
  • Marko Smith

    如何制作自己的自动完成/自动更正?

    • 1 个回答
  • Marko Smith

    选择斐波那契数列

    • 2 个回答
  • Marko Smith

    所有 API 版本中的通用权限代码

    • 2 个回答
  • Martin Hope
    jfs *(星号)和 ** 双星号在 Python 中是什么意思? 2020-11-23 05:07:40 +0000 UTC
  • Martin Hope
    hwak 哪个孩子调用了父母的静态方法?还是不可能完成的任务? 2020-11-18 16:30:55 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    user207618 Codegolf——组合选择算法的实现 2020-10-23 18:46:29 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    Arch ArrayList 与 LinkedList 的区别? 2020-09-20 02:42:49 +0000 UTC
  • Martin Hope
    iluxa1810 哪个更正确使用:if () 或 try-catch? 2020-08-23 18:56:13 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5