RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1589511
Accepted
Фангенто
Фангенто
Asked:2024-08-05 00:39:17 +0000 UTC2024-08-05 00:39:17 +0000 UTC 2024-08-05 00:39:17 +0000 UTC

C++。字符数组中西里尔字母编码的问题

  • 772

我遇到了问题。我有一个分割编码。

SetConsoleOutputCP(1251);
    SetConsoleCP(1251);

当我通过控制台输入数组时,cin>>MassChar;它接受一种编码,其中 1 个字符存储在第一个元素中。 “Hello”一词需要一个至少包含 7 个元素的数组。当我在 code 中分配一个值时char MassChar[]="Привет";,1 个字符需要 2 个元素,当输出数组的一个元素时,它输出 M 或 O。单词“Hello”需要一个至少包含 13 个元素的数组。 如何使所有内容与第一种情况相同(1 个字符 = 1 个元素)。我马上说:wchar_t和char16_t不需要加。

c++
  • 2 2 个回答
  • 49 Views

2 个回答

  • Voted
  1. Best Answer
    Lith
    2024-08-05T08:48:12Z2024-08-05T08:48:12Z

    向量长度为​​ 13 个字符,因为每个非 ASCII 字符使用 2 个字节,6*2=12(Hello),最后一个字符 \0 为空,表示行结束。您可以针对这种情况创建自己的类并重载索引运算符。

        #include <iostream>
        #include <fstream>
        #include <string>
        #include <Windows.h>
        class Utf8String {
        public:
            Utf8String(const std::string& str) : data(str) {}
        
            std::string operator[](size_t index) const {
                return getCharacterAt(index);
            }
        
            size_t length() const {
                return countCharacters();
            }
        
        private:
            std::string data;
        
            size_t countCharacters() const {
                size_t count = 0;
                for (size_t i = 0; i < data.size(); ) {
                    if ((data[i] & 0x80) == 0) {
                        i += 1;
                    }
                    else if ((data[i] & 0xE0) == 0xC0) {
                        i += 2;
                    }
                    else {
                        throw std::runtime_error("Неправильная последовательность UTF-8.");
                    }
                    count++;
                }
                return count;
            }
        
            std::string getCharacterAt(size_t index) const {
                size_t count = 0;
                for (size_t i = 0; i < data.size(); ) {
                    if ((data[i] & 0x80) == 0) {
                        if (count == index) return data.substr(i, 1);
                        i += 1;
                    }
                    else if ((data[i] & 0xE0) == 0xC0) {
                        if (count == index) return data.substr(i, 2);
                        i += 2;
                    }
                    else {
                        throw std::runtime_error("Неправильная последовательность UTF-8.");
                    }
                    count++;
                }
                throw std::out_of_range("Индекс вне границ вектора символов.");
            }
        };
        
        
        
        int main() {
            SetConsoleOutputCP(65001);
            SetConsoleCP(65001);
            const char* charArray = "Привет";
            Utf8String MassChar(charArray);
        
            std::cout << "Первый символ строки: " << MassChar[0] << std::endl;
        
            std::cout << "Длина строки: " << MassChar.length() << std::endl;
        
            std::cout << "Полная строка: " << MassChar[0] << MassChar[1] << MassChar[2] << MassChar[3] << MassChar[4] << MassChar[5] << std::endl;
        
            char userInput[2 * 6 + 1];
            std::cout << "Введите новую строку: ";
            std::cin >> userInput;
        
            Utf8String userUtf8Input(userInput);
            std::cout << "Вы ввели: " << userUtf8Input[0] << userUtf8Input[1] << userUtf8Input[2] << std::endl;
        
            return 0;
        }
    

    输出将在控制台中:

    Первый символ строки: П
    Длина строки: 6
    Полная строка: Привет
    Введите новую строку: Мир
    Вы ввели: Мир
    

    文件编码 65001。

    • 0

相关问题

  • 编译器和模板处理

  • 指针。找到最小数量

  • C++,关于枚举类对象初始化的问题

  • 函数中的二维数组

  • 无法使用默认构造函数创建类对象

  • C++ 和循环依赖

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5