RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题

问题[utf-8]

Martin Hope
MaminHacker
Asked: 2022-06-22 01:09:59 +0000 UTC

utf-8 编解码器无法在位置 0 处解码字节 0xd0 [关闭]

  • 0
关闭 这个问题是题外话。目前不接受回复。

该问题是由不再复制的问题或错字引起的。虽然类似问题可能与本网站相关,但该问题的解决方案不太可能帮助未来的访问者。通常可以通过在发布问题之前编写和研究一个最小程序来重现问题来避免此类问题。

5 个月前关闭。

本帖已于5个月前更正提交审核,但重开帖失败:

原关闭原因未更正

改进问题

问题是这样的-我正在学习python,为了清楚起见,我为自己创建了一个代码,并且每隔一段时间就会弹出一个错误:

Traceback (most recent call last):
  File "/home/maminhacker/PycharmProjects/pythonProject/txt.py", line 4, in <module>
    a = input('Операция?(r - прочитать, w - создать, пересоздать, a - добавить в файл):')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 0: invalid continuation byte

Tipo 1 次有效,1 次弹出错误,1 次有效,再一次。我已经尝试了我所知道的一切。例如,我尝试在代码末尾a = input('Операция?(r - прочитать, w - создать, пересоздать, a - добавить в файл):')写一个逗号,encoding = 'utf=8'并在其余代码中尝试相同。我不知道正确,我试图修复错误,但我试图做一些事情。我什至可能已经知道该怎么做,但我不知道该怎么做。一段代码:

a = input('Операция?(r - прочитать, w - создать, пересоздать, a - добавить в файл):')
    
    text = input( 'Файл с которым будем работать:' )
        if a == 'r':
            file = open(text, 'r', encoding='utf-8') # на всякий случай переконвертировал в utf-8
        print('В этом файле написано:')
        print(file.read())
        file.close()

我希望你能帮忙,因为我没有在这个网站上找到确切的答案。

python utf-8
  • 1 个回答
  • 187 Views
Martin Hope
Ярослав Паламарчук
Asked: 2022-03-08 23:27:03 +0000 UTC

在 R 控制台中使用 Unicode 代码显示西里尔字符

  • 0

当我尝试通过打印将西里尔文输出到控制台时,我看到了:

> print('абв')
> [1] "\u0430\u0431\u0432"

在同一时间:

> cat('абв')
абв

会话信息输出:

> sessionInfo()
R version 4.0.4 (2021-02-15)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 10 x64 (build 19042)

Matrix products: default

locale:
[1] LC_COLLATE=Russian_Russia.1251  LC_CTYPE=Russian_Russia.1251    LC_MONETARY=Russian_Russia.1251 LC_NUMERIC=C                   
[5] LC_TIME=Russian_Russia.1251    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
[1] httr_1.4.2         compiler_4.0.4     R6_2.5.0           tools_4.0.4        curl_4.3           tinytex_0.29       telegram.bot_2.4.0 jsonlite_1.7.2    
[9] xfun_0.21 

我不能使用 cat(),我需要格式化输出。在 RStudio 变量中,所有西里尔字母名称也显示为 Unicode 代码。尝试使用 Sys.setlocale("LC_CTYPE", "en_RU.UTF-8") 更改语言环境,但没有效果。

utf-8
  • 1 个回答
  • 10 Views
Martin Hope
Cyneprepou4uk
Asked: 2021-10-21 22:22:27 +0000 UTC

如何从字符串中整体而不是部分地读取日文字母?

  • 3

一个任务

用户独立编辑脚本内的表格,它将字符串的每个单独字符替换为另一个字符/字符组合,然后运行脚本并获得他需要的内容。应该允许这个想法使用任何 UTF-8 字符。

--[[ Lua 5.3 ]]--

str = "ABC あしひ"         --строка, которую нужно обработать

characters = {            --таблица для замены символов, слева - совпадение, справа - замена
    " ",    "_",
    "A",    "1",
    "B",    "2",
    "C",    "3",
    "あ",    "a",
    "し",    "b",
    "ひ",    "c",
}

unknown_character = "*"      --default если символ не найден в таблице



output = ""                                 --сюда будут добавляться результаты совпадений
for i = 1, string.len(str) do               --цикл чтения каждого символа строки
    local c = string.sub(str, i, i)         --получить следующий символ строки
    local replaced_flag = false             --флаг того, что символ был найден, по умолчанию false
    for j, _ in ipairs(characters) do       --цикл чтения таблицы
        if j % 2 ~=0 then                   --проверка каждой нечетной ячейки таблицы
            if c == characters[j] then      --если найдено совпадение символа из строки и символа из ячейки
                c = characters[j + 1]       --то заменить символ на содержимое четной ячейки
                replaced_flag = true        --и выставить флаг
                break                       --досрочный выход из цикла, раз совпадение найдено
            end
        end
    end
    
    if replaced_flag == true then               --если найдено совпадение
        output = output..c                      --присоединить его к общему результату
    else                                        --в противном случае
        output = output..unknown_character      --присоединить default
    end
end

print(output)          --показать итоговый результат
io.read()

期待

123_abc

结果

123_*********

问题

一个日文字母实际上占 3 个字符,一个表格单元格一次存储 3 个字符。但是当我从一个字符串中读取一个日文字母到变量c时,我没有得到整个字母,而是那个字母的 1/3。这会导致表格不匹配,因此有 9 个字符 *(3 个字母,每个字母 3 个字符)。

你能告诉我如何才能完整地阅读这封信吗?我无法提前知道需要读取多少个字符串才能正确比较。

utf-8
  • 1 个回答
  • 10 Views
Martin Hope
Sergey P
Asked: 2020-03-29 12:50:53 +0000 UTC

如何将一组文件从 window-1251 转换为 UTF-8?

  • 2

我们将项目从 window-1251 翻译成 UTF-8。文件很多,一个一个导入很烦人。

问题:也许有人遇到了一个批处理程序,例如,启动了一个程序,指出了它的路径,它导入了文件夹中的所有文件?操作系统视窗 10

utf-8
  • 1 个回答
  • 10 Views
Martin Hope
BigTows
Asked: 2020-10-14 02:43:14 +0000 UTC

mariadb 编码

  • 2

有一个“奇妙”的符号“🐉”。当您尝试将其插入表中时,结果是:

ERROR 1300 (HY000): Invalid utf8mb4 character string: '\xF0\x9F\x90\x89'

需要什么编码?

utf-8
  • 1 个回答
  • 10 Views

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5