谁是base64编码的创造者

Question

hedgehogues

Asked:2022-03-02 10:54:57 +0000 UTC2022-03-02 10:54:57 +0000 UTC 2022-03-02 10:54:57 +0000 UTC

编码问题。编码转换

772

确定文件编码的实用程序有哪些？任务很简单。我收到文件，我需要将它们从 X 编码转换为“utf-8”。如何决定？

2 个回答

Voted

CrazyElf · Answer 1 · 2022-03-02T15:10:59Z

CrazyElf

2022-03-02T15:10:59Z2022-03-02T15:10:59Z

python中有一个很好的 chardet库。我为您的任务草拟了一份代码草案。我检查了输入中的文件cp1251，utf-8它似乎有效。

import chardet

filename = 'testfile.txt'
with open(filename, 'rb') as f_det:
    rawdata = f_det.read()
    enc = chardet.detect(rawdata)
    print(enc)
if enc['encoding'] != 'utf-8':
    text = rawdata.decode(enc['encoding'])
    with open(filename + '_utf-8', 'w', encoding='utf-8') as f_out:
        f_out.writelines(text)

2

hedgehogues · Answer 2 · 2022-03-09T06:05:14Z

我以一种简单的方式做到了。我从这里获取了 python 的所有标准编码并这样做了：

def decode(contents):
    """
    decode gets any bytes and try transform it to all standart encode. All variants this function returns as list of strings
    
    list standart encoding https://docs.python.org/3/library/codecs.html#standard-encodings
    """
    encodings = [
        "ascii","big5","big5hkscs","cp037","cp273","cp424","cp437","cp500","cp720","cp737","cp775","cp850","cp852",
        "cp855","cp856","cp857","cp858","cp860","cp861","cp862","cp863","cp864","cp865","cp866","cp869","cp874","cp875",
        "cp932","cp949","cp950","cp1006","cp1026","cp1125","cp1140","cp1250","cp1251","cp1252","cp1253","cp1254",
        "cp1255","cp1256","cp1257","cp1258","euc_jp","euc_jis_2004","euc_jisx0213","euc_kr","gb2312","gbk","gb18030",
        "hz","iso2022_jp","iso2022_jp_1","iso2022_jp_2","iso2022_jp_2004","iso2022_jp_3","iso2022_jp_ext","iso2022_kr",
        "latin_1","iso8859_2","iso8859_3","iso8859_4","iso8859_5","iso8859_6","iso8859_7","iso8859_8","iso8859_9",
        "iso8859_10","iso8859_11","iso8859_13","iso8859_14","iso8859_15","iso8859_16","johab","koi8_r","koi8_t",
        "koi8_u","kz1048","mac_cyrillic","mac_greek","mac_iceland","mac_latin2","mac_roman","mac_turkish","ptcp154",
        "shift_jis","shift_jis_2004","shift_jisx0213","utf_32","utf_32_be","utf_32_le","utf_16","utf_16_be",
        "utf_16_le","utf_7","utf_8","utf_8_sig",
    ]
    succeed = []
    for e in encodings:
        try:
            contents.decode(e)
            succeed.append(e)
        except:
            pass
    return succeed

设计成小萝卜的形式。

编码问题。编码转换

表格填充不起作用

提示 50/50，有两个，其中一个是正确的

在 PyQt5 中停止进程

我的脚本不工作

在文本文件中写入和读取列表

如何像屏幕截图中那样并排排列这些块？

确定文本文件中每一行的字符数

将接口对象传递给 JAVA 构造函数

正确更新数据库中的数据

Python解析不是css

编码问题。编码转换

2 个回答

相关问题