数据库中有一些记录是使用Delphi程序编码的,示例如下:
text = 'ïðîáëåìà ñ ëåíòî÷íûì ïðèâîäîì'
corrected_text = text.encode('utf-8').decode('cp866')
print(corrected_text)
其产生:
├п├░├о├б├л├е├м├а ├▒ ├л├е├н├▓├о├╖├н├╗├м ├п├░├и├в├о├д├о├м
有人可以告诉我那里使用什么编码吗?
数据库中有一些记录是使用Delphi程序编码的,示例如下:
text = 'ïðîáëåìà ñ ëåíòî÷íûì ïðèâîäîì'
corrected_text = text.encode('utf-8').decode('cp866')
print(corrected_text)
其产生:
├п├░├о├б├л├е├м├а ├▒ ├л├е├н├▓├о├╖├н├╗├м ├п├░├и├в├о├д├о├м
有人可以告诉我那里使用什么编码吗?
我从 Outlook 解析了 ost 文件,它错误地解密了一些消息。粗略地说,通过utf-8解密,结果是“dNAPSHI DEME”,但应该是“Good PM”。
我尝试了不同的编码,但没有一个有效。
encoded_text = b'\xd0\xb4\xd0\x9d\xd0\x90\xd0\x9f\xd0\xa8\xd0\x98 \xd0\x94\xd0\x95\xd0\x9c\xd0\xad'
encodings = ['utf-8', 'windows-1251', 'koi8-r', 'cp866', 'iso-8859-5', 'mac-cyrillic']
for encoding in encodings:
try:
decoded_text = encoded_text.decode(encoding)
print(f"Кодировка {encoding}: {decoded_text}")
except Exception as e:
print(f"Ошибка декодирования для кодировки {encoding}: {e}")
结论如下:
Кодировка utf-8: дНАПШИ ДЕМЭ
Ошибка декодирования для кодировки windows-1251: 'charmap' codec can't decode byte 0x98 in position 11: character maps to <undefined>
Кодировка koi8-r: п╢п²п░п÷п╗п≤ п■п∙п°п╜
Кодировка cp866: ╨┤╨Э╨Р╨Я╨и╨Ш ╨Ф╨Х╨Ь╨н
Кодировка iso-8859-5: аДаЈаааа