使用在线商店时,您必须处理来自不同本地化的数据。它们包含一个对处理很重要的日期。自然,日期格式在不同语言的意义上是不同的——西班牙语、法语、英语、德语等。
这是西班牙语的示例:
“2021 年 9 月 9 日 12:19:03 GMT-7”
“2022 年 2 月 8 日 23:28:33 GMT-8”
“1 年前 2021 00:31:47 GMT-7”
当您尝试在 Pfndas 中使用 pd.to_datetime() 时,您会遇到错误。
pd.to_datetime("1 ago 2021 00:31:47 GMT-7")
ParserError: Unknown string format: 1 ago 2021 00:31:47 GMT-7
这里和这里都有关于该主题的解决方案 - 使用PyICU. 但是没有 Windows 的“本机”安装。
同时,我很想用每种语言的“句柄”替换几个月的必要缩写,并pd.to_datetime()在上下文替换后使用它们。然后对于每种语言可以有几个语言环境。西班牙语——墨西哥和西班牙等。
问题 1PyICU :使用 “手动”替换几个月的缩写有什么好处以及可能出现什么“问题”。通过文件名,我可以理解它是什么语言。
问题 2:也许出现了一些新的模块来解析日期而不需要告诉它语言?
问题3,短)csv :如果日期中有不同的语言,读取时如何解析日期?
我决定在一个单独的环境中安装适合我的环境,
PyICU-2.9-cp39-cp39-win_amd64.whl取自此处。借用上述来源的代码并吐出时区时间,我得到了一个通用解析器:好吧,它完全适用于所需的行列,如下所示:
由于文件名包含国家/地区缩写,因此不难找到语言环境。比方说“es_MX”或“es_ES”。
作品。会有问题 - 我会更正答案。)
添加于 2022.08.06
到目前为止,一切正常。
唯一的澄清。
conda最好使用参数--no-deps安装。