有一个字符串包含页面编码元标记,它可以是 UTF-8、Windows-1251、KOI8-R 等。
元标记,视情况而定,有不同的外观;它可能并不总是包含编码的明确指示。
在这种情况下,元标记如下所示:
<meta http-equiv="Content-Type" content="text/html; charset=koi8-r">
如果存在,如何通过 PHP 获取元标记中的字符集值?我只需要获取字符集标记的内容,在这种情况下,我想获取内容为“koi8-r”的字符串。
PS - 我想澄清通过 PHP DOM 的解决方案不适合我,建议使用正则表达式。
也许这样的选择?经测试
UTF-8, Windows-1251, KOI8-R如果你需要考虑这个选项
<meta charset="utf-8">PS:如果还有空格和单引号,需要考虑到: