我在输出代码长度大于四个字符的 Unicode 字符时遇到问题。
事实是,当您尝试输出label1Unicode 字符时,例如,像这样:U+1F4BE,由于某种原因,程序不会捕获最后一个字符。在本例中,这是符号E。
我只是不明白问题出在哪里,因为U+2709所有类型的代码都可以正常工作:
在代码的开头还写了以下内容:
Unicode 有一个看起来像空格的字符,但它不是空格。它的代码是U+1160。它看起来像这样:'ᅠ'(不带引号)。那么这个字符在unicode中的作用是什么,有什么用呢?
为什么要创建像 U+007F(DELETE) 这样的符号?这DELETE不会删除任何东西,我试过了。而且还有很多这样的字符,这里是一个列表:
http ://www.fileformat.info/info/unicode/category/Cc/list.htm
那么为什么需要这样的符号呢?以及如何应用它们?
我熟悉了有关 Unicode 的维基百科页面,但不理解它,尽管它在那里说这是一个字符编码标准
据我所知,Unicode表示如下
0x00000000 - 0x0010F800
有一种说法是UTF-16 = Unicode,是真的吗?
UTF-16 表示为 256*256 = 65 536(没有代理对),有代理对的公式是 2^20+2^16−2048 - 不清楚这样的公式是怎么来的,懂行的可以解释一下(没有代理对,一切都很清楚)
UTF-8表示如下
4字节(用什么)
0x00000000 - 0x001FFFFF
6 个字节(未使用的)
0x00000000 - 0x7FFFFFFF
这里问题似乎在酝酿,如果 Unicode 编码的字符少 2 倍,我们如何从 UTF-8 转换为 Unicode?
什么是 Unicode,为什么我们要从同一个 UTF-8 翻译成它?
PS 脑子里的粥,我已经糊涂了X_X,帮我理清头绪