NoteDeep
客户端通过:Accept-Language、Accept-Charset
服务器通过:Content-Language、Content-Type中的charset参数

对HTTP来说,实体主体只是二进制信息的容器而已。字符集是把字符转换成二进制码的编码

US-ASCII
ASCII是最著名的编码后字符集,ASCII的代码值只是从0-127,因此只需要7个二进制码就可以覆盖代码空间。HTTP报文(首部、URI等)使用的字符集是US-ASCII

UTF-8
每个字符使用1-6个字节。第一字节的从左往右的高位的数目,表示编码后的字符所用的字节数,所需的每个后续字节都含有6位的代码值。
如果第一字节的最高位为0,长度就是1字节,剩余的7位就包含字符代码,正好可以和ASCII兼容
例如:字符代码90(ASCII的“Z”)会被编码为1个字节(01011010)。而字符代码5073,会被编码为3个字节:
11100001 10001111 10010001


评论列表