Charset and encoding

1,272 views

Published on

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,272
On SlideShare
0
From Embeds
0
Number of Embeds
164
Actions
Shares
0
Downloads
10
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Charset and encoding

  1. 1.
  2. 2. Charset & Encoding<br />fahai [at] TaobaoUED<br />
  3. 3. a<br />
  4. 4. character set<br />
  5. 5. encoding<br />
  6. 6. for ASCII<br />Charset - 码点是 0x61(位于第 97 个位置)<br />Encoding - 可以用单字节 0x61 来代表码点 0x61<br />
  7. 7. Unicode – Since 1991<br />
  8. 8. Encodings in Unicode<br />UTF-32 – 定长。编码每个码点,用 4 个字节,因此可以在 U+0000 和 U+FFFFFFFF 之间对任何码点编码。<br />UTF-16 – 变长,但通常看起来像一个定长编码。UTF-16 对于大多数字符也使用 2 个字节,但在 U+D800 和 U+DFFF 之间。<br />UTF-8 – 变长,使用 1 到 4 个字节来为码点编码,而且能够编码介于 U+0000 和 U+0FFFF 之间的码点。<br />
  9. 9. Byte Order Mark<br />字节顺序标记(BOM)<br />出现在 Unicode 流开端,说明编码类型。<br />
  10. 10. UTF-8<br />
  11. 11. Unicode 8-bit<br />节省空间。<br />和 ASCII 完全兼容。<br />将一组码点编码成字节流。<br />
  12. 12. UTF-8 in App<br />编辑时,将页面保存为 UTF-8 格式的。<br />告诉浏览器页面是如何编码的:set header or set meta。<br />
  13. 13. Reference<br />《构建可扩展的 Web 站点》<br />
  14. 14. Thanks<br />

×