CodeCamp Iasi 10 march 2012 - UTF-8

636 views

Published on

Published in: Technology, Art & Photos
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
636
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

CodeCamp Iasi 10 march 2012 - UTF-8

  1. 1. marți, 13 martie 12
  2. 2. UTF-8 The What, Why, and How Iulian Dogariu 10.03.2012marți, 13 martie 12
  3. 3. Te-a°tept disearã la portiÞãmarți, 13 martie 12
  4. 4. 00000000 89 50 4e 47 0d 0a 1a 0a 00 00 00 0d 49 48 44 52 |.PNG........IHDR| 00000010 00 00 02 e5 00 00 00 8f 08 06 00 00 00 5d ca a5 |.............]..| 00000020 eb 00 00 0a 43 69 43 43 50 49 43 43 20 70 72 6f |....CiCCPICC pro| 00000030 66 69 6c 65 00 00 78 da 9d 53 77 58 93 f7 16 3e |file..x..SwX...>| 00000040 df f7 65 0f 56 42 d8 f0 b1 97 6c 81 00 22 23 ac |..e.VB....l.."#.| 00000050 08 c8 10 59 a2 10 92 00 61 84 10 12 40 c5 85 88 |...Y....a...@...| 00000060 0a 56 14 15 11 9c 48 55 c4 82 d5 0a 48 9d 88 e2 |.V....HU....H...| 00000070 a0 28 b8 67 41 8a 88 5a 8b 55 5c 38 ee 1f dc a7 |.(.gA..Z.U8....| 00000080 b5 7d 7a ef ed ed fb d7 fb bc e7 9c e7 fc ce 79 |.}z............y| 00000090 cf 0f 80 11 12 26 91 e6 a2 6a 00 39 52 85 3c 3a |.....&...j.9R.<:| 000000a0 d8 1f 8f 4f 48 c4 c9 bd 80 02 15 48 e0 04 20 10 |...OH......H.. .| 000000b0 e6 cb c2 67 05 c5 00 00 f0 03 79 78 7e 74 b0 3f |...g......yx~t.?|marți, 13 martie 12
  5. 5. “ASCII is allright” 41 53 43 49 49 20 69 73 20 61 6c 6c 72 69 67 68 74marți, 13 martie 12
  6. 6. ASCIImarți, 13 martie 12
  7. 7. marți, 13 martie 12
  8. 8. marți, 13 martie 12
  9. 9. One byte not enoughmarți, 13 martie 12
  10. 10. ASCII “Unicode is KEWL” 55 6e 69 63 6f 64 65 20 69 73 20 4b 45 57 4c 0amarți, 13 martie 12
  11. 11. Unicode UCS-2 “Unicode is KEWL” 55 00 6e 00 69 00 63 00 6f 00 64 00 65 00 20 00 69 00 73 00 20 00 4b 00 45 00 57 00 4c 00 0a 00marți, 13 martie 12
  12. 12. Two bytes not enough (!)marți, 13 martie 12
  13. 13. Unicode UCS-4 Unicode is KEWL 55 00 00 00 6e 00 00 00 69 00 00 00 63 00 00 00 6f 00 00 00 64 00 00 00 65 00 00 00 20 00 00 00 69 00 00 00 73 00 00 00 20 00 00 00 4b 00 00 00 45 00 00 00 57 00 00 00 4c 00 00 00 0a 00 00 00marți, 13 martie 12
  14. 14. “0” bytes “Unicode is KEWL” 55 00 6e 00 69 00 63 00 6f 00 64 00 65 00 20 00 69 00 73 00 20 00 4b 00 45 00 57 00 4c 00 0a 00marți, 13 martie 12
  15. 15. UCS-2 ... 55 f4 3a ff 6e ac 12 43 69 fa 3f 1a 63 ff ... ... 55 f4 3a ff 6e ac 12 43 69 fa 3f 1a 63 ff ...marți, 13 martie 12
  16. 16. This way? ... 55 f4 3a ff 6e ac 12 43 69 fa 3f 1a 63 ff ... ... or This way ? ... 55 f4 3a ff 6e ac 12 43 69 fa 3f 1a 63 ff ...marți, 13 martie 12
  17. 17. Little Endian “U” 55 00 “U” 00 55 Big Endianmarți, 13 martie 12
  18. 18. 1) Storage space 2) “0” bytes 3) Synchronisation 4) Endiannessmarți, 13 martie 12
  19. 19. UTF-8marți, 13 martie 12
  20. 20. Variable length encoding a ж 龍 61 d0 b6 e9 be 8dmarți, 13 martie 12
  21. 21. Unicode number 00 61 a 0000 0000 0110 0001 0--- ---- UTF-8 encodingmarți, 13 martie 12
  22. 22. Unicode number 00 61 a 0000 0000 0110 0001 0110 0001 61 UTF-8 encodingmarți, 13 martie 12
  23. 23. Unicode number 04 36 ж 0000 0100 0011 0100 11-- ---- 10-- ---- UTF-8 encodingmarți, 13 martie 12
  24. 24. Unicode number 04 36 ж 0000 0100 0011 0100 1101 0000 1011 0110 d0 b6 UTF-8 encodingmarți, 13 martie 12
  25. 25. Unicode number 9f 8d 1001 1111 1000 1101 龍 111- ---- 10-- ---- 10-- ---- UTF-8 encodingmarți, 13 martie 12
  26. 26. Unicode number 9f 8d 1001 1111 1000 1101 龍 1110 1001 1011 1110 1000 1101 e9 be 8d UTF-8 encodingmarți, 13 martie 12
  27. 27. Variable length encoding a 61 0110 0001 ж d0 b6 1101 0000 1011 0110 龍 e9 be 8d 1110 1001 1011 1110 1000 1101marți, 13 martie 12
  28. 28. 1) Storage space 2) “0” bytes 3) Synchronisation 4) Endiannessmarți, 13 martie 12
  29. 29. Thank you! And please don’t forget the evaluation form :-)marți, 13 martie 12

×