SlideShare a Scribd company logo
1 of 12
Кодирование текстовой
информации
Кодирование символов
Текстовый файл
• на экране (символы)
• в памяти – двоичные
коды

10000012 10000102 10000112 10001002
65

!

66

67

68

В файле хранятся не изображения символов, а
их числовые коды в двоичной системе!
Для кодирования символов используют
различные кодовые таблицы

Например:

символ код
1 байтовая таблица(ASCII)
• Всего можно закодировать 256 символов
(с десятичными кодами от 0 до 255).
• Каждый символ занимает 1 байт
памяти(или 8 бит, так как 28=256 )
• Первая половина таблицы - ASCII(коды 0 127) является международной,
применяется для кодирования десятичных
цифр, латинского алфавита, знаков
препинания и управляющих символов.
• Вторая половина - расширенная(коды 128 255) применяется для кодирования
национального алфавита, в частности в
нашей стране для кодирования русских
букв(кириллицы). Один из вариантов
называется КОИ8-R
0

127

1

таблица ASCII
(международная)

128

254

Расширенная
таблица

0-31 управляющие символы:
7 – звонок, 10 – новая строка, 13 – возврат
каретки, 27 – Esc.
32 пробел
знаки препинания: . , : ; ! ?
специальные знаки: + - * / () {} []
48-57
цифры 0..9
65-90
заглавные латинские буквы A-Z
97-122 строчные латинские буквы a-z
25.12.13

Наиль Загидуллин МБОУ СОШ № 2 с.
Стерлибашево
http://lessonnr.blogspot.ru/2013/06/9.ht

255
25.12.13

Наиль Загидуллин МБОУ СОШ № 2 с.
Стерлибашево
http://lessonnr.blogspot.ru/2013/06/9.ht
Кодовая страница (расширенная таблица ASCII)

CP-866
CP-1251
КОИ8-R
Windows и т.д.

25.12.13

Наиль Загидуллин МБОУ СОШ № 2 с.
Стерлибашево
http://lessonnr.blogspot.ru/2013/06/9.ht
• Нужно иметь в виду, что в тексте также
присутствуют невидимые символы,
например, пробел(код 32), переход
строки(код 10), возврат каретки(код 13).
Последние два кода вставляются при
нажатии на клавишу Enter(новый абзац),
добавляя 2 байта информации в текст.
• Enter (новый абзац) – добавляет два
байта!
Таблица Unicode (UTF-16)
• Windows, MS Office, …
• Это 16-разрядная кодировка, т.е. в ней на
каждый символ отводится 2 байта памяти.
Можно закодировать до 216 = 65536 символов
• Полная спецификация стандарта Unicode
включает в себя все существующие, вымершие и
искусственно созданные алфавиты мира, а также
множество математических, музыкальных,
химических и прочих символов.
Задачи:
1 Сколько бит памяти компьютера занимает слово
МИКРОПРОЦЕССОР, в кодировках Windows и
Unicode?
2 Файл, созданный в блокноте содержит 10 абзацев
по 650 символов каждый. Чему равен объём
файла в байтах?
3 Автоматическое устройство осуществило
перекодировку информационного сообщения на
русском языке, первоначально записанного в
коде Unicode, в кодировку ASCII. При этом
информационное сообщение уменьшилось на
480 бит. Какова длина сообщения в символах?
• 1 всего 14 символов
• В Windows 14 х8 бит = 112 бит = =112:8=14
байт
• В Unicode 14x16= 224 бит = 224:8=
=28 байт
• 2 650 х 1байт х 10 + 2 х 9(enter) =
6500+18=6518 байт
• 3 k – количество символов
• 16 x k – 8 x k = 480 бит
• 8 x k = 480 бит
• k = 480 : 8 = 60 ответ: 60 символов

More Related Content

What's hot (6)

012
012012
012
 
лб № 1 кодирование
лб № 1 кодированиелб № 1 кодирование
лб № 1 кодирование
 
Кодирование текстовой информации
Кодирование текстовой информацииКодирование текстовой информации
Кодирование текстовой информации
 
Www
WwwWww
Www
 
урок 03 представление информации в компьютере
урок 03 представление информации в компьютереурок 03 представление информации в компьютере
урок 03 представление информации в компьютере
 
тема
тематема
тема
 

Similar to кодирование текстовой информации

кодировка Html
кодировка Htmlкодировка Html
кодировка Html
serega127
 
Кодирование информации
Кодирование информацииКодирование информации
Кодирование информации
ryabuha
 
Кодирование информации
Кодирование информацииКодирование информации
Кодирование информации
ryabuha
 
2 кодирование информации
2 кодирование информации2 кодирование информации
2 кодирование информации
zarechneva
 
Магдеева Р кодирование
Магдеева Р кодированиеМагдеева Р кодирование
Магдеева Р кодирование
Elena Nazarova
 
038
038038
038
JIuc
 
кодовые таблицы
кодовые таблицыкодовые таблицы
кодовые таблицы
alexwert
 

Similar to кодирование текстовой информации (18)

кодирование информации1
кодирование информации1кодирование информации1
кодирование информации1
 
кодирование информации в компьютере
кодирование информации в компьютерекодирование информации в компьютере
кодирование информации в компьютере
 
представление текстовой информации
представление текстовой информациипредставление текстовой информации
представление текстовой информации
 
кодировка Html
кодировка Htmlкодировка Html
кодировка Html
 
Кодирование информации
Кодирование информацииКодирование информации
Кодирование информации
 
Кодирование информации
Кодирование информацииКодирование информации
Кодирование информации
 
"Кодирование информации"
"Кодирование информации""Кодирование информации"
"Кодирование информации"
 
2 кодирование информации
2 кодирование информации2 кодирование информации
2 кодирование информации
 
Магдеева Р кодирование
Магдеева Р кодированиеМагдеева Р кодирование
Магдеева Р кодирование
 
038
038038
038
 
378 егоров александр
378 егоров александр378 егоров александр
378 егоров александр
 
info
infoinfo
info
 
Количество информации.Единицы измерения информации
Количество информации.Единицы измерения информацииКоличество информации.Единицы измерения информации
Количество информации.Единицы измерения информации
 
ОПК № 3 – Машинное представление целых чисел, символов, строк
ОПК № 3 – Машинное представление целых чисел, символов, строкОПК № 3 – Машинное представление целых чисел, символов, строк
ОПК № 3 – Машинное представление целых чисел, символов, строк
 
29212p
29212p29212p
29212p
 
информатика. кодирование символов. 8 кл^
информатика. кодирование символов. 8 кл^информатика. кодирование символов. 8 кл^
информатика. кодирование символов. 8 кл^
 
кодовые таблицы
кодовые таблицыкодовые таблицы
кодовые таблицы
 
кодовые таблицы
кодовые таблицыкодовые таблицы
кодовые таблицы
 

кодирование текстовой информации

  • 2. Кодирование символов Текстовый файл • на экране (символы) • в памяти – двоичные коды 10000012 10000102 10000112 10001002 65 ! 66 67 68 В файле хранятся не изображения символов, а их числовые коды в двоичной системе!
  • 3. Для кодирования символов используют различные кодовые таблицы Например: символ код
  • 4. 1 байтовая таблица(ASCII) • Всего можно закодировать 256 символов (с десятичными кодами от 0 до 255). • Каждый символ занимает 1 байт памяти(или 8 бит, так как 28=256 )
  • 5. • Первая половина таблицы - ASCII(коды 0 127) является международной, применяется для кодирования десятичных цифр, латинского алфавита, знаков препинания и управляющих символов. • Вторая половина - расширенная(коды 128 255) применяется для кодирования национального алфавита, в частности в нашей стране для кодирования русских букв(кириллицы). Один из вариантов называется КОИ8-R
  • 6. 0 127 1 таблица ASCII (международная) 128 254 Расширенная таблица 0-31 управляющие символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc. 32 пробел знаки препинания: . , : ; ! ? специальные знаки: + - * / () {} [] 48-57 цифры 0..9 65-90 заглавные латинские буквы A-Z 97-122 строчные латинские буквы a-z 25.12.13 Наиль Загидуллин МБОУ СОШ № 2 с. Стерлибашево http://lessonnr.blogspot.ru/2013/06/9.ht 255
  • 7. 25.12.13 Наиль Загидуллин МБОУ СОШ № 2 с. Стерлибашево http://lessonnr.blogspot.ru/2013/06/9.ht
  • 8. Кодовая страница (расширенная таблица ASCII) CP-866 CP-1251 КОИ8-R Windows и т.д. 25.12.13 Наиль Загидуллин МБОУ СОШ № 2 с. Стерлибашево http://lessonnr.blogspot.ru/2013/06/9.ht
  • 9. • Нужно иметь в виду, что в тексте также присутствуют невидимые символы, например, пробел(код 32), переход строки(код 10), возврат каретки(код 13). Последние два кода вставляются при нажатии на клавишу Enter(новый абзац), добавляя 2 байта информации в текст. • Enter (новый абзац) – добавляет два байта!
  • 10. Таблица Unicode (UTF-16) • Windows, MS Office, … • Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Можно закодировать до 216 = 65536 символов • Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
  • 11. Задачи: 1 Сколько бит памяти компьютера занимает слово МИКРОПРОЦЕССОР, в кодировках Windows и Unicode? 2 Файл, созданный в блокноте содержит 10 абзацев по 650 символов каждый. Чему равен объём файла в байтах? 3 Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в коде Unicode, в кодировку ASCII. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?
  • 12. • 1 всего 14 символов • В Windows 14 х8 бит = 112 бит = =112:8=14 байт • В Unicode 14x16= 224 бит = 224:8= =28 байт • 2 650 х 1байт х 10 + 2 х 9(enter) = 6500+18=6518 байт • 3 k – количество символов • 16 x k – 8 x k = 480 бит • 8 x k = 480 бит • k = 480 : 8 = 60 ответ: 60 символов

Editor's Notes

  1. Цели урока: Познакомить учащихся со способами кодирования информации в компьютере; Рассмотреть примеры решения задач; Способствовать развитию познавательных интересов учащихся. Воспитывать выдержку и терпение в работе, чувства товарищества и взаимопонимания. Задачи урока: Формировать знания учащихся по теме “Кодирование текстовой (символьной) информации”; Содействовать формированию у школьников образного мышления; Развить навыки анализа и самоанализа; Формировать умения планировать свою деятельность. http://festival.1september.ru/articles/502820/ http://festival.1september.ru/articles/573989/