2. Кодирование информации
Код – это система условных знаков для
представления информации.
Кодирование – это операция преобразования
символов или группы символов одного кода в
символы или группы символов другого кода.
Кодирование – это запись информации с помощью
некоторой знаковой системы (языка).
3. Кодирование информации
? Зачем кодируют информацию?
кодирование
Информация передается,
обрабатывается и
данные (код) хранится в виде кодов.
10101001010
передача данные (код)
11111100010
борьба с помехами
(специальные способы передача
кодирования)
обработка хранение
3
4. Языки
Язык – знаковая система, используемая для хранения
и передачи информации (знаковая форма
представления информации).
Естественные языки:
1. носят национальный характер (русский,
английский, …);
2. есть правила и исключения.
Формальные языки:
1. интернациональны, понятны всем (язык физики и
т.п.);
2. наличие строгих правил.
program qq;
E = mc 2
begin
writeln("Привет!");
end.
16 = 1016 = 208 = 10000 2 4
6. Кодирование
Упражнение 2. Закодируйте имя ВАСЯ с
помощью кодовой таблицы (Windows-1251):
0 1 2 3 4 5 6 7 8 9 A B C D E F
C А Б В Г Д Е Ж З И Й К Л М Н О П
D Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
В А С Я
ВАСЯ С2 С0 D1 DF
! Код равномерный, разделитель НЕ нужен!
6
7. Языки
Грамматика – правила по которым из символов алфавита
строятся слова. Синтаксис - правила по которым из слов.
строятся предложения.
Упражнение 3. Представьте с помощью естественных и
нормальных языков следующую информацию
Формальный Естественный
Информация язык язык
Нахождение 1
S= a * b * sin γ
площади 2
треугольника
Правило
дорожного
движения
Призыв о
помощи
8. Кодирование: цели и способы
Текст:
в Росии: Привет, Вася!
Windows-1251: CFF0E8E2E52C20C2E0F1FF21
передача за рубеж (транслит): Privet, Vasya!
стенография:
шифрование: Рсйгжу-!Гбта”
Числа:
для вычислений: 25
?Как зашифровано?
прописью: двадцать пять
римская система: XXV
! Информация (смысл сообщения) может
быть закодирована разными способами!
8
9. В процессе обмена информацией кроме
кодирования информации происходит и ее
декодирование:
Источник Кодирующее Передача
информации устройство информации
Декодирующее Получатель
устройство информации
10. Пример: как создается новая мелодия
Образ Запись Передача
композитором исполнителю
мелодии мелодии нотами носителя с нотами
Перевод исполнителем Прослушивание
нот в звуки мелодии
11. Упражнение 4 (устно).
Девочка заменила каждую букву своего имени
ее номером в алфавите. Получилось 141261.
Как зовут девочку?
Код имени необходимо разделить
следующим образом: 14-1-26-1.
14-М, 1-А, 26-Ш.
Имя - Маша
12. Двоичное кодирование
Двоичное кодирование – это кодирование всех видов
информации с помощью двух знаков (обычно 0 и 1).
Передача электрических сигналов:
U сигнал с помехами U сигнал с помехами
5В
«1»
1 0 1
полезный полезный «0»
сигнал сигнал время
время
12
13. Двоичное кодирование
чис
ла
символы
кодировщик 101011011101110110101
рисунки
звук
• в такой форме можно закодировать все виды
информации
• нужны только устройства с двумя состояниями
• практически нет ошибок при передаче
• компьютеру легче обрабатывать данные
• человеку сложно воспринимать двоичные коды
? Можно ли использовать не «0» и «1», а другие
символы, например, «А» и «Б»?
13
14. Упражнение 4. Заполните таблицу:
Количество бит 1 2 3 4 5 6 7 8 9 10
Кодируемое
количество сообщений
16. При вводе в компьютер текстовой
информации каждая буква
кодируется определенным числом,
а при выводе на внешние устройства
(экран или печать) для восприятия
человеком по этим числам строятся
изображения букв.
Соответствие между набором букв и
числами называется кодировкой
символов.
17. Традиционно для кодирования одного символа
используется количество информации, равное 1 байту (8
битам).
Кодирование заключается в том, что каждому символу
ставится в соответствие уникальный десятичный код от
0 до 255, а каждому десятичному коду соответствует 8-
разрядный двоичный код от 00000000 до 11111111.
Код символа хранится в памяти компьютера, где
занимает 1 байт.
При таком способе можно закодировать 256 различных
символов (256 = 28).
Такое количество символов достаточно для
представления текстовой информации, включая
прописные и заглавные буквы русского алфавита,
цифры, знаки, графические символы и т. д.
18. Кодирование символов
Текстовый файл
• на экране (символы)
• в памяти – двоичные
коды
10000012 10000102 10000112 10001002
65 66 67 68
! В файле хранятся не изображения символов, а
их числовые коды в двоичной системе!
А где же хранятся изображения?
18
19. Таким образом, компьютер различает
символы по их коду.
Присвоение символу конкретного кода
является вопросом соглашения, которое
фиксируется в конкретной кодовой таблице.
В качестве международного стандарта
принята кодовая таблица ASCII.
В этой кодовой таблице латинские буквы
(прописные и строчные) располагаются в
алфавитном порядке.
Расположение цифр также упорядочено по
возрастанию значений .
20. Стандартными в этой таблице кодов ASCII являются
только первые 128 символов,
т. е. символы с номерами от нуля (двоичный код
00000000) до 127 (01111111).
Первые 33 кода (с 0 до 32) соответствуют не символам,
а операциям (перевод строки, ввод пробела и т.д.).
Коды 33 до 127 являются интернациональными и
соответствуют символам латинского алфавита, цифрам,
знакам арифметических операций и знакам
препинания.
21. Остальные 128 кодов, начиная со 128
(двоичный код 10000000) и кончая 255
(11111111), используются для кодировки букв
национальных алфавитов, символов
псевдографики
и научных символов.
В национальных кодировках одному и тому
же коду соответствуют различные символы. К
сожалению, в настоящее время существует 5
различных кодовых таблиц для русских букв,
поэтому тексты созданные в одной кодировке,
не будут правильно отображаться в другой.
22. Кодировка 1 байт на символ
0 1 127 128 254 255
таблица ASCII кодовая
(международная) страница
ASCII = American Standard Code for Information Interchange
0-31 управляющие символы:
7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc.
32 пробел
знаки препинания: . , : ; ! ?
специальные знаки: + - * / () {} []
48-57 цифры 0..9
65-90 заглавные латинские буквы A-Z
97-122 строчные латинские буквы a-z
Кодовая страница (расширенная таблица ASCII)
для русского языка:
CP-866 для системы MS DOS
CP-1251 для системы Windows (Интернет)
КОИ8-R для системы UNIX (Интернет) 22
23. Хронологически одним из первых
стандартов кодирования русских букв
на компьютерах был код КОИ – 8
(«Код обмена информационный – 8
битный»). Эта кодировка
применяется в компьютерах с
операционной системой UNIX.
24. Наиболее распространенная
кодировка – это стандартная
кириллистическая кодировка
Microsoft Windows, обозначаемая
сокращением CP1251 («CP» означает
«Code Page»). Все Windows –
приложения, работающие с русским
языком, поддерживают эту кодировку.
25. Для работы в среде операционной
системы MS-DOS используется
«альтернативная» кодировка, в
терминологии фирмы Microsoft –
кодировка CP 866.
26. Фирма Apple разработала для
компьютеров Macintosh свою
собственную кодировку русских букв
(Mac)
27. Международная организация по
стандартизации (International Standards
Organization, ISO) утвердила в качестве
стандарта для русского языка еще одну
кодировку под названием ISO 8859 – 5.
28. Стандарты кодировок:
1. КОИ-8 - UNIX
2. CP1251 («CP» означает «Code Page») -
Microsoft Windows
3. CP 866 - MS-DOS
4. Mac - Macintosh
5. ISO 8859 – 5
29. Таблица кодировки символов
Двоичный Десятичный КОИ8 CP1251 CP866 Mac ISO
код код
0000 0000 0
………
0000 1000 8 Удаление последнего символа (клавиша Backspace)
………
0000 1101 13 Перевод строки (клавиша Enter)
………
0010 0000 32 Пробел
0010 0001 33 !
………
0101 1010 90 Z
………
0111 1111 127
……… 128 - Ъ А А К
………
1100 0010 194 Б В - - Т
………
1100 1100 204 Л М : : Ь
………
1101 1101 221 Щ Э - Ё Н
………
1111 1111 225 Ь я Нераз. пробел Нераз. пробел п
30. В последнее время появился новый
международный стандарт Unicode,
который отводит на каждый символ не
один байт, а два, и поэтому с его
помощью можно закодировать не 256
символов, 216=65 536 различных
символов. Эту кодировку поддерживает
платформа Microsoft Windows&Office97.
31. Кодировка UNICODE (UTF-16)
• Windows, MS Office, …
• 16 бит на символ
• 65536 или 216 символов в одной таблице
можно одновременно использовать
символы разных языков (Интернет)
размер файла увеличивается в 2 раза
31
32. Задание : определите символ
по числовому коду.
• Запустите программу БЛОКНОТ
• Нажмите ALT и 0224 (на дополнительной
цифровой клавиатуре).
• Появится символ а.
• Повторите эту операцию для числовых кодов
от 0225 до 0233.
• Появятся символы в кодировке (CP 1251
Windows).
• Запишите их в тетрадь.
33. Задание 2: определите символ
по числовому коду.
• Запустите программу БЛОКНОТ
• Нажмите ALT и 161 (на дополнительной
цифровой клавиатуре).
• Появится символ.
• Повторите эту операцию для числовых кодов
160, 169, 226.
• Появятся символы в кодировке (CP 866 MS-
DOS).
• Запишите их в тетрадь.
34. II I
- ; # $ % & ( ) * + » - /
. зз 34 35 36 3? 38 33 40 41 42 43 44 45 46 47
0 1 2 3 4 5 6 7 8 9 1
< = > 9
. 43 50 51 52 53 54 55 56 5? 58 59 60 61 62 63
■ А В С D Е F G н 1 J К L M N 0
•i 65 66 67 68 63 Т1 72 73 74 75 76 77 T8 79
то
р Q R S V W X Y [ 3
т и z л
81 82 83 84 85 86 81 88 89 90 91 92 33 94 35
ео
» а b С е f Я h j i k 1 m n О
а
96 38 83 100 101 102 103 104 105 106 107 108 109 110 111
зт
Р q Г S t U V W X У z { I } ~
112 113 1U 115 116 11Т 118 113 120 121 122 123 124 125 126