преобразование входной информации в форму,
воспринимаемую компьютером, т.е. двоичный код.
(с) Чугунов А.С., 2015
преобразование данных из двоичного кода в
форму, понятную человеку.
Декодирование
Кодирование
История создания кодовых
таблиц
• Кодировка представляет собой таблицу символов, где каждой букве алфавита (а также цифрам и
специальным знакам) присвоен свой уникальный номер - код символа.
• Стандартизирована только половина таблицы, т.н. ASCII-код - первые 128 символов, которые
включают в себя буквы латинского алфавита. И с ними никогда не бывает проблем. Вторая же
половина таблицы (а всего в ней 256 символов - по количеству состояний, который может принять
один байт) отдана под национальные символы, и в каждой стране эта часть различна. Но только в
России умудрились придумать целых 5 различных кодировок. Термин "различные" обозначает то,
что одному и тому же символу соответствует разный цифровой код. Т.е. если мы неправильно
определим кодировку текста, то нашему вниманию предстанет абсолютно нечитаемый текст.
• Кодировки появились исторически. Первая широко используемая российская кодировка называлась
KOI-8. Ее придумали, когда адаптировали к русскому языку систему UNIX. Это было еще в
семидесятых - до появления персоналок. И до сих пор в UNIX это считается основной кодировкой.
• Потом появились первые персональные компьютеры, и началось победное шествие DOS. Вместо
того чтобы воспользоваться уже придуманной кодировкой, Microsoft решила сделать свою, ни с чем
не совместимую. Так появилась DOS-кодировка (или 866 кодовая страница). В ней, кстати, были
введены спецсимволы для рисования рамок, что широко использовалось в программах написанных
под DOS. Например, в том же Norton Commander-е.
• Параллельно с IBM-совместимыми развивались и Macintosh-компьютеры. Несмотря на то, что их
доля в России очень мала, тем не менее, потребность в русификации существовала и, разумеется,
была придумана еще одна кодировка - MAC.
• Время шло, и 1990 году Microsoft явила на свет первую успешную версию Windows 3.0-3.11. А
вместе с ней и поддержку национальных языков. И снова был проделан такой же фокус, как и с
DOS. По непонятным причинам они не поддержали ни одну, из уже существовавших ранее (как это
сделала OS/2, принявшая за стандарт DOS-кодировку), а предложили новую Win-кодировку (или
кодовая страница 1251). Де-факто, она стала самой распространенной в России.
(с) Чугунов А.С., 2015
(с) Чугунов А.С., 2015
Для кодирования одного символа требуется
один байт информации.
Учитывая, что каждый бит принимает значение 1 или 0,
получаем, что с помощью 1 байта можно закодировать 256
различных символов.
N=2i N – мощность алфавита
28=256 I – информационный вес
Таблица кодировки ASCII
является стандартной, и ее
понимают абсолютно все
программы, работающие с
текстами.
(с) Чугунов А.С., 2015
(с) Чугунов А.С., 2015
Кодовая таблица ASCII
American Standard Code for Information Interchange
коды от 0 до 31
функциональные
клавиши
коды от 128 до 255
национальный
алфавит
коды от 32 до 127
буквы английского алфавита,
знаки математических операций и т.д
(с) Чугунов А.С., 2015
Таблица кодировки Unicode
Стандарт кодирования Unicode
отводит на каждый символ 2 байта,
что позволяет закодировать многие
алфавиты в одной таблице.
N=2I=216=65 536
(с) Чугунов А.С., 2015
Таблицы кодировки русскоязычных
символов-
код обмена информации 8-битныйКОИ8-Р
CP1251
CP866
Mac
ISO
Список сайтов
(с) Чугунов А.С., 2015
http://yandex.ru/images/search?text=%D0%BA%D0%BE%D0%B4%D0%
BE%D0%B2%D0%B0%D1%8F%20%D1%82%D0%B0%D0%B1%D0%
BB%D0%B8%D1%86%D0%B0&stype=image&lr=213&noreask=1&sour
ce=wiz&uinfo=sw-1366-sh-768-ww-1287-wh-704-pd-1-wp-
16x9_1366x768-lt-443
https://ru.wikipedia.org/wiki/Windows-
1253#.D0.A2.D0.B0.D0.B1.D0.BB.D0.B8.D1.86.D1.8B
http://citforum.ru/internet/webd/article_20.shtml

"Кодирование информации"

  • 2.
    преобразование входной информациив форму, воспринимаемую компьютером, т.е. двоичный код. (с) Чугунов А.С., 2015 преобразование данных из двоичного кода в форму, понятную человеку. Декодирование Кодирование
  • 3.
    История создания кодовых таблиц •Кодировка представляет собой таблицу символов, где каждой букве алфавита (а также цифрам и специальным знакам) присвоен свой уникальный номер - код символа. • Стандартизирована только половина таблицы, т.н. ASCII-код - первые 128 символов, которые включают в себя буквы латинского алфавита. И с ними никогда не бывает проблем. Вторая же половина таблицы (а всего в ней 256 символов - по количеству состояний, который может принять один байт) отдана под национальные символы, и в каждой стране эта часть различна. Но только в России умудрились придумать целых 5 различных кодировок. Термин "различные" обозначает то, что одному и тому же символу соответствует разный цифровой код. Т.е. если мы неправильно определим кодировку текста, то нашему вниманию предстанет абсолютно нечитаемый текст. • Кодировки появились исторически. Первая широко используемая российская кодировка называлась KOI-8. Ее придумали, когда адаптировали к русскому языку систему UNIX. Это было еще в семидесятых - до появления персоналок. И до сих пор в UNIX это считается основной кодировкой. • Потом появились первые персональные компьютеры, и началось победное шествие DOS. Вместо того чтобы воспользоваться уже придуманной кодировкой, Microsoft решила сделать свою, ни с чем не совместимую. Так появилась DOS-кодировка (или 866 кодовая страница). В ней, кстати, были введены спецсимволы для рисования рамок, что широко использовалось в программах написанных под DOS. Например, в том же Norton Commander-е. • Параллельно с IBM-совместимыми развивались и Macintosh-компьютеры. Несмотря на то, что их доля в России очень мала, тем не менее, потребность в русификации существовала и, разумеется, была придумана еще одна кодировка - MAC. • Время шло, и 1990 году Microsoft явила на свет первую успешную версию Windows 3.0-3.11. А вместе с ней и поддержку национальных языков. И снова был проделан такой же фокус, как и с DOS. По непонятным причинам они не поддержали ни одну, из уже существовавших ранее (как это сделала OS/2, принявшая за стандарт DOS-кодировку), а предложили новую Win-кодировку (или кодовая страница 1251). Де-факто, она стала самой распространенной в России. (с) Чугунов А.С., 2015
  • 4.
    (с) Чугунов А.С.,2015 Для кодирования одного символа требуется один байт информации. Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. N=2i N – мощность алфавита 28=256 I – информационный вес
  • 5.
    Таблица кодировки ASCII являетсястандартной, и ее понимают абсолютно все программы, работающие с текстами. (с) Чугунов А.С., 2015
  • 6.
    (с) Чугунов А.С.,2015 Кодовая таблица ASCII American Standard Code for Information Interchange коды от 0 до 31 функциональные клавиши коды от 128 до 255 национальный алфавит коды от 32 до 127 буквы английского алфавита, знаки математических операций и т.д
  • 7.
    (с) Чугунов А.С.,2015 Таблица кодировки Unicode Стандарт кодирования Unicode отводит на каждый символ 2 байта, что позволяет закодировать многие алфавиты в одной таблице. N=2I=216=65 536
  • 8.
    (с) Чугунов А.С.,2015 Таблицы кодировки русскоязычных символов- код обмена информации 8-битныйКОИ8-Р CP1251 CP866 Mac ISO
  • 9.
    Список сайтов (с) ЧугуновА.С., 2015 http://yandex.ru/images/search?text=%D0%BA%D0%BE%D0%B4%D0% BE%D0%B2%D0%B0%D1%8F%20%D1%82%D0%B0%D0%B1%D0% BB%D0%B8%D1%86%D0%B0&stype=image&lr=213&noreask=1&sour ce=wiz&uinfo=sw-1366-sh-768-ww-1287-wh-704-pd-1-wp- 16x9_1366x768-lt-443 https://ru.wikipedia.org/wiki/Windows- 1253#.D0.A2.D0.B0.D0.B1.D0.BB.D0.B8.D1.86.D1.8B http://citforum.ru/internet/webd/article_20.shtml