Методическая разработка по подготовке к ЕГЭ
Кодирование текстовой информации. Кодировка ASCII. Основные кодировки кириллицы.
Наумчик Н.В.
Что нужно знать:
все символы кодируются одинаковым числом бит (алфавитный подход)
чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные)
при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта
после знака препинания внутри (не в конце!) текста ставится пробел
чтобы найти информационный объем текста I, нужно умножить количество символов N на число бит на символ K:
две строчки текста не могут занимать 100 Кбайт в памяти
пример задания:
Определите информационный объем текста в битах
Бамбарбия! Кергуду!
Решение:
в этом тексте 19 символов (обязательно считать пробелы и знаки препинания)
если не дополнительной информации, считаем, что используется 8-битная кодировка (чаще всего явно указано, что кодировка 8- или 16-битная)
поэтому в сообщении 19*8 = 152 бита информации
пример задания:
В таблице ниже представлена часть кодовой таблицы ASCII:
Символ 1
5
A
B
Q
a
b
Десятичный код
49
53
65
66
81
97
98
Шестнадцатеричный код
31
35
41
42
51
61
62
Каков шестнадцатеричный код символа «q» ?
Решение:
в кодовой таблице ASCII (American Standard Code for Information Interchange, американский стандартный код для обмена информацией) все заглавные латинские буквы A-Z расставлены по алфавиту, начиная с символа с кодом 65=4116
все строчные латинские буквы a-z расставлены по алфавиту, начиная с символа с кодом 97=6116
отсюда следует, что разница кодов букв «q» и «a» равна разнице кодов букв «Q» и «A», то есть, 5116 – 4116=1016
тогда шестнадцатеричный код символа «q» равен коду буквы «a» плюс 1016
отсюда находим 6116 + 1016=7116.
пример задания:
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?
Решение:
1. обозначим количество символов через N
2. при 16-битной кодировке объем сообщения – 16*N бит
3. когда его перекодировали в 8-битный код, его объем стал равен– 8*N бит
4. таким образом, сообщение уменьшилось на 16*N – 8*N = 8*N = 480 бит
5. отсюда находим N = 480/8 = 60 символов.
Условия задач взяты с сайта К.Полякова