Существует несколько подходов к измерению информации, алфавитный подход, является объективным, т.е. не зависит от субъекта (человека), воспринимающего текст, его знаний о предмете сообщения. Объём зависит от количества символов в сообщении и количества информации, которую несет один символ.
Множество символов, используемых при записи текста (чисел, графики, звука и т.д.), называется алфавитом. Полное количество символов в алфавите называется мощностью (размером) алфавита. Если допустить, что все символы алфавита встречаются с одинаковой частотой (равновероятно), то количество информации, которое несет каждьiй символ, вычисляется по формуле:
i = log2N, где N - мощность алфавита.
Следовательно, в 2-х символьном алфавите каждый символ «весит» 1 бит (log22 = 1); в 4-х символьном алфавите каждый символ несет 2 бита информации (log24 = 2); в 8-ми символьном - 3 бита (log28 = 3) и т.д.
Один символ из алфавита мощностью 256 (28) несет в тексте 8 бит информации. Такое количество информации называется байт. Алфавит из 256 символов используется для представления текстов в компьютере.
1 байт = 8 бит.
Если весь текст состоит из К символов, то при алфавитном подходе размер содержащейся в нем информации равен:
I=K х i, где i - информационный вес одного символа в используемом алфавите.
Для измерения информации используются и более крупные единицы:
1 KB (килобайт) = 210 байт = 1024 байта
1 МB (мегабайт) = 210 Кбайт = 1024 Кбайта
1 GB (гигабайт) = 210 Мбайт
1 TB (терабайт) = 210 Гбайт
1 PB (петабайт) = 210 Tбайт
1 EB (эксабайт) = 210 Пбайт
1 ZB (зеттабайт) = 210 Эбайт
1 YB (йоттабайт) = 210 Збайт
Примеры решения задач по теме кодирование
Пример 1.
Сколько существует различных последовательностей из символов «плюс» и «минус», длиной ровно в 5 символов?
Решение.
Различных комбинаций из символов «плюс» и «минус» существует ровно столько же, сколько и соответствующих двоичных кодов той же длины, то есть 25 = 32.
Ответ 32.
Пример 2.
Сколько мегабайт информации содержит сообщение объёмом 223 бит?
Решение:
Поскольку 1 байт=8 битам=23битам, то 223бит=210*210*23бит=210*210байт=210Кбайт=1Мбайт.
Ответ: 1 Мбайт
Пример 3.
Обычный дорожный светофор без дополнительных секций подает шесть видов сигналов (непрерывные красный, желтый и зеленый, мигающий желтый, мигающий зеленый, мигающие красный и желтый одновременно). Электронное устройство управления светофором последовательно воспроизводит записанные сигналы. Подряд записано 100 сигналов светофора. Сколько составляет В байтах данный информационный объем.
Решение. Для кодирования шести различных состояний достаточно 3-х битов (при этом две комбинации даже остаются невостребованными). К этому выводу можно прийти, воспользовавшись формулой I = log2N, где I – информационный объем одного символа, N – мощность алфавита. В нашем случае N=6, т.к. светофор подает 6 различных сигналов. I = log26 ? 3. Таким образом, 100 сигналов кодируется 300 битами. Делим это число на 8 (1 байт = 8 бит) и округляем в большую сторону (дробных байтов не бывает). Получаем 38 байтов.
Ответ 38 байт.
Упражнения
-
Скорость передачи данных через АDSL-соединение равна 512 Кбит/с. Передача файла через данное соединение заняла 4 минуты. Определите размер файла в мегабайтах.
- ДНК человека (генетический код) можно представить себе как некоторое слово в четырех буквенном алфавите, где каждой буквой помечается звено цепи ДНК, или нуклеотид. Сколько информации (в битах) содержит ДНК человека, содержащий примерно 1,5 х 1023 нуклеотидов?
- Световое табло состоит из лампочек, каждая из которых может находиться в двух состояниях («включено» или «выключено»). Какое наименьшее количество лампочек должно находиться на табло, чтобы с его помощью можно было передать 50 различных сигналов?
- Игровое клетчатое поле состоит из 15-ти строк и 5-ти столбцов. Партия записана последовательностью из 10 координат, соответствующим ходам игроков по клеткам. Какой объем информации в битах несет эта запись, если для кодирования координат одной клетки поля использовали двоичный код наименьшей длины?
- Электронное устройство приемника должно воспринимать и воспроизводить 6 двоичных сигналов, которые закодированы двоичным кодом минимальной длины. Устройство приняло 160 сигналов, каков объем данного информационного сообщения в байтах?
- Электронное устройство приемника должно воспринимать и воспроизводить 11 двоичных сигналов, которые закодированы двоичным кодом минимальной длины. Сколько сигналов приняло устройство, если объем информационного сообщения 100 байт?
- В некоторой стране автомобильный номер состоит из 7 символов. В качестве символов используют 18 различных букв и десятичные цифры в любом порядке. Каждый такой номер в компьютерной программе записывается минимально возможным и одинаковым целым количеством байтов, при этом используют посимвольное кодирование и все символы кодируются одинаковым и минимально возможным количеством битов. Определите объем памяти в байтах, отводимый этой программой для записи 60 номеров.
- Сколько мегабайт информации содержит сообщение объемом 223 бит?
- Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере равна 256. Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту.
- Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мбайта. Каков размер алфавита, с помощью которого записано сообщение?
- Односторонняя дискета имеет объем 180 Кбайт. Сколько дорожек будет на диске, если каждая из них содержит 9 секторов, а в каждом секторе размещается по 1024 символа из 16-ти символьного алфавита?
- Текст, записанный с помощью 16-ти символьного алфавита, занимает 10 полных секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит этот текст?
- Скорость чтения ученика 10 класса составляет приблизительно 250 символов в минуту. Приняв мощность используемого алфавита за 64, определите, какой объем информации в килобайтах получит ученик, если он будет непрерывно читать в течение 40 минут.