Одно и то же сообщение может нести много информации для одного человека и не нести её совсем для другого человека. При таком подходе количество информации определить однозначно затруднительно.
Алфавитный подход позволяет измерить информационный объём сообщения, представленного на некотором языке (естественном или формальном), независимо от его содержания.
Для количественного выражения любой величины необходима, прежде всего, единица измерения. Измерение осуществляется путём сопоставления измеряемой величины с единицей измерения. Сколько раз единица измерения «укладывается» в измеряемой величине, таков и результат измерения.
При алфавитном подходе считается, что каждый символ некоторого сообщения имеет определённый информационный вес — несёт фиксированное количество информации. Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита. Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется 1 бит.
Как сделать презентацию в СhatGPT: пошаговая инструкция
Обратите внимание, что название единицы измерения информации «бит» (bit) происходит от английского словосочетания binary digit — «двоичная цифра».
За минимальную единицу измерения информации принят 1 бит. Считается, что таков информационный вес символа двоичного алфавита.
1.6.2. Информационный вес символа произвольного алфавита
Ранее мы выяснили, что алфавит любого естественного или формального языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита N связана с разрядностью двоичного кода i, требуемой для кодирования всех символов исходного алфавита, соотношением: N = 2 i .
Разрядность двоичного кода принято считать информационным весом символа алфавита. Информационный вес символа алфавита выражается в битах.
Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2 i .
Задача 1. Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?
Решение. Составим краткую запись условия задачи.
Известно соотношение, связывающее величины i и N : N = 2 i .
С учётом исходных данных: 8 = 2 i . Отсюда: i = 3.
Полная запись решения в тетради может выглядеть так:
1.6.3. Информационный объём сообщения
Информационный объём сообщения (количество информации в сообщении), представленного символами естественного или формального языка, складывается из информационных весов составляющих его символов.
Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i;I = К • i.
Задача 2. Сообщение, записанное буквами 32-символьного алфавита, содержит 140 символов. Какое количество информации оно несёт?
Задача 3. Информационное сообщение объёмом 720 битов состоит из 180 символов. Какова мощность алфавита, с помощью которого записано это сообщение?
Пакеты прикладных программ — Создание Web-сайтов
1.6.4. Единицы измерения информации
В наше время подготовка текстов в основном осуществляется с помощью компьютеров. Можно говорить о «компьютерном алфавите», включающем следующие символы: строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки и др. Такой алфавит содержит 256 символов.
Поскольку 256 = 2 8 , информационный вес каждого символа этого алфавита равен 8 битам. Величина, равная восьми битам, называется байтом. 1 байт — информационный вес символа алфавита мощностью 256.
1 байт = 8 битов
Бит и байт — «мелкие» единицы измерения. На практике для измерения информационных объёмов используются более крупные единицы:
1 килобайт = 1 Кб = 1024 байта = 2 10 байтов
1 мегабайт = 1 Мб = 1024 Кб = 2 10 Кб = 2 20 байтов
1 гигабайт = 1 Гб = 1024 Мб = 2 10 Мб = 2 20 Кб = 2 30 байтов
1 терабайт = 1 Тб = 1024 Гб = 2 10 Гб = 2 20 Мб = 2 30 Кб = 2 40 байтов
Задача 4. Информационное сообщение объёмом 4 Кбайта состоит из 4096 символов. Каков информационный вес символа используемого алфавита? Сколько символов содержит алфавит, с помощью которого записано это сообщение?
Ответ: 8 битов, 256 символов.
Задача 5. В велокроссе участвуют 128 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер цепочкой из нулей и единиц минимальной длины, одинаковой для каждого спортсмена. Каков будет информационный объём сообщения, записанного устройством после того, как промежуточный финиш пройдут 80 велосипедистов?
Решение. Номера 128 участников кодируются с помощью двоичного алфавита. Требуемая разрядность двоичного кода (длина цепочки) равна 7, так как 128 = 2 7 . Иначе говоря, зафиксированное устройством сообщение о том, что промежуточный финиш прошёл один велосипедист, несёт 7 битов информации. Когда промежуточный финиш пройдут 80 спортсменов, устройство запишет 80 • 7 = 560 битов, или 70 байтов информации.
Ответ: 70 байтов.
Самое главное.
При алфавитном подходе считается, что каждый символ некоторого сообщения имеет опредёленный информационный вес — несёт фиксированное количество информации.
1 бит — минимальная единица измерения информации.
Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2 i .
Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i: I = K•i.
1 байт = 8 битов.
Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (210) раза.
Вопросы и задания.
1.Ознакомтесь с материалами презентации к параграфу, содержащейся в электронном приложении к учебнику. Используйте эти материалы при подготовке ответов на вопросы и выполнении заданий.
Источник: murnik.ru
Информационный объём сообщения
Используя только что построенный трёхбитный код, наше сообщение можно записать так:
М | А | М | А | М | Ы | Л | А | Р | А | М | У |
Длина такого сообщения – 14 × 3 = 42 символа в двоичном коде, поэтому его информационный объём – 42 бита.
При равномерном кодировании информационный объем сообщения вычисляется по формуле I = L × i где L – длина сообщения (количество символов), а i – информационный объём одного символа. |
Если бы наше сообщение было закодировано с помощью 8-битного кода, его информационный объём был бы равен 14 × 8 = 112 битов. Для 16-битного кода получаем 14 × 16 = 224 бита.
Наверное, вы задаёте себе вопрос: зачем же нужна 16-битная кодировка, которая намного увеличивает объём текста (и время его передачи по сети!). Дело в том, что с её помощью, можно закодировать значительно больше символов, чем, например, в 8-битной кодировке. Это позволяет использовать в одном документе русские и французские буквы, китайские иероглифы и др.
Задачи
Задача 1. Определить информационный объём сообщения
ПРИВЕТ ОТ СТАРЫХ ШТИБЛЕТ!
при использовании 16-битной кодировки.
Решение. В этом сообщении 25 символов (считая 3 пробела и восклицательный знак!). Каждый из них занимает 16 битов, поэтому информационный объём сообщения равен
25 × 16 = 400 битов = 400: 8 байтов = 50 байтов.
Если сообразить, что 16 битов = 2 байта, сразу получим
25 × 2 = 50 байтов.
Ответ: 50 байтов.
Задача 2. Решить задачу 1 при условии, что используется кодировка с минимальным количеством битов на символ.
Решение. В этом сообщении используется всего 17 различных символов (П, Р, И, В, Е, Т, О, С, А, Ы, Х, Ш, И, Б, Л,! и пробел). Для того, чтобы присвоить им различные коды, нужно использовать для каждого кода не менее 5 битов (4 бита дадут только 16 вариантов, а 5 битов – 32 варианта). Поэтому информационный объём текста при таком кодировании равен
25 × 5 = 125 битов.
Ответ: 125 битов.
Нужно учитывать, что при использовании такого кода вместе с кодами символов необходимо передать и словарь (соответствие кода конкретном символу). Объём 125 битов вычислен без учёта словаря.
Задача 3. Определить информационный объем (в Кбайтах) брошюры, в которой 10 страниц текста. На каждой странице 32 строки по 64 символа в каждой, используется 8-битная кодировка.
Решение. Сначала определим количество символов на странице:
32 × 64 = 2 5 × 2 6 = 2 11 .
Теперь находим общее количество символов в книге: L = 10 × 2 11 символов.
Так как используется 8-битная кодировка, каждый символ занимает 8 битов или 1 байт. Поэтому информационный объём текста 10 × 2 11 байтов. Переведём это значение в килобайты:
Ответ: 20 Кбайт.
Во многих задачах на определение количества информации можно значительно упростить вычисления, если записывать все величины как степени числа 2. |
- Что такое информационный объём текста? Зачем и как его вычисляют?
- Что такое алфавит? Как используемый алфавит влияет на информационный объём текста?
- Что такое сообщение?
- Зачем текст представляют в двоичном коде?
- Что такое равномерный код?
- Как вы себе представляете неравномерный код? В чём могут быть его достоинства и недостатки?
- Как связаны мощность алфавита и информационный объём текста?
- Какие вы знаете кодировки текста, используемые в компьютерной технике?
- В чём вы видите достоинства и недостатки 16-битных кодировок?
- Как определяют, какой именно символ соответствует некоторому коду?
- Зачем при использовании нестандартной кодировки нужно передавать словарь? Как это изменит длину сообщения?
- Как бы вы предложили закодировать словарь для нестандартной кодировки?
- Зачем нужны международные стандарты?
- Что такое ASCII?
- Как вычислить информационный объём сообщения?
- Какое минимальное число битов на символ надо выделить в памяти, если требуется использовать не менее 100 символов одновременно?
- Сколько различных символов можно использовать при 9-битном коде (на каждый символ отводится 9 битов)?
- Определите, чему равен информационный объём (в байтах) следующего высказывания Рене Декарта, закодированного с помощью 16-битной кодировки:
Источник: mydocx.ru
2. Информационный объём
Информационный объём (1) сообщения вычисляется по формуле: (I = К · i), где (I) — информационный объем сообщения, (K) — количество символов в сообщении, (i) — информационный вес одного символа.
Вес одного символа, набранного на компьютере, зависит от того, какую кодировку используют. Чаще всего используется восьмиразрядная кодировка, т. е. один символ «весит» (8) бит. Может использоваться шестнадцатиразрядная кодировка. Один символ при этом будет кодироваться (16) -ю битами.
1. Найди информационный объём следующего сообщения, если известно, что один символ кодируется одним байтом.
Кто владеет информацией, тот владеет миром.
Решение: посчитаем количество символов в сообщении, будем учитывать буквы, знаки препинания и пробелы.
Всего (43) символа. Каждый символ кодируется (1) байтом.
(I = К · i), (43 · 1) байт (= 43) байта.
Ответ: (43) байта.
2. Найди информационный объём слова из (12) символов в кодировке Unicode (каждый символ кодируется двумя байтами). Ответ дайте в битах.
Мы знаем из условия задачи, что каждый символ кодируется двумя байтами. Найдём сколько это бит.
(2) байта (· 8 = 16) бит;
Слово состоит из (12) символов, поэтому
(16) бит (· 12) символов (= 192) бита.
Ответ: (192) бита.
3. Найди информационный вес книги, которая состоит из (700) страниц, на каждой странице (70) строк и в каждой строке (95) символов . Мощность алфавита — (256) символов. Ответ дать в Мб.
Источник: www.yaklass.ru