Теория недели 10.09 - 15.09.2012

 


Алфавитный подход к измерению информации

Алфавитный подход к измерению информации позволяет определить количество информации, заключенной в тексте. Алфавитный подход является объективным, т.е. он не зависит от субъекта (человека), воспринима­ющего текст.

Множество символов, используемых при записи текста, на­зывается алфавитом. Полное количество символов в алфавите называется мощностью (размером) алфавита.

Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то

2i =N

где i – информационный вес одного символа в используемом алфавите,

N – мощность алфавита.

Если весь текст состоит из К символов, то при алфавитном подходе размер содержащейся в нем информации равен:

I = К × i,

Задача: Какой объём информации содержат 3 символа 16 – символьного алфавита?

Решение: Так как каждый символ алфавита мощностью 16 знаков можно закодировать с помощью четырёхзначного двоичного кода, каждый символ исходного алфавита весит 4 бита.

Так как всего использовали 3 символа алфавита мощностью 16 символов, следовательно: 4 бит • 3 = 12 бит

Ответ: объём информации записанный 3 знаками алфавита мощностью 16 символов равен 12 бит.

Задача. Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице – 40 строк, в каждой строке – 60 символов. Каков объем информации в книге?

Решение. Мощность компьютерного алфавита равна 256. Один символ несет 1 байт информации. Значит, страница содержит 40 х 60 = 2400 байт информации. Объем всей информации в книге (в разных единицах):

2400 х 150 = 360 000 байт.

360000/1024 = 351,5625 Кбайт.

351,5625/1024 = 0,34332275 Мбайт.

 

1 байт = 23 бит = 8 бит

1 килобайт (Кб) = 2 10 байт = 1024 байт

1 мегабайт (Мб) = 1024 Кб

1 гигабайт (Гб) = 1024 Мб

1 терабайт (Тб) = 1024 Гб

Домашнее задание:

 

1. Одно племя имеет 32-символьный алфавит, а второе племя – 64-символьный алфавит. Вожди племен обменялись письмами. Письмо первого племени содержало 80 символов, а письмо второго племени – 70 символов. Сравните объем информации, содержащийся в письмах.

2. Имеется 2 текста на разных языках. Первый текст использует 32-символьный алфавит и содержит 200 символов, второй – 16-символьный алфавит и содержит 250 символов. Какой из текстов содержит большее количество информации и на сколько бит?

3. Оцените, сколько школьных сочинений размером в 2 машинописные страницы (в одной странице 40 строк по 50 символов в одной строке) можно уместить на гибком диске ёмкостью 1,44 Мб?