Алфавитный подход к определению количества информации

Автор: Пользователь скрыл имя, 17 Декабря 2010 в 23:04, реферат

Описание работы

При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.
Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.

Работа содержит 1 файл

Завтра я буду счастлив.doc

— 37.50 Кб (Скачать)

 Алфавитный подход к определению количества информации

   Однако  любое техническое устройство не воспринимает содержание информации.Поэтому  в вычислительной технике используется другой подход к определению количества информации. Он называется алфавитным подходом.

При алфавитном подходе  к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как  последовательность знаков определенной знаковой системы.  
Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.  
      Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами.    

  Алфавит - множество  символов, используемых  при записи текста.        

 Мощность (размер) алфавита - полное количество символов в алфавите.     

 Будем обозначать  эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54.  
      Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. В действительности это не совсем так, но для упрощения примем такое предположение. В каждой очередной позиции текста может появиться любой из N символов.         Тогда, согласно известной нам формуле N = 2I (см.
содержательный подход) каждый такой символ несет I бит информации, которое можно определить из решения уравнения: 2I = 54. Получаем: I = 5.755 бит - такое количество информации несет один символ в русском тексте.    

 Чтобы найти  количество информации во всем  тексте, нужно посчитать число  символов в нем и умножить  на I. 
      Посчитаем количество информации на одной странице книги. Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит, на странице умещается 50x60=3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит.           

  При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита.    

 Таким образом,  алфавитный подход к измерению  информации можно изобразить  в виде таблицы: 
 

   При определении количества информации на основе уменьшения неопределенности наших знаний мы рассматриваем информацию с точки зрения содержания, ее понятности и новизны для человека. С этой точки зрения в опыте по бросанию монеты одинаковое количество информации содержится и в зрительном образе упавшей монеты, и в коротком сообщении "Орел", и в длинной фразе "Монета упала на поверхнПри использовании двоичной системы (алфавит состоит из двух знаков: 0 и 1) каждый двоичный знак несет 1 бит информации.     

 Применение алфавитного  подхода удобно, прежде всего,  при использовании технических  средств работы с информацией.  В этом случае теряют смысл  понятия «новые - старые», «понятные - непонятные» сведения.     

 Алфавитный подход является объективным способом измерения информации в отличие от субъективного содержательного подхода.     

 Удобнее всего  измерять информацию, когда размер  алфавита N равен целой степени двойки. Например, если N=16, то каждый символ несет 4 бита информации потому, что 24 = 16. А если N =32, то один символ «весит» 5 бит.     

 Ограничения на  максимальный размер алфавита  теоретически не существует. Однако  есть алфавит, который можно  назвать достаточным. С ним мы встречались при рассмотрении  темы "Кодирование текствовой информации". Это алфавит мощностью 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания....  
Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название - байт.  
1 байт = 8 бит.

Для измерения больших  объемов информации используются следующие  единицы:

 
 
 

1 Кб  (один килобайт)= 1024 байт=210байт 
1 Мб  (один мегабайт)= 1024 Кб=210Кбайт=220байт 
1 Гб  (один гигабайт)= 1024 Мб=210Mбайт=230байт 
1Тбайт (один терабайт)=210Гбайт=1024Гбайт=240байт 
1Пбайт(один петабайт)=210Тбайт=1024Тбайт=250байт 
1Эбайт(один экзабайт)=210Пбайт=1024Пбайт=260байт 
1Збайт(один зетабайт)=210Эбайт=1024Эбайт=270байт 
1Йбайт(один йотабайт)=210Збайт=1024Збайт=280байт.

   ость  земли той стороной вверх, на которой  изображен орел".

   .  

   Так, в русском алфавите, если не использовать букву ё, количество событий (букв) будет  равно 32. Тогда:

   32 = 2I, откуда I = 5 битов.

   Каждый  символ несет 5 битов информации (его  информационная емкость равна 5 битов). Количество информации в сообщении можно подсчитать, умножив количество информации, которое несет один символ, на количество символов.

Информация о работе Алфавитный подход к определению количества информации