Автор: Пользователь скрыл имя, 12 Февраля 2012 в 15:47, лекция
Понятие количества информации. Единицы измерения количества информации
Язык как способ представления информации
Кодирование информации
3.1Понятие кодирования и декодирования
3.2 Двоичное кодирование текстовой информации
3.3 Аналоговые и дискретные способы представления изображения и звука
3.4 Двоичное кодирование графической информации
3.5 Двоичное кодирование звуковой информации
Тема: Двоичное кодирование текстовой, графической и звуковой информации.
План
Вопрос 1: Понятие количества информации. Единицы измерения информации.
Для
количественного выражения
?За единицу количества информации принимается такое сообщение, уменьшающее неопределенность в два раза. Такая единица названа «бит» - от англ. Binary digit – двоичный код – сокращенно bit.
Минимальной единицей измерения количества информации является бит, а следующей по величине единицей является байт, причем 1 байт=23 = 8 бит.
В
информатике система
?Так, кратные байту единицы измерения количества информации вводятся следующим образом:
1 байт = 8 бит
1 Кбайт (килобайт) = 210 байт(1024) = 213 бит;
1 Мбайт (мегабайт) = 210 (1024) Кбайт =220 (1048576) байт=223 бит;
1 Гбайт (гигабайт) = 210 (1024) Мбайт = 220 Кб = 230 байт =233 бит;
1Тб (терабайт)
= 210 Гб = 220
Мб = 230
Кб = 240
байт =243
бит.
Вопрос 2: Язык как способ представления информации: естественные и формальные языки
Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, и др.), то есть информация представляется с помощью естественных языков. В основе языка лежит алфавит, то есть набор символов (знаков), которые человек различает по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов).
Последовательности
символов алфавита в соответствии с
правилами грамматики образуют основные
объекты языка – слова. Правила, согласно
которых образуются предложения из слов
данного языка, называются синтаксисом.
Необходимо отметить, что в естественных
языках грамматика и синтаксис языка формулируются
с помощью большого количества правил,
из которых существуют исключения, так
как и такие правила складывались исторически.
Наряду с естественными языками были разработаны
формальные языки (системы счисления,
язык алгебры, языки программирования
и др.). Основное отличие формальных
языков от естественных состоит в наличии
строгих правил грамматики и синтаксиса.
Например, системы счисления можно рассматривать
как формальные языки, имеющие алфавит
(цифры) и позволяющие не только именовать
и записывать объекты (числа), но и выполнять
над ними арифметические операции по строго
определенным правилам. Некоторые языки
используют в качестве знаков не буквы
и цифры, а другие символы, например химические
формулы, ноты, изображения элементов
электрических или логических схем, дорожные
знаки, точки и тире (код азбуки Морзе и
др.)
Вопрос 3: Кодирование информации
3.1 Понятие кодирования и декодирования
Представление информации может осуществляться с помощью языков, которые являются знаковыми системами. Каждая знаковая система строится на основе определенного алфавита и правил выполнения операций над знаками.
?Преобразование информации из одной формы представления (знаковой системы) в другую называется кодированием. Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем. В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. При вводе знака алфавита в компьютер путем нажатия соответствия клавиши на клавиатуре происходит кодирование знака, то есть преобразование его в компьютерный код. При выводе знака на экран монитора или принтер происходит обратный процесс – декодирование, когда из компьютерного кода знак преобразуется в его графическое изображение.
В
компьютере для представления информации
используется двоичное
кодирование. Все виды
информации в компьютере кодируются на
машинном языке, в виде логических последовательностей
нулей и единиц. Каждая цифра
машинного двоичного
кода несет количество информации, равное
одному биту. Для кодирования одного
символа требуется 1
байт информации.
3.2 Двоичное
кодирование текстовой
Для кодирования одного символа используется количество информации, равное 1 байту, то есть I = 1 байт = 8 битов. Для кодирования одного символа требуется - 1 байт информации.
Если
рассматривать символы как
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертаниям, а компьютер — по их кодам. В процессе вывода символа на экран компьютера производится обратный процесс — декодирование, то есть преобразование кода символа в его изображение. Присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице.
В настоящее время существуют пять различных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO — табл. 2.3), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой. Широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, поэтому с его помощью можно закодировать не 256 символов, а N = 2 16 = 65536 различных символов. Эту кодировку поддерживают последние версии платформы Microsoft Windows (начиная с 1997 года).
3.3 Аналоговый
и дискретный способы
Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно. Примером аналогового представления графической информации может служить, например, живописное полотно, цвет которого изменяется непрерывно, а дискретного — изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета. Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью). Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.
Дискретизация
— это преобразование
непрерывных изображений
и звука в набор дискретных
значений в форме кодов.
3.4 Двоичное
кодирование графической
Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые в свою очередь содержат определенное количество точек (пикселей). Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается. Чем больше разрешающая способность, то есть чем больше количество строк растра и точек в строке, тем выше качество изображения. В современных персональных компьютерах обычно используются три основные разрешающие способности экрана: 800 х 600, 1024 х 768 и 1280 х 1024 точки. Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки, хранящимся в видеопамяти. Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемым для кодирования цвета точки. Наиболее распространенными значениями глубины цвета являются 8, 16, 24 или 32 бита. Качество двоичного кодирования изображения определяется разрешающей способностью экрана и глубиной цвета. Каждый цвет можно рассматривать как возможное состояние точки, тогда количество цветов, отображаемых на экране монитора, может быть вычислено по формуле (2.1): N = 21, где I — глубина цвета (табл. 1.).
Таблица 1.
Глубина цвета
и количество отображаемых
цветов
Глубина цвета (/) | Количество отображаемых цветов (I/) |
8 | 28 = 256 |
16 (High Color) | 216 = 65 536 |
24 (True Color) | 224= 16 777 216 |
32 (True Color) | 232 = 4 294 967 296 |
Графический режим вывода
Рассчитаем необходимый объем видеопамяти для одного из графических режимов, например, с разрешением 800 х 600 точек и глубиной цвета 24 бита на точку.
Всего точек на экране: 800 ■ 600 = 480 000.
Необходимый объем видеопамяти:
24 бит • 480 000 = 11 520 000 бит = 1 440 000 байт =
= 1406,25 Кбайт = 1,37 Мбайт.
Задание:
Используются графические
режимы с глубинами
цвета 8, 16, 24 и 32 бита.
Вычислить объемы
видеопамяти, необходимые
для реализации данных
глубин цвета при
различных разрешающих
способностях экрана.
3.5 Двоичное
кодирование звуковой
Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц). В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.
Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле (2.1):
Информация о работе Двоичное кодирование текстовой, графической и звуковой информации