Автор: Пользователь скрыл имя, 29 Октября 2011 в 19:08, курсовая работа
На современном этапе экономического развития страны одной из важнейших, наиболее острых и неотложных проблем является качество и надежность продукции и работ (услуг). Немаловажное место в этой проблеме занимает повышение качества и надежности разработок в области создания экономических информационных систем (ЭИС), используемых в различных сферах деятельности: обработки данных, проектирования, научных исследований и т.п., поскольку от прогрессивности создаваемых проектов ЭИС в значительной мере зависит научно-технических прогресс.
ВВЕДЕНИЕ………………………………………………………………….. 3
Глава 1. Понятие информации……………………………………………..5
1.1 Количественные и качественные характеристики информации… 10
1.2.1 Качественные характеристики информации……………………....10
1.2.2 Количественные характеристики информации…………………...12
Глава 2. Анализ качества баз данных ……………………………………29
ЗАКЛЮЧЕНИЕ ……….……………………………………………………36
Список используемой литературы ..……………………………………..40
Учитывая, что исходная функция х(t) непрерывна и может изменяться в неограниченных пределах, найдем энтропию непрерывного сообщения как сумму энтропии отсчетов в виде
Второе слагаемое содержит член log2 Δх, который не рассчитывается, так как с уменьшением Δх он может стать бесконечно большой величиной. Обычно определяют так называемую дифференциальную или приведенную энтропию в виде
Таким образом, понятие энтропии применимо и для оценки среднего количества информации, которая содержится в непрерывном сообщении Однако пользоваться выражением энтропии для непрерывных сообщений следует крайне осторожно, учитывая неопределенность второго слагаемого выражения, особенно при малых значениях шага квантования Δх,
В целом в отношении энтропии непрерывного сообщения можно сделать следующие выводы:
1. Дифференциальная энтропия определяется статистикой отсчетов непрерывной функции Можно показать, что при постоянной дисперсии отсчетов наибольшее количество информации соответствует непрерывным сообщениям, отсчеты которых распределяются по нормальному закону,
2 Энтропия зависит от амплитуды исходной непрерывной функции х и шага ее квантования Δх. На практике реализуют системы с равномерным и неравномерным шагом квантования, с передачей отклонения функции от математического ожидания и др.
Это позволяет в конкретных условиях повысить скорость передачи информации в непрерывном канале.
Таким образом, статистическая теория позволяет дать плодотворные оценки количества информации для такого важного этапа информационного процесса в системе, как передача. Заложенные еще К. Шенноном принципы количественной оценки на основе функции энтропии сохраняют свою значимость до настоящего времени и являются полезными при определении информативности символов и сообщений и при оценке оптимальности построения кода на основе критериев избыточности.
В современных системах обработки информации и управления существенное место занимает подготовка информации для принятия решения и сам процесс принятия решения в системе. Здесь существенную помощь может оказать семантическая теория, позволяющая понять смысл и содержание информации, выражаемой на естественном языке. С увеличением объема и сложности производства количество информации, необходимое для принятия безошибочного решения, непрерывно возрастает. В этих условиях необходимо осуществлять отбор информации по некоторым критериям, т.е. предоставлять руководителю либо лицу, принимающему решение, своевременную и полезную информацию С учетом ошибок, которые могут возникать в информации в связи с действиями оператора, отказами технических средств в др., избыточность допускается лишь как средство борьбы с ошибками. В этом смысле можно считать, что избыточность способствует сохранению ценности информации, обеспечивая требуемую верность. В рамках семантического подхода ценность информации можно задать через функцию потерь. Если в процессе подготовки информации исходная величина х отображается через величину у, то минимум потерь можно установить как
где Р(х) — распределение входной величины х; П (х/у) — потери при преобразовании входной величины х в величину у.
Отсюда ценность информации определяется как
где М{П(х/у)} — математическое ожидание потерь при отклонении от входной величины х к величине у.
Следует
отметин, что данная интерпретация
ценности имеет сугубо технический
характер. Конструктивным выходом из
нее является такое разбиение входной
величины х, при котором удается максимизировать
ценность. В общем случае ценность информации,
поступающей от материального объекта,
является функцией времени. Анализ информации,
используемой для принятия решения в реальных
системах, позволил найти функции ценности.
Эти функции задают предельные временные
интервалы, в течение ко-. торых имеет смысл
использовать данную информацию. При принятии
решения обычно используется информация
не только о материальном объекте, но и
об условных распределениях критериальных
оценок последствий различных альтернативных
решений. В этом случае резко уменьшается
число предпочтительных альтернатив и
удается принять решение, базируясь на
качественно неполной информации, В ряде
практических случаев решение принимается
с использованием субъективных критериев,
при этом приходится применять большой
объем информации, ужесточать требования
к согласованности и непротиворечивости
исходной информации. Принцип принятия
решений по своей методологии требует
сохранения содержания качественных понятий
на всех этапах использования информации,
при общей оценке альтернативных решений
Кроме того, исключается сложная информация,
при работе с которой лицо, принимающее
решение, должно иметь дело с громоздкими
задачами. Используют замкнутые процедуры
выявления предпочтений, т.е. процедуры,
в которых имеется возможность проверить
предпочтение на непротиворечивость и
транзитивность. Можно отметить, что семантическая
теория требует дальнейшей серьезной
проработки, однако уже сейчас при принятии
решений существует ряд методов, позволяющих
оценивать смысловое содержание информации.
Глава 2. Анализ качества баз данных..
Для анализа свойств баз данных предлагается выделять характеристики качества системы управления базой данных и содержащейся в ней информации. Состав этих характеристик рекомендуется систематизировать на основе требований международного стандарта ISO 9126.
Современные базы данных — один из тех объектов в сфере информатизации, от которых иногда требуется особенно высокое качество и наличие возможности его оценки. Но что означает качество баз данных, какие требования следует предъявлять к их качеству, какими характеристиками можно описывать качество, как их оценивать и измерять? Для этого могут быть полезны методы и стандарты, разработанные для анализа сложных программных средств.
При комплексном анализе качества баз данных не всегда удается четко разделить требования и значения характеристик качества для каждого из этих объектов. Одна СУБД может обрабатывать различные по структуре, составу и содержанию данные, а одни и те же данные могут управляться различными СУБД. При анализе качества баз данных целесообразно рассматривать два компонента: систему программ управления данными и совокупность данных, упорядоченных по некоторым правилам. Хотя эти компоненты тесно взаимодействуют при реализации конкретной базы данных, первоначально они создаются независимо и могут рассматриваться в своем жизненном цикле как два объекта, которые различаются:
номенклатурой
и содержанием показателей
технологией и средствами автоматизации разработки и обеспечения всего жизненного цикла объекта;
категориями специалистов, обеспечивающих создание, эксплуатацию или применение баз данных;
комплектами эксплуатационной и технологической документации, поддерживающими жизненный цикл объекта.
Практически
весь набор характеристик и
Различия требований к характеристикам качества привели к созданию широкого спектра локальных, специализированных и распределенных СУБД. В зависимости от области применения, приоритет при оценке качества может отдаваться различным конструктивным характеристикам: надежности и защищенности применения (финансовая сфера), удобству использования малоквалифицированными пользователями (социальная сфера), эффективности использования ресурсов (сфера материально-технического снабжения). Однако практически во всех случаях сохраняется некоторая роль других конструктивных показателей качества — для каждого из них необходимо оценивать его приоритет для конкретной сферы применения, меры и шкалы необходимых и допустимых характеристик качества.
В системах баз данных доминирующее значение приобретают сами данные, их хранение и обработка. Для оценивания качества информации может применяться общий методический подход к выделению адекватной номенклатуры стандартизированных в ISO 9126 базовых характеристик и субхарактеристик. Однако их содержание для применения к качеству баз данных требуется уточнить. Выделяемые показатели качества должны иметь практический интерес для пользователей и быть упорядочены в соответствии с приоритетами практического применения. Кроме того, каждый выделяемый показатель качества должен быть пригоден для достоверного экспертного оценивания или измерения, а также для сравнения с требуемым значением.
При разработке базы данных в техническом задании и спецификации на нее должен формализоваться представительный набор функциональных требований к качеству базы данных, адекватный ее назначению и области применения, а также требованиям заказчика и потенциальных пользователей. Так же как для программных систем, характеристики качества информации можно разделить на функциональные и конструктивные. Их номенклатура, содержание и субхарактеристики базируются на ISO 9126. Может быть заложена основа для стандартизированного формирования требований к качеству баз данных и при изложении содержания характеристик качества использованы номенклатура и описания характеристик [1, 2], в которых объекты для анализа качества — «программы», заменены термином и содержанием — «информация баз данных». Однако номенклатура показателей качества не всегда может ограничиваться только характеристиками информации в базе данных, а должна включать ряд уточнений, отражающих комплексную эффективность и функциональную пригодность ее применения в реальных условиях.
Функциональная пригодность информации базы данных может представлять сложную проблему для измерения и оценки соответствия требованиям реальных значений атрибутов качества. Особенно это актуально для больших распределенных баз данных, в которых циркулирует разнообразная и сложная информация об анализируемых объектах. Мерой качества функциональной пригодности может быть степень покрытия целей, назначения и функций баз данных доступной пользователям информацией. Как и для программных систем, для баз данных целесообразно использовать группу субхарактеристик, определяющих функциональные, структурные и эксплуатационные требования [1]. На содержательном уровне функциональную пригодность многих баз данных отражают:
полнота накопленных описаний объектов — относительное число объектов или документов, имеющихся в базе данных, к общему числу объектов по данной тематике или по отношению к числу объектов в аналогичных базах данных;
идентичность — относительное число описаний объектов, не содержащих дефекты и ошибки, к общему числу документов об объектах в базах данных;
актуальность — относительное число устаревших данных об объектах в базах данных к общему числу накопленных и обрабатываемых данных.
Разнообразие функций баз данных ограничивает возможность стандартизации требований к ним только общими правилами их организации, структурирования и документирования, которые достаточно подробно изложены в [1]. Меры и шкалы качества функциональной пригодности столь же разнообразны, насколько различаются назначения и специфика функций информации баз данных, однако конструктивные характеристики могут быть в значительной степени стандартизированы.
К
конструктивным характеристикам качества
информации можно отнести практически
все стандартизированные
Корректность или достоверность данных — это степень соответствия данных об объектах в базах данных реальным объектам в данный момент времени, определяющаяся изменениями самих объектов, некорректностями записей об их состоянии или некорректностями расчетов их характеристик. Выбор и установку требований к корректности данных можно оценивать по степени покрытия накопленными, актуальными и достоверными данными состояния и изменения внешних объектов, которые они отражают. Сюда же можно отнести и некоторые объемно-временные характеристики сохраняемых и обрабатываемых данных:
объем базы данных — относительное число записей описаний объектов или документов, доступных для хранения и обработки, по сравнению с полным числом реальных объектов во внешней среде;
оперативность — степень соответствия динамики изменения данных состояниям реальных объектов;
глубина ретроспективы — интервал времени от даты выпуска и/или записи в базу данных самого раннего документа до настоящего времени;
Информация о работе Меры информации, качество информации и его характеристика