Автор: Пользователь скрыл имя, 02 Мая 2012 в 23:45, доклад
Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - то процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.
КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ ИНФОРМАЦИИ
Система классификации
Важным понятием при работе с
информацией является классифик
Классификация - cистема распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком
Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - то процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.
Пример 2.6. Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:
Свойства информационного
Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
Пример 2.7. Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:
Все перечисленные реквизиты
Кроме выявления общих свойств
информационного объекта
Пример 2.8.
Алгоритм обработки
Алгоритм обработки
Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.
При любой классификации
В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.
Классификатор - систематизированный свод наименований и кодов классификационных группировок.
При классификации широко используются понятияклассификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.
Пример 2.9. В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.
Можно в качестве признаков классификации использовать: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет,
Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Рассмотрим основные идеи этих методов для создания систем классификации.
Иерархическая система классификации
Иерархическая система классификации (рис. 2.3) строится следующим образом:
Рис. 2.3. Иерархическая система
Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.
Запомните! В иерархической системе классификации из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков.
В иерархической системе
Количество уровней
Достоинства иерархической системы классификации:
Пример 2.10. Поставлена задача - создать иерархическую систему классификации для информационного объекта "Факультет", которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин - наличие детей. Система классификации представлена на рис.2.4 и будет иметь следующие уровни:
Созданная иерархическая система классификации имеет глубину классификации, равную четырем.
Рис. 2.4. Пример иерархической системы
классификации для
Фасетная система классификации
Фасетная система
Пример 2.11. Фасет цвет содержит значения: красный, белый, зеленый, черный, желтый.
Фасет специальность содержит названия специальностей.
Фасет образование содержит значения: среднее, среднее специальное, высшее.
Схема построения фасетной системы классификации в виде таблицы отображена на рис. 2.5. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2,..., Фi,..., Фn. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, обозначенный Ф2, содержит значения: красный, белый, зеленый, черный, желтый.
Ф1, Ф2,..., Фi,..., Фn
Рис 2.5. Фасетная система классификации
Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:
Ks=( Ф1, Ф2,..., Фi,..., Фn),
где Фi- i-й фасет;
n - количество фасетов.
При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.
Достоинства фасетной системы классификации:
Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.
Пример 2.12. Обратитесь к содержанию примера 2.10, где показано построение иерархической системы классификации. Для сопоставления разработаем фасетную систему классификации.
Сгруппируем и представим в виде таблицы (рис. 2.6) все классификационные признаки по фасетам:
фасет название факультета с пятью названиями факультетов;
фасет возраст с тремя возрастными группами;
фасет пол с двумя градациями;
фасет дети с двумя градациями.
Структурную формулу любого класса можно представить в виде:
Ks=(Факультет, Возраст, Пол, Дети)
Присваивая конкретные значения каждому фасету, получим следующие классы:
К1=(Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети);
K2=(Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет);
К3=(Математический факультет, возраст до 20 лет, женщина, детей нет) и т.д.
Рис. 2.6. Пример фасетной системы классификации для информационного объекта "Факультет"
Дескрипторная система классификации
Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.
Суть дескрипторного метода классификации заключается в следующем:
Пример 2.13. В качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие, занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся, преподаватель, учитель, педагог, факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.