Проектирование классификаторов в задачах информационного поиска

Автор: Пользователь скрыл имя, 03 Марта 2013 в 12:30, лабораторная работа

Описание работы

Цель работы: получить навыки в проектировании и использовании классификаторов.
Задание 1: построить классификатор иерархического типа.

Работа содержит 1 файл

Ромазан Анна работа 5.docx

— 109.11 Кб (Скачать)

МИНИСТЕРСТВО  ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное автономное образовательное учреждение высшего  профессионального образования

Дальневосточный федеральный университет

(ДВФУ)

 


Филиал в г. Арсеньеве

 


 

 

Лингвистическое обеспечение  информационных систем

 

Лабораторная работа № 5

 

ПРОЕКТИРОВАНИЕ  КЛАССИФИКАТОРОВ В ЗАДАЧАХ ИНФОРМАЦИОННОГО  ПОИСКА

 

 

 

Работа

студента группы С17408

Ромазан А.Г.

 

 

Преподаватель

Рагулин П.Г.,

к.т.н., проф.

 

 

 

 

г. Арсеньеве

2011

 

Тема: охрана интеллектуальной собственности.

Цель работы: получить навыки в проектировании и использовании классификаторов.

Задание 1: построить классификатор иерархического типа.

Проектируемая система классификации  предусматривает следующие уровни:

    • 0-й уровень: информационный объект – интеллектуальная собственность;
    • 1-й уровень: классификационный признак – виды интеллектуальных прав:
      • авторское право;
      • смежные права;
      • патентное право;
      • права на средства индивидуализации;
      • право на секреты производства;
    • 2-й уровень: классификационный признак – причина нарушения права интеллектуальной собственности:
      • монополизм;
      • другая;
    • 3-й уровень: классификационный признак – способы защиты:
      • судебный порядок;
      • правоохранительные органы.

Глубина классификации равна 3.

Оценку трудоемкости рассчитаем путем вычисления числа иерархий, которое можно построить на данном множестве атрибутов.

Пусть С – множество атрибутов, используемых в качестве оснований деления:

С = {c1, с2,…сn}, где n – число элементов множества;

f(ci) - число классов, порождаемых каждым атрибутом, взятым из С;

f(c1)=5, f(c2)=1, f(c3)=2.

N=∏f(c) – число классов нижнего уровня одной иерархии;

n! – число возможных перестановок классификационных признаков;

N=n!*∏f(c) – общее число классов нижнего уровня всех возможных иерархий.

N=n!*∏f(c) = (1*2*3)*(5*1*2)=6*10=60

Значение N невелико, что говорит о невысокой трудоемкости процедуры классифицирования документов.

Интеллектуальная собственность




На секреты производства


Патентное право


На средство индивидуализации



Смежные права


Авторское право





монополия


монополия


монополия


монополия


монополия



 


суд


 

суд


 

суд


 

суд


 

суд



 

 

правоохранительные  органы


правоохранительные органы


правоохранительные  органы


правоохранительные органы


правоохранительные органы



 

 

 

Рисунок 1 –  Граф классификационной структуры

 

Задание 2: Построить классификатор фасетного типа.

  • Фасет виды интеллектуальной собственности;
  • Фасет причины нарушения права ИС;
  • Фасет способы защиты ИС.

Присваивая конкретные значения каждому  фасету, получим следующие классы:

K1 = (патентное право, монополия, суд);

К2 = (авторское право, монополия, антимонопольные органы) и т.п.

 

 

Антимонопольные органы


Судебные органы


Интеллектуальная собственность



 

 

Индивидуализация


Патентное право


Смежные права


Авторское право


 


 


 

 

Другая


Монополия




 

 

 

 

 

 

Рисунок 2 –  Граф фасетной классификации

 

 

Таблица 1 –  фасеты для информационного объекта «Интеллектуальная собственность»

Виды ИС

Причина нарушения права ИС

Методы защиты права ИС

На средство индивидуализации

Авторское право

Патентное право

На секреты производства

Смежные права

Монополия

Другая

Судебные органы

Правоохранительные органы


 

 

Задание 3: построить классификатор дескрипторного типа.

Совокупность ключевых слов или словосочетаний, описывающих  предметную область - «защита интеллектуальной собственности», представим списком:

    • собственность;
    • интеллектуальная собственность;
    • защита ИС;
    • авторское право;
    • патентное право;
    • монополия;
    • судебные органы;
    • охрана ИС;
    • обеспечение;
    • информационное обеспечение;
    • программное обеспечение;
    • лингвистическое обеспечение.

Далее ключевые слова подвергнем нормализации. Среди указанных ключевых слов встречаются синонимы:

    • защита ИС и охрана ИС.

После нормализации словарь дескрипторов будет состоять из следующих слов:

    • собственность;
    • интеллектуальная собственность;
    • авторское право;
    • патентное право;
    • монополия;
    • судебные органы;
    • охрана ИС;
    • обеспечение;
    • информационное обеспечение;
    • программное обеспечение;
    • лингвистическое обеспечение.

Установим между дескрипторами связи:

Синонимическая связь: собственность - интеллектуальная собственность.

Родо-видовая связь: обеспечение – информационное, программное, лингвистическое обеспечение; интеллектуальная собственность – авторское, патентное право.

Ассоциативная связь: судебные органы – правоохранительные органы.

 

Задание 4: построить классификатор комбинативного типа на основе схемы булевой классификации для исследуемой предметной области.

Для рассматриваемого примера «ИС» классификационная схема может быть задана следующими классификационными группировками:

Право на средство индивидуализации    Да

Авторское право                                    Да

Патентное право                                     Да

На секреты  производства                          Да

Смежные права                                      Да

Монополия                                            Да

Судебные органы                                  Да

Правоохранительные органы                 Да

В такой  классификации могут быть построены  классы, например:

- класс, построенный для фокусов фасетов «Авторское право» = Да и «Смежные права» = Да, будет содержать информацию о праве, имеющем принадлежность к обоим классам;

- класс, построенный для фокусов фасетов «Судебные органы» = Да и «Правоохранительные органы» = Да, будет содержать информацию о заявлении, обрабатываемом в обоих видах органов.     

Вывод: при выполнении данной работы, было освоено проектирование классификаторов в задачах информационного поиска.   Для заданной системы были решены все задачи представленные в задании.      


Информация о работе Проектирование классификаторов в задачах информационного поиска