Автор: Пользователь скрыл имя, 07 Мая 2012 в 13:41, реферат
Экспертные системы (ЭС)- это набор программ, выполняющий функции эксперта при решении задач из некоторой предметной области. Они возникли как значительный практический результат в применении и развитии методов искусственного интеллекта (ИИ)- совокупности научных дисциплин, изучающих методы решения задач интеллектуального (творческого) характера с использованием ЭВМ. ЭС выдают советы, проводят анализ, дают консультации, ставят диагноз. Практическое применение ЭС на предприятиях способствует эффективности работы и повышению квалификации специалистов.
Введение 3
1. Экспертные системы, их особенности. Применение экспертных систем. 5
2. Структура экспертной системы 11
3.Отличие ЭС от других программных продуктов. 11
3.1. Отличительные особенности. Экспертные системы первого и второго поколения. 14
3.2. Критерий использования ЭС для решения задач. 15
3.3. Ограничения в применение экспертных систем. 17
3.4.Преимущества ЭС перед человеком - экспертом. 18
4. История развития экспертных систем. 20
5. Модели представления знаний 23
5.1 Логическая модель представления знаний 24
5.2 Продукционная модель представления знаний 26
5.3 Представление знаний фреймами 28
5.4 Представление знаний семантическими сетями 31
Список литературы 35
При разработке системы
EURISCO была предпринята попытка
преодолеть указанные
Однако через некоторое
время обнаружилось, что система
не всегда корректно
С 1990 года доктор Ленат во главе исследовательской группы занят кодированием и вводом нескольких сот тысяч элементов знаний, необходимых, по его мнению, для создания “интеллекту-
альной” системы. Этот проект назван Cyc (“Цик”, от английского слова enciklopaedia).
Одной из наиболее важных проблем, характерных для систем, основанных на знаниях, является проблема представления знаний. Это объясняется тем, что форма представления знаний оказывает существенное влияние на характеристики и свойства системы. Для того чтобы манипулировать всевозможными знаниями из реального мира с помощью компьютера, необходимо осуществлять их моделирование. В таких случаях необходимо отличать знания, предназначенные для обработки компьютером, от знаний, используемых человеком. Кроме того, при большом объеме знаний желательно упростить последовательное управление отдельными элементами знаний.
При проектировании модели представления знаний следует учитывать такие факторы, как однородность представления и простота понимания. Однородное представление приводит к упрощению механизма управления логическим выводом и упрощению управления знаниями. Представление знаний должно быть понятным экспертам и пользователям системы. В противном случае затрудняются приобретение знаний и их оценка. Однако выполнить это требование в равной степени, как для простых, так и для сложных задач довольно трудно. Обычно для несложных задач останавливаются на некотором среднем (компромиссном) представлении, но для решения сложных и больших задач необходимы структурирование и модульное представление.
Типичными моделями представления знаний являются:
Однако во всех разработанных в прошлом системах с базами знаний помимо этих моделей использовались специальные для конкретного случая средства, поэтому представление знаний получалось сложным. Тем не менее классификация моделей оставалась неизменной. Язык, используемый для разработки систем, спроектированных на основе этих моделей, называется языком представления знаний.
Логическая модель используется для представления знаний в системе логики предикатов первого порядка и выведения заключений с помощью силлогизма. Основное преимущество использования логики предикатов для представления знаний заключается в том, что обладающий хорошо понятными математическими свойствами мощный механизм вывода может быть непосредственно запрограммирован. С помощью этих программ из известных ранее знаний могут быть получены новые знания.
Приведенные ниже примеры являются логическими моделями представления фактов с помощью предикатов и носят название атомарной формулы.
ЛЮБОВЬ (Виктор, Ирина): Виктор любит Ирину
СТОЛИЦА (Москва): Москва – столица
Следующие примеры являются правильно построенными логическими формулами, включающими кванторы существования ([pic]) и общности ([pic]).
[pic] : некий дельфин наделен умственными способностями
[pic] : все слоны имеют серую окраску
Отличительными чертами логических моделей, в частности приведенных выше моделей представления знаний, являются единственность теоретического обоснования и возможность реализации системы формально точных определений и выводов. По этим причинам немало исследователей в области искусственного интеллекта выбрали для себя предметом изучения именно логические модели.
Однако для логических моделей характерен ряд сомнительных моментов, а поскольку большинство исследователей в области искусственного интеллекта – люди с неформальным мышлением, то большая часть достижений в области систем с базами знаний до недавнего времени принадлежала так называемой группе исследователей нелогического направления. В отличие от исследователей логического направления, которые выбирают предметом своих исследований сравнительно простые задачи, для решения которых используются теоретические подходы, исследователи нелогического направления выбирают сложные задачи и пытаются сконцентрировать все внимание на развитии способностей. Кроме того, в отличие от первой категории исследователей, которые почти не занимаются теоретическими исследованиями, вторая категория придает им большое значение. Другими словами, так называемая “человеческая логика” – это интеллектуальная модель с нечеткой структурой – в этом ее отличие от строгой логики. Более точно следует сказать, что исследователи логического направления ищут пути логического решения (в малой модели) задач, поставленных исследователями нелогического направления, и постепенно расширяют рамки логики. Примерами тому являются модальная логика, многозначная логика и т.п. В 80-х гг. было пересмотрено отношение к преимуществам и значимости логических методов, и они в различных формах стали применяться в нелогических моделях представления знаний.
Это обусловлено, с одной стороны, необходимостью в точном представлении знаний, а с другой – ставшими очевидными пределами традиционных систем знаний, чрезмерно тяготеющих к эвристике.
В модели правил знания представлены совокупностью правил вида “ЕСЛИ – ТО”. Системы с базами знаний, основанные на этой модели, называются продукционными системами. Эти системы бывают двух диаметрально противоположных типов – с прямыми и обратными выводами. Типичным представителем первого типа является система MYCIN, используемая для решения задач диагностического характера, а типичным представителем систем второго типа – OPS, используемая для решения проектирования задач.
В системе продукций с обратными выводами с помощью правил строится дерево И/ИЛИ, связывающее в единое целое факты и заключения; оценка этого дерева на основании фактов, имеющихся в базе данных, и есть логический вывод. Логические выводы бывают прямыми, обратными и двунаправленными. При прямом выводе отправной точкой служат предоставленные данные, процесс оценки приостанавливается в узлах с отрицанием, причем в качестве заключения (если не все дерево пройдено) используется гипотеза, соответствующая самому верхнему уровню дерева (корню). Однако для такого вывода характерно большое количество данных, а также оценок дерева, не имеющих прямого отношения к заключению, что излишне. Преимущество обратных выводов в том, что оцениваются только те части дерева, которые имеют отношение к заключению, однако если отрицание или утверждение невозможны, то порождение дерева лишено смысла. В двунаправленных выводах сначала оценивается небольшой объем полученных данных и выбирается гипотеза (по примеру прямых выводов), а затем запрашиваются данные, необходимые для принятия решения о пригодности данной гипотезы. На основе этих выводов можно реализовать более мощную и гибкую систему.
Системы продукций с прямыми выводами среди систем, основанных на использовании знаний, имеют наиболее давнюю историю, поэтому они являются в некотором смысле основополагающими. Эти системы включают три компонента: базу правил, состоящую из набора продукций (правил вывода), базу данных, содержащую множество фактов, и интерпретатор для получения логического вывода на основании этих знаний. База правил и база данных образуют базу знаний, а интерпретатор соответствует механизму логического вывода. Вывод выполняется в виде цикла “понимание – выполнение”, причем в каждом цикле выполняемая часть выбранного правила обновляет базу данных. В результате содержимое базы данных преобразуется от первоначального к целевому, т.е. целевая система синтезируется в базе данных. Иначе говоря, для системы продукций характерен простой цикл выбора и выполнения (или оценки) правил, однако из-за необходимости периодического сопоставления с образцом в базе правил (отождествлением) с увеличением числа последних (правил) существенно замедляется скорость вывода. Следовательно, такие системы не годятся для решения крупномасштабных задач. Упорядочим слабые и сильные стороны хорошо известных систем продукций. Сильные стороны:
Слабые стороны:
Таким образом, если объектом является небольшая задача, выявляются только сильные стороны системы продукций. В случаях увеличения объема знаний, необходимости решения сложных задач, выполнения гибких выводов или повышения скорости вывода требуется структурирование базы данных. Первое, что приходит в голову в таких случаях, - это группировка знаний и структурирование базы данных. Другими словами, путем предварительной группировки соответствующих правил в некотором состоянии процесса вывода можно ограничить диапазон выбора правил. В тех случаях, когда объекты, для которых используются правила, также имеют иерархическую структуру, эффективным является структурирование базы данных. Этот подход был реализован в системах EMICIN и MECS-AI, разработанных на базе системы MYCIN с применением универсального языка представления знаний.
Расширенным вариантом модели правил является модель доски объявлений (blackboard), которая была предложена в системе распознавания разговорной речи HEARSAY-II как модель представления знаний.
Фреймовая модель, или модель представления знаний, основанная на фреймовой теории М. Минского, представляет собой систематизированную модель памяти человека и его сознания.
Теория фреймов - это парадигма для представления знаний с целью использования этих знаний компьютером. Впервые была представлена Минским в 1975 году, как попытка построить фреймовую сеть, или парадигму с целью достижения большего эффекта понимания. С одной стороны он пытался сконструировать базу данных, содержащую энциклопедические знания, но с другой стороны, хотел создать наиболее описывающую базу, содержащую информацию в структурированной и упорядоченной форме. Эта структура позволила бы компьютеру вводить информацию в более гибкой форме, имея доступ к тому разделу, который требуется в данный момент. Минский разработал такую схему, в которой информация содержится в специальных ячейках, называемых фреймами, объединенными в сеть, называемую системой фреймов. Новый фрейм активизируется с наступлением новой ситуации.
Отличительной его чертой является то, что он одновременно содержит большой объем знаний и в то же время является достаточно гибким для того, чтобы быть использованным как отдельный элемент базы данных. Термин «фрейм» был наиболее популярен в середине семидесятых годов, когда существовало много его толкований, отличных от интерпретации Минского.
Итак, как было сказано выше фреймы – это фрагменты знания, предназначенные для представления стандартных ситуаций. Термин «фрейм» (Frame – рамка) был предложен Минским. Фреймы имеют вид структурированных компонентов ситуаций, называемых слотами. Слот может указывать на другой фрейм, устанавливая, таким образом, связь между двумя фреймами. Могут устанавливаться общие связи типа связи по общению. С каждым фреймом ассоциируется разнообразная информация (в том числе и процедуры), например ожидаемые процедуры ситуации, способы получения информации о слотах, значение принимаемые по умолчанию, правила вывода.
Формальная структура фрейма имеет вид:
f[, , …, ],
где f – имя фрейма; пара - i-ый слот, Ni – имя слота и Vi – его значение.
Значение слота может быть представлено последовательностью
· ;...; ; ; …; ,
где Ki – имена атрибутов, характерных для данного слота; Li – значение этих атрибутов, характерных для данного слота; Rj – различные ссылки на другие слоты.
Каждый фрейм, как структура хранит знания о предметной области (фрейм–прототип), а при заполнении слотов знаниями превращается в конкретный фрейм события или явления.
Фреймы можно разделить на две группы: фреймы-описания; ролевые фреймы.
Рассмотрим пример.
Фрейм описание: [<программное обеспечение>, <программа 1С бухгалтерия, версия 7.7>, <программа 1С торговля, версия 7.7>, <правовая программа «Консультант +» проф.>].
Ролевой фрейм: [<заявка на продажу>, <что, установка и покупка программы 1С торговля, версия 7.7>, <откуда, фирма ВМИ>, <куда, фирма «Лукойл»>, <кто, курьер Иванова>, <когда, 27 октября 1998г.>].
Во фрейме-описании в качестве имен слотов задан вид программного обеспечения, а значение слота характеризует массу и производителя конкретного вида продукции. В ролевом фрейме в качестве имен слотов выступают вопросительные слова, ответы на которые являются значениями слотов. Для данного примера представлены уже описания конкретных фреймов, которые могут называться либо фреймами – примерами, либо фреймами – экземплярами. Если в приведенном примере убрать значения слотов, оставив только имена, то получим так называемый фрейм – прототип.