Особенности построения гибридных интеллектуальных систем обработки информации

Автор: Пользователь скрыл имя, 29 Мая 2012 в 00:08, курсовая работа

Описание работы

Целью данной работы является изучение особенностей построения гибридных интеллектуальных систем.
Поставленная цель решается посредством следующих задач:
- раскрыть понятие гибридной интеллектуальной системы;

Работа содержит 1 файл

Введение.doc

— 900.00 Кб (Скачать)

default – использовать палитру, установленную по умолчанию;

blue – холодная сине-голубая палитра;

hot – теплая палитра, состоящая из черного, красного, желтого и белого цветов;

HSV – палитра насыщенных цветов: красный, желтый, зеленый, циан, голубой, мажента, красный.

Рисунок 28. Примеры форматов поверхности “входы-выход”

 

Команда Always evaluate позволяет установить / отменить режим автоматического, т.е. без нажатия кнопки Evaluate, перерисовывания поверхности “входы-выход" при любом изменении параметров.

 

1.8.7 GUI-модуль  Findcluster

 

GUI-модуль Findcluster позволяет автоматически находить центры кластеров многомерных данных с помощью нечеткого c-means алгоритма и алгоритма субтрактивной кластеризации.

Загрузка модуля Findcluster осуществляется по команде findcluster. Основное графическое окно модуля Findcluster с указанием назначения функциональных областей приведено на рис. 34.

 

Рисунок 34. Основное окно модуля Findcluster

Модуль Findcluster содержит 7 верхних типовых меню графического окна (File, Edit, View, Insert, Tools, Windows иHelp), область визуализации, область загрузки данных, область кластеризации, область вывода текущей информации а также кнопки Info и Close, которые позволяют вызвать окно справки и закрыть модуль, соответственно.

В области визуализации в двумерном пространстве выводятся экспериментальные данные (образы) и найденные центры кластеров. Для образов используется маркер в виде красной окружности (o), а для центров кластеров – маркер в виде черной точки ().

В области также расположены меню выбора координатных осей X-axis и Y-axis, позволяющие ассоциировать признаки образов с осями абсцисс и ординат, соответственно.

В области загрузки данных, которая расположена в правом верхнем углу окна, находится кнопка Load Data…. Нажатие этой кнопки позволяет загрузить данные для кластеризации, хранящиеся на диске. После нажатия кнопки Load Data… открывается типовое окно открытия файла. В файле данные должны быть записаны построчно, т. е. каждому образу должна соответствовать одна строка файла данных.

В области вывода текущей информации, которая расположена внизу графического окна, выводится наиболее важная текущая информация, например, состояние модуля, номер итерации алгоритма кластеризации, значение целевой функции и т.п.

В области кластеризации пользователь может выбрать алгоритм кластеризации, установить параметры алгоритма кластеризации, провести кластеризацию и сохранить координаты центров кластеров в виде файла. В области расположены следующие меню и кнопки.

Меню Method… позволяет выбрать один из двух алгоритмов кластеризации: subtractiv – алгоритм субтрактивной кластеризации; fcm - нечеткий c-means алгоритм. При выборе алгоритма субтрактивной кластеризации графическое окно модуля Findcluster имеет вид, показанный на рис. 34. В этом случае пользователь имеет возможность установить значения следующих параметров алгоритма: Influence Range,  Squash, Accept Ratio и Reject Ratio, смысл которых объяснен в описании функции subclust. При выборе нечеткого c-means алгоритма область кластеризации принимает вид, изображенный на рис. 35. В этом случае пользователь имеет возможность установить значения следующих параметров: Cluster Num. - количество кластеров; Max Iteration # - максимальное количество итераций алгоритма; Min - минимально допустимое значение улучшения целевой функции за одну итерацию алгоритма; Exponent - значения экспоненциального веса.

Рисунок 35. Область кластеризации для нечеткого c-means алгоритма кластеризации

Кнопка Start – запускает кластеризацию. При использовании алгоритма fcm значения координат центров кластеров выводятся в окне визуализации после каждой итерации. При использовании субтрактивной алгоритма открывается дополнительное окно (рис. 36), показывающее динамику процесс кластеризации. Координаты центров кластеров выводятся по окончанию выполнения алгоритма.

Рисунок 36. Окно выполнения алгоритма субтрактивной кластеризации.

Кнопка Save Center… - позволяет сохранить координаты найденных центров кластеров. По нажатию этой кнопки открывается типовое окно записи данных в файл. Координаты центров записываются в таком же формате, как и данные для кластеризации, т. е. каждая строчка файла содержит значения координат одного центра.

Кнопка Clear Plot позволяет очистить поле вывода данных.

2. Построение нечёткой модели гибридной сети.

2.1 Анализ и прогнозирование валютных цен на финансовом рынке посредством нечёткой модели принятия решений.

 

Для решения задачи прогнозирования валютных цен на финансовом рынке рассмотрим процесс разработки нечеткой модели гибридной сети. Суть данной задачи состоит в том, чтобы, зная динамику изменения курсовой стоимости продажи некоторой валюты за фиксированный интервал времени, предсказать значение ее курсовой стоимости на определенный момент времени в будущем. При этом характерной особенностью динамики изменения курса (тренда) является наличие двух основных явлений в колебаниях соответствующих цен.

С одной стороны, наблюдается общее долгосрочное падение курсовой стоимости. С другой стороны, наблюдается краткосрочное колебание цен, связанное с целым рядом случайных факторов, адекватное представление которых в той или иной формальной модели вряд ли возможно.

Традиционно для решения данной задачи применяются различные модели, технического анализа, основанные на использовании различных индикаторов. В то же время наличие неявных тенденций в динамике изменения курсовой стоимости валют позволяет применить модель адаптивных нейро-нечетких сетей.

В качестве исходных данных можно воспользоваться информацией о динамике курса ЦБ РФ по валюте «Доллар США» (USD) за некоторый временной интервал, которая доступна в Интернете по адресу (///www.finmarket.ru///)Спросить!!!. Для конкретности возьмем значения курсовой стоимости USD за 1 единицу в период, с 1 сентября 2011 года по 10 декабря 2011 года. Данную информацию представим в виде таблицы. (Приложение 1).

Предположим, что нечеткая модель гибридной сети будет содержать 4 входных переменных. При этом первая входная переменная будет соответствовать курсу USD на текущий банковский день, вторая — курсу USD на предыдущий банковский день, т.е. на день (i - 1), где через i обозначен текущий банковский день. Тогда третья входная переменная будет соответствовать курсу USD на (i - 2) банковский день, а четвертая — на (i - 3) банковский день.

Соответствующие обучающие данные могут быть сведены в отдельную таблицу. Объем полученной таким образом обучающей выборки равен 40, что соответствует динамике курса USD с 6 сентября 2011 года по 31 октября 2011 года. Таким образом, данные за ноябрь не вошли в состав обучающей выборки и будут использованы для проверки адекватности построенной нечеткой модели. (Приложение 2).

В следующем пункте рассмотрим использование данной модели для построения нечеткой системы в среде MATLAB Fuzzy Logic Toolbox.

 

2.2 Реализация задачи в среде Fuzzy Logic Toolbox.

 

        Особенностью нейронных сетей является то, каким образом происходит обработка данных. При использовании стандартного алгоритма обратного распространения ошибки сеть «видит» и анализирует данные исходной матрицы рядами. Чтобы нейронная сеть смогла «увидеть» тренды, нужно представить данные таким образом, чтобы в каждой строке обучающей матрицы отражалась «история» временного ряда т.е. содержалась информация как о текущем наблюдении, так и о прошлых.

При решении нашей задачи мы будем учитывать пятидневную историю, т.е. все изменения, которые происходили в течение предшествующей недели. Здесь нужно заметить, что попытки рассматривать более длинную «историю» приводят к сокращению числа наблюдений в обучающей выборке и к одновременному неоправданному ее росту «вширь», что может отрицательно повлиять на способность сети к обучению.

Теперь необходимо преобразовать имеющуюся информацию в вид понятный и содержательный для сети.

Невозможно получить сколько-нибудь удовлетворительный результат с помощью нейронных сетей, подав на вход необработанные данные. Для работы с нейронными сетями важно не только тщательно отобрать показатели: необходимо также представить их в определённой, понятной для сети форме. Можно выделить два основных правила , согласно которым формируется обучающая выборка.

Нейронные сети лучше реагируют не на исходные данные, а на ряды приращений. Этот факт можно объяснить тем, что в нейронной сети задаётся диапазон значений, определяемый наибольшим и наименьшим значениями из обучающей выборки. Если этот диапазон велик , а сами значения при переходе от наблюдения к наблюдению изменяется на незначительную по сравнению с диапазоном величину, то нейронная сеть попросту не придаст должного значения этим изменениям . Кроме того , использование при работе с сетью приращений позволяет получать прогноз в случае , когда абсолютные значения переменных, на основе которых строится прогноз, выходят за пределы диапазона установленного при обучении.

Таким образом, чтобы оптимизировать обучение и работу сети, преобразуем все исходные ряды в ряды приращений следующим образом:

delta[i]=(p[i]-[pi-1])/p[i-1]

Где p[i] – значение показателя p в момент времени i.

Сохраним обучающую выборку, которая была составлена в предыдущем разделе, в отдельный файл с именем training_data.dat. После этого с помощью команды anfisedit из командной строки MATLAB запускаем ANFIS-редактор и загружаем этот файл.

Рис.37 ANFIS-редактор с загруженным файлом training_data.dat

 

Сгенерируем систему нечеткого вывода типа Сугено нажатием кнопки Generate FIS.... В появившемся окне зададим для каждой входной переменной по 3 функции принадлежности типа pimf. Для выходной переменной зададим линейную функцию принадлежности. (Рис 38).

Рис. 38 Generate FIS.... с линейной функцией принадлежности.

Для обучения гибридной сети выберем метод hybrid с уровнем ошибки 0 и количеством циклов 30. Запустим обучение гибридной сети.

 

Рис 39 Anfis Editor: Untitled с методом hybrid.

 

После обучения гибридной сети можно посмотреть структуру построенной нечеткой модели. В данной системе мы получили 81 правило. (Рис 40)

Протестируем полученную систему нечеткого вывода на обучающем наборе данных. (Рис 41)

 

Рис 40. Anfis Model Structure 81 правило.

 

Рис 41 Anfis Editor: Untitled.

Теперь проверим точность построенной системы на тех данных, которые не вошли в обучающую выборку. Предположим, что текущий день - это 9 ноября 2011 года, и сделаем прогноз курсовой стоимости USD на 10 ноября 2011 года. Для этого воспользуемся функцией командной строки evalfis, так как графические средства пакета Fuzzy Logic Toolbox дают слишком большую погрешность.

Проверка точности предоставлена в (приложении 3).

Вектор input — это курсовая стоимость валюты за текущий и предыдущие дни, а price — предполагаемая курсовая стоимость на следующий день. После выполнения функции получаем значение price равное 24.4460. Сравнивая это значение со значением из таблицы, легко убедиться, что они очень близки и погрешность составляет всего 0.004. Таким образом, построенную нечеткую модель гибридной сети можно считать достаточно точной для прогнозирования курсовой стоимости USD.

В данном разделе приводится ряд иллюстраций, показывающих графический интерфейс среды Fuzzy Logic Toolbox и, собственно, структуру построенной нечеткой системы вывода которая предоставлена в (приложении 4).

 

 

 

 

 

 

 

 

 

 

 

 

Заключение.

 

В ходе исследования курсовой работы мы изучили особенности построения гибридных интеллектуальных систем и сделали следующие выводы:

В свою очередь, гибридные ИС можно классифицировать, в зависимости от архитектуры, на следующие типы: 1) комбинированные (combination), 2) интегрированные (integration), 3) объединенные (fusion) и 4) ассоциативные (association) гибридные интеллектуальные системы.

Было выяснено, что ANFIS - это аббревиатура Adaptive – Network -   Based Fuzzy Inference System - адаптивная сеть нечеткого вывода. ANFIS является одним из первых вариантов гибридных нейро - нечетких сетей - нейронной сети прямого распространения сигнала особого типа. Для реализации нечеткой нейронной сети тип ANFIS необходимо реализовать базовые функции, которые описываются ниже.

Для реализации гибридной системы класса ANFIS была выбрана система MatLab, были рассмотрены основные операторы и функции системы.

Гибридные интеллектуальные системы, позволяют использовать преимущества традиционных средств и методов искусственного интеллекта, и, в то же время, преодолевают некоторые их недостатки, они способны решать задачи, нерешаемые отдельными методами искусственного интеллекта. Гибридные интеллектуальные системы позволяют более эффективно соединять формализуемые и неформализуемые знания за счет интеграции традиционных средств искусственного интеллекта.

Проверка построенной нечёткой модели гибридной сети показывает достаточно высокую степень её адекватности реальным исходным данным, что позволяет сделать вывод о возможности её практического использования для прогнозирования курсовой стоимости USD на финансовом рынке валют.

Информация о работе Особенности построения гибридных интеллектуальных систем обработки информации