Автор: Пользователь скрыл имя, 20 Февраля 2012 в 20:20, реферат
При сучасному рівні розвитки техніки, коли навіть побутова техніка обладнується мікропроцесорними пристроями, виникнула потреба в інтелектуальних адаптивних системах керування, спроможних пристосовуватися до дуже широкого діапазону зовнішніх умов. Більш того, виникнула потреба в універсальній технології створення таких систем. Науковий досвід людства свідчить про те, що в природі можна знайти безліч цінних ідей для науки і техніки.
Використання нейромережевих технологій при створенні систем підтримки прийняття рішень (СППР).
При сучасному рівні розвитки техніки, коли навіть побутова техніка обладнується мікропроцесорними пристроями, виникнула потреба в інтелектуальних адаптивних системах керування, спроможних пристосовуватися до дуже широкого діапазону зовнішніх умов. Більш того, виникнула потреба в універсальній технології створення таких систем. Науковий досвід людства свідчить про те, що в природі можна знайти безліч цінних ідей для науки і техніки. Людський мозок є самим надзвичайним і загадковим створенням природи. Спроможність живих організмів, наділених вищою нервовою системою, пристосовуватися до навколишнього середовища може служити призовом до імітації природі або імітації при створенні технічних систем.
Серед імітаційних підходів виділяється клас нейромережевих методів. Нейронні мережі (НМ) [4] знайшли широке застосування в галузях штучного інтелекту, в основному пов'язаних із розпізнаванням образів і з теорією керування. Одним з основних принципів нейромережевого підходу є принцип конективизма. Суть його виражається в тому, що розглядаються дуже прості однотипні об'єкти, сполучені у велику і складну мережу. Таким чином, НМ є в першу чергу графом, із яких можна зв'язати сукупність образів, поданих як чисельні значення, асоційовані з вершинами графа, алгоритм для перетворення цих чисельних значень за допомогою передачі даних між сусідніми вершинами і простими операціями над ними. Сучасний рівень розвитку мікроелектроніки дозволяє створювати нейрочіпи, що складаються з дуже великого числа простих елементів, спроможних виконувати тільки арифметичні операції. Таким чином, нейромережеві методи підтримується апаратно.
Математично НМ можна розглядати як клас методів статистичного моделювання, що у свою чергу можна розділити на три класи: оцінка щільності ймовірності, класифікація і регресія [2].
Передбачається, що система підтримки та прийняття рішень (СППР) може бути цілком реалізована на нейронній мережі. У відмінності від традиційного використання НМ для рішення тільки задач розпізнавання і формування образів, у СППР узгоджено вирішуються задачі
розпізнавання і формування образів
одержання і збереження знань (емпірично знайдених закономірних зв'язків образів і впливів на об'єкт керування)
оцінки якісних характеристик образів
прийняття рішень (вибору впливів).
Особливостями СППР на базі НМ є:
Надмірність нейронів у мережі, необхідна для адаптації системи керування (СК) до умов існування , що змінюються , об'єкта керування (ОК). Внаслідок цього для практичної реалізації СК необхідно створення великих НМ (для порівняння людський мозок містить ~1011 нейронів).
НМ складається зі специфічних нейронів, що є більш близькими аналогами біологічного нейрона і пристосованими для рішення задач ППР.
Нейрони в мережі з'єднуються спеціальною образом, також для рішення задач ППР.
Особливості сучасних СППР роблять непридатними або малопридатними існуючі системи САПР і системи моделювання традиційних НМ (наприклад, BrainMaker) для створення прототипів СК ППР. Через цю обставину основні питання, що розглядаються в статті це:
1. Розробка інструмента системи побудови та дослідження нейронних мереж (СПДНМ) для моделювання і дослідження нейромережевих реалізацій прототипів СК ППР.
2. Розробка загальної схеми нейромережевої реалізації прототипів СК ППР.
Розглянемо основні сторони створення СППР на базі нейронних мереж. Будемо називати керуючою системою (КС) систему керування, що імітує нервову систему відповідно до методології ППР. Під об'єктом керування (ОК) будемо розуміти організм, що несе в собі нервову систему, іншими словами, ОК - це об'єкт, що повинний управлятися за допомогою КС, розташованої усередині ОК і взаємодіючої зі своїм оточенням за допомогою блока датчиків (БД) і виконавчих органів (ВО).
Мал. 1.3.1.
На мал. 1.3.1 [1] подана система, під якою будемо розуміти середовище, у яке вкладений ОК, що містить у свою чергу КС. Як бачимо з малюнку, можна стверджувати, що КС управляє не тільки ОК, але й всією системою. Під середовищем у системі можна розуміти різні об'єднання об'єктів. Будемо називати середовищем W сукупність об'єктів, що лежать поза КС; середовищем S - сукупність об'єктів, що лежать поза ОК; середовищем U - всю систему.
Блок датчиків поставляє КС вхідну інформацію у вигляді двійкового вектора. Цей блок необхідний у реальних системах для сполучення середовища і КС, тому при моделюванні КС на ЕОМ не використовувався і ми не акцентуємо увагу.
Роботу блоку формування і розпізнавання образів (ФРО) можна уявити таким чином. У блоці ФРО на підставі апріорної інформації про можливі функціональні властивості середовища задані деякі об'єкти, назвемо їхніми нейронами, на які відображаються деякі класи просторово-тимчасових явищ, що потенційно можуть існувати в системі. Відображення задається топологією мережі. У класі, відображуваному на нейрон, виділяється підклас, що може сприйматися даним нейроном. Кожний нейрон може статистично аналізувати сприйманий їм підклас. Накопичуючи статистичну інформацію про сприйманий підклас, нейрон може прийняти рішення, чи є цей підклас випадковим або невипадковим явищем у системі Якщо якийсь нейрон приймає рішення, що відображуваний на нього підклас є невипадковою подією, то він переходить у деякий відмінний від вихідного навчений стан. Якщо нейрон навчений, то будемо говорити також, що сформований образ, цей образ ідентифікується номером даного нейрону. Підклас явищ, що сприйнятий нейроном, і який викликав його навчання, тобто просторово-тимчасові явища, статистично вірогідно існуючі в системі, називається прообразом даного образу. Сформований образ може бути розпізнаний блоком ФРО, коли прообраз даного образу спостерігається БД. Блок ФРО вказує, які з сформованих образів розпізнані в сучасний момент. Одночасно з цим розпізнані образи беруть участь у формуванні образів більш високих порядків, тобто має місце агрегування та абстрагування образів.
Блок формування бази знань(БЗ) призначений для автоматичного уяввлення емпірично знайдених КС знань про функціональні властивості системи.
Блок оцінки стану(БОС) виробляє інтегральну оцінку якості стану ОК St.
Блок вибору дії або, надалі, блок прийняття рішень (БПР) реалізує процедуру ухвалення рішення, засновану на аналізі поточної ситуації, цільових функцій, змісту БЗ, а також оцінки поточного значення оцінки St.
Блок визначення часу ухвалення рішення визначає глибину перегляду БЗ у залежності від поточної оцінки St. Чим вище значення St, тим більше образів (у порядку спадання модулю їхньої ваги) може врахувати КС при ухваленні рішення, тим менше темп прийняття рішень.
У КС можуть бути засоби для апріорного аналізу наслідків альтернативних дій, що вибираються на декілька кроків вперед.
Такий у самих загальних рисах алгоритм керування, реалізований КС у СППР. Основні властивості процесу керування складаються в тому, що КС автоматично накопичує емпіричні знання про властивості пред'явленого їй об'єкта керування і приймає рішення, спираючись на накопичені знання. Якість керування росте в міру збільшення обсягу накопичених знань. Зауважимо також, що керування складається не в тому, що КС реагує на вхідну інформацію, а в тому, що КС постійно активно шукає можливий у поточних умовах засіб поліпшити стан ОК. Тим самим КС СППР має внутрішню активність.
При створенні додатків може бути доцільним використання КС СППР для керування тільки в тих областях простору ознак, у котрих раніше використовувані методи були неефективними. Іншими словами, корисно розділити ознаковий простір на дві області: на область, для якої є апріорна інформація про властивості ОК, і в який можна застосувати систему керування, і на область, у котрої немає інформації про властивості ОК, де потрібно адаптація в реальному часі керування.
Біологічний нейрон
Мал. 3.1.1
1. У будь-який момент можливі лише два стани волокна: наявність імпульсу і його відсутність, так називаний закон «усе або нічого».
2. Передача вихідного сигналу з аксона попереднього нейрона на дендриты або прямо на тіло такого нейрона здійснюється в спеціальних утвореннях - синапсах. Вхідні сигнали підсумовуються із синаптичними затримками й у залежності від сумарного потенціалу генерується або ні вихідний імпульс - спайк.
Формальна модель нейрона.
Вперше формальна логічна модель нейрона була введена Маккалоком і Питтсом [3] у 1948 році та тих пір було запропоновано величезна кількість моделей. Але усі вони призначені для рішення в основному задач розпізнавання і класифікації образів. Можна зазначити цілий ряд основних відмінностей запропонованої в даній роботі моделі і вже існуючих. По-перше, у класичних моделях завжди є присутнім «вчитель» або «супервізор», що підбудовує параметри мережі по визначеному алгоритму, запропонований же нейрон повинний підбудовуватися «сам» у залежності від «побаченої» їм послідовності вхідних векторів. Формально говорячи, при роботі нейрона повинна використовуватися тільки інформація з його входів. По-друге, у запропонованій моделі немає речовинних важелів і зваженої сумації по цих вагах, що є великим плюсом при створенні нейрочипу і модельних обчислень, оскільки цілочисленна арифметика виконується завжди швидше, ніж раціональна і простіше в реалізації. Головна ж відмінність запропонованої моделі складається в цілі застосування. C її допомогою вирішуються всі задачі керуючої системи: формування і розпізнавання образів (ФРО), розпізнавання і запам'ятовування закономірностей (БЗ), аналіз інформації БЗ і вибір дій (БПР), у відмінності від класичних моделей, де вирішується тільки перша задача.
Для моделювання на ЕОМ компонентів КС, сконструйованих із нейронів усвідомлена необхідність у спеціальному інструменті, що дозволяє за допомогою зручного графічного інтерфейсу створювати бібліотеки шаблонів блоків, будувати мережі з блоків, побудованих по шаблонах, і прораховувати мережу з можливістю перегляду проміжних станів мережі, збору й аналізу статистики про роботу мережі з метою налагодження.
При створенні (або виборі) інструмента використовувалися такі критерії:
відкритість, або специфікація і реалізація інтерфейсу і (процедур обробки) форматів даних, що дозволяють проводити модифікацію і нарощування функціональності системи не торкаючись ядра системи і з мінімальними витратами на модифікацію зв'язаних компонентів, іншими словами, мінімізація зв'язків між компонентами;
гнучкість, можливості по конструюванню як можна більшої кількості класів формальних моделей нейронів і мереж під самі різноманітні додатки від моделей КС супутників і космічних апаратів до систем підтримки прийняття рішень і систем прогнозування курсу цінних паперів;
багатоплатформеність, максимальна незалежність від операційної системи;
зручність і пристосованість до моделювання саме систем підтримки прийняття рішень, простота у використанні і спроможність ефективно працювати на слабких ресурсах ЕОМ (класу персональних комп'ютерів).
Аналіз існуючих у наявності або доступних СППР і інших систем (наприклад, LabView або систем із класичними НМ), тим або іншою чином задовольняючих першим трьом критеріям, показав, що усі вони є або великоваговими, або занадто дорогими, або дуже погано пристосовані до моделювання систем керування з формальною моделлю нейрона. Таким чином, виникнула необхідність в інструменті для науково-дослідних цілей, який би дозволяв перевіряти ідеї створення СППР і створювати прототипи КС на НМ.
Мал. 5.1. Загальна схема ядра СПДНМ.
На приведеній схемі (рис 5.1) [1] зазначені основні класи об'єктів ядра системи і їхня взаємодія. Стрілками показані потоки даних при роботі системи. Кожному з основних блоків КС відповідає свій блок у системі. Чотири блоки: ФРО, БЗ, БОС і БПР складають КС. З формальної моделі НМ випливає, що блок - це ієрархічна структура, у якій елементи одного рівня сполучені в мережу і кожний з елементів рівня може бути мережею, що складається з елементів більш низького рівня. Розглядаючи обраний елемент будь-якого рівня, можна вважати його «чорною скринєю», тобто абстрагуватися від його змісту і внутрішньої будови. Наприклад, можна на деякому проміжному етапі конструювання КС абстрагуватися від нейро-мережевої реалізації блока верхнього рівня і спробувати різноманітні реалізації, причому необов’язково нейромережеві. Система не накладає обмежень на внутрішню будову кожного блока, тому воно може не мати внутрішньої ієрархії, а просто рекомендуватися деякою функцією виходу. Далі, у процесі розвитку КС, зміст окремих блоків може змінитись, можливо стати більш складним і ієрархічним, при цьому поведінка системи не зміниться, якщо новий зміст забезпечує функціональність старого в еквівалентності вихідних функцій. Таким чином, полегшується розробка системи, тому що з'являється можливість конструювання «зверху донизу», немає необхідності реалізовувати блок відразу через НМ, можна поставити тимчасову «заглушку», а в процесі розвитку системи ускладнювати, доповнювати або заміняти на цілком іншу внутрішню конструкцію блоків.
Крім зазначених блоків, у систему входять ще два важливих класи об'єктів: конструктори мережі й аналізатори роботи мережі. Перші, як очевидно з назви, призначені для створення робочих копій НМ у пам'яті комп'ютера по різноманітних джерелах, наприклад по специфікації мережі з файла. Власне, для кожного джерела і створюється свій об'єкт. Специфікація мережі може посилатися на шаблони блоків з бібліотеки, які, таким чином, також можуть бути джерелом для конструкції. Аналізатори потрібні при налагодженні мереж. Справа в тому, що мережі можуть містити тисячу і десятки тисяч елементів (принципових обмежень немає,мають місце обмеження тільки по пам'яті і продуктивності комп'ютера), роботу яких одночасно простежити просто неможливо, особливо якщо тимчасовий інтервал роботи складає сотні і більш тактів. Тому необхідно якось узагальнювати інформацію про стан мережі (який є сукупність станів кожного елемента) у кожний момент часу і видавати користувачу сумарну інформацію, можливо, з деякою деталізацією на бажаняя користувача. Для такої задачі і потрібні спеціальні об'єкти - аналізатори. Ці об'єкти можуть зберігати історію станів обраних елементів в обрані інтервали часу і згодом її аналізувати, тобто визначати статистичного роду інформацію. Кожний об'єкт вирішує цю задачу по-своєму і може бути обраний у залежності від роду необхідної інформації про роботу мережі.