Автор: Пользователь скрыл имя, 16 Марта 2011 в 23:02, реферат
Основное отличие деревьев решений от методов распознавания образов и моделирования состоит в том, что проводимое исследование основывается на логических рассуждениях, а не на вычислениях. Деревья решений – это один из методов построения экспертных систем на основе правил вывода. Такие системы называются системами прямого логического вывода, так как мы начинаем с фактов, в результате приходим к тому или иному выводу
1.Общая характеристика метода дерева решений ………………………..3
2.Порядок построения дерева решений …………………………………...6
3.Преимущества деревьев решений ………………………………………10
Содержание
Одним из популярных методов принятия решений являются деревья решений. С помощью этого метода можно принимать решения:
- по социальным и макроэкономическим вопросам;
- по развитию фирмы или в банковской сфере.
Деревья решений используются также для диагностики в медицине, экономике и бизнесе.
Основное
отличие деревьев решений от методов
распознавания образов и
Дерево
решений – популярный метод науки
управления, используемый для выбора
наилучшего направления действий из
имеющихся вариантов. Дерево решений
– это схематичное
Методом
дерева решений можно пользоваться
в ситуациях, подобных описанной
выше, в связи с рассмотрением
платежной матрицы. В этом случае
предполагается, что данные о результатах,
вероятности и т.п. не влияют на все
последующие решения. Однако дерево
решений можно построить под
более сложную ситуацию, когда
результаты одного решения влияют на
последующие решения. Таким образом,
дерево решений – это полезный
инструмент для принятия последовательных
решений.
Рис.1
Дерево решений
На рис. 1 проиллюстрировано применение метода дерева решений для разрешения проблемы, требующей определенной последовательности решений. Вице-президент по производству из компании, выпускающей электрические газонокосилки, считает, что расширяется рынок ручных косилок. Он должен решить, стоит ли переходить на производство ручных косилок, и если сделать это, – стоит или не стоит продолжать выпуск электрических газонокосилок. Производство косилок обоих типов потребует увеличения производственных мощностей. До принятия решения руководитель собрал релевантную информацию об ожидаемых выигрышах в случае тех или иных вариантов действий и о вероятности соответствующих событий. Эта информация представлена на дереве решений.
Прогнозы полезны для планирования и осуществления деловых операции только в том случае, если компоненты прогноза тщательно продуманы, а ограничения, содержащиеся в прогнозе, откровенно названы. Существует несколько способов сделать это:
Спросить себя, для чего нужен прогноз, какие решения будут на нем основаны. Этим определяется потребная точность прогноза. Некоторые решения принимать опасно, даже если возможная погрешность прогноза – менее 10%. Другие решения можно принимать безбоязненно даже при значительно более высокой допустимой ошибке.
Определить изменения, которые должны произойти, чтобы прогноз оказался достоверным. Затем с осмотрительностью оцените вероятность соответствующих событий.
Определить компоненты прогноза. Подумайте об источниках данных.
Определить, насколько ценен опыт прошлого в составлении прогноза. Не настолько ли быстры изменения, что основанный на опыте прогноз будет бесполезным? Дают ли данные по подобным продуктам (или вариантам развития) основания для составления прогноза о судьбе вашего продукта? Насколько просто или недорого можно будет получить надежную информацию об опыте прошлого?
Определить, насколько структурированным должен быть прогноз. При прогнозировании сбыта может быть целесообразно выделить отдельные части рынка (развивающиеся потребители, стабильные потребители, крупные и мелкие потребители, вероятность появления новых потребителей и т.п.).
Используя дерево решений, руководитель находит путем возврата от второй точки к началу наиболее предпочтительное решение – наращивание производственных мощностей под выпуск косилок обоих типов. Это обусловлено ожидаемым выигрышем (3 млн. долл.), который превышает выигрыш (1 млн. долл.) при отказе от такого наращивания, если в точке А будет низкий спрос на электрические косилки.
Руководитель продолжает двигаться назад к текущему моменту (первой точке принятия решений) и рассчитывает ожидаемые значения в случаях альтернативных действий – производства только электрических или только ручных косилок. Ожидаемое значение для варианта производства только электрических косилок составляет 6,5 млн. долл. (0,7 х 8 млн. долл. + 0,3 х 3 млн. долл.). Подобным образом рассчитывается ожидаемое значение для варианта выпуска только ручных косилок, которое равно всего 4,4 млн. долл. Таким образом, наращивание производственных мощностей под выпуск косилок обоих типов является наиболее желательным решением, поскольку ожидаемый выигрыш здесь наибольший, если события пойдут, как предполагается.
Дерево
решений позволяет представить
проблему схематично и сравнить возможные
альтернативы визуально. Этот метод
можно использовать в применении
к сложным ситуациям, когда результат
принимаемого решения влияет на последующие.
2. Порядок построения дерева решений
В наиболее простом виде дерево решений – это способ представления правил в иерархической, последовательной структуре. Основа такой структуры – ответы "Да" или "Нет" на ряд вопросов.
Рис.2. Дерево решений "Играть ли в гольф?"
На рис. 2 приведен классический пример дерева решений, задача которого – ответить на вопрос: "Играть ли в гольф?" Чтобы решить задачу, т.е. принять решение, играть ли в гольф, следует отнести текущую ситуацию к одному из известных классов (в данном случае – "играть" или "не играть"). Для этого требуется ответить на ряд вопросов, которые находятся в узлах этого дерева, начиная с его корня.
Первый узел нашего дерева "Солнечно?" является узлом проверки, т.е. условием. При положительном ответе на вопрос осуществляется переход к левой части дерева, называемой левой ветвью, при отрицательном – к правой части дерева. Таким образом, внутренний узел дерева является узлом проверки определенного условия. Далее идет следующий вопрос и т.д., пока не будет достигнут конечный узел дерева, являющийся узлом решения. Для нашего дерева существует два типа конечного узла: "играть" и "не играть" в гольф.
В результате прохождения от корня дерева (иногда называемого корневой вершиной) до его вершины решается задача классификации, т.е. выбирается один из классов – "играть" и "не играть" в гольф.
Целью построения дерева решения в нашем случае является определение значения категориальной зависимой переменной.
Итак, основными элементами дерева решений являются:
Корень дерева: "Солнечно?"
Внутренний узел дерева или узел проверки: "Температура воздуха высокая?", "Идет ли дождь?"
Лист, конечный узел дерева, узел решения или вершина: "Играть", "Не играть"
Ветвь дерева (случаи ответа): "Да", "Нет".
В рассмотренном примере решается задача бинарной классификации, т.е. создается дихотомическая классификационная модель. Пример демонстрирует работу так называемых бинарных деревьев.
В узлах бинарных деревьев ветвление может вестись только в двух направлениях, т.е. существует возможность только двух ответов на поставленный вопрос ("да" и "нет").
Бинарные деревья являются самым простым, частным случаем деревьев решений. В остальных случаях, ответов и, соответственно, ветвей дерева, выходящих из его внутреннего узла, может быть больше двух.
Рассмотрим более сложный пример. База данных, на основе которой должно осуществляться прогнозирование, содержит следующие ретроспективные данные о клиентах банка, являющиеся ее атрибутами: возраст, наличие недвижимости, образование, среднемесячный доход, вернул ли клиент вовремя кредит. Задача состоит в том, чтобы на основании перечисленных выше данных (кроме последнего атрибута) определить, стоит ли выдавать кредит новому клиенту. Такая задача решается в два этапа: построение классификационной модели и ее использование.
На этапе построения модели, собственно, и строится дерево классификации или создается набор неких правил. На этапе использования модели построенное дерево, или путь от его корня к одной из вершин, являющийся набором правил для конкретного клиента, используется для ответа на поставленный вопрос "Выдавать ли кредит?"
Правилом является логическая конструкция, представленная в виде "если : то :"
На рис. 3. приведен пример дерева классификации, с помощью которого решается задача "Выдавать ли кредит клиенту?". Она является типичной задачей классификации, и при помощи деревьев решений получают достаточно хорошие варианты ее решения.
Рис.
3 Дерево решений "Выдавать ли кредит?"
Как видно из рисунка, внутренние узлы дерева (возраст, наличие недвижимости, доход и образование) являются атрибутами описанной выше базы данных. Эти атрибуты называют прогнозирующими, или атрибутами расщепления. Конечные узлы дерева, или листы, именуются метками класса, являющимися значениями зависимой категориальной переменной "выдавать" или "не выдавать" кредит.
Каждая ветвь дерева, идущая от внутреннего узла, отмечена предикатом расщепления. Последний может относиться лишь к одному атрибуту расщепления данного узла. Характерная особенность предикатов расщепления: каждая запись использует уникальный путь от корня дерева только к одному узлу-решению. Объединенная информация об атрибутах расщепления и предикатах расщепления в узле называется критерием расщепления.
На рис 3. изображено одно из возможных деревьев решений для рассматриваемой базы данных. Например, критерий расщепления "Какое образование?", мог бы иметь два предиката расщепления и выглядеть иначе: образование "высшее" и "не высшее". Тогда дерево решений имело бы другой вид.
Таким образом, для данной задачи (как и для любой другой) может быть построено множество деревьев решений различного качества, с различной прогнозирующей точностью.
Качество построенного дерева решения весьма зависит от правильного выбора критерия расщепления. Над разработкой и усовершенствованием критериев работают многие исследователи.
Метод
деревьев решений часто называют
"наивным" подходом. Но благодаря
целому ряду преимуществ, данный метод
является одним из наиболее популярных
для решения задач
3. Преимущества деревьев решений
Интуитивность деревьев решений. Классификационная модель, представленная в виде дерева решений, является интуитивной и упрощает понимание решаемой задачи. Результат работы алгоритмов конструирования деревьев решений легко интерпретируется пользователем. Это свойство деревьев решений не только важно при отнесении к определенному классу нового объекта, но и полезно при интерпретации модели классификации в целом. Дерево решений позволяет понять и объяснить, почему конкретный объект относится к тому или иному классу.