Математические методы в принятии решений

Автор: Пользователь скрыл имя, 20 Марта 2012 в 11:41, контрольная работа

Описание работы

Но натурный эксперимент в экономике осуществить очень трудно, ведь любая экономическая деятельность связана с людьми, а пробовать на людях разные варианты управления, проверять их последствия опасно. Вдобавок люди ведут себя в условиях эксперимента не так, как в реальной действительности. К тому же экономические эксперименты в натуре весьма дорогостоящи и продолжительны, в большинстве случаев субъект управления не имеет возможности затягивать принятие решений, ожидая пока они будут опробованы посредством эксперимента.

Содержание

РОЛЬ ЭКОНОМИКО-МАТЕМАТИЧЕСКИХ МЕТОДОВ И МОДЕЛЕЙ В УПРАВЛЕНИИ ЭКОНОМИЧЕСКИМИ ОБЪЕКТАМИ И ПРОЦЕССАМИ 3
1.ВВЕДЕНИЕ В ТЕОРИЮ ПРИНЯТИЯ РЕШЕНИЙ 3
1.1 Краткая историческая справка 3
1.2 Этапы принятия решений 5
1.3 Общие подходы и рациональные процедуры принятия решений 6
1.4 Математическая постановка задачи принятия решения 8
2. КЛАССИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ ПРИНЯТИЯ РЕШЕНИЙ 10
2.1 Экстремум функции одной переменной 10
2.2 Метод неопределенных множителей Лагранжа 12
2.3 Особенности реальных задач 14
3.НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ 15
3.1 Области применения нелинейного программирования 15
3.2 Общая характеристика методов решения задач нелинейного программирования 16
3.3 Методы одномерной оптимизации 19
3.4 Методы многомерной оптимизации 23
4.ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ 27
4.1 Краткий исторический очерк 28
4.2 Типичные задачи линейного программирования 28
4.3Постановка задачи линейного программирования 30
5.ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 32
5.1 Основные понятия 32
5.2 Математическое описание. Функциональное уравнение Беллмана. 33
5.3 Общая процедура решения задач методом динамического программирования 35
5.4 Задачи, решаемые методом динамического программирования 40
6. ИГРОВЫЕ МЕТОДЫ В ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ 43
6.1 Постановка задачи 44
6.2 Классификация игровых задач 47
7.ЭКОНОМИКО-МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ 47
7.1 О некоторых особенностях применения экономико-математических моделей и компьютеров в управлении 50
7.1 Основные виды экономико-математических моделей, применяемые в управлении 56
СОВРЕМЕННЫЙ ЭТАП РАЗВИТИЯ ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ 63
Литература 66

Работа содержит 1 файл

ТЕОРИЯ ПРИНЯТИЯ РЕШЕНИЙ.docx

— 1.03 Мб (Скачать)

Эффективность каждой стадии процесса оценивается скалярной  величиной Qν (yν, uν), которая называется функцией полезности – критерием оптимальности

       (5.4, а)

с учетом (5,1) функциональная зависимость (5.4, а) может быть представлена как

       (5.4, б)

Результирующая оценка эффективности  многостадийного процесса в целом  определяется как аддитивная функция  результатов, получаемых на каждой стадии

       (5.5)

Естественно, что критерий оптимальности Q зависит от совокупности управляющих воздействий на всех стадиях процесса (u1, u2, ..., um).

Таким образом, задачу оптимизации  многостадийного процесса можно  сформулировать как задачу отыскания  оптимальной стратегии uопт = (u1опт , u2опт , ..., umопт ) , для которой критерий оптимальности Q принимает максимальное или минимальное значение.

Процедура применения принципа оптимальности для оптимизации m-стадийного процесса должна начинаться с последней стадии, для которой не существует последующих стадий, могущих повлиять на выбор управления um опт на этой стадии. После этого приступают к определению оптимального управления для предыдущей m – 1 стадии, для которой оптимальная стратегия на последующих стадиях, т.е. на последней m-й известна и т.д. В результате может быть найдена оптимальная стратегия управления для

всего многостадийного процесса, являющаяся функцией начального состояния  процесса um (y0).

При применении любой стратегии  управления величина критерия оптимальности Q зависит только от состояния входа первой стадии у0 ( ) Q = Q y0 .

Пусть оптимальное значение целевой функции (для определенности минимальное) на участке от ν до m будет Bνm(yν −1), и оно зависит от состояния на ν – 1 стадии

     (5.6)

Соответственно

        (5.7)

здесь оптимизация проводится по всем возможным управлениям, принадлежащим  области допустимых значений U, на всех стадиях процесса. Соотношение (5.7) по существу является математической формулировкой задачи оптимизации m-стадийного процесса, но не содержит указаний как нужно минимизировать критерий Q, чтобы получить оптимальную стратегию uопт = (u1опт , u2опт , ..., umопт ).

Так как Q является аддитивной функцией критериев оптимальности отдельных стадий, то его можно представить в виде

      (5.8)

тогда (5.7) перепишется в  виде

    (5.9)

Выражение (5.9) может быть также переписано в виде

    (5.10)

где минимизация первого  слагаемого Q1 (y0, u1) проводится только по управлению u1, а второе минимизируется выбором управлений на всех стадиях, причем каждое слагаемое в (5.10) нельзя минимизировать в отдельности, так как они оба зависят от u1.

Минимизацию второго слагаемого в (5.10) можно рассматривать как  задачу оптимизации (m – 1) стадийного процесса с критерием оптимальности  Qm−1( y1) и оптимальной стратегией um−1 опт = (u2опт, uпт, … ,umопт) . Таким образом, можно записать, что

      (5.11)

Выражение (5.9) с учетом (5.11) может быть представлено в виде

     (5.12)

Если математическое описание первой стадии y1 = f1(y0 , u1 ), то

    (5.13)

Последнее уравнение является математической формулировкой принципа оптимальности и называется рекуррентным соотношением Беллмана.

Для начала расчетов необходимо задать начальную функцию f0 (ym), которая может быть принята равной нулю, что естественным образом соответствует отсутствию процесса за пределами последней стадии.

Уравнение (5.13) можно трактовать как оптимальные потери, причем Q1 (y0) , u1 – потери на первом участке, а Bm–1 – оптимальные потери на всех последующих участках. Минимизируя сумму этих потерь, необходимо найти правильное соотношение между ними.

5.3 Общая процедура решения задач методом динамического программирования

 

Согласно общему подходу  к решению задач методом динамического  программирования определение оптимальных  управлений начинается с последней  стадии процесса, для которой рекуррентное соотношение Беллмана с учетом, что B0 (ym) = 0, записывается в виде

Для этой стадии можно построить  зависимость целевой функции Qm от управления um для различных значений переменной состояния ym–1 (рис. 5.2).

Эта зависимость позволяет  найти зависимость оптимального управления на последней стадии umопт от входной переменной этой стадии ym–1 (рис. 5.3).

 

Одновременно определяется минимальное значение целевой функции B1 данной стадии от ее входа, т.е. ym–1 (рис. 5.4).

Таким образом можно получить зависимости оптимального управления на m-й стадии от входной переменной этой стадии umопт = um(ym−1), а также критерия оптимальности на этой m-й стадии от ее входа B1 = B1(ym−1). Кроме того, можно определить зависимость выходной переменной при оптимальном управлении от входной переменной  ymопт = ym (ym−1) (рис. 5.5).

Для определения оптимального управления um–1 на (m – 1)-й стадии из всех полученных результатов необходима зависимость B1(ym–1), с учетом которой рекуррентное соотношение для (m – 1)-й стадии записывается как

Далее необходимо построить  зависимость (Qm-1 + B1) от управления um–1 для различных значений ym–2 переменных состояний входа (m – 1) стадии (рис. 5.6).

Также как и для m-й стадии в результате минимального значения выражения (5.15) находятся зависимости um−1опт = um−1(ym−2), B2 = B2(ym−2), а также ym−1опт = ym−1(ym−2 ), которые представлены соответственно на рис. 5.7, 5.8, 5.9.

Далее появляется возможность  записать рекуррентные соотношения  на (m – 2) стадии, и т.д. Продолжая процесс вычислений можно дойти до первой стадии, для которой также будут получены соотношения ( ) 1опт 1 0 u = u y , Bm= Bm(y0), 1опт 1( 0). y = y y Возможный вид кривых для них представлен на рис. 5.10 –5.13.

На этом первый этап решения  задачи оптимизации многостадийного  процесса заканчивается. Полученные соотношения  определяют оптимальную стратегию  управления m-стадийного процесса для любого возможного состояния входа первой стадии.

На втором этапе решения  оптимальной задачи находятся оптимальные  управления всех стадий uν, ν = 1, m , для чего необходимо принять соответствующее значение состояния входа y0. В том случае, если оно в постановке задачи не задано, его можно определить из условия минимума величины Bm как функции значения y0 (рис. 5.12). В рассмотренном случае зависимость Bm от y0 имеет минимум, что позволяет найти оптимальное значение состояния входа y0 = a0. Минимальное значение Bm может достигаться и на концах.

После определения переменной состояния входа из условия минимума функции Bm(y0), преступают к определению оптимальных управлений для всех стадий процесса, соответствующих выбранной величине y0 = a0 (рис. 5.12). Вторым этапом решения задачи оптимального управления методом динамического программирования является определение оптимальных управлений для всех стадий. Здесь порядок расчета следующий.

Определяется оптимальное  управление на первой стадии (рис. 5.11) u1опт = b1 и значение выходной переменной этой стадии y1опт = a1 (рис. 5.13), отвечающее оптимальному управлению. После этого переходят ко второй стадии, и вся процедура повторяется и т.д. В результате решения задачи доходят до последней m-й стадии и имеют значения uVопт для всей рассматриваемой задачи по стадиям.

Динамическое программирование является одним из методов решения  задач оптимизации при принятии решений. Основные преимущества этого  метода: прежде всего, он позволяет  найти глобальное оптимальное решение; оптимизация ведется по одной  переменной; рекуррентная формула (уравнение) Беллмана удобна для программирования. Ограничением метода является размерность  задачи, так как приходится хранить  результаты оптимизации всех этапов. Но гораздо более серьезные затруднения возникают при применении метода динамического программирования для оптимизации многостадийных процессов, для которых размерности векторов состояния yν и управления u0 велики, из-за сложности отыскания оптимальных управлений на каждой стадии. Поэтому следует стремиться, чтобы размерность стадии оптимизируемого объекта была по возможности невысокой.

5.4 Задачи, решаемые методом динамического программирования

 

5.4.1 Задача распределения  ресурсов

Пусть имеется некоторое  количество экономических ресурсов. Под термином ресурсы подразумеваются  люди, деньги, машины, материалы для  технологических процессов, вода для  сельскохозяйственных и промышленных целей, топливо и т.д. Эти ресурсы  потребляются различными способами, в  результате чего получают некоторый доход, размер которого зависит от употребленного количества ресурсов и от выбранного процесса распределения.

Задача заключается в  распределении ресурсов таким образом, чтобы максимизировать общий  доход при следующих условиях: доходы, полученные от различных процессов  измеряются общей единицей; доход, полученный от рассматриваемого процесса, не зависит  от количества ресурсов, выделенных для  других процессов; общий доход получается как сумма доходов полученных от отдельных процессов.

Математическая формулировка задачи следующая.

Пусть имеется N различных процессов (ι = 1, 2, ..., N), каждому из которых соответствует функция полезности – целевая функция (доход) Qι, зависящая от количества выделенных ресурсов uι . Общий доход определяется аддитивной функцией

на количество ресурсов наложены ограничения, что общее их количество не должно превышать заданного u1 + u2 + ...+ uN = u, где uι ≥ 0.

Требуется максимизировать  целевую функцию Q (u1, ..., uN) при uι, удовлетворяющих соответствующим ограничениям.

Конкретным примером рассматриваемой  задачи является процесс загрузки судна. Необходимо загрузить корабль грузом, составленным из отдельных предметов  различного типа, имеющих различные  массу и стоимость. Задача состоит  в загрузке судна ограниченной грузоподъемности грузом наибольшей стоимости.

Если uι – число отдельных предметов ι-го типа, Vι – вес отдельного предмета ι-го типа), Сι – стоимость отдельного предмета ι-го типа, z – максимальная грузоподъемность судна, N – количество различных типов, тогда ценность груза определяется линейной формой

и ограничение по грузоподъемности имеет вид 

Требуется максимизировать  целевую функцию Q (u) при ограничении на грузоподъемность и условиях Cι ≥ 0, Vι ≥ 0, uι = 0, 1, 2, ...

Другим примером, в котором  функция цели не является аддитивной, является задача надежности, возникающая  при конструировании любого узла сложной аппаратуры. Требуется построить  надежное устройство из менее надежных компонент.

 

5.4.2 Транспортная  задача

В математической экономике  большое значение имеет задача наиболее эффективного перемещения ресурсов из одного пункта в другой. Это, так  называемая, транспортная задача.

Пусть ресурсы сосредоточены  на складах ι = 1, 2, ..., m (Dι), спрос на них имеется в пунктах потребления j = 1, 2, ..., N (Pj). Для простоты рассматривается один вид ресурса, его запасы на ι-м складе – uι, спрос на него в j-м пункте потребления – rj. Общий запас равен общему спросу .

Количество ресурсов, отправляемые из ι-го склада в j-й пункт потребления uιj, стоимость соответствующей перевозки Qιj (uιj ). Величины uιj должны быть неотрицательны, uιj ≥ 0. Кроме того, вводятся ограничения на запасы; общее количество ресурсов, отправляемое из любого склада, должно равняться запасам на этом складе ; и ограничение на спрос; общее количество ресурсов, отправляемое в любой пункт потребления, должно равняться спросу в этом пункте

Таким образом, требуется  определить количество перевозимых  ресурсов из ι-го склада в j-й пункт потребления uιj , чтобы общая стоимость перевозок была минимальна.

Эта задача обычно решается методом линейного программирования. Но, если функции стоимости Qιj ( u) нелинейные, то эти методы не применимы, и задача может быть решена методом динамического программирования.

Пусть для простоты имеется  два склада ι = 1, 2, и N пунктов потребления. Величина затрат при использовании оптимальной политики составляет BN (u1, u2) при N = 1, 2, ..., u1 ≥ 0, u2 ≥ 0.

Удовлетворяя первым спрос  в N-м пункте потребления, затраты в нем составят ( ) ( ) Q1N u1N + Q2N u2N и запасы ресурсов на складах уменьшатся до u1 − u1N и u2 − u2N . Согласно принципа оптимальности для N ≥2 рекуррентное соотношение Беллмана записывается в виде

Информация о работе Математические методы в принятии решений