Автор: Пользователь скрыл имя, 28 Сентября 2011 в 22:59, курсовая работа
Динамическое программирование - это область математического программирования, включающая совокупность приемов и средств для нахождения оптимального решения, а также оптимизации каждого шага в системе и выработке стратегии управления, то есть процесс управления можно представить как многошаговый процесс
1. введение…….....................................................................................(2-5) с
1.1динамическоепрограммирование…………………………...….(5-6)с.
1.2 Дополнительная информация ……………..…………………(6-8) с.
1.3 Модели динамического программирования ………..…….…(8-11) с.
1.4 Постановка задач динамического программирования выбор стратегии обновления оборудования ...............................................(11-14)с.00
2. Решение задачи …………………………………………………(14-15) с..
2.1. Экономическая постановка задачи ……………………(14-15) с
2.2. Численное решение задачи ……………………………..(15-20) с.
2.3 Получение результатов…………………………………(20-21) с.
3. Описание автоматизированных расчетов …………………..…(20-21) с.
3.1 Выбор языка программирования ……………………..…….(20-21) с.
3.2 Описание программы………………………….. ……..…….…(21-30) с.
3.3 Заключение ………….………………………………………..………(31) с.
4.Список литературы ……………………………..…………...………(31-32) с.
4.1Приложение …………………………………………………………………
4.2инструкция для пользователя по форме №1и№2(включая описание формы)…………………………………………………………………(32-34) с.
ский аппарат, который подходит к решению некоторого класса задач пу-
тем их разложения на части, небольшие и менее сложные задачи. При
этом отличительной особенностью является решение задач по этапам,
через фиксированные интервалы, промежутки времени, что и определило
появление термина динамическое программирование. Следует заметить,
что методы динамического программирования успешно применяются и
при решении задач, в которых фактор времени не учитывается. В целом
математический аппарат можно представить как пошаговое или поэтап-
ное программирование. Решение задач методами динамического про-
граммирования проводится на основе сформулированного Р. Э. Беллма-
ном принципа оптимальности: оптимальное поведение обладает тем
свойством, что каким бы ни было первоначальное состояние системы и
первоначальное решение, последующее решение должно определять оп-
тимальное поведение относительно состояния, полученного в результате
первоначального решения.
Из этого следует, что планирование каждого шага должно проводиться
с учетом общей выгоды, получаемой по завершении всего процесса, что и
позволяет оптимизировать конечный результат по выбранному критерию.
Таким образом, динамическое программирование в широком смысле
представляет собой оптимальное управление процессом, посредством
изменения управляемых параметров на каждом шаге, и, следовательно,
воздействуя на ход процесса, изменяя на каждом шаге состояние системы.
В целом динамическое программирование представляет собой
стройную теорию для восприятия и достаточно простую для применения
в коммерческой деятельности при решении как линейных, так и нелиней-
ных задач.
Динамическое программирование (ДП) является одним из разделов
оптимального программирования. Для него характерны специфические
методы и приемы, применительные к операциям, в которых процесс при-
нятия решения разбит на этапы (шаги). Методами ДП решаются вариант-
ные оптимизационные задачи с заданными критериями оптимальности, с
определенными связями между переменными и целевой функцией, вы-
раженными системой уравнений или неравенств. При этом, как и в зада-
чах, решаемых методами линейного программирования, ограничения мо-
гут быть даны в виде равенств или неравенств. Однако если в задачах ли-
нейного программирования зависимости между критериальной функцией
и переменными обязательно линейны, то в задачах ДП эти зависимости
могут иметь еще и нелинейный характер. ДП можно использовать как
для решения задач, связанных с динамикой процесса или системы, так и
для статических задач, связанных, например, с распределением ресурсов.
Это значительно расширяет область применения ДП для решения задач
управления.
А возможность упрощения
тигается за счет ограничения области и количества, исследуемых при пе-
реходе к очередному этапу вариантов, увеличивает достоинства этого
комплекса методов.
Вместе с тем ДП свойственны и недостатки. Прежде всего, в нем нет
единого универсального метода решения. Практически каждая задача,
решаемая этим методом, характеризуется своими особенностями и тре-
бует проведения поиска наиболее приемлемой совокупности методов для
ее решения. Кроме того, большие объемы и трудоемкость решения много-
шаговых задач, имеющих множество состояний, приводят к необходи-
мости отбора задач малой размерности либо использования сжатой ин-
формации.
Последнее достигается с
и переработки списка состояний.
Для процессов с непрерывным временем ДП рассматривается как
предельный вариант дискретной схемы решения. Получаемые при этом
результаты практически совпадают с теми, которые получаются метода-
ми максимума Л. С. Понтрягина или Гамильтона-Якоби-Беллмана.
ДП применяется для решения задач, в которых поиск оптимума воз-
можен при поэтапном подходе, например, распределение дефицитных
капитальных вложений между новыми направлениями их использования;
разработка правил управления спросом или запасами, устанавливающи-
ми момент пополнения запаса и размер пополняющего заказа; разработка
принципов календарного планирования производства и выравнивания за-
нятости в условиях колеблющегося спроса на продукцию; составление
календарных планов текущего и капитального ремонтов оборудования и
его замены; поиск кратчайших расстояний на транспортной сети; форми-
рование последовательности развития коммерческой операции и т. Д.
.
1.4.Постановка задач стратегии обновления оборудвания.
Важной
экономической проблемой
Эксплуатация оборудования планируется в течение п лет, но оборудование имеет тенденцию с течением времени стареть и приносить все меньшую годовую прибыль r(t), где t — возраст оборудования. При этом есть выбор: либо в начале любого года продать устаревшее оборудование за цену s(t), которая также зависит от возраста, и купить новое оборудование за цену P, либо оставить оборудование в эксплуатации. Требуется найти оптимальный план замены оборудования с тем, чтобы суммарная прибыль за все n лет была максимальной, учитывая, что к началу эксплуатационного периода возраст оборудования составляет t0 лет.
Входными данными в этой задаче являются:
r(t) — доход от эксплуатации в течение одного года оборудования возраста t лет;
S (t) — остаточная стоимость оборудовании
Р — цена нового оборудования;
t0 — начальный возраст оборудования.
Остановимся на k-м шаге решения задачи.
Переменной управления на k-м шаге является логическая переменная, которая может принимать два значения:
С — сохранить
3 — заменить
оборудование в начале k-го года.
Переменной состояния системы на k-м шаге является переменная t.
Функцию Беллмана Fk(t) определим как максимально возможную прибыль от эксплуатации оборудования за годы с k-го по n-й, если к началу k-ro года возраст оборудования ссклавля t лет. Применяя то или иное управление, мы переводим систему в некоторое новое состояние, а именно, если в начале k-гo года мы оборудование сохраняем, то к началу следующего (k +1)-го года его возраст увеличится на 1 (состояние системы станет равно t+1), за этот год оно принесет прибыль r(t), и максимально возможная прибыль за оставшиеся годы (с (к+ 1)-го по n-й) составит Fk+1(t+1).
Если же в начале k-го года принимаем решение на замену оборудования, то мы продаем старое оборудование возраста t лет за цену S(t), покупаем новое оборудование за цену Р и эксплуатируем его в течение к-го года, что приносит за этот год прибыль r (0). К началу следующего года возраст оборудования составит 1 год, и за все годы с (k+1)-го по n-й максимально возможная прибыль будет Fk+1(1).
Из этих двух вариантов управления выбираем тот, который приносит большую прибыль. Уравнение Беллмана на каждом шаге имеет вид
Функцию Беллмана для первого шага (к=п) легко вычислить — это максимально возможная прибыль только за последний n-й год:
Вычислив значение функции Fn(t) по формуле (2), далее можно
замену посчитать Fn-1(t), затем Fn-2(t) и так далее до F1(t0).
Функция F1 (t0) представляет собой максимально возможную прибыль за все годы (с 1-го по n-й). Этот максимум достигается при некотором управлении, применяя которое в течение первого года, мы определяем возраст оборудования к началу второго года (в зависимости от того, какое управление является для первого года оптимальным, это будет 1 или t0+1). Для данного возраста оборудования по результатам, полученным на этапе условной оптимизации, мы смотрим, при каком управлении достигается максимум прибыли за годы со 2-го по n-й и так далее. На этапе безусловной оптимизации отыскиваются годы, в начале которых следует произвести оборудования.
2.решение задачи
2.1.
Экономическая постановка
задачи .
Гражданин приобрел новый автомобиль за 0.9 тыс .усл.ед.По мере его эксплуатации автомобиля у него изменяется ликвидационная стоимость и он требует ремонта ,временная динамика этих характеристик представлена в таблице. Определить оптимальный срок эксплуатации автомобиля и соответственно его замены на новый по такой же цене.
Время эксплуатации а/м, годы. | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
Ликвидационная стоимость по отношению к новму,%. | 100 | 80 | 70 | 60 | 50 | 35 | 25 |
Затраты на ремонт по отношению к нвому | 1 | 6 | 8 | 10 | 15 | 20 | 25 |
2.2. Численное решение задачи
Для упрощения работы с числами таблицы и их дольнейшего решения выводим следующую таблицу.
Решение.
t | 0 |
|
2 | 3 | 4 |
|
|
r(t) |
|
846 | 828 | 810 | 765 |
|
|
S(t) | 900 | 720 | 630 |
|
450 | 315 | 225 |