Автор: Пользователь скрыл имя, 11 Декабря 2011 в 21:34, курсовая работа
Понятие оптимального портфеля описывает объективное нахождение прибыльности портфеля исходя из риска, который готов понести инвестор. По мере роста капитала предполагаемого инвестора возникает необходимость снизить риски, диверсифицировать портфель, а для этого нужно сначала определиться со структурой инвестиционного портфеля.
(5) |
где
yj – значение j-го выхода нейросети
dj – целевое значение j-го выхода
p – число нейронов в выходном слое
Обучение нейросети производится методом градиентного спуска, т. е. на каждой итерации изменение веса производится по формуле
(6) |
где h – параметр, определяющий скорость обучения.
(7) |
где
yj – значение выхода j-го нейрона
Sj – взвешенная сумма входных сигналов, определяемая по формуле (1).
При этом множитель
(8) |
где
xi – значение i-го входа нейрона
Далее рассмотрим определение первого множителя формулы (7)
(9) |
где
k – число нейронов в слое n+1.
Введем вспомогательную переменную
(10) |
Тогда мы сможем определить рекурсивную формулу для определения n-ного слоя, если нам известно следующего (n+1)-го слоя.
(11) |
Нахождение же для последнего слоя НС не представляет трудности, так как нам известен целевой вектор, т. е. вектор тех значений, которые должна выдавать НС при данном наборе входных значений.
(12) |
И наконец запишем формулу (6) в раскрытом виде
(13) |
Рассмотрим теперь полный алгоритм обучения нейросети:
(14) |
На этапе 2 сети поочередно
в случайном порядке
Повышение эффективности обучения НС обратного распространения
Простейший метод градиентного спуска, рассмотренный выше, очень неэффективен в случае, когда производные по различным весам сильно отличаются. Это соответствует ситуации, когда значение функции S для некоторых нейронов близка по модулю к 1 или когда модуль некоторых весов много больше 1. В этом случае для плавного уменьшения ошибки надо выбирать очень маленькую скорость обучения, но при этом обучение может занять непозволительно много времени.
Простейшим методом усовершенствования градиентного спуска является введение момента m, когда влияние градиента на изменение весов изменяется со временем. Тогда формула (13) примет вид
(13.1) |
Дополнительным преимуществом от введения момента является способность алгоритма преодолевать мелкие локальные минимумы.
Представление входных данных
Основное отличие НС в том, что в них все входные и выходные параметры представлены в виде чисел с плавающей точкой обычно в диапазоне [0..1]. В то же время данные предметной области часто имеют другое кодирование. Так, это могут быть числа в произвольном диапазоне, даты, символьные строки. Таким образом данные о проблеме могут быть как количественными, так и качественными. Рассмотрим сначала преобразование качественных данных в числовые, а затем рассмотрим способ преобразования входных данных в требуемый диапазон.
Качественные данные мы можем разделить на две группы: упорядоченные (ординальные) и неупорядоченные. Для рассмотрения способов кодирования этих данных мы рассмотрим задачу о прогнозировании успешности лечения какого-либо заболевания. Примером упорядоченных данных могут, например, являться данные, например, о дополнительных факторах риска при данном заболевании.
нет | ожирение | алкоголь | курение | гипертония |
А также возможным примером может быть, например, возраст больного:
до 25 лет | 25-39 лет | 40-49 лет | 50-59 лет | 60 и старше |
Опасность каждого фактора возрастает в таблицах при движении слева направо.
В первом случае мы видим, что у больного может быть несколько факторов риска одновременно. В таком случае нам необходимо использовать такое кодирование, при котором отсутствует ситуация, когда разным комбинациям факторов соответствует одно и то же значение. Наиболее распространен способ кодирования, когда каждому фактору ставится в соответствие разряд двоичного числа. 1 в этом разряде говорит о наличии фактора, а 0 о его отсутствии. Параметру нет можно поставить в соответствии число 0. Таким образом для представления всех факторов достаточно 4-х разрядного двоичного числа. Таким образом число 10102 = 1010 означает наличие у больного гипертонии и употребления алкоголя, а числу 00002 соответствует отсутствие у больного факторов риска. Таким образом факторы риска будут представлены числами в диапазоне [0..15].
Во втором случае мы также можем кодировать все значения двоичными весами, но это будет нецелесообразно, т.к. набор возможных значений будет слишком неравномерным. В этом случае более правильным будет установка в соответствие каждому значению своего веса, отличающегося на 1 от веса соседнего значения. Так, число 3 будет соответствовать возрасту 50-59 лет. Таким образом возраст будет закодирован числами в диапазоне [0..4].
В принципе аналогично
можно поступать и для
Алексей Стариков
Литература
http://www.basegroup.ru/
Информация о работе Составление оптимального инвестиционного портфеля