Автор: Пользователь скрыл имя, 02 Ноября 2011 в 10:32, реферат
Цель и задачи исследования. Целью исследования является выявление зависимости между мировыми кассовыми сборами на зарубежные фильмы, появившиеся в широком прокате в период с 2006 по 2008 годы, и факторами, которые непосредственно влияют на данные сборы. В качестве таких факторов исследователи выбрали следующие:
количественные
Бюджет фильма
Количество известных актеров (известность будет оцениваться исходя из рейтингов)
Продолжительность показа фильма(надели)
Максимальное число кинотеатров
Введение..................................................................................................................3
Глава 1. Данные......................................................................................................5
Описание данных.........................................................................................5
Предварительный анализ данных..............................................................8
Графическое представление зависимости кассовых
сборов зарубежных фильмов от основных факторов....................................10
Глава 2. Поиск эконометрической модели..........................................................11
2.1 Линейная модель.........................................................................................11
2.2 Полулогарифмическая модель...................................................................16
2.3 Логарифмическая модель...........................................................................16
2.4 Оригинальная модель.................................................................................17
2.5 Анализ модели на устойчивость................................................................18
Глава 3. Оценка адекватности итоговой модели и возможные
способы ее улучшения...........................................................................................21
3.1 Улучшение эффективности оценок. Двухшаговая процедура...............21
3.2 Выводы.........................................................................................................23
Заключение.............................................................................................................24
Приложения............................................................................................................26
Таблица 1. Основные исследуемые показатели
При
последовательном изучении информации
взято 200 наблюдений. Ниже представлены
причины, по которым собранные данные
были учтены в дальнейшем анализе не полностью:
Приведем основные статистики по анализируемым показателям
MAX | BUD | TIME | ACTOR | |
Mean | 2080.215 | 45549325 | 11.42900 | 1.040000 |
Median | 2459.000 | 30000000 | 11.00000 | 1.000000 |
Maximum | 4362.000 | 3.00E+08 | 35.30000 | 5.000000 |
Minimum | 1.000000 | 15000.00 | 0.400000 | 0.000000 |
Std. Dev. | 1311.228 | 47962368 | 6.437567 | 1.060198 |
Таблица 2.1. Статистика по количественным показателям
Из таблицы видно, что средний бюджет зарубежного фильма составляет примерно 45,5 млн $. Продолжительность фильма составляет в среднем примерно 11 с половиной недель, и в среднем в каждом фильме снимается 1 известный актер. Максимальное количество кинотеатров в среднем перешагивает отметку 2000.
FANTA | FIGHT | THR | PRE | SEASON | STATE | ADV | CAR | COM | DIRECTOR | DRAMA | |
Mean | 0.150 | 0.175 | 0.295 | 0.100 | 0.400 | 0.835 | 0.135 | 0.075 | 0.280 | 0.390 | 0.395 |
Более
80% фильмов выборки произведены
в США (скорее всего будет незначимым),
примерно 40% картин снимают известные
режиссеры. И основным жанром является
драма (почти 40%). Примерно 30% фильмов снимаются
в жанре Триллер.
1.2.Предварительный анализ данных
Для того чтобы сформулировать основные гипотезы относительно влияния факторов (в том числе, гипотезы о значимости влияния) и проверить догадки, проанализируем корреляционную матрицу (Таблица 2). Кроме этого, ее анализ даст возможность подтвердить предварительные предположения относительно мультиколлинеарности признаков.
ACTOR | ADV | BUD | CAR | COM | DIRECTOR | DRAMA | FANTA | FIGHT | MAX | PRE | TIME | SEASON | STATE | THR | |
ACTOR | 1,000 | 0,137 | 0,397 | -0,029 | 0,061 | 0,241 | -0,050 | 0,077 | -0,017 | 0,275 | 0,066 | 0,082 | 0,104 | 0,170 | 0,141 |
ADV | 0,137 | 1,000 | 0,444 | 0,110 | -0,051 | 0,074 | -0,170 | 0,285 | 0,319 | 0,264 | 0,161 | 0,147 | 0,096 | 0,018 | -0,063 |
BUD | 0,397 | 0,444 | 1,000 | 0,252 | 0,016 | 0,071 | -0,289 | 0,350 | 0,255 | 0,665 | 0,336 | 0,284 | 0,167 | 0,165 | 0,104 |
CAR | -0,029 | 0,110 | 0,252 | 1,000 | 0,161 | -0,072 | -0,191 | 0,040 | -0,031 | 0,243 | 0,032 | 0,129 | 0,155 | 0,075 | -0,184 |
COM | 0,061 | -0,051 | 0,016 | 0,161 | 1,000 | -0,042 | -0,026 | -0,137 | -0,229 | 0,178 | -0,022 | 0,118 | 0,105 | 0,157 | -0,355 |
DIRECTOR | 0,241 | 0,074 | 0,071 | -0,072 | -0,042 | 1,000 | 0,130 | 0,037 | -0,045 | 0,019 | -0,027 | 0,035 | 0,038 | 0,079 | 0,135 |
DRAMA | -0,050 | -0,170 | -0,289 | -0,191 | -0,026 | 0,130 | 1,000 | -0,168 | -0,238 | -0,366 | -0,201 | -0,122 | 0,050 | -0,137 | -0,186 |
FANTA | 0,077 | 0,285 | 0,350 | 0,040 | -0,137 | 0,037 | -0,168 | 1,000 | 0,175 | 0,229 | 0,047 | 0,043 | 0,000 | 0,036 | -0,057 |
FIGHT | -0,017 | 0,319 | 0,255 | -0,031 | -0,229 | -0,045 | -0,238 | 0,175 | 1,000 | 0,182 | 0,197 | -0,046 | -0,027 | -0,043 | 0,135 |
MAX | 0,275 | 0,264 | 0,665 | 0,243 | 0,178 | 0,019 | -0,366 | 0,229 | 0,182 | 1,000 | 0,287 | 0,278 | 0,054 | 0,364 | 0,140 |
PRE | 0,066 | 0,161 | 0,336 | 0,032 | -0,022 | -0,027 | -0,201 | 0,047 | 0,197 | 0,287 | 1,000 | 0,057 | 0,068 | 0,103 | 0,077 |
TIME | 0,082 | 0,147 | 0,284 | 0,129 | 0,118 | 0,035 | -0,122 | 0,043 | -0,046 | 0,278 | 0,057 | 1,000 | 0,123 | 0,020 | -0,012 |
SEASON | 0,104 | 0,096 | 0,167 | 0,155 | 0,105 | 0,038 | 0,050 | 0,000 | -0,027 | 0,054 | 0,068 | 0,123 | 1,000 | 0,060 | -0,125 |
STATE | 0,170 | 0,018 | 0,165 | 0,075 | 0,157 | 0,079 | -0,137 | 0,036 | -0,043 | 0,364 | 0,103 | 0,020 | 0,060 | 1,000 | 0,051 |
THR | 0,141 | -0,063 | 0,104 | -0,184 | -0,355 | 0,135 | -0,186 | -0,057 | 0,135 | 0,140 | 0,077 | -0,012 | -0,125 | 0,051 | 1,000 |
Таблица
3. Матрица корреляций
SB | |
ACTOR | 0.332711 |
ADV | 0.416024 |
BUD | 0.818703 |
CAR | 0.267647 |
COM | 0.068779 |
DIRECTOR | 0.044159 |
DRAMA | -0.291681 |
FANTA | 0.195107 |
FIGHT | 0.174537 |
MAX | 0.641668 |
PRE | 0.390612 |
TIME | 0.451627 |
SEASON | 0.138337 |
STATE | 0.172345 |
THR | 0.091926 |
Проанализируем полученные значения корреляционной матрицы:
На
практике связь между этими двумя
переменными не является явной. В
ходе разработки модели было предложено
использование новой переменной
log(MAX). Проверим, есть ли существенная
зависимость между ней и бюджетом.
LNMAX | SB | |
LNMAX | 1 | 0.409866168261 |
SB | 0.409866168261 | 1 |
Значение
0,41 позволяет говорить об «умеренной»
зависимости между двумя
Таким
образом, мы предполагаем, что факторами,
значимо влияющими на величину кассовых
сборов зарубежных фильмов, являются
бюджет, максимальное число кинотеатров,
продолжительность показа, наличие известных
актеров, наличие приквела, жанр «приключение».
1.3.
Графическое представление
зависимости кассовых
сборов зарубежных фильмов
от основных факторов.
Рисунок 2. зависимость кассовых сборов зарубежных фильмов от количественных факторов.
Рисунок 2 содержит графическое
представление зависимости
Таким
образом, исследователями были выбраны
факторы, наиболее значимо влияющие
на сборы фильмов. Перейдем к поиску
эконометрической модели.
Глава 2. Поиск эконометрической модели
2.1. Линейная модель
Данная глава посвящена построению и оценке моделей, а также, выявлению наиболее адекватной из них. Рассмотрим основные типы моделей, а именно: линейную, логарифмическую и полулогарифмическую, а также предложим свою оригинальную модель.
Для начала построим линейную модель, включив в нее все имеющиеся переменные:
SB = C(1) + C(2)*BUD + C(3)*ACTOR
+ C(4)*TIME + C(5)*MAX + C(6)*ADV + C(7)*PRE + C(8)*CAR + C(9)*COM +
C(10)*DIRECTOR + C(11)*DRAMA + C(12)*FANTA + C(13)*FIGHT + C(14)*SEASON
+ C(15)*STATE + C(16)*THR
Dependent Variable: SB | ||||
Method: Least Squares | ||||
Date: 05/18/08 Time: 19:31 | ||||
Sample: 1 200 | ||||
Included observations: 200 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | -87356186 | 24050108 | -3.632257 | 0.0004 |
BUD | 2.305123 | 0.224880 | 10.25045 | 0.0000 |
ACTOR | 5230277. | 7107703. | 0.735860 | 0.4628 |
TIME | 6227264. | 1088265. | 5.722196 | 0.0000 |
MAX | 15546.52 | 7622.119 | 2.039658 | 0.0428 |
ADV | 46661830 | 22400288 | 2.083091 | 0.0386 |
PRE | 78523004 | 23597280 | 3.327629 | 0.0011 |
CAR | 34072723 | 27314557 | 1.247420 | 0.2138 |
COM | -1998791. | 17041176 | -0.117292 | 0.9068 |
DIRECTOR | -5188663. | 14099403 | -0.368006 | 0.7133 |
DRAMA | -4261813. | 15279910 | -0.278916 | 0.7806 |
FANTA | -43224393 | 20446413 | -2.114033 | 0.0359 |
FIGHT | -16672298 | 19533884 | -0.853507 | 0.3945 |
SEASON | -8698813. | 13865034 | -0.627392 | 0.5312 |
STATE | 2166866. | 19290794 | 0.112326 | 0.9107 |
THR | 4104583. | 16964467 | 0.241952 | 0.8091 |
R-squared | 0.762580 | Mean dependent var | 1.29E+08 | |
Adjusted R-squared | 0.743226 | S.D. dependent var | 1.81E+08 | |
S.E. of regression | 91604914 | Akaike info criterion | 39.58049 | |
Sum squared resid | 1.54E+18 | Schwarz criterion | 39.84435 | |
Log likelihood | -3942.049 | F-statistic | 39.39997 | |
Durbin-Watson stat | 2.144451 | Prob(F-statistic) | 0.000000 |
Модель
1.1
На основе проверки гипотез о значимости каждого коэффициента и уравнения в целом (t-статистики и F-статистика), можно сделать следующие выводы: всего 7 переменных (включая константу) оказались значимыми. Четыре из них на 1% уровне значимости (tкрит.=2,576), три фактора на 5 % уровне (tкрит.=1,96).
Уравнение значимо в целом 39,39997=F-стат> F-крит. = 2,04 на 1% уровне значимости.
В
Главе 1 отмечалось, что графическое
представление зависимости
White Heteroskedasticity Test: | |||
F-statistic | 4.051984 | Probability | 0.000000 |
Obs*R-squared | 59.91547 | Probability | 0.000004 |
Полученный
результат можно проверить
Результаты
теста говорят о наличии
Учтем
этот факт и проведем поправку Уайта.
Тогда данная модель будет иметь
следующий вид:
Dependent Variable: SB | ||||
Method: Least Squares | ||||
Date: 05/18/08 Time: 19:57 | ||||
Sample: 1 200 | ||||
Included observations: 200 | ||||
White Heteroskedasticity-Consistent Standard Errors & Covariance | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | -87356186 | 21211925 | -4.118258 | 0.0001 |
BUD | 2.305123 | 0.284974 | 8.088898 | 0.0000 |
ACTOR | 5230277. | 8611834. | 0.607336 | 0.5444 |
TIME | 6227264. | 1187948. | 5.242036 | 0.0000 |
MAX | 15546.52 | 6220.358 | 2.499296 | 0.0133 |
ADV | 46661830 | 28166381 | 1.656650 | 0.0993 |
PRE | 78523004 | 37039777 | 2.119964 | 0.0353 |
CAR | 34072723 | 40273335 | 0.846037 | 0.3986 |
COM | -1998791. | 16154517 | -0.123730 | 0.9017 |
DIRECTOR | -5188663. | 14648836 | -0.354203 | 0.7236 |
DRAMA | -4261813. | 13529950 | -0.314991 | 0.7531 |
FANTA | -43224393 | 24889359 | -1.736662 | 0.0841 |
FIGHT | -16672298 | 22810062 | -0.730919 | 0.4658 |
SEASON | -8698813. | 14004858 | -0.621128 | 0.5353 |
STATE | 2166866. | 14066915 | 0.154040 | 0.8777 |
THR | 4104583. | 17386786 | 0.236075 | 0.8136 |
R-squared | 0.762580 | Mean dependent var | 1.29E+08 | |
Adjusted R-squared | 0.743226 | S.D. dependent var | 1.81E+08 | |
S.E. of regression | 91604914 | Akaike info criterion | 39.58049 | |
Sum squared resid | 1.54E+18 | Schwarz criterion | 39.84435 | |
Log likelihood | -3942.049 | F-statistic | 39.39997 | |
Durbin-Watson stat | 2.144451 | Prob(F-statistic) | 0.000000 |