Анализ рынка фильмов

Автор: Пользователь скрыл имя, 02 Ноября 2011 в 10:32, реферат

Описание работы

Цель и задачи исследования. Целью исследования является выявление зависимости между мировыми кассовыми сборами на зарубежные фильмы, появившиеся в широком прокате в период с 2006 по 2008 годы, и факторами, которые непосредственно влияют на данные сборы. В качестве таких факторов исследователи выбрали следующие:
количественные
Бюджет фильма
Количество известных актеров (известность будет оцениваться исходя из рейтингов)
Продолжительность показа фильма(надели)
Максимальное число кинотеатров

Содержание

Введение..................................................................................................................3
Глава 1. Данные......................................................................................................5
Описание данных.........................................................................................5
Предварительный анализ данных..............................................................8
Графическое представление зависимости кассовых
сборов зарубежных фильмов от основных факторов....................................10
Глава 2. Поиск эконометрической модели..........................................................11
2.1 Линейная модель.........................................................................................11
2.2 Полулогарифмическая модель...................................................................16
2.3 Логарифмическая модель...........................................................................16
2.4 Оригинальная модель.................................................................................17
2.5 Анализ модели на устойчивость................................................................18
Глава 3. Оценка адекватности итоговой модели и возможные
способы ее улучшения...........................................................................................21
3.1 Улучшение эффективности оценок. Двухшаговая процедура...............21
3.2 Выводы.........................................................................................................23
Заключение.............................................................................................................24
Приложения............................................................................................................26

Работа содержит 1 файл

Анализ мировых кассовых сборов зарубежных фильмов.doc

— 1.80 Мб (Скачать)

   Таблица 1. Основные исследуемые  показатели

                                                          

     При последовательном изучении информации взято 200 наблюдений. Ниже представлены причины, по которым собранные данные были учтены в дальнейшем анализе не полностью:  

    • Пробелы в  данных (большинство) – отсутствие информации о бюджете фильма, кассовом сборе, продолжительности показа и  максимальном числе кинотеатров;
    • Критические случаи – слишком большой разброс бюджета и кассовых сборов.
 
 

Приведем  основные статистики по анализируемым  показателям

  MAX BUD TIME ACTOR
Mean 2080.215 45549325 11.42900 1.040000
Median 2459.000 30000000 11.00000 1.000000
Maximum 4362.000 3.00E+08  35.30000 5.000000
Minimum 1.000000 15000.00 0.400000 0.000000
Std. Dev. 1311.228 47962368 6.437567 1.060198

Таблица 2.1. Статистика по количественным показателям

      Из  таблицы видно, что средний бюджет зарубежного фильма составляет примерно 45,5 млн $. Продолжительность фильма составляет в среднем примерно 11 с половиной недель, и в среднем в каждом фильме снимается 1 известный актер. Максимальное количество кинотеатров в среднем перешагивает отметку 2000.

      
  FANTA FIGHT THR PRE SEASON STATE ADV CAR COM DIRECTOR DRAMA
Mean 0.150 0.175 0.295 0.100 0.400 0.835 0.135 0.075 0.280 0.390 0.395

      Более 80% фильмов выборки произведены  в США (скорее всего будет незначимым), примерно 40% картин снимают известные  режиссеры. И основным жанром является драма (почти 40%). Примерно 30% фильмов снимаются в жанре Триллер.  

1.2.Предварительный  анализ данных

     Для того чтобы сформулировать основные гипотезы относительно влияния факторов (в том числе, гипотезы о значимости влияния) и проверить догадки, проанализируем корреляционную матрицу (Таблица 2). Кроме этого, ее анализ даст возможность подтвердить предварительные предположения относительно мультиколлинеарности признаков.

  ACTOR ADV BUD CAR COM DIRECTOR DRAMA FANTA FIGHT MAX PRE TIME SEASON STATE THR
ACTOR 1,000 0,137 0,397 -0,029 0,061 0,241 -0,050 0,077 -0,017 0,275 0,066 0,082 0,104 0,170 0,141
ADV 0,137 1,000 0,444 0,110 -0,051 0,074 -0,170 0,285 0,319 0,264 0,161 0,147 0,096 0,018 -0,063
BUD 0,397 0,444 1,000 0,252 0,016 0,071 -0,289 0,350 0,255 0,665 0,336 0,284 0,167 0,165 0,104
CAR -0,029 0,110 0,252 1,000 0,161 -0,072 -0,191 0,040 -0,031 0,243 0,032 0,129 0,155 0,075 -0,184
COM 0,061 -0,051 0,016 0,161 1,000 -0,042 -0,026 -0,137 -0,229 0,178 -0,022 0,118 0,105 0,157 -0,355
DIRECTOR 0,241 0,074 0,071 -0,072 -0,042 1,000 0,130 0,037 -0,045 0,019 -0,027 0,035 0,038 0,079 0,135
DRAMA -0,050 -0,170 -0,289 -0,191 -0,026 0,130 1,000 -0,168 -0,238 -0,366 -0,201 -0,122 0,050 -0,137 -0,186
FANTA 0,077 0,285 0,350 0,040 -0,137 0,037 -0,168 1,000 0,175 0,229 0,047 0,043 0,000 0,036 -0,057
FIGHT -0,017 0,319 0,255 -0,031 -0,229 -0,045 -0,238 0,175 1,000 0,182 0,197 -0,046 -0,027 -0,043 0,135
MAX 0,275 0,264 0,665 0,243 0,178 0,019 -0,366 0,229 0,182 1,000 0,287 0,278 0,054 0,364 0,140
PRE 0,066 0,161 0,336 0,032 -0,022 -0,027 -0,201 0,047 0,197 0,287 1,000 0,057 0,068 0,103 0,077
TIME 0,082 0,147 0,284 0,129 0,118 0,035 -0,122 0,043 -0,046 0,278 0,057 1,000 0,123 0,020 -0,012
SEASON 0,104 0,096 0,167 0,155 0,105 0,038 0,050 0,000 -0,027 0,054 0,068 0,123 1,000 0,060 -0,125
STATE 0,170 0,018 0,165 0,075 0,157 0,079 -0,137 0,036 -0,043 0,364 0,103 0,020 0,060 1,000 0,051
THR 0,141 -0,063 0,104 -0,184 -0,355 0,135 -0,186 -0,057 0,135 0,140 0,077 -0,012 -0,125 0,051 1,000

Таблица 3. Матрица корреляций 

  SB
ACTOR   0.332711
ADV   0.416024
BUD   0.818703
CAR   0.267647
COM   0.068779
DIRECTOR   0.044159
DRAMA -0.291681
FANTA   0.195107
FIGHT   0.174537
MAX   0.641668
PRE   0.390612
TIME   0.451627
SEASON   0.138337
STATE   0.172345
THR   0.091926
 

Проанализируем  полученные значения корреляционной матрицы:

  • Существует высокая корреляция  между бюджетом и максимальным числом кинотеатров (0,66), что наводит на мысль о  наличии мультиколлинеарности между этими регрессорами.

      На  практике связь между этими двумя  переменными не является явной. В  ходе разработки модели было предложено использование новой переменной log(MAX). Проверим,  есть ли существенная зависимость между ней и бюджетом. 

  LNMAX SB
LNMAX 1 0.409866168261
SB 0.409866168261 1
 

      Значение 0,41 позволяет говорить об «умеренной»  зависимости между двумя переменными.

  • Самая высокая корреляция  с кассовыми сборами фильмов – у бюджета и максимального числа кинотеатров (0,82 и 0,64 соответственно).
  • Достаточно высокая зависимость есть между кассовыми сборами и продолжительностью показа (0,45). Менее коррелированны  со сборами жанры фильмов: только Приключения имеют высокую корреляцию (0,41). Стоит также отметить возможную зависимость сборов от количества известных актеров, снявшихся в картине (0,33), и от наличия приквелов (0,39).

      Таким образом,  мы предполагаем, что факторами, значимо влияющими на величину кассовых сборов зарубежных фильмов, являются  бюджет, максимальное число кинотеатров, продолжительность показа, наличие известных актеров, наличие приквела, жанр «приключение». 

1.3. Графическое представление зависимости кассовых сборов зарубежных фильмов от основных факторов. 

              

             

Рисунок 2. зависимость кассовых сборов зарубежных фильмов от количественных факторов.

        Рисунок 2 содержит графическое  представление зависимости кассовых  сборов от бюджета, продолжительности  показа, максимального числа кинотеатров  и количества известных актеров.  Исходя из полученных графиков, можно сделать предположение о линейной положительной зависимости сборов от всех 4 регрессоров. Графическое представление также дает возможность оценить разбросы в данных и предположить гетероскедастичность, которая явно просматривается в Бюджете и Продолжительности показа.

      Таким образом, исследователями были выбраны  факторы, наиболее значимо влияющие на сборы фильмов. Перейдем к поиску эконометрической модели. 

Глава 2. Поиск эконометрической модели

2.1. Линейная модель

      Данная  глава посвящена построению и оценке моделей, а также, выявлению наиболее адекватной из них. Рассмотрим основные типы моделей, а именно: линейную, логарифмическую и полулогарифмическую, а также предложим свою оригинальную модель.

      Для начала построим линейную модель, включив в нее все имеющиеся переменные:

SB = C(1) + C(2)*BUD + C(3)*ACTOR + C(4)*TIME + C(5)*MAX + C(6)*ADV + C(7)*PRE + C(8)*CAR + C(9)*COM + C(10)*DIRECTOR + C(11)*DRAMA + C(12)*FANTA + C(13)*FIGHT + C(14)*SEASON + C(15)*STATE + C(16)*THR 

Dependent Variable: SB
Method: Least Squares
Date: 05/18/08   Time: 19:31
Sample: 1 200
Included observations: 200
Variable Coefficient Std. Error t-Statistic Prob. 
C -87356186 24050108 -3.632257 0.0004
BUD 2.305123 0.224880 10.25045 0.0000
ACTOR 5230277. 7107703. 0.735860 0.4628
TIME 6227264. 1088265. 5.722196 0.0000
MAX 15546.52 7622.119 2.039658 0.0428
ADV 46661830 22400288 2.083091 0.0386
PRE 78523004 23597280 3.327629 0.0011
CAR 34072723 27314557 1.247420 0.2138
COM -1998791. 17041176 -0.117292 0.9068
DIRECTOR -5188663. 14099403 -0.368006 0.7133
DRAMA -4261813. 15279910 -0.278916 0.7806
FANTA -43224393 20446413 -2.114033 0.0359
FIGHT -16672298 19533884 -0.853507 0.3945
SEASON -8698813. 13865034 -0.627392 0.5312
STATE 2166866. 19290794 0.112326 0.9107
THR 4104583. 16964467 0.241952 0.8091
R-squared 0.762580     Mean dependent var 1.29E+08
Adjusted R-squared 0.743226     S.D. dependent var 1.81E+08
S.E. of regression 91604914     Akaike info criterion 39.58049
Sum squared resid 1.54E+18     Schwarz criterion 39.84435
Log likelihood -3942.049     F-statistic 39.39997
Durbin-Watson stat 2.144451     Prob(F-statistic) 0.000000

Модель 1.1 
 

      На  основе проверки гипотез о значимости каждого коэффициента и уравнения  в целом    (t-статистики и F-статистика), можно сделать следующие выводы: всего 7 переменных (включая константу) оказались значимыми. Четыре из них на 1% уровне значимости (tкрит.=2,576), три фактора на 5 % уровне (tкрит.=1,96).

      Уравнение значимо в целом 39,39997=F-стат> F-крит. = 2,04 на 1% уровне значимости.

      В Главе 1 отмечалось, что графическое  представление зависимости кассовых сборов от бюджета наталкивает на предположение об  отсутствии гомоскедастичности.  Для проверки этого предположения  проведем White Test и получим следующий результат: 

White Heteroskedasticity Test:
F-statistic 4.051984    Probability 0.000000
Obs*R-squared 59.91547    Probability 0.000004
 

   Полученный  результат можно проверить наглядно на рисунке остатков: 

 

   Результаты  теста говорят о наличии гетероскедастичности в модели.

      Учтем этот факт и проведем поправку Уайта. Тогда данная модель будет иметь  следующий вид: 
 
 
 
 
 
 
 

Dependent Variable: SB
Method: Least Squares
Date: 05/18/08   Time: 19:57
Sample: 1 200
Included observations: 200
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob. 
C -87356186 21211925 -4.118258 0.0001
BUD 2.305123 0.284974 8.088898 0.0000
ACTOR 5230277. 8611834. 0.607336 0.5444
TIME 6227264. 1187948. 5.242036 0.0000
MAX 15546.52 6220.358 2.499296 0.0133
ADV 46661830 28166381 1.656650 0.0993
PRE 78523004 37039777 2.119964 0.0353
CAR 34072723 40273335 0.846037 0.3986
COM -1998791. 16154517 -0.123730 0.9017
DIRECTOR -5188663. 14648836 -0.354203 0.7236
DRAMA -4261813. 13529950 -0.314991 0.7531
FANTA -43224393 24889359 -1.736662 0.0841
FIGHT -16672298 22810062 -0.730919 0.4658
SEASON -8698813. 14004858 -0.621128 0.5353
STATE 2166866. 14066915 0.154040 0.8777
THR 4104583. 17386786 0.236075 0.8136
R-squared 0.762580     Mean dependent var 1.29E+08
Adjusted R-squared 0.743226     S.D. dependent var 1.81E+08
S.E. of regression 91604914     Akaike info criterion 39.58049
Sum squared resid 1.54E+18     Schwarz criterion 39.84435
Log likelihood -3942.049    F-statistic 39.39997
Durbin-Watson stat 2.144451     Prob(F-statistic) 0.000000

Информация о работе Анализ рынка фильмов