Таблицы сопряженности

Автор: Пользователь скрыл имя, 09 Апреля 2012 в 14:12, реферат

Описание работы

Помимо ответов на вопросы, относящихся к анализу одной переменной, маркетологов часто интересуют дополнительные вопросы о связи этой переменной с другими переменными.
• Как много мужчин среди приверженцев данной торговой марки?

Работа содержит 1 файл

тема 10. вопрос 6.docx

— 48.02 Кб (Скачать)

6. Построение таблиц  сопряженности признаков

Помимо ответов на вопросы, относящихся к анализу одной  переменной, маркетологов часто интересуют дополнительные вопросы о связи  этой переменной с другими переменными.

• Как много мужчин среди  приверженцев данной торговой марки?

• Связано ли использование  товара (потребление его в больших, средних, малых количествах и  не потребление) с отдыхом на открытом воздухе (высокая, средняя и низкая активность)?

• Связана ли осведомленность  о новом товаре с возрастом  и уровнем образования?

• Связана ли покупка  товара с доходом человека (высокий, средний или низкий доход)?

На эти и подобные вопросы  можно ответить с помощью таблицы  сопряженности признаков.

Построение таблиц сопряженности признаков, кросс-табуляция (cross-tabulation) - статистический метод, который одновременно характеризует две или больше переменных и заключается в создании таблиц сопряженности признаков, отражающих совместное распределение двух или больше переменных с ограниченным числом категорий или определенными значениями.

Кросс-табуляция представляет собой процесс объединения распределений  частот значений двух или больше переменных в одну таблицу. Она объясняет, как  одна переменная, например лояльность торговой марке, связана с другой переменной, такой как пол. В таблицах сопряженности признаков показывается совместное распределение значений двух или больше переменных, обладающих ограниченным числом категорий или  принимающих определенные значения. Категории одной переменной помешают в таблицу так, чтобы они размещались  в ней (сопрягались) в соответствии с категориями другой или другими  несколькими переменными.

Предположим, нас интересует, действительно ли использование  Internet связано с полом. Чтобы построить таблицу сопряженности признаков, респондентов разделили в зависимости от того, сколько времени они пользуются сетью. Пользующихся Internet пять часов и меньше отнесли к мало пользующимся, а остальных — ко много. Итог процедуры кросс-табуляции приведен в таблице.

 

 Таблица 3. Пол и использование Internet

использование интернет

пол

итого

мужчины

женщины

Мало (1)

5

10

15

Много(2)

10

5

15

итого

15

15

 

 

Кросс-табуляция предусматривает  создание ячейки для каждой комбинации категорий двух переменных. Число  в каждой ячейке показывает количество респондентов, давших эту комбинацию ответов. В таблице видим, что 10 респондентов, ответивших, что они мало используют Internet — женщины. Итоговые значения таблицы показывают, что из 30 респондентов с достоверными ответами по обеим переменным 15 человек ответили, что они мало используют Internet, a 15 — много. Что касается пола, то 15 респондентов оказались женщинами, а 15 — мужчинами. Обратите внимание, что эту информацию можно было бы получить из отдельного распределения частот для каждой переменной.

Рассматриваемые данные должны быть качественными или категориальными, поскольку предполагается, что каждая переменная должна измеряться только по номинальной шкале.

Таблицами сопряженности  широко пользуются при проведении прикладных маркетинговых исследований, поскольку:

• менеджеры, которые недостаточно владеют статистическими методами, легко интерпретируют и понимают процедуру кросс-табуляции и ее результаты;

• очевидность трактовки  результатов анализа ясно свидетельствует  о возможных управленческих действиях;

• ряд операций кросс-табуляции  позволяет лучше понять сложное  явление, чем это сделал бы один многовариантный  анализ;

• кросс-табуляция облегчает  проблему разбросанных ячеек, которая затрудняет дискретный многовариантный анализ;

• анализ методом кросс-табуляции  прост для выполнения и поэтому  обращен к исследователям, менее  искушенным в вопросах статистики.

Мы рассмотрим построение таблиц сопряженности для  двух и трех переменных.

Две переменные

Кросс-табуляцию с двумя  переменными можно рассматривать  как двумерную. Сначала рассмотрим кросс-табуляцию данных, касающихся пола и использования Internet, представленную в табл. 3. Связано ли использование Internet с полом? Это можно выяснить из табл. 3. Мы видим, что непропорционально большое количество респондентов, проводящих много времени в Internet, — мужчины. Лучше понять этот вопрос поможет процентное вычисление.

Исходя из того, что обе  переменные подвергаются процедуре  кросс-табуляции, мы можем посчитать  проценты применительно к колонке (табл. 4) либо к строке (табл. 5).

Таблица 4. Использование Internet в зависимости от пола

Пользование интернет

пол

мужчины

женщины

Мало

33,3%

66,7%

Много

66,7%

33,3%

итого

100%

100%


Таблица 5. Пол человека в зависимости от использования Internet

Пол

Использование интернет

мало

много

Итого

Мужчины

33,3%

66,7%

100%

женщины

66,7%

33,3%

100%


Какая из этих двух таблиц полезнее? Ответ на данный вопрос зависит от того, какая переменная рассматривается как независимая, а какая как зависимая. Общее правило, которое необходимо соблюдать, гласит: проценты необходимо вычислять для каждой категории независимой переменной (так, чтобы суммарное значение категорий зависимой переменной применительно к каждой категории независимой переменной давало 100%). В нашем анализе пол можно рассматривать как независимую переменную, использование Internet — как зависимую, а правильный способ вычисления процентов показан в табл. 4. Заметим, что мужчины больше используют Internet, чем женщины. Это видно из того, что 66,7%, активно пользующихся Internet, составляют мужчины, тогда как на долю женщин в этой категории приходится всего лишь 33,3%.

Вычисление процентов  в направлении зависимой переменной через независимую, как показано в табл. 5, бессмысленно. Табл. 5 подразумевает, что интенсивное пользование Internet — причина того, что такими людьми являются мужчины. Это последнее утверждение неправдоподобно. Однако, возможно, что связь между пользованием Internet и полом человека опосредована третьей переменной, например возрастом или доходом. Поэтому необходимо проверить влияние третьей переменной.

Три переменные

Часто введение третьей переменной позволяет маркетологу четче  уяснить природу исходной связи между двумя переменными. Третья переменная может привести к четырем возможностям.

1. Уточнить связь, наблюдаемую  между двумя исходными переменными.

2. Указать на отсутствие  связи между двумя переменными, хотя первоначально связь наблюдалась. Другими словами, третья переменная покажет, что исходная связь между двумя переменными была ложной.

3. Показать некоторую  связь между двумя переменными,  хотя первоначально она не наблюдалась. В этом случае третья переменная показывает скрытую связь между первыми двумя переменными.

4. Не показать никаких  изменений в первоначальной связи.

Эти возможности объясняются  на примерах, в основе которых лежит выборка в тысячу респондентов.

Уточнение исходной связи. В результате изучения связи между покупкой модной одежды и семейным положением получены данные, приведенные в табл. 6.

Таблица 6. Покупка модной одежды в зависимости от семейного положения

Покупка модной одежды

Семейное положение

Женат (замужем)

Не женат (не замужем)

Много

31%

52%

Мало

69%

48%

Итого

100%

100%

Число респондентов

700

300


 

Респондентов поделили на две категории покупателей модной одежды: много покупающие и мало покупающие. Семейное положение тоже имело две категории: женат (замужем) либо не женат (не замужем). Как видно из табл. 6, в категорию лиц, покупающих много модной одежды, попали 52% несемейных респондентов и только 31% семейных. Перед тем как заключить, что респонденты, не имеющие семьи, покупают больше модной одежды, чем имеющие семью, в анализ была введена третья переменная — пол.

 

Таблица 7. Связь покупки модной одежды с семейным положением

Покупка модной одежды

пол

мужской

женский

женат

неженат

замужем

Не замужем

много

35%

40%

25%

60%

мало

65%

60%

75%

40%

итого

100%

100%

100%

100%

Число респондентов

400

120

300

180


Пол респондентов вводился в качестве третьей переменной на основании результатов предшествующего маркетингового исследования. Связь между покупкой модной одежды и семейным положением пересмотрена в свете третьей переменной, как показано в табл.7. Что касается женщин, то из них 60% незамужних попали в категорию покупающих больше модной одежды по сравнению с 25% замужних женщин. С другой стороны, для мужчин эта разница в процентах не так велика: 40% холостых и 35% женатых попали в категорию покупателей, приобретающих много модной одежды. Следовательно, третья переменная уточнила связь между семейным положением и покупкой модной одежды (начальными переменными). Вероятность попадания в категорию покупателей, приобретающих много модной одежды, выше для несемейных респондентов по сравнению с семейными, причем она выше для женщин.

Исходная связь  между двумя переменными ложна.

Маркетолог проводит исследование для рекламного агентства, разрабатывающего рекламу для автомобилей стоимостью свыше 30 тысяч долларов. Он попытался проанализировать факторы, влияющие на владение дорогими автомобилями (табл. 8).

Таблица 8. Зависимость владения дорогами автомобилями от образовательного уровня

Наличие дорогого автомобиля

Образование

Выпускник колледжа

Без степени колледжа

Да

32%

21%

Нет

68%

79%

Итого

100%

100%

Число респондентов

250

750


Из таблицы видно, что 32% выпускников колледжа имеют дорогой  автомобиль, в то время как среди не окончивших колледж дорогим автомобилем владеют только 21%. Исследователь убежден, что уровень образования влияет на приобретение дорогого автомобиля. Решив, что на его покупку влияет и доход, исследователь перепроверил связь между образованием и наличием дорогого автомобиля в свете уровня доходов. Результаты приведены в табл.9.

Таблица 9. Влияние образования и уровня дохода на наличие дорогого автомобиля.

Наличие дорогого автомобиля

Доход

низкий

высокий

образование

образование

колледж

нет

колледж

нет

да

20%

20%

40%

40%

нет

80%

80%

60%

60%

итого

100%

100%

100%

100%

Число респондентов

100

700

150

50


Заметим, что процент тех, кто имеют дорогой автомобиль среди окончивших колледж или не окончивших его, одинаков для каждой из групп, разбитых по доходу. Если данные по группам с высокими и низкими доходами проверить отдельно, то связь между образованием и наличием дорогого автомобиля исчезает, а это значит, что первоначально наблюдаемая связь между этими двумя переменными была ложной. Третья переменная показывает подавленную связь между первыми двумя переменными.

Информация о работе Таблицы сопряженности