История психодиагностики

Автор: Пользователь скрыл имя, 18 Октября 2011 в 20:03, реферат

Описание работы

Психодиагностика как особая научная дисциплина прошла значительный путь развития и становления.
Психологическая диагностика выделилась из психологии и начала складываться на рубеже XX в. Ее возникновение было подготовлено несколькими направлениями в развитии психологии.
Психодиагностика выросла из экспериментальной психологии, а ее возникновение в 1850-1870-е гг. связано с возросшим влиянием естествознания на область психических явлений, с процессом «физиологизации» психологии. Первыми экспериментальными методами психологию снабдили другие науки, главным образом физиология.

Работа содержит 1 файл

история психодиагностики.docx

— 152.11 Кб (Скачать)

31. Очевидная, экологическая, иллюзорная (ложная) валидности

  Очевидная валидность – представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого или другого лица, не располагающего специальными сведениями о характере использования и целях методики. Высокая очевидная валидность является весьма желательной. Она выступает в качестве фактора, побуждающего испытуемых к обследованию, способствует более серьезному и ответственному отношению к работе по выполнению заданий теста и к заключениям, формулируемым психологом.

  Очевидная валидность улучшает применение понятных формулировок и терминов, также заданий, по содержанию являющихся наиболее естественными с учетом возрастной, половой, профессиональной специфики испытуемых. Очевидная валидность иногда носит название внешней (face validity), «доверительной» (faith validity), валидности.

  Экологическая валидность – валидность теста по отношению к измеряемому свойству в контексте определенной ситуации. Экологическая валидность является свойством теста, проявляющимся в том, что его применение при решении различных практических задач ведет к качественно различной интерпретации результатов тестирования (Дружинин В. Н., 1990).

  Введение  понятия экологической валидности связано с проблемой влияния  ситуации на результаты тестирования. Споры между «чертистами» (сторонниками теории черт личности, постулирующими устойчивость в разных ситуациях  форм поведения, соответствующих определенным психическим свойствам) и «ситуационалистами» (утверждающими полное отсутствие влияния  свойств личности на поведение в  конкретной ситуации), хотя и продолжаются по сей день, привели к возникновению и развитию теорий личностно-ситуационного взаимодействия.

  Иллюзорная (ложная) валидность – иллюзия соответствия заключения по результатам тестирования личностным характеристикам обследуемого. Возникает как следствие использования предельно общих, а поэтому применимых практически ко всем обследуемым формулировок, таких, например, как «разумный в выборе цели», «стремящийся к лучшей жизни» и т. п. Такого рода утверждения принимаются почти всеми людьми в качестве точного описания их личности, что создает почву для деятельности различного рода прорицателей и предсказателей. Иллюзорная валидность названа эффектом Барнума (по имени Финиса Барнума, популярного организатора публичных зрелищ, говорившего, что «глупец рождается ежеминутно»).

32. Критерий валидности. Основное психометрическое неравенство. Типы критериев валидности

  Соответствие  теста измеряемому психическому свойству называется валидностью теста. На валидность теста негативно влияют случайные факторы, поэтому в психометрике принято следующее основное психометрическое неравенство:

  Валидность  ≤ Надежность,

  что означает, что валидность не может  превышать надежность теста.

  Помимо  случайных факторов, на валидность теста влияют систематические факторы. Они привносят систематические  искажения в результаты.

  В современной  психометрике разработаны десятки  разнообразных теоретических и  экспериментальных методов проверки валидности тестов. Основным элементом этих методов является так называемый «критерий».

  Критерий  валидности – это независимый от теста, внешний по отношению к тесту источник информации об измеряемом свойстве. Мы не можем судить о валидности теста до тех пор, пока не сравним его результаты с источником истинной (или заведомо более валидной) информации об измеряемом свойстве – с критерием.

  Типы  критериев валидности

  В научных  исследованиях преобладают специальные  лабораторные критерии. Например, конструируется компактный тест-опросник на тревожность. В качестве критерия валидности для него используется специальный трудоемкий объективный лабораторный эксперимент, в котором воспроизводится реальная ситуация тревожности (испытуемым-добровольцам угрожают за ошибочные действия ударами тока).

  На  практике в качестве критерия валидности используются прагматические критерии – показатели эффективности той  деятельности, ради прогнозирования  которой предпринимается тестирование.

  В качестве критерия валидности используется экспертная оценка. Мы хотим убедиться, что короткий тест на измерение уровня дисциплинированности валиден. Для этого проводится опрос  учителей об уровне дисциплинированности хорошо известных им учеников. После  этого сравниваются результаты теста  и экспертный рейтинг учеников по дисциплинированности. Это один из самых простых, популярных методов  эмпирического измерения валидности. Это метод «известных групп». В  психометрическом эксперименте по проверке валидности теста приглашаются испытуемые, при этом известно, к какой группе по критерию они относятся. В случае с тестом дисциплинированности подбираются  ученики, дисциплинированные по данным экспертной оценки учителей («высокая»  группа по критерию) и заведомо недисциплинированные («низкая» группа по критерию). Ученики  со средними показателями по критерию в тестировании не участвуют.

33. Математическое выражение критерия валидности (коэффициент Гилфорда). Основные схемы валидизации психодиагностических

  Меру  совпадения (корреляции) между крайними группами по тесту и по критерию оценивают с помощью самого простого Фи-коэффициента Гилфорда:

  При численности протестированной группы в 30 человек (это минимальная выборка  для проверки валидности) статистически  значимую связь теста с критерием  мы можем констатировать, Phi› 0,36. Хотя это и низкая валидность, но все же тест в данном случае дает значимо лучшие результаты, чем случайное гадание.

  Но  метод «известных групп» обладает серьезным  недостатком. Он не всегда позволяет  использовать тест для прогноза. При  формировании «известных групп» оценивается  поведение, которое происходило  в прошлом, а мы хотим сделать  тест для прогноза поведения, которое  будет происходить в будущем. Многие тесты, используемые в образовательной  психодиагностике, обладают указанным  недостатком. Они проходят в лучшем случае проверку по методике «известных групп» и не обладают прогностической  валидностью (или валидность экспериментально не доказана).

  Решение проблемы прогностической валидности под силу крупным научно-методическим центрам. Ведь к психометрическому  исследованию по проверке прогностической  валидности надо привлекать на порядок  больше испытуемых – не 30, минимум  – 300, так как не известно, кто из этих 300 попадет в крайние группы.

  Мы  хотим использовать тест для прогноза готовности школьников для обучения в вузе. Это типичная прогностическая  психодиагностическая задача. Кто-то должен взяться за программу проверки прогностического потенциала этого теста. Нужно протестировать 300 – 500 школьников, а затем подождать, кто из них поступит в вуз и  будет успешно там учиться. После 2-3-летнего интервала можно сформировать критериальные группы и подсчитать корреляцию с прежними тестовыми  показателями этих бывших школьников. После реализации такой схемы  психометрического эксперимента можно  утверждать, что тест прошел проверку на прогностическую валидность. Без этого мы исходим только из доверия к научной интуиции разработчика теста и не имеем независимых доказательств того, что тест можно использовать для прогноза.

  Различение  обычной дешевой схемы валидизации  теста (по «известным группам») и дорогой  прогностической схемы валидизации  теста – важнейший элемент  психодиагностической грамотности  не только для психологов, но и для  педагогов, как, впрочем, и для любых  заказчиков психодиагностической информации.

34. Тестовые нормы. Корреляция качественных признаков

  Что, несомненно, должен знать и уметь  делать каждый грамотный пользователь теста – это понимать, что такое  тестовые нормы и как ими пользоваться.

  Первоначальный  суммарный балл, подсчитанный с помощью  ключа, не является показателем, который  можно диагностически интерпретировать. Его называют в те-стологии «сырым тестовым баллом». Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы  в «стандартную». Эта процедура  называется «стандартизацией тестового  балла».

  Допустим, мы провели тест из 20 заданий и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет. Для такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.

  Выборка, на которой определяются статистические тестовые нормы, называется выборкой стандартизации. Ее численность, как правило, не меньше 200 человек. Такое количество человек должно принять участие в психометрическом эксперименте по определению тестовых норм – в эксперименте по стандартизации теста.

  Корреляция  качественных признаков – метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований (см. шкалы измерительные). Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов ранговой корреляции, используемых в случаях, когда обе переменные измеряются в шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона (см. критерий X2). Наиболее часто в таких расчетах пользуются коэффициентом сопряженности Пирсона:

  Значение P всегда положительно и измеряется от нуля до единицы. Особенностью коэффициента сопряженности Пирсона является то, что максимальное его значение всегда меньше + 1 и в значительной степени зависит от количества наблюдений (размера таблицы). В случае квадратной таблицы (k x k):

  Так, в таблице размером (5 x 5) Pmax = 0,894; в таблице (10 x 10) Рmax = 0,949. Поэтому окончательной формой выражения связи между переменными с помощью коэффициента Пирсона является его отношение к величине Рmax для данного случая (P/Pmax).

  При расчете сопряженности находит  применение также коэффициент Чупрова:

  где t – число столбцов таблицы;

  k –  число строк таблицы.

  В психологической  диагностике описанные коэффициенты используются относительно редко

35. Ранговая корреляция

  Ранговая  корреляция – метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Ранговая корреляция применяется для анализа связи между признаками, измеряемыми в порядковых шкалах, как метод определения корреляции качественных признаков. Достоинством коэффициентов ранговой корреляции является возможность их использования независимо от характера распределения коррелирующих признаков.

  В практике применяются коэффициенты ранговой корреляции Спирмена и Кендалла. Первым этапом расчета коэффициентов ранговой корреляции является ранжирование рядов  переменных. Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречаются несколько равных по значению переменных, им присваивается  усредненный ранг.

  Таблица 1

  Ранжирование  распределения показателей  теста (n = 18)

 

  В таблице 1 приведены данные для расчета  коэффициентов ранговой корреляции. Во второй графе представлены ранжированные  показатели по первому из сравниваемых распределений (оценка IQ, в третьей  графе – соответствующие им данные теста зрительной памяти).

  Коэффициент корреляции рангов Спирмена (rs)

  определяется  из уравнения:

  где di – разности между рангами каждой переменной из пар значений X и Y;

  n –  число сопоставляемых пар.

  Получаем:

36. Измерительные и метрические шкалы

  Измерительные шкалы (лат. scala – «лестница») – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Шкалы представляют собой метрические системы, моделирующие исследуемый феномен путем замены прямых обозначений изучаемых объектов числовыми значениями и отображение пропорций континуального состава элементов объекта в соответствующих числах. Элементу совокупности проявлений свойств изучаемого объекта соответствует определенный балл или шкальный индекс, количественно устанавливающий положение наблюдаемой единицы на шкале, которая охватывает всю совокупность или ее часть, существенную с точки зрения задач исследования. Операция упорядочивания исходных эмпирических данных в шкальные носит название шкалирования. Шкалы различаются в зависимости от характера функции, лежащей в основе их построения. В качестве такой функции могут служить: сравнение по признаку убывания или возрастания, ранжирование, оценка интенсивности признака или оценка пропорциональных отношений между признаками. Общая классификация измерительных шкал предложена С. Стивенсон. В ее основу положен признак метрической детерминированности. Согласно этому признаку, шкалы делятся на метрические (интервальные и шкалы отношений) и неметрические(номинативные, шкалы порядка).

Информация о работе История психодиагностики