Психометрика — это… Что такое Психометрика?
психометрика — (или психометрия) совокупность теоретико математических моделей и процедурно методических правил организации сбора и обработки эмпирических данных, позволяющих выразить психические свойства и параметры психических процессов в числовой или… … Большая психологическая энциклопедия
Психометрика — область психологии, которая изучает теоретические и методологические проблемы измерений во всех др. областях психологии; разрабатывает математические модели для методов психологического измерения (напр., модель Терстоуна, модель многомерного… … Словарь по психогенетике
Психометрика (psychometrics) — Область П. (или психометрии) связана с количественным подходом к анализу тестовых данных. П. включает два раздела: теорет. и прикл. Психометрическая теория обеспечивает исследователей и психологов мат. моделями, используемыми при анализе ответов… … Психологическая энциклопедия
психодиагностика — (от греч. psyche душа и diagnostikos способный распознавать) область психологической науки, разрабатывающая методы выявления и измерения индивидуально психологических особенностей личности. Начавшись с попыток «охватить числом операции ума» (Ф.… … Большая психологическая энциклопедия
ЕРЕМЕЕВ Борис Алексеевич — (р. 1947) российский психолог, спец. в обл. социальной и пед. психологии. Докт. психол. наук (2003), проф. В 1972 г. окончил ф т психологии ЛГУ. В 1975 г. окончил аспирантуру ф та психологии ЛГУ. Защитил канд. дис.: «Изучение социальной перцепции … Психология общения. Энциклопедический словарь
Ежегодники психических измерений (mental measurement yearbooks)
Измерение (measurement) — Психол. исслед. фокусируется на отношениях между наблюдаемыми переменными. Психол. теория занимается отношениями между конструктами. Эти теорет. конструкты обычно операционально определяются через наблюдаемые переменные. Как в теории, так и в… … Психологическая энциклопедия
Клинический прогноз в сравнении со статистическим (clinical versus statistical prediction)
Конструирование измерительных инструментов (instrument design) — Слово «инструмент» при его употреблении в контексте соц. наук может относиться ко всему, что позволяет осуществлять измерение. Напр., IQ тест инструмент, предназначенный для измерения интеллекта. Др. типы широко используемых инструментов включают … Психологическая энциклопедия
Культурно свободные тесты (culture fair tests) — Термин «К. с. т.» относится к тестам, «справедливым» в отношении любой конкретной культурной группы. И хотя технически невозможно разраб. тест, полностью лишенный систематических ошибок, обусловленных культурными факторами, существует множество… … Психологическая энциклопедия
как Вышка отвечает на вызовы будущего – Национальный исследовательский университет «Высшая школа экономики»
разрабатывает, адаптирует и анализирует измерительные инструменты применительно к характеристикам личности, компетенциям и навыкам, образовательным достижениям индивидов, карьерному развитию и другим абстрактным атрибутам; оценивает логику, качество и надежность тестов, а также анализирует факторы, которые влияют на их результаты
Валидность, надежность, сопоставимость и справедливость – это не только вопросы, возникающие в задачах количественного измерения; это социальные ценности, которые имеют значение и силу в любой области, где формируются оценочные суждения и выносятся решения
Самуэль Мессик, американский психолог (Источник)
Во многих сферах все больше возникает необходимость в измерении абстрактных атрибутов личности (латентных конструктов) — системного мышления, внимательности, стрессоустойчивости, вовлеченности в процесс, креативности и т.д. Важность такого рода тестов часто очень высока, ведь от их результатов могут зависеть ключевые для организаций и людей решения (прием на работу, выдача водительских прав, сертификатов о получении образования и др.). Это порождает спрос на специалистов по психометрике, которые занимаются разработкой измерительных инструментов, соответствующих международным стандартам качества.
Психометрики разрабатывают тесты и задания, оценивают их логику, результаты — и факторы, которые на них влияют. Ключевая задача — создать инструмент, соответствующий критериям надежности и валидности. Это означает, что результаты качественного теста должны быть воспроизводимыми и не зависеть от условий его проведения, а также быть обоснованным с точки зрения конкретного приложения. То есть, тест должен измерять именно тот конструкт, ради которого он был создан: например, при анализе теста на оценку за прохождение онлайн-курса психометрику важно понимать, какой процент ответов обусловлен угадыванием, а какой — реальными знаниями слушателя. Специалисты по психометрике востребованы в HR-департаментах коммерческих и государственных компаний, проектах, связанных с рекрутментом, управлением талантами и оценкой персонала, в научных и консалтинговых организациях, создающих инструменты для оценки качества образования, в сфере маркетинга (анализ поведения клиентов), психодиагностики и психологических измерений.
Драйверы профессии
- Рост требований к количественному обоснованию принятия решений
- Объективность, быстрота и относительно низкая стоимость психометрических тестов
- Рост популярности геймифицированных инструментов для оценки абстрактных атрибутов
Задачи, которые решает специалист
- Разработка тестов, опросников, методик оценки личности
- Оценка качества, валидности и надежности аналитических измерительных инструментов
- Разработка методологии и организация исследований (например, мониторинговых или оценочных) разного уровня — от локальных до национальных и международных
- Интерпретация результатов психометрических измерений
Необходимые компетенции, знания, навыки
- Методология качественных и количественных исследований в социальных науках
- Подходы к измерениям в психологии и образовании
- Теория и практика тестирования
- Принципы разработки контрольно-измерительных материалов
- Анализ данных и работа со статистическими пакетами
Магистерская программа НИУ ВШЭ
Цифры и факты
ДРУГИЕ ПРОФЕССИИ НАПРАВЛЕНИЯ «ДЕМОГРАФИЧЕСКИЕ И СОЦИАЛЬНЫЕ ТРАНСФОРМАЦИИ»
Психометрика появилась более века назад и изначально измеряла уровень знаний человека через совокупность правильно выполненных заданий. В настоящее время спектр задач этой науки намного шире, начиная с персонализированного обучения и анализа пользователей в социальных сетях и заканчивая медицинской аналитикой. Сегодня флагманами в психометрике являются Нидерланды, Бельгия, Великобритания и США. Именно в этих странах уже более ста лет разрабатываются новые подходы и математические модели вычислительной науки о поведении. В России психометрика как наука стала развиваться фактически в начале 2000-х, а в 2016 г. в Дирекции по онлайн-обучению НИУ ВШЭ был создан первый в стране центр, специализирующийся на психометрических исследованиях в онлайн-образовании. Автор Дарья КРАВЧЕНКО, ведущий аналитик Центра психометрических исследований в онлайн-образовании НИУ ВШЭ ЧТО ТАКОЕ ПСИХОМЕТРИКА И ЗАЧЕМ ОНА НУЖНА Психометрика — это область науки о поведении (behavioral science), которая занимается измерениями и математическим моделированием латентных конструктов и процессов в образовании и психологии. Латентный — значит невидимый, ненаблюдаемый. Например, знания — латентный конструкт: невозможно пронаблюдать, сколько их в голове у человека. В этом случае моделируют ситуацию, в которой человек может проявить свои знания. Тесты, опросники, задачники существуют, для того чтобы на основе ответов — верных или неверных — и с помощью специально разработанного математического аппарата установить связь между наблюдениями и интересующими нас латентными переменными. На сегодняшний день в психометрике чётко прослеживаются два направления: прикладное и вычислительное. Прикладная психометрика располагается на пересечении психологии, педагогики и базовой статистики: она занимается разработкой тестов, анкет, опросов и обработкой собранных с их помощью данных для измерения знаний, способностей и психологических особенностей человека. Вычислительная психометрика сравнительно новая область, комбинирующая методы компьютерных наук и теоретическую психометрику для более глубокого моделирования и объяснения поведения человека. Например, информация о том, сколько попыток решить задание сделал студент, какой вопрос задал на форуме, как часто пересматривал видеолекцию на онлайн-платформе, позволяет сделать более точные выводы о его знаниях. Но для того чтобы сформулировать такие выводы, требуются новые вычислительные методы, разработкой которых и занимается вычислительная психометрика. ПСИХОМЕТРИЧЕСКАЯ АНАЛИТИКА ОНЛАЙН-КУРСОВ В НИУ ВШЭ Центр психометрических исследований в онлайн-образовании отвечает за качество измерений в онлайн-курсах НИУ ВШЭ. Мы консультируем авторов курсов о том, как правильно планировать разработку и составлять измерительные инструменты, рассказываем им о требованиях и даём базовые рекомендации. В процессе создания контента для курса участвуем в содержательной экспертизе измерительных инструментов. Нам поступает большое количество тестов, заданий с открытым ответом, задач, кейсов. Все эти материалы мы рассматриваем с точки зрения корректности формулировок, ответных опций, наличия или отсутствия подсказок в ответах или в вопросах, а также в целом анализируем композицию измерительного инструмента. Каждое задание оценивается с точки зрения его направленности на измерение педагогических целей: запоминания учебного материала, его понимания или применения. Хороший измерительный инструмент должен содержать в себе задания всех трёх видов. И если мы выявляем какие-то моменты, которые можно улучшить в измерительном инструменте, то даём обратную связь преподавателю: пишем о том, что можно было бы усовершенствовать. Например, считаем, что стоит добавить задания на применение материала, и приводим примеры, опираясь на которые педагоги могут разработать свои. Мы называем этот процесс содержательной экспертизой. После того как курс прошёл годичный цикл, мы выгружаем данные с платформ, где размещаются курсы НИУ ВШЭ. Под данными мы понимаем цифровой след — это любая активность студента на платформе онлайн-обучения, например регистрация на курсе, просмотр видеолекций, решение проверочных заданий, работа на форуме курса. Все эти действия фиксируются и сохраняются платформой. Психометрический анализ данных проводится по нескольким блокам: трудность контента, просматриваемость видеолекций, измерительные инструменты и наличие прироста в подготовленности студентов. Далее формируем рекомендации для преподавателя, на основе которых он вносит доработки в курс. Скажем, в части оценочных инструментов мы нередко рекомендуем заменить проблемные задания. ЭТАПЫ РАБОТЫ С СЕРВИСОМ ПСИХОМЕТРИЧЕСКОЙ АНАЛИТИКИ ОНЛАЙН-КУРСОВ НА РЕСУРСЕ ОДНОГО ОКНА В 2017 г. НИУ ВШЭ получил грант Минобрнауки России на разработку и внедрение методики и инструментария психометрической аналитики онлайн-курсов в рамках приоритетного проекта «Современная цифровая образовательная среда в Российской Федерации». Основным результатом работы стал сервис психометрической аналитики онлайн-курсов, запущенный в конце 2018 г. и интегрированный в так называемый Ресурс одного окна (РОО, online.edu.ru) — платформу, на которой могут размещать свой контент правообладатели онлайн-курсов Российской Федерации: любые университеты, организации и коммерческие компании. Сервис доступен на этой платформе как дополнительная опция для правообладателей, которые могут воспользоваться ею в качестве инструмента, позволяющего анализировать данные. Каждый правообладатель курсов на РОО может зайти в личный кабинет, в котором представлен целый ряд услуг, в том числе портфолио, оценка работодателями конкретного онлайн-курса и сервис психометрической аналитики. Выглядит он как обычное поле для прикрепления файла, куда правообладатель загружает данные и нажимает кнопку «Отправить». Если они корректны, то в течение нескольких минут появляется ссылка на отчёт — PDF-файл с аналитикой по курсу. Важно пояснить, что для нормальной работы сервиса загружаемый контент должен соответствовать определённой структуре. Поскольку в основу работы сервиса положен конкретный алгоритм, для осуществления корректной аналитики правообладателю необходимо предварительно вычленить нужные данные. Это делается с помощью конвертера, который, как показала практика, разрабатывается правообладателями под конкретную платформу без особых проблем. Обычно на его подготовку у программистов университета уходит не более двух недель. Мы предоставляем полное описание структуры данных, в которой описаны переменные — параметры, необходимые для аналитики (ID слушателя курса, оценки по тестам, данные о том, как студент просматривает видеолекции, и др.). На эту структуру программист ориентируется при разработке. Такие конвертеры, например, уже созданы для Национальной платформы открытого образования, «Лекториума», для собственных онлайн-платформ Высшей школы экономики («Онлайн-образование в НИУ ВШЭ») и Томского государственного университета. Правообладатели курсов на этих платформах имеют возможность выгружать на РОО уже сконвертированные данные. СТРУКТУРА АНАЛИТИЧЕСКОГО ОТЧЁТА Аналитический отчёт включает в себя четыре блока. ПЕРВЫЙ БЛОК — это анализ трудности, т.е. информация о том, насколько контент внутри курса (а чаще всего это видеоматериалы) был доступен для слушателей. Обычно онлайн-курс состоит из тем или из модулей, и правообладателю доступны данные о трудности по каждой отдельной теме: насколько она была сложной или, наоборот, лёгкой для освоения студентами. Как разработчики сервиса мы считаем, что каждый правообладатель должен ориентироваться прежде всего на цели своего курса. Если курс носит ознакомительный характер, то, безусловно, он не должен быть очень трудным. Если же курс академический и его задача — обучить, а по итогам измерить образовательный результат (выдать сертификат, поставить оценку), то в этом случае необходимо обратиться к рекомендациям, которые мы даём. ВТОРОЙ БЛОК посвящён анализу подготовленности студентов и содержит информацию о её приросте к концу курса. Важно, чтобы подготовленность студентов в ходе освоения курса повышалась. Отсутствию такого прогресса есть несколько объяснений. Например, может оказаться, что на курс записались хорошо подготовленные слушатели; в таком случае он не даёт для их прогресса значимого эффекта. Или же, наоборот, студентам в целом трудно обучаться на курсе: они не справляются со сложными заданиями и поэтому прироста знаний не происходит. ТРЕТИЙ БЛОК — это данные, полученные в результате анализа взаимодействия слушателей с учебным контентом. Они представляют собой таблицу, в которой представлено число слушателей, просматривавших видеоматериалы курса. Если активность низкая, то необходимо работать с контентом. В данном случае мы рекомендуем использовать ссылки на материалы внутри курса, на внешние ресурсы или на контент на форумах. ЧЕТВЁРТЫЙ БЛОК посвящён анализу измерительных инструментов в онлайн-курсе. Автор получает информацию о распределении всех заданий в курсе по трудности. Допустим, оказалось, что в курсе 80% заданий лёгкие: с ними подавляющее большинство студентов справляется с первой попытки. В этом случае преподаватель может принять решение добавить в курс более сложные задачи. В помощь ему предназначены специальные таблицы: с самыми трудными заданиями и с наиболее лёгкими. Если в курсе есть задание с открытым ответом (задание на взаимную оценку), то автору предоставляется диаграмма с информацией о том, присутствует ли эффект занижения/завышения баллов студентами, которые проверяют работы своих сокурсников. Если такой эффект наблюдается, то автор может обратиться к рекомендациям. РЕКОМЕНДАЦИИ ПО УЛУЧШЕНИЮ КОНТЕНТА ОНЛАЙН-КУРСОВ Все рекомендации в аналитических отчётах носят универсальный характер, однако в каждом конкретном случае они распределены по показателям. В случае если необходимо повысить качество усвоения, но у правообладателя нет возможности доработать видеоконтент, имеет смысл добавить ссылки на дополнительные материалы, подсказки, элементы интерактивного обучения (когда видео встраивается в виде заданий), разобрать кейсы, инициировать обсуждение на форуме. Словом, дополнить курс всем тем, что способно помочь студенту. Если курс оказался слишком трудным, то можно его переработать: включить вопросы с открытыми ответами, добавить лёгкие задания или упростить формулировки, использовать формирующее оценивание — когда предлагаются пять-шесть задач, похожих на те, что будут в итоговом тесте: студент может подготовиться и изучить материалы. Если позволяет платформа, можно встроить в видеолекцию вопрос, а после неё предложить небольшое неоцениваемое задание, которое выявит проблемы студентов. Важно, чтобы в пререквизитах, т.е. во вводной информации к курсу, были корректно описаны его цель и аудитория. Возможно, имеет смысл добавить вступительный тест, определяющий уровень слушателя, или задачу по физике либо по алгебре, т.е. то, что позволит студенту на самом старте понять, готов он приступить к обучению на этом курсе или нет. Мы постарались сделать рекомендации наиболее универсальными, подходящими под большинство ситуаций, но тем не менее каждый курс — это индивидуальный живой организм со своими процессами и необходимо рассматривать все показатели в комплексе, чтобы выявлять проблемные места. Важно понимать, что аналитический отчёт — это прежде всего инструмент и, как и любым инструментом, им нужно уметь пользоваться. В помощь тем, кто хочет освоить функционал сервиса, мы разработали электронный справочник, в котором рассказано, как пользоваться отчётом, и содержится очень много полезной информации для разработчиков онлайн-курсов, в том числе примеры того, как можно интерпретировать показатели, а также кейсы университетов, участвовавших с нами в проекте. Всю эту информацию можно найти на сайте Центра психометрических исследований в онлайн-образовании НИУ ВШЭ. КАК СОЗДАВАТЬ ОНЛАЙН-КУРС: ПРАКТИЧЕСКИЕ СОВЕТЫ ПСИХОМЕТРИКОВ Разработка онлайн-курса — это очень сложный и многоуровневый процесс, которым должны заниматься специалисты. С точки зрения психометрики очень важно подходить к разработке курса заблаговременно, как и к подготовке контента в целом. Прежде всего необходимо создать описание курса. Как психометрики мы можем порекомендовать включить в него пререквизиты — информацию, которая даёт студенту возможность перед началом обучения прочитать о том, для кого этот курс и что необходимо знать для его прохождения. Хорошо, если платформа позволяет встроить в неё входящий не очень сложный welcome-тест. Что касается видеоконтента, то тут мы можем порекомендовать встраивать в видеолекции задания и вопросы на понимание. Это повышает качество работы студента. Советуем включать подобные задания через каждые три-четыре минуты видеолекции. Если же такой технической возможности нет, можно добавлять задания до видеолекции или после неё. Также имеет смысл предложить студенту поделиться своим мнением на тему лекции, поскольку, когда человек отвечает на такой вопрос, он думает о том, что изучил. Можно добавить дополнительный контент или ссылки на него. В таких материалах часто содержится расширенное объяснение, способное помочь разобраться в теме студентам, которым видеолекции было недостаточно. Наверное, самый большой массив рекомендаций психометрика позволяет дать в отношении измерительных инструментов в онлайн-курсе. Здесь снова на первое место выходит планирование. Необходимо заранее разработать все тесты и задания, ознакомиться с возможностями платформы и выяснить, какие типы задач она поддерживает. Важно понимать, где задания будут использоваться: в итоговой проверке с целью измерения результата или в формирующем тесте, предназначенном для того, чтобы обучить, ознакомить, помочь, поддержать, выявить сильные и слабые стороны студента, направить его. По нашему мнению, задания в тесте должны быть разными, как по целям: на понимание, запоминание и применение, так и по типам. Например, мы рекомендуем использовать меньше заданий с выбором одного верного ответа, объясняя, что предпочтительнее задавать вопросы с вводом ответа, поскольку это снижает вероятность списывания, ведь время на прохождение теста ограниченно. Если есть возможность, стоит включить задания на взаимную оценку, когда студент сам конструирует ответ и его проверяют сокурсники. Разработка таких заданий — кропотливый процесс, поскольку требует подготовки инструкции, ясного и чёткого формулирования задания и, наконец, установления критериев для тех, кто будет оценивать. Если критерии не содержат ответов, мы советуем показывать их студентам, выполняющим задание, ведь хотелось бы знать, как, по каким критериям их будут оценивать и на что нужно обратить внимание. Считается, что самая главная проблема взаимной оценки — субъективность (когда кто-то необоснованно завышает, занижает или усредняет баллы), однако не меньшую проблему представляет ситуация, когда неподготовленные студенты, которые не освоили материал, проверяют других. И если студент некомпетентен, а критерии сформулированы очень размыто, это не позволит корректно оценить работу. Основная задача — разработать чёткие, ясные и понятные критерии (пусть они даже будут при этом большими, широко описанными), которые позволят тому, кто проверяет работу, тоже чему-то обучиться, прочитав их. Так, если критерий снабжён примером качественного выполнения задания, то студент сможет, опираясь на него, поставить релевантный балл. В целом каждому элементу тестовых заданий мы можем дать определённые рекомендации. Есть ряд ошибок, которых лучше избежать на стадии разработки тестовых заданий. Одна из основных — когда формулировка одного задания содержит подсказку к последующим. Встречается немало композиционных ошибок в ответных опциях, подсказок в самих ответах. Обычно сложно даются авторам задания на взаимную оценку: в них начинают возникать формулировки «Как вы думаете?», «Что вы думаете по поводу?», которые лучше исключать, если мы хотим измерить результат. ПЕРСПЕКТИВЫ РАЗВИТИЯ СЕРВИСА ПСИХОМЕТРИЧЕСКОЙ АНАЛИТИКИ Сервис стартовал в сентябре 2017 г. Встроенная в него метрика позволяет отслеживать, сколько организаций успели им воспользоваться, но пока ещё прошло слишком мало времени, для того чтобы собирать и анализировать подобную статистику. В период разработки и запуска сервиса было проанализировано 270 онлайн-курсов 15 ведущих российских университетов, в том числе СПбПУ, УрФУ, ТюмГУ, Самарского университета, ОмГТУ, МФТИ и др., т.е. география вузов была довольно широкой. Основываясь на рекомендациях из аналитического отчёта, коллеги из этих вузов модернизировали свои онлайн-курсы, чтобы повысить эффективность их освоения слушателями. У каждого университета были индивидуальные корректировки: кто-то работал с тестовой системой — усложнял, упрощал, делал более разнообразными задания или убирал их вовсе, кто-то дорабатывал видеоматериалы — добавлял ссылки, менял описания курса в пререквизитах, добавлял вводные тесты, инфографику, чтобы повысить вовлечённость студентов. Безусловно, если представится возможность, сервис психометрической аналитики имеет смысл развивать и дальше: делать более развёрнутой аналитику, работать с платформами, чтобы корректировать технические моменты, связанные с правильным отображением курса. Можно встроить в сервис элементы выявления ситуаций, когда студенты списывают, отслеживать паттерны, добавлять возможности кластеризации студентов исходя из того, какие траектории прохождения курса они выбирают и как это вязано с выполнением ими тестовых заданий. Естественно, для осуществления этих целей потребуется больше данных и соответственно это будет уже другая структура и иной алгоритм работы. Опубликовано в номере апрель 2019 |
Психометрика — Кафедра «Общая психология, психодиагностика и психологическое консультирование»
Предисловие к русскому изданию
«Если что-то существует, оно обязательно существует в каком-то количестве – и следовательно может быть измерено» — это наблюдение Терстоуна (Thurstone, 1938) десятилетиями вдохновляло развитие теории измерений и одного из наименее очевидных ее подразделов – теории психологических измерений. Психометрика – дисциплина, обобщающаяся практику психологических измерений, за годы выросла из занятия в основном академического в развитую индустрию, с обилием прикладных задач, измерительного инструментария (тестов) и хорошо обоснованными «правилами игры».
Главное предназначение психологических тестов – помогать в принятии решений. От диагностики эмоциональных нарушений у детей до оценки интеллекта и социальных навыков при приеме на работу. Тесты в руках квалифицированного профессионала дают возможность оценить способности и черты личности с уверенностью, недоступной невооруженному наблюдателю.
С другой стороны, исследование человеческих способностей и черт личности, факторов, их определяющих, а также параметров деятельности, зависящих от них, невозможно без создания валидных и надежных методов измерения и диагностики психологических конструктов.
В перечисленных вопросах пересекаются и оказываются неразрывно связанными, с одной стороны, чисто исследовательские интересы, а с другой – сугубо практические, прикладные задачи. Будущее профессионального психологического инструментария – в конструктивном сочетании обоих подходов, когда психодиагностический тест – это не только средство «тиражировать» готовое знание о человеке, но и новый источник такого знания.
Психометрика — это наука, лежащая в основе создания психодиагностических измерительных инструментов , а также в основе анализа качества и оптимизации существующих психологических тестов.
На протяжении многих лет на столе у отечественных разработчиков и пользователей психодиагносического инструментария не было специализированной книги по психометрике[1]. Этот пробел частично восполнялся материалами из разделов по психометрике в отечественных учебниках по психодиагностике и в зарубежных по тестированию. К сожалению, российские специалисты так и не отважились написать полноценную книгу по психометрике. Именно поэтому и возникла необходимость в переводе зарубежной книги.
Выбрать самую подходящую из множества зарубежных монографий и учебников по психометрике нам помог американский коллега Том Окланд (Tom Oaklan). Он попал не в бровь, а в глаз, прислав нам для ознакомления книгу Фера и Бакарака (Furr & Bacharach, 2008) — предугадав таким образом, что нам нужна книга, написанная простым языком о сложных вещах.
В Предисловии к оригиналу авторы так и пишут: «…психометрику не обязательно преподавать сложно. Мы писали эту книгу для того, чтобы представить основы психометрики тем, кто должен понимать суть измерений, используемые в психологии и других науках о поведении. Наша книга предназначена студентам старших курсов, аспирантам и профессионалам из различных областей науки о поведении. Она будет полезна тем, кто хорошо разбирается в основных понятиях и логике психометрики. Она была написана для опытных психометристов и тех, кто только собирается ими стать».
Знакомство с книгой Фера и Бакарака и сравнение ее с тем материалом по психометрике, который обычно фигурирует в отечественных книгах, выявляет существенную разницу как в объеме, так и в разнообразии и тонкости психометрической информации. Многие проблемы с легкостью изложенные в книге, в отечественной психометрике просто никогда не обсуждаются, особенно разработчиками тестов. До сих пор создание тестов в России не стало объектом сколько-нибудь широкого обсуждения психологов. Обучение разработке тестов, а вместе с тем углубленное изучение психометрики не проводится ни на каком уровне обучения отечественных психологов. До сих пор разработка тестов – это либо вид полупрофессионального любительства, либо вынужденное занятие, поскольку исследователь (чаще всего диссертант) не нашел для изучаемой им проблемы профессионально разработанного теста.
Даже прочитав книгу, от начала до конца остается непонятным, в каком жанре она написана: это учебник для начинающих, пособие для «продвинутых» или руководство для опытных психометристов? Авторы правы, она подойдет всем, поскольку начинается с самых простых, базовых понятий измерения (часть I), затем переходит к классическим темам — надежность, валидность и достоверность (части II, III, IV), наполняя их множеством неклассических подходов и примеров, а заканчивается книга главами для опытных специалистов, в которых рассматриваются принципиально новые (особенно для отечественных психодиагностов) темы по «теории генерализуемости» и известной, но кажущейся недоступной в своей сложности Теории ответов на пункты (Item Response Thoery — IRТ).
Читая книгу, ее научные редакторы, авторы этих строк, много лет занимающиеся психодиагностикой и тестированием, не уставали удивляться неожиданным поворотам авторов в разработке давно знакомых тем, неожиданным решениям для задач, остававшихся долгое время без ответа.
Чтобы обратить на такие темы особое внимание отечественных специалистов, в это Предисловие включены краткие резюме по соответствующим главам книги. Эти резюме рассчитаны на то чтобы вызвать читательский интерес к главам, а не заменить их детальное прочтение. В то же время, их можно рассматривать как «взгляд с птичьего полета» на содержание соответствующих глав, который может помочь читателю сформировать индивидуальную последовательность их чтения.
Одним из важнейших достоинств этой книги является простота изложения. Авторы не скрывают своей озабоченности тем, что начинающие психологи плохо знают математику и многие из них боятся всего, что связано с расчётами. Считая себя заядлыми гуманитариями, такие психологи нередко блокируют в себе попытки преодолеть этот страх. Поэтому авторы очень спокойно и терпеливо, подробно разбирая множество различных примеров, разъясняют, что такое «свойство порядка», «свойство количества», «число нуль» в психологии, в чём специфика математических операций при измерении в психологическом мире. Думаем, что такая неторопливость и подробность изложения материала более чем оправдана. Более того, наверно так и надо знакомить с азами измерений в психологии, поскольку они во многом отличаются от более знакомых измерений в физическом мире.
На множестве простых примеров авторы стремятся к тому, чтобы читателям стал понятен так называемый «физический смысл», а в данном случае лучше сказать «психологический смысл» измерения в очень специфической сфере – сфере «объектов», подавляющее большинство из которых относятся к категории ненаблюдаемых психологических характеристик, являясь не очевидными, то есть не доступными обычному восприятию. Их нельзя увидеть, потрогать, а можно только понять и опосредованно измерить.
К сожалению, желание всё объяснить просто и доступно приводит к многочисленным повторам одного и того же содержания разными словами. Специалистам эти повторы могут показаться навязчивыми. Однако дидактическая их ценность для начинающих вряд ли вызовет сомнения.
В последние годы разработано несколько мощных статистических софтвенных пакетов, таких как SPSS, позволяющих проводить обработку, расчёты почти всех мыслимых и не мыслимых статистических показателей. Появились даже книги для «чайников» по статистике, которые позволяют пользоваться этими стат.пакетами, нажимая на последовательность кнопок, изображённых на скриншотах в этих книгах. Складывается впечатление, что обработать экспериментальные данные человеку, плохо знающему статистику, не составит принципиальных проблем.
Печальным последствием этого оказывается то, что психологи перестают понимать, да и интересоваться внутренним смыслом проводимых внутри компьютера расчётов. Это приводит к тому, что ошибки, возникшие на разных этапах исследования — от проведения измерения до распечатки результатов — становятся практически недоступными для обнаружения, а отпечатанные результаты обработки данных, даже самые бессмысленные, интерпретируются психологами нередко без всяких попыток оценить их реальность. Мало кому приходит в голову, что такие оценки просто обязаны предварять содержательную интерпретацию результатов.
Всё это подтверждает необходимость, даже при наличии стат.пакетов, понимания смысла производимой обработки данных, смысла каждого статистического показателя, в том числе параметров, используемых в психометрике. Книга Фера и Бакарака является примером того, как важно учить именно осмысленной работе с данными. Авторы затрачивают много времени и сил для того, чтобы донести до психолога смысл производимых расчётов: среднего, дисперсии, стандартного отклонения, корреляции, ковариации и т.д. (главы 2, 3, 4).
Книга обладает ещё одним важным достоинством: она демонстрирует отечественным психологам возможности куда более строго подхода к планированию, проведению измерения, также интерпретации данных, чем принято у нас. Прекрасные примеры, точные и одновременно простые даже для неискушенных в психометрике, позволяют наблюдать за процессом приложения строгих психометрических подходов к вполне реальным исследованиям. Например, анализ надёжности, основанный на сравнении истинных и наблюдаемых корреляций (см.первый раздел главы 7) или демонстрация того, насколько низкая надёжность даже одного измерительного инструмента ослабляет корреляцию между переменными. Особенно показательно в этом отношении уравнение 7.4., известное как «поправка на затухание», вызванное низкой надёжностью инструментов. Использование уравнения 7.4. дает большое преимущество по сравнению с принятой у нас оценкой статистической значимости корреляции, зависящей только от величины выборки. Это также иллюстрирует более универсальное преимущество оценок величины статистического эффекта и ограниченность анализа статистической значимости любых параметров, долгое время преобладавшего в мировой психологии.
То, что в книге по психометрике три отдельных главы (5, 6 и 7) посвящены анализу надёжности теста может показаться непривычным отечественному читателям. Для многих из них надёжность, это в лучшем случае величина, которая содержится в руководстве к тесту и, если она удовлетворительна, то на нее больше не обращают внимания вообще. Высокие показатели надёжности по умолчанию позволяют исследователю быть уверенным в полученных данных.
Из содержания книги становится очевидно, что отечественные подходы к оценке надежности отличаются от описанных в книге. Во-первых, книгу отличает значительно большее внимание к научной базе анализа надежности теста. Целая глава (5-я) посвящена кропотливому разбору теоретических основ надежности с точки зрения классической теории тестов. При этом авторы показывают, что «надежность – это теоретическое свойство теста, и что она не может быть рассчитана прямо. Она выявляется из истинных баллов и ошибки измерения и может быть лишь примерно оценена на основе реальных данных».
Во-вторых, в отечественных работах по оценке надежности обычно опускают «понятие параллельных (или альтернативных) форм», которому придается ключевое значение в теоретических доказательствах оценки надежности теста.
В-третьих, все привыкли к нескольким интуитивно понятным способам эмпирической проверки надежности, не задумываясь об их теоретическом обосновании, что при сравнении с более строгими подходами даже эмпирических в своей сути методов, описанных в книге, обнаруживает пропуски в понимании природы надежности.
Так, существует убежденность, что увеличение количества пунктов (длины теста или отдельной шкалы) всегда приводит к увеличению надежности теста. Авторы убедительно показывают ограниченность такого подхода : «добавление новых пунктов – это палка о двух концах. С одной стороны, при прочих равных длинные тесты надежнее коротких. С другой стороны, иногда может быть небезопасно предполагать, что все «прочее» (в первую очередь равенство новых пунктов по согласованности с исходными – Ред.) останется постоянным. На само деле, если средняя межпунктовая корреляция более длинного теста достаточно маленькая, тогда более длинный тест будет менее надежным, чем исходный».
Авторы приводят очень полезный график (рис. 6.1.), на котором показаны связи между пунктами теста и надежностью, для теста с межпунктовой корреляцией 0,30, на котором хорошо видно, что надежность существенно возрастает до 0,72 при увеличении пунктов от 2 до 10. После этого добавление еще восми пунктов , увеличивает внутреннюю согласованность только на 0,1 и доводит ее до 0,82. «Польза от добавления новых пунктов уменьшается с количеством добавленных пунктов», делают вывод авторы. Кроме того, увеличение пунктов имеет и практические ограничения – возрастает время на проведение и усталость испытуемых. Аналогичные выводы появлялись в отечественной литературе (Эйдман, Модина, 1992), однако они остались, в целом, незамеченными.
Следующая тема, содержание которой отличается от кажущихся общепринятыми для нас тем – это валидность теста. Авторы книги указывают на то, что понятие валидности развивалось на протяжении более 60 лет, и за это время претерпело существенные изменения. Воспринимаемое как классическое определение валидности звучит так: «валидность это степень того, насколько тест измеряет именно то, для чего он предназначен». Однако Стандарты психологических тестов «The Standards for Educational and Psychological Testing» 1999 года, разработанные американской ассоциацией исследований в области образования (AERA), американской психологической ассоциацией (APA) и национальным советом по измерениям в образовании (NCME), определяют валидность как «степень эмпирической и теоретической поддержки интерпретации тестовых баллов в предполагаемых сферах использования теста». Из этого следует, что валиден тест не сам по себе, а то насколько интерпретации результатов тестирования и способы их использования способствуют применению теста в соответствующих сферах его использования.
Величина валидности теста зависит от дополнительных условий, которые определяют ограничения областей содержательной интерпретации. Например, тест Добросовестности описанный авторами в Главе 8, не претендует на обладание высокой валидностью для всех случаев жизни, всех сфер деятельности и может быть равно пригодным для диагностики на мужской и женской выборках.
Достаточно большой период времени развития психодиагностики (пока это условие было не общепринятым), исследователи, проверяя тест на «своих» выборках и в «своих» условиях могли обнаружить весьма высокие показатели валидности и тогда могли хвалить тест или низкие показатели – и указывать на то, что валидность теста явно недостаточна. Эта книга поможет разработчикам тестов у нас в стране уяснить для себя и разъяснить потребителям, что валидность теста ограничена областью содержательной интерпретации результатов теста.
Обходится молчанием в отечественной психодиагностике и такой аспект валидности как её зависимость от возможных последствий (благоприятных или неблагоприятных), вызываемых самим процессом прохождения тестирования и особенностями интерпретации полученных результатов. Разработчики тестов здесь выходят в область этических или даже политических последствий тестирования.
Еще одна проблема отечественных психологов, которые не хотят углубляться в «дебри» психометрики — это доминирование такого неизвестного в научной психометрике подхода как а «интуитивная валидность» (заметьте, не «очевидная», а именно «интуитивная»). Этот подход означает, что автор-разработчик просто уверен, «ему так кажется», что именно такой перечень пунктов хорошо выявляет исследуемое им свойство. А то, что инструмент должен измерять психологические характеристики в строгом значении этого слова – многие авторы-разработчики даже не задумываются. При этом среди методик, основанных на интуитивной валидности, известны не только простые одношкальные опросники, но и сложные семантические и проективные процедуры.
В книге Фера и Бакарака целая глава (9) посвящена оценке степени конвергентной и дискриминантной валидности теста. Авторы справедливо полагают, что это тема является краеугольным камнем проверки психометрического качества теста. В книге приводятся несколько способов такой проверки: от достаточно простых до весьма сложных. Если простые методы хотя и редко, но всё таки используются в отечественной психометрике , то сложные методы – практически никогда.
Особого внимания, на наш взгляд, заслуживает весьма тонкий анализ сложных взаимных корреляций между различными признаками и различными методами, используемыми при проверке валидности, предложенный еще Кемпбелом и Фиске (1959). В книге он переведён как «Мультипризнаковые мультиметодные матрицы» (МТМММ).
Такой тонкий анализ взаимного и конкурентного влияния множества признаков и множества методов при проверке конструктной валидности совершенно не характерен для отечественных разработчиков психодиагностических методик. Авторы книги вслед за Кемпбелом и Фриске, демонстрируют «высший пилотаж» психометрического анализа, разбирая в качестве примера гипотетический случай проверки валидности учебного опросника «социальной компетентности», который проверяется путем предсказания величины и направления корреляций с другим опросником, измеряющим признаки родственного конструкта «эмоциональной устойчивости», с другими (экспертными) методами измерения тех же самых конструктов. В табл. 9.2. собраны все возможные сочетания четырёх типов корреляции: 1) гетеропризнаковые – гетерометодные; 2) гетеропризнаковые – монометодные; 3) монопризнаковые – гетерометодные и 4) монопризнаковые –монометодные.
И хотя авторы книги сетуют, что в современной психометрике этот метод проверки конвергентной и дискриминантной валидности используется не так часто (в 2-х статьях из 13-и в журнале Psychological Assessment (APA) за 2005 год), тем не менее они делают такой вывод: «…Несмотря на не высокую частоту его применения, анализ МТМММ является важным шагом вперед в теории и методах оценки конвергентной и дискриминантной валидности тестов. Данный подход во многом сформировал само понимание конструктной валидности, и без его рассмотрения невозможно полное понимание психометрии».
В следующем параграфе рассматривается еще один «сложный» метод проверки конструктной (конвергентной и дискриминантной) валидности, который по мнению авторов является еще более точным и более объективным методом «Квантификация конструктной валидности» (QCV).
Этот относительно недавно (2003) разработанный метод безусловно достоин рекомендации для широкого использования. Основная идея метода состоит в проверке уровня соответствия двух паттернов корреляции – между эмпирически полученных корреляций показателей разрабатываемого (проверяемого) теста с совокупностью показателей других тестов (реальные корреляции) и теоретически предсказанных группой экспертов корреляций между конструктами тех же самых тестов или их отдельных показателей. Рассчитанные в итоге два показателя связи между паттернами реальных и теоретически предсказанных корреляций позволяют делать более точные и объективные выводы о конструктной валидности теста.
Новый аспект валидности, редко обсуждаемый в отечественной литературе, представляет анализ совпадения между психологическими процессами, которые респондент в действительности (при выполнении теста) задействуют в процессе выполнения теста и теми процессами, которые они должны задействовать, согласно предположениям разработчиков теста.
Авторы книги ссылаются на ряд экспериментов, в которых было показано различие между действительными (реальными) процессами и планируемыми при создании теста. Это позволяет сделать вывод о необходимости при проверке валидности теста контролировать и такой аспект как различия этих процессов.
Совершенно новой для отечественной психодиагностики является детальное обсуждение проблемы «Необъективности теста» (глава 11). В этой главе авторы продолжают анализ факторов, начатый в Главе 10, представляющих угрозу надежности и валидности в интерпретации и использовании тестовых баллов. Если в Главе 10 рассматривалась погрешность тестового балла, вызванная намеренными или неосознанными стратегиями ответов респондента (установки на ответ), то Глава 11 сфокусирована на источниках такой погрешности внутри самого теста, которые могут приводить к искаженным различиям между группами – например, к иллюзорным гендерным или возрастным различиям при реальном отсутствии таковых. Рассматриваются два важных типа необъективности теста — погрешность конструкта и предсказательная погрешность. Погрешность конструкта связана с возможным смещением в интерпретации смысла измерительного конструкта при переходе от одной группы к другой (например, между мужчинами и женщинами), что может привести к смещению зависимости между «истинным» тестовым баллом и его наблюдаемыми величинами на выборке. Погрешность тестового конструкта диагностируется методами внутреннего анализа теста – такими как оценка силы (дискриминативности) отдельных пунктов, построение полных характеристических кривых пунктов или факторный анализ. Например, если индекс «силы» отдельно взятого пункта рассчитанного на женской выборке, оказывается отличным от того же индекса в мужской выборке – другими словами, этот пункт сильнее (или слабее) дифференцирует женщин чем мужчин – то это свидетельствует о конструктной погрешности теста и, скорее всего, потребует пересмотра или полной замены такого пункта.
До подобных тонкостей в анализе погрешностей теста отечественная психодиагностика еще просто не дошла. Как не дошла и до обсуждения того, что в отличие от конструктной, предсказательная погрешность связана со смещениями во взаимосвязи тестового балла с параметрами жизнедеятельности (внешними критериями), которые этот тест пытается предсказать. Таким внешним критерием может служить успеваемость, здоровье или результаты по другому тесту. Однако в этой главе авторы ограничиваются «результатами по другому тесту» в качестве внешнего критерия. Надо отметить, что это упущение довольно типично – в силу своего удобства, поэтому «результаты по другому тесту» слишком часто предпочитаются более реальным внешним критериям, что является источником хорошо известной проблемы недостаточной «калиброванности» психологических тестов (Sechrest, McKnight & McKnihgt, 1996). Читателям стоит не забывать о важности реальных жизненных критериев не только для снижения предсказательной погрешности, но и повышения качества тестов в целом. Предсказательная погрешность диагностируется методами внешней оценки теста – такими как регрессионный анализ и структурное моделирование, с помощью которых оценивается связь между суммарным баллом или отдельными пунктами теста с внешними по отношению к этому тесту критериями.
Основной смысл выделения и разработки методов выявления необъективности теста заключается в противодействии постоянным ошибкам, которые проявляются в неправомерной разнице в набранных баллах в двух различных по какому-то признаку группах: мужчины и женщины, молодые и старики, европейцы и африканцы и т.д.
При этом очень важно подчеркнуть, что «разница» в тестовых баллах в двух группах не обязательно означает наличие систематической ошибки. Эта разница может быть проявлением реальных различий, существующих между группами.
Необходимость разработки методов такой проверки, реально обнаруживаемых при тестировании различий между группами, вызвана, на наш взгляд, социальной значимостью таких различий и особой чувствительностью развитого общества к безупречной обоснованности выводов о наличии реальных различий между социальными и национальными группами.
Наше общество ещё просто не созрело до контроля за результатами психологических исследований, в которых обнаруживаются (возможно совершенно ошибочно) гендерные различия или различия между этническими и социальными группами. Тематика этой главы является тем более важной, что при контроле за психодиагностическими методиками можно превентивно избежать ошибок тестирования в социально чувствительных зонах.
Заметим, что предсказательная погрешность не зависит от конструктной и, как следствие, требует отдельной проверки. Так, например, существует немало тестов с выраженной предсказательной погрешностью при отсутствии сколько-нибудь заметной конструктной погрешности.
К достоинствам 11 главы, кроме всего прочего, стоит также отнести компактное и очень доступное изложение основ регрессионного анализа.
Завершая обзор 11-ой главы, важно отметить, что само ее название (Test bias) нередко приводит к смешению ключевого понятия систематической ошибки (смещения оценок) с необъективностью или предвзятостью теста. Первое относится к науке о психологических измерениях, второе – к области моральных суждений. С научной точки зрения важно не то, насколько несправедливыми могут показаться различия между группами (хотя и этого игнорировать не стоит), а насколько аккуратно тестовые баллы отражают эти различия (или их отсутствие). К примеру, никому не придет в голову подозревать в предвзятости измерение роста или веса тела только потому, что гендерные различия по этим показателям хорошо известны.
Последние две главы книги выделены в отдельную связку под заголовком «Современные психометрические подходы: высшая психометрика». Это не случайно – в главах представлены современные подходы к психометрике, выходящие за привычные рамки классической теории тестов (на которой основаны все предыдущие главы).
В 12-ой главе описаны основные понятия и задачи теории генерализуемости (Generalizability Theory — GT). Основу GТ составляет понятие «совокупной популяции» всех возможных заданий теста. Как следствие, надежность интерпретируется в терминах способности обобщать результаты с небольшого набора пунктов на всю эту «совокупность». Преимущества GТ над классической теории тестов особенно заметны при сложных измерениях с несколькими источниками ошибки. К примеру, GТ позволяет разделить погрешность наблюдателя, погрешность пункта, и целый ряд других источников погрешности измерения. Долю вариативности, вызванную каждым из этих источников ошибки, можно рассчитать с помощью дисперсионного анализа. Сравнивая эту вариативность с вариативностью, вызванной реальными индивидуальными различиями, можно рассчитать коэффициент генерализуемости измерительной стратегии. Таким способом можно сравнивать генерализуемость разных измерительных стратегий – в самом простом случае это варианты шкалы с разным количеством пунктов. А такие сравнительные данные весьма полезны при дизайне окончательной версии шкалы, при этом, как правило, выбирается минимальное количество пунктов, достигающее заданного уровня генерализуемости – или же находится такое количество пунктов, после которого добавление новых уже почти не улучшает генерализуемость.
Примеры расчетов вариативности и коэффициентов генерализуемости отличает завидная доступность – даже в довольно сложном случае с применением двухфакторного дисперсионного анализа. В случае простого, однофакторного дизайна обращает на себя внимание идентичность рассчитанного коэффициента генерализуемости и классического коэффициента альфа Кронбаха – что подчеркивает преемственность и взаимопереходы между GТ и классической теорией тестов. Как в случае с теорией относительности и классической механикой, классическая теория тестов оказывается частным случаем GТ при достаточно простых источниках ошибки измерения.
В Главе 13 представлен наиболее продвинутый на сегодня подход в психометрике — Item Response Theory (IRT). Однозначного русскоязычного эквивалента самому термину IRT до сих пор не существует. Варианты перевода включают «теория тестовых заданий», «теория ответов на пункты теста», «алгоритмическая теория измерений» и целый рад других. В настоящем издании термин IRT переведен как «Теория ответов на пункты» — с тем, чтобы подчеркнуть сфокусированность этого подхода «на поведении» отдельных пунктов, а не агрегированной шкалы. В то же время, по сложившейся традиции, в книге часто используется уже привычная отечественному читателю англоязычная аббревиатура IRT. Подобное узнавание теории частично снимает проблему адекватности перевода ее названия. Уже только по аббревиатуре IRT становится понятно о чем идет речь.
В основе подхода IRT лежит довольно очевидное наблюдение, что ответ конкретного респондента на данный пункт шкалы определяется как свойствами респондента, так и свойствами пункта.
В разных вариантах IRT разработаны методы расчета вероятностных характеристик отдельных пунктов относительно реальных свойств респондента. Так, сила (или сложность) пунктов в IRT выражается в терминах выраженности измеряемого признака у респондента – точнее, она определена как степень выраженности черты или способности, дающая респонденту 50-процентный шанс справиться с заданием. Самая простая версия IRT – модель Раша – определяет ответ респондента как вероятностную функцию сложности пункта и выраженности измеряемого признака.
Графическая форма этой функции — характеристическая кривая пункта – является полезным инструментом отбора и оптимизации пунктов.
Здесь необходимо отметить, что долгое время в отечественной психодиагностике использование IRT на практике упиралось в чем-то обоснованное предубеждение, что модель Раша пригодна только для очень ограниченного типа методик. В первую очередь для тестов достижения, в которых довольно очевидна зависимость ответа респондента на пункт (задание) как от его знаний (способностей), так и трудности пункта. Второе ограничение распространения модели Раша связано с требованием только дихотомического формата ответов (да – нет, верно – неверно и т.д.) на пункты тестов. Поэтому очень важно, что авторы, кроме модели Раша, рассматривают и более современные версии IRT, в которых указанные ограничения уже преодолены.
Следующее поколение моделей IRT учитывают другие важные параметры пунктов. Так, такой важный параметр в IRT – дискриминативность пункта – определяется тем, насколько различны ответы на этот пункт у респондентов с высокой и низкой выраженностью измеряемого признака. Добавление дискриминативности пункта как дополнительной детерминанты ответа респондента на пункт расширяет модель Раша до так называемой двух-факторной логистической модели и заметно повышает ее полезность. Дельнейшее расширение возможно как через добавление факторов (например, в трех-факторной логистической модели добавлена третья характеристика пункта – вероятность угадывания), так и через расширение формата ответов: от дихотомического до включения градаций ответа по степени согласия с пунктом (например, полностью согласен – пожалуй не согласен) или по степени корректности ответов (при оценке способностей).
Подобранная модель IRT позволяет правильно оценить информативность как теста в целом, так и отдельных его пунктов – с последующим их отбором и оптимизацией. Более того, в отличие от классического понятия надежности теста, информативность не является константой, а может меняться в зависимости от уровня выраженности измеряемого признака. Например, тест (и даже отдельный пункт) может обладать более высокой информативностью в середине диапазона выраженности измеряемой черты или способности, чем на его краях. В таком случае различимость экстремальных значений выраженности черты ухудшена по сравнению со средними ее значениями.
Полезность такого рода данных несомненна – как для улучшения качества тестов, так и для повышения адекватности процедур тестирования в целом.
Особенно ценен вклад IRT при диагностике нетипичных или подозрительных паттернов ответов, а также в приложениях компьютеризованного адаптивного тестирования, когда каждый последующий пункт теста подбирается из банка заданий на основании мгновенного анализа всех предыдущих ответов респондента.
Подкупающая доступность изложения довольно сложного материала в Главе 13, достигнутая без излишних упрощений и потери аккуратности, подчеркивает преимущества IRT в детальной оценке и оптимизации психометрических параметров теста. Можно с уверенностью предположить, что этот материал перекочует из категории «продвинутый» в категорию «полезный каждому» значительно скорее, чем может показаться – и во многом благодаря книге, которую вы держите в руках.
Завершая анализ книги Фера и Бакарака, хочется отметить весьма качественную работу ее переводчиков – кандидатов психологических наук Анны Науменко и Алексея Попова, а также огромный труд аспиранта кафедры «Психологическая диагностика и консультирования» ЮУрГУ Татьяны Ким, благодаря которому эта книга увидела свет.
Хочется также от имени всего психодиагностического сообщества поблагодарить Ректора ЮУрГУ д.т.н., проф. А. Л. Шестакова за поддержку в реализации этого не простого проекта.
Научные редакторы перевода:
Профессор Николай Батурин (ЮУрГУ, Россия) и Профессор Евгений Эйдман (Kingston University London & University of Adelaide, Australia)
Психометрик
В своей жизни вы наверняка хотя бы один раз сдавали какой-нибудь тест – крайне важный и судьбоносный. И точно таким же он был и для той, «другой» стороны – работодателя, школы, курсов, выдающих сертификат и т.д.
Любой тест – это «линейка», которой оценивают человека. Как добиться объективности и точности такой «линейки»?
Для этого есть психометрики – специалисты, способные уложить на измерительную шкалу даже самые абстрактные вещи: креативность, внимательность, мотивацию, знания, вовлеченность в какой-нибудь процесс.
С помощью специальных статистических моделей можно оценить качество задания и всего теста в целом, понять, не слишком ли трудный или легкий тест, помогает ли он определить, как кто усваивает курс.
Процедура разработки теста требует серьезного подхода — от результатов теста могут зависеть судьбы и людей, и компаний.
Например, если тест невысокого качества, знания школьника на ЕГЭ могут быть неверно оценены, оценка может быть или завышена, или занижена. Или действительно хороший специалист может быть не принят на работу.
Психометрики могут разрабатывать тесты и задания, оценивать их на логику, анализировать качество и надежность теста, а также оценивать результаты теста и факторы, влияющие на результаты.
Психометрикам важно знать статистику и уметь работать в специализированных компьютерных программах для психометрической оценки теста, уметь ставить гипотезы, видеть и находить проблему исследования.
Психометрики востребованы в самых разных компаниях, где хотят оценивать персонал, качество образования, образовательные достижения, карьерное развитие и свойства личности.
Основное профессиональное образование
Проценты отражают распределение специалистов с определенным уровнем образования на рынке труда. Ключевые специализации для освоения професии отмечены зеленым цветом.
Дополнительное образование для взрослых
Обязательные этапы дополнительного образования для освоения профессии закрашены зеленым цветом.
Интересные факты
Первые системы оценивания существовали еще в Древнем Китае, там оценку определенных качеств новобранцев использовали при приеме на военную службу. Античные греки использовали различные системы оценки для измерения физических и умственных навыков учеников учебных заведений. В Средние века в европейских университетах появилась система экзаменов, которые также оценивали прогресс студентов. Однако развитие тестирования, разработка технологий измерения и оценивания, пришлось на 19 и 20 века.Некоторое время одновременное прохождение тестов двумя или более людьми было невозможно, так как испытуемый отвечал на вопросы устно, либо совершал какие-то действия с предметами под наблюдением ученого. Первое массовое тестирование было разработано на заказ для нужд армии США. В 1917 году США вступили в Первую мировую войну, и необходимо было в короткие сроки отобрать и распределить по пунктам и училищам более полутора миллионов рекрутов. Так был создан «Самоприменяемый тест умственных способностей А.С.Отиса».Основателем теории тестирования считается Джеймс Кеттел. Его статья «Интеллектуальные тесты и измерения», опубликованная в 1890 году, заложила основы измерений и сделала тестирование необычайно популярной методикой. В статье Кеттел доказывал, что применение тестирования к большому числу индивидов позволяет получить количественные данные о качественных показателях.Психометрика — Psy-Testology
Лучший или один из лучших учебных пособий по психометрике
Р.Майкл Фер Психометрика: Введение /Р. Майкл Фер, Верн Р. Бакарак; пер. с англ. А.С. Науменко, А.Ю. Попова; под ред. Н.А. Батурина, Е.В. Эйдмана. — Челябинск: Издательский центр ЮУрГУ, 2010. — 445.
В нашем информационном центре (387 каб) есть два экземпляра книги!
В книге представлены основы психометрики, рассмотрены базовые понятия измерения, основы надежности и валидности, угрозы психометрическому качеству теста, а также современные психометрические подходы. Книга предназначена для студентов старших курсов, аспирантов и профессионалов из различных областей наук о поведении.
«Книга обладает еще одним важным достоинством: она демонстрирует отечественным психологам возможности куда более строго подхода к планированию, проведению измерения, также интерпретации данных, чем принято у нас. Прекрасные примеры, точные и одновременно простые даже для неискушенных в психометрике, позволяют наблюдать за процессом приложения строгих психических подходов к вполне реальным исследованиям…» /д.пс.н., проф. Н.А. Батурин / предисловие к русскому изданию/
Авторы:
Почитать об авторе (М.Фер) и познакомиться с его работами http://psych.wfu.edu/furr/
R.Michel Furr Р. Майкл Фер | Verne R. Bacharach Верн Р. Бакарак |
Оглавление
Предисловие к русскому изданию доктора психологических наук, профессора Н.А. Батурина (прочитать обязательно!)
Глава 1. Психометрика и важность психологического измерения
Часть 1. БАЗОВЫЕ ПОНЯТИЯ ИЗМЕРЕНИЯ
Глава 2. Шкалирование
Глава 3. Индивидуальные различия и корреляции
Глава 4. Измерения теста и факторный аналз
Часть 2. НАДЕЖНОСТЬ
Глава 5 Надежность: понятийный аппарат
Глава 6 Эмпирическая оценка надежности
Глава 7. Важность надежности
Часть 3 ВАЛИДНОСТЬ
Глава 8. Валидность: теоретические основы
Глава 9. Валидность: вычисление и оценка конвергентной дивернентной валидности
Часть 4. УГРОЗЫ ПСИХОМЕТРИЧЕСКОМУ КАЧЕСТВУ ТЕСТА
Глава 10. Установки на ответ
Глава 11. Необъективность теста
Часть 5. СОВРЕМЕННЫЕ ПСИХОМЕТРИЧЕСКИЕ ПОДХОДЫ: ВЫСШАЯ ПСИХОМЕТРИКА
Глава 12. Теория генерализуемости тестовых баллов
Глава 13. Теория ответов на пункты модели Раша
Библиография
Предметно-именной указатель
Об авторах
П С И Х О М Е Т Р И К А
Психометрия – область психологической диагностики, связанная с теорией и практикой измерений в психологии (понятие введено Х. Вольфом). Первоначально под психометрией понимали измерение временных характеристик психических процессов, затем добавилось измерение и более сложных психических функций. Появились общая психометрия (измерения общепсихологического характера (того, что свойственно всем) и дифференциальная психометрия (измерение индивидуальных различий).
Психометрика – это методологическая основа психодиагностики, технолого-методическая дисциплина, отражающая вероятностный характер тестов, обосновывающая требования к тесту (стандартизация, надежность, валидность). Функциональное предназначение психометрики связано с возможностью создавать, адаптировать и оценивать качество теста, а также понимать вероятностный характер тестов.
Психологическое измерение – это процесс приписывания числовых значений объектам в соответствии с определенными правилами.
Существует четыре группы правил, по которым свойства объекта находятся в каком-то отношении с присвоенными им номерами. Используя эти правила, мы можем обращаться с номерами, приписанными объектам, как с числами и использовать по отношению к ним все техники арифметики и математики. Каждому из четырех наборов правил соответствует свой вид измерения или своя шкала: номинальная, ординарная (порядковая), интервальная и шкала отношений.
Шкала в широком понимании этого слова представляет собой упорядоченную совокупность данных.
Номинальная шкала (шкала наименований) состоит в присваивании какому-либо свойству или признаку определенного обозначения или символа (численного, буквенного и т. д.). По сути, это классификация свойств, группирование объектов, объединение их в классы при условии, что объекты, принадлежащие к одному классу, идентичны.
Ординарная (порядковая, ранговая) шкала предполагает ранжирование определенного признака или свойства так, что А > В > С > … (или наоборот). Порядковое измерение возможно тогда, когда в объектах можно обнаружить различия в степени выраженности признака или свойства.
Интервальная шкала (шкала интервалов) предполагает разбиение диапазона (расстояния) между двумя крайними (реперными) точками на определенное число равных интервалов (градаций, категорий и т. д.).
Шкала отношений предполагает наличие естественного нуля, который означает полное отсутствие какого-либо свойства или признака. Шкала отношений является наиболее информативной шкалой, допускает любые математические операции и использование различных статистических приемов.
Соотношение показателей валидности и надежности
Психометрические инструменты в подборе и оценке
Татьяна Коломбет — директор HR-консалтинговой компании Formatta UA, профессиональный рекрутер и эксперт в оценке персонала — вместе с командой Hurma провела вебинар на тему психометрики в подборе и оценке.
Татьяна рассказала о том, какая информация о сотрудниках и внешних кандидатах нужна рекрутерам, HR-ам и руководителям для принятия взвешенных кадровых решений, и показала, как в сборе этой информации помогают психометрические инструменты — в частности, опросники.
В Украине психометрические опросники пока используются мало, в основном в рамках ассесмент-центров, то есть в целях оценки. В рекрутинге их применяют очень редко. Как правило, результатами опросников пользуются HR-ы, хотя этот инструмент не менее полезен для бизнес-руководителей: он показывает целостный профиль сотрудника, который помогает в формировании команд, распределении задач и управлении развитием персонала.
Психометрические инструменты показывают потенциал к развитию компетенций, поэтому начнем обзор с самого определения компетенции.
Это многоплановый конструкт, по структуре напоминает пирамиду: в ее основе — личностные характеристики, на которые накладываются способности, навыки и знания. Все четыре компонента измеряются разными инструментами:
Из этих конструктов есть те, на которые мы можем влиять в большей и меньшей степени: так, знаниями овладеть легче всего. Труднее повлиять на личностные характеристики и способности, и именно они измеряются психометрикой: тестами способностей и опросниками.
Какие инструменты мы называем психометрическимиЧетыре ключевых момента делают инструмент психометрическим:
1. Стандартизация оценки по содержанию, администрированию, подсчету результатов и интерпретации. Результат оценки опросником всегда выражен в цифрах.
2. Из этого следует второй признак — психометрическое тестирование обеспечивает количественные измерения, а значит, объективность оценки.
3. Равнозначность условий оценки для всех участников — всем обеспечены не только стандартные условия оценки, но и единые критерии, и равные правила подсчета результатов.
4. Этот подсчет основан на сравнении с заранее определенными нормативными группами.
Надежность и валидность — два ключевых показателя психометрического инструментаПоскольку при выборе психометрического инструмента, в первую очередь, важно обращать внимание на показатели его надежности и валидности, разберемся с этими понятиями и посмотрим как они соотносятся между собой.
Надежность — это точность и воспроизводимость результатов теста. Это тот параметр, который говорит, насколько отличаются результаты одного и того же человека при повторных прохождениях инструмента. Если тест или опросник надежен, то результаты будут каждый раз примерно одинаковы. Минимальный коэффициент надежности — 0.7. Информацию о надежности всегда можно получить у издателя или провайдера инструмента, именно издатель ответственен за этот показатель.
Еще один параметр, который говорит о качестве теста или опросника, — это валидность. Посмотрим на примере: мы оцениваем кандидата на должность продавца мебели. Он прошел тест способностей к работе с вербальной информацией. Допустим, он прошел его несколько раз, и в надежности инструмента сомнений нет, поскольку результаты каждый раз отличались незначительно.
Но можем ли мы быть уверены, что результаты теста на оценку вербальных способностей спрогнозируют, насколько успешным этот кандидат окажется в продаже мебели? Вряд ли. Именно для этого нужна валидность — она показывает, насколько данный инструмент оценивает именно то, что важно оценить — то, что определяет успех на работе в этой компании на этой должности. Показатель валидности связан с тем, верно ли выбран тест или опросник.
Правильность выбора — это ответственность заказчика, который консультируется с издателем инструмента и собирает информацию у издателя или компаний, использующих его.
Как надежность и валидность соотносятся между собойЕсли тест или опросник ненадежный, то он не может быть валидным: не может точно померить компетенции, значит, нельзя говорить о том, что он меряет то, что должен мерить.
Ненадежный и невалидный
Надежный, но невалидный — точность измерения высокая. То есть результаты при повторном прохождении схожи, но измерение именно этого параметра никак не связано с прогнозом успешности на позиции. Инструмент измеряет то, что неважно для работы.
Надежный и валидный — высокая точность результатов, меряет ровно то, что важно знать для прогноза эффективности.
Переходим к конкретному опроснику и посмотрим, как его можно использовать в подборе и оценке. Formatta работает с психометрическими инструментами британской компании Saville Assessment. Татьяна рассказала об опроснике Work Strengths, но вначале представила модель компетенций, которая лежит в основе любого опросника Saville Assessment.
Модель компетенций Wave — одна из самых полных библиотек компетенций в миреМодель Wave разработана в XXI веке и максимально соответствует реалиям постиндустриальной экономики и VUCA-мира. Она описывает все возможные бизнес-ситуации, роли и стандарты поведения современного менеджера. Кроме того, включает в себя только те компетенции, влияние которых на эффективность работы подтверждено статистически и которые могут быть надежно диагностированы при помощи психометрики.
Модель структурирована по 4 блокам — кластерам — и выстроена иерархически: 4 кластера — 12 групп — 36 компетенций — 108 индикаторов.
4 кластера обеспечивают глубину описания личности в терминах компетенций:
1. Решает проблемы. Отвечаем на вопрос, как человек рассуждает, как обдумывает задачи. В какой степени он опирается на аналитическое мышление и работу с данными, а в какой — мыслит концепциями и стратегиями.
2. Влияет на людей. В любой работе сотруднику приходится иметь дело с людьми и каким-то образом влиять на них: через располагающую коммуникацию, настойчивое продвижение своей позиции или лидерские качества.
3. Адаптирует способ действия. Важно посмотреть, как кандидат или сотрудник относится к изменениям и как реагирует на людей, которые отличаются от него.
4. Достигает результатов. Смотрим, за счет какого поведения человек приходит к нужному результату. Больше опирается на дисциплину, планирование или добивается результата за счет энергии и драйва?
В результате оценки опросником Work Strengths мы получаем психометрический профиль по 4 кластерам, в каждом из которых 3 группы компетенций.
Каждая из 36 компетенций оценивается по 10-балльной шкале, есть две дополнительные шкалы, которые показывают стиль заполнения опросника: насколько участник был критичен к себе и насколько последовательно отвечал на вопросы. Эти шкалы покажут, можем ли мы доверять результатам опросника.
В отчете также есть прогноз подходящего рабочего окружения: он описывает, в какой среде человек будет максимально эффективен, что его мотивирует.
Такой профиль с полной информацией о потенциале развития по 36 компетенциям помогает в принятии решений при найме и по результатам оценки.
Чем полезен психометрический профиль в оценкеОценка сотрудников — это определение их сильных сторон и зон роста для принятия кадровых решений или решений по развитию. Самый полный метод оценки — ассесмент-центр. Он построен на симуляционных упражнениях: моделирует рабочие ситуации, требующие проявления конкретных навыков. В рамках ассесмент-центра часто также проводится интервью по компетенциям.
Сравним два сценария: ассесмент-центр с использованием психометрики и без нее:
Если мы не включаем психометрику в процедуру оценки, интервью и бизнес-кейсы показывают нам уровень владения навыками: мы видим сильные стороны человека — те компетенции, за счет которых он добивается успеха в работе. Также видим те компетенции, которые пока недостаточно развиты: или репертуар инструментов внутри навыка неполный, или же человек в принципе не демонстрирует нужное поведение. Как правило, мы называем эти области зонами развития.
Иначе говоря, бизнес-кейс показывает результаты человека в конкретной рабочей ситуации. Склонности и потенциал он показать не может.
Теперь посмотрим, какими данными мы дополняем информацию по человеку, если включаем в оценку психометрику: участник проходит опросник, мы получаем его профиль, то есть уровень потенциала к развитию компетенций. Сравнение результатов по навыкам и по потенциалу дает уже более объемную картину.
Появляется еще два аспекта: ограничения и зона повышенного внимания, которую мы образно называем «жизнь заставила»:
- Если сотрудник в какой-то компетенции получает высокие оценки и по навыку, и по потенциалу, эта компетенция — его сильная сторона.
- Низкие оценки по навыкам и потенциалу говорят о том, что эта компетенция — ограничение сотрудника. Они есть у любого человека, но о них важно знать, чтобы перераспределить работу или запросить помощи коллег. Важно отделять ограничения от зон развития, поскольку это позволяет фокусировать усилия и инвестиции на тех областях, которые человек действительно может развить. Теоретически с ограничениями тоже можно работать, но это потребует гораздо больших ресурсов и вряд ли будет в радость человеку — склонности к этому у него нет.
- Если сотрудник продемонстрировал высокий потенциал к чему-либо, но его навык в этой области получил низкие оценки, мы выделяем зону развития: склонность проявлять действие есть, но оно пока не сформировано на уровне навыка. При целенаправленной работе за 1,5–2 года эта компетенция может оказаться в сильных сторонах.
- Бывают такие ситуации, когда навык уже сформирован, но склонности его проявлять нет. Возьмем, к примеру, публичные выступления. Часто людям приходится в силу работы и статуса освоить этот навык, потратив на это много времени и усилий. Окружающим скорее всего будет незаметно, что публичные выступления человеку в тягость, так как он прекрасно с ними справляется. Почему для нас такая ситуация будет зоной повышенного внимания: в привычных условиях человек будет проявлять этот навык, но мы не можем гарантировать этого в ситуации стресса или форс-мажорных обстоятельствах. Допустим, директор завода регулярно обращался к рабочим с вдохновляющими речами, но в случае забастовки, когда условия стрессовые, он может оказаться не готов выступить — сказывается низкий потенциал.
Таким образом, психометрика дает более объемный взгляд на человека. Мы часто привыкли думать о кандидатах и сотрудниках с точки зрения их сильных и слабых сторон, но очень важно понимать, инвестиции в развитие каких областей дадут максимальный эффект (то есть отделять зоны развития от ограничений), а также знать риски уже развитых компетенций человека (то есть учитывать зоны повышенного внимания).
Чем полезен психометрический профиль в подбореВсе те аспекты, которые показывает опросник, полезны не только в оценке сотрудников, но и в оценке кандидатов. Посмотрим на примере, как психометрический профиль помогает рекрутеру и будущему руководителю. Возьмем вакансию директора направления — то есть руководителя бизнес-единицы внутри крупного холдинга. Он отвечает за прибыль, управление командой, маркетинговую стратегию и продажи.
Это была нетипичная вакансия — сфера, в которой работает компания, очень узкая. Найти на рынке кандидата с опытом в этой области невозможно. Поэтому перед нами встала задача посмотреть, а есть ли у кандидатов потенциал к управлению такой бизнес-единицей.
Разберем профиль одного из них.
Начнем со стиля заполнения опросника. Установка на согласие «4» означает, что человек чуть более критично оценивает себя, чем большинство людей в его нормативной группе. Небольшая критичность по отношению к себе не проблема, тревогу вызывает, когда этот показатель равен 1-2. Последовательность «6» также указывает, что мы можем доверять результатам опросника.
Дальше перейдем к анализу результатов по каждому кластеру:
1. Решает проблемы. Видим, что кандидат склонен структурировать и анализировать информацию, оцифровывать результаты. Мы можем сделать вывод, что в управлении операционной деятельностью он будет успешен, поскольку любит анализировать и работать с цифрами. При этом разрабатывать стратегии и предлагать инновационные решения ему сложнее, на это стоит обратить внимание. В то же время высокие оценки по компетенции «изучает предмет обсуждения» говорят о том, что он открыт к новым знаниям.
2. Влияет на людей. Видим, что все компетенции, связанные с коммуникацией, лидерством и координацией работы других, — сильная сторона кандидата. Это важно, учитывая, что должность предполагает личные продажи, а в этой сфере продажи строятся в основном за счет коммуникации.
3. В целом высокие оценки по кластеру «Адаптирует способ действия» говорят о стрессоустойчивости и самообладании в ситуации изменений. Стоит обратить внимание на низкие оценки по группе «дает поддержку». Учитывая единицу за компетенцию «работает в команде», мы делаем вывод, что кандидат предпочитает действовать самостоятельно, и это зона риска, поскольку должность предполагает, в том числе кросс-функциональное взаимодействие.
4. Очевидно, что кандидату потребуется подстраховка во всем, что касается соблюдения сроков и графиков, при этом высокие оценки за компетенции «ухватывает возможности» и «преследует цели» говорят как раз о потенциале в продажах.
Психометрика вскрывает большие объемы данных, которые позволяют просчитать все риски при принятии решения о найме.
Модель компетенций: как быть, если в компании уже есть своя модель, что делать, если она не доработана, и можно ли адаптировать модель Wave, если своей модели нетИспользование психометрики в рекрутинге и оценке возможно во всех этих случаях:
- Если модели нет или она пока не распространена в компании — подойдет профилирование: вы соотносите требования к должности с моделью, которая заложена в основу опросника.
- Если в компании уже действует модель компетенций — предстоит меппинг: вы сопоставляете свою модель с моделью в основе опросника.
Польза психометрики: главное
1. Психометрический профиль дает обширную информацию о потенциале развития компетенций, сильных сторонах, зонах развития и ограничениях человека. Кроме того, он показывает факторы, мотивирующие этого человека, и подходящую для него рабочую среду.
2. Возможность отделить зоны развития от ограничений — важное преимущество психометрического опросника: когда мы четко понимаем, какие компетенции у человека в зоне развития, а какие — его ограничения, мы можем определить, инвестиции в развитие каких именно компетенций дадут эффект, а с какими задачами он не справится в силу своих ограничений.
3. Зоны риска среди сильных сторон человека — еще один аспект, который может показать психометрический профиль. Чаще всего мы оцениваем человека и видим верхушку айсберга: выделяем сильные стороны, то есть хорошо развитые компетенции, на которые человек опирается в работе. Но опросник может показать, как будет действовать человек в зависимости от ситуации и среды, в каких обстоятельствах появится риск того, что он не сможет проявить свои навыки.
4. Если сравнивать стоимость ошибки при найме и стоимость психометрического опросника, можно сказать, что опросник — недорогой инструмент. Особенно если учитывать объем и глубину информации, которую он дает. Оценить двух финалистов отбора опросником стоит примерно 100 евро. А результаты помогут не только сделать правильный выбор, но и спланировать шаги по работе с выбранным кандидатом и его развитию.
Что такое психометрия? — Психометрическое общество
Слоган Психометрического общества гласит, что Общество посвящен развитию методов количественного измерения в психологии, образовании и социальных науках. Это очень общее описание психометрии, но мы подчеркиваем слово количественный в предыдущем предложении. Некоторые люди принимают более клинический взгляд на психометрию с акцентом на введение и применение психологических шкал.Но масштаб администрация не является особым акцентом этого общества.
Как способ разъяснить наши определения и взгляды на термин психометрия , несколько психометров с различные исследовательские направления дали определения ниже. Эти определения ни в коем случае не являются официальными, они скорее продемонстрировать индивидуальные различия в способах психометристы думают о своей профессии.
Хенк Кельдерман (Лейденский университет, Амстердамский университет)
Измерение и количественная оценка широко распространены в современном обществе.В начале современности научная революция предоставила твердую научная основа для физических измерений, таких как температура, давление и так далее. В конце девятнадцатого и начале двадцатого века аналогичная революция произошла в психологии с измерение интеллекта и личности. Решающая роль была играет Психометрия, первоначально определенная как «Искусство навязывание измерения и числа действиям разума » (Гальтон, 1879, стр. 149). С 1936 года Психометрическое общество были в авангарде развития формальных теорий и методы исследования уместности и верности психологические измерения.Потому что измерение в психологии часто делается с помощью тестов и анкет, это довольно неточно и возможны ошибки. Следовательно, статистика играет важную роль. в психометрии. Например, у членов общества есть уделял большое внимание развитию статистических методов для оценки зашумленных измерений, результаты которых рассмотрены индикаторы интересующих атрибутов, которые не могут быть непосредственно наблюдали.
Сегодня психометрия охватывает практически все статистические методы. которые полезны для поведенческих и социальных наук, включая обработка недостающих данных, комбинация предшествующих информация с данными измерений, измерения, полученные от специальных эксперименты, визуализация статистических результатов, измерения что гарантирует конфиденциальность личных данных и т. д.Психометрические модели и методы теперь имеют широкий диапазон применимости в различных дисциплины, такие как образование, производственные и организационные психология, поведенческая генетика, нейропсихология, клиническая психология, медицина и даже химия.
В будущем у нас будет больше личных данных, чем когда-либо прежде благодаря улучшенным инструментам, таким как сканирование мозга и секвенирование генома, а также рост Интернета и вычислительная мощность. Сбор данных теперь превосходит наши возможности собрать и интерпретировать его сложность.Ожидается, что весь экономика будет расти вокруг анализа данных, как коммерческих и науч. Важность инноваций в измерении и статистика и способы значимого обобщения и визуализации данных ожидается, что вместе с ним будет расти. Психометрическое общество ориентированы на то, чтобы стать крупным игроком в предоставлении этих инноваций.
Гальтон, Ф. (1879). Психометрические эксперименты. Мозг: A Журнал неврологии , 11 , 149-162.
Питер Моленаар (Государственный университет Пенсильвании)
Психометрия — это приближение скрытого психологического процессов с помощью стохастического анализа как на отдельных и уровни населения.
Денни Борсбум (Амстердамский университет)
Психометрия — это научная дисциплина, занимающаяся создание инструментов оценки, измерительных инструментов и формализованные модели, которые могут служить для связи наблюдаемых явлений (например, ответы на вопросы в IQ-тесте) на теоретические атрибуты (например, интеллект). Например, теоретические конструкции были определены как области наблюдаемого поведения ответы на какие вопросы образуют выборку (теория обобщаемости), как психологические атрибуты, которые действуют как общие причины предмета ответы (теория скрытых переменных), как ожидаемые значения теста оценка (классическая теория тестирования), как отображение наблюдаемых соотношений в числовую систему (теория масштабирования), и как системы взаимоусиливающих факторов (теория сетей).Такой модели представляют концептуальные, содержательные и статистические проблемы психометрии стремятся анализировать и решать. Потому что многие из вопросы, которые изучают психометрии, выходят за рамки дисциплинарных границ и касаются общих вопросов измерения и data-анализ, границы дисциплины нечеткие; психометрия особенно тесно переплетается с методологией и статистика. Психометрические методы широко используются в разных странах. науки и нашли применение в образовательном тестировании, генетика поведения, социология, политология и нейробиология.
Дэвид Тиссен (Университет Северной Каролины в Чапел-Хилл)
Использование прилагательного «психометрический» в смысле имени Психометрического общества восходит, по крайней мере, к Фрэнсису. Эссе Гальтона (1879 г.) в книге «Мозг», озаглавленное «Психометрические Эксперименты »; первая строка этой статьи заключается в том, что «Психометрия, вряд ли нужно говорить, означает искусство навязывание измерения и числа действиям разума… » «Эксперименты» Гальтона были по сути интроспективными, но он обработал свои результаты «статистически» (что означает, что он сообщил считает; это был ведь 1879 год!).Слова «психометрический» как прилагательное и «психометрия» как существительное, относящееся к области изучение стало все более распространенным по мере развития психологии, достигнув известности как название субдисциплины с основание Психометрического общества в 1935 г. и публикация «Психометрических методов» Гилфорда (1936).
Психометрические методы Гилфорда (1936) охватывают широкий спектр темы, из психофизических методов и психологического масштабирования через корреляцию и регрессию к процедурам анализа данных, полученных в результате ментальных тестов, и факторного анализа.в предисловие, Гилфорд (1936, стр. xi) написал: «Название« Психометрическая Методы », слишком долго ограничивающиеся клиническими испытаниями и т. Д., безусловно, достаточно широко, чтобы надлежащим образом охватить все темы только что упомянул. » Журнал Психометрического общества под названием Психометрика, пишется с k (предположительно) с кивком в сторону «Биометрика» Гальтона и Пирсона). издание с фондом общества; это включало статьи по всем темам книги Гилфорда.Для большей части двадцатого века психометрия была хорошо определена подзаголовок, появившийся под названием Психометрика из его создание в 1936 году до изменения дизайна обложки в 1984 году, журнал посвящена развитию психологии как количественного рациональная наука ».
Практики науки психометрии были известны как психометристы; однако этот термин также использовался для обозначения практикующие, проводившие психологические тесты в образовательных и клиническая практика.Около 1980 г., выпускник факультета психометрии. программы тренировок начали менять названия, чтобы избежать путаницы с этим альтернативным значением, и быть более инклюзивным постоянно увеличивающийся объем; чаще всего использовалась номенклатура «Количественная психология». В 1984 году обложка «Психометрики». был переработан, впервые оставив в стороне нарисованная вручную обложка; освященный веками титул был сохранен, но подзаголовок был изменен на «журнал количественных психология.» Это поле сейчас чаще всего называют «Количественная психология», но ее ведущий журнал остается Психометрика.Джонс и Тиссен (2007; см. Ниже) резюмируют история субдисциплины во вводной главе относительно недавняя книга, озаглавленная, как ни странно, «Психометрия».
Гальтон, Ф. (1879). Психометрические эксперименты. Мозг: A
Журнал неврологии, 11 , 149-162.
Гилфорд, Дж. П. (1936). Психометрические методы . Новый
Йорк, Нью-Йорк: Книжная компания Макгроу-Хилл.
Видео и дополнительная литература
Видео-лекции можно найти здесь.
Дополнительная информация об определении, истории и будущем
психометрии можно найти в следующих статьях.
Джонс, Л. В., и Тиссен, Д. (2007). А
история и обзор психометрии. В C.R. Rao и S.
Синхарай (ред.). Справочник по статистике, 26:
Психометрия (стр 1-27). Амстердан: Северная Голландия.
Бесплатную версию этой главы можно получить здесь.
Стаут, W. (2002). Психометрия: От от практики к теории и назад. Психометрика, 67 (4), 485-518. А бесплатную версию этой статьи можно получить здесь.
Гроенен, П. Дж., И Андрис ван дер Арк, Л. (2006). Видения 70 лет психометрии: прошлое, настоящее и будущее. Statistica Neerlandica, 60 (2), 135-144.
Борсбум, Д. (2006). Атака психометристы. Психометрика, 71 (3), 425-440.
Что такое психометрия?
Психометрия, образованная от греческих слов «ментальный» и «измерение», относится к области психологии, посвященной тестированию, измерению, оценке и связанной с ними деятельности.По данным Американской психологической ассоциации (APA), в области психометрии рассматривается теория и методика психологического измерения, которые позволяют количественно оценить знания, способности, отношения и личностные черты.
Ученые-исследователи, также называемые психометриками, создают научно обоснованные и надежные инструменты (такие как анкеты и тесты) для сбора данных и обеспечения количественной оценки. Сегодня многие работодатели используют тесты, основанные на психометрических принципах, чтобы служить как инструментами предварительного отбора, так и приспосабливать существующих сотрудников к ролям, наиболее подходящим для их типа личности.Согласно статье, опубликованной APA, до 70% потенциальных сотрудников проходят тесты личности для крупных компаний, таких как McDonald’s и Lowe’s.
Что можно измерить с помощью психометрического теста?
Существует несколько различных типов психометрических тестов, которые можно использовать для оценки ваших академических достижений, профессиональных навыков, отношения к людям и степени, в которой вы можете выполнять требования работы, согласно Джеймс Наро ’85MBA , консультант по вопросам продаж и оптимизации талантов для The Naro Group и дополнительный бизнес-инструктор в Университете Южного Нью-Гэмпшира, который недавно говорил о психометрии на мероприятии для выпускников Business Indicator Series в кампусе SNHU.
Общество управления человеческими ресурсами (SHRM) описывает различные тесты, которые работодатели могут использовать для отбора или размещения сотрудников.
- Когнитивные тесты — Хотя наиболее распространенным типом когнитивных тестов является IQ-тест, другие оценивают вербальные и математические способности человека и его способности к рассуждению. Эти тесты помогают менеджерам по найму измерить вашу способность выполнять определенную работу. Они измеряют ваш уровень владения конкретными знаниями или навыками по отношению к данной группе населения, измеряя то, чего вы достигли или узнали в ходе предыдущего формального образования, обучения или инструктажа.
- Тесты личности — Эти тесты пытаются измерить такие аспекты личности потенциального сотрудника, как отношение, эмоциональная адаптация и мотивация.
- Тесты на профессиональную пригодность — Сможете ли вы выполнять работу, если будете приняты на работу? Тесты на профессиональную пригодность предоставляют информацию о вашей способности справляться с будущими требованиями к работе. Он измеряет вашу способность как приобретать, так и применять навыки. Работодатели могут использовать эти типы психометрических оценок, например, для измерения вашей способности изучать новый язык, управлять людьми или овладевать компьютерным кодом.Один популярный тип теста на способности известен как личностный тест. Личностные тесты исследуют, например, ваш стиль управления, то, как вы реагируете на коллег, вашу способность справляться со стрессом и вашу способность принимать решения.
Какие методы можно использовать?
Большинство методов оценки делятся на одну из трех категорий: методы наблюдения, проективные методы или личностные исследования .
- Наблюдение (наблюдение за тем, что делают люди) — один из методов проведения психологических исследований.Однако существуют разные типы методов наблюдения, которые включают контролируемые наблюдения, натуралистические наблюдения и наблюдения участников, согласно Simply Psychology.
- При контролируемых наблюдениях исследователь решает, где будет происходить наблюдение, в какое время, с какими участниками, при каких обстоятельствах и использует стандартизированную процедуру.
- Натуралистическое наблюдение включает наблюдение за спонтанным поведением участников в их естественном окружении.Исследователь просто записывает то, что он видит, любым способом.
- Совместное наблюдение — это вариант естественного наблюдения, но в этом типе наблюдения исследователь присоединяется и становится частью группы, которую он изучает, чтобы глубже понять свою жизнь.
- Проективные методы включают в себя оценку личности, в которой вы предлагаете ответы на неоднозначные сцены, слова или изображения. Одна из наиболее распространенных проективных оценок — тест Роршаха.Этот психологический тест, разработанный в 1921 году швейцарским психологом Германом Роршахом, включает интерпретацию чернильных пятен для анализа личности и эмоционального функционирования человека. Первоначально он был разработан как инструмент для диагностики шизофрении. Согласно PsychCentral, тест Роршаха — это задача по решению проблем, которая дает представление о психологии человека, который ее принимает, и некоторый уровень понимания прошлого и будущего поведения человека.
- Инвентаризация личности — это инструменты самооценки, которые консультанты по вопросам карьеры и менеджеры по найму могут использовать для выявления типов личности участников.Эти тесты могут предоставить информацию о ваших социальных качествах, мотивациях, сильных и слабых сторонах и взглядах. По мнению The Balance Careers, многие специалисты по карьере считают, что эти факторы играют важную роль в успехе и удовлетворении работой и карьерой. Вы также можете использовать личностный инвентарь, чтобы лучше понять свои сильные стороны и способность выполнять определенные рабочие роли.
Тесты личности, с которыми вы можете столкнуться при приеме на работу
На рынке существует множество инвентаризаций личности, предназначенных для предоставления работодателям различной информации.В то время как некоторые из них ориентированы на самопознание, другие служат в качестве оценок, которые помогают работодателям подбирать нужных людей для конкретных рабочих ролей. По словам Наро, поскольку компаниям приходится тратить время и деньги, когда они нанимают «плохих» сотрудников, можно использовать тесты личности, чтобы определить, хорошо ли вы подходите компании или можете ли вы выполнять свои обязанности на данной должности.
«Личностные тесты могут помочь заранее предсказать, насколько позиция соответствует чьим-то личным мотивам или как это может помочь им внести изменения», — сказал он.
Ниже приведены несколько популярных личностных тестов, с которыми вы можете столкнуться при приеме на работу.
- Индикатор типа Майерс-Бриггс (MBTI): Вы интроверт или экстраверт? MBTI, один из наиболее известных личностей, был разработан Кэтрин Бриггс и Изабель Бриггс Майерс на основе теории типа личности Карла Юнга. Он рассматривает 16 типов личности, которые указывают на то, как вы предпочитаете заряжаться энергией, воспринимать информацию, принимать решения и жить своей жизнью.Согласно Фонду Майерса Бриггса, инструмент MBTI не предназначен в качестве инструмента для использования при найме на работу или для принятия решений о назначении на работу. Тем не менее, около 80% новых сотрудников в компаниях из списка Fortune 500 получили MBTI за последнее десятилетие, и бесчисленное количество других компаний используют его как часть фактического процесса отбора сотрудников, сообщает Forbes.
- Caliper Profile измеряет, как личностные качества человека соотносятся с его или ее производительностью труда, согласно Top Resume.Тест состоит из нескольких типов вопросов. Самый распространенный тип представляет собой серию утверждений, и ваша задача — решить, какое из утверждений лучше всего соответствует вашей точке зрения. Есть также вопросы, требующие от вас определения утверждений, которые меньше всего отражают вашу точку зрения. Профиль Caliper отличается от других личностных тестов тем, что он исследует как положительные, так и отрицательные качества, давая менеджерам по найму полное представление о кандидате.
- Опросник по шестнадцати личностным факторам , также называемый 16PF, был разработан в 1949 году психологом Рэймондом Кеттеллом, который, по данным Forbes, выявил 16 черт, которые у всех нас есть в разной степени, например, душевность и напряжение.170 вопросов теста отличаются от других личностных оценок тем, что они спрашивают, как вы можете реагировать на определенную ситуацию, с которой вы можете столкнуться на работе. Работодатели могут использовать эту оценку, чтобы определить, насколько вероятно, что вы завершите задачи до конца или насколько хорошо вы справляетесь со стрессовыми ситуациями.
- Индекс прогнозирования (PI) предлагает вам выбрать из ряда прилагательных, чтобы раскрыть вашу личность на основе того, как вы описываете себя и как другие могут вас видеть.По словам Наро, PI рассматривает такие факторы, как доминирование, экстраверсия, терпение, формальность и объективность, чтобы дать работодателям представление о том, насколько хорошо сотрудник может соответствовать конкретной работе. Компании могут использовать PI не только как часть процесса собеседования, но и для согласования своей бизнес-стратегии со своей стратегией найма.
«Исследования показали, что требования к поведению тесно связаны с тем, насколько хорошо кто-то выполняет свою работу», — сказал Наро. «Оценки могут определить, способны ли вы выполнять работу, будете ли вы ее выполнять, будете ли вы выполнять ее в течение длительного времени и будете ли вы делать это хорошо.”
Используя психометрию, работодатели могут лучше понять, как личности кандидатов могут лучше всего подходить для их сотрудников. В то же время кандидаты могут использовать личностные оценки, чтобы раскрыть свои сильные стороны и определить, для каких работ они лучше всего подходят.
Кристен Годфри Мэддокс из 11G — писатель и профессионал в области маркетинга и коммуникаций. Свяжитесь с ней в LinkedIn.
Психометрия — обзор | Темы ScienceDirect
Цели измерения социальных реакций на роботов
Психометрия — это область исследования, сфокусированная на теориях и методах измерения психологических построений.Психометрия предоставляет исследователям набор стандартов, по которым можно судить об эффективности и вероятном успехе измерения психологических явлений. Как мы утверждали ранее в этой главе, социальная реакция на роботов играет центральную роль в объяснении различных важных аспектов HRI. Таким образом, мы можем обратиться к психометрии для оценки показателей, используемых в HRI, и для руководства дальнейшим развитием и уточнением.
При разработке инструмента психометрического тестирования важны несколько целей. Во-первых, прибор должен фиксировать то, что он якобы измеряет.Применительно к HRI общая мера социальных реакций на роботов должна определять и фиксировать то, на чем люди спонтанно сосредотачиваются, когда они думают, смотрят или взаимодействуют с роботом. Во-вторых, меры должны успешно отражать намеченные, а не непреднамеренные конструкции. И, в-третьих, на меры следует реагировать последовательно, как в рамках элементов, предназначенных для измерения конкретной конструкции, так и во времени в ответ на последовательный стимул. Конечно, как известно большинству читателей, эти характеристики соответствуют достоверности конструкции , дискриминантной достоверности и надежности при измерении, соответственно.
Хотя психометрия, вероятно, хорошо понимается многими читателями, краткое обсуждение нескольких ключевых вопросов подчеркивает важные проблемы HRI. Как правило, мера является психометрически правильной в той степени, в которой она надежна и действительна. Хотя надежность обычно относится к последовательности в реагировании на меру, есть несколько различных аспектов надежности. Один аспект надежности относится к постоянству во времени; Последовательно ли оцениваются одинаковые стимулы у разных участников исследования в разных контекстах тестирования? Другой важный аспект надежности включает внутреннюю согласованность (обычно отражаемую в статистике, α Кронбаха), указывающую, последовательно ли люди реагируют на элементы, которые предположительно измеряют одну и ту же основную конструкцию.
Достоверность — это степень, в которой оценка, полученная на основе меры, может быть интерпретирована как мера определенной психологической конструкции. Валидность высока, когда мера успешно захватывает конструкт или конструкции, которые он предназначен для оценки. Инструменты должны иметь высокую дискриминантную достоверность , если они предполагают оценивать более одного аспекта суждения. Этот тип валидности является высоким, если ответы на шкалу или подшкалу отличаются от ответов на шкалы, оценивающие теоретически различные концепции.Когда различные концепции измеряются в рамках одной шкалы, размерность шкалы , или факторная структура, используется для определения количества и природы различных оцениваемых конструкций. Одномерные шкалы содержат набор согласованных элементов, измеряющих одну психологическую конструкцию, тогда как многомерные шкалы содержат наборы элементов, охватывающих различные психологические конструкции. В общем, меры должны вызывать последовательные ответы при оценке любой данной конструкции и разные ответы на разные конструкции.
Есть несколько явных преимуществ использования психометрически достоверных показателей в HRI. Во-первых, использование стандартизированной меры, которая является одновременно надежной и действительной, позволяет сравнивать результаты по одной метрике как с течением времени, так и в разных контекстах. Использование действующего инструмента становится особенно важным при попытке сравнить реакцию разных групп респондентов на разных или похожих роботов. Во-вторых, такую шкалу можно использовать для изучения множества взаимосвязанных, но различных явлений в рамках данной области исследования.Если конструкции похожи, но различны, средства измерения должны отражать эти отношения. В-третьих, использование действительной меры обеспечивает прочную основу для изучения других суждений или поведения, касающихся робота. В-четвертых, такая шкала позволяет исследователям и практикам избегать использования интуиции или предположений в качестве основы исследования. В общем, использование психометрических данных для разработки и оценки меры гарантирует, что критически важные конструкции изучаются, избегая при этом измерения нечетких или несущественных конструкций при учете реакций на роботов.Учитывая эти бесчисленные преимущества, неудивительно, что в исследовании HRI появилось несколько шкал, оценивающих реакцию на роботов.
Каковы психометрические свойства анкеты Godspeed? Как мы сообщали ранее, различные субшкалы обеспечивают согласованность ответов от умеренной до высокой, что указывает на приемлемый уровень надежности. Тем не менее, эмпирическая работа подняла вопросы о дискриминантной валидности субшкал удачной скорости. В исследовании сверхъестественной долины Хо и МакДорман (2010) попросили участников оценить компьютерных анимированных персонажей и роботов, отображаемых с помощью видеоклипов, с помощью опросника Godspeed.Были проведены различные статистические тесты для оценки психометрических свойств Godspeed. Надежность субшкалы была аналогична той, о которой сообщалось в Bartneck et al. (2009), за исключением предполагаемой безопасности (α = 0,60 Кронбаха). Однако ответы на субшкалы сильно коррелировали, достигая 0,89. Фактически, средняя корреляция в ответах на первые четыре подшкалы составила 0,74, что свидетельствует о том, что оценивались аналогичные и сильно перекрывающиеся концепции. Только воспринимаемая безопасность представляла собой отдельную конструкцию (все корреляции с другими подшкалами <0.20). Этот вывод был подтвержден факторным анализом, статистическим методом для создания небольшого, значимого набора концептуальных переменных (факторов) на основе анализа изменчивости среди откликов шкал (см. Обзор в Furr, 2011). Факторный анализ идеален для определения того, улавливают ли разные субшкалы разные конструкции, а анализ Хо и МакДормана показал, что субшкалы Godspeed этого не делают. Вместо этого факторный анализ не подтвердил существование пяти предполагаемых факторов.Более того, ответы на многие вопросы, предназначенные для измерения конкретных концепций, были слабо связаны с этим фактором. Например, суждения «Удивлен – Спокойствие» были слабо связаны с предполагаемым фактором безопасности, который он якобы измерял. Эту работу критиковали за использование видеоклипов, а не реальных роботов (Weiss & Bartneck, 2015). Несмотря на это предостережение, исследование действительно подняло вопросы о полезности Godspeed как общей меры социального восприятия роботов.
Психометрия — обзор | Темы ScienceDirect
Психометрические теории
Психометрические теории обычно пытались понять структуру интеллекта: какую форму он принимает и каковы его части, если таковые имеются? Такие теории обычно основывались на данных, полученных в результате тестов на умственные способности, включая аналогии (например, адвокат относится к клиенту , как врач относится к __), классификациям (например, какое слово не относится к остальные — малиновка, воробей, цыпленок, голубая сойка ), а также завершение серий (e.г., какое число будет следующим в следующем ряду? 3, 6, 10, 15, 21, _ ).
Психометрические теории основаны на модели, которая изображает интеллект как совокупность способностей, измеряемых ментальными тестами. Одна из первых психометрических теорий принадлежит британскому психологу Чарльзу Э. Спирману (1863–1945), опубликовавшему свою первую крупную статью об интеллекте в 1904 году. Спирмен пришел к выводу, что всего два типа факторов лежат в основе всех индивидуальных различий в результатах тестов.Первый и более важный фактор, который он назвал «общим фактором», или g , влияет на производительность при выполнении всех задач, требующих интеллекта. Другими словами, независимо от задачи, если требуется интеллект, требуется г . Второй фактор конкретно связан с каждым конкретным тестом. Например, если вы дадите кому-то тест на арифметические рассуждения, для его выполнения потребуется общий коэффициент, общий для всех тестов ( g ), и конкретный коэффициент любых мысленных операций, требуемых только для математических рассуждений, в отличие от другие ментальные тесты.Таким образом, эти специфические ( s ) факторы не представляют большого интереса для теорий интеллекта, потому что они не являются обобщающими. Спирмен не знал точно, что это за общий фактор, но в 1927 году он предположил, что это может быть что-то вроде «умственной энергии». Он оставил точную природу умственной энергии в значительной степени неопределенной.
Американский психолог Л.Л. Терстон не согласился с теорией Спирмена, утверждая, что существует семь факторов, которые он определил как «первичные умственные способности».«Эти семь способностей, согласно Терстону, были вербальным пониманием (например, знание словарного запаса и чтением), вербальной беглостью (например, написание и иным производством слов), числом (например, решение довольно простых числовых вычислений и задач арифметического мышления), пространственная визуализация (например, визуализация и манипулирование объектами, например установка набора чемоданов в багажник автомобиля), индуктивное мышление (например, завершение числовой серии или предсказание будущего на основе прошлого опыта), память (например,g., вспоминая имена или лица людей) и скорость восприятия (например, корректура для обнаружения опечаток в тексте).
Хотя спор между Спирменом и Терстоном так и остался нерешенным, другие психологи, такие как канадский Филип Э. Вернон и американец Раймонд Б. Кеттелл, предположили, что оба были правы в некоторых отношениях. Вернон и Кеттелл рассматривали интеллектуальные способности как иерархические, g , или общие способности, находящиеся на вершине иерархии.Но ниже г — это уровни постепенно сужающихся способностей, заканчивающиеся конкретными способностями, определенными Спирменом. Кеттелл, например, в 1971 г. предложил в Способности: их структура, рост и действие , что общие способности можно подразделить на два следующих вида: «текучие» и «кристаллизованные». с помощью таких тестов, как аналогии, классификации и дополнения серий. Кристаллизованные способности, которые, как считается, происходят от подвижных способностей, включают словарный запас, общую информацию и знания в конкретных областях.Американский психолог Джон Л. Хорн предположил, что кристаллизованные способности более или менее увеличиваются на протяжении жизни человека, тогда как гибкие способности увеличиваются в более ранние годы и уменьшаются в более поздние.
Американский психолог Джон Б. Кэрролл в работе Human Cognitive Abilities (1993) предложил «трехуровневую» психометрическую модель интеллекта, которая расширила существующие теории интеллекта. Многие психологи считают модель Кэрролла окончательной, поскольку она основана на повторном анализе сотен наборов данных.В первом слое Кэрролл определил узкие способности (примерно 50), которые включали семь основных способностей, определенных Терстоуном. По словам Кэрролла, средний слой включает в себя широкие способности (~ 10), такие как обучение, способность извлекать информацию, скорость, визуальное восприятие, подвижный интеллект и создание идей. Третий слой состоял исключительно из общего фактора, g , как определил Спирмен.
Может показаться само собой разумеющимся, что фактор наверху будет общим фактором, но это не так, в том смысле, что нет никакой гарантии, что вообще существует какой-либо общий фактор.Кэрролл, как и многие другие теоретики психометрии, утверждали, что существует такой общий фактор.
Что такое психометрия? — Лучшие дипломы консультанта
Психометрия — это область, в которой основное внимание уделяется правильному измерению определенных психологических понятий, таких как познание, знания и личность. Эта уникальная область жизненно важна для успеха всех отраслей психологии. Продолжайте читать, чтобы узнать, почему и почему эта специальная область так важна для психологии.
Как это развивалось
Психологические измерения начинались с элементарных тестов интеллекта и личности.По мере того, как теоретические подходы к психологическим измерениям становились все более изощренными, психологи начали применять комплексные данные и статистическую методологию для понимания своих результатов. Из-за этого современные психологические измерения чрезвычайно точны и научно обоснованы.
Каковы основные концепции?
Психологические измерения основаны на классических теориях, таких как обоснованность и надежность. Достоверная мера относится к точным измерениям, а надежная мера — к согласованности фактов.Обе эти концепции можно математически интерпретировать для получения коррелирующих согласований. Например, согласованность можно измерить с помощью коэффициента корреляции момента произведения Пирсона. С другой стороны, валидность измеряется путем установления одновременной валидности, которая используется для создания предсказуемой валидности и, следовательно, конструирования валидности.
Популярные онлайн-программы
Выяснили, куда обратиться? Эти лучшие аккредитованные школы предлагают различные онлайн-степени.Рассмотрите одну из этих аккредитованных программ и откройте для себя их ценность сегодня.
Какое программное обеспечение используется?
Комплексные исследования и хранилища данных не могут быть поняты или обработаны вручную. Поэтому психологи полагаются на программное обеспечение Psychometrics для анализа своих тестов и исследований.
Например, программы классической теории тестирования включают CITAS, TAP и CITAS.
Теория отклика предмета (IRT) — это научный подход, который предсказывает вероятность на основе функций черт.Популярные программы включают Facets, ICL, JMetrik и TestFact.
Существуют дополнительные программы, которые предоставляют только определенные результаты калибровки.
Каковы преимущества?
Вся психология зависит от основательных исследований и правильно интерпретированных результатов. Первоначально психологию считали квазинаукой из-за чрезмерной зависимости от теорий и субъективных наблюдений. Однако современная психология теперь почти полностью полагается на статистические данные и исследования в поддержку теорий.
Когнитивные психологи используют психологические измерения для оценки биологических и когнитивных процессов. С другой стороны, поведенческие психологи полагаются на психологические измерения для количественной оценки человеческого поведения. Психологи, специализирующиеся на аномальных проблемах психического здоровья, используют психологические измерения для оценки своих пациентов, понимания психических заболеваний, установления рекомендаций по диагностике и скрининга новых пациентов. Наконец, количественные психологи в основном используют статистические измерения для проведения психологических измерений в различных областях исследований.
В каких областях используются психологические измерения?
Система образования полностью зависит от психологических измерений. Ежегодные тесты в государственных школах и тесты на поступление в колледж SAT — все это академические формы психологических измерений. Стандартизированные тесты — лучший способ оценить успеваемость учащихся, выявить слабые места и помочь учащимся совершенствоваться. Поэтому школьные консультанты и психологи часто полагаются на психологические тесты, чтобы помочь своим ученикам.
Все виды вооруженных сил требуют, чтобы кандидаты прошли тест ASVAB, который используется для определения того, для каких должностей кандидат имеет квалификацию.Фактически, Министерство обороны также создало тест DLAB для оценки способности кандидата изучать иностранные языки.
Наконец, все правоохранительные органы используют стандартизированные тесты, которые измеряют память, знания, компетенции и способность кандидата логически обрабатывать информацию. Другие уникальные вакансии, такие как авиадиспетчер или оператор службы 911, также будут использовать определенные психологические параметры для отбора кандидатов на вакансию.
В конце концов, психологические измерения являются основой научной достоверности для всех разделов психологии.Эти измерения обеспечивают превосходную достоверность и надежность в научных психологических исследованиях. Большинство психологов используют стандартные методы интерпретации и передовые программы для анализа данных. Без психометрии область психологии вернулась бы к расплывчатым постиндустриальным теориям о человеческом поведении и мыслительных процессах.
Психометрия
2
Фильм ученых о квантовых измерениях
Февраль26 февраля 2020 г. — Измерение квантовой системы приводит к ее изменению — один из странных, но фундаментальных аспектов квантовой механики. Теперь исследователи смогли продемонстрировать, как это изменение …
Магнитный момент мюона идеально подходит
7 апреля 2021 г. — Новая оценка силы магнитного поля вокруг мюона — субатомной частицы, похожей на электрон, но более тяжелой, — сокращает разрыв между теорией и экспериментом …
Как чувствительность к эмоциям меняется на протяжении жизни
Мар.1 января 2019 г. — Почему мы становимся более позитивными по мере взросления? Почему подростки так чувствительны к негативному социальному …
Ученые измерили точный радиус протона, чтобы решить головоломку десятилетней давности
5 сентября 2019 г. — Исследователи точно измерили размер протона — решающий шаг к разгадке тайны, которая занимала ученых всего мира в течение последнего десятилетия. В …
Квантовое моделирование: упрощение измерения запутанности
24 июня 2021 г. — Исследователи разработали метод, позволяющий измерить ранее недоступные свойства квантовых систем.Новый метод определения квантового состояния в квантовых симуляторах снижает …
Прецизионные измерения достигают предела
5 ноября 2018 г. — Исследователи продемонстрировали процедуру для проведения точных измерений скорости, ускорения, свойств материалов и даже гравитационных волн, приближающуюся к предельной чувствительности, разрешенной …
Разборка кота Шредингера
14 февраля 2020 г. — Многие физики пытались объяснить проблему квантовой суперпозиции на примере кота Шредингера.Теперь французский физик-теоретик предлагает новое возможное решение, которое …
Гравитация вызывает однородность Вселенной
24 сентября 2020 г. — Гравитация может ускорить гомогенизацию пространства-времени как Вселенной …
Преодолевая барьер разрешающей способности с ограниченной квантовой точностью
5 января 2021 г. — Исследователи разработали новый метод измерения расстояния для таких систем, как GPS, который обеспечивает более точные результаты, чем когда-либо прежде.Используя квантовую физику, команда успешно …
Проверка общей теории относительности Эйнштейна
9 апреля 2020 г. — В рамках еще одной проверки справедливости общей теории относительности Эйнштейна ученые использовали два точно настроенных оптических решетчатых часа, чтобы произвести новые сверхточные измерения времени …
Психометрия: определение и примеры тестов — видео и стенограмма урока
Пример
Боб — новобранец Академии ФБР.Известно, что ФБР проводит множество психометрических тестов, чтобы убедиться, что его новобранцы образованы, психически стабильны и в остальном годны для выполнения служебных обязанностей. Итак, в первую неделю в академии Боб должен сдать несколько тестов.
Первый тип теста, который проходит Боб, — это тест интеллекта — вероятно, тест Вешлера или Стэнфорд-Бине — для определения его IQ , или коэффициента интеллекта. Обученный психометр , который проводит этот тип теста, заставит Боба выполнить множество задач, от повторения последовательности чисел вперед и назад до решения некоторых довольно сложных головоломок.
После того, как Боб завершит тест на IQ, он, скорее всего, пройдет психометрический тест, который разработан, чтобы убедиться, что у него нет никаких основных личностных или психических расстройств. Одним из таких тестов является MMPI, или Миннесотский многофазный опросник личности. Доступно несколько версий этого теста, одна из которых содержит 567 вопросов «верно / неверно», которые позволят определить все аспекты личности Боба.
На следующий день психометр может попросить Боба пройти несколько тестов, которые позволят оценить его убеждения и отношения.Это может продолжаться и продолжаться. Существуют буквально тысячи психометрических тестов, хотя не все они были разработаны профессионалами. Другой популярный тип психометрических тестов — это шкала Лайкерта, которая спрашивает об уровне вашего согласия или несогласия в ответ на подсказку.
Достоверность и надежность
При написании и проведении психометрических тестов психометристы должны убедиться, что тесты действительны и надежны. Действительность просто означает, что тест измеряет то, что должен измерять.Другими словами, IQ-тест Стэнфорда-Бине не годился бы, если бы он измерял личностные черты или отношения, а не интеллект.
Надежность означает, что психометр будет получать примерно один и тот же результат от одного и того же человека каждый раз, когда проводится тест. Другими словами, надежно ли тест выполняет то, для чего он предназначен?
Психометристы и составители тестов очень беспокоятся о надежности и валидности, поэтому новые психометрические тесты проходят тщательные испытания и нормируются, прежде чем они появятся на рынке. Норма относится к средству «тестирования» теста и определения исходных показателей, прежде чем он будет использован для тестирования населения в целом.
Краткое содержание урока
Психометрия — это область исследования, которая занимается проверкой интеллекта, взглядов, убеждений и личности людей.