Валидность внешняя: Внешняя валидность — это… Что такое Внешняя валидность? – Внешняя валидность — Психологос

Автор: | 20.10.2020

Содержание

Внешняя валидность — это… Что такое Внешняя валидность?

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность — соответствие реального исследования изучаемой объективной реальности.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности[2].

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о

степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов

[2].

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности»[2], однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

См. также

Примечания

  1. Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 89.
  2. 1 2 3 Исследование в психологии: методы и планирование / Дж. Гудвин. — 3-е изд. — СПб.: Питер, 2004. С. 185.

Внешняя валидность — Психологос

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на

  • другие популяции,
  • другие условия,
  • другое время.

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно генерализовал свою модель на представителей обоих полов.

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

Вводное занятие Университета

Внешняя валидность — Карта знаний

Источник: Википедия

Связанные понятия

Вали́дность (англ. validity, от лат. validus — «сильный, здоровый, достойный») — обоснованность и пригодность применения методик и результатов исследования в конкретных условиях. Более прикладное определение понятия «валидность» — мера соответствия методик и результатов исследования поставленным задачам. Валидность считается фундаментальным понятием экспериментальной психологии, организационной психологии и психодиагностики. Вну́тренняя вали́дность (англ. internal validity) — вид валидности, степень влияния независимой переменной на зависимую переменную. Внутренняя валидность тем выше, чем больше вероятность того, что изменение зависимой переменной вызвано изменением именно независимой переменной (а не чего-либо ещё). Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Психометри́я (психометрика) — дисциплина психологии, изучающая теорию и методику психологических измерений, включая измерение знаний, способностей, взглядов и качеств личности. Психометрия является разделом психодиагностики. В первую очередь, эта область касается создания и валидации измерительных инструментов, таких как опросники, тесты и методики описания (оценки) личности. Она включает в себя две основные исследовательские задачи, а именно… Проблема Гальтона, названная в честь сэра Фрэнсиса Гальтона, представляет собой проблему выведения заключений из кросс-культурных данных на основании статистического феномена, известного на сегодняшний день как сетевая автокорреляция. В настоящее время проблема признается проблемой общего характера, которая применяется ко всем неэкспериментальным исследованиям, а также к экспериментальному проектированию. Ее можно наиболее просто описать как проблему внешних зависимостей при проведении статистических… Больша́я пятёрка — диспозициональная (от англ. disposition — предрасположенность) модель личности человека.

Упоминания в литературе

2. Вариативность использования стратегий преодоления частично зависит и от индивидуальных склонностей. Однако в большинстве случаев требования ситуации изменяют стратегии. Существуют групповые (культурные, классовые, профессиональные и др.) различия в понимании реакций «стремление к успеху», не говоря уже о различиях в их оценки. Таким образом, подходы, исследующие исключительно личностное влияние, методологически более чисты, так как их шкалы имеют большую внутреннюю надежность, но их внешняя валидность ниже. 4. Валидность внешняя – это приблизительно то же самое, что и эмпирическая валидность, но здесь речь должна идти о связи между показателями методики и наиболее значимыми внешними признаками, относящимися к поведению испытуемого. Специальное исследование подтвердило соответствие инструмента современным требованиям, предъявляемым к психометрическим качествам разрабатываемых тестов. Тестирование опросника показало его достаточно высокую надежность (коэффициент α Кронбаха по субшкалам: удовлетворенность результатом лечения – 0,79; удовлетворенность отношениями врач – больной – 0,84; удовлетворенность бытовыми условиями и окружающей обстановкой – 0,66). Высокие показатели получены также по параметрам внутренней и внешней валидности.

Связанные понятия (продолжение)

Вопрос научного обоснования нейролингвистического программирования (НЛП), соотношения НЛП и науки, а также критического научного рассмотрения феномена НЛП стоит со времени создания НЛП в начале 1970-х.

Подробнее: НЛП и наука

Типология Майерс — Бриггс — типология личности, возникшая на базе типологии Юнга в 1940-х годах и получившая широкое распространение в США и Европе. На основе этой типологии была создана система психологического тестирования — Myers–Briggs Type Indicator (MBTI). Академическая психология настороженно относится к этому подходу, принимая его с многочисленными оговорками, так как не все исходные предположения теории были затем подтверждены после накопления эмпирических данных. Психологический эксперимент — проводимый в специальных условиях опыт для получения новых научных знаний о психологии посредством целенаправленного вмешательства исследователя в жизнедеятельность испытуемого. Теоретическая выборка (англ. theoretical sampling), или теоретический отбор — процесс сбора данных для теории, когда аналитик одновременно собирает, кодирует, анализирует и сравнивает свои данные между собой. Он также решает, какие данные собирать дальше и где их искать, чтобы развивать свою теорию по мере ее возникновения . Исследователь выбирает какую-либо общую проблемную область и начинает с определения некоторых ключевых понятий и особенностей, которые будут им анализироваться. При этом важно… Методика Роджерса-Даймонд — личностный опросник, направленный на выявление особенностей личности тестируемого и степени социально-психологической адаптации, часто к новой среде, условиям и правилам поведения. Планирование эксперимента — один из важнейших этапов организации психологического исследования, на котором исследователь пытается сконструировать наиболее оптимальную для воплощения на практике модель (то есть план) эксперимента. Метод индивидуального случая в психологии (англ. case study) — один из методов клинической психологии, в частности, психотерапии, относящийся к классу исследовательских приемов, которые включают в себя описание и анализ конкретных особенностей личности или феномена, сопоставление результатов с нормативными данными. Контент-ана́лиз (от англ.: англ. contents — содержание, содержимое) или ана́лиз содержа́ния — стандартная методика исследования в области общественных наук, предметом анализа которой является содержание текстовых массивов и продуктов коммуникативной корреспонденции. Дескриптивные методы принятия решений — это оценочно-описательный метод исследования, направленный на эмпирическое исследование и описание поведения отдельных лиц и групп людей в процессе принятия решений. Она носит ярко выраженный объясняющий, а не предписывающий характер. Шкала (измерительная шкала) — это знаковая система, для которой задано отображение (операция измерения), ставящее в соответствие реальным объектам (событиям) тот или иной элемент (значение) шкалы. Формально шкалой называют кортеж, , где X — множество реальных объектов (событий), φ — отображение, Y — множество элементов (значений) знаковой системы. Конструктная валидность (концептуальная, понятийная валидность) — частный случай операциональной валидности, степень адекватности метода интерпретации экспериментальных данных теории, которая определяется правильностью употребления терминов той или иной теории. Когнити́вное искаже́ние — понятие когнитивной науки, означающее систематические отклонения в поведении, восприятии и мышлении, обусловленные субъективными убеждениями (предубеждениями) и стереотипами, социальными, моральными и эмоциональными причинами, сбоями в обработке и анализе информации, а также физическими ограничениями и особенностями строения человеческого мозга. Когнитивные искажения возникают на основе дисфункциональных убеждений, внедрённых в когнитивные схемы, и легко обнаруживаются при… Тематический апперцептивный тест (англ. Thematic apperception test (TAT)) — проективная психодиагностическая методика, разработанная в 1930-х в Гарварде Генри Мюрреем и Кристианой Морган. Целью методики являлось исследование движущих сил личности — внутренних конфликтов, влечений, интересов и мотивов. После второй мировой войны тест стал широко применяться психоаналитиками и клиницистами для работы с нарушениями в эмоциональной сфере пациентов. Эффект сверхуверенности (англ. overconfidence effect) — когнитивное искажение, при котором уверенность человека в своих действиях и решениях значительно выше, чем объективная точность этих суждений. Также выражается в льстивом представлении о себе. Иерархия доказательств отражает относительное качество (надежность получаемых данных при их проведении) различных видов биомедицинских исследований экспериментальной медицины, которое выражается в уровнях доказательств. Фармакоэкономика — новая самостоятельная наука, которая изучает в сравнительном плане соотношение между затратами и эффективностью, безопасностью, качеством жизни при альтернативных схемах лечения (профилактики) заболевания. Нейролингвистическое программирование (также нейро-лингвистическое программирование, НЛП, от англ. Neuro-linguistic programming) — направление в психотерапии и практической психологии, не признаваемое академическим сообществом, основанное на технике моделирования (копирования) вербального и невербального поведения людей, добившихся успеха в какой-либо области, и наборе связей между формами речи, движением глаз, тела и памятью. Конверсацио́нный ана́лиз – это эмпирический метод научного познания, который основывается на установлении взаимосвязей между структурами разговора, социальными практиками и ожиданиями коммуникантов, на основании которых последние выбирают определенную модель поведения и интерпретируют поведение других . Некоторые модели человеческого поведения в общественных науках предполагают, что поведение людей может быть описано в предположении, что люди ведут себя как «рациональные» существа (смотри, например, теорию рационального выбора). Во многих экономических моделях полагается, что люди гиперрациональны и никогда не делают чего бы то ни было, что противоречит их интересам. Концепция ограниченной рациональности подвергает эти положения сомнению с целью учесть, что в действительности совершенно рациональные…

Подробнее: Ограниченная рациональность

Приня́тие жела́емого за действи́тельное — формирование убеждений и принятие решений в соответствии с тем, что является приятным человеку, вместо апелляции к имеющимся доказательствам, рациональности или реальности. Социо́ника — концепция типов личности и взаимоотношений между ними. Создана в 1970-х годах Аушрой Аугустинавичюте на основе типологии Юнга и теории информационного метаболизма А. Кемпинского. Из восьмитипной типологии Юнга соционика выводит существование 16 соционических типов. Эксперимента́льная психоло́гия — общее обозначение всех видов научно-психологических исследований, осуществляемых посредством различных экспериментальных методов. Кросскульту́рные иссле́дования — это научный метод из области антропологии и смежных наук (социология, психология, экономика, политология), который использует данные о различных обществах, собранные в полевых исследованиях, чтобы изучить социальное поведение и проверить гипотезы о культурных различиях. В отличие от сравнительных исследований, в которых рассматриваются схожие характеристики нескольких обществ, в кросс-культурных исследованиях используется более широкая выборка, которая позволяет провести… Алекситимия (от др.-греч. ἀ- — приставка с отрицательным значением, λέξις — слово, θυμός — чувство, буквально «без слов для чувств») — затруднения в передаче, словесном описании своего состояния. Методика исследования самоотношения (МИС) — личностный опросник, разработанный в 1989 году С. Р. Пантилеевым и В. В. Столиным. Используется в таких практических сферах психологии, как консультирование, психотерапия, а также индивидуальная и групповая коррекция, так как они имеют наиболее тесное отношение к воздействию на самооценку клиента или пациента. Обучение без учителя (самообучение, спонтанное обучение, англ. Unsupervised learning) — один из способов машинного обучения, при котором испытуемая система спонтанно обучается выполнять поставленную задачу без вмешательства со стороны экспериментатора. С точки зрения кибернетики, это является одним из видов кибернетического эксперимента. Как правило, это пригодно только для задач, в которых известны описания множества объектов (обучающей выборки), и требуется обнаружить внутренние взаимосвязи, зависимости… Фактор общего интеллекта (англ. general factor, g factor) является распространённым, но противоречивым конструктом, используемым в психологии (см. также психометрию) для выявления общего в различных тестах интеллекта. Словосочетание «теория g» имеет дело с гипотезой и полученными из неё результатами о биологической природе g, постоянством/податливостью, уместностью его применения в реальной жизни и другими исследованиями. Модулярность сознания — это идея сознания, включающая в себя, по крайней мере частично, врожденные нейронные структуры или модули, каждый из которых имеет особенные функции, установленные эволюцией. Благодаря инакомыслию авторов, существуют множество определений понятия «модуль». Систе́ма це́нностей — понятие теории ценностей, обозначающее совокупность сложившихся у людей мнений о значении в их жизни вещей и явлений, встречаемых в природе и обществе («социальных установок»). Копинг, копинговые стратегии (англ. coping, coping strategy) — это то, что делает человек, чтобы справиться (англ. to cope with) со стрессом. Понятие объединяет когнитивные, эмоциональные и поведенческие стратегии, которые используются, чтобы совладать со стрессами, и в общем случае, с психологическими трудными ситуациями обыденной жизни. Близкое понятие, широко используемое и глубоко разработанное в русской психологической школе, — переживание (преодоление неблагоприятных последствий стресса) (см… Эконометрика — наука, изучающая количественные и качественные экономические взаимосвязи с помощью математических и статистических методов и моделей. Современное определение предмета эконометрики было выработано в уставе Эконометрического общества, которое главными целями назвало использование статистики и математики для развития экономической теории. Теоретическая эконометрика рассматривает статистические свойства оценок и испытаний, в то время как прикладная эконометрика занимается применением эконометрических… Тéория двойнóй наслéдственности (англ. dual inheritance theory, также известная как теория генно-культурной коэволюции или биокультурная эволюция) — теория, разработанная в 1960—1980-х годах с целью объяснить человеческое поведение с точки зрения двух различных, но взаимодействующих процессов: генетической эволюции и культурной эволюции. В рамках теории двойной наследственности культура определяется как информация или поведение, приобретенное посредством социального научения. Одно из центральных…

Подробнее: Теория двойной наследственности

Систе́ма (др.-греч. σύστημα «целое, составленное из частей; соединение») — множество элементов, находящихся в отношениях и связях друг с другом, которое образует определённую целостность, единство. Шкала Гуттмана (названа в честь Луиса Гуттмана, eng.Guttman scale/scalp gram) — измерительная шкала, принимающая за основу одномерность и то, что, суждения в анкете иерархически связаны между собой. Психологическая типология — система индивидуальных установок и поведенческих стереотипов, образованная с целью объяснения разницы между людьми. Проблема удачного, то есть определяющего более широкий спектр производных характеристик, основания для классификации психологических типов всегда была краеугольной для дифференциальной психологии.

Подробнее: Психологические типологии

Суперве́нтность (англ. Supervenience) — отношение детерминированности состояния любой системы состоянием другой системы. Набор свойств одной системы супервентен относительно набора свойств другой системы в том случае, если существование различия между двумя фактами в свойствах первой системы невозможно без существования такого же различия между двумя фактами в свойствах второй системы. Понятие супервентности является центральным понятием современной аналитической философии и часто используется в… Моде́ль (фр. modèle от лат. modulus «мера, аналог, образец») — это система, исследование которой служит средством для получения информации о другой системе; представление некоторого реального процесса, устройства или концепции. Психологическая резилентность (от англ. resilience — упругость, эластичность) — Резильентность — это врожденное динамическое свойство личности, лежащие в основе способности преодолевать стрессы и трудные периоды конструктивным путем. Несмотря на то, что это свойство врожденное, его можно развивать. Модели́рование — исследование объектов познания на их моделях; построение и изучение моделей реально существующих объектов, процессов или явлений с целью получения объяснений этих явлений, а также для предсказания явлений, интересующих исследователя. В когнитивной науке под когнити́вными искаже́ниями понимаются систематические ошибки в мышлении или шаблонные отклонения, которые возникают на основе дисфункциональных убеждений, внедрённых в когнитивные схемы, и легко обнаруживаются при анализе автоматических мыслей. Существование большинства когнитивных искажений было описано учёными, а многие были доказаны в психологических экспериментах.

Подробнее: Список когнитивных искажений

Ключ для определения в биологии — это описанный или реализованный в CAE-системе алгоритм, служащий для помощи в идентификации биологических сущностей, таких как растения, животные, фоссилии, микроорганизмы, зёрна пыльцы. Такие ключи, кроме того, нашли широкое применение в различных областях науки и техники для идентификации разного вида сущностей, например заболеваний, почв, минералов, археологических и антропологических артефактов.

Внешняя валидность — Википедия. Что такое Внешняя валидность

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность — соответствие реального исследования изучаемой объективной реальности.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности[2].

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов[2].

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности»[2], однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

См. также

Примечания

  1. ↑ Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 89.
  2. 1 2 3 Исследование в психологии: методы и планирование / Дж. Гудвин. — 3-е изд. — СПб.: Питер, 2004. С. 185.

Внешняя валидность — Википедия

Материал из Википедии — свободной энциклопедии

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность — соответствие реального исследования изучаемой объективной реальности.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности[2].

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов[2].

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности»[2], однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

См. также

Примечания

  1. ↑ Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 89.
  2. 1 2 3 Исследование в психологии: методы и планирование / Дж. Гудвин. — 3-е изд. — СПб.: Питер, 2004. С. 185.

Внутренняя и внешняя валидность

Внешняя и внутренняя валидность.

Боровкова Виктория И-01

ВАЛИДНОСТЬ (validity)—достоверность (или степень достоверности) вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. “В.”—центральное понятие словаря экспериментатора: оно объединяет основные цели исследования с идеальными эталонами их достижения и реальными процедурами проведения экспериментах

Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует (представляет) безупречный, и чем лучше эта репрезентативность, тем выше В. эксперимента. Таким образом, повышение В., т. е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера, реальных условий и, во-вторых, от адекватности выбора средств. Так, источники нарушения В., (прежде всего, ненадежность и смешение) отдаляют реальный эксперимент от безупречного, а способы их контроля, позволяют приблизиться к нему, т. е. обеспечить высокую В. для обобщения экспериментальных результатов. В. полученных данных можно оценить статистически: например, В. теста (в корреляционном исследовании) определяется степенью корреляции результатов его .выполнения с изучаемым видом деятельности испытуемых.

В соответствии с различными типами безупречного эксперимента различают внутреннюю и внешнюю В.:

внутренняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами идеального бесконечного экспериментов. Повышение внутренней В. связано с устранением результатов действия побочных переменных и с усреднением их изменчивости и нестабильности. Внутренняя В. — первое и необходимое требование к экспериментальным выводам: эксперимент, не обладающий внутренней В., названы автором просто неудачным.

При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором[2].

Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.

Пример нарушения внутренней валидности

Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.

внешняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами эксперимента полного соответствия. Повышение внешней В. обеспечивается достижением соответствия уровней дополнительных переменных в эксперименте уровням этих переменных в изучаемой реальности. Эксперимент, не обладающий внешней В., является неверным, не соответствующим поставленной гипотезе (но, быть может, пригодным для проверки, другой гипотезы).

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на:

-другие популяции,

-другие условия,

-другое время.

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов.

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

Следует отметить, что любую переменную (фактор), отличную от независимой, также оказывающую влияние на зависимую переменную, автор называет просто “ other ” — другая. При переводе для обозначения таких переменных используются два разных термина: “побочная” — применительно к переменной, нарушающей внутреннюю В., и “дополнительная” — переменная, уровень которой входит в экспериментальную гипотезу и должен быть адекватно представлен с целью достижения внешней В. Иногда одни и те же факторы могут выступать в эксперименте и как побочные (нарушающие внутреннюю В.), и как дополнительные (влияющие на внешнюю В.). Устранение и унификация побочных факторов, повышающая внутреннюю В., может приводить к несоответствию уровней дополнительных переменных, что снижает внешнюю В. (см. Соответствие).

-операциональная В.—разновидность внешней В. для лабораторного эксперимента; соответствие (или степень соответствия) применяемых методических процедур тем теоретическим понятиям, которые входят в экспериментальную гипотезу.

Угрозы внутренней валидности

«Угрозы внутренней валидности» — выражение, относящееся к плану исслед., к-рое интерпретаторы данных используют для описания ряда вопросов, возникающих в связи с возможными неточностями при интерпретации причинно-следственных связей между изучаемыми переменными. Некоторые из этих угроз уже упоминались, в частности, при описании квазиэкспериментов. Выражение регрессия к среднему показателю используется для описания эффекта неточного измерения текущего и будущих наблюдений, и она представляет собой серьезную угрозу для внутренней валидности плана психол. исслед.

Другой угрозой является естественное развитие, поскольку испытуемые подвержены естественным процессам созревания и развития с течением времени независимо от манипуляций, которые совершает над ними исследователь. Эта последняя гипотеза, в частности, объясняет необходимость использования в исслед. контрольных групп, позволяющих осуществлять сравнения с естественно развивающимися испытуемыми.

Еще одной угрозой является отсев. Систематическое сокращение количественного состава групп вследствие выбывания, неявок, переезда людей в другой город, незаполненных критериальных опросников, и т. д. может делать менее заметной в результатах исслед. роль тех оставшихся участников, к-рые оказываются в меньшей степени подвержены эксперим. воздействию. А ведь чем более заметны улучшения по критерию, тем лучше выглядит эффективность самого изучаемого воздействия.

Угроза отбора возникает на этапе формирования исслед. состава групп участников. Систематический отбор или пассивный отбор (собственное желание) участников для изучаемого воздействия или условия может приводить к возникновению различий среди некоторых групп перед началом исслед. Эти группы будут по-прежнему отличаться от других и после реализации воздействия — даже когда они сами не подвергались воздействию. Поэтому, для достижения высокой внутренней валидности (причинно-следственных) утверждений в отношении взаимосвязей переменных, необходима формулировка и проверка альтернативной гипотезы о том, какими могли бы быть эти эффекты в отсутствие такого воздействия или условия.

Фон относится к тем изменениям контекста проводящегося исслед., которые могут смешиваться с самими изучаемыми воздействиями. Подобное смешение делает невозможным отнесение изменений в испытуемых на счет исследуемого воздействия или внешних изменений.

Инструментальная погрешность являются угрозой внутренней валидности, почти исключительно присущей психологии, поскольку она возникает в результате происходящих со временем изменений стандартов наблюдателя или условий наблюдения. Эти изменения вызывают различия в оценках. Проблема состоит в том, что подобные расхождения в стандартах измерения могут приводить к ошибочным оценкам тех изменений, которые являются следствием изучаемых воздействий.

Эффект тестирования являются примером другой, почти исключительно присущей психологии, угрозы внутренней валидности. Она связана с эффектом улучшения показателей испытуемых просто в результате предыдущего прохождения теста.

Нестабильность, как было указано выше, вытекает из попыток интерпретировать происходящие непосредственно после эксперимента воздействия или спустя к.-л. время естественные изменения испытуемых и измерений.

Существуют также четыре аффективных угрозы внутренней валидности: подражание, компенсаторное соперничество, компенсаторное уравнивание, и деморализация. Они также присущи исключительно психол. науке, поскольку возникают в результате эмоциональных изменений у испытуемых и проводящего измерения персонала как формы адаптации к тому факту, что они не попали в число «избранных» участников исследования, получающих и осуществляющих эксперимент

Внешняя валидность и метаанализ

Наконец, существует понятие внешней валидности — суммы характеристик исследований, к-рая позволяет осуществлять обобщение или распространение получаемых в исследованиях (как результат высокой внутренней валидности) причинно-следственных утверждений на сходные категории людей, воздействий и критериев за пределами данного исследования.

Метаанализ. Внешняя валидность результатов исследования, существенно усиливается, когда объединяется и обобщается целый ряд исследований одной и той же воздействующей переменной. Такая процедура называется метаанализом. В метаанализе определяются величина эффекта, оказываемого эксперимента, воздействием и основными условиями исследования на критериальные переменные. Последние выбираются в зависимости от теоретических интересов проводящего метаанализ исследователя. Т. о., если основной анализ предполагает сравнение связей всех пар переменных, то набор интересующих метааналитика связей является набором из переменных-условий и критериальных переменных, который позволяет судить о величине эффекта изучаемого воздействия на эти критериальные переменные. Величина эффекта для каждого исследования определяется простым делением разности между средними показателями по критериальной переменной в эксперименты группах и контрольной группе на меру изменчивости индивидуальных показателей в этих группах. В результате такого анализа можно продемонстрировать, что целый ряд изучавшихся переменных условий не оказывают влияния на набор критериев, что позволяет исследователям обобщать результаты своих исследований, не оглядываясь на эти, как было установлено в ходе метаанализа, посторонние условия.

Наконец, можно определить степень влияния каждой переменной-воздействия и их различных сочетаний на критерии. Это представляет особый интерес для прикладных областей, где важно знать не только о том, что одна переменная влияет на другую, но и насколько велико такое влияние.

Внешняя валидность — Википедия

Материал из Википедии — свободной энциклопедии

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность — соответствие реального исследования изучаемой объективной реальности.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности[2].

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов[2].

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности»[2], однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

См. также

Примечания

  1. ↑ Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 89.
  2. 1 2 3 Исследование в психологии: методы и планирование / Дж. Гудвин. — 3-е изд. — СПб.: Питер, 2004. С. 185.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *