Внутренняя валидность: Внутренняя валидность • Аутизм.Энциклопедия

Автор: | 11.04.2021

Содержание

Внутренняя валидность — Вики

Внутренняя валидность (англ. internal validity) — вид валидности, степень влияния независимой переменной на зависимую переменную. Внутренняя валидность тем выше, чем больше вероятность того, что изменение зависимой переменной вызвано изменением именно независимой переменной (а не чего-либо ещё)[1]. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.

Общие сведения

При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором[2].

Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.

Факторы, угрожающие внутренней валидности

[3]

См. также

Пример нарушения внутренней валидности

Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.

Примечания

  1. Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 86.
  2. ↑ Исследование в психологии: методы и планирование / Дж. Гудвин. — 3-е изд. — СПб.: Питер, 2004. С. 190.
  3. Зароченцев К. Д., Худяков А. И. Экспериментальная психология: учеб. — М.: Проспект, 2005. С. 65—68.
  4. Дружинин В. Н. Экспериментальная психология. С. 87.

См. также

Внутренняя валидность — Internal validity

Степень, в которой доказательство поддерживает утверждение о причине и следствии

Внутренняя валидность — это степень, в которой доказательство поддерживает утверждение о причине и следствии в контексте конкретного исследования. Это одно из важнейших свойств научных исследований и важная концепция при рассуждении о доказательствах в более общем плане. Внутренняя валидность определяется тем, насколько хорошо исследование может исключить альтернативные объяснения своих выводов (обычно источники систематической ошибки или « систематической ошибки »). Это контрастирует с внешней достоверностью , степенью, в которой результаты могут оправдать выводы о других контекстах (то есть степень, в которой результаты могут быть обобщены ).

Подробности

Говорят, что выводы обладают внутренней достоверностью, если причинно-следственная связь между двумя переменными правильно продемонстрирована. Обоснованный причинно-следственный вывод может быть сделан при соблюдении трех критериев:

  1. «причина» предшествует «следствию» во времени (приоритет во времени),
  2. «причина» и «следствие» имеют тенденцию происходить вместе (ковариация), и
  3. нет никаких правдоподобных альтернативных объяснений наблюдаемой ковариации (непредсказуемости).

В условиях научных экспериментов исследователи часто изменяют состояние одной переменной ( независимой переменной ), чтобы увидеть, какое влияние она оказывает на вторую переменную ( зависимую переменную ). Например, исследователь может манипулировать дозировкой определенного лекарства между разными группами людей, чтобы увидеть, как он влияет на здоровье. В этом примере исследователь хочет сделать причинно-следственный вывод, а именно, что различные дозы препарата могут быть ответственны за наблюдаемые изменения или различия. Когда исследователь может уверенно отнести наблюдаемые изменения или различия в зависимой переменной к независимой переменной (то есть, когда исследователь наблюдает связь между этими переменными и может исключить другие объяснения или

конкурирующие гипотезы ), тогда говорят, что причинный вывод быть внутренне действительным.

Однако во многих случаях размер эффектов, обнаруженных в зависимой переменной, может зависеть не только от

Скорее, ряд неконтролируемых (или неконтролируемых) переменных или обстоятельств может привести к дополнительным или альтернативным объяснениям (а) обнаруженных эффектов и / или (б) величины обнаруженных эффектов. Следовательно, внутренняя валидность больше зависит от степени, чем от «либо-либо», и именно поэтому исследовательские планы, отличные от истинных экспериментов, также могут давать результаты с высокой степенью внутренней достоверности.

Чтобы сделать выводы с высокой степенью внутренней достоверности, при разработке исследования могут быть приняты меры предосторожности. Как правило, выводы, основанные на прямом манипулировании независимой переменной, допускают большую внутреннюю валидность, чем выводы, основанные на ассоциации, наблюдаемой без манипуляций.

Если рассматривать только внутреннюю валидность, строго контролируемые истинные экспериментальные планы (т.е. со случайным отбором, случайным распределением в контрольную или экспериментальную группы, надежные инструменты, надежные процессы манипуляции и меры предосторожности от вмешивающихся факторов) могут быть «золотым стандартом» научных исследований. . Однако сами методы, используемые для повышения внутренней достоверности, могут также ограничивать обобщаемость или внешнюю достоверность результатов. Например, изучение поведения животных в зоопарке может облегчить получение достоверных причинно-следственных выводов в этом контексте, но эти выводы могут не распространяться на поведение животных в дикой природе. В общем, типичный эксперимент в лаборатории, изучающий конкретный процесс, может не учитывать многие переменные, которые обычно сильно влияют на этот процесс в природе.

Примеры угроз

Для восьми из этих угроз существует первая буква мнемонические этот бардак , который относится к первым буквам T esting (повторное тестирование), H стория, я nstrument изменения, S tatistical регрессия, M aturation, E xperimental смертности, S Выборы и S Взаимодействие с выборами.

Неоднозначный временной приоритет

Когда неизвестно, какая переменная изменилась первой, может быть сложно определить, какая переменная является причиной, а какая — следствием.

Сбивает с толку

Основная угроза достоверности причинно-следственных выводов сбивает с толку : изменения зависимой переменной скорее можно отнести к вариациям третьей переменной, которая связана с управляемой переменной. Там, где нельзя исключить ложные отношения, могут быть разработаны конкурирующие гипотезы с исходным причинным выводом.

Критерий отбора

Систематическая ошибка отбора относится к проблеме, заключающейся в том, что на этапе предварительного тестирования между группами существуют различия, которые могут взаимодействовать с независимой переменной и, таким образом, быть «ответственными» за наблюдаемый результат. Исследователи и участники привносят в эксперимент множество характеристик, одни из которых усвоены, а другие присущи. Например, пол, вес, волосы, цвет глаз и кожи, личность, умственные способности и физические способности, а также такие отношения, как мотивация или готовность участвовать.

Если на этапе выбора исследовательского исследования неравное количество испытуемых имеет похожие предметные переменные, возникает угроза внутренней валидности. Например, исследователь создал две тестовые группы: экспериментальную и контрольную. Субъекты в обеих группах не похожи по независимой переменной, но похожи по одной или нескольким связанным с субъектом переменным.

Самовыбор также отрицательно сказывается на интерпретирующей способности зависимой переменной. Это часто происходит в онлайн-опросах, когда люди определенной демографии выбирают тест с большей частотой, чем другие демографические группы.

История

События вне исследования / эксперимента или между повторными измерениями зависимой переменной могут повлиять на реакцию участников на экспериментальные процедуры. Часто это крупномасштабные события (стихийные бедствия, политические изменения и т. Д.), Которые влияют на отношение и поведение участников, так что становится невозможным определить, вызвано ли какое-либо изменение зависимых показателей независимой переменной или историческим событием. .

Созревание

Субъекты меняются в ходе эксперимента или даже между измерениями. Например, маленькие дети могут повзрослеть, и их способность к концентрации может измениться по мере взросления. И постоянные изменения, такие как физический рост, и временные, такие как усталость, дают «естественные» альтернативные объяснения; таким образом, они могут изменить то, как испытуемый будет реагировать на независимую переменную. Таким образом, по завершении исследования исследователь, возможно, не сможет определить, связана ли причина несоответствия со временем или независимой переменной.

Повторное тестирование (также называемое тестовыми эффектами)

Неоднократное измерение участников может привести к смещению. Участники могут помнить правильные ответы или могут знать, что они проходят тестирование. Неоднократное прохождение (одинаковых или похожих) тестов интеллекта обычно приводит к увеличению количества баллов, но вместо того, чтобы сделать вывод о том, что базовые навыки изменились навсегда, эта угроза внутренней валидности обеспечивает хорошую альтернативную гипотезу.

Смена инструмента (инструментальность)

Инструмент, используемый в процессе тестирования, может изменить эксперимент. Это также относится к наблюдателям, которые были более сконцентрированы, настроены или бессознательно изменили критерии, которые они использовали для вынесения суждений. Это также может быть проблемой, когда меры самоотчета предоставляются в разное время. В этом случае влияние может быть уменьшено за счет использования предварительного ретроспективного тестирования. Если происходят какие-либо изменения в инструментах, это влияет на внутреннюю достоверность основного заключения, поскольку альтернативные объяснения легко доступны.

Регресс к среднему значению

Этот тип ошибки возникает, когда испытуемые выбираются на основе экстремальных баллов (один далеко от среднего) во время теста. Например, когда для участия в курсе чтения отбираются дети с наихудшими оценками по чтению, улучшения в конце курса могут быть связаны с регрессом к среднему значению, а не с эффективностью курса. Если бы дети прошли повторное тестирование до начала курса, они, вероятно, в любом случае получили бы более высокие баллы. Точно так же экстремальные выбросы в индивидуальных оценках с большей вероятностью будут зафиксированы в одном экземпляре тестирования, но, скорее всего, они превратятся в более нормальное распределение при повторном тестировании.

Смертность / дифференциальная убыль

Эта ошибка возникает, если выводы делаются на основе только тех участников, которые участвовали от начала до конца. Однако участники могли выбыть из исследования до его завершения, и, возможно, даже из-за самого исследования, программы или эксперимента. Например, процент членов группы, бросивших курить во время послетеста, был обнаружен намного выше в группе, получившей программу обучения отказу от курения, чем в контрольной группе. Однако в экспериментальной группе программу выполнили только 60%. Если этот отсев систематически связан с какой-либо особенностью исследования, применением независимой переменной, инструментарием или если отсев приводит к значительному смещению между группами, возможен целый класс альтернативных объяснений, которые объясняют наблюдаемые различия.

Взаимодействие селекции и созревания

Это происходит, когда связанные с предметом переменные, цвет волос, цвет кожи и т. Д., И переменные, связанные со временем, возраст, физический размер и т. Д., Взаимодействуют. Если между тестами возникает расхождение между двумя группами, это расхождение может быть связано с возрастными различиями в возрастных категориях.

Диффузия

Если эффекты лечения распространяются от групп лечения к контрольным группам, может наблюдаться отсутствие различий между экспериментальной и контрольной группами. Однако это не означает, что независимая переменная не имеет никакого эффекта или что нет связи между зависимой и независимой переменной.

Компенсационное соперничество / возмущенная деморализация

Поведение в контрольных группах может измениться в результате исследования. Например, члены контрольной группы могут усердно работать, чтобы увидеть, что ожидаемое превосходство экспериментальной группы не продемонстрировано. Опять же, это не означает, что независимая переменная не оказала никакого влияния или что нет никакой связи между зависимой и независимой переменной. И наоборот, изменения в зависимой переменной могут быть затронуты только из-за деморализованной контрольной группы, менее напряженной или мотивированной, а не из-за независимой переменной.

Предвзятость экспериментатора

Предвзятость экспериментатора возникает, когда люди, проводящие эксперимент, непреднамеренно влияют на результат, неосознанно ведя себя по-разному по отношению к членам контрольной и экспериментальной групп. Можно исключить возможность предвзятости экспериментатора за счет использования двойного слепого дизайна исследования, в котором экспериментатор не осведомлен о состоянии, к которому принадлежит участник.

Смотрите также

Рекомендации

внешняя ссылка

Внутренняя валидность | Психология общества

Она высока, когда исследователи могут быть уверены в том, что следствия, которые они наблюдают в зависимой переменной, действительно определяются независимой переменной, которой они манипулировали в ходе эксперимента (и не зависят от других неконтролируемых факторов). В полевых условиях испытуемых сложно помещать в определенные условия в случайном порядке, быть уверенным в том, что они все испытывают одно и то же, и осуществлять точные оценки зависимой переменной. В частности, сложно без помех манипулировать независимой переменной и получать чистые оценки зависимой переменной. Исследователь должен обнаружить и классифицировать обстоятельства, вызывающие определенные различия между условиями. В сложном и многоуровневом полевом исследовании воздействия телевизионных сцен насилия, осуществленном Фешбахом и Сингером проводилось изучение мальчиков подросткового возраста, проживающих в семи различных школах-интернатах в Калифорнии и Нью-Йорке. С помощью школьного персонала исследователи получили возможность применить к детям, выбранным в случайном порядке, две различные «телевизионные диеты». В течение 6 недель все мальчики по меньшей мере по 6 часов в неделю смотрели специально отобранные телевизионные шоу, показываемые в то время, когда передачи смотрят максимальное количество телезрителей. При условии, предполагающем просмотр телевизионных программ с показом сцен насилия, мальчики смотрели шоу с агрессивным содержанием, включая вестерны и криминальные истории. При условии, предполагающем просмотр телевизионных программ без сцен насилия, мальчики смотрели комедии положений и другие неагрессивные программы. Оценки поведения мальчиков, даваемые персоналом, составляли оценку агрессии. Вопреки возможным ожиданиям, исследователи выявили, что агрессивность мальчиков, смотревших программы со сценами насилия, была в действительности ниже, чем у тех, кто смотрел программы, в которых насилие отсутствовало. Оказалось, что просмотр телевизионных передач со сценами насилия привел к снижению агрессивного поведения. Чем можно объяснить столь неожиданный результат? Исследователи выяснили, что большинство мальчиков Предпочитали Программы, содержащие большое количество сцен насилия. Таким образом, мальчики, которым пришлось смотреть программы, не показывающие насилия, могли испытывать более сильную фрустрацию, чем представители другой группы, и это связано с тем, что они были лишены возможности смотреть свои любимые программы. Соответственно мы не можем выяснить наверняка, определяются ли результаты содержанием шоу, которые смотрели мальчики, или различиями в степени фрустрации между мальчиками, помещенными в условия, предполагающие просмотр телевизионных программ с показом насилия, или условия, в которых

Похожие записи

  • 04.06.2014 Требование о наличии согласия осведомленного испытуемого Оно представляется вполне разумным, но иногда создает проблемы для социальных психологов. Как мы уже могли убедиться, бывает важно не рассказывать испытуемым о подлинной цели исследования […]
  • 06.06.2014 Индивидуальный подход Он объясняет насильственные преступления с точки зрения уникальных историй и личностных характеристик преступника. Например, почему из всех банковских кассиров Чикаго только один сошел с […]
  • 17.05.2014 Суждения ковариации Кроме собирания информации воедино для формирования ясных впечатлений о людях и событиях нас также беспокоит выявление того, «что связано с этим» в социальной жизни. Многие наши убеждения […]

Внутренняя валидность

Психология Внутренняя валидность

просмотров — 247

Понятие валидности

Valid – действительный, правомерный, обоснованный, имеющий силу

Валидность — ϶ᴛᴏ степень, в которой нечто соответствует стандарту

– мера соответствия того, насколько методика и результаты исследования

соответствуют поставленным задачам

– комплексная характеристика, включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ней

Валидность теста тем выше, чем лучше в нем отражаются качества, ради которых он создавался.

Идеальный эксперимент – такой эксперимент, в котором допускается изменение только независимой переменной, другие условия эксперимента остаются неизменными.

В таком эксперименте предполагается эквивалентность (равнозначность, равноценность) испытуемых, неизменность их характеристик во времени, отсутствие самого физического времени, возможность проводить эксперимент бесконечно.

Реальный эксперимент – такой эксперимент, в котором изменяются не только интересующие исследователя переменные, но и ряд других условий.

Внутренняя валидность – соответствие реального эксперимента идеальному. Планирование эксперимента так, чтобы получить то же отношение зависимой и независимой переменной, что и в идеальном эксперименте.

Внутренняя валидность – главное требование к любому эксперименту. Чем больше влияют на изменения зависимой переменной неконтролируемые экспериментатором условия, тем ниже внутренняя валидность, тем больше вероятность артефактов.

Артефакт (что-то сделанное искусственно) – результат исследования, являющийся следствием изменения зависимой переменной под влиянием побочных переменных. Это следствие ошибок или недостаточного контроля условий проведения исследования.

Одно и то же явление может быть артефактом в рамках одной экспериментальной схемы и фактом в рамках другой.

Кэмпбелл выделил факторы, угрожающие внутренней валидности:

1. Фактор фона – конкретные события, которые происходят между первым и вторым измерениями, наряду с экспериментальным воздействием.

О1 х О2

Чем больше время между О1 и О2, тем больше может быть фактор фона, тем вероятнее, что фон является правдоподобным объяснением зарегистрированного изменения.

Пример: повышает ли успеваемость большой группы слушателœей курса общей психологии использование компьютеризированных видеоматериалов по сравнению с традиционными плакатами. Фактор фона — ужесточение приема на факультет, в мире произошло повышение интереса к изучаемому предмету, владение копиями ответов на прошлогодний экзамен

2. Естественное развитие, или фактор созревания – изменения испытуемых, являющиеся следствием течения времени, не связанное с конкретными событиями. Все биологические и психологические процессы, которые независимо от внешних событий, изменяются с течением времени. Испытуемые могут просто повзрослеть, вырасти, устать, проголодаться и т.п.

3. Эффект тестирования – влияние выполнения заданий, применяемых для измерения, на результат повторного испытания.

Сам процесс измерения может изменять то, что измеряется. Зависит от нестандартности процедуры, чем более привлекающая внимание процедура, тем значительнее бывают изменения.

Пример: повысит ли новая рекламная компания информированность людей о креме для бритья, выпускаемого вашей фирмой. Эффект тестирования – после опроса у людей мог просто повыситься интерес к кремам для бритья.

4. Инструментальная погрешность – нестабильность измерительного инструмента.

5. Отбор испытуемых, селœекция – ошибки, возникающие в связи с тем, что группы не эквивалентны по составу.

6. Отсев в ходе эксперимента («смертность») – уход людей из эксперимента͵ неравномерность выбывания испытуемых из сравниваемых групп.

7. Статистическая регрессия – когда группы отбираются на основе крайних показателœей или оценок.

8. Взаимодействие фактора отбора с естественным развитием.

Пример: Стэнли Корен и его коллеги изучили архивные записи и обнаружили, что распределœение праворуких и леворуких людей в возрастных группах, начиная с 10-летнего и заканчивая 80-летними, сильно разняться. Чем моложе группа, тем больше в ней леворуких. Исследователи заключили, что леворукие имеют «пониженную жизнеспособность» и умирают в более раннем возрасте. При этом Лоренс Харрис оспорил эти выводы, доказав что различие могло быть вызвано взаимодействием отбора и фона. 80 лет назад быть левшой считалось предосудительным

Готтсданкер выделяет три фактора, угрожающих внутренней валидности:

1. Фактор времени

2. Задача

3. Экспериментатор (самый опасный фактор)


Читайте также


  • — Внутренняя валидность

    Понятие валидности Valid – действительный, правомерный, обоснованный, имеющий силу Валидность – это степень, в которой нечто соответствует стандарту – мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам –… [читать подробенее]


  • — Внутренняя валидность.

    Внутренняя валидность – один из самых важных типов валидности, который действительно касается отношений между зависимыми и независимыми переменными. Эта валидность связана с особыми процедурами, которые позволяют определить, насколько выводы, сделанные в данном… [читать подробенее]


  • Приглашаем на семинары по методам статистической обработки и планированию экспериментов в биологических и медицинских исследованиях

    Со 2 по 8 декабря в корпусе НТП «Фабрика» БФУ им. И. Канта пройдет цикл семинаров по медицинской статистике. 

    Доктор медицинских наук, доцент (асс.проф.) Балтийской международной академии (Baltic International Academy, Riga, Latvia), руководитель научного направления международного студенческого научно-практического клуба КОЛУМБ Диана Загулова представит принципы структурного моделирования, различные подходы в медико-биологических исследованиях, особенности решения социологических и медицинских задач и методы медико-биологических и социальных исследований.

    Семинары будут проходить с 11.00 до 13.00 в НТП «Фабрика» (ул. Гайдара, 6), аудитория №204 (Круглый стол).

    Для участия необходимо отправить заявку с указанием ФИО, организации и должности на E-mail: [email protected] ru

    Программа семинаров

    02.12.2019

    «Принципы структурного моделирования, как методологии проверки параллельных гипотез о наличии причинно-следственных связей»

    03.12.2019

    «Системный подход в медико-биологических исследованиях»

    04.12.2019

    «Валидность. Внешняя и внутренняя валидность. Виды нарушений валидности.

    Особенности решения социологических и медицинских задач.»

    05.12.2019

    «Формирование выборок. Ошибки. Выборочное наблюдение.

    Особенности решения социологических и медицинских задач.»

    06.12.2019

    «Измерения. Надежность и достоверность измерений. Систематические и случайные ошибки.»

    07.12.2019

    «Методы медико-биологических и социальных исследований.»

    08.12.2019

    «Особенности обработки социологических и медицинских данных.

    Проведение статистических расчетов в статистических пакетах (SPSS и Statistica), интернете и MS Excel.»

    Внутренняя валидность — Большая Энциклопедия Нефти и Газа, статья, страница 1

    Внутренняя валидность

    Cтраница 1

    Внутренняя валидность каждого тестового задания определяется его способностью обеспечить то, для чего оно предназначено, то есть способностью обеспечить измерение уровня подготовленности испытуемых. В конечном счете это зависит от согласия с моделью Раша тех ответов испытуемых, которые даны на это задание. Внутренняя валидность ответов каждого испытуемого на все задания теста также, по существу, определяется их согласием с этой моделью.  [1]

    Заинтересованные читатели могут ознакомиться с подробностями, например, с помощью работ [ 1, с. Результаты такого анализа определяют собой в ТМПТ то, что принято называть внутренней валидностью каждого тестового задания и внутренней валидностью ответов, каждого испытуемого. Внешняя валидность определяется, как обычно, по независимым критериям.  [2]

    Заинтересованные читатели могут ознакомиться с подробностями, например, с помощью работ [ 1, с. Результаты такого анализа определяют собой в ТМПТ то, что принято называть внутренней валидностью каждого тестового задания и внутренней валидностью ответов, каждого испытуемого. Внешняя валидность определяется, как обычно, по независимым критериям.  [3]

    Внутренняя валидность каждого тестового задания определяется его способностью обеспечить то, для чего оно предназначено, то есть способностью обеспечить измерение уровня подготовленности испытуемых. В конечном счете это зависит от согласия с моделью Раша тех ответов испытуемых, которые даны на это задание. Внутренняя валидность ответов каждого испытуемого на все задания теста также, по существу, определяется их согласием с этой моделью.  [4]

    Страницы:      1

    Психометрические характеристики русскоязычной версии опросника К. Томаса – Р. Килманна («Thomas-Kilmann Conflict Mode Instrument – TKI-R»)

    78
    Кардашина С. В. Шаньгина Н. В.
    Файл статьи:

    Вам может быть интересно:

    Электронные средства обучения в процессе преподавания русского языка как иностранного: метод презентации при обучении невербальной коммуникации

    Аннотация: В статье содержится история создания опросника К. Томаса – Р. Килманна (TKI-R), предназначенного для определения предпочитаемого стиля управления конфликтом и измерения выраженности пяти основных типов стиля поведения в межличностном конфликте: соперничество, сотрудничество, компромисс, избегание и приспособление. Особое внимание уделено апробации и уточнению формулировок пунктов методики. В отечественной психодиагностической практике не удалось обнаружить в доступных источниках исходного текста опросника Томаса – Килманна на русском языке и сведений о его психометрических характеристиках. В статье приведен текст опросника на русском и английском языке для оценки идентичности. Все психометрические процедуры выполнены на основе эмпирических результатов, полученных с помощью текстов, содержащихся в русскоязычных пособиях. Показана процедура адаптации русскоязычного теста, кратко изложены результаты содержательной и внутренней валидности. Оценка внутренней валидности методики выполнялась на выборке из 392 человек. В целом следует отметить, что внутренняя валидность опросника TKI-R может быть признана высокой – во-первых, шкалы хорошо характеризуются комплексом предложенных пунктов, а во-вторых, нет ни одного пункта, статистически значимо связанного с «чужой» шкалой. В работе показаны различия в структуре типов предпочитаемых и отвергаемых стилей управления конфликтом.

    Ключевые слова: Стили поведения в межличностном конфликте; надежность; содержательная валидность; внутренняя валидность; согласованность; стандартизация; апробация; основные характеристики.

    Для цитирования:

    Кардашина, С. В. Психометрические характеристики русскоязычной версии опросника К. Томаса – Р. Килманна («Thomas-Kilmann Conflict Mode Instrument – TKI-R») / С. В. Кардашина, Н. В. Шаньгина // Педагогическое образование в России. – 2016. – №11. – С. 216-228.

    Можете ли вы применить результаты исследования к своим пациентам?

    J Bras Pneumol. 2018 май-июнь; 44 (3): 183.

    Сесилия Мария Патино

    1 . Методы эпидемиологических, клинических и операционных исследований — программа MECOR, Американское торакальное общество / Asociación Latinoamericana del Tórax, Монтевидео, Уругвай.

    2 . Отделение профилактической медицины Медицинской школы Кека Университета Южной Калифорнии, Лос-Анджелес, Калифорния, США.

    Джулиана Карвалью Феррейра

    1 .Методы эпидемиологических, клинических и операционных исследований — программа MECOR, Американское торакальное общество / Asociación Latinoamericana del Tórax, Монтевидео, Уругвай.

    3 . Divisão de Pneumologia, Instituto do Coração, Hospital das Clínicas, Faculdade de Medicina, Universidade de São Paulo, Сан-Паулу (SP) Бразилия.

    1 . Методы эпидемиологических, клинических и операционных исследований — программа MECOR, Американское торакальное общество / Asociación Latinoamericana del Tórax, Монтевидео, Уругвай.

    2 . Отделение профилактической медицины Медицинской школы Кека Университета Южной Калифорнии, Лос-Анджелес, Калифорния, США.

    3 . Divisão de Pneumologia, Instituto do Coração, Hospital das Clínicas, Faculdade de Medicina, Universidade de São Paulo, Сан-Паулу (SP) Бразилия.

    Copyright © 2018 Sociedade Brasileira de Pneumologia e Tisiologia

    Это статья в открытом доступе, распространяемая в соответствии с лицензией Creative Commons Attribution License

    . Эта статья цитируется другими статьями в PMC.

    КЛИНИЧЕСКИЙ СЦЕНАРИЙ

    В многоцентровом исследовании во Франции исследователи провели рандомизированное контролируемое исследование, чтобы проверить влияние вентиляции лежа на животе или на спине на смертность среди пациентов с ранним тяжелым ОРДС. Они показали, что длительная вентиляция в положении лежа на животе снижает 28-дневную смертность [отношение рисков (HR) = 0,39; 95% ДИ: 0,25-0,63]. 1

    ДЕЙСТВИТЕЛЬНОСТЬ ИССЛЕДОВАНИЯ

    Под достоверностью исследования понимается то, насколько хорошо результаты участников исследования представляют истинные результаты среди схожих людей вне исследования.Эта концепция валидности применима ко всем типам клинических исследований, включая исследования распространенности, ассоциаций, вмешательств и диагнозов. Валидность исследования включает две области: внутреннюю и внешнюю валидность.

    Внутренняя валидность определяется как степень, в которой наблюдаемые результаты соответствуют истине в исследуемой нами популяции и, следовательно, не являются результатом методологических ошибок. В нашем примере, если авторы могут подтвердить, что исследование имеет внутреннюю валидность, они могут сделать вывод, что положение лежа снижает смертность среди пациентов с тяжелым ОРДС.Внутренней валидности исследования могут угрожать многие факторы, в том числе ошибки в измерениях или выборе участников исследования, и исследователи должны подумать об этих ошибках и избегать их.

    После того, как внутренняя валидность исследования установлена, исследователь может приступить к вынесению суждения о его внешней валидности, задав вопрос, применимы ли результаты исследования к аналогичным пациентам в другой обстановке или нет (). В этом примере мы хотели бы оценить, применимы ли результаты клинического исследования к пациентам с ОРДС в других отделениях интенсивной терапии.Если у пациентов есть ранний тяжелый ОРДС, вероятно, да, но результаты исследования могут не применяться к пациентам с легким ОРДС . Внешняя валидность относится к степени, в которой результаты исследования могут быть обобщены для пациентов в нашей повседневной практике, особенно для популяции, которую, как считается, представляет выборка.

    Внутренняя и внешняя действительность.

    Отсутствие внутренней достоверности означает, что результаты исследования отклоняются от истины, и, следовательно, мы не можем делать какие-либо выводы; следовательно, если результаты исследования недействительны внутри, внешняя валидность не имеет значения.2 Отсутствие внешней достоверности означает, что результаты исследования могут не применяться к пациентам, которые отличаются от исследуемой популяции, и, следовательно, могут привести к низкому принятию лечения, протестированного в исследовании, другими клиницистами.

    ПОВЫШЕНИЕ ДЕЙСТВИТЕЛЬНОСТИ ИССЛЕДОВАТЕЛЬСКИХ ИССЛЕДОВАНИЙ

    Для повышения внутренней достоверности исследователи должны обеспечить тщательное планирование исследования и адекватный контроль качества и стратегии реализации, включая адекватные стратегии набора, сбор данных, анализ данных и размер выборки.Внешняя валидность может быть увеличена за счет использования широких критериев включения, которые приводят к тому, что исследуемая популяция более похожа на реальных пациентов, и, в случае клинических испытаний, путем выбора вмешательств, которые можно применить. 2

    СПИСОК ЛИТЕРАТУРЫ

    1. Guérin C, Reignier J, Richard JC, Beuret P, Gacouin A, Boulain T. Позиционирование на животе при тяжелом остром респираторном дистресс-синдроме. N Engl J Med. 2013. 368 (23): 2159–2168. DOI: 10.1056 / NEJMoa1214103. [PubMed] [CrossRef] [Google Scholar] 2.Акобенг АК. Оценка достоверности клинических испытаний. J Pediatr Gastroenterol Nutr. 2008. 47 (3): 277–282. DOI: 10.1097 / MPG.0b013e31816c749f. [PubMed] [CrossRef] [Google Scholar]

    Внутренняя достоверность: определение и примеры

    Определения статистики> Внутренняя достоверность

    Что такое внутренняя действительность?

    Примечание : Если вы не знакомы с смешением, сначала прочтите эту статью:
    Confounding Variables

    Внутренняя достоверность — это способ измерить надежность исследования (т.е.е. было ли исследование проведено правильно?). Это связано с тем, сколько мешающих переменных у вас есть в вашем эксперименте. Если вы проводите эксперимент и избегаете смешанных переменных, ваша внутренняя валидность высока; чем больше у вас смешанных переменных, тем ниже ваша внутренняя достоверность. В идеальном мире ваш эксперимент имел бы высокую внутреннюю достоверность. Это позволит вам быть уверенным в том, что результаты вашего эксперимента обусловлены только одной независимой переменной.

    Случайная выборка помогает повысить достоверность.Изображение: CSUS.edu

    Например, предположим, что вы провели эксперимент, чтобы узнать, теряют ли мыши вес, когда они тренируются на колесе. Вы использовали хорошие экспериментальные методы, такие как случайные выборки, и вы использовали контрольные переменные для учета других факторов, которые могут вызвать потерю веса (изменение диеты, болезнь, возраст и т. Д.). Другими словами, вы учли смешанные переменные, которые могут повлиять на ваши данные, и ваш эксперимент имеет высокую достоверность.

    С другой стороны, если вы вообще не использовали случайную выборку или контрольные переменные, ваш риск искажения чрезвычайно высок.Следовательно, ваша внутренняя значимость будет очень низкой.

    Внешняя и внутренняя достоверность

    Внутренняя валидность — это способ оценить, насколько сильны были ваши методы исследования. Внешняя валидность помогает ответить на вопрос: можно ли применить исследование к «реальному миру»? Если ваше исследование применимо к другим ситуациям, внешняя валидность высока. Если исследование не может быть воспроизведено в других ситуациях, внешняя валидность низкая.

    Вещи, которые могут повлиять на действительность

    Иногда смешивающие переменные могут быть не так очевидны.Список обычных подозреваемых в вещах, которые могут повлиять на внутреннюю валидность, велик. Включает:

    • Регрессия к среднему . Это означает, что участники эксперимента с экстремальными оценками будут стремиться приближаться к среднему.
    • Предметы предварительного тестирования. Это может иметь неожиданные последствия, поскольку невозможно определить, как взаимодействуют предварительное и во время тестирования. Если «логическое рассуждение» является вашей зависимой переменной, участники могут получить подсказки из предварительного теста.
    • Смена инструментов во время учебы.
    • Участники выбыли из исследования. Обычно это большая угроза для экспериментальных проектов с более чем одной группой.
    • Невозможность заполнить протоколы.
    • Что-то неожиданное изменилось во время эксперимента, влияя на зависимую переменную.

    Список литературы

    Додж, Ю. (2008). Краткая энциклопедия статистики.Springer.
    Everitt, B.S .; Скрондал А. (2010), Кембриджский статистический словарь, Cambridge University Press.
    Vogt, W.P. (2005). Словарь статистики и методологии: нетехническое руководство для социальных наук. МУДРЕЦ.
    Wheelan, C. (2014). Голая статистика. W. W. Norton & Company


    ————————————————— —————————-

    Нужна помощь с домашним заданием или контрольным вопросом? С помощью Chegg Study вы можете получить пошаговые ответы на свои вопросы от эксперта в данной области.Ваши первые 30 минут с репетитором Chegg бесплатны!

    Комментарии? Нужно опубликовать исправление? Пожалуйста, оставьте комментарий на нашей странице в Facebook .

    Внутренняя валидность — обзор

    Внутренняя и внешняя валидность

    Причинная связь одной концепции с другой иногда также обсуждается с точки зрения валидности. Внутренняя валидность относится к устойчивости отношения одного понятия к другому, внутреннему по отношению к изучаемому вопросу исследования.Большая часть обсуждения в разделе «Угрозы действительности и тесты на валидность» относятся к внутренней валидности меры по сравнению с другой концепцией, с которой она теоретически коррелирует. Внешняя валидность относится к большей обобщаемости отношений между двумя исследуемыми концепциями. Применимы ли выявленные отношения вне исследовательского исследования?

    Отношение между одним показателем и другим может быть истинным, или это может быть ложное отношение, вызванное неверным измерением одного из показателей.То есть две меры могут быть связаны из-за неправильного измерения, а не потому, что эти две меры действительно коррелированы друг с другом. Точно так же две меры, которые действительно связаны, могут остаться необнаруженными, потому что неверное измерение препятствует обнаружению корреляции. К настоящему времени читатель должен осознавать, что не все меры являются полностью достоверными, и есть надежда, что ошибка, вызванная проецированием теории на реальный мир, мала и беспристрастна, так что взаимосвязи, будь то выводы о том, что две меры коррелированы или не коррелированы, правильно определены.

    Все угрозы действительности относятся к силе внутренней достоверности взаимосвязи между двумя показателями, поскольку эти две меры должны быть действительными, чтобы можно было определить истинную взаимосвязь между ними, если таковая существует. Большая часть обсуждения тестов содержания и конвергентной валидности также относится к внутренней валидности. Кроме того, исследователи должны учитывать правила вывода при определении того, являются ли отношения настоящими или ложными. Есть ли неконтролируемые факторы, влияющие на отношения? Классическим примером анализа временных рядов является коинтеграция, перемещение двух рядов вместе во времени, таких как размер населения и размер экономики, или любой другой показатель, который со временем увеличивается или уменьшается.В предыдущем примере явки избирателей смешивающее влияние роста неприемлемого населения привело к тому, что исследователи неправильно коррелировали в значительной степени неверную меру снижения явки избирателей с негативной рекламой, упадком социального капитала, ростом кабельного телевидения, финансированием избирательной кампании, смертью поколения Второй мировой войны, глобализации и упадка усилий политических партий по мобилизации избирателей.

    Внешняя валидность относится к обобщаемости отношений вне рамок исследования.Возможно, наиболее отличительной чертой социальных наук от точных наук является то, что социологи не могут позволить себе роскошь проводить контролируемые эксперименты. Нельзя вернуться в историю и изменить события, чтобы определить гипотетические противоречия, в то время как физики могут неоднократно сталкивать частицы вместе и наблюдать, как меняющиеся условия меняют результаты. Ближе всего социальные науки подходят к контролируемым экспериментам в лабораторных условиях, где наблюдают, как люди реагируют на стимулы в контролируемых ситуациях.Но применимы ли эти лабораторные эксперименты к реальным ситуациям извне?

    В классическом психологическом эксперименте испытуемому, сидящему на стуле, говорят, что кнопка перед ним соединена с электрическим датчиком, прикрепленным ко второму испытуемому. Когда кнопка нажата, подается возрастающее напряжение. Неизвестный субъекту, кнопка прикреплена только к динамику, имитируя крики боли. При определенных обстоятельствах субъекты вынуждены подавать смертельные дозы напряжения.

    Такие лабораторные эксперименты поднимают вопрос о том, будут ли в реальных ситуациях испытуемые реагировать аналогичным образом и передавать смертельный заряд другому человеку, т. Е. Является ли эксперимент внешне достоверным? Психологи, социологи, политологи, экономисты, теоретики когнитивных наук и другие, кто участвует в лабораторных экспериментах в области социальных наук, старательно приближают лабораторию к реальному миру, насколько это возможно, чтобы контролировать сбивающее с толку влияние, которое люди могут вести себя иначе, если они знают наблюдаются.Например, это может быть одностороннее окно для наблюдения за поведением ребенка. К сожалению, иногда лабораторную атмосферу невозможно удалить, например, когда испытуемые занимаются компьютерным моделированием, и испытуемые обычно до начала лабораторного эксперимента знают, что за ними наблюдают.

    Внешняя достоверность также является проблемой при прогнозировании, когда взаимосвязи, основанные на наблюдаемых взаимосвязях, могут потерпеть неудачу при прогнозировании гипотетических или ненаблюдаемых событий.Например, экономисты часто описывают фондовый рынок как случайное блуждание. Несмотря на аналитические графики, на которых показаны уровни поддержки и простые линии тренда, не существует модели, которая могла бы предсказать, что произойдет в будущем. По этой причине паевые инвестиционные фонды имеют оговорку: «прошлые результаты не являются гарантией будущих доходов». Успешный управляющий паевым инвестиционным фондом, вероятно, будет не более успешным, чем другой в следующем деловом квартале.

    Фондовый рынок, пожалуй, лучший пример системы, которая очень быстро реагирует на внешние шоки.Непредвиденные потрясения — это проклятие для прогнозирования. Пока условия остаются постоянными, моделирование будет по крайней мере в некоторой степени точным, но если мир кардинально изменится, модель может потерпеть неудачу. Точно так же прогнозы экстремальных значений, выходящие за рамки плана исследования, также могут быть ошибочными, или когда мир действует в пределах погрешности прогноза, прогнозы, такие как победитель президентских выборов 2000 года, могут быть неопределенными.

    Внутренний срок действия | Лэрдская диссертация

    Внутренний срок действия

    В качестве концепции внутренняя валидность важна, потому что мы хотим иметь возможность сказать, что выводы, сделанные в нашей диссертации , точно отражают то, что мы изучали.Например, если мы придем к выводу, что упражнения уменьшают сердечные заболевания , мы хотим быть уверены, что можем сказать это с максимальной уверенностью, будучи уверенными в том, что то, что мы изучали, а не другие факторы, объясняет наши результаты.

    Внутренняя валидность — это то, что может повлиять на диссертации, которые руководствуются планом исследования количественных , качественных или смешанных методов [см. Раздел «Планы исследования», если вы не уверены, какой исследовательский дизайн следует за вашей диссертацией].Однако, если ваша диссертация руководствовалась планом качественного исследования , идея внутренней валидности часто упоминается как надежности , и хотя она похожа на внутреннюю валидность, это не то же самое.

    В планах количественного исследования на уровень внутренней валидности будет влиять (a) тип принятого вами количественного плана исследования (т. Е. описательный , экспериментальный , квазиэкспериментальный или план исследования на основе взаимоотношений) и (б) потенциальных угроз внутренней действительности , которые могли повлиять на ваши результаты.В этой статье мы (a) объясняем, что такое внутренняя валидность, а (b) обсуждаем и приводим примеры различных угроз внутренней валидности.

    Что такое внутренняя действительность?

    Вообще говоря, существует четыре типов количественных исследовательских планов: описательных , экспериментальных , квазиэкспериментальных и основанных на отношениях исследовательских планов [см. Статьи «Дизайн исследований», чтобы узнать больше].Планы экспериментальных исследований, также известные как интервенционные исследования , обеспечивают наибольшее обоснование (т. Е. Поддержку) утверждений о знаниях (например, все овцы не черные, упражнения уменьшают сердечные заболевания и т. Д.), Поскольку они могут утверждать, что X , независимая переменная , вызывает Y , зависимую переменную . Используя слово вызывает , мы имеем в виду, что независимая переменная (X) приводит к изменению на в зависимой переменной (Y) [см. Статью Типы переменных, если вы не уверены в различиях между независимыми и зависимыми переменные].Например, если экспериментальное исследование показало, что студенты, которые приходят на семинары в дополнение к лекциям, получают более высокие оценки, чем те студенты, которые приходят только на лекции, мы можем утверждать, что посещаемость семинаров (т. Е. Независимая переменная ) увеличивается. (то есть вызывает увеличение) результатов экзамена (т.е. зависимая переменная ).

    Идея о том, что X вызывает Y , важна, потому что внутренняя валидность заключается в возможности оправдать , что X на самом деле вызвало Y.Мы выделяем слово «» на самом деле «», потому что существует множество различных причин, по которым трудно определить, является ли X причиной Y. Мы можем, , думать, что является причиной Y; другими словами, мы можем предположить , что X вызывает Y. Но мы не можем с уверенностью сказать, что это имеет место. Это отражает тот факт, что существует множество угроз внутренней действительности , которые могут подорвать наши результаты, которые обсуждаются в следующем разделе [см. Раздел: Угрозы внутренней действительности].Это также отражает тот факт, что существуют различные типов количественного плана исследования (например, описательный , экспериментальный , квазиэкспериментальный и дизайн исследования, основанный на взаимосвязях ), которые могут вселять в нас более или менее уверенность. что наши выводы имеют внутреннюю силу.

    Угрозы внутренней действительности

    диссертации могут пострадать от широкого спектра потенциальных угроз внутренней действительности , которые широко обсуждались в литературе (например,г., Кэмпбелл, 1963, 1969; Кэмпбелл и Стэнли, 1963; Кук и Кэмпбелл, 1979). В этом разделе обсуждаются 14 основных угроз внутренней достоверности, с которыми вы можете столкнуться в ходе своего исследования, с соответствующими примерами. К ним относятся исторические эффекты , созревание , эффекты тестирования , инструментарий , статистическая регрессия , отклонения отбора , экспериментальная смертность , причинный временной порядок , распространение (или имитация) обработок , компенсация , компенсационная конкуренция , деморализация , экспериментатор эффекты и субъект эффекты .В следующих разделах каждая из этих угроз внутренней действительности объясняется с соответствующими примерами.

    Исторические эффекты и внутренняя достоверность

    Эффекты истории относятся к событиям , которые происходят в среде , которые изменяют условия исследования, влияя на его результат . Такое историческое событие может произойти до начала эксперимента или между предварительным и последующим тестами. Чтобы повлиять на результат эксперимента способом, угрожающим его внутренней валидности, эффект истории должен (a) изменить баллы по независимым и зависимым переменным, а (b) изменить баллы одной группы больше, чем другой. (е.g., увеличить баллы в группе лечения по сравнению с контрольной группой или второй группой лечения). Если вы не уверены в некоторых из этих основных аспектов экспериментального дизайна, вы можете сначала прочитать статью «Экспериментальные исследовательские планы».

    Чтобы понять больше о эффектах истории , рассмотрите их следующие характеристики: время появления эффектов истории, продолжительность исследования и величину эффектов истории. Каждая из этих характеристик рассматривается по очереди:

    Учебное пособие по внутренней валидности

    Экспериментальные психологи выбирают одно или несколько условий или манипулируют ими, чтобы определить их влияние на меру поведения субъекта.Например, запах вкусного пищу можно периодически предлагать субъектам, чтобы оценить ее влияние на их реакция слюноотделения.

    Управляемое условие упоминается как независимая переменная , а поведенческое мера называется зависимой переменной . В нашем примере запах вкусной еды будет независимой переменной, а реакция слюноотделения будет зависимой Переменная.

    Эксперимент имеет внутреннюю ценность в той мере, в какой он показывает причинно-следственную связь между независимыми и зависимыми переменными. Предположим, экспериментатор наблюдает увеличение вероятность слюноотделения после запаха вкусной еды, что приводит его или ее к заключению что запах еды вызывает слюноотделение. Чтобы это заключение было внутренне достоверным, эксперимент должен быть спроектированным таким образом, чтобы условия, отличные от запаха пищи, были исключены как потенциальные причины поведения изменять.Например, если вид еды представлен вместе с ее запахом, то альтернативный вариант объяснение может заключаться в том, что вид вкусной еды, а не ее запах, является причиной повышенная вероятность слюноотделения.

    Есть девять источников угрозы внутренней действительности. Их:

    1. Выбор
    2. История
    3. Созревание
    4. Повторное испытание
    5. Приборы
    6. Регрессия к среднему
    7. Экспериментальная смертность
    8. Взаимодействие выбора и созревания
    9. Смещение экспериментатора

    Перед тем, как узнать больше о каждом из них, нажмите «Далее», чтобы прочитать следующую справочную информацию для гипотетического эксперимент.

    Действительно ли ваш проект по науке о данных делает то, что, по вашему мнению, он делает? | by Joel Nantais

    Четыре типа действительности

    Есть несколько типов действительности, все из которых важны в зависимости от контекста. Мы сосредоточимся на наиболее распространенных проблемах внутренней и внешней валидности, но было бы хорошо знать и о других типах.

    Достоверность статистического заключения относится к правильному применению математических и статистических методов, чтобы сделать выводы между наблюдениями между независимыми и зависимыми переменными.Например, применил ли исследователь подходящую формулу регрессии наименьших квадратов для выборки, а не для генеральной совокупности?

    Конструктивная валидность — это озабоченность тем, что наблюдаемые данные на самом деле являются представлением идей или переменных высокого порядка, которые пытаются измерить. Это важно в социальных науках (которые, как я считаю, составляют многие области науки о данных, которые связаны с поведением отдельных лиц и групп), потому что многие важные теоретические концепции нельзя непосредственно наблюдать или измерять.

    Например, если я хочу сравнить патриотизм людей, я могу сделать некоторые измерения, например, стоят ли они во время исполнения государственного гимна, жертвуют ли они благотворительным организациям, которые поддерживают ветеранов, устанавливают флаги на их бамперы или поддерживают действия против стран, обвиняемых в том, что они агрессивны по отношению к своей стране. Тем не менее, я должен быть уверен, что эти наблюдения не измеряют их любовь к наклейкам на бампере с флагами, или их лень или трудности, связанные с стоянием, когда звучит государственный гимн, или, возможно, они просто очень сторонники войны, независимо от провокации!

    Внешняя валидность — это степень, в которой можно сделать вывод, что случайная связь, наблюдаемая и доказанная в рамках конкретного исследования, существует в более крупной выборке, генеральной совокупности или при других обстоятельствах.Это важно в тех случаях, когда вы проводите эксперимент или пилотную версию подгруппы, и вы хотите понять, будут ли ваши результаты верными, если вы увеличите масштаб или проведете тот же пилотный проект в другой группе.

    Внутренняя достоверность — это мера того, вызвали ли изменения независимой переменной различия или изменения зависимой переменной в эксперименте или исследуемой популяции. Например, можем ли мы быть уверены, что наблюдаемые изменения или различия наблюдаемой зависимой переменной произошли из-за изменений или различий в независимых переменных.

    Внутренняя достоверность важна, поскольку она напрямую связана с причинно-следственной связью, которая, несмотря на то, что некоторые считают, все еще важна в век машинного обучения! Поскольку внутренняя валидность так важна, мы сосредоточимся на ней в оставшейся части этой статьи.

    Внутренняя валидность

    Ключевым аспектом качества является внутренняя валидность исследования. Внутренняя валидность, по сути, заключается в том, являются ли результаты исследования результатом изучаемого вмешательства, а не случайностью или каким-либо другим фактором.Вы также можете сказать, что внутренняя валидность — это то, насколько хорошо исследование было организовано и выполнено для предотвращения систематических ошибок или предвзятости.

    Давайте рассмотрим вымышленный пример, чтобы увидеть, как это разыграется. Предположим, исследователи изучали эффективность программы по эргономике, которая включала обучение персонала. Программа была ориентирована на рабочих-швей, которые часто испытывают боли в запястьях. В ходе исследования рабочие на одной фабрике выполнили тест на знание поз для предотвращения боли в запястье. Затем были введены эргономическая программа и обучение.Шесть месяцев спустя меньше рабочих сообщали о болевых симптомах, а при повторном обследовании их результаты были лучше.

    На первый взгляд программа выглядит многообещающей. Но на самом деле эти изменения могли быть вызваны чем-то другим. Исследование с сильной внутренней достоверностью будет организовано таким образом, чтобы исключить другие объяснения.

    Вопросы для рассмотрения

    Чтобы определить, имеет ли исследование сильную внутреннюю валидность, вы должны быть уверены, что исследователи учли другие причины и минимизировали систематическую ошибку.Вот некоторые из вопросов, о которых стоит спросить:

    • Использовали ли исследователи контрольную группу рабочих, которые не участвовали в программе? Контрольная группа дает исследователям возможность увидеть, привела ли программа к изменениям, поскольку они могут проверить, произошли ли какие-либо изменения в контрольной группе.
    • Что еще происходило на рабочем месте, что могло бы объяснить результаты? Например, предположим, что штатный специалист по эргономике был нанят после начала программы. Это может объяснить улучшения, и это необходимо учитывать.
    • Возможно ли, что со временем рабочие стали более осведомлены о предотвращении травм самостоятельно?
    • Повлияло ли выполнение первого теста знаний на результаты во второй раз?
    • Были ли рабочие оба раза сданы одинаково и одинаково?
    • Кто выбыл из исследования до его окончания? Возможно, некоторые рабочие уволились, потому что их болевые симптомы не улучшались. Любые улучшения в боли у рабочих, оставшихся в исследовании, не отражают всей правды.Исследователям необходимо изучить причины, по которым люди бросили учебу, чтобы понять, является ли это проблемой.
    • Как были выбраны рабочие для участия в исследовании? Исследователи должны сообщить о том, как они выбирали группы, и о различиях между группами. Если бы работники, участвовавшие в программе, вызвались добровольцами, они могли бы проявить большую мотивацию, и это повлияло бы на результаты.
    • Каков был средний уровень боли, о которой сообщалось до начала программы? Предположим, что руководство фабрики согласилось с программой, потому что в предыдущем году количество сообщений о боли и отсутствии на работе резко возросло, что намного превышает среднегодовые показатели.Однако эти ставки могут естественным образом колебаться из года в год. Таким образом, улучшение может означать, что скорость возвращается к среднему.

    На внутреннюю валидность также влияет способ естественного взаимодействия людей. Например, если работники контрольной группы узнали о программе, они могли бы попытаться сделать что-то подобное сами. Или руководство может решить, что наличие контрольной группы создает слишком много проблем среди сотрудников, и может позволить этим работникам получить доступ к программе или создать для них новую.

    Все эти сценарии показывают, насколько сложно проводить исследования на рабочих местах.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *