Причинно следственная связь примеры: 1. Понятие о причинно-следственных связях. Логика: конспект лекций

Автор: | 23.10.2018

Содержание

1. Понятие о причинно-следственных связях. Логика: конспект лекций

1. Понятие о причинно-следственных связях

Перед тем как рассматривать непосредственно методы установления причинно-следственных связей, необходимо уяснить себе понятие причины и следствия.

Причиной называют такое явление, процесс или предмет, который уже в силу своего существования вызывает определенные изменения окружающего мира. Причина характеризуется тем, что всегда предшествует результату. Она лежит как бы в основе последствия. Так, ни одно следствие невозможно представить себе без причины, ведь последняя является своего рода отправной точкой. Приведем пример: «Ударила молния — лес загорелся». Очевидно, что здесь причиной является молния, если именно она спровоцировала пожар. Без такой причины следствия быть не могло. Конечно, можно говорить о том, что пожар мог начаться в результате поджога, однако в таком случае причиной стал бы поджог.

Следствие — это то, что влечет за собой причина; оно всегда вторично и зависимо, определяемо ей.

Именно на таком соотношении причины и следствия построен профессиональный процесс многих людей. Пожарные, спасатели, сотрудники правоохранительных органов, прежде чем приступить к работе, вначале ищут причину. Например, пожарные приступают к тушению пожара, только когда более-менее ясно, от чего возник пожар и где. В противном случае риск для жизни повысился бы в несколько раз. Конечно, окончательно причина возгорания, будь то поджег, неисправность электропроводки или неосторожное обращение с огнем, становится ясна только по окончании тушения, но первоначально она должна быть определена хотя бы примерно.

Работник правоохранительных органов, выезжая на место происшествия, первым делом определяет причины этого происшествия. Если поступил сигнал об убийстве, необходимо проверить, является ли происшедшее на самом деле преступлением.

То есть определяется причина смерти. При этом отсеиваются версии о самоубийстве, несчастном случае, смерти от болезни и т. д. После этого (если установлено, что убийство имело место) определяется уже причина совершения преступления — корысть, месть и т.  д.

Спасатели, приезжая на место вызова, вначале определяют причину несчастного случая, для того чтобы разработать наиболее эффективную тактику спасения. Если речь идет о падении с высоты, автомобильной катастрофе или другом травматичном событии, появляется необходимость в особом порядке транспортировки. Так, например, шейный, грудной и поясничный отделы позвоночника должны быть зафиксированы на случай, если имеются повреждения позвоночного столба. Виды оказываемой первой помощи также зависят от того, какое именно событие привело к возникновению опасных ситуаций, получению травм. Очевидно, что спасатели определяют причины произошедших событий для наиболее эффективной организации помощи гражданам.

На первый взгляд может показаться, что определение причины не важно, не имеет большого значения, однако приведенные выше примеры говорят об обратном. Установление причины необходимо, так как в противном случае оперативный работник милиции искал бы несуществующего преступника, расследуя стечение обстоятельств, похожее на преступление (стоит ли говорить, что установление причины — большая часть оперативной работы), а пожарные и спасатели не справлялись с работой.

Таким образом, причиной называется такая объективная связь между двумя явлениями, когда одно из них вызывает другое — следствие.

Раскрытие причинной связи между явлениями представляет собой сложный многогранный процесс, включающий разнообразные логические средства и способы познания. В логике разработано несколько методов установления причинной связи между явлениями. Из этих методов чаще всего используются четыре:

метод сходства, метод различия, метод сопутствующих изменений и метод остатков. Нередко в научном исследовании применяются сочетания этих методов, но для уяснения сути вопроса следует рассмотреть их отдельно{12}.

Данный текст является ознакомительным фрагментом.

Продолжение на ЛитРес

Harvard Business Review Россия

Способность аналитически мыслить чрезвычайно полезна для современного руководителя. Она, как я объяснял раньше, начинается с умения собрать данные, составить простые схемы, сделать первые выводы и спланировать дальнейшие шаги. Но данные не так-то легко расстаются со своими тайнами. Мы достаточно быстро устанавливаем некие соотношения, но для глубокого понимания причинно-следственных связей требуется нечто большее. И особенно опасно путать причину со следствием.

Каждый менеджер должен строго различать корреляции и причинно-следственные связи, поскольку путаница возникает регулярно. Запуск новых продуктов, маркетинг, планирование, инвестиции — все это требует внимания и все это поминутно меняется. Большие данные и сложные аналитические инструменты устанавливают неожиданные соотношения между событиями, и главное здесь — это умение отличать действительно прекрасную возможность от сомнительной приманки. Ведь едва ли не главная задача менеджера — делать то, что в его власти, чтобы повлиять на конечный результат.

В качестве иллюстрации расскажу о своих попытках посидеть на диете.

Изначально судьба одарила меня отменным здоровьем. Я люблю заниматься спортом и никогда не отлыниваю. И все же с годами я стал набирать вес. Беда в том, что покушать я тоже люблю. Порой я задумывался насчет диеты, но не вникал ни в какие тонкости, за исключением общеизвестных («поменьше мяса, в нем холестерин!»), и до прошлого сентября всегда находил себе оправдание. Однако с 22 сентября я начал выполнять те предписания, о которых сам же рассказал в своем недавнем блоге. Это оказалось немного сложнее, чем я надеялся, но я совладал. Нашел в интернете программу, позволяющую учитывать съеденное. Через три месяца я смог нарисовать графики — я помещаю их здесь, потому именно такие методы исследования я успешно применяю в работе.

На первом графике я отмечал свой вес (синие точки) и ежедневное количество потребленных калорий (синяя линия). Здесь также указано «рекомендуемое количество калорий» (зеленая линия).

image

Потребление калорий с 22 сентября по 17 декабря 2013 года.

А теперь вникнем. Нетрудно заметить, что я ел чересчур много со второй недели по четвертую и прибавил в весе. Это ясно: между количеством потребляемых калорий и прибавкой веса существует причинно-следственная связь. Корреляция имеет реальное объяснение.

К сожалению, очевидный вывод — «Ешь меньше!» — меня не устраивает. Если б я мог есть меньше, я бы и не толстел. Придется разобраться с этим повнимательнее.

Еще одно возможное объяснение: в эти недели я путешествовал. Я нанес на график эту поездку и последующие. График подтвердил мою гипотезу: и без того не слишком правильное пищевое поведение в дороге усугубляется.

Заметьте: хотя корреляция между путешествием и прибавкой веса представляется интересной, график сам по себе не может служить доказательством причинно-следственной связи. Разумеется, путешествую я не оттого, что много ем, — но я пока что не мог объяснить, почему я переедаю, когда путешествую. Требовалось выявить еще какие-то скрытые факторы. Может быть, тут совпадает сразу несколько причин: незнакомая еда, слишком много ужинов с напитками плюс аэропортовский фаст-фуд — а может быть, проблема заключается в чем-то другом. Об этом было попросту рано судить. Путешествие оказалось «ближайшей» причиной ослабления контроля веса, но не «коренной» причиной, с которой следовало бы разобраться.

Мы подошли к ключевому моменту: выявить корреляцию — еще не значит установить причину, но это тот исходный пункт, отрываясь от которого можно изучать имеющиеся данные, рассматривать другие факты и т. д.

Например, прибавка веса в две ноябрьские недели поначалу озадачивала, ведь в это время я контролировал количество калорий. Тогда я добавил к графику занятия спортом. Оказалось, что как раз в эту пору занятия спортом резко сократились. Опять же все разумно: физические упражнения сжигают калории, меньше упражнений — больше вес. Ни в коем случае не нарушать график тренировок!

image

Занятие спортом с с 22 сентября по 17 декабря 2013 года.

Но осторожность и еще раз осторожность! Хотя с виду недостаток занятий спортом годится в качестве основной причины прибавки веса, зависимость может оказаться не такой простой. Скажем, дополнительные занятия могут пробудить аппетит и свести на нет эффект сожженных калорий. Например, летом по воскресеньям я люблю прокатиться на велосипеде и, если не ошибаюсь, после долгой поездки так и набрасываюсь на ужин. Но на этом этапе я не располагаю данными для дополнительной проверки, поэтому физические упражнения признаются в качестве «основной причины при прочих равных» и не более того.

Последний график отражает ежедневное потребление жира. Даже в последние недели, когда в целом удалось снизить потребление калорий и вес стабилизировался, жира в моей диете все еще было многовато. Я проконсультировался с диетологом, и она предупредила: в грамме жира содержится девять калорий, в то время как в грамме углеводов — всего четыре! Заметьте, что, хотя я не установил корреляцию между этими данными, мои подозрения насчет лишнего потребления жира убедительно подтверждаются реальными фактами.

image

Потребление жира с 22 сентября по 17 декабря 2013 года.

Следующий шаг: я проверяю девять дней максимального потребления жира, выявляю три основных вида пищи, в которых содержится жир, и сокращаю их в своем рационе.

Вот почему подобный анализ так полезен. Во-первых, необходимы данные. Интуиция подсказывает, что физические упражнения пойдут на пользу, но та же интуиция неоднократно обманывала меня, когда дело касалось диеты! Точно так же обстоят дела и в бизнесе. Клиенты, обратившиеся ко мне за консультацией, твердят: «я знаю то», «я знаю се» — и порой оказываются правы, но гораздо чаще заблуждаются.

Во-вторых, не бойтесь задавать трудные вопросы и о данных, и на другие темы. Я не психолог, но думаю, что отчасти не всегда полезная психология «знания» проистекает из страха ошибки. Я чувствовал себя полным дураком, обращаясь к диетологу, зато она помогла мне разобраться, чем вреден жир.

В-третьих, нужно отсеивать сомнительные данные. Дважды мой дневной рацион калорий оказывался чересчур низким, и я пометил эти дни красным крестиком. Так бывает всегда: какие-то данные оказываются ненадежными, и правильная обработка их особенно важна, когда нужна точная калибровка или когда высоки ставки. Однако если таких подозрительных точек на графике не много, можно спокойно проводить анализ.

В-четвертых, чтобы добраться до коренных причин, выбирайте не слишком много факторов — причем хорошо обоснованных. В моем случае удалось прояснить все потенциальные факторы, влияющие на вес: путешествие, физкультуру и количество жира в пище. Но пока мы еще не уверены, что эти причины — действительно коренные, нужно разобраться, что именно происходит, как один фактор соотносится с другим. Точно так же полагается действовать и в бизнесе.

В-пятых, корреляцию часто путают с причиной. Вот недавний пример: мой сын со своей женой отправился на семинар и услышал там такую фразу: «В семьях, где мужья помогают по дому и в воспитании ребенка, секса гораздо больше». Занятное совпадение, но как установить причинно-следственную связь? Когда мужья помогают, их усилия вознаграждаются сексом — или хорошая сексуальная жизнь побуждает помогать по дому? А может быть, тут задействованы какие-то скрытые факторы? Да и верна ли эта корреляция? Итак, не нужно в каждом совпадении видеть причинно-следственную связь — это лишь один из ключей, которые нужно соединить с другими, прежде чем прийти к окончательному выводу. Корреляция — не причинно-следственная связь. Но это — правильный отправной пункт.

На момент, когда я пишу это (прошло шесть недель после составления графика), я похудел на полтора килограмма. Здорово? Да нет, ничего особенно. В таких пределах прибавки и убавки веса случаются довольно часто. Тут опять же, как в бизнесе, важнее другой вопрос: надолго ли это? И хватит ли у меня силы воли, чтобы продержаться? Ведь эти графики — только начало. Диета, как и бизнес, штука сложная. Кто понимает, тот, конечно же, задаст вопросы вроде: «А вы едите фрукты?», «А как обстоит дело с насыщенными жирами?», «Сколько нужно пить?» и т. п. Чтобы от анализа была польза, приходится от первоначальных схем переходить к следующим.

И я надеюсь, что, как и в прошлый раз, читатели обрадовались, осознав, как использовать данные в поисках причинно-следственных связей. Анализ — это же пиршество мозга, не одним специалистам им тешиться!

Читайте по теме:

Причина и следствие | Экономика для школьников

Все примеры этой задачи построены так: описаны некоторые статистические наблюдения, из которых затем делается вывод. В решении, которое приводится ниже, для каждого из примеров приведено альтернативное объяснение имеющихся статистических наблюдений, которое противоречит сделанному выводу; существование такого объяснения доказывает, что вывод был получен некорректно. Мы не знаем, какое из альтернативных объяснений верно (возможно, и никакое), зато теперь мы знаем, что описанных наблюдений недостаточно, чтобы утверждать, что верным является именно тот вывод, который был сделан в условии.

Разделение примеров на группы достаточно условное. То общее между примерами группы, что описано ниже в пунктах б), относится не столько к логическим ошибкам, сколько к способу получения альтернативных объяснений.

I

а)
1) Возможно, число несчастных случаев никак не зависит от объёма потребления мороженого при прочих равных условиях, а положительная корреляция между этими двумя переменными объясняется тем, что обе они увеличиваются при росте числа посетителей пляжа.

Справка. Говорят, что наблюдается положительная корреляция между переменными $x$ и $y$, если в фактических наблюдениях вида $(x_{i},y_{i})$ б

ольшим значениям одной переменной соответствуют большие значения другой переменной. Иными словами, в тех случаях, когда одна переменная принимала относительно большие значения, вторая переменная тоже принимала относительно большие значения; когда первая принимала относительно маленькие, вторая тоже принимала относительно маленькие.

Отрицательная корреляция — когда большим значениям одной переменной соответствуют меньшие значения другой переменной.

Отличие причинно-следственной связи от корреляции заключается в наличии предпосылки «при прочих равных условиях». Так, фраза «переменная $x$ влияет на переменную $y$» означает, что если изменить $x$, оставив неизменным всё остальное (кроме $y$), то $y$ изменится.

2) Как нетрудно догадаться, бесплатные обеды предоставляются школьникам из семей с низкими доходами. Значит, если доход семьи по какой-то причине положительно коррелирует с оценками ребёнка, то средние оценки в группах тех, кто получает бесплатные обеды, могут быть ниже, чем в группах тех, кто не получает бесплатных обедов, даже если обеды при прочих равных условиях никак не влияют на оценки. Причиной положительной корреляции между доходом семьи и оценками ребёнка, например, могут быть способности, передающиеся по наследству: способности родителей приводят к их высоким заработкам, а полученные по наследству способности их детей приводят к их высоким оценкам.

б) Вывод о наличии причинно-следственной связи сделан лишь на основе корреляции. Это корреляция, скорее всего, объясняется изменением неучтённой переменной.

II

а)
1) Фейерверк начинается вне зависимости от того, выходят жители дома №48 на крышу или нет; напротив, это жители выходили на крышу потому, что ожидали фейерверк.

2) Страховая компания стала требовать более высокую плату потому, что получила информацию о возросшей вероятности смерти страхователя в ближайшем будущем; для того, чтобы вывод компании был верен, достаточно положительной корреляции между риском смерти и наличием телохранителя. Корреляция между риском смерти и наличием телохранителя может быть положительной, даже если зависимость риска смерти от наличия телохранителя (при прочих равных условиях) отрицательная. Страхователь нанял телохранителя потому, что существует угроза его жизни, однако он ошибочно интерпретировал вывод страховой компании так, как будто бы наоборот, наличие телохранителя повышает эту угрозу.

б) Из-за непонимания различия между корреляцией и причинно-следственной связью перепутана причина и следствие.

III

а)
1) Сравнение времени, за которое человек нашёл работу, между двумя группами — теми, кто посещал курсы, и теми, кто не посещал их, — не является корректным основанием для вывода о причинной зависимости этого времени от факта посещения курсов, т.к. отбор в эти группы происходил не случайно и поэтому факт посещения курсов может быть скоррелирован с некоторым неучтённым фактором, который влияет на время нахождения работы. Например, таким фактором может быть целеустремлённость человека, желание поскорее найти работу. Целеустремлённый человек, с одной стороны, запишется на курсы (предполагая, что курсы помогут), с другой стороны, будет активнее искать вакансии, более ответственно готовиться к собеседованиям и т.п. — по сравнению с теми, кто не записался на курсы. Он найдёт работу быстрее, чем те, кто не записался на курсы, даже если курсы на самом деле никак не помогают найти работу.

2) Среди инвесторов, присутствующих на рынке не меньше года, средняя доходность вложений клиентов компании А выше, чем средняя доходность вложений клиентов компании Б. Но срок пребывания на рынке сам зависит от доходности: клиент, который быстро разорился, уходит с рынка, не успев пробыть на нём год. То есть отбор в группы сравнения сам зависит от изучаемой переменной — доходности, что делает данное сравнение некорректным для вывода о том, где ожидаемая доходность выше. Возможно такое, что большинство клиентов компании А разоряются, но те, кто не разорился, имеют очень высокую доходность (например, компания А вкладывает деньги клиентов в очень рискованные, но потенциально очень прибыльные проекты). Потенциальный клиент компании А заранее не знает, попадёт он в число разорившихся или в число разбогатевших, и его скорее интересует средняя доходность по всем клиентам компании А, а не только по тем, кто продержался на рынке больше года. Средняя доходность по всем клиентам компании А вполне может оказаться меньше, чем средняя доходность по всем клиентам компании Б (например, компания Б вкладывает деньги клиентов в активы, приносящие стабильный, хоть и невысокий доход).

б) Отбор в группы сравнения сам зависит от переменной, влияние на которую исследуется с помощью этого сравнения.

IV

а)
1) В условии дана статистика, сравнивающая фильм с его сиквелом, а вывод из этого делается о сравнении сиквела с новым фильмом, что некорректно. Вполне возможно, что ожидаемый успех у сиквела ровно такой же, как и у нового фильма. То, что сиквелы данной кинокомпании хуже своих предшественников, может иметь следующее объяснение: сиквелы снимают только на те фильмы, которые имели большой успех, так что не удивительно, что этот успех не удаётся повторить со следующей же попытки. Кинокомпания всегда старается снять как можно более хороший фильм, но фактический успех зависит не только от стараний, но и от случайных факторов, которые она не в состоянии предугадать или проконтролировать. Вновь снятый фильм (как сиквел, так и не сиквел) скорее будет иметь «средний» успех, чем большой успех, что и объясняет описанную в условии закономерность.

2) Родители хвалят ребёнка за высокие оценки, а ругают за низкие. Оценки (особенно за контрольные) зависят от случайных факторов, которые ребёнок не может контролировать, так что при одинаковом уровне стараний ребёнок может получать разные оценки. Средний балл растёт, если вновь полученная оценка выше среднего балла, и падает, если ниже. Рассмотрим пример. Ребёнок получает только тройки, четвёрки и пятёрки. Пусть по итогам $n$ оценок средний балл равен 4,0. Если $n+1$-я оценка — 5, то средний балл станет выше 4. И если затем $n+2$-я оценка будет 4 или 3 (что, судя по среднему баллу, более вероятно, чем то, что она будет 5), то средний балл упадёт. Таким образом, стоит ожидать, что следующая оценка после получения пятёрки понизит средний балл. Аналогичным образом можно убедиться в том, что после получения тройки средний балл, скорее всего, вырастет. Эта закономерность будет иметь место, даже если похвала и порицание со стороны родителей никак не влияют на оценки.

б) Возврат к среднему значению после случайного отклонения ошибочно используется в качестве доказательства некоторой причинно-следственной связи.

характер причинно-следственных связей — Перевод на английский — примеры русский

На основании Вашего запроса эти примеры могут содержать грубую лексику.

На основании Вашего запроса эти примеры могут содержать разговорную лексику.

Кроме того, очевиден интерактивный характер причинно-следственных связей между болезнью и бедностью.

с) выявил сложный характер причинно-следственных связей между лесными экосистемами и загрязнением воздуха как одного из стрессовых факторов, влияющих на состояние лесов;

Предложить пример

Ь) Просьба разъяснить также характер причинно-следственной связи, подразумеваемой этим положением.

Будет по-прежнему поддерживаться проведение в сфере лесного хозяйства исследований междисциплинарного характера в качестве необходимого условия для дальнейшего выяснения причинно-следственных связей в отношении ущерба, наносимого лесам.

В материалах исследования рекомендуется проявлять осторожность в отношении этих результатов, поскольку вполне вероятно, что причинно-следственная связь носит обратный характер.

The study advises caution about these results because it is clearly possible that the causality runs in the opposite direction.

С учетом этих факторов Специальный докладчик отмечает наличие серьезной причинно-следственной связи между ограничительной по своему характеру иммиграционной политикой и торговлей людьми.

In the light of those factors, the Special Rapporteur notes that there is a strong causal link between restrictive immigration policies and trafficking.

Группа считает, что причинно-следственная связь по данному элементу потерь, фактически представляющему собой претензию в связи с потенциальным увеличением процентной прибыли, не носит прямого характера.

The Panel finds that the causal link in respect of this loss item, (which is essentially a claim for a potential increase in interest earnings), is not direct.

Упомянутое исследование носит системный характер, поскольку оно учитывает взаимозависимость явлений, через установление причинно-следственных связей, для того чтобы объяснить поведение с помощью новых парадигм.

The referred study is systemic because it takes into account the interdependence of phenomena, through a cause-effect relationship, in order to explain behavior through new paradigms.

Было отмечено, что Конвенция Тампере не содержит элемента причинно-следственной связи, поскольку причины бедствий иногда носят комплексный характер и трудно провести разграничение между экологическим и человеческим факторами.

It was recalled that the Tampere Convention did not include the element of causality, since the causes of disasters were sometimes complex and it was difficult to distinguish between environmental and human factors.

Взаимосвязь между нищетой и расизмом имеет сложный характер, и в простых рассуждениях относительно причинно-следственных связей не учитывается тот момент, что они дополняют и усиливают друг друга.

The relationship between poverty and racism was complex, and simple arguments about causation failed to recognize that they were mutually reinforcing.

Однако личный ущерб, о причинении которого заявляют правопреемники, должен носить прямой характер, т.е. иметь с правонарушением причинно-следственную связь.

В этом отношении важно избегать категоричности при распределении конкретных обязанностей по каждому уровню; характер обязанности определяется уровнем влияния компании и причинно-следственными связями между компанией и потенциальным нарушением прав человека.

In this regard, it is important not to be categorical in apportioning specific responsibilities within each layer; the nature of the responsibility corresponded to the level of influence of a business and the causal relationship between the business and the potential human rights abuse.

Возможные причинно-следственные связи носят комплексный характер:

Как бы то ни было, причинно-следственная связь между окружающей средой и миграцией носит сложный характер, и имеется лишь ограниченное число данных и результатов исследований относительно людей, которые перемещаются или вынужденно переселяются в результате экологических изменений.

Nevertheless, the causal relationship between environment and migration is complex, and data and studies on people who move or are displaced by environmental changes are limited.

Она заключается в углубленном анализе ожидаемых и реализованных достижений, изучении цепочки результатов, процессов, внешних факторов и причинно-следственной связи, что позволяет определить характер достижений или их отсутствие.

It focuses on expected and achieved accomplishments examining the results chain, processes, contextual factors and causality, in order to understand achievements or the lack thereof.

Учитывая обусловливающие ее причинно-следственные связи структурного характера и ее социальные предпосылки, эпидемия требует действенного и смелого отпора, в котором свою фундаментальную роль должны сыграть все действующие лица социума.

Given its structural causality and its social roots, this epidemic requires an effective and robust reply in which all the social actors have a basic role to play.

В то же время урок, который необходимо извлечь из оценки режима питания населения, заключается в том, что основополагающая причинно-следственная связь зачастую носит значительно более сложный характер, чем объяснение, основанное на таком единственном факторе, как общий недостаток продуктов питания.

The lesson to be drawn, however, in assessing the nutritional status of populations is that the underlying causality is often much more complex than a single-factor explanation such as overall lack of food.

Касаясь, в заключение, вопроса о связи между нелегальной миграцией и развитием, который широко фигурирует в глобальной повестке дня, он указывает на спорный и сложный характер причинно-следственных отношений между этими двумя феноменами.

Finally, while the issue of the link between irregular migration and development features high in the global agenda, the cause-effect relationship between these two phenomena remains controversial and complex.

Поэтому любая мера, направленная на предотвращение или разрыв этой причинно-следственной связи, которая была бы направлена на предотвращение или уменьшение вредных трансграничных последствий, носит сама по себе превентивный характер.

Therefore any measure intended to prevent or intercept that chain of cause and effect relationship which would prevent or reduce the harmful transboundary effect was per se of a preventive character.

Согласно двум последним поправкам, характер вредоносного деяния, обстоятельства, при которых был нанесен вред, и причинно-следственная связь между преступником и нанесенным ущербом становятся не относящимися к делу.

Under the last two amendments the character of the harmful act, the circumstances under which harm was suffered and the causality link between the perpetrator and the harm have become irrelevant.

Самоучитель чувашского языка/Причинно-следственные отношения в русском и чувашском языке

Причинно-следственные отношения в логике и лингвистике[править]

Причинно-следственные отношения в логике и лингвистике Как известно, причинно-следственная связь — это устанавливаемое человеческим мышлением такое соотношение двух явлений, при которой одно (причина) с необходимостью вызывает, предопределяет другое (следствие) и предшествует ему во временном плане. Сами явления действительности, между которыми мы обнаруживаем причинно-следственные отношения, логически не зависят друг от друга, они — реальность объективного мира, в то время как установление связи между ними является глубоко личностным процессом: говорящий оценивает и сопоставляет факты под определенным углом зрения.

Исследователи, изучающие различные смысловые типы речи, неоднократно подчеркивали особенности преломления общих логических закономерностей в естественном языке, прежде всего по отношению к разговорному языку и языку художественной литературы. И не столько потому, что наша речь наполнена не развернутыми умозаключениями, а энтимемами — сокращенными силлогизмами, сколько из-за субъективированности этих построений: установление причинно-следственных отношений в естественном языке зависит от того, как говорящий видит (и трактует) взаимосвязь явлений. Так, в качестве причины может быть названо не только реальное обусловливающее событие, но и косвенное свидетельство или явление-следствие: Недавно был дождь: крыши домов мокрые. На основе этого философы и логики проводят различие между реальной причиной и следствием, с одной стороны, и основанием и следствием — с другой. Первое отношение является фактуальным и эмпирическим, второе отношение — концептуальное и логическое, см. также понятие реальной и логической причины. В лингвистических классификациях концептуально устанавливаемым причинам соответствует выделение предложений с отношениями логического обоснования [Грамматика 1980: 712-713], с несобственно-причинными значениями [Русская грамматика 1980: 577] и др.

Человек может устанавливать причинно-следственные отношения не только между явлениями действительности. В качестве оснований для наблюдений, оценок, решений могут быть выдвинуты любые посылки и доводы, которые представляются говорящему достоверно аргументирующими его мысль: Ему многое прощали: сирота, без отца растет; Он мне не нравится: резкий, вспыльчивый. В лингвистике подобные смысловые отношения находят отражение в выделении разного рода предложений с мотивирующей, аргументирующей семантикой, например причинно-обобщающие бессоюзные предложения, обосновывающие с характеризующим значением [Русская грамматика 1980: 650], см. также понятия «внутренняя причинность», «причинное обоснование».

Выражение причины в русском языке[править]

Причинные придаточные содержат указания на причину или обоснование того, о чем говорится в главной части предложения. В предложении Такая густая трава росла только по берегам озера,потому что здесь достаточно было влаги придаточная указывает на причину того, о чем сообщается в главной. В предложение В нижнем этаже, под балконом, окна, вероятно, были открыты, потому что отчетливо слышались женские голоса и смех придаточная не указывает причину того, о чем сообщается в главном (окна открыты не потому, что слышались голоса, а потому, что их кто-то открыл), а объясняет, на каком основании говорящий установил, что окна открыты, то есть обосновывает то,о чем говорится в главной части предложения. Разграничение придаточных причины и основания связано с обусловленностью явлений действительности, о которых идет речь в предложениях с придаточными причины отражаются причинно следственные отношения, а в предложениях с придаточными основания отношения основания-вывода (сделанного говорящим).

Структурный аспект:

В сложном предложении причинно-следственные отношения выражаются при помощи синтаксических конструкций с союзами, причем важной оказывается позиция придаточной части в структуре предложения (постпозиция или свободная позиция). Союзы потому что, ибо имеют постпозицию. Шолохов «Тихий дон» — Тяготясь молчанием, не оправдывая чужого метания, потому что далек был от него и смотрел на жизнь с другого кургана, Иван Алексеевич на прощание сказал:

— Ты такие думки при себе держи. А то хоть и знакомец ты мне и Петро ваш кумом доводится, а найду я против тебя средства! Казаков нечего шатать, они и так шатаются. И ты поперек дороги нам не становись. Стопчем!.. Прощай!

Союзы оттого что, так как, поскольку, благодаря тому что, из-за того что, ввиду того что, вследствие того что, в силу того что, в связи с тем что, по причине того, что имеют свободную позицию.


Придаточные причины присоединяются к главной части посредством союзов и союзных сочетаний потому что, оттого что, вследствие того что, благодаря тому что, в силу того что, из-за того что, так как, поскольку, ибо, благо. Зинаида Гиппиус «чертовая кукла»- Должно быть, каждый приплелся в этот холодный сад одиноко и праздно, потому что все с удовольствием уселись за стол Юрия.

Придаточные причины обычно помещаются после главной части предложения, за исключением тех случаев, когда необходимо подчеркнуть причину или обоснование чего-либо и указать на следствие: Оттого что нельзя плакать и возмущаться в слух, Вася молчит, ломает руки и дрыгает ногами.

Придаточные, начинающиеся союзом так как, могут занимать по отношению к главной части любое положение, но если придаточная стоит на первом месте, то главная часть обычно имеет слово, скрепляющее части сложного целого, — то: Так как Каштанка взвизгнула и попала ему под ноги,то он не мог не обратить на нее внимания. (Тургенев)

Придаточные, начинающиеся союзом ибо, благо, потому что, помещается только после главной части: Верить хотелось, ибо книги уже внушали мне веру в человеку.(М.Горький)

Особенностью причинных союзов, включающих в себя что, является то,что они могут употребляться расчленено, с паузой перед что, и как цельная союзная группа. В нем цвело, бродило чувство, он любил Аксинью прежней изнуряющей любовью, он ощущал это всем телом, каждым толчком сердца и в то же время сознавал, что не явь, что мертвое зияет перед его глазами, что это сон. (Шолохов «Тихий дон»)

При расчленении союза в придаточной части предложения остается лишь союз что, а первая часть союза входит в главную часть предложения в качестве указательного слова, в других случаях – вся союзная группа помещается в придаточной части предложения. Например: Сергею было неловко о того, что говорил он с Саввой таким строгим и подчеркнуто официальным тоном. Базар кипел народом, потому что было воскресенье.Наличие соотносительных слов оттого, потому в главной части обязательно в следующих случаях:

1) когда указание на причину подчеркивается специальными словами,усилительными и ограничительными частицами – именно, собственно,только, лишь: Да и на этот раз он зашел к Похвисневу лишь потому, что случайно оказался в том районе. И, может быть, вся тайна твоей прелести состоит не в возможности все сделать, а в возможности думать, что ты все сделаешь, — состоит именно в том, что ты пускаешь по ветру силы,которые ни на что другое употребить бы не умела, — в том, что каждый инас не шутя считает себя расточителем, не шутя полагает, что он вправе сказать:»О, что бы я сделал, если б я не потерял времени даром!» (Тургенев «Первая любовь»)

2) при наличии вводных слов или словосочетаний при словах оттого, потому – вероятно, может быть, во-первых: Молодые тетеревята долго не откликались на мой свист, вероятно оттого, что я свистел недостаточно естественно. (Л. Толстой) Может быть, потому, что Штокман предложил ревкому на общем собрании распределить по беднейшим хозяйствам имущество, оставшееся от бежавших с белыми купцов. (Шолохов «Тихий дон»)

3) при указании на возможную, но на самом деле не имевшую места причину:Она вернулась не потому, чтобы угодить ему, а просто захотела побыть дома. В качестве относительных слов могут использоваться и сочетания на том основании, по той причине: Денег американец еще не прислал, на том основании, что, дескать, пока не окупилась еще плата переводчику.(М. Горький)

Стилистический аспект:

Наиболее употребительные союзы причины, функционирующие в сложном предложении, – так как и потому что – нейтральны по стилю. Примеры: Так как мы опаздывали на вокзал, пришлось взять такси. Сотрудничество развивается успешно, потому что это выгодно обеим странам. Большинство же союзов причины, используемых в составе сложного предложения, являются по своей стилистической принадлежности книжными. Совещание кончилось тем, что с общего голосу пепел раздули на ветер, а мешки спустили по веревке в яму, потому что никто из честных Козаков не захотел осквернить рук дьявольщиною. (Тургенев «Первая любовь»)Это составные союзы причины: благодаря тому что, в результате того что, в связи с тем что. Примеры: Благодаря тому, что в процессе переговоров был найден компромисс, они закончились успешно. В результате того что многие граждане не пришли на выборы, их результаты признаны недействительными. В связи с тем, что работа не была закончена в срок, комиссия не приняла строящийся объект.

Стилистически маркированными являются также союзы, поскольку и ибо, относящиеся к книжному стилю. Примеры: Поскольку принятие этого решения требует серьезного подхода, его следует согласовать со всем заинтересованными лицами. Нельзя жить лишь сегодняшним, ибо оно – незавершенное завтрашнее.

Причинные союзы очень разнообразны по своей стилистической окраске.Союзы потому что, оттого что, так как, поскольку употребительны как в книжной, так и в разговорной речи. Союзы благодаря тому что, вследствие того что, из-за того что, в силу того что, ввиду того что почти исключительно относятся к книжной речи делового характера. Союз ибо имеет книжную окраску: Мария Ивановна сильно была встревожена, но молчала, ибо в высшей степени была одарена скромностью и осторожностью.(Пушкин «Капитанская дочка»)

Семантический аспект:

Семантический аспект обусловлен теми дополнительными оттенками значения отдельных предложно-падежных конструкций – аргументов данных синтаксических отношений, которые они привносят в общее значение «причины». Семантическая характеристика аргументов причинно-следственных отношений выглядит следующим образом:

Благодаря + Д. п. – причина, благоприятствующая осуществлению действия, обеспечивающая его выполнение. Пример: Благодаря вашей помощи я достиг успеха. Благодаря дружеской помощи войск вашего императорского величества создалась тишина на юге Войска, и мною приготовлен корпус казаков для поддерживания порядка внутри страны и воспрепятствования натиску врагов извне. (Шолохов «Тихий дон»)

Из-за + Р. п. – причина, а) препятствующая осуществлению действия, вынуждающая прекратить его; б) вызывающая нежелательное действие. Пример: Из-за плохой погоды поход в горы не состоялся.

От + Р. п. – причина, вызывающая а) непроизвольное действие; б) изменение состояния лица. Пример: От сильной грозы в деревне разрушился дом. От радости ребенок запрыгал.

По + Д. п. – причина, не осознанная деятелем и обусловленная а) его свойствами; б) внешними факторами. Пример: По рассеянности она забыла нужный адрес. (Гиппиус «Странный человек»)

С + Р. п. – причина действия, являющегося реакцией на состояние лица в данный момент. Пример: (В. П. Мещерский «Мои воспоминания») В начале этого года петербургские сферы, в которых произносилось имя Витте, вдруг расширились благодаря тому, что стали ходить толки об уходе с должности министра путей сообщения Гюббенета, и в преемники его стали прочить Витте. Добавочные семантические оттенки в конструкциях с составными предлогами выглядят следующим образом:

В связи с + Тв. п. – причина, обосновывающая действие.

Ввиду + Р. п.

Пример: Пехота же не могла быть использована для подобного маневра ввиду ее слабой подвижности, неспособности к быстрому маневрированию и потому, что у казаков была преимущественно конница, которая могла в любой момент напасть на пехоту на марше и тем отвлечь ее от основной задачи. (Шолохов «Тихий дон»)

Выражение следствия в русском языке[править]

Придаточное следствия содержит указание на последствие того действия, о котором говорится в главном предложении.

Придаточные следствия отличаются от придаточных причины тем, что в сложноподчиненном предложении с придаточным причины вывод находится в главном, а причина вскрывается в придаточном, в сложноподчиненных же предложениях с придаточным следствия, наоборот, основание находится в главном предложении, а вывод, закономерно вытекающий из него или объясняющий его,- в придаточном следствия.

Соотносительных слов придаточные следствия в определяемых ими предложениях не имеют, то есть придаточные следствия не могут иметь соответствующего по функции второстепенного члена предложения, выраженного указательными местоимениями или местоименным наречием, в определяемом предложении.

Выражение причинно-следственных отношение в чувашском языке[править]

В чувашском языке придаточные предложения бывают новой и древней конструкции. В чувашском языке придаточные предложения бывают новой древней конструкции. Придаточные новой конструкции связываются с главным предложением союзом мěншěн тесен и стоят всегда после главного предложения. Придаточные предложение причины указывает причину того, о чем говорится в главном предложении и отвечает на вопрос мěншěн? Мěн пирки?

Пример: Левентийěн куштансене укςа пама, эрех ěςтерме май пулман, мěншěн тесен вăл хăй те Российăран аран – аран Ģěпěре ςитсе ÿкнě.(У Леонтия не было возможности ни дать кулаком денег, не угостить их, лидо он сам чуть чуть добрался из России до Сибири.)(Шолохов «Тихий дон») Эпě ăна хам черере усранă,меншěн тесен юратнă.

[[1.сказуемое придаточного предложения выражается причастием прошедшего времени, а иногда прилагательным, которые принимают для связи с главным предложением аффикс исходного падежа.]]

Примеры: Вăл тухса тарнăран, вěсем чăнахах айăплă тесе, Микехвěрěн тата ытларах ςилли тухса ςитет. (Из – за того, сто он убег, пологая, что они действительно виновны, Никифор еще более рассердился. ) (Б. А. Пильняк. «Простые рассказы»)

2.Сказуемое выражается причастием прошедшего времени, или прилагательным, или с существительном с послелогом пирки.

Примеры: Хěвеллě кунсем сахал пулнă пирки йывăς – курăксем хăвăртах ÿсеймерěς. (Ввиду того, что не было солнечных дней, растительность поднималось слабо.)

3.Сказуемое выражается причастием прошедшего времени, с притяжательным аффиксом 3-го лица в форме творительного падежа.

Примеры: Ģанталăк хěвеллě тăнипе тăвайккинсенче ςěршыв типсе ςитнě.(По причине ясной погоды на склонах гор земля высохла.)

Почему? Новая наука о причинно-следственной связи

Основная идея

Мы часто слышим фразу «Корреляция – это не причинно-следственная связь». Но табу, некогда наложенное статистикой на разговоры о каузальности, постепенно исчезает, и не в последнюю очередь благодаря революции причинности. В чем же состоит суть новой науки? Почему большие данные не могут ответить на все вопросы и как все же научиться искать на них ответы?

Причинный вывод

Книга рассказывает о новой науке, изменившей способ, которым мы отличаем факты от вымысла. Эта наука влияет на повседневную жизнь людей и может оказывать значительное воздействие на разные сферы, начиная от создания новых лекарств и заканчивая экономическими вопросами или глобальным потеплением. Несмотря на то, что спектр проблемных зон достаточно широк, эта наука позволяет рассматривать их унифицированно, что казалось невозможным еще 20 лет назад. Авторы называют эту науку «причинный вывод» (causal inference).

Десятки тысяч лет назад люди начали понимать, что некоторые вещи становятся причиной других событий, и если повлиять на причину, то изменится и следствие. Благодаря этому открытию возникли организованные сообщества, города, а также цивилизация, опирающаяся на науку и технологии. Произошло это благодаря вопросу: «Почему?»

Причинный вывод основывается на том же вопросе. Эта наука опирается на тезис: человеческий мозг – самый совершенный инструмент для управления причинами и следствиями. Он хранит невероятный объем каузального знания, которое, будучи подтвержденным данными, способно помочь нам найти ответы на самые сложные вопросы современности.

Более того, авторы считают, что если мы поймем логику каузального мышления, то сможем воспроизвести ее на компьютере и создать искусственного ученого. Этот робот будет открывать неизвестные доселе феномены, искать объяснения текущим научным дилеммам, разрабатывать новые эксперименты и постоянно извлекать новые каузальные знания из окружающей среды.

Однако это произойдет еще не сегодня, в то время как новая наука уже сейчас изменяет мышление ученых и влияет на наши жизни. В частности, она помогает искать ответы на такие вопросы:

— Насколько эффективно определенное средство в профилактике заболевания?

— Что стало причиной роста продаж: новый закон или наша рекламная кампания?

— Стоит ли мне менять работу?

Во всех этих пунктах есть нечто общее: причинно-следственные отношения. Наш мир полон подобных вопросов и нуждается в ответах, но до выделения причинного вывода в отдельное направление процесс поиска решений был очень сложен.

Почему авторы называют причинный вывод новой наукой, если еще Вергилий в 29 году до н.э. говорил: «Счастлив тот, кто смог понять причины вещей?». Самым серьезным препятствием они считают огромный разрыв между словарем, которым мы пользуемся, задавая каузальные вопросы, и традиционным научным словарем, с помощью которого формулируются научные теории.

Простой пример: показания барометра B = kP, где k  – коэффициент пропорциональности, а Р – атмосферное давление. Правила алгебры позволяют переписать это уравнение так: P = B/k, k = B/p, B – kP = 0. Ни одна из букв B, k или P не имеют приоритета перед другими. Тогда как мы можем быть уверены, что это давление влияет на показания барометра, а не наоборот? И как мы можем описать научным языком все те причинно-следственные связи, которые наблюдаем вокруг нас?

Статистика и причинность

Научные инструменты были изначально разработаны для удовлетворения потребностей ученых. До определенного момента этого было достаточно. Но научная любознательность двигала ученых вперед в поисках ответов на каузальные вопросы в разных сферах, например в законодательстве, бизнесе, медицине, формировании политик. И оказалось, что для этого инструментов уже недостаточно.

Такое случалось не раз в истории человечества. Например, еще 400 лет назад люди не страдали из-за того, что не умеют управлять неопределенностью. Но после изобретения новых азартных игр наука заинтересовалась направлением, которое позже получило название теории вероятности. И только когда страховым компаниям потребовались точные оценки продолжительности жизни, математики стали рассчитывать ожидаемую величину этого показателя.

Потребность в теории причинности возникла примерно в то же время, когда появилась статистика. На самом деле современная статистика родилась из каузальных вопросов о наследственности, которые ставили Карл Пирсон и Фрэнсис Гальтон, и их попыток найти ответ, исследуя данные разных поколений. К сожалению, они потерпели неудачу, но вместо того чтобы остановиться и спросить: «Почему?», они стали развивать статистику, свободную от причинности.

Этот момент стал критическим в истории науки. Появилась возможность оснастить каузальные вопросы правильным словарем, однако она была растрачена впустую. В результате создание «языка причинности» было отложено более чем на 50 лет. А вместе с тем был наложен запрет на разработку инструментов, методов и принципов, имеющих отношение к причинно-следственным связям.

С этим запретом знакомы все, кто изучал основы статистики. Каждый студент должен запомнить раз и навсегда: корреляция не означает причинности. Конечно, для этого есть разумное основание, ведь если петух кукарекает перед рассветом, это не означает, что без его кукареканья солнце не встанет.

Однако проблема в том, что, хотя статистика и говорит, что причинность не равна корреляции, она не объясняет, что же такое причинность. Часто студентам вообще запрещают говорить о том, что Х – причина У, а только о том, что Х и У связаны между собой. В итоге статистика сфокусировалась преимущественно на сборе данных, но не на их интерпретации. Считалось, что все ответы можно найти в данных, и большего искать не следует.

Отголоски такого подхода слышны до сих пор. Мы живем в эпоху, когда считается: большие данные – ключ к решению всех проблем человечества. Курсы по data science (науке о данных) пользуются огромной популярностью в университетах, а карьера аналитика данных становится все прибыльнее. И здесь кроется опасность. Авторы пишут: сами по себе данные чрезвычайно глупы. Собранная информация может поведать вам, что люди, которые принимают лекарства, выздоравливают быстрее, чем те, кто этого не делал, однако данные не расскажут, почему так произошло. А ведь причина может оказаться любой, в том числе такой, которая вообще исключит лекарство из уравнения.

Мы живем в эпоху, когда считается: большие данные – ключ к решению всех проблем человечества

С каждым днем мы все чаще сталкиваемся с примерами из науки или бизнеса, которые доказывают: одних данных недостаточно. Поэтому последние 30 лет теория причинности стала развиваться быстрыми темпами. Столетие назад вопрос о том, могут ли сигареты стать причиной проблем со здоровьем, считался бы ненаучным. 20 лет назад спросить специалиста по статистике, аспирин ли помог справиться с головной болью, означало узнать, верит ли он в вуду. Однако сегодня социальные ученые, IT-специалисты и даже некоторые экономисты регулярно задают подобные вопросы. Авторы называют такую трансформацию каузальной революцией.

Лестница причинности

Люди довольно давно поняли, что мир не состоит из сухих фактов (того, что сегодня мы называем данными). Скорее, эти факты склеиваются между собой причинно-следственными связями. . Ни одна машина не может генерировать объяснения из сырых данных. Ей необходим толчок.

Авторы выделяют три когнитивных уровня, которыми должен овладеть человек (или алгоритм) на пути к пониманию каузальности: наблюдать, делать и представлять. Каждому из них соответствует своя ступень на лестнице причинности.

  1. Ассоциация. Соответствует уровню наблюдения. Этим уровнем владеют даже животные. Он заключается в способности подмечать повторения в том, что мы видим. Например, сова наблюдает, как движется мышь, и понимает, где грызун будет в следующий момент. Точно так же поступает компьютерная программа, играющая в игру Го: она исследует базу данных, состоящую из миллионов партий, чтобы разобраться, какие шаги чаще всего приводят к победе.

Другими словами, первая ступень лестницы причинности подразумевает прогнозирование на основе предыдущих наблюдений. Ее можно описать вопросом: «Что, если я увижу что-то?» Скажем, маркетинг-директор магазина может размышлять: «Насколько вероятно, что клиент, который купил зубную пасту, также купит зубную нить?» Мы говорим, что одно событие ассоциировано с другим, если тот факт, что вы увидели первое, повышает вероятность увидеть второе.

Каузальные объяснения, а не сухие факты, составляют основной объем знаний, и именно они в будущем должны стать основой искусственного интеллекта

Вопросы вроде того, над которым размышляет маркетинг-директор, являются хлебом статистики. Чаще всего отвечают на них, собирая и анализируя данные (например, о покупательском поведении). Специалисты по статистике разработали немало инструментов, которые позволяют находить ассоциации между переменными. Пресловутая корреляция является типичным измерением ассоциации.

Некоторые ассоциации могут иметь очевидные каузальные интерпретации, другие нет. Однако статистика не дает ответа на вопрос, что является причиной, а что следствием, зубная паста или зубная нить. А с точки зрения маркетинг-директора это вообще не имеет значения. Хорошие прогнозы не обязательно подразумевают хорошие объяснения. В конце концов, сова может быть отличным охотником, не понимая, почему мышь движется в том или ином направлении.

Автор предполагает, что читатели удивятся, что системы машинного обучения находятся на том же уровне лестницы причинности, что и животные, – на самом низком. Ведь, казалось бы, они являются вершиной технического прогресса. Однако на самом деле существующий ИИ еще очень далек от человеческого мышления, и его появление – вряд ли дело ближайших лет.

Программы машинного обучения, как и 30 лет назад, оперируют практически полностью на ассоциативном уровне. Их приводит в движение поток данных, и они пытаются вычленить в них закономерность примерно так же, как статистик пытается провести прямую линию среди множества точек. Алгоритмы продолжают совершенствоваться в точности и скорости вычислений, но это не обеспечивает эволюционный скачок. И если, к примеру, программисты автономного автомобиля захотят, чтобы он реагировал по-другому в новых ситуациях, им придется самим задать такие реакции. Не стоит ожидать, что ИИ сам определит, что пешеход с бутылкой виски в руке способен швырнуть ею в машину, если та просигналит. Недостаток гибкости и адаптивности является неотъемлемым свойством систем, которые находятся на нижней ступени лестницы причинности.

  1. Вмешательство (интервенция). На этот уровень мы переходим, когда начинаем изменять мир вокруг нас. Пример типичного для этой ступени вопроса: «Что случится с продажами зубной нити, если мы удвоим цену на зубную пасту?» Чтобы найти ответ, недостаточно иметь много данных– нужен новый тип знания.

Интервенция соответствует уровню «делать» и поэтому находится выше, чем ассоциация, на лестнице причинности. Многие ученые с болью обнаруживают, что ни один из статистических методов не достаточен для ответа на простой вопрос вроде приведенного выше.

Почему нельзя поискать данные о периоде, когда зубная паста стоила вдвое дороже, и спрогнозировать результат? Потому что повышение цены в тот момент могло быть вызвано разными причинами (скажем, сокращением поставок у конкурентов), а сейчас вы планируете осознанный шаг. А значит, скорее всего, исход будет другим.

Один из способов предсказать результат интервенции – провести эксперимент в контролируемых условиях. Большие компании вроде Facebook часто так и поступают, чтобы проверить свои гипотезы. Однако интересно то, что иногда успешно предсказать эффект от вмешательства можно и без эксперимента. Например, менеджер по продажам может создать модель покупательского поведения, которая будет учитывать рыночную ситуацию. Точная каузальная модель сможет дать ответ на вопрос, что произойдет, если изменить цену.

Итак, вторая ступень лестницы причинности отвечает на вопрос «Что, если мы сделаем что-то?» или на вопрос «Как?». Скажем, если на складе осталось много зубной пасты, менеджера интересует: как можно ее продать? По какой цене ее стоит предлагать? И снова ответ на эти вопросы требует моделирования интервенции перед началом действий.

Мы постоянно производим вмешательства в повседневной жизни, например, когда принимаем таблетку от головной боли. Мы воздействуем на одну переменную (количество аспирина в нашем теле), чтобы повлиять на другую (статус головной боли). Если мы были правы в своей каузальной гипотезе об аспирине, то в результате значение второй переменной изменится с «есть головная боль» на «нет головной боли».

  1. Контрфакты. Интервенция не дает ответы на все вопросы, хоть и является важной ступенью лестницы причинности. Если головная боль прошла, нас по-прежнему может интересовать, почему это случилось. Стал ли причиной принятый аспирин? А может быть, съеденная пища или услышанные хорошие новости? Для поиска ответов на эти вопросы недостаточно данных или экспериментов – нужно, по сути, вернуться назад во времени и узнать: что было бы, если бы я не принял аспирин? Поэтому уровень контрфактов связан с воображением, способностью представить себе то, что могло пойти по-другому.

У контрфактов сложные отношения с данными, потому что данные. Они не могут рассказать, что произошло бы в воображаемом мире. Однако человеческий мозг на это способен, и это отличает его от животных и систем машинного обучения.

Если вернуться к примеру с зубной пастой, то вопрос верхнего уровня может звучать так: «Какова вероятность, что клиент, который купил зубную пасту, приобрел бы ее, если бы цена была вдвое выше?» В поисках ответа мы будем сравнивать реальный мир (где человек купил товар по текущей цене) с воображаемым (где цена в два раза больше). Наличие каузальной модели позволяет отвечать на подобные вопросы. А представить наглядно модель причинности помогает инструмент под названием «каузальная диаграмма», где в виде графа представлены переменные и причинно-следственные связи между ними (пример такой диаграммы – на рис.1).

 

 

Большие данные и каузальные модели

В науке, бизнесе, государственном управлении и даже спорте количество сырых данных в последние годы растет с ошеломляющим темпом. Особенно заметно это для активных пользователей социальных сетей. К примеру, в 2014 году Facebook хранил 300 петабайт данных (петабайт равен 1024 терабайт) 2 млрд активных пользователей, что составляет 150 Мб на человека. Научные базы данных также стремительно растут. Скажем, проект «1000 геномов» собрал 200 терабайт информации, составив самый большой в мире публичный каталог данных о генотипе.

Однако большие данные влияют не только на прогресс в передовых областях науки, но и на жизни рядовых ученых. Например, пару десятилетий назад морской биолог мог потратить месяцы, описывая различные виды. Сейчас же он имеет мгновенный доступ к онлайн-данным обо всех рыбах и других животных. И вместо выполнения рутинных задач биолог может заниматься более творческой работой.

Возникает вопрос: что же дальше? Как извлечь смысл из набора цифр, бит и пикселей? Кто-то по-прежнему считает, что ответ на все наши вопросы (например: существует ли ген, отвечающий за рак легких? в каких солнечных системах есть планеты, похожие на Землю? и т.д.) можно найти в самих данных, нужно лишь стать достаточно продвинутыми в анализе. Однако большая часть наших вопросов носит причинный характер, а значит, на них нельзя ответить только с помощью данных. Они требуют от нас сформировать модель процесса, который генерирует данные, или хотя бы отдельных его аспектов. Если вы видите исследование, которое анализирует данные без построения модели, то можете быть уверены: оно только резюмирует данные, но не интерпретирует их.

Конечно, данные сами по себе также полезны. Они могут быть необходимым первым шагом к поиску интересных шаблонов ассоциаций и формулировке вопросов. Однако не стоит останавливаться на нем, нужно идти дальше – к интерпретации данных.

Сможем ли мы создать ИИ, который поможет нам в этом, который будет способен думать? Скорее всего, да, если машины освоят все три уровня лестницы причинности. Алгоритмы, способные отвечать на каузальные и контрфактуальные вопросы, уже существуют. Если исследователи в сфере ИИ внедрят их, мы станем гораздо ближе к появлению мыслящих роботов.

Корреляция и Причинность 📊 — Чем Отличаются Эти Понятия

2. A/B/n Эксперименты

В качестве альтернативы, A/B/n -тестирование может привести вас от корреляции к причинно–следственной связи. Посмотрите на каждую из ваших переменных, измените одну и посмотрите, что произойдет. Если ваш результат постоянно меняется (с той же тенденцией), вы нашли переменную, которая имеет значение.

Эндрю Чен говорит об этом так: «после того, как вы нашли модель, которая работает в вашем случае, следующий шаг – это попробовать проверить ее. Сделайте что–то, что определяет приоритет входной переменной и увеличивает его, возможно, за счет чего–то еще».

Он продолжает: «посмотрите, будут ли эти пользователи в результате более успешным. Если вы видите большую разницу при измерении вашего успеха, то вы к чему–то пришли. Если же нет, то, возможно, это не очень хорошая модель».

Когда речь заходит о том, что присоединение к «сообществам» приводит к повышению коэффициента сохранения, необходимо исключить все другие переменные, которые могут повлиять на результат.

Например, пользователи могли опираться на другой фактор или причину, что в конечном итоге и повлияло на процент сохранения.

Чтобы проверить наличие причинно–следственной связи, необходимо найти прямую связь между пользователями, присоединяющимися к сообществам, и теми, кто будет использовать ваше приложение в долгосрочной перспективе.

Начните с притока новых пользователей. Создайте возможность выбора для следующих 1000-и пользователей, которые зарегистрируются, а затем разделите их на две группы. Половина будет вынуждена присоединиться к «сообществам», когда они впервые зарегистрируются, а другая половина может регистрироваться без присоединения к «сообществу».

Проведите эксперимент в течение 30-ти дней, а затем сравните показатели сохранения между двумя группами.

Если вы обнаружите, что группа, которая была вынуждена присоединиться к сообществам, имеет более высокий уровень сохранения, то у вас есть доказательства, необходимые для подтверждения причинно–следственной связи между присоединением к «сообществам» и сохранением клиентов. Это соотношение, вероятно, стоит анализировать и дальше, чтобы понять, почему «сообщества» могут сохранять пользователей.

Вы не будете уверены во взаимосвязи, пока не выполните эти эксперименты.

В чем разница (+ примеры!)

Перейти к тому, что вам интересно прочитать:


Супер краткое описание

Прежде чем мы начнем официально писать в блоге…

Я знаю, что некоторые из вас просто хотят получить быстрый, простой, односложный ответ. Итак, если вы здесь, чтобы получить короткий ответ о том, в чем разница между причинно-следственной связью и корреляцией, то вот она:

Корреляция — это связь между двумя переменными; когда одна переменная изменяется, другая переменная также изменяется.

Причинность — это когда существует реальное объяснение того, почему это происходит логически; это подразумевает причину и следствие.

Итак: причинно-следственная связь — это корреляция с причиной .

Если вам интересно прочитать полное объяснение, чтобы правильно понять термины, разницу между ними и узнать из реальных примеров, продолжайте прокручивать!


Прошли дни, когда данные в основном использовались исследователями или были доступны только тем, кто обладал огромным техническим мастерством.Времена, когда получение данных было трудным испытанием, которое требовало месяцев ручного отслеживания, разработки опроса или написания кода отслеживания с нуля , превышает .

Слава богу.

В наши дни, когда все, что находится под солнцем, отслеживается и каталогизируется, каждый имеет широкий доступ к данным. Однако этот обширный доступ может стать большим барьером между компаниями, которые становятся великими, и компаниями, которые этого не делают.

Люди, которые знают, как говорить на языке данных, имеют большое преимущество, потому что они могут владеть этим мощным инструментом.

Великие маркетологи больше не придумывают кампании, основанные на интуиции; вместо этого они позволяют своим данным сказать им, на какой кампании им следует сосредоточиться, а затем используют свой маркетинговый опыт для создания именно той оптимальной кампании, определенной с помощью данных.

Отличные менеджеры по продуктам предлагают тесты и изменения продукта на основе обширных исследований пользователей и данных об использовании продукта.

Каждый может использовать данные в своей роли, и получить доступ к актуальным для вас данным несложно.

Но часто самым большим препятствием является понимание: «Имея все эти данные, как я могу узнать, что действительно важно, на чем сосредоточить свои усилия и какие шаги нужно предпринять?»

В этой записи блога, состоящей из двух частей, я покажу вам, как отвечать на эти вопросы и что значит правильно использовать свои данные.

В этом посте мы рассмотрим основы, такие как понимание того, что такое корреляция и причинно-следственная связь на самом деле, и более подробно рассмотрим свойства корреляции, различные типы и роль, которую играет шум.

Во втором сообщении блога мы рассмотрим формулы, позволяющие определить силу корреляции, как они могут помочь нам определить причинно-следственную связь и как понять, насколько важна каждая переменная для конечного результата.

Что такое корреляция и причинно-следственная связь?

Ключ к правильному использованию ваших данных заключается в понимании разницы между причинно-следственной связью и корреляцией, поэтому давайте теперь рассмотрим каждый из этих терминов.

Что такое причинно-следственная связь?

Суть причинно-следственной связи заключается в понимании причины и следствия.

Это что-то вроде:

  • Дождевые облака вызывают дождь
  • Физические упражнения вызывают рост мышц
  • Переедание вызывает увеличение веса

Это предполагает, что , потому что произошло x , затем следует y ; есть причина и следствие.

Однако это не особенно практично в деловой среде.

Когда вы просматриваете данные в практической обстановке, вы в основном ищете ответы на вопросы, в зависимости от вашей роли, например следующие:

  • Какой канал привлечения клиентов является наиболее успешным и почему?
  • Какие части моего продукта нравятся моим пользователям больше всего?
  • Почему люди покупают мой продукт / платят за мои услуги?

И, наконец, то, что вы хотите сделать, — это различать факторы, которые на самом деле способствовали более успешному каналу, лучшую часть продукта или причину, по которой клиенты покупают то, что вы продаете. .

Здесь вы ищите индикаторы, которые сообщают вам, какое из ваших действий привело к желаемому результату.

Обычно это никогда не что-то одно, а скорее — комбинация многих факторов, каждый из которых в той или иной степени играет роль в конечном результате.

Итак, на практике это может стать очень трудным, потому что у вас часто происходит много вещей одновременно.

Например, если вы работаете в маркетинговой команде и видите, что ваше последнее сообщение в блоге или видео привлекают большой веб-трафик на ваш сайт, вы можете задаться вопросом, действительно ли это произошло из-за ваших усилий или из-за:

  • Новое дополнение к продукту, которое команда разработчиков выпустила на прошлой неделе, или
  • Приглашение вашего генерального директора в подкаст, или
  • Праздники не за горами, или
  • Кто-то разместил положительный отзыв о вашем продукте в популярный сайт,
  • и т. д.

Или, если быть более точным, , какая часть этого увеличения трафика произошла из-за созданного вами контента по сравнению с другими переменными факторами?

Как вы понимаете, установить причинно-следственную связь может быть довольно сложно. Поскольку на практике эти вещи могут стать очень сложными, вы часто будете сталкиваться с родственным, но более общим понятием, называемым корреляцией.

Что такое корреляция?

Корреляция описывает взаимосвязь между двумя разными переменными, которая гласит: , когда одна переменная изменяется, изменяется и другая.

Зависимые и независимые переменные

Если у вас есть пара коррелированных переменных, одна называется зависимой переменной, а другая — независимой переменной.

Значение, которое зависимая переменная принимает для , зависит от значения, которое имеет независимая переменная. Вы можете думать о независимой переменной как о той, которая задает сцену, и зависимая переменная должна реагировать соответствующим образом.

Например, если вы анализируете, сколько блюд готовят в вашем ресторане на основе количества посетителей, то количество приготовленных обедов является зависимой переменной, а количество клиентов — независимой переменной.

При большем количестве клиентов вам нужно готовить больше блюд, но если вы просто начнете готовить больше блюд, вы, вероятно, не собираетесь волшебным образом привлекать больше клиентов в свой ресторан.

Иногда эти отношения могут стать более туманными.

Например: если вы анализируете общее время просмотра ваших видео на Youtube по сравнению с количеством просмотров видео.

В данном случае зависимой переменной является время просмотра, а независимой переменной — количество просмотров, поскольку время просмотра зависит от количества просмотров и количества просмотров каждым человеком.

Хотя вы можете оценить количество просмотров на основе времени просмотра, эта взаимосвязь не имеет особого смысла, поскольку зритель сначала должен нажать на ваше видео и начать просмотр, прежде чем они смогут внести свой вклад в время просмотра.

Основные свойства корреляций

Корреляции могут быть:

  1. Положительный
  2. Отрицательный (обратно коррелированный)
  3. Не коррелированный

Их корреляцию можно классифицировать как:

  1. Слабая
  2. Сильная
  3. Совершенная

В расширенном сообщении в блоге, которое выйдет на следующей неделе, мы рассмотрим статистические тесты, которые вы можете провести для определения силы корреляции, но здесь мы сначала сосредоточимся на получении лучшее понимание того, что на самом деле означает и как выглядит корреляция.

На следующих графиках показаны типы корреляций, упомянутые выше:

В каждом столбце мы показываем сначала отсутствие корреляции, затем слабую корреляцию, сильную корреляцию и идеальную корреляцию.

Первая и вторая строки показывают положительную и отрицательную линейную корреляцию соответственно.

  • Положительная корреляция означает, что когда одна переменная растет, другая растет.
  • Отрицательная корреляция означает, что когда одна переменная растет, другая падает.

Как мы видим, отсутствие корреляции просто показывает отсутствие взаимосвязи: перемещение влево или вправо по оси x не позволяет нам предсказать какие-либо изменения по оси y.

Например, нет корреляции между весом моей кошки и ценой нового компьютера; они никак не связаны друг с другом.

(Если бы между весом моей кошки и ценой на новый компьютер существовала положительная корреляция, у всех нас были бы большие проблемы.)

Слабая корреляция означает, что мы можем видеть положительный или отрицательный тренд корреляции, глядя на данные издалека; однако эта тенденция очень слабая и может исчезнуть, когда вы сосредоточитесь на определенной области.

Например, возьмем слабую положительную и слабую отрицательную линейную корреляцию сверху и увеличим масштаб в области x от 0 до 4.

Вот что может получиться:

И внезапно , эта слабая корреляция, которую мы видели раньше, исчезла.

Это показывает нам, что, хотя слабая корреляция может сообщить нам информацию о более крупных тенденциях, эти правила могут не работать при поиске в меньшей области.

Следовательно, когда у нас слабая корреляция, мы должны быть осторожны, чтобы не пытаться использовать ее в слишком маленьком масштабе.

Сильная корреляция означает, что мы можем увеличивать масштаб намного, намного дальше, пока нам не придется беспокоиться о том, что это соотношение не соответствует действительности. Если мы возьмем нашу сильную положительную и сильную отрицательную корреляцию сверху, а также увеличим масштаб до области x от 0 до 4, мы увидим следующее:

Верхний ряд показывает нам, как выглядят сильные корреляции, когда мы увеличиваем масштаб x между областью 0–4. Как мы видим, даже здесь корреляции все еще очень очевидны, и они все еще довольно сильны (хотя и не так сильно, как раньше).

Чтобы попасть в область, где эта корреляция больше не соблюдается, нам нужно довольно сильно увеличить масштаб, что мы видим в нижней строке приведенного выше графика.

Здесь мы увеличили масштаб до области, где x находится в диапазоне от 0,5 до 1,5, что составляет 10% от нашего исходного диапазона. В этом масштабе наши корреляции больше не видны, даже в слабой форме.

И, наконец, идеальная корреляция — это корреляция без шума, и не имеет значения, насколько сильно мы увеличиваем масштаб, она всегда будет оставаться идеальной. Этот тип корреляции непрактичен, но все же важно знать, как выглядит «идеальная» корреляция.

Сила корреляции и наклон?

Еще одна вещь, которую часто неправильно понимают в отношении корреляций, заключается в том, что сила корреляции зависит от наклона .

Взгляните на следующие графики.Все они, кроме одного, демонстрируют сильную корреляцию с одинаковой силой.

Обратите внимание, как мы можем иметь сильную корреляцию независимо от того, большой (левый столбец) или маленький (средний столбец) наклон.

В крайнем правом столбце показан график без корреляции, несмотря на практически полное отсутствие шума. Это связано со способом определения корреляций: насколько изменение одной переменной влияет на другую переменную.

В этом случае значение y не зависит от значения x, следовательно, это еще один пример отсутствия корреляции (хотя более реалистичный пример отсутствия корреляции больше похож на случайный разброс точек, который мы видели в визуал в предыдущем разделе.)

Что такое шум и почему он важен для измерения корреляций

Вы могли заметить, что средний столбец приведенного выше графика больше похож на идеальную корреляцию, чем самый левый столбец. Это связано с тем, что в сила корреляции зависит от масштаба вашего шума относительно наклона.

Таким образом, чтобы средний и левый столбцы имели одинаковую силу корреляции, масштаб шума в среднем столбце должен быть меньше, чем масштаб шума в левом столбце, поскольку средний столбец имеет меньший (более мелкий) наклон. .

Причина этого в том, что мы более подробно обсудим в расширенном сообщении в блоге, которое выйдет на следующей неделе, так что пока просто знайте, что у вас могут быть очень сильные корреляции, даже если ваш наклон не очень большой.

Давайте сейчас сосредоточимся только на одном термине: шум.

Итак, что такое шум?

Шум указывает на изменение ваших данных. Он существует, потому что всегда есть много вещей, влияющих на данные, которые вы просматриваете.

Мы видели шум на графиках выше, особенно если посмотреть на различные силы корреляции.

Давайте снова возьмем это изображение:

В крайнем левом столбце мы видим много шума; данные сильно различаются, и все выглядит повсюду.

Второй столбец слева показывает общую тенденцию, как мы обсуждали выше, но все еще есть много изменений. На нашей оси Y мы можем видеть, что значения y варьируются от 0 до 4, но ширина нашей линии составляет около 2.

В третьем слева столбце («Сильная положительная / отрицательная линейная корреляция») мы видим гораздо более четкую тенденцию. Наши данные все еще немного колеблются, но не сильно. В данном случае у нас мало шума .

В крайнем правом столбце нет никаких колебаний и показывает идеальную прямую линию без шума.

Вот так «выглядит» шум. Мы также сравнили наш шум только со значениями y, но точки данных x и y будут иметь шум, который влияет на них.

Но давайте сделаем это более практичным.

Что такое шум на самом деле и откуда он?

Представим, что вы создали игру для смартфона и посмотрите, сколько времени каждый пользователь потратил на вашу игру при первой загрузке.

Лучше всего это представить в виде гистограммы, которая может выглядеть так:

Обычно после построения точек данных, которые есть у и , появляется форма распределения, и вы можете оценить форму распределения на основе имеющихся точек.

Идеальное распределение — это то, как ваше распределение выглядел бы, если бы у вас было бесконечное количество точек данных. Это распределение может принимать любую форму; это не обязательно должно быть нормальное распределение, подобное показанному выше.

Отклонение от идеального распределения, которое мы видим на гистограмме, является еще одной формой шума. Шум изменяет точки данных на основе факторов, не зависящих от эксперимента.

Этот шум исходит от таких вещей, как:

  • Пользователь запускает вашу игру, а затем забывает ее выключить, заставляя их оставаться включенными дольше
  • Другой пользователь вызван на обед своей мамой
  • Игра другого пользователя вылетела, поэтому они не могли играть в первый раз

Все это создает шум, который заставляет ваши данные отклоняться от «идеальной» формы, которую они имели бы, если бы каждого пользователя просто поместили в пустую комнату и попросили играть в вашу игру до тех пор, пока они не перестанут ощущать это.

Итак, при любом анализе данных, который вы когда-либо проводите, следует помнить о шуме, и в идеале вы должны минимизировать влияние шума на свои данные.

Контроль шума

На ваши данные всегда будет влиять шум, но , если вы хотите попытаться уменьшить количество шума в ваших данных, вы можете попытаться контролировать некоторые из источников шума.

Например, вы можете смотреть только на тех пользователей, чье приложение не закрылось из-за ошибки, так что вы можете контролировать шум, исходящий от сбоев пользовательских приложений.

Для каждой переменной шума, которую вы контролируете, размер вашей выборки будет уменьшаться, поэтому, если вы попытаетесь контролировать слишком много вещей, у вас будет слишком мало точек данных, которые не позволят вам ничего делать. тоже полезно.

Итак, что вы хотите сделать, это определить ваши самые большие источники шума , , то есть какие переменные приводят к наибольшему количеству колебаний, и попытаться контролировать эти .

Таким образом вы сохраните размер выборки как можно большим, контролируя только несколько вещей, при этом устраняя как можно больше шума.

Конечно, поиск правильного баланса между допустимым количеством шума и желаемым размером выборки всегда зависит от того, что вы делаете, поэтому, в конце концов, вам нужно решить, будет ли количество шума, которое вы видите на вашем графике приемлемо для анализа, и если размер выборки достаточно велик.

Есть несколько математических методов, которые вы можете использовать, чтобы помочь с этим, о которых мы поговорим в расширенном сообщении в блоге на следующей неделе, если вам интересно.

Типы корреляции

Выше мы видели примеры положительных и отрицательных линейных комбинаций при разной силе корреляции, но корреляции не обязательно должны быть линейными.

Они также могут иметь множество различных форм, таких как линейные, квадратичные, экспоненциальные, логарифмические и в основном любые другие функции, о которых вы только можете подумать.

На следующих графиках показано несколько примеров коррелированных переменных:

Мы можем видеть на крайнем левом графике, что, когда значение «x» увеличивается, значение «y» увеличивается на пропорциональную величину, и эта величина всегда одинакова.

Взаимосвязь между осью x и осью y можно описать уравнением «y = mx + b», которое делает этот тип корреляции линейным (это также легко увидеть по прямой линии на графике).

На среднем графике мы видим, что в зависимости от того, где мы находимся на графике, значение ‘y’ уменьшается (при x <~ 3), на самом деле не меняется (примерно при x = 3) или увеличивается с х (при х> ~ 3).

Здесь очень важно отметить, что, хотя корреляции не обязательно должны быть линейными, стандартно искать только линейные корреляции, потому что их проще всего искать и легче всего проверять с помощью формул.

Давайте рассмотрим несколько примеров корреляций, например:

  • Чем жарче погода, тем больше мороженого вы продаете
  • Чем больше голосов получает ваш контент на Reddit, тем больше посетителей страницы вы получаете из этого сообщения
  • Чем больше у вас подписчиков в Instagram, тем больше продаж вы делаете в своем бизнесе

Чтобы лучше понять эти примеры, я визуализировал, как могут выглядеть графики для каждого из приведенных выше примеров.

Вот график зависимости количества покупателей мороженого от температуры:

Вот посетители страницы, против которых проголосовали за Reddit:

И вот график ежемесячных продаж бизнеса относительно подписчиков в Instagram:

Обратите внимание, что ни один из них не имеет реальной линейной формы.

И на самом деле — наши продажи мороженого, кажется, достигают максимума примерно на 200, количество посещений страниц из голосов Reddit, кажется, растет намного быстрее после того, как мы даем 20-30 голосов, а продажи продуктов, похоже, растут медленнее, когда мы попадаем в тысячи Instagram. последователи.

Итак, чтобы быть более точным, мы могли бы сказать, что первый график выглядит как «S» (он же сигмовидная форма), второй график выглядит слегка экспоненциальным или как степенное соотношение, а третий график выглядит немного логарифмическим, потому что он выравнивается.

Тем не менее, я по-прежнему рекомендую, чтобы, если он выглядит более или менее линейным, рассматривал его части как линейные для вашего анализа.

Моя точка зрения: эти корреляции выглядят достаточно близкими к линейным, чтобы мы могли считать их части линейными, а не рассматривать их как более сложные формы, которые может быть труднее оценить и которые не приведут к значительному улучшению ваших результатов.

Конечно, когда связь слишком далека от линейной, вы не можете считать ее просто линейной.

Итак, из приведенных выше графиков мы можем прийти к следующим выводам, рассматривая их части как линейные корреляции как часть более сложных форм:

  • На графике мороженого есть определенный температурный диапазон, в котором потребительский спрос быстро растет (в центре), а во внешних регионах спрос практически не меняется. Нашему магазину мороженого не нужно планировать до последнего рожка мороженого, проданного в данный день, но было бы очень полезно знать, сколько ведер мороженого нужно приготовить в целом, исходя из завтрашнего прогноза погоды.
  • С помощью Reddit мы можем подготовить наши серверы к увеличению трафика на случай, если наша публикация начнет тренд, чтобы убедиться, что у наших пользователей не слишком долгое время загрузки на наш сайт. С помощью графика мы можем сделать обоснованные оценки ожидаемого трафика и минимизировать риск недо- или перекупленности.
  • Или с нашими подписчиками в Instagram , мы знаем, какую прибыль ожидать при определенном количестве подписчиков. Но с уменьшающейся отдачей, которую мы видим на графике выше, мы можем захотеть подумать о стратегиях, как сделать наших нынешних последователей более лояльными или заинтересованными, а не просто пытаться постоянно получать новых подписчиков.

В чем разница между причинно-следственной связью и корреляцией?

Итак, вопрос на миллион долларов: в чем разница между причинно-следственной связью и корреляцией?

Ну, короче:

Корреляция — это мера для , как зависимая переменная реагирует на изменение независимой переменной .

Корреляция — это, в конце концов, просто число, полученное из формулы.

Причинная связь — это особый тип связи между коррелированными переменными, в котором конкретно говорится, что изменение одной переменной вызывает соответствующую реакцию другой.

Причинно-следственная связь добавляет корреляции контекст и смысл реального мира.

Все причинные связи являются корреляциями, но не все корреляции являются причинными связями.

У вас могут возникнуть корреляции между переменными чисто случайно, поэтому, размышляя о причинно-следственной связи, мы должны спросить себя:

  • Имеет ли смысл эта корреляция? Существует ли фактическая связь между этими переменными?
  • Сохранится ли / будет ли корреляция, если я посмотрю на некоторые новые данные, которые я не использовал в своем текущем анализе?
  • Связь между этими переменными прямая, или они обе являются результатом какой-то другой переменной?

Примеры корреляции и причинно-следственной связи

Вот несколько быстрых примеров корреляции vs.причинно-следственная связь ниже.

Примеры корреляции, НЕ причинно-следственной связи:

  • « В те дни, когда я бегаю, я замечаю на дороге больше машин. «
    • Я лично НЕ ПРИЗЫВАЮ больше машин выезжать на улицу, когда я бегу. Просто потому, что я выбегаю на улицу, я вижу больше машин, чем когда остаюсь дома. Эта связь не является причинно-следственной , потому что ни машины, ни я не влияем друг на друга.

Хорошо, а как насчет примера, который на первый взгляд может показаться более связанным с :

  • В дни, когда я пью кофе, я чувствую себя более продуктивным. «
    • Я, конечно, могу чувствовать себя более продуктивно благодаря кофеину. Но это также может быть связано с тем, что я хожу в кафе, чтобы выпить кофе, и я более продуктивен в кафе, чем дома, когда есть миллион отвлекающих факторов. Эта причинно-следственная связь ЕСТЬ НЕ подтверждена.

Примеры причинной связи:

  • После тренировки я чувствую себя физически истощенным.
    • Это причинно-следственный номер , потому что я целенаправленно доводю свое тело до физического истощения при выполнении упражнений. Мышцы, которые я использовал для упражнений, истощены (эффект) после того, как я упражняюсь (причина). Эта причинно-следственная связь IS подтверждена.
  • Когда я кормлю кошку более чем двумя лакомствами в день, она становится немного более пухлой.
    • Моя кошка толстеет , потому что я кормлю ее больше. Это причина и следствие. Причина в том, что я кормлю кошку лакомствами, а в результате она становится немного круглее.

Отличить причинно-следственную связь от корреляции может быть сложно, когда вещи имеют положительную или отрицательную корреляцию без какой-либо причины или из-за, казалось бы, случайных, несвязанных причин.

Давайте представим, что каждый раз, когда я пью кофе, цена на кукурузу в Испании растет.

Это была бы положительная корреляция: когда я увеличиваю потребление кофе, цена на кукурузу возрастает.

Но разве это волшебным образом делает связь причинно-следственной? Нет.

То, что я пью больше кофе, НЕ означает, что я вызываю рост цен на кукурузу в Испании.

Между мной и ценами на кукурузу нет причинно-следственной связи.

Хотя … если по какой-то странной, сложной логистической причине глобальной цепочки поставок, связанной с моим спросом на кофе, увеличивающим производство кофе в Испании, что затем каким-то образом увеличивает стоимость на соседних кукурузных полях, тем самым фактически повышая цены на кукурузу, и, НА ФАКТЕ, была причинно-следственная связь … Тогда это была бы другая история.

Но, к счастью, в этом сценарии , вероятно, нет причинного эффекта, просто корреляция.

Эти примеры немного более анекдотичны с целью установить разницу между ними, но давайте рассмотрим более практический сценарий, в котором граница между причинно-следственной связью и корреляцией может быть размыта.

Например, давайте рассмотрим две переменные: 1) количество лайков на видео на Youtube и 2) общее время просмотра видео.

Мы можем видеть, что по мере увеличения количества лайков на видео увеличивается и общее время просмотра видео. Точно так же с увеличением общего времени просмотра увеличивается и количество лайков.

Следующее изображение представляет собой построенный мною график зависимости между временем просмотра и количеством лайков для выбранной группы видео на Youtube, чтобы помочь нам визуализировать эту связь:

Здесь мы видим слабую положительную корреляцию, которая не является полностью линейной, но которую мы для простоты будем приближать к линейной.

Но что это значит? И в каком направлении идет эта корреляция? Какая из них является зависимой, а какая независимой?

Ну, эти переменные могут быть слабо связаны друг с другом:

  • Чем больше лайков, тем больше людей смотрели видео дольше, потому что оно им понравилось, или
  • , что больше людей понравилось видео, потому что они смотрели его дольше и им понравилось.

Объяснения в обоих направлениях имеют смысл, но можно с уверенностью сказать, ни одно из них на самом деле не вызывает друг друга.

Лучшая причинная переменная, которая также коррелирует с обеими этими переменными, — это переменная «количество просмотров» видео на Youtube. Зрители несут ответственность за то, чтобы лайкать и смотреть видео, и, следовательно, они увеличивают эти цифры.

В этом случае на самом деле может происходить то, что переменная «количество просмотров» ВЫЗЫВАЕТ более высокое время просмотра и увеличение количества лайков для видео. И переменные «время просмотра» и «лайки» корреляции друг с другом только из-за их случайной связи с переменной «количество просмотров», но сами переменные «время просмотра» и «лайки» не связаны причинно. друг друга.

Итак, как вы понимаете, существует многих случаев , когда мы можем получить корреляции между переменными, которые возникают непосредственно из-за причинной связи между ними.

Важно отметить, что если у вас есть причинная переменная, которая коррелирует с несколькими другими переменными, то эти другие переменные также могут быть коррелированы друг с другом просто из-за их зависимости от той же причинной переменной.

Это то, что мы видели в примере выше.

Короче говоря, корреляция — это очень важная взаимосвязь между переменными, которая может указывать на причинно-следственные связи, но сами корреляции иногда могут вводить в заблуждение или неинформативно.

Если мы не оценили эту взаимосвязь и не нашли фактическое значение, которое связывает две переменные, нам не следует начинать принимать решения на основе того, как мы нашли коррелированную, но в остальном, казалось бы, не связанную переменную поведения.

И это сообщение в блоге на этой неделе!

Следите за обновлениями на следующей неделе, и вы увидите вторую часть этого сообщения в блоге, где мы более подробно рассмотрим эту тему.



Корреляция и причинно-следственная связь: определение, различия и примеры

Как маркетологи мобильной связи, мы каждый день принимаем решения на основе данных.Эти решения побуждают пользователей продолжать использовать наши приложения или удалять их. Вот почему мы должны ясно мыслить, сталкиваясь с данными, и остерегаться возможных проблем корреляции и причинно-следственной связи.

За последнее десятилетие организации стали отдавать предпочтение решениям, основанным на данных. Это мышление, что без доказательств нет реальной основы для решения. Это делает еще более важным использование статистики как инструмента, который дает представление о взаимосвязях между факторами в данном анализе.Статистика помогает отличить корреляции от причинно-следственных связей.

Пример корреляции и причинно-следственной связи

Моя свекровь недавно пожаловалась мне: «Каждый раз, когда я пытаюсь отправить текстовое сообщение, мой телефон зависает». Беглый взгляд на ее смартфон подтвердил мои подозрения: у нее одновременно было открыто пять игровых приложений, плюс Facebook и YouTube. Попытка отправить текстовое сообщение не приводила к зависанию, в отличие от нехватки оперативной памяти. Но она сразу связала это с последним действием, которое она совершала перед замораживанием.

Она подразумевала причинно-следственную связь, где была только корреляция.


Примеры корреляции и причинно-следственной связи в мобильном маркетинге

Корреляции повсюду. Как любят говорить разоблачители теории заговора: «Если вы посмотрите достаточно долго, вы увидите закономерности».

Таким же образом, если вы посмотрите достаточно долго, вы можете начать видеть причинно-следственные связи в своих данных мобильного маркетинга, где есть только корреляция. Мы пытаемся найти причину, по которой A и B встречаются одновременно.

Посмотрите, сможете ли вы определить, что есть что, в приведенных ниже примерах корреляции и причинной связи:

  • Реализован новый веб-дизайн >> Увеличился трафик веб-страницы
    Был ли рост трафика из-за нового дизайна (причинно-следственная связь)? Или трафик просто увеличивался в то время, когда был выпущен новый дизайн (корреляция)?
  • Загрузили новые изображения в магазин приложений >> Загрузки увеличились в 2 раза
    Увеличились ли загрузки из-за появления новых изображений в ваших магазинах приложений? Или они просто произошли одновременно?
  • Push-уведомление отправляется каждую пятницу >> Количество удалений увеличивается каждую пятницу
    Удаляют ли люди ваше приложение из-за ваших еженедельных push-уведомлений? Или здесь играет какой-то другой фактор?
  • Увеличение количества ссылок на ваш сайт >> Более высокий рейтинг в результатах поисковых систем
    Приводит ли увеличение количества ссылок непосредственно к лучшему поисковому рейтингу? Или они просто коррелируют?

Чтобы лучше понять корреляцию и причинную связь, давайте начнем с определения терминов.

Искусство адаптации пользователей мобильных приложений

Произведите хорошее первое впечатление благодаря длительным отношениям с клиентами. Узнайте, как подключить пользователей к вашему приложению с помощью CleverTap.

Загрузить технический документ

Что такое корреляция?

Корреляция — это термин в статистике, обозначающий степень связи между двумя случайными величинами. Таким образом, корреляция между двумя наборами данных — это степень, в которой они похожи друг на друга.

Если A и B наблюдаются одновременно, вы указываете на корреляцию между A и B.Вы не подразумеваете, что А причина Б или наоборот. Вы просто говорите, что когда A наблюдается, B наблюдается. Они движутся вместе или появляются одновременно.

Мы можем выделить три типа корреляций:

  • Положительная корреляция — это когда вы наблюдаете увеличение A и B также. Или, если A уменьшается, B соответственно уменьшается. Пример: чем больше покупок совершается в вашем приложении, тем больше времени вы проводите с ним.
  • Отрицательная корреляция — это когда увеличение A приводит к уменьшению B или наоборот.
  • Нет корреляции — это когда две переменные совершенно не связаны, и изменение A не приводит к изменению B, или наоборот.

Просто помните: корреляция не подразумевает причинной связи. Иногда это может быть совпадение. И если вы мне не верите, есть юмористический сайт, полный таких совпадений, под названием «Ложные корреляции». 1 Вот пример:


Что такое причинно-следственная связь?

Причинно-следственная связь подразумевает, что A и B имеют причинно-следственную связь друг с другом.Вы говорите, что А вызывает Б.

Причинность также известна как причинность.

  • Во-первых, причинно-следственная связь означает, что два события появляются одновременно или одно за другим.
  • И, во-вторых, это означает, что эти две переменные не только появляются вместе, существование одной вызывает проявление другой.

Корреляция и причинно-следственная связь: почему разница имеет значение

Знание разницы между корреляцией и причинно-следственной связью может иметь огромное значение, особенно когда вы принимаете решение на основании чего-то, что может быть ошибочным.

Скажем, вам интересно, было ли увеличение ежемесячных активных пользователей в прошлом месяце вызвано недавними усилиями по оптимизации App Store. Имеет смысл проверить это, чтобы точно сказать, является ли это корреляцией или причинно-следственной связью.

Корреляция против причинно-следственной связи: как определить, является ли что-то совпадением или причинно-следственной связью

Итак, как вы проверяете свои данные, чтобы делать надежные утверждения о причинной связи? Для этого есть пять способов — технически они называются планом экспериментов. ** Мы перечисляем их от самого надежного до самого слабого:

1. Рандомизированное и экспериментальное исследование

Допустим, вы хотите протестировать новую корзину покупок в своем приложении электронной коммерции. Ваша гипотеза состоит в том, что до того, как пользователь действительно сможет оформить заказ и оплатить свой товар, проходит слишком много шагов, и что эта трудность является точкой трения, которая мешает им покупать чаще. Итак, вы перестроили корзину покупок в своем приложении и хотите посмотреть, увеличит ли это шансы пользователей на покупку товаров.


Лучший способ доказать причинную связь — провести рандомизированный эксперимент. Здесь вы случайным образом назначаете людей для тестирования экспериментальной группы.

В плане эксперимента есть контрольная группа и экспериментальная группа, обе с одинаковыми условиями, но с одной проверяемой независимой переменной. Распределяя людей для тестирования экспериментальной группы случайным образом, вы избегаете экспериментальной ошибки, когда одни результаты предпочтительнее других.

В нашем примере вы случайным образом назначили бы пользователей для тестирования новой корзины покупок, прототипа которой вы создали в своем приложении, а контрольной группе будет назначена использование текущей (старой) корзины покупок.

После периода тестирования просмотрите данные и посмотрите, ведет ли новая корзина к большему количеству покупок. Если это так, вы можете заявить о наличии истинной причинно-следственной связи: ваша старая корзина мешала пользователям совершить покупку. Результаты будут иметь наибольшую ценность как для внутренних заинтересованных сторон, так и для других людей за пределами вашей организации, с которыми вы решите поделиться ими, именно из-за рандомизации.


2. Квазиэкспериментальное исследование

Но что произойдет, если вы не можете рандомизировать процесс отбора пользователей для участия в исследовании? Это квазиэкспериментальный дизайн.Существует шесть типов квазиэкспериментальных схем, каждый из которых имеет различные приложения. 2

Проблема с этим методом в том, что без рандомизации статистические тесты теряют смысл. Вы не можете быть полностью уверены в том, что результаты связаны с переменной или мешающими переменными, вызванными отсутствием рандомизации.

Квазиэкспериментальные исследования обычно требуют более сложных статистических процедур для получения необходимого понимания. Исследователи также могут использовать опросы, интервью и заметки наблюдений — все это усложняет процесс анализа данных.

Допустим, вы проверяете, менее запутан ли пользовательский интерфейс в вашей последней версии, чем в старой UX. И вы специально используете свою закрытую группу бета-тестеров приложений. Группа бета-тестирования была выбрана не случайно, поскольку все они подняли руку, чтобы получить доступ к новейшим функциям. Таким образом, доказать корреляцию против причинно-следственной связи — или, в этом примере, UX вызывает путаницу — не так просто, как при использовании случайного экспериментального исследования.

Хотя ученые могут избегать результатов этих исследований как ненадежных, собранные вами данные все же могут дать вам полезную информацию (подумайте о тенденциях).

3. Корреляционное исследование

Корреляционное исследование — это когда вы пытаетесь определить, коррелированы ли две переменные или нет. Если A увеличивается, а B соответственно увеличивается, это корреляция. Просто помните, что корреляция не подразумевает причинной связи, и все будет в порядке.

Например, вы решили проверить, имеет ли более плавный UX сильную положительную корреляцию с лучшими рейтингами в магазине приложений. И после наблюдения вы видите, что когда одно увеличивается, другое тоже.Вы не говорите, что A (плавный UX) вызывает B (более высокие оценки), вы говорите, что A тесно связано с B. И, возможно, даже может предсказать это. Это корреляция.

4. Однопредметное исследование

Однопредметный дизайн чаще используется в психологии и образовании, поскольку он связан с отдельным предметом. Вместо контрольной и экспериментальной группы субъект выступает в качестве своего собственного контроля. Исследователя беспокоят попытки изменить поведение или мышление человека.

В мобильном маркетинге исследование одного предмета может принимать форму просьбы к одному конкретному пользователю проверить удобство использования новой функции приложения. Вы можете попросить их выполнить одно действие несколько раз в текущем приложении, а затем попросить их попробовать то же действие в новой версии приложения. Соберите данные и посмотрите, будет ли действие выполнено быстрее в старом или новом приложении.

Очевидно, что в этой схеме используются данные одного пользователя. Его или ее опыт не может быть распространен на всех ваших пользователей, независимо от того, насколько идеально подходит ваш идеальный образ клиента.Это одна из причин, по которой этот тип исследования редко используется в маркетинге.


5. Истории

К сожалению, анекдоты иногда являются единственным доказательством, которое нам нужно для установления причинной связи. Вы можете встретить:

  • Служба поддержки: «Клиенты считают, что новый пользовательский интерфейс сложен в использовании. Вот почему они удаляются ».
  • Клиент X в Твиттере: «Мы пытались купить продукт в вашем приложении, и это привело к сбою моего телефона!»

Проблема здесь в том, что, хотя у них может быть действительная болевая точка и они могут сделать это убедительно (и очень эмоционально), эти истории не доказывают без сомнения, что А вызывает Б. На данный момент это действительно просто истории, и они имеют меньший вес, чем другие варианты, указанные выше.

Корреляция и причинно-следственная связь в мобильной аналитике

Итак, что мы узнали из всех этих примеров корреляции и причинно-следственной связи? Есть способы проверить, вызывают ли две переменные друг друга или просто коррелируют друг с другом.

Если вы серьезно относитесь к установлению причинно-следственной связи, вам следует использовать метод тестирования, который дает вашим данным и результатам наибольшую достоверность.Начните со случайного экспериментального плана и двигайтесь вниз. И всегда следите за тем, как вы думаете или даже вербализируете свои прогнозы.

Есть латинская фраза, которая гласит: «Post hoc, ergo propter hoc», что означает: «После этого, следовательно, из-за этого». Идея состоит в том, что, сообщая одно утверждение перед другим, вы подразумеваете, что предыдущее вызвало последнее. («Он оценил мое приложение на ноль звезд. Никто не скачивал мое приложение».) На самом деле это может быть просто корреляция или чистое совпадение.


Инфографика от CleverTap

Посмотрите, как ведущие современные бренды используют CleverTap для долгосрочного роста и удержания клиентов

Запланируйте демонстрацию прямо сейчас!

Поймите разницу для вашего продукта

Корреляция и причинно-следственная связь могут показаться обманчиво похожими.Но признание их различий может быть решающим фактором между потерей усилий на малоценные функции и созданием продукта, которым ваши клиенты не могут перестать восторгаться.

В этой статье мы сосредоточимся на корреляции и причинно-следственной связи, поскольку они относятся конкретно к созданию цифровых продуктов и пониманию поведения пользователей. Менеджеры по продуктам, специалисты по обработке данных и аналитики сочтут это полезным для использования правильной информации для роста продукта, например, влияют ли определенные функции на удержание или вовлеченность пользователей.

Прочитав эту статью, вы:

  • Знаете основные различия между корреляцией и причинно-следственной связью
  • Ключевые различия между корреляцией и причинно-следственной связью
  • Два надежных решения, которые ваша команда может использовать для проверки причинно-следственной связи

В чем разница между корреляцией и причинностью?

Хотя причинная связь и корреляция могут существовать одновременно, корреляция не подразумевает причинной связи. Причинная связь явно применяется к случаям, когда действие A вызывает результат B.С другой стороны, корреляция — это просто связь. Действие A относится к действию B, но одно событие не обязательно вызывает другое событие.

Корреляцию и причинно-следственную связь часто путают, потому что человеческий разум любит находить закономерности, даже если они не существуют. Мы часто придумываем эти паттерны, когда кажется, что две переменные настолько тесно связаны, что одна зависит от другой. Это подразумевает причинно-следственную связь, когда зависимое событие является результатом независимого события.

Однако мы не можем просто предположить причинно-следственную связь, даже если мы видим два события, происходящие, по-видимому, вместе на наших глазах. Во-первых, наши наблюдения носят чисто анекдотический характер. Во-вторых, существует множество других возможностей для ассоциации, в том числе:

  • Верно и обратное: B на самом деле вызывает A.
  • Эти две взаимосвязаны, но это еще не все: A и B коррелированы, но на самом деле они вызваны C.
  • Есть еще одна переменная: A действительно вызывает B — пока происходит D.
  • Существует цепная реакция: A вызывает E, что приводит к тому, что E вызывает B (но вы видели, что A вызывает B только своими глазами).

Пример корреляции и причинно-следственной связи в аналитике продукта

Вы можете ожидать найти причинно-следственную связь в своем продукте, где определенные действия или поведение пользователя приводят к определенному результату.

Представьте себе: вы только что запустили новую версию своего мобильного приложения. Вы делаете ключевую ставку на то, что удержание пользователей вашего продукта связано с социальным поведением в приложении.Вы просите свою команду разработать новую функцию, которая позволит пользователям присоединяться к «сообществам».

Через месяц после того, как вы выпустите и объявите о своей новой функции сообществ, около 20% всех пользователей приняли ее. Интересно, влияют ли сообщества на удержание, вы создаете две когорты одинакового размера со случайно выбранными пользователями. В одной когорте есть только пользователи, присоединившиеся к сообществам, а в другой — только пользователи, которые не присоединились к сообществам.

Ваш анализ показывает шокирующий вывод: пользователей, которые присоединились хотя бы к одному сообществу, удерживают гораздо чаще, чем средний пользователь.

Почти 90% тех, кто присоединился к сообществам, все еще находятся в Дне 1 по сравнению с 50% тех, кто этого не сделал. К 7 дню вы увидите 60% удержания среди присоединившихся к сообществу и около 18% удержания среди тех, кто не присоединился. Это похоже на массовый переворот.

Источник

Но подожди. Вы знаете, что у вас недостаточно информации, чтобы сделать вывод о том, приводит ли присоединение к сообществам к лучшему удержанию. Все, что вы знаете, это то, что они взаимосвязаны.

УСТРОЙСТВО УДЕРЖАНИЯ

Для развития вашего продукта вам нужна надежная стратегия удержания.

Прочтите наше руководство, чтобы получить советы экспертов по инструментам, стратегиям и реальным примерам для повышения удержания пользователей.

📚 Загрузить учебное пособие >>

Как проверить причинно-следственную связь в вашем продукте

Причинно-следственные связи не возникают случайно.

Может возникнуть соблазн связать две переменные как «причину и следствие». Но если сделать это без подтверждения причинно-следственной связи в надежном анализе, это может привести к ложноположительному результату, когда причинно-следственная связь, кажется, существует, но на самом деле ее нет.Это может произойти, если вы не тщательно проверяете связь между зависимой и независимой переменной.

Ложные срабатывания проблематичны для получения информации о продукте, потому что они могут ввести вас в заблуждение, заставив думать, что вы понимаете связь между важными результатами и поведением пользователей. Например, вы можете подумать, что знаете, какое конкретное событие активации ключа приводит к долгосрочному удержанию пользователей, но без тщательного тестирования вы рискуете принять важные решения по продукту на основе неправильного поведения пользователя.

Проведите надежные эксперименты для определения причинно-следственной связи

Как только вы обнаружите корреляцию, вы можете проверить ее, запустив эксперименты, которые «контролируют другие переменные и измеряют разницу».

Два таких эксперимента или анализа, которые вы можете использовать для определения причинно-следственной связи с вашим продуктом:

  • Проверка гипотез
  • A / B / n эксперименты
1. Проверка гипотез

Самая основная проверка гипотез включает H0 (нулевая гипотеза) и h2 (ваша основная гипотеза) .Вы также можете иметь вторичную гипотезу, третичную гипотезу и так далее.

Нулевая гипотеза противоположна вашей первичной гипотезе . Зачем? Потому что, хотя вы не можете доказать свою основную гипотезу со 100% уверенностью (самое близкое, что вы можете получить — 99%), вы можете опровергнуть свою нулевую гипотезу.

Первичная гипотеза указывает на причинно-следственную связь, которую вы исследуете, и должна определять независимую переменную и зависимую переменную.

Лучше сначала создать свой h2, затем определить его противоположность и использовать его для H0. Ваш h2 должен определять отношения, которые вы ожидаете между независимыми и зависимыми переменными. Итак, если мы будем использовать предыдущий пример влияния социальных функций в приложении на удержание, ваша независимая переменная будет присоединяться к сообществам, а ваша зависимая переменная будет удержанием. Итак, ваши гипотезы могут быть такими:

h2: Если пользователь присоединяется к сообществу в рамках нашего продукта в первый месяц, то он останется клиентом более одного года.

Затем отвергните свой h2, чтобы сгенерировать нулевую гипотезу:

H0: Нет никакой связи между присоединением к сообществу внутри приложения и удержанием пользователей.

Цель состоит в том, чтобы увидеть любые фактические различия между вашими различными гипотезами. Если вы можете отклонить нулевую гипотезу со статистической значимостью (в идеале с достоверностью минимум 95%), вы ближе к пониманию взаимосвязи между вашими независимыми и зависимыми переменными. В приведенном выше примере, если вы можете отклонить нулевую гипотезу, обнаружив, что присоединение к сообществу привело к более высоким показателям удержания (при корректировке мешающих переменных, которые могут повлиять на ваши результаты), то вы, вероятно, можете сделать вывод, что между сообществами и пользователем существует определенная связь удержание.

Чтобы проверить эту гипотезу, составьте уравнение, которое точно отражает взаимосвязь между ожидаемой причиной (независимая переменная) и следствием (переменная результата). Если ваша модель позволяет вам подставлять значение для вашей переменной воздействия и последовательно возвращать результат, который отражает фактические наблюдаемые данные, вы, вероятно, на чем-то натолкнулись.

Когда использовать проверку гипотез:

Проверка гипотез полезна, когда вы пытаетесь определить, действительно ли существует связь между двумя переменными, вместо того, чтобы смотреть на анекдотические свидетельства. Вы можете посмотреть исторические данные, чтобы запустить продольный анализ , который отслеживает изменения во времени. Например, вы можете выяснить, являются ли первые участники запуска продукта вашими крупнейшими промоутерами. Вы можете посмотреть на шаблоны рефералов, а также сравнить эту связь с запуском продукта с течением времени.

Или вы можете запустить перекрестный анализ , который анализирует моментальный снимок данных. Это полезно, когда вы смотрите на эффекты конкретного воздействия и результата, а не на изменения в тенденциях за период. В качестве примера вы можете изучить взаимосвязь между праздничными рекламными акциями и продажами.

2. Эксперименты с A / B / n

В качестве альтернативы, тестирование A / B / n может привести вас от корреляции к причинно-следственной связи. Посмотрите на каждую из ваших переменных, измените одну и посмотрите, что произойдет.Если ваш результат постоянно меняется (с той же тенденцией), вы нашли переменную, которая имеет значение.

Эндрю Чен говорит об этом так: «После того, как вы нашли модель, которая вам подходит, следующим шагом будет ее А / Б тестирование. Сделайте что-нибудь, что отдает приоритет входной переменной и увеличивает ее, возможно, за счет чего-то еще ». Он продолжает: «Посмотрим, станут ли в результате эти пользователи более успешными. Если вы видите большую разницу в своей метрике успеха, значит, вы на правильном пути.Если нет, то, возможно, это не очень удачная модель ».

Когда дело доходит до доказательства того, что присоединение к сообществам приводит к более высокому уровню удержания, вы должны исключить все другие переменные, которые могут повлиять на результат. Например, пользователи могли пойти другим путем, что в конечном итоге повлияло на удержание.

Чтобы проверить, существует ли причинно-следственная связь, вам нужно найти прямую связь между присоединением пользователей к сообществам и долгосрочным использованием вашего приложения.

Начните с процесса адаптации. Для следующих 1000 пользователей, которые зарегистрируются, разделите их на две группы. Половина будет вынуждена присоединиться к сообществам при первой регистрации, а другая половина — нет.

Запустите эксперимент в течение 30 дней, а затем сравните уровни удержания между двумя группами.

Если вы обнаружите, что группа, которая была вынуждена присоединиться к сообществам, имеет относительно более высокий уровень удержания, тогда у вас есть доказательства, необходимые для подтверждения наличия причинно-следственной связи между присоединением к сообществам и удержанием.Эти отношения, вероятно, стоит изучить глубже, чтобы понять, почему сообщества стимулируют удержание.

Вы не будете уверены в родстве, пока не проведете эксперименты такого типа.

Когда использовать A / B / n-тестирование:

A / B / n, или сплит-тестирование, идеально подходит, когда вы сравниваете влияние различных вариантов (это может быть кампания, функция продукта или контент стратегия). Сплит-тест процесса адаптации вашего продукта, например, может сравнить эффективность различных стратегий на основе определенных характеристик, в том числе:

  • Варианты копирования
  • Различная графика
  • Использование стороннего приложения для автоматического распознавания имени и компании ваши пользователи
  • Уменьшение количества полей в вашей форме регистрации, если у вас есть одно

После запуска нескольких вариантов адаптации продукта вы можете взглянуть на результаты, чтобы сравнить такие показатели, как процент прерывания, конверсия, и даже удержание.

Действуйте в соответствии с правильными корреляциями для устойчивого роста продукта

Мы всегда ищем закономерности вокруг нас, поэтому наша цель по умолчанию — уметь объяснить то, что мы видим. Однако, если причинно-следственная связь не может быть четко определена, следует предположить, что мы наблюдаем только корреляцию.

События, которые кажутся взаимосвязанными на основе здравого смысла, нельзя рассматривать как причинные, если вы не можете доказать четкую и прямую связь. И хотя причинная связь и корреляция могут существовать одновременно, корреляция не означает причинную связь.

Чем больше вы научитесь определять истинные корреляции в вашем продукте, тем лучше вы сможете расставить приоритеты в своих усилиях по вовлечению и удержанию пользователей.

6 примеров путаницы корреляции / причинно-следственной связи

Когда я впервые начал вести блог о корреляции и причинно-следственной связи (буквально мой третий и четвертый пост за всю историю), я утверждал, что существует три возможности, когда две переменные коррелируют. Теперь, когда я стал старше и мудрее, я расширил свой список до шести:

  1. Вещь А стала причиной Вещи Б (причинно-следственная связь)
  2. Вещь Б стала причиной Вещи А (обратная причинность)
  3. Вещь А вызывает Вещь В, которая затем ухудшает Вещь А (двунаправленная причинность)
  4. Вещь A вызывает вещь X вызывает вещь Y, которая в конечном итоге вызывает вещь B (косвенная причинность)
  5. Некоторая другая вещь C вызывает и A, и B (общая причина)
  6. Это случайно (ложное или случайное)

Очевидный вывод состоит в том, что годы, потраченные на ведение блогов о статистике, напрямую связаны с количеством возможных способов запутать корреляцию и причинную связь, которые вы распознаете.

В любом случае, я много говорил об этом на протяжении многих лет, и этот урок очень важен для любого класса статистики … хотя варианты №3 и №4 там не часто рассматриваются. Об этом легко забыть, поэтому я хотел использовать этот пост, чтобы собрать интересные примеры каждого типа.

  1. Курение сигарет вызывает рак легких (Вещь А вызывает Вещь Б): Это пример, который я использую в своем выступлении «Введение в Интернет-науку» для старшеклассников. Несмотря на то, что я постоянно призывал скептически относиться к различным утверждениям, я хотел бы отметить, что иногда неверие в истинное утверждение также имеет последствия.В течение многих лет табачные компании пытались поставить под сомнение связь между курением и раком легких, часто используя выражение «корреляция — это не причинная связь!» типа агитация.
  2. Увеличение веса во время беременности и преэклампсия (Вещь Б вызывает Вещь А): Это интересный случай обратной причинно-следственной связи, о котором я писал в блоге несколько лет назад. Еще в 1930-х годах врачи заметили, что женщины с преэклампсией (потенциально опасным для жизни состоянием) также быстро набирали вес. Они предположили, что прибавка в весе вызывает преэклампсию, и поэтому посоветовали женщинам строго ограничить прибавку в весе.К сожалению, на самом деле причиной увеличения веса была преэклампсия, и вполне вероятно, что ограничение веса принесло больше вреда, чем пользы.
  3. Свидания и отчаяние (Вещь А вызывает Вещь Б, которая делает Вещь А хуже): У всех нас был этот друг. Тот, кто атакует всех, с кем пытается встречаться, а затем сразу же удваивает их НАИХИЕ поведение. Это парень, который перестает мыться, прежде чем вывести девушек из дома, потому что «в чем дело». Или девушку, которую бросили после того, как она заговорила о браке на третьем свидании, поэтому вместо этого она поднимает этот вопрос на первом свидании.Это известно как «двунаправленная причинность» и менее формально известно как «порочный круг». В природе это может вызвать довольно забавное поведение графа, как в случае с хищниками и добычей. Увеличение добычи может вызвать увеличение количества хищников, но увеличение количества хищников вызовет уменьшение добычи. Таким образом, популяции хищников и жертв могут иметь как положительную, так и отрицательную корреляцию, в зависимости от того, где вы находитесь в цикле.
  4. Торговые автоматы в школах и ожирение (Вещь А вызывает Вещь X вызывает Вещь Y, которая затем вызывает Вещь Б): Одной из очевидных причин ожирения является чрезмерное употребление нездоровой пищи.Очевидным источником дополнительной нездоровой пищи являются торговые автоматы. Очевидно, что торговые автоматы можно найти во многих школах. Так что уберите торговые автоматы из школ и уменьшите ожирение, верно? Нет, к сожалению, не все так просто. В ходе длительного исследования, которое удивило даже авторов, было обнаружено, что дети, которые перешли из школ без торговых автоматов в школы с торговыми автоматами, не набирают вес. Интересно то, что вы можете найти корреляцию между детьми с избыточным весом и едой из торговых автоматов, но оказывается, что причинно-следственная связь достаточно запутана, и удаление торговых автоматов на самом деле не помогает исправить исходную конечную точку.
  5. Витамины и улучшение здоровья (Вещи A и B вызывают что-то другое): Это похоже на №4, но я считаю его более применимым, когда выясняется, что Вещи A и Вещи B даже не были действительно связаны совсем. Ежедневное употребление пакета чипсов из торгового автомата МОЖЕТ стать причиной набора веса, даже если удаление торгового автомата не поможет вам снова его сбросить. С другой стороны, со многими витаминными добавками первоначальные корреляции часто полностью вводят в заблуждение.Многие люди, получающие высокий уровень определенных витаминов (Вещь А), на самом деле просто те, кто уделяет внимание своему здоровью (Вещь С), и у этих людей, как правило, более высокие показатели здоровья (Вещь В). Однако не все витамины следует смазывать одной и той же кистью, эта потрясающая визуализация показывает, где доказательства указывают на 100 различных добавок.
  6. Ложные корреляции (ложные или случайные): Их есть целый веб-сайт, но мне больше всего нравится этот:

Причинный вывод, не для слабонервных.

Нравится:

Нравится Загрузка …

Связанные

Статистические уловки или угощения

Почему корреляция не подразумевает причинной связи? | Сима Сингх

Корреляция и причинная связь — это термины, которые в большинстве случаев понимаются неправильно и часто используются как взаимозаменяемые. Понимание обоих статистических терминов очень важно не только для того, чтобы делать выводы, но, что более важно, делать правильные выводы в конце.В этом посте мы поймем, почему корреляция не подразумевает причинно-следственную связь.

Мы много раз слышали, что «корреляция не вызывает причинной связи», или «корреляция не подразумевает причинной связи», или «корреляция не является причинной обусловленностью». Но что они на самом деле имеют в виду, говоря это?

Вы получите четкое представление, когда мы прочтем этот пост. Итак, начнем!

Корреляция — это статистический метод, который показывает нам, насколько сильно пара переменных линейно связаны и изменяются вместе. Он не говорит нам, почему и как стоят за отношениями, но просто говорит, что отношения существуют.

Пример: Корреляция между продажами мороженого и проданными солнцезащитными очками.

По мере роста продаж мороженого растут и продажи солнцезащитных очков.

Причинная связь идет дальше, чем корреляция. В нем говорится, что любое изменение значения одной переменной вызовет изменение значения другой переменной, что означает, что одна переменная вызывает другую.Его также называют причиной и следствием.

Пример: Когда человек тренируется, количество сжигаемых калорий увеличивается каждую минуту. Бывшее вызывает последнее.

Итак, теперь мы знаем, что такое корреляция и причинно-следственная связь, пора понять: «Корреляция не подразумевает причинность!» с известным примером.

Продажи мороженого коррелируют с убийствами в Нью-Йорке (исследование)

По мере роста и падения продаж мороженого растет и количество убийств. Приводит ли потребление мороженого к смерти людей?

Нет. Две взаимосвязанные вещи не означают, что одна вызывает другую.

Корреляция не означает причинно-следственную связь, или в нашем примере мороженое не вызывает смерти людей.

Когда две несвязанные вещи связаны вместе, они могут быть связаны либо причинно-следственной связью, либо корреляцией.

В большинстве случаев корреляция возникает только из-за совпадений. Просто потому, что кажется, что один фактор влияет на другой, это не значит, что это действительно так.

Корреляция — это то, о чем мы думаем, когда ничего не видим под покровом. Таким образом, чем меньше у нас информации, тем больше мы вынуждены наблюдать корреляции. Точно так же, чем больше у нас информации, тем более прозрачными станут вещи и тем больше мы сможем увидеть реальные случайные отношения.

Связь солнечных дней с продажей мороженого и убийствами

В некоторых случаях существуют некоторые скрытые факторы, которые на каком-то уровне связаны. Как и в нашем примере с продажами мороженого и количеством убийств, , погода — это скрытый фактор, вызывающий обе вещи.Погода на самом деле вызывает рост продаж мороженого и убийств. Как и летом, люди обычно выходят на улицу, наслаждаются солнечным днем ​​и расслабляются с мороженым. Поэтому в солнечную погоду на улице находится широкий круг людей и более широкий выбор жертв для хищников.

Нет причинно-следственной связи между мороженым и уровнем убийств, солнечная погода объединяет оба фактора. И да, продажа мороженого и убийства имеют причинно-следственную связь с погодой.

Сразу после обнаружения корреляции не делайте вывод слишком быстро.Найдите время, чтобы найти другие основные факторы, поскольку корреляция — это только первый шаг. Найдите скрытые факторы, проверьте, верны ли они, и затем сделайте вывод.

Надеюсь, этот пост развеял ваши сомнения!

Спасибо за прочтение !!

Корреляция и причинно-следственная связь: простое руководство

Опубликовано 22 февраля 2017 г. , автор: Людвиг Руф

Учебные пособия и основы

Сознательно или подсознательно мы стремимся найти в нашем окружении объяснения, почему вещи происходят именно так.Допустим, мы хотим знать, почему вчера я страдал от головной боли или почему некоторые гены способствуют мутации человеческих клеток в раковые. Поиск истинной причины, которая вызывает исход, важно по трем основным причинам. Это позволяет нам 1) объяснить текущую ситуацию, 2) спрогнозировать будущие результаты и 3) разработать меры вмешательства, направленные на причину изменения результата.

Теперь очевидно, что трудная задача — найти причину. Трудность в установлении причины возникает из-за того, что поведение и физиологические процессы часто являются результатом сложных взаимодействий между множеством факторов.Однако, когда вещи становятся сложными, мы пытаемся разбить их на мельчайшие единицы, исследуем отношения между ними и снова собираем все вместе, чтобы сделать общие выводы.

В исследованиях это обычно делается путем сопоставления интересующих переменных друг с другом. То есть, глядя, как увеличивается одна переменная, другая переменная также увеличивается (положительная корреляция) или уменьшается (отрицательная корреляция).

Пример 1: Потребление шоколада и лауреаты Нобелевской премии

Скажем, например, исследование показало, что потребление шоколада на душу населения положительно коррелирует с количеством лауреатов Нобелевской премии на 10 миллионов жителей, причем чем выше потребление шоколада, тем больше лауреатов Нобелевской премии (Messerli, 2012).

Осторожно: интерпретация природы этой корреляции непроста. Исследование не дает четких доказательств направления эффекта. Таким образом, невозможно дать причинную интерпретацию, например, «употребление большего количества шоколада приводит к увеличению количества Нобелевских премий» или «получение большего количества Нобелевских премий заставляет вас есть больше шоколада». Другими словами, мы ничего не можем сказать о том, увеличит ли употребление большего количества шоколада вероятность получения Нобелевской премии или наоборот. В этом случае стоит отметить, что корреляции просто показывают закономерность, не доказывая природу этой закономерности.Возможно, эта корреляция возникает случайно. Это известно как ложная корреляция (т. Е. Когда 2 или более событий не связаны причинно, но могут казаться таковыми либо по совпадению, либо потому, что они вызваны каким-то неизвестным фактором). Щелкните здесь, чтобы узнать больше о ложных корреляциях.

Пример 2: Воздействие антибиотиков в течение первого года жизни и увеличение веса в раннем детстве

Давайте рассмотрим второй пример: потенциальную связь между воздействием антибиотиков в течение первого года жизни и увеличением веса в раннем детстве.Исследования показывают, что получение большего количества антибиотиков увеличивает риск избыточного веса в более старшем возрасте в детстве (например, Bailey et al., 2014).

Может показаться логичным сделать вывод, что употребление антибиотиков на первом году жизни вызывает чрезмерное увеличение веса в раннем детстве. Однако, опять же, такого рода исследования показывают только корреляцию. Он не исследует причину у этих детей, страдающих избыточным весом, по сравнению с детьми, получающими меньше или совсем не принимающими антибиотики.Последующий вопрос должен быть следующим: каков точный физиологический механизм, лежащий в основе этой связи? Хотя это исследование полезно в первую очередь, мы должны использовать его только как отправную точку для обнаружения истинных механизмов (если они есть). Без этого наши вмешательства будут менее эффективными, потому что мы не нацелены на настоящую причину .

Bailey et al. (2014). Эти цифры показывают повышенный риск ожирения при более частом применении антибиотиков, особенно у детей, подвергшихся 4 или более воздействию антибиотиков.

Пример 3. Повышенный ИМТ и повышенный риск рака

Наконец, давайте рассмотрим третий пример. Повышенный ИМТ, по-видимому, связан с повышенным риском некоторых видов рака у взрослых (Renehan et al. , 2008).

Опять же, это может нас ввести в заблуждение. Было бы ошибочным заключить, что просто лишний вес вызывает случаев рака. Вместо этого нам нужно рассмотреть другие потенциальные переменные, которые могли бы объяснить связь между повышенным ИМТ и повышенным риском рака.Например, можно утверждать, что люди с более низким социально-экономическим статусом менее осведомлены о потенциальных факторах риска, не могут позволить себе хорошее медицинское обслуживание (например, профилактические меры для снижения риска рака) или просто ведут образ жизни, способствующий развитию определенных заболеваний. (например, меньшая физическая активность, диета и т. д.). Фактически, социально-экономический статус, по-видимому, связан с ИМТ у британских женщин в возрасте от 37 до 73 лет (Tyrrell et al., 2016).

Эти 3 примера иллюстрируют некоторые распространенные ошибки, которые можно сделать, делая выводы из корреляционных исследований.Несмотря на то, что вы знаете об этих подводных камнях, их бывает сложно избежать.

Тем не менее, при работе с корреляциями я бы рекомендовал задать себе следующие вопросы:

  1. Есть ли научные доказательства или даже правдоподобная логика относительно направления эффекта? (см. пример шоколада).
  2. Существуют ли промежуточные переменные, которые могут объяснить корреляцию? например биологический механизм, который мог бы объяснить взаимосвязь (см. пример антибиотика).
  3. Существуют ли неизмеряемые переменные, которые могли бы объяснить корреляцию? например третий фактор, который мог бы объяснить отношения (см. пример рака).

В заключение, наблюдение корреляций между переменными может быть относительно простым, но установить, что одна вещь вызывает другую, сложно. Читая статьи или научные статьи, будьте критичны. Вопрос, можно ли рассматривать заявленную корреляцию между двумя переменными как причинно-следственную связь.

Так что же нам нужно на будущее? Я думаю, что нам нужно составить общую картину взаимосвязанных отношений, а не искать изолированные связи между отдельными переменными.

Но прежде, чем мы получим лучшие ответы относительно сложного взаимодействия корреляций, это может быть хорошим предлогом для того, чтобы попробовать шоколад. Никогда не знаешь.

Список литературы

Бейли, Л.С., Форрест, К.Б., Чжан, П., Ричардс, Т.М., Лившиц, А., ДеРуссо, П.А., 2014. Связь применения антибиотиков в младенчестве с ранним детским ожирением. JAMA Pediatr. 168, 1063-1069. DOI: 10.1001 / jamapediatrics.2014.1539

Мессерли, Ф.Х., 2012. Потребление шоколада, когнитивные функции и лауреаты Нобелевской премии. N. Engl. J. Med. 367, 1562-1564. DOI: 10.1056 / NEJMon1211064

Ренехан А.Г., Тайсон М., Эггер М., Хеллер Р.Ф., Звален М. Индекс массы тела и заболеваемость раком: систематический обзор и метаанализ проспективных обсервационных исследований. Ланцет. 2008 16 февраля; 371 (9612): 569-78.DOI: 10.1016 / S0140-6736 (08) 60269-X.

Tyrrell, J., Jones, S.E., Beaumont, R., Astley, C.M., Lovell, R., Yaghootkar, H. , Tuke, M., Ruth, K.S. Фрити, Р.М., Хиршхорн, Дж. Н., Вуд, А. Р., Мюррей, А., Уидон, М. Н., Фрейлинг, Т. М., 2016. Рост, индекс массы тела и социально-экономический статус: исследование методом менделевской рандомизации в Биобанке Великобритании. Br. Med. J. 352, i582. DOI: 10.1136 / bmj.i582

Теги:

Корреляция против причинно-следственной связи: в чем разница?

Данные — чрезвычайно мощный элемент любого решения.Американский статистик У. Эдвардс Деминг однажды сказал: «Мы верим в Бога. Все остальные должны приносить данные ». Но слишком часто данные могут быть неверно истолкованы. Одна из самых больших трудностей при анализе данных связана с корреляцией и причинно-следственной связью.

Существует бесчисленное количество статей, в которых делаются дикие, часто ироничные выводы, сделанные на основе двух сильно коррелированных наборов данных. Например, Harvard Business Review однажды рассмотрел примеры, показывающие «возможность» того, что:

  • Чем больше вы тратите на спортивные матчи, тем меньше вероятность употребления кукурузного сиропа с высоким содержанием фруктозы
  • Продано больше iPhone означает, что больше людей умирает от падения с лестницы

Это крайние примеры. Хотя корреляция не обязательно подразумевает причинную связь, и эти примеры показывают опасность непонимания разницы между корреляцией и причинностью в реальном мире. В этих случаях требуется дополнительная проверка, прежде чем корреляция может считаться причинной.

В чем разница между корреляцией и причинно-следственной связью?

Начнем с основ. Каково определение причинной связи и корреляции?

Что такое корреляция?

Австралийское статистическое бюро дает прекрасное определение корреляции:

«[Это] статистическая мера (выраженная в виде числа), которая описывает размер и направление взаимосвязи между двумя или более переменными.”

Другими словами, изменение одной переменной обычно отражается положительным или отрицательным изменением другой.

Какие бывают типы корреляций?

  • Положительная корреляция : Переменные A и B движутся в одном направлении. Например, с увеличением переменной A увеличивается и B.
  • Отрицательная корреляция : Переменные A и B движутся в противоположных направлениях. Например, по мере увеличения переменной A B уменьшается.
  • Нет корреляции : Нет очевидной связи между переменными A и B.

Сила линейной связи между двумя переменными, также называемая коэффициентом корреляции , может варьироваться от -1 (отрицательная корреляция) до 1 (положительная корреляция). Чем ближе коэффициент корреляции к -1 или 1, тем сильнее связь. С другой стороны, коэффициент корреляции 0 указывает на отсутствие корреляции между этими двумя переменными.

Однако корреляция не обязательно означает, что данные независимые и зависимые переменные связаны.Это подводит нас к причинно-следственной связи…

Что такое причинно-следственная связь?

Также известное как «причинность», Австралийское статистическое бюро определяет причинность следующим образом:

«… одно событие является результатом возникновения другого события; то есть между двумя событиями существует причинно-следственная связь. Это также называется причиной и следствием ».

Другими словами, действительно ли одна переменная влияет на другую?

Причинная связь vs.Примеры корреляции

Spurious Correlations — это развлекательный ресурс, в котором приводятся примеры, демонстрирующие сильные взаимосвязи между переменными, но не вызванные друг другом. По крайней мере, их не должно быть.

Показательный пример: употребление маргарина отстает от количества разводов в штате Мэн?

Источник: tylervigen.com (ссылка на лицензию)

Если вернуться к примерам продуктов питания, может ли сыр быть секретным топливом, которое помогает инженерам-строителям в их исследованиях?

Источник: tylervigen.com (ссылка на лицензию)

Обе диаграммы показывают сильную корреляцию между зависимыми и независимыми переменными. Однако это, вероятно, классические случаи, когда «корреляция не подразумевает причинной связи». То есть, если только маргарин не является действительно болезненным предметом для пар в штате Мэн или есть новые революционные эффекты от употребления большого количества сыра.

Почему важно знать разницу между корреляцией и причинно-следственной связью?

Приведенные выше примеры корреляции и причинно-следственной связи показывают, насколько важно правильно различать различия.

Авинаш Кошик, евангелист по цифровому маркетингу в Google, писал в 2016 году о том, что непонимание разницы может быть очень проблематичным. Кошик выделил статью журнала The Economist, в которой утверждалось, что употребление большего количества мороженого может повысить успеваемость учащихся по шкале чтения PISA.

«Нормальным людям (не аналитикам) этот график и статья выглядят законными», — написал Кошик. «В конце концов, это уважаемый сайт и уважаемая команда. О, и посмотрите, есть красная линия, что похоже на правдоподобное распределение, и R-квадрат! »

Но Кошик хочет, чтобы мы немного внимательнее относились к имеющимся данным, а не принимали их за чистую монету.

Он указывает, что нет ничего, что могло бы обосновать причинность того и другого, несмотря на разумную корреляцию. Может показаться, что существует связь, связывающая IQ с потреблением мороженого. Однако данные не дают однозначного ответа на этот вопрос, кроме этой очевидной корреляции.

Смелые заявления

В повседневной жизни у нас есть доступ к большему количеству данных, чем когда-либо прежде. Решения, мнения и даже бизнес-стратегии могут зависеть от нашей способности различать их.

Каушик использует приведенный выше пример, чтобы напомнить людям, что они более скептически относятся к утверждениям, которые делают смелые выводы на основе коррелированных данных. Он призывает читателей глубже анализировать данные и избегать простых решений.

«Наша работа — быть скептиком, копать и понимать, тыкать и подталкивать и отвергать возмутительно неправильное, и, если оно не возмутительно неправильное, тогда выяснять, насколько это может быть правильно, чтобы вы могли дать обоснованную рекомендацию». — Авинаш Кошик

Причинная связь vs.корреляция — это также тема, которую Майкл Мольнар рассматривает в статье Forbes. Мольнар предупреждает, что:

«Запутанная корреляция с причинно-следственной связью — не неизвестная проблема, но она становится все более проблематичной по мере увеличения объема данных и увеличения мощности компьютеров … это затрагивает самую суть того, что мы знаем — или думаем, что знаем — о том, как устроен мир».

Может быть трудно сделать вывод о причинной связи между двумя переменными. Рандомизированный контролируемый опыт и другие статистические тесты часто необходимы, чтобы проверить, действительно ли одна переменная влияет на другую.Более того, хотя корреляции могут быть полезными мерами, у них есть ограничения. Как мы видели в приведенных выше примерах корреляции и причинно-следственной связи, это обычно связано с измерением линейной связи.

Получение правильной корреляции и причинно-следственной связи

В сегодняшнем мире, основанном на данных, важно более скептически относиться к конкретным выводам, прежде чем делать смелые заявления, как предполагает Кошик. Как мы можем это сделать? Дальнейшие исследования и, по возможности, дополнительное тестирование.

Внешние факторы (называемые «мешающими факторами» или «скрытыми переменными») иногда могут вступать в игру для одной или двух переменных в данной корреляции.Например, некоторые исследования обнаружили связь между употреблением кофе и риском рака легких. Однако, как показывает один мета-анализ этих результатов, было обнаружено, что «курение» является потенциально мешающей переменной в результатах [1]. Как уже упоминалось, и, как и в случае с другими ключевыми выводами, дальнейшие исследования могут помочь прояснить контекст, лежащий в основе корреляций.

Проверка причинно-следственной связи — сложная задача. Однако экспериментальный план может помочь. Здесь исследователь может проверить гипотезу таким образом, чтобы он мог контролировать одну переменную (независимую переменную) и измерять ее влияние на другую переменную (зависимую переменную).Что наиболее важно, это может помочь им контролировать возможные факторы, влияющие на результаты, чтобы избежать потенциальной предвзятости в их результатах. Для получения дополнительной информации о том, как работает экспериментальный дизайн, этот обзор Britannica является отличным введением.

Подойдите к аналитике клиентского опыта с уверенностью

В Astute мы помогаем ведущим брендам оценивать и повышать качество обслуживания клиентов с помощью проверенных решений по взаимодействию с клиентами, в том числе Astute VoC, нашего решения для голоса клиентов.Наши эксперты по голосовой связи также помогут разобраться в ваших данных, чтобы вы могли получить практическую информацию, в которой вы можете быть уверены.

Посмотрим, чем мы можем помочь. Запросите персонализированную демонстрацию сегодня.

Дополнительные ресурсы о корреляции и причинно-следственной связи

Ниже приведены некоторые полезные ресурсы, которые объясняют корреляцию по сравнению с причиной и следствием.

[1] Галаррага, В., и Боффетта, П. (2016). Употребление кофе и риск рака легких — метаанализ.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *