Рис. 3. Диаграмма разброса и корреляции
На рисунке 3 с помощью так называемых диаграмм разброса показано, насколько велика корреляция такого масштаба. Отдельные графики называются диаграммами разброса, потому что они показывают степени разброса относительно прямой линии — полной функциональной связи.
Корреляцию, равную 0,3, трудно распознать визуально, но на практике она может быть очень важна. Корреляция уровня 0,3 соответствует, например, прогнозируемости уровня дохода в зависимости от IQ или успеваемости в аспирантуре в зависимости от оценок в колледже. В такой же степени можно спрогнозировать вероятность развития сердечно-сосудистых заболеваний в зависимости от веса человека.
Корреляция 0,3 это вовсе не пустяк — это значит, что если кто-то находится в 84-м процентиле (одно СКО выше среднего значения) переменной величины А, то этот человек скорее всего будет в 63-м процентиле по величине Б (0,3 СКО выше среднего значения). А это уже более высокая прогнозируемость для величины Б, чем та, что была у вас, когда вы ничего не знали о величине А. В этом случае вы должны догадаться, что 50-й процентиль для каждого — среднее значение распределения величины Б. Иногда такой факт может решить судьбу вашего бизнеса — будет он процветать или обанкротится.
Корреляция 0,5 соответствует степени связи между уровнем 1(2 и качеством исполнения служебных обязанностей на средней должности. (Корреляция в данном случае будет выше, когда работа сложная и ответственная, и ниже, когда работа более легкая.)
Корреляция 0,7 соответствует степени связи между ростом и весом — она существенна, но все же это не полная взаимосвязь. Корреляция 0,8 соответствует степени связи между баллами за тестирование знаний по математике за один год и баллами за этот же тест на следующий год — это довольно высокая корреляция, но все же разница между двумя оценками в среднем может быть велика.
Расчет коэффициента корреляции — только один из шагов в определении причинно-следственных связей. Если между величиной А и величиной Б нет корреляции, тогда между ними (вероятно) нет и причинно-следственной связи. (Исключением может быть такой случай, когда существует третья величина В, которая маскирует корреляцию между А и Б, когда между ними на самом деле есть причинно-следственная связь.) Если между А и Б есть корреляция, это еще не говорит о том, что изменение величины А является причиной изменения величины Б. Возможно, А влияет на Б или Б влияет на А, а также ассоциация может возникнуть вследствие того, что А и Б связаны с некой третьей величиной В, но между А и Б нет никакой причинно-следственно связи.
Практически любой человек с высшим образованием признает, что теоретически эти утверждения верны. Но зачастую конкретная корреляция настолько согласуется с весьма правдоподобными объяснениями некой взаимообусловленности, что мы автоматически принимаем ее как доказательство наличия причинно-следственной связи. Нам так хорошо удается строить гипотезы о причинах и следствиях, что это происходит практически само собой. Выводы о причинах и следствиях, которые возникают у нас в голове, часто бывают настолько соблазнительны, что нам трудно от них отказаться. Если я скажу вам, что у людей, которые едят много шоколада, чаще бывают прыщи, трудно не сделать вывод, что шоколад вызывает появление прыщей. (Как известно, это не так.) Если я скажу вам, что пары, которые тщательно готовятся к свадьбе, потом дольше живут в браке, у вас возникнет естественный вопрос: каким же образом тщательно продуманная свадебная церемония продлевает брак? Не так давно в статье в одной очень известной газете автор утверждал, что такая корреляция существует, и пускался в размышления, почему совместная работа по планированию свадьбы производит такой эффект. Если поразмыслить над этой корреляцией, вы поймете, что тщательное планирование свадьбы не является случайным событием; скорее, можно сказать, что это событие с большей вероятностью произойдет у тех, у кого больше друзей, больше свободного времени друг для друга, больше денег и много чего еще. Любой из этих аспектов, а лучше сказать, все они и влияют на продолжительность брака. Не стоит выдергивать из запутанной паутины событий один-единственный факт и начинать раздумывать о том, как же так получилось. Это ни к чему не приведет.
Взгляните на причинно-следственные связи, изложенные в подборке 1. Все они реальны. Некоторые из них выглядят весьма правдоподобно, другие наоборот — весьма неправдоподобно. Независимо от того, считаете вы причинно-следственную связь правдоподобной или нет, подумайте, можете ли вы дать объяснения следующих типов: 1) А приводит к Б; 2) Б приводит к А; 3) что-либо, связанное и с А, и с Б, оказывает влияние, а между А и Б нет связи. Затем взгляните на возможные ответы в подборке 2.
...Подборка 1. Размышляем о корреляциях: какими могут быть причинно-следственные связи?
1. В статье, опубликованной в журнале Time, утверждается, что попытки родителей контролировать, сколько едят их дети, приводят к тому, что дети набирают избыточный вес. Если родители перестанут контролировать количество еды, похудеют ли эти дети?
2. В тех странах, где выше средний уровень IQ, выше и среднее благосостояние граждан, измеряемое в ВВП на душу населения. Делает ли наличие умных людей страну богаче?