Эффект «до и после» обычно объясняют тем, что пациенты притворяются, что им хуже, чем на самом деле, чтобы было видно, что они нуждаются в лечении. Но к концу лечения им хочется снискать расположение лечащего врача. Независимо от того, насколько это объяснение правдиво, мы ожидаем улучшения состояния пациента в конце лечения, а не в начале, потому что эмоциональное состояние пациента в то время, когда они ожидают лечения, вероятно, также хуже, чем обычно, и потому что сам по себе тот факт, что время идет, вызывает регрессию к среднему значению. Этот эффект проявляется даже при отсутствии лечения вообще.
Кстати говоря, время работает на врачей: со временем пациент ожидаемо идет на поправку, конечно, за исключением случаев, когда болезнь прогрессирует. Поэтому, каким бы ни было врачебное вмешательство, у него всегда будут шансы считаться действенным. «Я съела суп из одуванчиков, и простуды как не бывало». «Моя жена выпила отвар столетника, как только заболела гриппом, и у нее все прошло в два раза быстрее, чем у меня». Статистика «Один Человек Сказал» в сочетании с эвристическим правилом «после этого — значит вследствие этого» помогла разбогатеть многим производителям чудодейственных средств от всех болезней. И они не соврут, утверждая, что большинство людей почувствовало себя лучше после того, как приняли их лекарство.
Но я немного забегаю вперед, говоря о регрессии. Мы незаметно перешли от закона больших чисел к обсуждению концепции ковариации или корреляции. А это тема следующей главы.
Зачастую наблюдения за объектами или явлениями должны восприниматься как примеры выборки. Качество еды в конкретном ресторане в конкретный день, качество игры конкретного спортсмена в конкретной игре, сколько раз шел дождь за ту неделю, которую вы провели в Лондоне; приятно ли вам общество человека, с которым вы встретились на вечеринке, — все это нужно рассматривать лишь как выборку из огромного общего количества примеров. И любая оценка, подходящая к данной переменной величине, будет в той или иной степени ошибочна. Чем больше выборка, тем (при прочих равных составляющих) больше вероятность, что ошибки станут взаимоисключающими и мы приблизимся к правильному ответу. Закон больших чисел применяется к тем событиям, количество которых сложно определить, равно как и к тем, которые достаточно легко закодировать таким образом.
Фундаментальная ошибка атрибуции изначально возникает из-за нашей склонности игнорировать ситуационные факторы и осложняется тем, что мы отказываемся признавать тот факт, что короткое знакомство с человеком представляет собой лишь крохотную выборку его поступков. Иллюзия собеседования также основана на ошибке — увидев, как человек говорил и вел себя на получасовой беседе, мы по своей самоуверенности воображаем, что знаем, что он из себя представляет.
Увеличение выборки уменьшает ошибки только в том случае, если выборка является несмещенной (объективной). Добиться этого можно, предоставив каждому явлению, событию или человеку из данной популяции равные шансы участия в выборке. Нужно с вниманием относиться к опасности смещения выборки: отдохнул ли я, сходив в ресторан с женой, или был напряжен, потому что с нами была ее сестра, которая вечно всех критикует? А использовав расширенную смещенную выборку, можно лишь еще больше утвердиться в своем ошибочном выводе.
Среднеквадратическое отклонение — это простой способ измерения дисперсии непрерывной переменной величины относительно среднего значения. Чем больше среднеквадратическое отклонение в наблюдении данного типа, тем меньше мы можем быть уверены, что конкретное наблюдение будет близко к среднему значению, верному для всей выборки. Большое среднеквадратическое отклонение для инвестиции означает, что ее доходность окажется под вопросом.
Если мы знаем, что наблюдение переменной величины определенного вида относится к предельным значениям распределения этой переменной, то очень вероятно, что результаты последующих наблюдений не будут предельными. Студент, получивший высший балл на последнем экзамене, вероятно, хорошо сдаст следующий экзамен, но вряд ли снова получит высший балл. Акции десяти компаний, занимавшие самые высокие позиции в прошлогоднем рейтинге, не останутся на тех же позициях в этом году. Предельные значения стали предельными, потому что так расположились звезды (или не расположились). В следующий раз звезды, скорее всего, поменяют свое положение.
Статистика может быть полезна, а иногда даже необходима, чтобы дать чему-либо точную характеристику. Кроме того, статистика позволяет определить, существует ли связь между одним явлением и другим. Как несложно догадаться, с уверенностью говорить о наличии или отсутствии связей между явлениями может быть еще труднее, чем точно охарактеризовать какое-либо явление, предмет или человека.
Вам нужно правильно охарактеризовать явление 1, а также явление 2. Затем вам нужно подсчитать, насколько часто явление первого типа возникает вместе с явлением второго типа, как часто явление первого типа не возникает вместе с явлением второго типа и т.д. Если переменные величины непрерывны, задача усложняется еще больше. Нужно рассчитать, связаны ли более высокие показатели явлений первого типа с более высокими показателями явлений второго типа. Даже такое абстрактное рассуждение ясно дает понять, что у нас возникнут большие проблемы при попытке оценить степень связи между переменными величинами. И в самом деле, наши трудности с поиском ковариаций (или корреляций) очень серьезны. А последствия наших ложных оценок могут быть весьма и весьма неблагоприятными.