Admin
Администратор
Статистика иногда показывает картину, которая на первый взгляд кажется очевидной, но при более внимательном разборе оказывается неверной. Один из самых известных примеров связан с так называемым парадоксом Симпсона. Суть в том, что общая тенденция в данных может не совпадать с тем, что видно внутри отдельных групп, а иногда и прямо противоречить ей. Один из самых известных случаев произошел в 1970-х в Университете Калифорнии в Беркли. Тогда университет обвинили в дискриминации женщин при поступлении в магистратуру. Общая статистика действительно выглядела подозрительно: мужчин принимали в 44% случаев, женщин в 35%. Но после разбивки по отдельным факультетам картина изменилась. В четырех из шести крупнейших подразделений женщин принимали даже чаще, чем мужчин. Более низкий итоговый процент у женщин объяснялся не политикой университета в целом, а тем, куда именно они чаще подавали документы. Женщины чаще выбирали направления с более высоким конкурсом и большим числом отказов. Мужчины чаще подавали заявки на программы, где мест было больше, а конкуренция ниже. Именно такой эффект и называют парадоксом Симпсона. Он возникает, когда данные из разных групп объединяют в одну таблицу без учета важных различий между этими группами. В результате общий итог может показывать одну тенденцию, а данные внутри подгрупп другую. Проблема не ограничивается историческими примерами из университетской жизни. Похожая ситуация встречается и в медицине, и в эпидемиологии. Например, препарат может выглядеть эффективнее плацебо в общей выборке. Но после деления пациентов на отдельные группы может выясниться, что в каждой из них плацебо показывает лучший результат. Главный вывод простой: общая статистика без разбивки по важным группам может привести к ошибочным выводам.