Как лгать при помощи статистики. Доверяй, но проверяй…

Таинственный язык статистики, столь притягательный в условиях культуры, которая ставит во главу угла факты, используют для того, чтобы создавать сенсации, преувеличивать, сбивать с толку и чрезмерно упрощать.

91_mainНародная мудрость гласит: существуют три вида лжи — ложь, наглая ложь и статистика. Последняя может скрываться за убедительными графиками, диаграммами и отчетами. Мы часто видим заголовки вроде: “Центр N опубликовал результаты масштабного исследования…” и даже не думаем усомниться в их правдивости. Как лгать при помощи статистики? Ответ на этот вопрос в своей книге How to Lie With Statistics дает американский писатель Дарелл Хафф.

Необъективная выборка

Выборка — важнейшая составляющая статистического исследования. Если она велика и правильно составлена, результаты исследования будут достаточно объективными. В противном случае статистика может сыграть с вами злую шутку.

Чтобы данные выборочного исследования имели значительную ценность, нужно убрать все источники предвзятости (даже неочевидные). Примеров много и вот один из них: В 1950 г. журнал Time опубликовал статью, в которой утверждалось, что “средний выпускник Йельского университета 1924 г. зарабатывает 25 111 долларов в год”. На то время цифра была очень высокой. Но стоило ли доверять такой статистике? Оказывается, нет. Все дело в том. что размер дохода вычислен на основе выборки, составленной из всех выпускников, чьи адреса были известны. Логично предположить, что “заблудшие овечки”, чей адрес выяснить не удалось, вряд ли являлись дельцами с Уолл-Стрит или директорами компаний. Соответственно, исследование проводилось только среди людей, достигших определенного успеха, попавших в газеты или справочники. Так неочевидная предвзятость ввела в заблуждение миллионы читателей Time.

Подобным образом в следующий раз, когда вы прочитаете, что средний американец (в наши дни вы узнаете об этом субъекте много всякой всячины…) чистит зубы 1,02 раза в день — эту цифру я придумал прямо сейчас, но она ничем не уступает любой другой, — задайте себе вопрос: каким образом кому-то удалось собрать такие сведения?

Нюансы, о которых скромно умалчивают

В то время как исследователи могут случайно не учесть какие-то моменты, некоторые компании намерено лгут при помощи статистики. «Потребители отмечают, что благодаря зубной пасте компании Doakes у них образуется на 23% меньше кариеса», — гласит заголовок в одном из популярных печатных изданий. Почему компании Doakes так легко удалось, не прибегая к вранью, добиться широкого освещения в прессе, да еще и подкрепить все это заключениями независимых экспертов?

Предположим, некая немногочисленная группа потребителей в течение полугода ведет учет состояния своих зубов, а потом переключается на пасту от Doakes. Далее можно ожидать одного из трех вариантов: кариеса станет больше, кариеса станет ощутимо меньше или никаких изменений не последует. Если события пойдут по первому или последнему варианту, производитель пасты просто зафиксирует эти показатели (где-нибудь у себя, вдали от глаз общественности) и предпримет новые попытки. Рано или поздно в дело вмешается случай, и у испытуемых зафиксируют-таки значительное улучшение, достойное газетных заголовков, а то и целой рекламной кампании. И случится это независимо от того, пользуются ли испытуемые пастой Doakes, питьевой содой или своим привычным средством по уходу за зубами.

Должен ли каждый из нас стать сам себе статистиком и лично изучать исходные данные любого исследования? В принципе, все не так уж плохо, тем более что есть такая штука, как критерий значимости, суть которого несложно понять. Это просто способ показать, насколько вероятно, что полученная в ходе испытаний цифра отражает реальный результат, а не что-то случайное.

График – лучше не бывает

Пожалуй, простейшей разновидностью статистической картинки или графика будут всевозможные кривые. Они весьма полезны, когда нужно продемонстрировать те или иные тенденции.

График ниже наглядно демонстрирует ежегодный рост национального дохода США на 10%. Его можно назвать “честным”, поскольку 10% здесь выглядят как 10% — тенденция восходящая, существенная, но не особо впечатляющая…

Этого вполне достаточно, если ваша задача только в том, чтобы передать информацию. А давайте предположим, что вы хотите одержать верх в споре, потрясти читателей, побудить их к действию или что-то им продать.

Все, что нужно —  просто отрезать нижнюю часть:

Выглядит более внушительно, не так ли?

Но есть один еще более хитрый трюк, который сделает график поистине шикарным. Просто измените пропорции между осью ординат и осью абсцисс:

Мнение редакции DataReview

How to Lie With Statistics — книга, которую действительно СТОИТ ПРОЧЕСТЬ! Она наглядно демонстрирует тот факт, что не все цифры одинаково полезны, и не стоит верить всем “громким” заголовкам, ссылающимся на какую-либо статистику. На примерах и с большим количеством иллюстраций автор книги излагает основы статистики для самых широких кругов читателей, учит критическому отношению к статистическим данным, тщательному анализу предлагаемых сведений, умению отличать полезные и добросовестные статистические исследования от искусно сфальсифицированных.

Оценка — 9 из 10.

Приятного чтения!

Добавить комментарий

Ваш e-mail не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =