Не все цифры одинаково полезны, или “Среднестатистический” обман

Среднестатистический. Этот термин настолько популярен, что его можно услышать везде, где речь идет о статистике. На первый взгляд все просто, не так ли?. На самом деле существует несколько видов среднестатистических данных, и каждый из них может быть весьма обманчив.

Чтобы не подвергать себя и свою компанию рискам, связанным с принятием неправильных решений, следует разобраться в терминологии и понять, как выглядит “среднестатистический” обман.

Терминология

Как мы уже говорили, существует несколько — а именно, 3 вида среднестатистических данных:

Среднее арифметическое. Это сумма цифр поделенная на их количество. Пример:

5,6,9,3,8

5+6+9+3+8 = 31

31 / 5 (количество цифр) = 6.2

Медиана. Если расположить наши цифры в порядке возрастания, медианой будет число, находящееся строго посередине

3,5,6,8,9

Медиана — 6

* Если количество цифр четное, медианой будет среднее арифметическое двух цифр, находящихся посередине.

Мода. Это число, которое повторяется в выборке чаще остальных. В нашем случае моды нет, но если бы цифровой ряд выглядел так:

3,4,6,8,9,3,

то модой была бы цифра 3.

Чтобы увидеть разницу между средним, медианой и модой, представим простую ситуацию: телекоммуникационной компании нужно узнать, сколько звонков в день совершают ее абоненты. Возьмем выборку из 7 человек:

Абонент Кол-во звонков
Абонент 1 2
Абонент 2 3
Абонент 3 1
Абонент 4 10
Абонент 5 5
Абонент 6 2
Абонент 7 999
Среднее
Медиана
Мода

Среднее арифметическое будет указывать на 146 звонков, медиана — на 3, а мода — всего на 2. Огромная разница, не так ли? Поэтому, когда вам представляют результаты анализа данных, где фигурирует понятие “среднестатистический”, поинтересуйтесь, какой именно метрикой пользовались аналитики.

Когда врет среднее арифмитическое

Если вы думаете, что среднее статистическое не может врать, вы заблуждаетесь. Когда выборка содержит аномально высокие или аномально низкие показатели, результаты анализа будут ошибочны. Чтобы выводы были верны, необходимо найти и исключить из выборки такие показатели. Приведем несколько примеров:

  1. Зарплаты сотрудников

Представим большую компанию, где директор получает 100 000, его заместители 25 000, руководители отделов — 10 000, младшие менеджеры — 5 000, обычные работники — 2 500

Если сложить все цифры и поделить на их количество, средняя зарплата составит 28 500. Не мало, правда? Только вряд ли эта цифра о чем-то говорит обычным работниками (которых, кстати, большинство), получающим по 2 500. Зато с ее помощью можно обмануть общественность, представив компанию в выгодном свете.

  1. Банковские вклады

Представим, что ваш банк имеет 9 вкладчиков. 8 из них положили на депозит по 1 000 долларов, и только 1 — 1 доллар. Вы решили посчитать средний размер вкладов. Он будет равен 900,1 долларов — на целых 10% меньше суммы вклада большей части людей.

Когда врет медиана

Врать при помощи медианы, пожалуй, сложнее всего. По сути, это значение, которое просто находится в середине выборки. Тем не менее, порой медиана помогает скрывать очень большие или очень маленькие данные.

Представьте цифровой ряд:

1,5,7,9,2000

Медианой здесь будет 7 (чувствуете подвох?).

Пример: Компания заявляет, что медианный рост цен на ее продукцию за последние 10 лет составил 3%. Вроде немного, но при этом за последний год цены могли подняться на все 20%.

Когда врет мода

В некоторых случаях врать при помощи моды невозможно. Например, когда нужно узнать, сколько билетов в среднем приобрел каждый посетитель на определенный сеанс в кинотеатре.

Однако и этот вид статистических данных может искажать действительность. Представьте, что компания проводит опрос, в котором предлагает оценить уровень обслуживания клиентов по 10-бальной шкале от 1 до 10. Даже если десяток будет всего одну на больше, можно смело утверждать, что средняя мода по выборке равна 10.

Как видите, среднестатистические данные могут быть обманчивы. Так что не стоит слепо верить отчетам, результатам опросов и исследований.

Источники: 

Похожие публикации:

Аналитика в быту, или Почему каждый из нас – аналитик

Добавить комментарий

Ваш адрес email не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =