Когда визуализация врет…

Визуализация – один из наиболее мощных и удобных инструментов работы с данными. Однако у каждой медали есть две стороны. Это как в фильме «Кукольный дом» Дэвида Соломона:

— Ты поможешь?

— Ну… Я постараюсь не навредить.

Так вот «навредить» при помощи визуализации очень просто, и нам нужно постараться этого не сделать.

Сегодня мы рассмотрим 3 наиболее распространенных случая, когда ошибка в визуализации может ввести всех в заблуждение.

Обрезанная ось ординат

Один из наиболее простых способов исказить данные – «побаловаться» с осью ординат (будь то линейный график или диаграмма рассеяния). В большинстве случаев ось y лежит в пределах от 0 до максимального значения, который охватывает диапазон данных. Тем не менее, иногда мы решаем изменить диапазон, чтобы лучше подчеркнуть различия. Такой «прием» может сыграть против нас.

Давайте посмотрим, как это работает на практике. Ниже изображены два графика, построенных на одинаковых данных, но имеющих разные оси ординат.

На графике слева ось y лежит в диапазоне от 3,140% до 3,154%. На первый взгляд может показаться, что процентные ставки взлетели – в 2012 году они были в разы больше, нежели в 2008-м.

Однако второй график дает более точное представление о положении вещей – так, оказывается, в течение этих лет процентные ставки были неизменны.

Вот реальные примеры усеченных осей ординат:

Кумулятивные графики

Многие специалисты отдают предпочтение кумулятивным графикам, которые демонстрируют, например,  количество пользователей на сайте, доходы компании и т.д. Например, вместо того чтобы представить график квартальной прибыли, они визуализируют текущие доходы компании. Давайте посмотрим, как это выглядит:

Этот график мало, о чем говорит. Он движется вверх, а значит, дела идут хорошо…

Однако вот, что демонстрирует некумулятивный график:

Теперь картинка ясна: доходы компании снижались на протяжении последних 10 лет.  Если внимательно изучить кумулятивный график, можно увидеть, что наклон кривой уменьшается с течением времени, указывая на снижение доходов. Однако не для каждого пользователя это столь же очевидно, как для специалиста. Так что такой график может легко ввести в заблуждение.

Нарушение общепринятых правил

Мы привыкли к тому, что круговые диаграммы представляют части целого, что, к примеру года, обозначаются  по оси абсцисс слева на право. Нарушение этих элементарных правил ведет к тому, что данные будут интерпретированы неверно.

Вот пример круговой диаграммы, представленной Fox Chicago во время праймериз 2012 года в США:

Три части диаграммы не составляют положенных 100%. В этом случае более уместной была бы гистограмма.

Другой пример – визуализация Business Insider, которая демонстрирует совершенно противоположное существующему положение дел:

На первый взгляд кажется, что количество людей, погибших от огнестрельных ранений во Флориде, уменьшилось. При более детальном же изучении видно, что ось ординат перевернута и ее нулевое значение находится не у основания, а вверху.

Из всего этого следует простой вывод: будьте крайне внимательны и осторожны при построении визуализации, а также при интерпретации графиков, созданных вашими же коллегами!

Автор: Лариса Шурига

По материалам: Heap Data Blog

Добавить комментарий

Ваш адрес email не будет опубликован.

закрыть

Поделиться

Отправить на почту
закрыть

Вход

закрыть

Регистрация

+ =