Пересказ книги «Наглядное отображение количественной информации»: ошибки, форматы графиков
Зачем удалять чернила, что значит «утка» и почему даже информативная карта может врать.


Иллюстрация: Полина Честнова для Skillbox Media

Графическое совершенство — продуманное представление интересных и сложных данных, которые передали ясно и точно.
В книге «Наглядное отображение количественной информации» Тафти показывает, как неправильное измерение данных влияет на восприятие и даёт практические рекомендации дизайнерам.
Издательство — Graphics Press.
Эдвард Тафти — американский статистик и член Американской статистической ассоциации. Один из основоположников информационного дизайна. В своих книгах он рассказывает об удачных инфографиках и аргументированно критикует плохие.
Другие книги Тафти
Наглядное отображение количественной информации: ошибки и форматы графиков | Оформление графиков
В первой части пересказа книги «Наглядное отображение количественной информации» рассказываем на примерах: каких ошибок нельзя допускать в представлении информации и как эффективно использовать списки, таблицы, карты, таймлайны.
Ошибки в графиках
Сознательная ложь
Хотя с конца 1960-х к графическому представлению данных перестали относиться как к украшению, лживые графики по-прежнему существуют. Например, здесь сравнивают суммы за шесть месяцев в 1978 году с суммами за весь год в 1976-м и 1977-м:

На этом графике из отчёта Day Mines нет точки отсчёта, и из-за этого возникает много проблем с правдивой оценкой убыточности. Например, 1973-й начинается с минус 4 200 000, а 1972-й — с минус 4 400 000:

Ошибки измерений
Одномерные данные нельзя сравнивать в двух измерениях. Это слабый и неэффективный метод представления, из-за которого часто возникают ошибки.
Здесь из-за увеличения объёма бочек рост цен за нефть на 454% показали как 4280%:

А это — типичная ошибка в подсчёте инфляции. Стоимость денег одномерна, но на этом графике её показывают сразу в двух измерениях. Если площадь купюры точно отражает её покупательную способность, то доллар 1978 года должен быть примерно в два раза больше, чем на этом графике:

Лишние чернила
Так как любой график должен концентрировать внимание читателя на данных, в нём не должно быть ничего лишнего. Тафти предлагает аналогию с печатными чернилами — когда на печати можно сэкономить и при этом не потерять информативность. Хотя Эдвард имеет в виду физические журналы и газеты, тот же принцип стоит применять и к цифровым графикам.
На этой карте импорта и экспорта Англии и Северной Америки Уильям Плейфэр слишком сконцентрировался на дизайне и в результате — истратил слишком много чернил на то, что не передаёт данные:

А на этом графике импорта и экспорта Дании и Норвегии информативность значительно увеличена, хотя формат данных остался прежним:

На этом графике только почти все чернила используют для чего угодно, но не для передачи данных:

В следующей итерации того же графика соотношение данных и чернил значительно увеличилось:

На этой электроэнцефалограмме ничего нельзя стереть без потери информации. Обратите внимание на шкалу в нижнем блоке, справа внизу:

Мусор графиков (chartjunk)
График не станет привлекательнее и интереснее, если добавить декораций — их Тафти называет «мусором графиков» (chartjunk):
Назначение оформления может быть разным: придать графическому изображению более научный и точный вид, оживить экспозицию, дать дизайнеру возможность проявить свои художественные способности. Независимо от причины, всё это происходит из-за отсутствия данных или избыточных данных.
Эдвард Тафти
Вибрирующие графики с изобилием мусора:

Плохой график, который публиковали в научных журналах. Две задние плоскости выходят на передний план, нижняя плоскость без отметок, а треугольники невозможно сравнить друг с другом.

Изображение: Nicholas T. Kouchoukos, Replacement of the Aortic Root with a Pulmonary Autograft in Children and Young Adults with Aortic-Valve Disease, The New England Journal of Medicine, 1994 / Edward R. Tufte / Graphics Press
Расписание поездов из Парижа в Лион отлично передаёт информацию о времени отправления, следования и прибытия. Пункты прибытия, отправления и остановки расположены по горизонтали. Время поездки обозначено вертикальными линиями — при этом чем они ровнее, тем выше скорость поезда.

Но насыщенная сетка очень сильно мешает восприятию. Её можно ослабить, чтобы сохранить удобство использования и вывести данные на первый план:

Утки
Тафти сравнивает «уток» из информационного дизайна со странными зданиями: когда архитекторы и владельцы земель тратят много денег на искажение формы.
Настало время пересмотреть утверждение Джона Раскина о том, что архитектура — это украшение строительства. Но мы должны помнить о предупреждении Пугина: можно украшать конструкцию, но никогда не создавайте декорации.
Роберт Вентури, Денис Скотт Браун и Стивен Айзенур. Cambridge, revised edition, 1977

Здесь дизайнер использует графику исключительно как декорацию:

Серия странных трёхмерных графиков журнала American Education в 1970-х привела в восторг ценителей графического абсурда. Здесь пять цветов сообщают только о пяти фрагментах данных (разделение в течение каждого года увеличивается на 100%). Возможно, это худший график, который когда-либо печатали.
Эдвард Тафти
Форматы отображения данных
Таблицы и списки
Предложение хорошо подходит только когда вам нужно показать не больше двух чисел. Если их больше, то придётся вдумчиво читать и разбираться. Например:
Почти 53% респондентов из группы А сделали что-то в сравнении с группой Б, где их 46%, а в группе C чуть больше — 57%.
Вместо этого можно сделать список. А ещё — сортировать его не по буквам, а числам, чтобы быстрее сравнивать показатели:
- Группа Б 46%.
- Группа А 53%.
- Группа С 57%.
Для этих же целей можно использовать и таблицу. Но чтобы оправдать такое оформление, данных должно быть гораздо больше. Например, здесь указаны победители и проигравшие в игре с прогнозированием. При этом таблица работает ещё и как график:

Графики
Могут быть более точными и информативными, чем обычные статистические вычисления. Например, в квартете Энскомба все четыре набора данных описываются абсолютно одинаковой линейной моделью.

Но при этом их графики существенно отличаются друг от друга. Благодаря этому видно, что каждый столбец радикально отличается друг от друга:

А в этом примере вы явно сможете увидеть, что точка А сильно отклоняется от остального набора данных. При этом на вертикальной и горизонтальной полосе эта аномалия незаметна:

Но если изначальные данные идиотские, то никакая графика вам не поможет:

Изображение: Edward R. Dewey and Edwin F. Dakin, Cycle: The Science of Prediction, New York, 1947 / Edward R. Tufte / Graphics Press
Карты
Быстро и естественно направляют внимание на изучение данных и могут концентрировать в себе огромное количество данных в относительно небольшом пространстве.
На этих картах — статистика заболеваемости раком среди белых мужчин и женщин в США. Обратите внимание, как быстро вы начали изучать данные, а не отвлекаться на графические решения.

Изображение: Thomas J. Mason, Frank W. McKay, Robert Hoover, William J. Blot, and Joseph F. Fraumeni / Public Health Service, National Institutes of Health, 1975 / Lawrence Fahey and Edward Tufte
Но карты могут неправильно акцентировать внимание на незначительных точках. Здесь выделяют значимость каждого географического района, а не количество людей или смертей от рака. Тафти называет это «хронической проблемой» карт с закрашенными участками.
А ещё Тафти ставит источник и надёжность этих данных под сомнение:
В свидетельстве о смерти указывается причина смерти. Эти отчёты подпадают под влияние диагностической моды среди врачей и коронеров в определённых местах и в определённое время. Это — фальсификация данных, которые описывают и без того неоднозначный вопрос о точном расположении первичного рака в организме.
Эдвард Тафти
Это — точечная карта доктора Джона Сноу, где точками отмечены места смертей от холеры в центре Лондона. Кресты — это водяные насосы, из которых люди пьют воду. Большинство погибших жили на Броад-стрит — Джон это заметил, убрал ручку из водокачки на этой улице и положил конец эпидемии в районе.

На этой карте экспорта французских вин в 1867 году Шарль Минар указал количество и направление для измерения данных:

Временные отрезки
Благодаря единому ритму течения времени, на таймлайнах возникает естественная упорядоченность, которую можно эффективно интерпретировать. Подходит для больших рядов данных с заметной изменчивостью.
В этом графике погоды в Нью-Йорке за 1980 год дневные высокие и низкие температуры сравнивают со средними значениями за длительный период. Динамика также даёт понять, какой погоды ожидать в будущем.

А на этом графике Уильяма Плейфэра сразу три параллельных временных ряда: цены на пшеницу, зарплаты и сроки правления британских монархов с 1565 по 1821 год:

Нарративная графика
Это разновидность временных рядов, на которой изображают не только время, но и изменения в пространстве. Обычно они показывают данные сразу в трёх, четырёх или даже пяти измерениях — и делают это настолько ненавязчиво, что зритель это не осознаёт.
Шарль Джозеф Минар показал судьбу армии Наполена в России на этой карте. Ширина оранжевой линии — численность армии во время наступления на Москву, а чёрной — во время отступления в Польшу. На ней хорошо видно, где и каким образом Наполеон терял своих солдат:

А это — жизненный цикл японского жука:

На этом графике Антонио Габальо — история итальянских почтовых офисов. Количество сберегательных ящиков одномерно, но увеличивается со временем. Благодаря тому, что количество переменных и измерений одинаково, этот график выглядит достоверно. В отличие от странных графиков с нефтью и деньгами.

Абстрактная графика
С развитием инфографик человечеству понадобились более абстрактные способы представления данных, у которых нет прямых аналогий с физическим миром. Когда любую величину можно сравнить с другой, если их измеряли в тех же единицах наблюдения.
На этом графике Уильям Плейфэр изобразил соотношение между численностью населения и налогами в разных странах (круги — их площади). Линии между налогами и населением должны показывать соотношение, но они зависят не только от данных, но и от площади кругов, поэтому неинформативны.

Сравнение исследований взаимосвязи между температурой и теплопроводностью меди. Разные результаты связаны с примесями в исходных образцах:

Саженцы белой сосны, которые посадили на один сезон в песок с разным содержанием кальция:

Общие рекомендации
Тафти предупреждает, что не существует простых и универсальных правил представления данных. Но он предлагает не забывать несколько рекомендаций, которые помогут найти правильное решение:
- правильно подбирайте формат;
- совмещайте слова, цифры и иллюстрации;
- не забывайте про баланс, пропорции, ощущение уместного масштаба;
- показывайте доступную сложность деталей;
- данные можно использовать как способ рассказать историю;
- избегайте оформления без содержания, в том числе chartjunk.
Больше интересного про дизайн в нашем телеграм-канале. Подписывайтесь!
Другие книги для дизайнеров
- «Интерфейс»: основы проектирования удобных систем
- «Психбольница в руках пациентов». Как правильно проектировать интерфейсы
- «Основы стиля в типографике»: текст глазами опытного типографа
- «Типографика»: влияние формы и цвета на буквы
- «Модульные системы в графическом дизайне»: основы швейцарской вёрстки
- «О шрифте»: простые принципы хорошей типографики