Скидки до 50% и курс в подарок : : Выбрать курс
Дизайн
#статьи

Пересказ книги «Наглядное отображение количественной информации»: ошибки, форматы графиков

Зачем удалять чернила, что значит «утка» и почему даже информативная карта может врать.

Иллюстрация: Полина Честнова для Skillbox Media

Графическое совершенство — продуманное представление интересных и сложных данных, которые передали ясно и точно.

В книге «Наглядное отображение количественной информации» Тафти показывает, как неправильное измерение данных влияет на восприятие и даёт практические рекомендации дизайнерам.

Издательство — Graphics Press.

Эдвард Тафти — американский статистик и член Американской статистической ассоциации. Один из основоположников информационного дизайна. В своих книгах он рассказывает об удачных инфографиках и аргументированно критикует плохие.

Другие книги Тафти

Представление информации 

Наглядное отображение количественной информации: ошибки и форматы графиков | Оформление графиков

В первой части пересказа книги «Наглядное отображение количественной информации» рассказываем на примерах: каких ошибок нельзя допускать в представлении информации и как эффективно использовать списки, таблицы, карты, таймлайны.

Ошибки в графиках


Сознательная ложь

Хотя с конца 1960-х к графическому представлению данных перестали относиться как к украшению, лживые графики по-прежнему существуют. Например, здесь сравнивают суммы за шесть месяцев в 1978 году с суммами за весь год в 1976-м и 1977-м:

Изображение: The New York Times, 1978 / The American Statistician, May 1984, Vol. 38, No. 2 / Edward R. Tufte

На этом графике из отчёта Day Mines нет точки отсчёта, и из-за этого возникает много проблем с правдивой оценкой убыточности. Например, 1973-й начинается с минус 4 200 000, а 1972-й — с минус 4 400 000:

Изображение: Day Mines, Inc. 1974 Annual Report / Edward R. Tufte

Ошибки измерений

Одномерные данные нельзя сравнивать в двух измерениях. Это слабый и неэффективный метод представления, из-за которого часто возникают ошибки.

Здесь из-за увеличения объёма бочек рост цен за нефть на 454% показали как 4280%:

Изображение: Time, April 9, 1979 / Edward R. Tufte

А это — типичная ошибка в подсчёте инфляции. Стоимость денег одномерна, но на этом графике её показывают сразу в двух измерениях. Если площадь купюры точно отражает её покупательную способность, то доллар 1978 года должен быть примерно в два раза больше, чем на этом графике:

Изображение: Washington Post, 1978 / Edward R. Tufte

Лишние чернила

Так как любой график должен концентрировать внимание читателя на данных, в нём не должно быть ничего лишнего. Тафти предлагает аналогию с печатными чернилами — когда на печати можно сэкономить и при этом не потерять информативность. Хотя Эдвард имеет в виду физические журналы и газеты, тот же принцип стоит применять и к цифровым графикам.

На этой карте импорта и экспорта Англии и Северной Америки Уильям Плейфэр слишком сконцентрировался на дизайне и в результате — истратил слишком много чернил на то, что не передаёт данные:

Изображение: William Playfair / The Commercial and Political Atlas, 1786, 3th edition 1801 / Edward R. Tufte

А на этом графике импорта и экспорта Дании и Норвегии информативность значительно увеличена, хотя формат данных остался прежним:

Изображение: William Playfair / Edward R. Tufte

На этом графике только почти все чернила используют для чего угодно, но не для передачи данных:

Изображение: Stanley Kelley, Jr., Richard E. Ayres, William G. Bowen, Registration and Voting: Putting First Things First, American Political Science Review, 61 (1967) / Edward R. Tufte / Graphics Press

В следующей итерации того же графика соотношение данных и чернил значительно увеличилось:

Изображение: Stanley Kelley, Jr., Richard E. Ayres, William G. Bowen, Registration and Voting: Putting First Things First, American Political Science Review, 61 (1967) / Edward R. Tufte / Graphics Press

На этой электроэнцефалограмме ничего нельзя стереть без потери информации. Обратите внимание на шкалу в нижнем блоке, справа внизу:

Изображение: Kenneth A. Kooi, Fundamentals of Electroencephalography, Harper and Row, New York, 1971 / Edward R. Tufte / Graphics Press

Мусор графиков (chartjunk)

График не станет привлекательнее и интереснее, если добавить декораций — их Тафти называет «мусором графиков» (chartjunk):

Назначение оформления может быть разным: придать графическому изображению более научный и точный вид, оживить экспозицию, дать дизайнеру возможность проявить свои художественные способности. Независимо от причины, всё это происходит из-за отсутствия данных или избыточных данных.

Эдвард Тафти

Вибрирующие графики с изобилием мусора:

Изображение: Instituto de Expansão Commercial, Brasil: Graphicos Economicos–Estatisticas, Rio de Janeiro, 1929, p. 15. / Edward R. Tufte / Graphics Press

Плохой график, который публиковали в научных журналах. Две задние плоскости выходят на передний план, нижняя плоскость без отметок, а треугольники невозможно сравнить друг с другом.

График оценки тяжести регургитации в лёгких у 31 пациента. Оценки тяжести: 0 ― нет, 0,5 ― незначительная, от 1 до 1,5 ― лёгкая, 2 ― умеренная, 3 ― тяжёлая
Изображение: Nicholas T. Kouchoukos, Replacement of the Aortic Root with a Pulmonary Autograft in Children and Young Adults with Aortic-Valve Disease, The New England Journal of Medicine, 1994 / Edward R. Tufte / Graphics Press

Расписание поездов из Парижа в Лион отлично передаёт информацию о времени отправления, следования и прибытия. Пункты прибытия, отправления и остановки расположены по горизонтали. Время поездки обозначено вертикальными линиями — при этом чем они ровнее, тем выше скорость поезда.

Изображение: Étienne-Jules Marey, La Méthode Graphique Dans les Sciences Expérimentales et Principalement en Physiologie et en Médecine / Edward R. Tufte / Graphics Press LLC

Но насыщенная сетка очень сильно мешает восприятию. Её можно ослабить, чтобы сохранить удобство использования и вывести данные на первый план:

Изображение: Étienne-Jules Marey, La Méthode Graphique Dans les Sciences Expérimentales et Principalement en Physiologie et en Médecine / Edward R. Tufte / Graphics Press LLC

Утки

Тафти сравнивает «уток» из информационного дизайна со странными зданиями: когда архитекторы и владельцы земель тратят много денег на искажение формы.

Настало время пересмотреть утверждение Джона Раскина о том, что архитектура — это украшение строительства. Но мы должны помнить о предупреждении Пугина: можно украшать конструкцию, но никогда не создавайте декорации.

Роберт Вентури, Денис Скотт Браун и Стивен Айзенур. Cambridge, revised edition, 1977

Фото: Edward R. Tufte / Graphics Press LLC

Здесь дизайнер использует графику исключительно как декорацию:

Изображение: American Education, 1970s / Edward R. Tufte / Graphics Press LLC

Серия странных трёхмерных графиков журнала American Education в 1970-х привела в восторг ценителей графического абсурда. Здесь пять цветов сообщают только о пяти фрагментах данных (разделение в течение каждого года увеличивается на 100%). Возможно, это худший график, который когда-либо печатали.

Эдвард Тафти

Форматы отображения данных


Таблицы и списки

Предложение хорошо подходит только когда вам нужно показать не больше двух чисел. Если их больше, то придётся вдумчиво читать и разбираться. Например:

Почти 53% респондентов из группы А сделали что-то в сравнении с группой Б, где их 46%, а в группе C чуть больше — 57%.

Вместо этого можно сделать список. А ещё — сортировать его не по буквам, а числам, чтобы быстрее сравнивать показатели:

  • Группа Б 46%.
  • Группа А 53%.
  • Группа С 57%.

Для этих же целей можно использовать и таблицу. Но чтобы оправдать такое оформление, данных должно быть гораздо больше. Например, здесь указаны победители и проигравшие в игре с прогнозированием. При этом таблица работает ещё и как график:

Изображение: New York Times, January 2, 1979 / Edward R. Tufte / Graphics Press LLC

Графики

Могут быть более точными и информативными, чем обычные статистические вычисления. Например, в квартете Энскомба все четыре набора данных описываются абсолютно одинаковой линейной моделью.

Изображение: Edward R. Tufte / Graphics Press

Но при этом их графики существенно отличаются друг от друга. Благодаря этому видно, что каждый столбец радикально отличается друг от друга:

Изображение: F.J. Anscombe, Graphs in Statistical Analysis, American Statistician, 1973 / Edward R. Tufte / Graphics Press

А в этом примере вы явно сможете увидеть, что точка А сильно отклоняется от остального набора данных. При этом на вертикальной и горизонтальной полосе эта аномалия незаметна:

Изображение: Edward R. Tufte / Graphics Press

Но если изначальные данные идиотские, то никакая графика вам не поможет:

А ― цены на акции нью-йоркской биржи, B ― солнечная радиация, C ― цены лондонской биржи. 1929 год (по Гарсии-Мате и Шаффнеру)
Изображение: Edward R. Dewey and Edwin F. Dakin, Cycle: The Science of Prediction, New York, 1947 / Edward R. Tufte / Graphics Press

Карты

Быстро и естественно направляют внимание на изучение данных и могут концентрировать в себе огромное количество данных в относительно небольшом пространстве.

На этих картах — статистика заболеваемости раком среди белых мужчин и женщин в США. Обратите внимание, как быстро вы начали изучать данные, а не отвлекаться на графические решения.

Уровни заболеваемости раком среди белых женщин и мужчин в США. 1950–1969
Изображение: Thomas J. Mason, Frank W. McKay, Robert Hoover, William J. Blot, and Joseph F. Fraumeni / Public Health Service, National Institutes of Health, 1975 / Lawrence Fahey and Edward Tufte

Но карты могут неправильно акцентировать внимание на незначительных точках. Здесь выделяют значимость каждого географического района, а не количество людей или смертей от рака. Тафти называет это «хронической проблемой» карт с закрашенными участками.

А ещё Тафти ставит источник и надёжность этих данных под сомнение:

В свидетельстве о смерти указывается причина смерти. Эти отчёты подпадают под влияние диагностической моды среди врачей и коронеров в определённых местах и в определённое время. Это — фальсификация данных, которые описывают и без того неоднозначный вопрос о точном расположении первичного рака в организме.

Эдвард Тафти

Это — точечная карта доктора Джона Сноу, где точками отмечены места смертей от холеры в центре Лондона. Кресты — это водяные насосы, из которых люди пьют воду. Большинство погибших жили на Броад-стрит — Джон это заметил, убрал ручку из водокачки на этой улице и положил конец эпидемии в районе.

Изображение: E.W. Gilbert, Pioneer Maps of Health and Disease in England, Geographical Journal, 1958 / Edward R. Tufte / Graphics Press

На этой карте экспорта французских вин в 1867 году Шарль Минар указал количество и направление для измерения данных:

Изображение: Charles Minard

Временные отрезки

Благодаря единому ритму течения времени, на таймлайнах возникает естественная упорядоченность, которую можно эффективно интерпретировать. Подходит для больших рядов данных с заметной изменчивостью.

В этом графике погоды в Нью-Йорке за 1980 год дневные высокие и низкие температуры сравнивают со средними значениями за длительный период. Динамика также даёт понять, какой погоды ожидать в будущем.

Изображение: The New York Times / Edward R. Tufte / Graphics Press

А на этом графике Уильяма Плейфэра сразу три параллельных временных ряда: цены на пшеницу, зарплаты и сроки правления британских монархов с 1565 по 1821 год:

Изображение: William Playfair

Нарративная графика

Это разновидность временных рядов, на которой изображают не только время, но и изменения в пространстве. Обычно они показывают данные сразу в трёх, четырёх или даже пяти измерениях — и делают это настолько ненавязчиво, что зритель это не осознаёт.

Шарль Джозеф Минар показал судьбу армии Наполена в России на этой карте. Ширина оранжевой линии — численность армии во время наступления на Москву, а чёрной — во время отступления в Польшу. На ней хорошо видно, где и каким образом Наполеон терял своих солдат:

Изображение: Charles Minard

А это — жизненный цикл японского жука:

Изображение: Leonard Hugh Newman / Man and Insects, Aldus Books, 1965 / Edward R. Tufte / Graphics Press

На этом графике Антонио Габальо — история итальянских почтовых офисов. Количество сберегательных ящиков одномерно, но увеличивается со временем. Благодаря тому, что количество переменных и измерений одинаково, этот график выглядит достоверно. В отличие от странных графиков с нефтью и деньгами.

Изображение: Antonio Gabaglio, Teoria Generale Della Statistica, Milan, 1888 / Edward R. Tufte / Graphics Press

Абстрактная графика

С развитием инфографик человечеству понадобились более абстрактные способы представления данных, у которых нет прямых аналогий с физическим миром. Когда любую величину можно сравнить с другой, если их измеряли в тех же единицах наблюдения.

На этом графике Уильям Плейфэр изобразил соотношение между численностью населения и налогами в разных странах (круги — их площади). Линии между налогами и населением должны показывать соотношение, но они зависят не только от данных, но и от площади кругов, поэтому неинформативны.

Изображение: William Playfair, Statistical Breviary, 1801 / Edward R. Tufte / Graphics Press

Сравнение исследований взаимосвязи между температурой и теплопроводностью меди. Разные результаты связаны с примесями в исходных образцах:

Изображение: C.Y. Ho, R.W. Powell, P.E. Liley / Journal of Physical and Chemical Reference Data 3, American Chemical Society, 1974 / Edward R. Tufte / Graphics Press

Саженцы белой сосны, которые посадили на один сезон в песок с разным содержанием кальция:

Изображение: H. L. Mitchell, The Growth and Nutrition of White Pine Seedlings in Cultures with Varying Nitrogen, Phosphorus, Potassium and Calcium, The Black Rock Forest Bulletin No. 9 / Maria Moors Cabot Foundation for Botanical Research / Harvard University, 1939 / Edward R. Tufte / Graphics Press

Общие рекомендации

Тафти предупреждает, что не существует простых и универсальных правил представления данных. Но он предлагает не забывать несколько рекомендаций, которые помогут найти правильное решение:

  • правильно подбирайте формат;
  • совмещайте слова, цифры и иллюстрации;
  • не забывайте про баланс, пропорции, ощущение уместного масштаба;
  • показывайте доступную сложность деталей;
  • данные можно использовать как способ рассказать историю;
  • избегайте оформления без содержания, в том числе chartjunk.

Больше интересного про дизайн в нашем телеграм-канале. Подписывайтесь!

Научитесь: Профессия UX/UI-дизайнер Узнать больше
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована