Круговая диаграмма - Pie chart

Круговая диаграмма популяций английский носитель языка

А круговая диаграмма (или круговая диаграмма) представляет собой циркуляр статистический график, который разделен на части, чтобы проиллюстрировать числовые пропорции. На круговой диаграмме длина дуги каждого среза (и, следовательно, его центральный угол и площадь ), является пропорциональный к количеству, которое оно представляет. Хотя он назван из-за его сходства с пирог который был нарезан, существуют варианты его представления. Самая ранняя известная круговая диаграмма обычно приписывается Уильям Плейфэр с Статистический Бревиарий 1801 г.[1][2]

Круговые диаграммы очень широко используются в мире бизнеса и СМИ.[3] Однако их критиковали,[4] и многие специалисты рекомендуют их избегать,[5][6][7][8] указывая на то, что исследования показали, что сложно сравнивать разные разделы данной круговой диаграммы или сравнивать данные на разных круговых диаграммах. Круговые диаграммы в большинстве случаев можно заменить другими графиками, такими как гистограмма, коробчатый сюжет, точечный график, так далее.

История

Самая ранняя известная круговая диаграмма обычно приписывается Уильям Плейфэр с Статистический Бревиарий 1801 г., в котором используются два таких графа.[1][2][9] Playfair представила иллюстрацию, содержащую серию круговых диаграмм. На одной из этих диаграмм были показаны пропорции Турецкая Империя находится в Азия, Европа и Африка до 1789 г. Сначала это изобретение не получило широкого распространения.[1]

Playfair считал, что круговые диаграммы нуждаются в третьем измерении для добавления дополнительной информации.[10]

Было сказано, что Флоренс Найтингейл изобрела круговую диаграмму, хотя на самом деле она просто популяризировала ее, и позже предполагалось, что она ее создала из-за неясности создания Playfair.[11]

Французский инженер Чарльз Джозеф Минар был одним из первых, кто использовал круговые диаграммы в 1858 году. На его карте 1858 года круговые диаграммы использовались для изображения скота, посланного со всех концов. Франция для потребления в Париж.

Варианты и аналогичные схемы

Трехмерная круговая диаграмма и перспективный пирог

Трехмерная круговая диаграмма или круговая диаграмма перспективы используются для придания диаграмме 3D Смотреть. Третье измерение, которое часто используется по эстетическим соображениям, не улучшает чтение данных; напротив, эти графики трудно интерпретировать из-за искаженного эффекта перспектива связано с третьим измерением. Использование излишних измерений, не используемых для отображения интересующих данных, не рекомендуется для диаграмм в целом, а не только для круговых диаграмм.[7][12]

Кольцевая диаграмма

Информация о данных в виде дырки в центре кольцевой диаграммы

Кольцевая диаграмма (также обозначаемая как пончик) - это вариант круговой диаграммы с пустым центром, позволяющий включить дополнительную информацию о данных в целом.[13][14] Кольцевые диаграммы похожи на круговые в том смысле, что их цель - проиллюстрировать пропорции.[нужна цитата ] Этот тип кругового графика может поддерживать несколько статистических данных одновременно и обеспечивает лучшее соотношение интенсивности данных по сравнению со стандартными круговыми диаграммами.[14] Необязательно содержать информацию в центре.

Разнесенная круговая диаграмма

Разнесенная круговая диаграмма для примера данных (см. Ниже) с разнесенной самой большой партийной группой.

Диаграмма с одним или несколькими секторами, отделенными от остальной части диска, называется разнесенная круговая диаграмма. Этот эффект используется либо для выделения сектора, либо для выделения более мелких сегментов диаграммы с небольшими пропорциями.

Диаграмма полярной области

"Схема причин смертности в армии на Востоке"Флоренс Найтингейл.

Диаграмма полярных областей похожа на обычную круговую диаграмму, за исключением того, что секторы имеют равные углы и различаются скорее тем, насколько далеко каждый сектор простирается от центра круга. Диаграмма полярных областей используется для построения циклических явлений (например, подсчета смертей по Например, если нужно построить подсчет смертей в каждом месяце за год, то будет 12 секторов (по одному в месяц), каждый с одинаковым углом 30 градусов каждый. Радиус каждого сектора будет пропорционален квадратному корню из числа смертей за месяц, так что площадь сектора представляет число смертей в месяц. Если число смертей в каждом месяце разделено по причинам смерти, оно можно сделать несколько сравнений на одной диаграмме, как это видно на диаграмме полярных областей, известной, как Флоренс Найтингейл.

Первое известное использование диаграмм полярных областей было Андре-Мишель Герри, который он назвал Courbes Circaires (круговые кривые) в статье 1829 года, показывающие сезонные и суточные изменения направления ветра в течение года, а также число рождений и смертей по часам дня.[15] Леон Лаланн позже использовал полярную диаграмму, чтобы показать частоту направлений ветра вокруг точек компаса в 1843 году. Роза ветров все еще используется метеорологи. Найтингейл опубликовал свою диаграмму роз в 1858 году. Хотя название «coxcomb» стало ассоциироваться с этим типом диаграммы, Найтингейл первоначально использовал этот термин для обозначения публикации, в которой эта диаграмма впервые появилась - привлекающей внимание книги диаграмм и диаграмм. таблицы, а не к этому конкретному типу диаграммы.[16]

Кольцевая диаграмма, диаграмма солнечных лучей и многоуровневая круговая диаграмма

Многоуровневая круговая диаграмма, показывающая использование диска в файловой системе Linux

Кольцевая диаграмма, также известная как солнечные лучи диаграмма или многоуровневая круговая диаграмма, используется для визуализации иерархических данных, изображаемых концентрическими кругами.[17] Круг в центре представляет собой корневой узел, а иерархия движется наружу из центра. Сегмент внутреннего круга имеет иерархическое отношение к тем сегментам внешнего круга, которые лежат в пределах угловой протяженности родительского сегмента.[18]

Шпионская диаграмма

Шпионская диаграмма, сравнивающая количество учеников с расходами на учеников в четырех разных школах

Вариантом полярной диаграммы является шпионская карта, разработанная Дрором Фейтельсоном.[19]При этом обычная круговая диаграмма накладывается на измененную диаграмму с полярными областями, чтобы можно было сравнить два набора связанных данных. Базовая круговая диаграмма представляет первый набор данных обычным образом с разными размерами срезов. Второй набор представлен наложенной диаграммой полярных областей, использующей те же углы, что и у основания, и корректировкой радиусов в соответствии с данными. Например, базовая круговая диаграмма может показывать распределение возрастных и гендерных групп в популяции, а также их представление среди дорожно-транспортных происшествий. Возрастные и гендерные группы, которые особенно подвержены несчастным случаям, выделяются как части, выходящие за пределы исходной круговой диаграммы.

Квадратная диаграмма / Вафельная диаграмма

Квадратная круговая диаграмма (вафельная диаграмма), показывающая, насколько легче отобразить меньшие проценты, чем на круговых диаграммах. В сетке 10x10 каждая ячейка представляет 1%.

Квадратные диаграммы, также называемые вафельными диаграммами, представляют собой форму круговых диаграмм, в которых для представления процентов используются квадраты вместо кружков. Подобно базовым круговым круговым диаграммам, квадратные круговые диаграммы отбирают каждый процент от общих 100%. Обычно это сетки 10x10, где каждая ячейка представляет 1%. Несмотря на название, вместо квадратов можно использовать круги, пиктограммы (например, с изображением людей) и другие формы. Преимущество этого состоит в том, что легче отобразить меньшие проценты, которые трудно увидеть на традиционных круговых диаграммах.[20]

Пример

Круговая диаграмма для примера данных

Следующий пример диаграммы основан на предварительных результатах выборы в Европарламент в 2004 г.. В таблице указано количество мест, выделенных каждой партийной группе, а также выведенный процент от общего количества, которое они составляют. Значения в последнем столбце, производный центральный угол каждого сектора, находят путем умножения процента на 360 °.

ГруппаСиденьяПроцентов (%)Центральный угол (°)
EUL395.319.2
PES20027.398.4
ОДВ425.720.7
EDD152.07.4
ELDR679.233.0
EPP27637.7135.7
UEN273.713.3
Другой669.032.5
Общий73299.9*360.2*

* Из-за округления эти итоги не составляют в сумме 100 и 360.

Размер каждого центрального угла пропорционален размеру соответствующего количества, здесь количество мест. Поскольку сумма центральных углов должна составлять 360 °, центральный угол для величины, являющейся дробной частью Q из общего количества составляет 360Q В этом примере центральный угол для самой большой группы (Европейская народная партия (ЕНП)) составляет 135,7 °, потому что 0,377 умноженное на 360, округленное до одного десятичного знака, равно 135,7.

Использование и эффективность

Трехмерная круговая диаграмма, показывающая процентное содержание компонентов атмосферного воздуха

Недостаток круговых диаграмм заключается в том, что они не могут отображать более нескольких значений без разделения визуального кодирования («срезов») от данных, которые они представляют (обычно в процентах). Когда срезы становятся слишком маленькими, круговые диаграммы должны полагаться на цвета, текстуры или стрелки, чтобы читатель мог их понять. Это делает их непригодными для использования с большими объемами данных. Круговые диаграммы также занимают больше места на странице по сравнению с более гибкими линейчатыми диаграммами, которые не нуждаются в отдельных условных обозначениях и могут отображать другие значения, такие как средние или целевые значения, одновременно.[7]

Статистиков обычно рассматривают круговые диаграммы как плохой метод отображения информации, и они редко встречаются в научной литературе. Одна из причин заключается в том, что сравнивать размер элементов в диаграмме труднее. когда вместо длины используется площадь и когда разные предметы показаны разными формами.[21]

Три набора процентов в виде круговых и столбчатых диаграмм. Как правило, проще сравнивать данные на гистограммах.

Далее, в исследованиях, выполненных на AT&T Bell Laboratories, было показано, что сравнение по углу менее точное, чем сравнение по длине. Это можно проиллюстрировать на соседней диаграмме, на которой показаны три круговые диаграммы, а под каждой из них - соответствующая гистограмма, представляющая те же данные. Большинство испытуемых испытывают трудности с упорядочением срезов на круговой диаграмме по размеру; когда используется гистограмма, сравнение становится намного проще.[22] Точно так же сравнивать наборы данных проще с помощью гистограммы. Однако, если цель состоит в том, чтобы сравнить данную категорию (кусочек круговой диаграммы) с общим количеством (весь круговой круг) на одной диаграмме, а кратность близка к 25 или 50 процентам, то круговая диаграмма часто может быть более эффективной. чем гистограмма.[23][24]

Пример круговой диаграммы с 18 значениями
Пример круговой диаграммы в форме пончика

Пример (слева) представляет собой круговую диаграмму с 18 значениями, данные которой необходимо отделить от представления. Также несколько значений представлены одним и тем же цветом, что затрудняет интерпретацию. Пример (справа) представляет собой круговую диаграмму в форме пончика, показывающую рекорды ударов и пробежек индийского игрока в крикет в тестовых матчах 2019 года.

Несколько исследований, представленных на Европейская конференция по визуализации проанализировали относительную точность нескольких форматов круговых диаграмм,[25][26][20] пришли к выводу, что круговые диаграммы и кольцевые диаграммы дают одинаковые уровни ошибок при их чтении, а квадратные круговые диаграммы обеспечивают наиболее точное чтение.[27]

Рекомендации

  1. ^ а б c Спенс (2005)
  2. ^ а б Tufte, p. 44
  3. ^ Кливленд, стр. 262
  4. ^ Уилкинсон, стр. 23.
  5. ^ Tufte, p. 178.
  6. ^ ван Белль, стр. 160–162.
  7. ^ а б c Стивен Фью. «Пироги для десерта», Август 2007, дата обращения 02.02.2010
  8. ^ Стив Фентон «Плохие круговые диаграммы»
  9. ^ «Вехи в истории тематической картографии, статистической графики и визуализации данных». www.datavis.ca.
  10. ^ Пальский, с. 144–145
  11. ^ Статья Дэйва об этой информации о QI
  12. ^ Гуд и Хардин, глава 8.
  13. ^ Харрис, Роберт Л. (1999). Информационная графика: исчерпывающий иллюстрированный справочник ([Nachdr.] Ред.). Оксфорд: Издательство Оксфордского университета. п. 143. ISBN  9780195135329.
  14. ^ а б "Дизайн данных Юргена Кай-Уве Брока на iBooks". iBooks. Получено 2017-06-10.
  15. ^ Дружелюбный, стр. 509
  16. ^ "Статистические диаграммы Флоренс Найтингейл". Получено 2010-11-22.
  17. ^ «Многоуровневые круговые диаграммы». www.neoformix.com.
  18. ^ Уэббер Ричард, Герберт Рик, Цзянбц Вел. «Методы заполнения пространства в визуализации результатов компьютерных экономических моделей»
  19. ^ "Фейтельсон, Дрор (2003) Сравнение разделов со шпионскими диаграммами" (PDF). 2003. Получено 2010-08-31.
  20. ^ а б Косара, Роберт; Скау, Дрю (2016). «Ошибка суждения в вариациях круговой диаграммы». EuroVis.
  21. ^ Krygier, Джон. «Перцепционное масштабирование символов карты». makemaps.net. Получено 3 мая 2015.
  22. ^ Кливленд, стр. 86–87
  23. ^ Симкин, Д., и Хасти, Р. (1987). Анализ обработки информации графического восприятия. Журнал Американской статистической ассоциации, 82 (398), 454. Дои:10.2307/2289447. Косара, Роберт. «В защиту круговых диаграмм». Получено 13 апреля, 2011.
  24. ^ Спенс, Ян; Левандовски, Стефан (1 января 1991 г.). «Отображение пропорций и процентов». Прикладная когнитивная психология. 5 (1): 61–77. Дои:10.1002 / acp.2350050106.
  25. ^ «Иллюстрированный обзор результатов исследования круговой диаграммы». Eagereyes. 2016-06-28. Получено 2016-11-28.
  26. ^ Скау, Дрю; Косара, Роберт (2016). «Дуги, углы или области: отдельные кодировки данных в круговых и кольцевых диаграммах». EuroVis.
  27. ^ "Повторный анализ исследования (квадратных) круговых диаграмм за 2009 год". Eagereyes. 2016-07-11. Получено 2016-11-28.

дальнейшее чтение

внешняя ссылка