Вводящий в заблуждение график - Misleading graph

В статистика, а вводящий в заблуждение график, также известный как искаженный график, это график это искажает данные, составляя неправильное использование статистики и в результате из него может быть сделан неправильный вывод.

Графики могут вводить в заблуждение из-за чрезмерной сложности или плохого построения. Даже если они построены для точного отображения характеристик своих данных, графики могут подвергаться различной интерпретации, или непреднамеренный вид данных может казаться и в конечном итоге быть получен ошибочно.[1]

Вводящие в заблуждение графики могут быть созданы намеренно, чтобы помешать правильной интерпретации данных, или случайно из-за незнания программное обеспечение для построения графиков, неправильное толкование данных или невозможность точной передачи данных. Вводящие в заблуждение графики часто используются в ложная реклама. Одним из первых авторов, написавших о вводящих в заблуждение графах, был Даррелл Хафф, издатель книги 1954 г. Как лгать со статистикой.

Поле визуализация данных описывает способы представления информации, позволяющие избежать создания вводящих в заблуждение графиков.

Вводящие в заблуждение методы графа

Этот [вводящий в заблуждение график] намного эффективнее, однако, поскольку он не содержит прилагательных или наречий, разрушающих иллюзию объективности, никто не может вас повесить.

--Как лгать со статистикой (1954)[2]

Существует множество способов построения обманчивого графа.[3]

Чрезмерное использование

Использование графиков там, где они не нужны, может привести к ненужной путанице / интерпретации.[4] Как правило, чем больше пояснений требуется для графа, тем меньше требуется сам граф.[4] Графики не всегда передают информацию лучше, чем таблицы.[5]

Предвзятая маркировка

Использование предвзятого или загруженные слова в заголовке графика, метках оси или заголовке могут премьер читатель.[4][6]

Изготовленные тенденции

Точно так же попытка провести линии тренда с помощью некоррелированных данных может ввести читателя в заблуждение и заставить поверить в то, что тренд существует там, где его нет. Это может быть как результатом намеренной попытки ввести читателя в заблуждение, так и явлением иллюзорная корреляция.

Круговая диаграмма

  • Сравнение круговых диаграмм разных размеров может ввести в заблуждение, так как люди не могут точно определить сравнительную площадь кругов.[7]
  • Использование тонких срезов, которые трудно различить, может быть трудно интерпретировать.[7]
  • Использование процентов в качестве меток на круговой диаграмме может ввести в заблуждение при небольшом размере выборки.[8]
  • Создание трехмерной круговой диаграммы или добавление наклона затруднит интерпретацию из-за искаженного эффекта перспектива.[9] Круговые диаграммы в виде гистограмм, на которых высота секторов варьируется, могут запутать читателя.[9]

Перспектива среза трехмерной круговой диаграммы

А перспектива (3D) круговая диаграмма используется для придания диаграмме 3D смотрю. Третье измерение, которое часто используется по эстетическим соображениям, не улучшает чтение данных; напротив, эти графики трудно интерпретировать из-за искаженного эффекта перспектива связано с третьим измерением. Использование излишних измерений, не используемых для отображения интересующих данных, не рекомендуется для диаграмм в целом, а не только для круговых диаграмм.[10] На трехмерной круговой диаграмме срезы, расположенные ближе к читателю, кажутся больше, чем срезы сзади, из-за угла, под которым они представлены.[11]. Этот эффект снижает способность читателей оценивать относительную величину каждого кусочек при использовании 3D, чем 2D [12]

Сравнение круговых диаграмм
Вводящая в заблуждение круговая диаграммаОбычная круговая диаграмма
Вводящая в заблуждение круговая диаграмма.pngОбразец круговой диаграммы.png

На вводящей в заблуждение круговой диаграмме элемент C кажется по крайней мере таким же большим, как и элемент A, тогда как на самом деле он меньше половины.

Эдвард Тафте, известный американский статистик, заметил, почему таблицы могут быть предпочтительнее круговых диаграмм в Визуальное отображение количественной информации:[5]

Для многих небольших наборов данных таблицы предпочтительнее графики. Таблица почти всегда лучше, чем тупая круговая диаграмма; Единственное, что хуже круговой диаграммы - это несколько из них, потому что тогда зрителя просят сравнить количества, расположенные в пространственном беспорядке как внутри, так и между пирогами. никогда не следует использовать.

Неправильное масштабирование

При использовании пиктограмм в гистограммах их не следует масштабировать равномерно, поскольку это создает вводящее в заблуждение сравнение.[13] Интерпретируется область пиктограммы, а не только ее высота или ширина.[14] Это приводит к тому, что при масштабировании разница оказывается возведенной в квадрат.[14]

Неправильное масштабирование 2D-пиктограммы на гистограмме
Неправильное масштабированиеОбычныйСравнение
Неправильно масштабированное изображение graph.svgИзображение Graph.svgСравнение правильно и неправильно масштабированного изображения graph.svg

На гистограмме пиктограммы с неправильным масштабом изображение для B фактически в 9 раз больше, чем для A.

Сравнение масштабирования 2D-формы
КвадратКругТреугольник
Коробка scaling.svgКруг scaling.svgТреугольник scaling.svg

Воспринимаемый размер увеличивается при масштабировании.

Эффект неправильного масштабирования пиктограмм дополнительно проиллюстрирован, когда пиктограмма имеет 3 измерения, и в этом случае эффект отображается в кубе.[15]

График, показывающий неправильное масштабирование трехмерных пиктограмм. Svg

График продаж дома (слева) вводит в заблуждение. Похоже, что продажи домов в 2001 году выросли в восемь раз по сравнению с предыдущим годом, тогда как на самом деле они выросли вдвое. Кроме того, не уточняется количество продаж.

Неправильно масштабированная пиктограмма также может указывать на то, что сам предмет изменился в размере.[16]

Вводящий в заблуждениеОбычный
Пиктограмма не выровнена и другого размера.svgПиктограмма с выравниванием и аналогичным размером .svg

Предполагая, что изображения представляют эквивалентные количества, вводящий в заблуждение график создает впечатление, что бананов больше, потому что бананы занимают большую часть площади и находятся дальше всего справа.

Логарифмическое масштабирование

Логарифмические (или логарифмические) шкалы являются допустимым средством представления данных. Но при использовании без четкой маркировки в виде шкалы журнала или при отображении для читателя, незнакомого с ними, они могут вводить в заблуждение. Шкалы журнала помещают значения данных в виде выбранного числа (основание журнала) в определенную степень. Основанием часто является e (2,71828 ...) или 10. Например, шкала журнала может давать высоту 1 для значения 10 в данных и высоту 6 для значения 1000000 (106) в данных. Логарифмические шкалы и варианты обычно используются, например, для индекса вулканической взрывоопасности, шкалы Рихтера для землетрясений, магнитуды звезд и pH кислотных и щелочных растворов. Даже в этих случаях логарифмический масштаб может сделать данные менее заметными для глаза. Часто причиной использования логарифмических шкал является то, что автор графика желает отобразить эффекты совершенно разных масштабов на одной и той же оси. Без шкалы журнала, сравнение таких величин, как 103 против 109 становится визуально непрактичным. График с логарифмической шкалой, которая не была четко обозначена как таковая, или график с логарифмической шкалой, представленный зрителю, не знающему логарифмических шкал, обычно приводит к представлению, при котором значения данных выглядят одинакового размера, пока факт существования самых разных величин. Неправильное использование логарифмической шкалы может привести к тому, что очень разные значения (например, 10 и 10 000) будут выглядеть близко друг к другу (в логарифмической шкале с основанием 10 они будут только 1 и 4). Или же небольшие значения могут казаться отрицательными из-за того, как логарифмические шкалы представляют числа, меньшие, чем основание.

Неправильное использование логарифмических шкал может также привести к тому, что отношения между величинами будут казаться линейными, тогда как эти отношения на самом деле являются экспоненциальными или степенными законами, которые очень быстро растут в сторону более высоких значений. Было заявлено, хотя в основном в юмористической форме, что «все выглядит линейно на бревенчатом участке толстым маркером».

Сравнение линейной и логарифмической шкал для идентичных данных
Линейная шкалаЛогарифмическая шкала
Linear scale.pngЛогарифмическая шкала (2) .png

Оба графика показывают идентичную экспоненциальную функцию от ж(Икс) = 2Икс. На графике слева используется линейная шкала, четко демонстрирующая экспоненциальный тренд. Однако на графике справа используется логарифмическая шкала, которая образует прямую линию. Если бы наблюдатель графика не знал об этом, график мог бы показывать линейный тренд.


Усеченный граф

А усеченный граф (также известный как разорванный граф) имеет y ось, которая не начинается с 0. Эти графики могут создать впечатление важного изменения там, где есть относительно небольшое изменение.

Хотя усеченные графики можно использовать для устранения различий или для экономии места, их использование часто не рекомендуется. Коммерческое программное обеспечение, такое как MS Excel, по умолчанию будет обрезать графики, если все значения находятся в узком диапазоне, как в этом примере. Чтобы показать относительные различия значений во времени, можно использовать индексную диаграмму. Усеченные диаграммы всегда будут визуально искажать лежащие в основе числа. Несколько исследований показали, что даже если люди были правильно проинформированы об усечении оси Y, они все равно переоценили фактические различия, часто значительно.[17]

Усеченная гистограмма
Усеченная гистограммаОбычная гистограмма
Усеченная гистограмма.svgBar graph.svg

Оба этих графика отображают идентичные данные; однако на усеченной гистограмме слева данные появиться чтобы показать существенные различия, тогда как на обычной гистограмме справа эти различия почти не видны.

EU 3.png


Есть несколько способов указать y-осевые разрывы:

Указывая на y-осевой разрыв
Гистограмма break.svgОсь Y break.svg

Оси изменения

Изменение y-ось максимальная
Исходный графикМеньший максимумБольший максимум
Линейный graph1.svgЛинейный graph3.svgЛинейный graph2.svg

Изменение y-axis maximum влияет на вид графика. Более высокий максимум приведет к тому, что график будет иметь меньшую волатильность, меньший рост и менее крутую линию, чем более низкий максимум.

Изменение соотношения размеров графика
Исходный графикПоловина ширины, вдвое больше высотыДвойная ширина, половина высоты
Линейный graph1.svgЛинейный график1-3.svgЛинейный график1-4.svg

Изменение соотношения размеров графика повлияет на его внешний вид.

Без шкалы

Масштаб графика часто используется для преувеличения или минимизации различий.[18][19]

Вводящая в заблуждение гистограмма без шкалы
Меньше разницыБольше разницы
Пример усеченной гистограммы .svg
На гистограмме отсутствует zero1.svg

Отсутствие начального значения для y ось не позволяет понять, усечен ли график. Кроме того, отсутствие отметок не позволяет читателю определить, правильно ли масштабированы столбцы графика. Без шкалы можно легко управлять визуальной разницей между полосами.

Вводящий в заблуждение линейный график без шкалы
ВолатильностьУстойчивый, быстрый ростМедленный рост
Линия без шкалы graph1.svgБез масштабной линии graph2.svgЛиния без шкалы graph3.svg

Хотя все три графика имеют одни и те же данные, и, следовательно, фактические наклон из (Икс, y) данные одинаковы, способ построения данных может изменить внешний вид угла, образованного линией на графике. Это потому, что каждый график имеет разный масштаб по вертикальной оси. Поскольку масштаб не показан, эти графики могут вводить в заблуждение.

Неправильные интервалы или единицы

Интервалы и единицы, используемые в графике, можно изменять, чтобы создать или смягчить выражение изменения.[11]

Пропуск данных

Графики, созданные с пропущенными данными, удаляют информацию, на основании которой можно сделать вывод.

Точечная диаграмма с отсутствующими категориями
Точечная диаграмма с отсутствующими категориямиГрафик регулярного рассеяния
Точечная диаграмма с отсутствующим файлом category.svgДиаграмма рассеяния без пропущенных категорий .svg

На диаграмме рассеяния с отсутствующими категориями слева рост выглядит более линейным с меньшими вариациями.

В финансовых отчетах отрицательная доходность или данные, которые не коррелируют с положительным прогнозом, могут быть исключены для создания более благоприятного визуального впечатления.[20]

3D

Настоятельно не рекомендуется использовать лишнее третье измерение, не содержащее информации, так как оно может запутать читателя.[9]

Сложность

Графики предназначены для облегчения интерпретации статистических данных. Однако графики с чрезмерной сложностью могут запутать данные и затруднить интерпретацию.

Плохая конструкция

Плохо построенные графики могут затруднить распознавание и интерпретацию данных.

Экстраполяция

В свою очередь, вводящие в заблуждение графики могут использоваться для экстраполировать вводящие в заблуждение тенденции.[21]

Измерение искажений

Было разработано несколько методов, позволяющих определить, искажены ли графики, и количественно оценить это искажение.[22][23]

Фактор лжи

где

График с высоким коэффициентом лжи (> 1) преувеличивает изменение данных, которые он представляет, а график с небольшим коэффициентом лжи (> 0, <1) скрывает изменения в данных.[24] Совершенно точный график показал бы коэффициент лжи, равный 1.

Индекс расхождения графика

где

В индекс расхождения графика, также известный как индекс искажения графика (GDI), был первоначально предложен Полом Джоном Стейнбартом в 1998 году. GDI рассчитывается как процентное значение в диапазоне от -100% до положительной бесконечности, при этом ноль процентов указывает на то, что график построен правильно, и все, что выходит за пределы диапазона ± 5%, считается допустимым. искаженный.[22] Исследование использования GDI в качестве меры искажения графики показало, что оно непоследовательно и непостоянно, что затрудняет использование GDI в качестве меры для сравнения.[22]

Соотношение чернил и данных

Соотношение чернил и данных должно быть относительно высоким, иначе диаграмма может содержать ненужную графику.[24]

Плотность данных

Плотность данных должна быть относительно высокой, в противном случае таблица может лучше подходить для отображения данных.[24]

Использование в финансовой и корпоративной отчетности

Графики полезны для обобщения и интерпретации финансовых данных.[25] Графики позволяют видеть тенденции в больших наборах данных, а также позволяют интерпретировать данные неспециалистам.[25][26]

Графики часто используются в корпоративных ежегодные отчеты как форма управление впечатлениями.[27] В США нет необходимости проверять графики, поскольку они подпадают под AU Раздел 550 Прочая информация в документах, содержащих аудированную финансовую отчетность.[27]

В нескольких опубликованных исследованиях рассматривалось использование графиков в корпоративных отчетах для разных корпораций в разных странах и было обнаружено частое использование в этих отчетах неправильного дизайна, избирательности и искажения измерений.[27][28][29][30][31][32][33] Наличие вводящих в заблуждение графиков в годовых отчетах привело к запросам на установление стандартов.[20][34][35][36]

Исследования показали, что, хотя читатели с плохим уровнем понимания финансов имеют больше шансов быть дезинформированными из-за вводящих в заблуждение графиков,[37] могут быть введены в заблуждение даже те, кто разбирается в финансовых вопросах, например кредитные специалисты.[34]

Академия

Восприятие графиков изучается в психофизика, когнитивная психология, и вычислительные видения.[38]

Смотрите также

использованная литература

  1. ^ Кирк, стр. 52
  2. ^ Хафф, стр. 63
  3. ^ Нолан, стр. 49–52.
  4. ^ а б c «Методическое руководство: Анализ данных: отображение данных - обман с помощью графиков» (PDF). Аудиторская служба штата Техас. 4 января 1996 г. Архивировано 02 апреля 2003 г.CS1 maint: BOT: статус исходного URL-адреса неизвестен (ссылка на сайт)
  5. ^ а б Тафт, Эдвард Р. (2006). Визуальное отображение количественной информации (4-й выпуск, 2-е изд.). Чешир, Коннектикут: Graphics Press. п.178. ISBN  9780961392147.
  6. ^ Келлер, стр. 84
  7. ^ а б Whitbread, стр. 150
  8. ^ Содерстрем, Ирина Р. (2008), Вводная статистика уголовного правосудия, Waveland Press, стр. 17, ISBN  9781478610342.
  9. ^ а б c d Whitbread, стр. 151
  10. ^ Немного, Стивен (август 2007 г.). «Прибереги пироги для десерта» (PDF). Информационный бюллетень Visual Business Intelligence. Предел восприятия. Получено 28 июн 2012.
  11. ^ а б Рамси, стр. 156.
  12. ^ Зигрист, Майкл (1996). «Использование или неправильное использование трехмерных графиков для представления низкоразмерных данных». Поведение и информационные технологии. 15 (2): 96–100. Дои:10.1080/014492996120300.
  13. ^ Вайс, стр. 60.
  14. ^ а б Уттс, стр. 146–147.
  15. ^ Херли, стр. 565–566.
  16. ^ Хафф, стр. 72.
  17. ^ Hanel, Paul H.P .; Майо, Грегори Р .; Мэнстед, Энтони С. Р. (2019). «Новый взгляд на данные: сходства между группами людей велики и важны». Журнал личности и социальной психологии. 116 (4): 541–562. Дои:10.1037 / pspi0000154. ЧВК  6428189. PMID  30596430.
  18. ^ Смит, Карл Дж. (1 января 2012 г.). Математика: ее сила и полезность. Cengage Learning. п. 472. ISBN  978-1-111-57742-1. Получено 24 июля 2012.
  19. ^ Мур, Дэвид С .; Нотц, Уильям (9 ноября 2005 г.). Статистика: концепции и противоречия. Макмиллан. С. 189–190. ISBN  978-0-7167-8636-8. Получено 24 июля 2012.
  20. ^ а б Берджесс, Дина Оксендер; Уильям Н. Дилла; Пол Джон Стейнбарт; Тодд М. Шэнк (май 2008 г.). «Имеет ли значение дизайн графика для бухгалтеров и читателей финансовой отчетности?». Журнал исследований бизнеса и экономики. 6 (5). Архивировано из оригинал на 2012-07-09. Получено 2012-07-09.
  21. ^ Смит, Чарльз Хью (29 марта 2011 г.). «Экстраполяция тенденций захватывает, но вводит в заблуждение». Business Insider. Получено 23 сентября 2018.
  22. ^ а б c Mather, Dineli R .; Mather, Paul R .; Рамзи, Алан Л. (июль 2003 г.). «Является ли индекс расхождения графиков (GDI) надежной мерой?». Дои:10.2139 / ssrn.556833.
  23. ^ Мазер, Динели; Мазер, Пол; Рамзи, Алан (1 июня 2005 г.). «Исследование измерения искажений графиков в финансовых отчетах». Бухгалтерский учет и бизнес-исследования. 35 (2): 147–160. Дои:10.1080/00014788.2005.9729670.
  24. ^ а б c Крейвен, Тим (6 ноября 2000 г.). «LIS 504 - Графическое отображение данных». Факультет информации и медиа исследований. Лондон, Онтарио: Университет Западного Онтарио. Получено 9 июля 2012.
  25. ^ а б Фулкерсон, Шерил Линтикум; Маршалл К. Питман; Синтия Фраунфельтер-Лорке (июнь 1999 г.). «Подготовка финансовой графики: принципы повышения эффективности презентаций». Журнал CPA. 69 (6): 28–33.
  26. ^ МакНелис, Л. Кевин (1 июня 2000 г.). «Графики, недостаточно используемый метод представления информации». Национальный общественный бухгалтер. 45 (4): 28–30.(требуется подписка)
  27. ^ а б c Битти, Вивьен; Джонс, Майкл Джон (1 июня 1999 г.). «Финансовые графики: правда и честно?». Австралийский CPA. 69 (5): 42–44.
  28. ^ Битти, Вивьен; Джонс, Майкл Джон (1 сентября 1992 г.). «Использование графиков в годовых отчетах и ​​злоупотребление ими: теоретические основы и эмпирические исследования» (PDF). Бухгалтерский учет и бизнес-исследования. 22 (88): 291–303. Дои:10.1080/00014788.1992.9729446.
  29. ^ Пенроуз, Дж. М. (1 апреля 2008 г.). «Использование графики в годовом отчете: обзор литературы». Журнал делового общения. 45 (2): 158–180. Дои:10.1177/0021943607313990.
  30. ^ Фраунфельтер-Лорке, Синтия; Фулкерсон, К. Л. (1 июля 2001 г.). «Распространенность и качество графики в годовых отчетах: международное сравнение». Журнал делового общения. 38 (3): 337–357. Дои:10.1177/002194360103800308.
  31. ^ Мохд Иса, Росиатима (2006). «Частота и достоверное представление графической информации в корпоративном годовом отчете: исследование малазийских компаний». Технический отчет. Институт исследований, разработок и коммерциализации, Universiti Teknologi MARA. Архивировано из оригинал на 15.08.2016. Также опубликовано как: Мохд Иса, Росиатима (2006). «Графическая информация в корпоративном годовом отчете: обзор мнений пользователей и составителей». Журнал финансовой отчетности и бухгалтерского учета. 4 (1): 39–59. Дои:10.1108/19852510680001583.
  32. ^ Битти, Вивьен; Джонс, Майкл Джон (1 марта 1997 г.). «Сравнительное исследование использования финансовых графиков в корпоративных годовых отчетах крупных компаний США и Великобритании» (PDF). Журнал международного финансового менеджмента и бухгалтерского учета. 8 (1): 33–68. Дои:10.1111 / 1467-646X.00016.
  33. ^ Битти, Вивьен; Джонс, Майкл Джон (2008). «Корпоративная отчетность с использованием графиков: обзор и обобщение». Журнал бухгалтерской литературы. 27: 71–110. ISSN  0737-4607.
  34. ^ а б Кристенсен, Дэвид С .; Альберт Ларкин (весна 1992 г.). «Критерии высоконадежной графики». Журнал управленческих вопросов. Питтсбургский государственный университет. 4 (1): 130–153. JSTOR  40603924.
  35. ^ Икин, Синтия Фейри; Тимоти Луверс; Стивен Уиллер (2009). «Роль аудитора в управлении раскрытием информации: информация, потенциально вводящая в заблуждение, в документах, содержащих проаудированную финансовую отчетность» (PDF). Журнал судебно-медицинской экспертизы и следственного учета. 1 (2). ISSN  2165-3755.
  36. ^ Стейнбарт, П. (сентябрь 1989 г.). «Ответственность аудитора за точность графиков в годовых отчетах: некоторые доказательства необходимости дополнительных указаний». Горизонты бухгалтерского учета: 60–70.
  37. ^ Битти, Вивьен; Джонс, Майкл Джон (2002). «Измерение искажений графиков в корпоративных отчетах: экспериментальное исследование» (PDF). Журнал бухгалтерского учета, аудита и отчетности. 15 (4): 546–564. Дои:10.1108/09513570210440595.
  38. ^ Фрис, Эдвард В. Роберт Б. Миллер (январь 1998 г.). «Создание эффективных графиков» (PDF). Североамериканский актуарный журнал. 2 (2): 53–76. Дои:10.1080/10920277.1998.10595699. Архивировано 16 февраля 2012 года.CS1 maint: BOT: статус исходного URL-адреса неизвестен (ссылка на сайт)

Книги

дальнейшее чтение

внешние ссылки