Юзабилити-тестирование - Usability testing

Юзабилити-тестирование это техника, используемая в ориентированный на пользователя интерактивный дизайн оценить продукт, протестировав его на пользователях. Это можно рассматривать как незаменимый удобство использования на практике, поскольку он дает прямую информацию о том, как реальные пользователи используют систему.[1] Он больше связан с интуитивно понятным дизайном продукта и протестирован с пользователями, которые ранее не сталкивались с ним. Такое тестирование имеет первостепенное значение для успеха конечного продукта, поскольку полностью функционирующее приложение, вызывающее замешательство среди пользователей, не просуществует долго.[2] Это контрастирует с проверка удобства использования методы, при которых эксперты используют разные методы для оценки пользовательского интерфейса без участия пользователей.

Юзабилити-тестирование фокусируется на измерении способности созданного человеком продукта соответствовать своему предназначению. Примеры продуктов, которые обычно выигрывают от тестирования юзабилити: еда, потребительские товары, веб-сайты или веб-приложения, компьютерные интерфейсы, документы и устройства. Юзабилити-тестирование измеряет удобство или простоту использования определенного объекта или набора объектов, тогда как общие взаимодействие человека с компьютером исследования пытаются сформулировать универсальные принципы.

Что это не

Просто собрать мнения об объекте или документе - это исследования рынка или же качественное исследование а не юзабилити-тестирование. Тестирование юзабилити обычно включает систематическое наблюдение в контролируемых условиях, чтобы определить, насколько хорошо люди могут использовать продукт.[3] Однако часто качественные исследования и юзабилити-тестирование используются в сочетании, чтобы лучше понять мотивацию / восприятие пользователей в дополнение к их действиям.

Вместо того, чтобы показывать пользователям черновик и спрашивать: «Вы это понимаете?», Юзабилити-тестирование предполагает наблюдение за людьми, пытающимися использовать что-то по прямому назначению. Например, при тестировании инструкций по сборке игрушки испытуемым следует дать инструкции и коробку с деталями, и вместо того, чтобы просить их прокомментировать детали и материалы, их следует попросить собрать игрушку. Формулировка инструкции, качество иллюстраций и дизайн игрушки влияют на процесс сборки.

Методы

Настройка юзабилити-теста требует тщательного создания сценарий, или реалистичная ситуация, когда человек выполняет список задач, используя продукт, проверено пока наблюдатели смотрят и делают записи (динамическая проверка ). Несколько других тест инструменты, такие как скриптовые инструкции, бумажные прототипы, а также анкеты до и после тестирования также используются для сбора отзывов о тестируемом продукте (статическая проверка ). Например, чтобы проверить функцию прикрепления электронное письмо В программе сценарий описал бы ситуацию, когда человеку нужно отправить вложение электронной почты и попросить его или ее выполнить эту задачу. Цель состоит в том, чтобы реалистично наблюдать за тем, как люди функционируют, чтобы разработчики могли определить проблемные области и исправить их. Методы, обычно используемые для сбора данных во время тестирования удобства использования, включают: мысли вслух протокол, совместное открытие обучения и отслеживание глаз.

Тестирование прихожей

Тестирование прихожей, также известный как партизанский юзабилити, - это быстрый и дешевый метод юзабилити-тестирования, при котором людей, например, проходящих в коридоре, просят попробовать использовать продукт или услугу. Это может помочь дизайнерам определить «кирпичные стены», проблемы настолько серьезные, что пользователи просто не могут продвинуться вперед, на ранних этапах разработки нового проекта. Можно использовать кого угодно, кроме дизайнеров проекта и инженеров (они, как правило, выступают в качестве «экспертов-рецензентов», потому что слишком близки к проекту).

Удаленное тестирование юзабилити

В сценарии, когда оценщики удобства использования, разработчики и потенциальные пользователи находятся в разных странах и часовых поясах, проведение традиционной лабораторной оценки удобства использования создает проблемы как с точки зрения затрат, так и с точки зрения логистики. Эти опасения привели к исследованию удаленной оценки юзабилити, когда пользователь и оценщики были разделены во времени и пространстве. Удаленное тестирование, которое облегчает выполнение оценок в контексте других задач и технологий пользователя, может быть синхронным или асинхронным. Первый предполагает индивидуальную связь в реальном времени между оценщиком и пользователем, тогда как второй предполагает, что оценщик и пользователь работают отдельно.[4] Доступны многочисленные инструменты для удовлетворения потребностей обоих этих подходов.

Методологии синхронного тестирования юзабилити включают видеоконференцсвязь или использование инструментов удаленного совместного использования приложений, таких как WebEx. WebEx и GoToMeeting - это наиболее часто используемые технологии для проведения синхронного удаленного теста на удобство использования.[5] Однако синхронному удаленному тестированию может не хватать непосредственности и ощущения «присутствия», необходимых для поддержки процесса совместного тестирования. Более того, управление межличностной динамикой через культурные и языковые барьеры может потребовать подходов, чувствительных к вовлеченным культурам. К другим недостаткам относятся снижение контроля над средой тестирования, а также отвлекающие факторы и прерывания, с которыми сталкиваются участники в своей родной среде.[6] Одним из новейших методов, разработанных для проведения синхронного удаленного тестирования юзабилити, является использование виртуальных миров.[7]

Асинхронные методологии включают автоматический сбор потоков кликов пользователя, пользовательские журналы критических инцидентов, которые происходят при взаимодействии с приложением, и субъективные отзывы пользователей об интерфейсе.[8] Подобно лабораторному исследованию, асинхронный удаленный юзабилити-тест основан на задачах, и платформа позволяет исследователям фиксировать клики и время выполнения задач. Следовательно, для многих крупных компаний это позволяет исследователям лучше понимать намерения посетителей при посещении веб-сайта или мобильного сайта. Кроме того, этот стиль пользовательского тестирования также дает возможность сегментировать отзывы по демографическим, оценочным и поведенческим типам. Тесты проводятся в собственной среде пользователя (а не в лабораторных условиях), помогая в дальнейшем моделировать тестирование реальных сценариев. Этот подход также предоставляет средство для быстрого получения обратной связи от пользователей в удаленных районах с меньшими организационными накладными расходами. В последние годы асинхронное тестирование удобства использования также стало распространенным явлением и позволяет тестировщикам предоставлять отзывы в свободное время и не выходя из собственного дома.

Экспертиза

Экспертная оценка - еще один общий метод юзабилити-тестирования. Как следует из названия, этот метод основан на привлечении экспертов с опытом работы в этой области (возможно, из компаний, специализирующихся на тестировании удобства использования) для оценки удобства использования продукта.

А эвристическая оценка или же юзабилити аудит это оценка интерфейса одним или несколькими экспертами по человеческому фактору. Оценщики измеряют удобство использования, эффективность и результативность интерфейса на основе принципов удобства использования, таких как 10 эвристик удобства использования, первоначально определенных Якоб Нильсен в 1994 г.[9]

Эвристика удобства использования Nielsen, которая продолжает развиваться в ответ на исследования пользователей и появление новых устройств, включает:

  • Видимость состояния системы
  • Соответствие системы и реального мира
  • Пользовательский контроль и свобода
  • Последовательность и стандарты
  • Предотвращение ошибок
  • Признание, а не отзыв
  • Гибкость и эффективность использования
  • Эстетичный и минималистичный дизайн
  • Помогите пользователям распознавать, диагностировать и устранять ошибки
  • Помощь и документация

Автоматическая экспертиза

Подобно обзорам экспертов, автоматические обзоры экспертов обеспечить тестирование удобства использования, но с использованием программ, содержащих правила хорошего дизайна и эвристики. Хотя автоматическая проверка может не предоставить столько подробностей и понимания, сколько отзывы от людей, ее можно завершить более быстро и последовательно. Идея создания суррогатных пользователей для юзабилити-тестирования - амбициозное направление для сообщества искусственного интеллекта.

A / B тестирование

В веб-разработке и маркетинге A / B-тестирование или сплит-тестирование - это экспериментальный подход к веб-дизайну (особенно дизайн пользовательского опыта), который направлен на выявление изменений на веб-страницах, которые увеличивают или максимизируют интересующий результат (например, рейтинг кликов. для баннерной рекламы). Как следует из названия, сравниваются две версии (A и B), которые идентичны, за исключением одного варианта, который может повлиять на поведение пользователя. Версия A может быть той, которая используется в настоящее время, в то время как версия B в некотором отношении модифицирована. Например, на веб-сайте электронной коммерции воронка покупок обычно является хорошим кандидатом для A / B-тестирования, так как даже незначительное улучшение количества отказов может привести к значительному увеличению продаж. Существенные улучшения можно увидеть с помощью элементов тестирования, таких как текст, макеты, изображения и цвета.

Многовариантное тестирование или тестирование корзины аналогично A / B-тестированию, но тестирует более двух версий одновременно.

Количество испытуемых

В начале 1990-х гг. Якоб Нильсен, в то время исследователь Sun Microsystems, популяризировал концепцию использования множества небольших тестов юзабилити - обычно с пятью испытуемыми в каждом - на различных этапах процесса разработки. Его аргумент состоит в том, что, как только выясняется, что двое или трое людей полностью сбиты с толку домашней страницей, мало что можно получить, наблюдая, как все больше людей страдают от одного и того же ошибочного дизайна. «Сложные тесты на удобство использования - пустая трата ресурсов. Наилучшие результаты достигаются при тестировании не более пяти пользователей и выполнении как можно большего количества небольших тестов».[10]

Утверждение «Достаточно пяти пользователей» было позже описано математической моделью.[11] что указывает на долю нерешенных проблем U

где p - вероятность того, что один испытуемый определит конкретную проблему, а n - количество испытуемых (или тестовых сессий). Эта модель отображается как асимптотический график количества реально существующих проблем (см. Рисунок ниже).

Формула Вирзиса.PNG

В более поздних исследованиях утверждение Нильсена было подвергнуто сомнению с использованием обоих эмпирический свидетельство[12] и более продвинутый математические модели.[13] Две ключевые проблемы для этого утверждения:

  1. Поскольку удобство использования связано с конкретным набором пользователей, такой небольшой размер выборки вряд ли будет репрезентативным для всей совокупности, поэтому данные из такой небольшой выборки с большей вероятностью будут отражать группу выборки, чем совокупность, которую они могут представлять.
  2. Не все проблемы с удобством использования одинаково легко обнаружить. Возникают неразрешимые проблемы, которые замедляют общий процесс. В этих условиях ход процесса намного медленнее, чем предсказывает формула Нильсена / Ландауэра.[14]

Стоит отметить, что Nielsen не рекомендует останавливаться после одного теста с пятью пользователями; его точка зрения состоит в том, что тестирование с пятью пользователями, устранение обнаруженных ими проблем, а затем тестирование обновленного сайта с пятью разными пользователями - лучшее использование ограниченных ресурсов, чем выполнение одного теста удобства использования с десятью пользователями. На практике тесты запускаются один или два раза в неделю в течение всего цикла разработки, с участием трех-пяти испытуемых за цикл, а результаты доставляются дизайнерам в течение 24 часов. Таким образом, количество пользователей, фактически протестированных в ходе проекта, может легко достичь от 50 до 100 человек. Исследования показывают, что пользовательское тестирование, проводимое организациями, чаще всего включает набор 5-10 участников.[15].

На ранней стадии, когда пользователи, скорее всего, сразу же столкнутся с проблемами, которые останавливают их на своем пути, в качестве испытуемого можно использовать почти любого человека с нормальным интеллектом. На втором этапе тестировщики набирают испытуемых с широким спектром способностей. Например, в одном исследовании опытные пользователи не выявили проблем с использованием какого-либо дизайна, от первого до последнего, в то время как наивный пользователь и самоидентифицированные опытные пользователи неоднократно терпели неудачу.[16] Позже, когда дизайн станет более гладким, пользователей следует набирать из целевой группы.

Когда метод применяется к достаточному количеству людей в ходе проекта, вышеупомянутые возражения устраняются: размер выборки перестает быть малым и обнаруживаются проблемы удобства использования, которые возникают только у случайных пользователей. Ценность метода заключается в том, что однажды возникшие специфические проблемы проектирования больше никогда не встречаются, потому что они немедленно устраняются, а части, которые кажутся удачными, тестируются снова и снова. Хотя верно, что начальные проблемы в дизайне могут быть протестированы только пятью пользователями, при правильном применении метода части дизайна, которые сработали в этом первоначальном тесте, будут проверены от 50 до 100 человек.

Пример

А 1982 г. Компьютер Apple инструкция для разработчиков, советы по юзабилити-тестированию:[17]

  1. «Выберите целевую аудиторию. Начните проектирование человеческого интерфейса с определения целевой аудитории. Вы пишете для бизнесменов или детей?»
  2. Определите, насколько целевые пользователи знают о компьютерах Apple и предмете программного обеспечения.
  3. Шаги 1 и 2 позволяют разработать пользовательский интерфейс в соответствии с потребностями целевой аудитории. Программное обеспечение для подготовки налогов, написанное для бухгалтеров, может предполагать, что его пользователи ничего не знают о компьютерах, но знают налоговый кодекс, в то время как такое программное обеспечение, написанное для потребителей, может предполагать, что его пользователи ничего не знают о налогах, но знакомы с основами компьютеров Apple.

Apple посоветовала разработчикам: «Вы должны начать тестирование как можно скорее, используя приглашенных друзей, родственников и новых сотрудников»:[17]

Наш метод тестирования следующий. Мы оборудовали комнату с пятью-шестью компьютерными системами. Мы планируем две-три группы по пять-шесть пользователей одновременно, чтобы опробовать системы (часто без их ведома, что мы тестируем именно программное обеспечение, а не систему). У нас в комнате два дизайнера. Немного меньше, и они многое упускают из того, что происходит. Еще больше, и пользователям кажется, что им всегда кто-то дышит в шею.

Дизайнеры должны лично наблюдать, как люди используют программу, потому что[17]

Девяносто пять процентов камней преткновения можно найти, наблюдая за языком тела пользователей. Обратите внимание на прищуренные глаза, сутулые плечи, трясущиеся головы и глубокие задушевные вздохи. Когда пользователь сталкивается с препятствием, он будет считать, что это «из-за того, что он не слишком сообразителен»: он не будет сообщать об этом; он это скроет ... Не делайте предположений, почему пользователь запутался. Спроси его. Вы часто будете удивлены, узнав, что, по мнению пользователя, программа делала в то время, когда он заблудился.

Образование

Юзабилити-тестирование было официальным предметом академических инструкций по различным дисциплинам.[18]

Смотрите также

Рекомендации

  1. ^ Нильсен, Дж. (1994). Юзабилити-инженерия, Academic Press Inc., стр. 165
  2. ^ Мейс, Моника (27.06.2019). «Юзабилити-тестирование: ключ к проверке дизайна». Команда Mood Up - программный дом. Получено 2019-09-11.
  3. ^ Деннис Дж. Йерц (19 июля 2000 г.). «Юзабилити-тестирование: что это такое?». Журнал грамотности Джерца. Получено 29 июня, 2016.
  4. ^ Андреасен, Мортен Зикер; Нильсен, Хенрик Виллеманн; Шредер, Саймон Ормхольт; Stage, январь (2007). Что случилось с удаленным юзабилити-тестированием?. Материалы конференции SIGCHI по человеческому фактору в вычислительных системах - CHI '07. п. 1405. Дои:10.1145/1240624.1240838. ISBN  9781595935939. S2CID  12388042.
  5. ^ Дабни Гоф; Холли Филлипс (2003-06-09). «Удаленное онлайн-тестирование юзабилити: зачем, как и когда его использовать». Архивировано из оригинал 15 декабря 2005 г.
  6. ^ Дрей, Сьюзен; Сигел, Дэвид (март 2004 г.). «Удаленные возможности ?: международное юзабилити-тестирование на расстоянии». Взаимодействия. 11 (2): 10–17. Дои:10.1145/971258.971264. S2CID  682010.
  7. ^ Чалил Мадатил, Капил; Джоэл С. Гринштейн (май 2011 г.). Синхронное удаленное юзабилити-тестирование: новый подход, основанный на виртуальных мирах. Труды Ежегодной конференции по человеческому фактору в вычислительных системах 2011 г.. ЧИ '11. С. 2225–2234. Дои:10.1145/1978942.1979267. ISBN  9781450302289. S2CID  14077658.
  8. ^ Дрей, Сьюзен; Сигел, Дэвид (2004). «Далекие возможности?». Взаимодействия. 11 (2): 10. Дои:10.1145/971258.971264. S2CID  682010.
  9. ^ «Эвристическая оценка». Юзабилити прежде всего. Получено 9 апреля, 2013.
  10. ^ «Юзабилити-тестирование с 5 пользователями (ящик предупреждений Якоба Нильсена)». useit.com. 2000-03-13.; Рекомендации Якоб Нильсен; Томас К. Ландауэр (апрель 1993 г.). «Математическая модель нахождения проблем юзабилити». Материалы конференции ACM INTERCHI'93 (Амстердам, Нидерланды, 24–29 апреля 1993 г.).
  11. ^ Вирци, Р. А. (1992). «Уточнение тестовой фазы оценки юзабилити: сколько предметов достаточно?». Человеческие факторы. 34 (4): 457–468. Дои:10.1177/001872089203400407. S2CID  59748299.
  12. ^ «Тестирование веб-сайтов: пяти пользователей недостаточно - Semantic Scholar». semanticscholar.org. 2001. Дои:10.1145/634067.634236. S2CID  8038786.
  13. ^ Колтон, Д. А. (2001). «Ослабление предположения об однородности при тестировании удобства использования». Поведение и информационные технологии. 20 (1): 1–7. Дои:10.1080/01449290010020648. S2CID  62751921.
  14. ^ Шметтов, Неоднородность в процессе оценки юзабилити. В: M. England, D. & Beale, R. (ed.), Proceedings of the HCI 2008, British Computing Society, 2008, 1, 89-98.
  15. ^ «Результаты отраслевого отчета по пользовательскому тестированию за 2020 год». www.userfountain.com. Получено 2020-06-04.
  16. ^ Брюс Тоньяццини. «Увеличение окна».
  17. ^ а б c Мейерс, Джо; Тоньяццини, Брюс (1982). Рекомендации по дизайну Apple IIe (PDF). Компьютер Apple. С. 11–13, 15.
  18. ^ Бреуч, Ли-Энн; Марк Закри; Клей Спинуцци (апрель 2001 г.). «Инструкция по удобству использования в программах технической коммуникации». Журнал деловых и технических коммуникаций. 15 (2): 223–240. Дои:10.1177/105065190101500204. S2CID  61365767.

внешняя ссылка