HTTP 404 - HTTP 404

В HTTP 404, 404 Не Найдено, 404, 404 Ошибка, Страница не найдена, Файл не найден, или же Сервер не найден сообщение об ошибке это Протокол передачи гипертекста (HTTP) стандартный код ответа, в компьютерная сеть сообщения, чтобы указать, что браузер смог общаться с данным сервер, но сервер не смог найти то, что было запрошено. Ошибка также может использоваться, когда сервер не желает раскрывать, есть ли у него запрошенная информация.[1]

Сервер, на котором размещен веб-сайт, обычно создает веб-страницу «404 Not Found», когда пользователь пытается подписаться на битая или мертвая ссылка; следовательно, ошибка 404 - одна из самых узнаваемых ошибок, возникающих на Всемирная паутина.

Обзор

При обмене данными через HTTP сервер должен ответить на запрос, например, веб-браузер запрос на страница в Интернете, с числовым кодом ответа и необязательным, обязательным или запрещенным (в зависимости от кода состояния) сообщением. В коде 404 первая цифра указывает на ошибку клиента, например опечатку. Единый указатель ресурсов (URL). Следующие две цифры указывают на конкретную обнаруженную ошибку. Использование трехзначных кодов HTTP аналогично использованию таких кодов в более ранних протоколах, таких как FTP и NNTP. На уровне HTTP за кодом ответа 404 следует удобочитаемая «фраза причины». Спецификация HTTP предлагает фразу «Не найдено»[2] и многие веб-серверы по умолчанию создают HTML-страницу, которая включает в себя как код 404, так и фразу «Not Found».

Ошибка 404 часто возвращается, когда страницы были перемещены или удалены. В первом случае лучше использовать Сопоставление URL или же Перенаправление URL путем возврата ответа 301 Moved Permanently, который можно настроить в большинстве файлов конфигурации сервера, или через Перезапись URL; во втором случае нужно вернуть 410 Gone. Поскольку эти два параметра требуют особой конфигурации сервера, большинство веб-сайтов их не используют.

Ошибки 404 не следует путать с DNS ошибки, которые появляются, когда данный URL ссылается на несуществующее имя сервера. Ошибка 404 означает, что сам сервер был найден, но сервер не смог получить запрошенную страницу.

Мягкие ошибки 404

Некоторые веб-сайты сообщают об ошибке «не найдено», возвращая стандартную веб-страницу с кодом ответа «200 OK», ложно сообщая, что страница загружена правильно; это известно как мягкий 404. Термин «мягкий 404» был введен в 2004 году Зивом Бар-Йосефом. и другие.[3]

Программные сообщения 404 проблематичны для автоматизированных методов определения того, не работает ли ссылка. Некоторые поисковые системы, например Yahoo и Google используйте автоматизированные процессы для обнаружения программных ошибок 404.[4] Программные ошибки 404 могут возникать в результате ошибок конфигурации при использовании определенного программного обеспечения HTTP-сервера, например, с Apache программное обеспечение, когда документ об ошибке 404 (указанный в .htaccess file) указывается как абсолютный путь (например, http://example.com/error.html), а не как относительный путь (/error.html).[5] Это также можно сделать специально, чтобы заставить некоторые браузеры (например, Internet Explorer ) для отображения настраиваемого сообщения об ошибке 404 вместо замены того, что обслуживается, «дружественным» сообщением об ошибке для конкретного браузера (в Internet Explorer это поведение срабатывает, когда обслуживается 404 и полученный HTML-код короче определенной длины, и может быть отключен пользователем вручную).

Существуют также "мягкие 3XX" ошибки, когда контент возвращается со статусом 200, но он поступает с перенаправленной страницы, например, когда отсутствующие страницы перенаправляются на корневую / домашнюю страницу домена.

Прокси-серверы

Немного прокси-серверы генерировать ошибку 404, когда 500-диапазонный код ошибки было бы правильнее. Если прокси-сервер не может удовлетворить запрос страницы из-за проблемы с удаленным хостом (например, сбои при разрешении имени хоста или отказ в TCP-соединениях), это следует описать как внутреннюю ошибку сервера 5xx, но вместо этого может выдать ошибку 404 . Это может сбивать с толку программы, которые ожидают определенных ответов и действуют в соответствии с ними, поскольку они больше не могут легко отличить отсутствующий веб-сервер от отсутствующей веб-страницы на существующем веб-сервере.

Преднамеренные ошибки 404

В июле 2004 г. оператор связи Великобритании BT Group развернул Cleanfeed система блокировки контента, которая возвращает ошибку 404 на любой запрос контента, идентифицированный как потенциально незаконный Internet Watch Foundation.[6] Другие интернет-провайдеры возвращают HTTP 403 «запрещенная» ошибка при тех же обстоятельствах.[7] Практика использования поддельных ошибок 404 как средства сокрытия цензура также сообщалось в Таиланд[8] и Тунис.[9] В Тунисе, где цензура была жесткой до 2011 революция, люди узнали природу фальшивых ошибок 404 и создали воображаемого персонажа по имени "Аммар 404 "кто представляет" невидимого цензора ".[10]

Коды ошибок подсистемы Microsoft Internet Server 404

Программное обеспечение веб-сервера, разработанное Microsoft, Информационные службы Интернета Microsoft (IIS) возвращает набор кодов подстатуса с ответами 404. Коды подстатуса имеют форму десятичных чисел, добавленных к коду состояния 404. Коды субстатусов официально не признаются IANA и не возвращаются серверами сторонних производителей.

Коды подстатуса

Серверы Microsoft IIS 7.0, IIS 7.5 и IIS 8.0 определяют следующие коды подстатуса HTTP, чтобы указать более конкретную причину ошибки 404:

  • 404.0 - Не обнаружено.
  • 404.1 - Сайт не найден.
  • 404.2 – ISAPI или же CGI ограничение.
  • 404.3 – MIME ограничение типа.
  • 404.4 - Обработчик не настроен.
  • 404.5 - Запрещено настройкой фильтрации запросов.
  • 404.6 - Глагол отклонен.
  • 404.7 - Расширение файла запрещено.
  • 404.8 - Скрытое пространство имен.
  • 404.9 - Атрибут файла скрыт.
  • 404.10 - Заголовок запроса слишком длинный.
  • 404.11 - Запрос содержит двойную escape-последовательность.
  • 404.12 - Запрос содержит символы старшего разряда.
  • 404.13 - Слишком большая длина содержимого.
  • 404.14 - URL-адрес запроса слишком длинный.
  • 404.15 - Слишком длинная строка запроса.
  • 404.16 - Запрос DAV отправлен обработчику статического файла.
  • 404.17 - Динамическое содержимое, отображаемое в обработчик статических файлов через сопоставление MIME с подстановочными знаками.
  • 404.18 - последовательность строки запроса отклонена.
  • 404.19 - Запрещено правилом фильтрации.
  • 404.20 - слишком много сегментов URL.

Пользовательские страницы ошибок

Сообщение Викимедиа 404

Веб-серверы обычно может быть настроен для отображения настраиваемой страницы ошибки 404, включая более естественное описание, брендинг родительского сайта, а иногда и карту сайта, форму поиска или виджет на 404 страницы. Фраза уровня протокола, которая скрыта от пользователя, редко изменяется. Internet Explorer тем не менее, пользовательские страницы не будут отображаться, если они не превышают 512 байт, вместо этого будет отображаться «дружественная» страница ошибок.[11] Гугл Хром включены аналогичные функции, где 404 заменяется альтернативными предложениями, сгенерированными алгоритмами Google, если размер страницы меньше 512 байт.[нужна цитата ] Другая проблема заключается в том, что если на странице нет фавикон, и существует отдельная настраиваемая страница 404, при каждом просмотре страницы будет генерироваться дополнительный трафик и увеличенное время загрузки.[12][13]

Многие организации используют страницы с ошибками 404 как возможность добавить юмора к тому, что в противном случае могло бы быть серьезным веб-сайтом. Например, Metro UK показывает белого медведя на скейтборде, а у агентства веб-разработки Left Logic есть простая программа для рисования.[14] Вовремя 2015 всеобщие выборы в Великобритании Все основные политические партии использовали свои страницы 404 для того, чтобы нацелиться на политических оппонентов или продемонстрировать соответствующую политику потенциальным сторонникам.[15] В Европе NotFound проект, созданный несколькими европейскими организациями, включая Пропавшие дети в Европе и Детский фокус, призывает операторов сайтов добавлять фрагмент кода для обслуживания настроенных страниц с ошибками 404[16] которые предоставляют данные о пропавшие дети.[17]

Хотя многие веб-сайты отправляют дополнительную информацию в сообщении об ошибке 404, например ссылку на домашняя страница веб-сайта или окна поиска - некоторые также пытаются найти правильную веб-страницу, которую хотел пользователь. Расширения доступны для некоторых системы управления контентом (CMS) для этого.[18]

Отслеживание ошибок 404

Существует ряд инструментов, которые просматривают веб-сайт в поисках страниц, возвращающих коды статуса 404. Эти инструменты могут быть полезны при поиске ссылок, существующих на определенном веб-сайте. Ограничение этих инструментов заключается в том, что они находят ссылки только на одном конкретном веб-сайте и игнорируют ошибки 404, полученные от ссылок на других веб-сайтах. В результате эти инструменты пропускают 83% из 404 на веб-сайтах.[19] Один из способов обойти это - найти ошибку 404 путем анализа внешних ссылок.[20]

Один из наиболее эффективных способов обнаружения ошибок 404 - использовать Консоль поиска Google, Гугл Аналитика или программное обеспечение для сканирования.

Другой распространенный метод - отслеживание трафика на 404 страницы с помощью анализа файла журнала.[21] Это может быть полезно, чтобы узнать больше о том, что пользователи 404 достигли на сайте. Другой метод отслеживания трафика на 404 страницы - использование инструментов отслеживания трафика на основе JavaScript.[22]

Смотрите также

Рекомендации

  1. ^ «RFC 7231, HTTP / 1.1 Семантика и контент, раздел 6.5.4 404 не найден». ietf.org. Июнь 2014 г.. Получено 13 декабря 2018.
  2. ^ «RFC 7231, HTTP / 1.1 Семантика и контент, раздел 6.5.4 404 не найден». ietf.org. Июнь 2014 г.. Получено 13 декабря 2018.
  3. ^ Зив Бар-Йосеф; Андрей З. Бродер; Рави Кумар; Эндрю Томпкинс (2004). Sic Transit Gloria Telae: на пути к пониманию разложения Интернета. Материалы 13-й Международной конференции по всемирной паутине (WWW). С. 328–337. Дои:10.1145/988672.988716. ISBN  978-1581138443.
  4. ^ "Почему ваш сканер запрашивает странные URL-адреса, которых никогда не было на моем сайте?". Страница справки Yahoo Ysearch. Архивировано из оригинал 15 июля 2014 г.. Получено 4 сентября 2013.
  5. ^ «Прощай, мягкие 404-е». Официальный блог Google. Получено 20 сентября 2008.
  6. ^ «LINX Public Affairs» Cleanfeed: факты ». Publicaffairs.linx.net. 10 сентября 2004 г. Архивировано с оригинал 13 мая 2011 г.. Получено 6 марта 2011.
  7. ^ «ДЕМОН - Ошибка 403». Получено 14 июн 2012.
  8. ^ Самбандаракса, Дон (18 февраля 2009 г.). "Старая поддельная процедура" 404 Not Found "- неработающая ссылка". Почта Бангкока. Получено 12 сентября 2010.
  9. ^ Номан, Хельми (12 сентября 2008 г.). «Тунисский журналист подает в суд на правительственное агентство за блокировку Facebook, заявляет о возмещении ущерба из-за использования сообщения об ошибке 404 вместо 403». Инициатива Open Net. Получено 21 ноября 2010.
  10. ^ «Движение против цензуры в Тунисе: творчество, смелость и надежда!». Global Voices Advocacy. 27 мая 2010 г.. Получено 28 августа 2010.
  11. ^ «Дружественные страницы ошибок HTTP». msdn.com. 18 августа 2010. Архивировано с оригинал 2 декабря 2010 г.. Получено 14 июн 2012.
  12. ^ Хенг, Кристофер (7 сентября 2008 г.). «Что такое Favicon.ico и как создать значок Favicon для вашего веб-сайта». Мастер сайта. Получено 23 февраля 2011.
  13. ^ "Подлый" favicon.ico не найден "Ошибка". Интернет-люди. 3 августа 1999 г.
  14. ^ «От скейтбординга до пропавших без вести детей: сила страницы с ошибкой 404 Not Found». Метро. 6 июня 2011 г.. Получено 16 апреля 2013.
  15. ^ «Политическая война». BBC Newsbeat. 27 апреля 2015 г.. Получено 18 мая 2018.
  16. ^ "Notfound.org". не найден. не найден. Архивировано из оригинал 2 сентября 2014 г.
  17. ^ «Сообщения об отсутствии детей попадают на страницы ошибок 404». Новости BBC. 27 сентября 2012 г.. Получено 20 сентября 2014.
  18. ^ Свенсон, Сахала (19 августа 2008 г.). «Сделайте свои 404 страницы более полезными». Официальный блог Центра веб-мастеров Google. Google, Inc. Получено 28 августа 2009.
  19. ^ «Источники, ведущие к 404-м годам». SpringTrax. Получено 11 февраля 2013.
  20. ^ Кушинг, Энн (2 апреля 2013 г.). «Ориентированный на данные подход к выявлению 404 страниц, которые стоит экономить». Search Engine Land. Получено 7 июн 2013.
  21. ^ «Отслеживание и предотвращение ошибок 404». 404errorpages.com. Получено 7 июн 2013.
  22. ^ «Понять ошибку 404». SpringTrax.com. Получено 7 июн 2013.

внешняя ссылка