Ошибка 404

Дата публикации: 09.06.2013 13:17:53

Ошибка 404 сообщает поисковому роботу о том, что страница не существует либо была удалена, следовательно, индексировать ее нельзя.

Любой сайт должен иметь собственную страницу 404 ошибки. Если страница сообщает об ошибке и при этом выдает код 200 OK, то она будет проиндексирована; если же сервер вернет HTTP-код 404, это сообщение об ошибке проиндексировано не будет.

Если при вводе в строку поиска браузера какого-либо заведомо неверного адреса страницы (например,http://www.rookee.ru/page/22.aspx) появляется страница с сообщением об ошибке (например, «Запрашиваемая

страница отсутствует на сервере»), значит, обработка 404 ошибки присутствует. Однако в этом случае следует также смотреть на ответ сервера.

Зачастую на сайте может присутствовать надпись об ошибке для посетителей, а на самом деле сервером может отдаваться код 200 OK.

Примечание: одной из ошибок, влекущей за собой невозможность индексации страниц роботами поисковых систем, является неправильная обработка 404 ошибки: ответ с каким-либо заголовком, помимо 404 Not Found, при запросе явно несуществующей страницы

Способ проверки:

    1. Возьмем сайт поисковой системы Яндекс (http://www.yandex.ru/). Для проверки правильности обработки 404 ошибки на сайте по-пробуем загрузить в окно браузера страницу http://yandex.ru/exampage/ (или любую другую несуществующую страницу, где вместо exampage/ – произвольный набор символов). В результате мы получим страницу с заголовком 404, т.е. обработка 404 ошибки на сайте присутствует.

    2. Также анализ можно провести с помощью формы добавления сайта в Яндекс (http://webmaster.yandex.ru/addurl.xml). В поле «URL» требуется ввести несуществующий адрес (например, http://www.yandex.ru/exampage/), а в поле «Защита от автоматических регистраций» – код, изображённый на картинке справа. Если на анализируемом сайте осуществляется корректная обработка 404 ошибки, то при добавлении сайта будет выдано сообщение «Сервер возвращает код статуса HTTP 404».

Как настроить:

Если сайт работает на Apache, то необходимо добавить в верхнюю часть файла .htaccess следующие строки:

    • ErrorDocument 404 /404.html — если 404 страница находится в корне сайта;

    • ErrorDocument 404 http://www.site.ru/404/— если 404 страница находится не в корне сайта.

Если сервер работает на ngnix, то нужно добавить в файл nginx.conf следующий код:

    • error_page 404 /404.html;

    • error_page 404 http://www.site.ru/404/.