Файл robots.txt играет ключевую роль в управлении индексированием сайта поисковыми системами. В WordPress по умолчанию этот файл генерируется виртуально, и не всегда его удобно или возможно изменить через стандартные средства. В этой статье расскажу, как изменить или создать собственный robots.txt без использования плагинов, а также дам практические примеры, которые помогут настроить правильное поведение поисковых роботов.
Что такое robots.txt и зачем его менять в WordPress
Файл robots.txt — это простой текстовый файл, который размещается в корне сайта и содержит инструкции для поисковых роботов, какие страницы или разделы сайта индексировать нельзя. В WordPress, если физического файла нет, система отдает виртуальный robots.txt с базовыми правилами.
Однако у этого подхода есть ограничения: вы не можете гибко настроить правила, закрыть специфичные разделы, указать карту сайта (sitemap) или изменить поведение для отдельных роботов. Поэтому часто возникает необходимость создать собственный физический robots.txt и управлять им вручную.
Как проверить текущий robots.txt на сайте WordPress
Для начала нужно посмотреть, какой robots.txt отдает ваш сайт. Для этого достаточно открыть в браузере адрес https://ваш_домен/robots.txt. Если вы увидите базовый набор правил, значит виртуальный файл работает. Если получите ошибку 404 — файл отсутствует.
Если у вас есть физический файл robots.txt в корне сайта (например, через FTP или файловый менеджер хостинга), он будет иметь приоритет и отдаваться поисковикам.
Как создать и настроить robots.txt вручную без плагинов
Для создания собственного файла robots.txt выполните следующие шаги:
- Подключитесь к серверу через FTP или воспользуйтесь файловым менеджером в панели хостинга.
- Перейдите в корневую папку сайта WordPress — обычно это
public_htmlилиwww. - Создайте новый текстовый файл с именем
robots.txt. - Заполните его необходимыми правилами.
- Сохраните изменения и проверьте доступность по адресу
https://ваш_домен/robots.txt.
Например, базовый файл может выглядеть так:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://ваш_домен/sitemap.xml
Этот файл запрещает индексацию административной части сайта, но разрешает обработку AJAX-запросов и указывает поисковикам на расположение карты сайта.
Динамическое управление robots.txt через functions.php
Иногда удобно не создавать физический файл, а генерировать robots.txt динамически с помощью кода. Это дает гибкость и позволяет менять правила без доступа к серверу.
В WordPress можно подключиться к хуку do_robots и вывести свой контент. Добавьте в файл functions.php вашей темы следующий код:
function wpdream_custom_robots_txt() {
header('Content-Type: text/plain; charset=utf-8');
echo "User-agent: *\n";
echo "Disallow: /wp-admin/\n";
echo "Allow: /wp-admin/admin-ajax.php\n";
echo "Disallow: /wp-login.php\n";
echo "Sitemap: https://ваш_домен/sitemap.xml\n";
exit; // прервать стандартный вывод
}
add_action('do_robots', 'wpdream_custom_robots_txt');
Этот код полностью заменит содержимое robots.txt на ваше, без создания физического файла. Удобно, если вы хотите быстро менять правила из кода.
Как закрыть от индексации определённые разделы WordPress
В WordPress часто нужно закрыть от индексации:
- Страницы авторов, если у вас один автор.
- Страницы поиска.
- Страницы с параметрами сортировки или пагинацией.
Для этого добавьте в файл robots.txt или в динамическую генерацию следующие строки:
Disallow: /author/
Disallow: /?s=
Disallow: /*?orderby=
Disallow: /*?paged=
Так вы снизите дублирование контента и предотвратите индексацию неважных страниц.
Пример расширенного robots.txt с учётом SEO
Ниже пример файла robots.txt, который подходит для большинства сайтов на WordPress:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-login.php
Disallow: /cart/
Disallow: /checkout/
Disallow: /my-account/
Disallow: /author/
Disallow: /?s=
Disallow: /*?orderby=
Disallow: /*?paged=
Sitemap: https://ваш_домен/sitemap.xml
<В этом примере закрыты стандартные страницы WooCommerce (если используются), страницы входа и поиска, что помогает избежать лишнего индексации и повысить качество SEO.
Как проверить корректность robots.txt и избежать ошибок
После создания или изменения robots.txt важно проверить его корректность:
- Используйте Google Search Console — там есть специальный инструмент проверки файла robots.txt.
- Проверьте отсутствие ошибок синтаксиса, например, лишних символов или пробелов.
- Убедитесь, что нужные страницы не закрыты от индексации.
Ошибки в robots.txt могут привести к ухудшению индексации и падению трафика, поэтому проверка обязательна.
Полезные плагины для управления robots.txt (если всё-таки решите использовать)
Хотя статья про обход плагинов, иногда для удобства можно применить плагины. Рекомендую обратить внимание на:
- Clearfy Pro — в нем есть удобный модуль управления robots.txt, который позволяет быстро настроить правила без кода. Подробнее на wpshop.ru.
- Yoast SEO — популярный SEO-плагин, который позволяет редактировать robots.txt через интерфейс.
Но если у вас есть доступ к серверу, лучше использовать физический файл или динамическую генерацию через код — это надежнее и не зависит от сторонних плагинов.