Связаться
Услуги Кейсы Блог О нас КонтактыСвязаться

robots.txt и sitemap.xml: как настроить для SEO

robots.txt и sitemap.xml для SEO: директивы, ошибки и проверка через вебмастеров.

29 May 2026 7 мин чтения SEO Техническое SEO robots.txt sitemap.xml Индексация

Заказать звонок

Оставьте номер — мы перезвоним

Пожалуйста, укажите номер телефона
Спасибо за заявку!
Мы свяжемся с вами в ближайшее время.

robots.txt и sitemap.xml — два файла, с которых начинается знакомство поискового робота с сайтом. От их правильной настройки зависит, какие страницы попадут в индекс, а какие останутся незамеченными.

Пример содержимого файлов robots.txt и sitemap.xml с пояснениями

Что такое robots.txt

robots.txt — текстовый файл в корне сайта (site.ru/robots.txt), который управляет сканированием. Он работает как указатель для робота: «сюда можно заходить, сюда — нельзя».

Основные директивы

  • User-agent — для какого поискового робота действуют правила
  • Disallow — какие URL запрещены для сканирования
  • Allow — исключение из Disallow
  • Host — зеркало сайта (директива Яндекса)
  • Sitemap — ссылка на карту сайта
  • Clean-param — игнорирование GET-параметров (директива Яндекса)
  • Crawl-delay — задержка между запросами робота

Типовой robots.txt

User-agent: *
Disallow: /admin/
Disallow: /search/
Disallow: /personal/
Disallow: /cart/

Host: https://site.ru
Sitemap: https://site.ru/sitemap.xml

Частые ошибки

  • Disallow: / — закрывает весь сайт от индексации
  • Отсутствие Host для Яндекса — могут возникнуть дубли с www/без www
  • Запрет на CSS и JS — Google может хуже видеть страницу (хотя с 2020 года это менее критично)
  • Пробелы и пустые строки — Яндекс строже читает robots.txt, чем Google

Что такое sitemap.xml

sitemap.xml — карта сайта для поисковых роботов. Она содержит URL всех значимых страниц, даты последнего обновления и приоритеты.

Типовой sitemap.xml

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://site.ru/</loc>
    <lastmod>2026-05-28</lastmod>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://site.ru/services/</loc>
    <lastmod>2026-05-25</lastmod>
    <priority>0.9</priority>
  </url>
</urlset>

Как создать

  • Вручную — для маленьких сайтов
  • Через CMS-плагин (Yoast SEO, Rank Math для WordPress)
  • Динамически — через скрипт или генератор статики
  • Средствами фреймворка — Hugo, Jekyll и другие генерируют автоматически

Индекса sitemap

  • Одна карта — до 50 000 URL или 50 МБ
  • Если больше — разбейте на несколько и создайте индексный файл sitemap_index.xml

Как проверить файлы

  • Яндекс Вебмастер → Индексирование → Проверка robots.txt
  • Google Search Console → Индексация → Карта сайта
  • Прямой доступ: откройте site.ru/robots.txt и site.ru/sitemap.xml в браузере

Коротко о главном

  • robots.txt не гарантирует защиту от индексации — для конфиденциальных страниц используйте noindex
  • sitemap.xml ускоряет обнаружение новых и обновлённых страниц
  • Добавьте карту сайта в Яндекс Вебмастер и Google Search Console
  • Проверяйте robots.txt и sitemap после каждого изменения структуры сайта
  • Не закрывайте CSS и JS от сканирования — это ухудшает понимание страницы роботом

Проверить корректность robots.txt и sitemap можно в рамках технического SEO аудита — мы проанализируем все файлы и исправим ошибки.

Нужен технический аудит сайта? Оставьте заявку через форму обратной связи — проверим индексацию, robots.txt, sitemap и другие критичные параметры.

Часто задаваемые вопросы

Это текстовый файл в корне сайта, который говорит поисковым роботам, какие страницы можно сканировать, а какие — нет. Он не запрещает индексацию напрямую, а управляет доступом к сканированию.

Файл карты сайта в формате XML, который содержит список всех важных страниц сайта с метаданными: дата обновления, приоритет, частота изменений. Помогает поисковикам быстрее находить и переиндексировать контент.

Да. Добавьте строку Sitemap: https://site.ru/sitemap.xml в robots.txt — это стандартный способ сообщить о карте сайта всем поисковым системам. Дополнительно добавьте sitemap в Яндекс Вебмастер и Google Search Console.

Поисковые роботы будут сканировать все доступные страницы. Это не критично, но без robots.txt вы не сможете запретить сканирование технических разделов (админка, поиск, служебные страницы).

Disallow в robots.txt запрещает сканирование, но если на страницу уже ведут внешние ссылки — Google может её проиндексировать. Для гарантированного запрета индексации используйте мета-тег noindex или HTTP-заголовок X-Robots-Tag.

Оставьте заявку

Расскажите о вашем проекте — мы подготовим предложение

Пожалуйста, укажите номер телефона
Спасибо за заявку!
Мы свяжемся с вами в ближайшее время.

Готовы начать?

Напишите нам — обсудим ваш проект без обязательств.

Написать нам