что такое sitemap xml

Инструкция по работе с sitemap.xml

что такое sitemap xml. Смотреть фото что такое sitemap xml. Смотреть картинку что такое sitemap xml. Картинка про что такое sitemap xml. Фото что такое sitemap xml

Для того, чтобы страницы сайта и их содержимое начали ранжироваться — отображаться по запросам пользователей, их должен проиндексировать робот поисковой системы. Когда у ресурса есть карта сайта, Google проще обнаружить адреса страниц.

Из статьи вы узнаете

Что такое карта сайта

Карта сайта или sitemap — это файл, содержащий список URL всех страниц ресурса, которые нужно проиндексировать. Он размещен в корневой папке и в большинстве случаев называется sitemap.xml.

Структура сайта напоминает структуру книги с разделами, подразделами и страницами. Когда читателю нужно что-то найти в учебнике или энциклопедии, он сначала смотрит содержание и находит нужную страницу. Файл sitemap XML выполняет роль содержания на сайте, помогая поисковым роботам обнаружить страницы.

Как посмотреть карту сайта

Содержимое карты сайта доступно не только роботам, но и посетителям сайта. Поскольку список URL обычно размещают в папке с серверными файлами, адрес sitemap состоит из двух элементов — имени сайта и названия карты.

Как посмотреть карту чужого сайта? Возьмем для примера сайт компании Apple и добавим к доменному имени в адресной строке /sitemap.xml.

Для чего используют карту сайта

Основная роль sitemap — это навигация робота и направление его к важным URL, чтобы они попали в индекс поисковика.

Важно учесть, что наличие карты не гарантирует индексацию страниц. Также поисковики могут находить URL без карты, например, если на него ведет ссылка с другой веб-страницы. В то же время, Google рекомендует добавлять на сайт список адресов для индексирования.

Как и инструкция по сканированию страниц для роботов — robots.txt, карта сайта — важный атрибут оптимизации. Проверить правильность настроек sitemap можно в инструментах от поисковых систем, на сайтах-валидаторах и на платформах, которые анализируют SEO сайта онлайн.

Когда полезна карта сайта:

Представим себе крупный интернет-магазин или другой многостраничный сайт. При большом количестве страниц робот может пропустить какие-то из них. Карта сайта повышает вероятность попадания важных URL в индекс и, как следствие, появления их в результатах выдачи.

Чтобы новый ресурс начал ранжироваться, нужно помочь поисковику обнаружить его страницы. Если упоминаний URL нет на других страницах в интернете, роботу будет сложнее найти этот URL и проиндексировать.

Создание карты сайта и информирование краулеров о ее наличии ускорит индексацию страниц и их отображение по поисковым запросам.

Для сайта, который уже в индексе, тоже может быть актуально ускорение индексации страниц. Например, новостные и развлекательные порталы постоянно добавляют новые статьи и заинтересованы в том, чтобы пользователи быстрее находили свежие материалы в выдаче.

Также в карте может быть указана дата последнего обновления страницы или периодичность, с которой она обновляется. Таким образом роботы получают информацию, когда нужно повторно индексировать URL.

Как правило, страницы внутри сайта связаны друг с другом. Например, на главной странице находятся ссылки на категории продукции, страницы категорий содержат URL на карточки товара, карточки товара могут ссылаться на страницу про оплату и доставку.

Когда робот находит ссылки на странице, он может переходить по ним, постепенно сканируя больше и больше URL. Если же адрес не связан с другими страницами сайта, краулер сможет его найти благодаря sitemap.

В результатах ранжирования могут участвовать не только страницы сайта, но и их отдельные элементы. Например, в Google есть разделы, где отображаются только картинки или видео.

Картинки и видео, которые видит пользователь на сайте, в коде страниц выглядят как ссылки на файлы. Браузер обращается по этим ссылкам к медиафайлам и отображает визуальный контент на экране. Если создать отдельную карту для таких URL, это обратит внимание роботов на данный тип контента.

Любите продавать?
Держите хостинг для интернет-магазина с гарантированным аптаймом и +30% экономии при годичной оплате

что такое sitemap xml. Смотреть фото что такое sitemap xml. Смотреть картинку что такое sitemap xml. Картинка про что такое sitemap xml. Фото что такое sitemap xml

Как создать sitemap XML

XML-файл можно получить, используя инструменты, которые автоматически генерируют список URL на основании страниц сайта, или составить карту вручную.

Автоматическая генерация карты сайта

Есть несколько способов получить готовый sitemap.xml.

Онлайн-сервисы для создания файлов

Это сервисы, которые формируют файлы и фиды по URL сайта, в том числе sitemap. Чтобы запустить генератор, в специальном окне укажите имя домена. Через несколько минут вы сможете скачать готовую XML-карту.

Многофункциональные платформы для SEO-специалистов

Есть сервисы, которые в числе различных инструментов для оптимизации предоставляют опцию для создания карты. Из плюсов — вы можете задать дополнительные параметры для sitemap, например, тип страниц, частоту изменений и приоритет.

Примеры сервисов для SEO, где можно создать карту сайта: SE Ranking, СайтРепорт.

Плагины для систем управления сайтом (CMS)

Разработчики CMS предлагают дополнительные программы для SEO-настроек, включая карту сайта. Плагины автоматически создают файл sitemap.xml и обновляют список URL, когда вы добавляете или удаляете страницы.

Примеры плагинов: All in One SEO Pack и Google XML Sitemap Generator для WordPress, Simple XML sitemap для Drupal, OSMap для Joomla!.

Статья по теме:

что такое sitemap xml. Смотреть фото что такое sitemap xml. Смотреть картинку что такое sitemap xml. Картинка про что такое sitemap xml. Фото что такое sitemap xml

Самостоятельное создание файла sitemap

Поскольку есть автоматические сервисы, необходимости составлять список страниц вручную, как правило, нет. Но если вы все-таки хотите создать карту сайта самостоятельно:

Правила для создания файла sitemap

Выделим общие рекомендации поисковых систем для создания карты сайта.

Как разместить карту сайта в файле robots.txt

Перед тем, как добавить страницы в индекс, робот сначала делает обход сайта и сканирует его содержимое. Первый файл, который он просматривает — это robots. В него нужно добавить директиву Sitemap и ссылку на карту сайта.

В файле robots могут быть указаны ссылки на несколько XML-файлов.

Из чего состоит карта сайта

Файл sitemap состоит из элементов — тегов, которые имеют начало <> и конец и содержат определенные данные. Некоторые теги могут быть родительскими и включать в себя дочерние. Синтаксис карт сайта для Google соответствует протоколу Sitemap.

У XML-карты есть обязательные теги:

— тег, содержащий ссылку на текущий стандарт протокола;

— тег для каждого URL, который включает дочерние теги с адресом страницы и дополнительной информацией о ней;

— тег, который размещают в начале и конце файла, когда у сайта несколько файлов sitemap, а его дочерние теги содержат ссылки на эти карты.

Теперь рассмотрим теги, которые используют при необходимости:

— дата последнего обновления страницы в формате YYYY-MM-DD.

— указывает периодичность обновления страниц и когда роботу рекомендуется индексировать контент: всегда (always), ежечасно (hourly), ежедневно (daily), еженедельно (weekly), ежемесячно (monthly), ежегодно (yearly), никогда (never).

— тег для обозначения приоритетных для индексации страниц с помощью параметра от 0 до 1.

в своем руководстве, но в данный момент не учитывает их. Они актуальны для других поисковых систем.

Как добавить несколько карт на сайт

Если у сайта несколько sitemap, о которых нужно сообщить поисковикам, используйте для этого один из двух вариантов:

Рассмотрим пошагово второй способ, как объединить несколько карт в одном файле.

Шаг 1 Создайте XML-файлы и проверьте, чтобы общее количество URL не превышало 50 000, а вес — 50 МБ.

Шаг 2 Дайте файлам названия, отличные от sitemap.

Шаг 3 Проверьте карты на ошибки с помощью специальных инструментов.

Пример sitemap.xml, содержащего две карты сайта:

Расширение gz говорит о том, что для файлов sitemaps применялось gzip-сжатие.

Чтобы поисковые системы обнаружили все «вложенные» карты сайта, достаточно их уведомить об основном файле sitemap.xml через специальный инструмент, например, Google Search Console.

Попробуйте хостинг с кучей плюшек: автоустановщиком 330 движков, конструктором сайтов и теплой поддержкой 24/7!

что такое sitemap xml. Смотреть фото что такое sitemap xml. Смотреть картинку что такое sitemap xml. Картинка про что такое sitemap xml. Фото что такое sitemap xml

Карта сайта для разных типов контента

Чтобы содержимое страниц попадало в специальные разделы поисковиков (для фото, видео, новостей), рекомендуется создавать отдельные карты сайта. Узнаем, как создавать sitemaps для популярных видов контента — изображений и видео.

Sitemap для изображений

Когда стоит использовать sitemap для картинок:

Обязательные теги:

— тег, который содержит URL картинки и может включать информацию об изображении, например, название и подписи к фото, место съемки.

— тег для URL картинки.

Необязательные теги:

— название (заголовок) картинки.

— подпись к картинке.

— ссылка на лицензию фото.

Пример фрагмента Sitemap для изображений:

Информация о настройке карты для изображений есть в официальной справке Google.

Sitemap для видео

Если нужно уведомить Google о недавно добавленных видео или помочь ему проиндексировать сайт с большим количеством мультимедийного контента, используют карту для видео.

Обязательные теги:

— тег, который содержит дочерние теги с адресом видеофайла и дополнительной информацией о нем, например, описанием, длительностью или датой публикации;

— тег, который содержит URL видео;

— место размещения проигрывателя для видеоролика;

— название (заголовок) видео с рекомендуемой длиной до 100 символов;

— описание к видео, близкое по смыслу к контенту страницы, с максимальной длиной в 2048 символов.

— URL файла со значком видео в мини-версии от 60×30 пикселей;

Необязательные теги:

— дата размещения видео в формате YYYY-MM-DD;

— продолжительность видео в секундах с максимальным значением 28800 (8 часов);

— описание тематической категории видео до 256 символов;

— тег, который обычно используют для запрета показов видео на определенных платформах: ПК (web), мобильных устройствах (mobile), телевизорах (tv);

— тег для запрета показа видео в определенных регионах, в котором коды стран приведены в формате ISO 3166;

— тег для безопасного поиска, т.е. ограничения просмотра видео по возрасту;

— тег в формате YYYY-MM-DD для видео, которые будут доступны до определенной даты;

— имя пользователя или название компании, добавившей видео, с допустимой длиной до 255 символов;

— тег, который используют для видео с платным просмотром или загрузкой, указывая валюту (атрибут currency) в формате ISO 4217;

— тег для доступа к видео по подписке;

— тег, в котором указано, сколько просмотров получило видео;

— рейтинг видеоролика в диапазоне от 0.0 до 5.0;

— тег для пометки прямых трансляций;

— теги в виде ключевых слов, которые помогают целевой аудитории находить контент.

Пример фрагмента Sitemap для видео:

Источник

sitemaps.org

В этом документе приведено описание XML-схемы протокола Sitemap.

Формат протокола Sitemap состоит из XML-тегов. Для всех значений данных в файле Sitemap должно использоваться маскирование. В файле необходимо использовать кодировку UTF-8.

Все теги необязательны. Поддержка необязательных тегов может отличаться в зависимости от поискового сервера. Чтобы получить более подробную информацию, обратитесь к документации поискового сервера.

Также все URL-адреса в файле Sitemap должны быть с одного узла, например www.example.com или store.example.com. Дополнительные сведения см. в разделе Расположение файла Sitemap

Пример XML-файла Sitemap

Ниже приведен пример файла Sitemap, в котором содержится только один URL-адрес и использованы все необязательные теги. Необязательные теги выделены курсивом.

Определения XML-тегов

Ниже описаны доступные XML-теги.

Инкапсулирует этот файл и указывает стандарт текущего протокола.

Родительский тег для каждой записи URL-адреса. Остальные теги являются дочерними для этого тега.

URL-адрес страницы. Этот URL-адрес должен начинаться с префикса (например, HTTP) и заканчиваться косой чертой, если Ваш веб-сервер требует этого. Длина этого значения не должна превышать 2048 символов.

Дата последнего изменения файла. Эта дата должна быть в формате W3C Datetime. Этот формат позволяет при необходимости опустить сегмент времени и использовать формат ГГГГ-ММ-ДД.

Обратите внимание, что этот тег не имеет отношения к заголовку «If-Modified-Since (304)», который может вернуть сервер, поэтому поисковые системы могут по-разному использовать информацию из этих двух источников.

Вероятная частота изменения этой страницы. Это значение предоставляет общую информацию для поисковых систем и может не соответствовать точно частоте сканирования этой страницы. Допустимые значения:

Значение»всегда» должно использоваться для описания документов, которые изменяются при каждом доступе к этим документам. Значение «никогда» должно использоваться для описания архивных URL-адресов.

Имейте в виду, что значение для этого тега рассматривается как подсказка, а не как команда. Несмотря на то, что сканеры поисковой системы учитывают эту информацию при принятии решений, они могут сканировать страницы с пометкой «ежечасно» менее часто, чем указано, а страницы с пометкой «ежегодно» – более часто, чем указано. Сканеры могут периодически сканировать страницы с пометкой «никогда», чтобы отслеживать неожиданные изменения на этих страницах.

Приоритетность URL относительно других URL на Вашем сайте. Допустимый диапазон значений — от 0,0 до 1,0. Это значение не влияет на процедуру сравнения Ваших страниц со страницами на других сайтах — оно только позволяет указать поисковым системам, какие страницы, по Вашему мнению, более важны для сканеров.

Приоритет страницы по умолчанию — 0,5.

Следует учитывать, что приоритет, который Вы назначили странице, не влияет на положение Ваших URL на страницах результатов той или иной поисковой системы. Поисковые системы используют эту информацию при обработке URL, которые относятся к одному и тому же сайту, поэтому можно использовать этот тег для увеличения вероятности присутствия в поисковом индексе Ваших самых важных страниц.

Кроме того, следует учитывать, что назначение высокого приоритета всем URL на Вашем сайте не имеет смысла. Поскольку приоритетность – величина относительная, этот параметр используется для того, чтобы определить очередность обработки URL в пределах сайта.

Маскирование символов

В файле Sitemap должна использоваться кодировка UTF-8 (обычно ее можно выбрать при сохранении данного файла). В XML-файлах для всех значений данных (включая URL-адреса) должно использоваться маскирование символов, перечисленных ниже в таблице.

АтрибутОписание
обязательный
СимволМаскирование
Амперсанд&&
Одинарные кавычки
Двойные кавычки««
Больше>>
Меньше

Кроме того, для всех URL (включая URL из вашего файла Sitemap) должны использоваться маскирование и кодировка для удобочитаемости веб-сервером, на котором они размещаются. Однако, если для создания своих URL Вы используете какой-либо вид скрипта, инструментального средства или журнала (любой способ кроме ввода их вручную), то маскировка и кодировка применяются автоматически. Убедитесь в том, что все URL-адреса соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и XML-стандарту.

Ниже приведен пример URL-адреса, в котором используется символ, отличный от ASCI ( ü ), а также символ, для которого необходимо маскирование ( & ):

Ниже этот же URL-адрес приведен в кодировке ISO-8859-1 (для размещения на сервере, который использует эту кодировку) с маскированием:

Ниже этот же URL-адрес приведен в кодировке UTF-8 (для размещения на сервере, который использует эту кодировку) и с использованием маскирования:

Ниже приведен тот же URL-адрес, но с использованием маскирования:

Пример XML-файла Sitemap

В следующем примере показан файл Sitemap в XML-формате. Sitemap в этом примере содержит небольшое число URL-адресов, каждый из которых использует разное сочетание необязательных параметров.

Использование файлов индекса Sitemap (для создания группы из нескольких файлов Sitemap)

Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 50 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора gzip, чтобы уменьшить требования к пропускной способности канала. Однако размер файла sitemap без сжатия не должен превышать 50 МБ. Если необходимо перечислить более 50000 URL-адресов, следует создать несколько файлов Sitemap.

Если требуется передать несколько файлов Sitemap, необходимо перечислить каждый из этих файлов в файле индекса Sitemap. В файле индекса Sitemap может быть перечислено не более 50000 файлов Sitemap. Размер этого файла не должен превышать 50 МБ (52 428 800 байт) и может быть сжат. У вас может быть несколько файлов Sitemap. Формат XML-файла индекса Sitemap очень похож на формат XML-файла Sitemap.

Файл индекса Sitemap должен:

Необязательный тег также доступен для файлов индекса Sitemap.

Примечание. Файл индекса Sitemap может указывать только файлы Sitemap, которые находятся на том же сайте, что и файл индекса Sitemap. Например, файл индекса http://www.vashsait.ru/sitemap_index.xml может включать файлы Sitemap, размещенные на сайте http://www.vashsait.ru, но не на сайте http://www.primer.ru или http://vashkhost.vashsait.ru. Для файла индекса Sitemap, как и для файлов Sitemap, необходимо использовать кодировку UTF-8.

Пример индекса XML Sitemap

В следующем примере показан файл индекса Sitemap, который содержит два файла Sitemaps.

Определения XML-тегов индекса Sitemap

Указывает местоположение файла Sitemap.

Этим местоположением может быть файл Sitemap, файл Atom, файл RSS или простой текстовый файл.

Указывает время изменения соответствующего файла Sitemap. Не соответствует времени изменения ни одной из страниц в этом файле Sitemap. Значение тега «lastmod» должно быть представлено в формате W3C Datetime.

Предоставляя отметку времени последнего изменения, Вы позволяете сканерам поисковой системы извлекать только часть файлов Sitemap в индексе, то есть сканер может извлекать только те файлы Sitemap, которые были изменены после определенной даты. Этот механизм частичного извлечения файлов Sitemap позволяет быстро обнаруживать новые URL на сайтах больших размеров.

Другие форматы файла Sitemap

Протокол Sitemap дает возможность обеспечить поисковые системы подробной информацией о страницах, и мы рекомендуем его использовать, поскольку при этом можно указать дополнительные сведения о страницах сайта, а не только их URL. Помимо протокола XML мы также поддерживаем каналы RSS и текстовые файлы, которые предоставляют более ограниченную информацию.

Канал синдикации

Вы можете предоставить канал RSS 2.0, Atom 0.3 или 1.0. Как правило, этот формат используется только в том случае, если на сайте уже есть канал синдикации. Обратите внимание, что в этом случае поисковые системы, возможно, не получат информацию обо всех URL на вашем сайте, поскольку данный канал предоставляет информацию только по последним URL. Однако поисковые системы могут использовать эту информацию, чтобы обнаружить другие страницы сайта, переходя по ссылкам на страницах канала в процессе обычного сканирования. Убедитесь, что канал расположен в каталоге самого высокого уровня, который должен сканироваться поисковой системой. Поисковые системы извлекают информацию из канала следующим образом.

для каналов RSS и дата для каналов Atom) – указывает, когда каждый URL был изменен в последний раз. Использовать поле даты изменения необязательно.

Текстовый файл

Вы можете предоставить простой текстовый файл, содержащий один URL в строке. Этот текстовый файл должен соответствовать следующим требованиям.

Ниже приведен пример строк текстового файла.

Местоположение файла Sitemap

Местоположение файла Sitemap определяет набор URL-адресов, которые можно включить в этот Sitemap. Файл Sitemap, расположенный в каталоге http://primer.ru/catalog/sitemap.xml, может включать любые URL-адреса, начинающиеся с http://primer.ru/catalog/, но не должен включать URL-адреса, начинающиеся с http://primer.ru/images/.

Если у Вас есть разрешение на изменение файла http://primer.org/path/sitemap.xml, можно предположить, что у Вас также имеется разрешение на предоставление информации для URL с префиксом http://primer.org/path/. Примеры допустимых URL в http://primer.ru/catalog/sitemap.xml включают:

К недопустимым URL-адресам в файле http://primer.ru/catalog/sitemap.xml относятся следующие:

Это значит, что все URL-адреса, перечисленные в файле Sitemap, должны использовать один и тот же протокол (в данном случае — HTTP) и должны быть размещены на том же хосте, что и файл Sitemap. Например, если файл Sitemap расположен по адресу http://www.primer.ru/sitemap.xml, в нем могут быть указаны URL-адреса из субдомена http://subdomen.primer.ru.

URL-адреса, которые считаются недопустимыми, исключаются из дальнейшего рассмотрения. Настоятельно рекомендуется поместить файл Sitemap в корневой каталог Вашего веб-сервера. Например, если адрес Вашего сервера — primer.ru, Ваш файл индекса Sitemap должен быть размещен по адресу http://primer.ru/sitemap.xml. Возможно, в некоторых случаях нужно будет создать различные файлы Sitemap для различных путей на Вашем сайте (например, если полномочия доступа в Вашей организации установлены таким образом, что доступ с правом записи к различным каталогам предоставляется отдельно).

Если при передаче файла Sitemap используется путь, содержащий номер порта, необходимо включить этот номер порта в путь в каждом URL, перечисленном в файле Sitemap. Например, если Ваш файл Sitemap находится в http://www.primer.ru:100/sitemap.xml, то каждый URL, перечисленный в файле Sitemap, должен начинаться с http://www.primer.ru:100.

Файлы Sitemap и перекрестная отправка

Чтобы отправить файлы Sitemap на несколько узлов с одного, необходимо «подтвердить» владение узлом(-ами) для которого URL-адреса отправляются в файле Sitemap. Ниже приведен пример. Допустим, необходимо отправить файлы Sitemap на 3 узла:

Более того, необходимо разместить все три файла Sitemap на одном узле: www.sitemaphost.com. Таким образом, URL-адреса Sitemaps будут следующими:

По умолчанию это приведет к ошибке «перекрестная отправка», так как была произведена попытка отправить URL-адреса для узла www.host1.com через файл Sitemap, который расположен на узле www.sitemaphost.com (то же самое и для двух других узлов). Первый способ избежать этой ошибки — это доказать свое владение (например право изменять файлы) узлом www.host1.com. Это можно сделать, изменив файл robots.txt на узле www.host1.com, чтобы указать на файл Sitemap на узле www.sitemaphost.com.

В этом примере файл robots.txt на узле http://www.host1.com/robots.txt содержал бы строку «Sitemap: http://www.sitemaphost.com/sitemap-host1.xml». Изменив файл robots.txt на узле www.host1.com с указанием на файл Sitemap на узле www.sitemaphost.com, вы косвенно доказали, что являетесь владельцем узла www.host1.com. Другими словами, кто бы не управлял файлом robots.txt на узле www.host1.com, он доверяет файлу Sitemap на узле http://www.sitemaphost.com/sitemap-host1.xml на предмет содержания URL-адресов для узла www.host1.com. Эту же процедуру можно повторить для двух других узлов.

Теперь можно отправлять файлы Sitemap на узел www.sitemaphost.com.

Если в файле robots.txt указан определенный узел, например http://www.host1.com/robots.txt, это указывает на файл Sitemap или файл индекса Sitemap на другом узле. Скорее всего это означает, что для каждого конечного файла Sitemap, например http://www.sitemaphost.com/sitemap-host1.xml, все URL-адреса принадлежат узлу, который на них указывает. Это происходит потому, что, как было указано ранее, ожидается, что файл Sitemap будет содержать URL-адреса только с одного узла.

Проверка файла Sitemap

Для определения элементов и атрибутов, которые могут появляться в Вашем файле Sitemap, используются следующие XML-схемы. Эту схему можно загрузить с помощью приведенных ниже ссылок.

Ряд инструментов может помочь при проверке структуры файла Sitemap на основе этой схемы. Вы можете найти список инструментов для работы с XML-файлами в каждом из следующих местоположений:

Для проверки Вашего файла Sitemap или файла индекса Sitemap по этой схеме в XML-файл нужно добавить дополнительные заголовки, как показано ниже.

Sitemap:

Файл индекса Sitemap:

Расширение протокола Sitemaps

Протокол Sitemap можно расширить с помощью Вашего собственного пространства имен. Просто укажите это пространство имен в корневом элементе. Например:

Уведомления для сканеров поисковых систем

После того как файл Sitemap создан и размещен на веб-сервере, необходимо сообщить о местонахождении этого файла поисковым системам, поддерживающим этот протокол. Это можно сделать следующим образом.

Затем поисковые системы смогут извлечь файл Sitemap и разрешить своим сканерам доступ к URL-адресам.

Передача файла Sitemap с помощью интерфейса поисковой системы

Чтобы отправить файл Sitemap напрямую в поисковую систему, которая предоставляет возможность получать информацию о статусе и ошибках обработки, обратитесь к документации поисковой системы.

Как указать местоположение файла Sitemap в файле robots.txt

Можно указать местоположение файла Sitemap, используя файл robots.txt. Для этого просто добавьте следующую строку:

Эта инструкция не зависит от строки агента пользователя, поэтому неважно, где она размещается в файле. При наличии файла индекса Sitemap можно включить местоположение только этого файла. Перечислять каждый отдельный файл Sitemap, указанный в файле индекса, не нужно.

Можно указать несколько файлов Sitemap для каждого файла robots.txt.

Передача файла Sitemap с помощью запроса HTTP

Чтобы отправить файл Sitemap с помощью HTTP-запроса (замените на URL, указанный поисковой системой), создайте запрос для следующего URL-адреса.

Например, если файл Sitemap находится в архивном файле http://www.primer.ru/sitemap.gz, URL-адрес будет следующим:

Добавьте кодировку URL для всех символов после /ping?sitemap=:

Можно отправить http-запрос, используя «wget», «curl» или другой механизм по выбору. Успешный запрос возвратит код отклика HTTP 200; если получен другой отклик, необходимо повторно передать запрос. Код отклика HTTP 200 указывает только на то, что поисковая система получила Ваш файл Sitemap, но это не значит, что сам файл Sitemap или содержащиеся в нем URL допустимы. Самый простой способ — создать автоматическое задание для регулярного создания и передачи файлов Sitemap.
Примечание. Предоставляя файл индекса Sitemap, необходимо инициировать только один http-запрос, который включает местоположение файла индекса Sitemap; отправлять отдельные запросы для каждого файла Sitemap, указанного в этом индексе, не нужно.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

АтрибутОписание
обязательныйИнкапсулирует информацию о всех файлах Sitemap в этом файле.
обязательныйИнкапсулирует информацию об отдельном файле Sitemap.
обязательный