что такое sitemap xml
Инструкция по работе с sitemap.xml
Для того, чтобы страницы сайта и их содержимое начали ранжироваться — отображаться по запросам пользователей, их должен проиндексировать робот поисковой системы. Когда у ресурса есть карта сайта, Google проще обнаружить адреса страниц.
Из статьи вы узнаете
Что такое карта сайта
Карта сайта или sitemap — это файл, содержащий список URL всех страниц ресурса, которые нужно проиндексировать. Он размещен в корневой папке и в большинстве случаев называется sitemap.xml.
Структура сайта напоминает структуру книги с разделами, подразделами и страницами. Когда читателю нужно что-то найти в учебнике или энциклопедии, он сначала смотрит содержание и находит нужную страницу. Файл sitemap XML выполняет роль содержания на сайте, помогая поисковым роботам обнаружить страницы.
Как посмотреть карту сайта
Содержимое карты сайта доступно не только роботам, но и посетителям сайта. Поскольку список URL обычно размещают в папке с серверными файлами, адрес sitemap состоит из двух элементов — имени сайта и названия карты.
Как посмотреть карту чужого сайта? Возьмем для примера сайт компании Apple и добавим к доменному имени в адресной строке /sitemap.xml.
Для чего используют карту сайта
Основная роль sitemap — это навигация робота и направление его к важным URL, чтобы они попали в индекс поисковика.
Важно учесть, что наличие карты не гарантирует индексацию страниц. Также поисковики могут находить URL без карты, например, если на него ведет ссылка с другой веб-страницы. В то же время, Google рекомендует добавлять на сайт список адресов для индексирования.
Как и инструкция по сканированию страниц для роботов — robots.txt, карта сайта — важный атрибут оптимизации. Проверить правильность настроек sitemap можно в инструментах от поисковых систем, на сайтах-валидаторах и на платформах, которые анализируют SEO сайта онлайн.
Когда полезна карта сайта:
Представим себе крупный интернет-магазин или другой многостраничный сайт. При большом количестве страниц робот может пропустить какие-то из них. Карта сайта повышает вероятность попадания важных URL в индекс и, как следствие, появления их в результатах выдачи.
Чтобы новый ресурс начал ранжироваться, нужно помочь поисковику обнаружить его страницы. Если упоминаний URL нет на других страницах в интернете, роботу будет сложнее найти этот URL и проиндексировать.
Создание карты сайта и информирование краулеров о ее наличии ускорит индексацию страниц и их отображение по поисковым запросам.
Для сайта, который уже в индексе, тоже может быть актуально ускорение индексации страниц. Например, новостные и развлекательные порталы постоянно добавляют новые статьи и заинтересованы в том, чтобы пользователи быстрее находили свежие материалы в выдаче.
Также в карте может быть указана дата последнего обновления страницы или периодичность, с которой она обновляется. Таким образом роботы получают информацию, когда нужно повторно индексировать URL.
Как правило, страницы внутри сайта связаны друг с другом. Например, на главной странице находятся ссылки на категории продукции, страницы категорий содержат URL на карточки товара, карточки товара могут ссылаться на страницу про оплату и доставку.
Когда робот находит ссылки на странице, он может переходить по ним, постепенно сканируя больше и больше URL. Если же адрес не связан с другими страницами сайта, краулер сможет его найти благодаря sitemap.
В результатах ранжирования могут участвовать не только страницы сайта, но и их отдельные элементы. Например, в Google есть разделы, где отображаются только картинки или видео.
Картинки и видео, которые видит пользователь на сайте, в коде страниц выглядят как ссылки на файлы. Браузер обращается по этим ссылкам к медиафайлам и отображает визуальный контент на экране. Если создать отдельную карту для таких URL, это обратит внимание роботов на данный тип контента.
Любите продавать?
Держите хостинг для интернет-магазина с гарантированным аптаймом и +30% экономии при годичной оплате
Как создать sitemap XML
XML-файл можно получить, используя инструменты, которые автоматически генерируют список URL на основании страниц сайта, или составить карту вручную.
Автоматическая генерация карты сайта
Есть несколько способов получить готовый sitemap.xml.
Онлайн-сервисы для создания файлов
Это сервисы, которые формируют файлы и фиды по URL сайта, в том числе sitemap. Чтобы запустить генератор, в специальном окне укажите имя домена. Через несколько минут вы сможете скачать готовую XML-карту.
Многофункциональные платформы для SEO-специалистов
Есть сервисы, которые в числе различных инструментов для оптимизации предоставляют опцию для создания карты. Из плюсов — вы можете задать дополнительные параметры для sitemap, например, тип страниц, частоту изменений и приоритет.
Примеры сервисов для SEO, где можно создать карту сайта: SE Ranking, СайтРепорт.
Плагины для систем управления сайтом (CMS)
Разработчики CMS предлагают дополнительные программы для SEO-настроек, включая карту сайта. Плагины автоматически создают файл sitemap.xml и обновляют список URL, когда вы добавляете или удаляете страницы.
Примеры плагинов: All in One SEO Pack и Google XML Sitemap Generator для WordPress, Simple XML sitemap для Drupal, OSMap для Joomla!.
Статья по теме:
Самостоятельное создание файла sitemap
Поскольку есть автоматические сервисы, необходимости составлять список страниц вручную, как правило, нет. Но если вы все-таки хотите создать карту сайта самостоятельно:
Правила для создания файла sitemap
Выделим общие рекомендации поисковых систем для создания карты сайта.
Как разместить карту сайта в файле robots.txt
Перед тем, как добавить страницы в индекс, робот сначала делает обход сайта и сканирует его содержимое. Первый файл, который он просматривает — это robots. В него нужно добавить директиву Sitemap и ссылку на карту сайта.
В файле robots могут быть указаны ссылки на несколько XML-файлов.
Из чего состоит карта сайта
Файл sitemap состоит из элементов — тегов, которые имеют начало <> и конец и содержат определенные данные. Некоторые теги могут быть родительскими и включать в себя дочерние. Синтаксис карт сайта для Google соответствует протоколу Sitemap.
У XML-карты есть обязательные теги:
— тег, содержащий ссылку на текущий стандарт протокола;
— тег для каждого URL, который включает дочерние теги с адресом страницы и дополнительной информацией о ней;
— тег, который размещают в начале и конце файла, когда у сайта несколько файлов sitemap, а его дочерние теги содержат ссылки на эти карты.
Теперь рассмотрим теги, которые используют при необходимости:
— дата последнего обновления страницы в формате YYYY-MM-DD.
— указывает периодичность обновления страниц и когда роботу рекомендуется индексировать контент: всегда (always), ежечасно (hourly), ежедневно (daily), еженедельно (weekly), ежемесячно (monthly), ежегодно (yearly), никогда (never).
— тег для обозначения приоритетных для индексации страниц с помощью параметра от 0 до 1.
в своем руководстве, но в данный момент не учитывает их. Они актуальны для других поисковых систем.
Как добавить несколько карт на сайт
Если у сайта несколько sitemap, о которых нужно сообщить поисковикам, используйте для этого один из двух вариантов:
Рассмотрим пошагово второй способ, как объединить несколько карт в одном файле.
Шаг 1 Создайте XML-файлы и проверьте, чтобы общее количество URL не превышало 50 000, а вес — 50 МБ.
Шаг 2 Дайте файлам названия, отличные от sitemap.
Шаг 3 Проверьте карты на ошибки с помощью специальных инструментов.
Пример sitemap.xml, содержащего две карты сайта:
Расширение gz говорит о том, что для файлов sitemaps применялось gzip-сжатие.
Чтобы поисковые системы обнаружили все «вложенные» карты сайта, достаточно их уведомить об основном файле sitemap.xml через специальный инструмент, например, Google Search Console.
Попробуйте хостинг с кучей плюшек: автоустановщиком 330 движков, конструктором сайтов и теплой поддержкой 24/7!
Карта сайта для разных типов контента
Чтобы содержимое страниц попадало в специальные разделы поисковиков (для фото, видео, новостей), рекомендуется создавать отдельные карты сайта. Узнаем, как создавать sitemaps для популярных видов контента — изображений и видео.
Sitemap для изображений
Когда стоит использовать sitemap для картинок:
Обязательные теги:
— тег, который содержит URL картинки и может включать информацию об изображении, например, название и подписи к фото, место съемки.
— тег для URL картинки.
Необязательные теги:
— название (заголовок) картинки.
— подпись к картинке.
— ссылка на лицензию фото.
Пример фрагмента Sitemap для изображений:
Информация о настройке карты для изображений есть в официальной справке Google.
Sitemap для видео
Если нужно уведомить Google о недавно добавленных видео или помочь ему проиндексировать сайт с большим количеством мультимедийного контента, используют карту для видео.
Обязательные теги:
— тег, который содержит дочерние теги с адресом видеофайла и дополнительной информацией о нем, например, описанием, длительностью или датой публикации;
— тег, который содержит URL видео;
— место размещения проигрывателя для видеоролика;
— название (заголовок) видео с рекомендуемой длиной до 100 символов;
— описание к видео, близкое по смыслу к контенту страницы, с максимальной длиной в 2048 символов.
— URL файла со значком видео в мини-версии от 60×30 пикселей;
Необязательные теги:
— дата размещения видео в формате YYYY-MM-DD;
— продолжительность видео в секундах с максимальным значением 28800 (8 часов);
— описание тематической категории видео до 256 символов;
— тег, который обычно используют для запрета показов видео на определенных платформах: ПК (web), мобильных устройствах (mobile), телевизорах (tv);
— тег для запрета показа видео в определенных регионах, в котором коды стран приведены в формате ISO 3166;
— тег для безопасного поиска, т.е. ограничения просмотра видео по возрасту;
— тег в формате YYYY-MM-DD для видео, которые будут доступны до определенной даты;
— имя пользователя или название компании, добавившей видео, с допустимой длиной до 255 символов;
— тег, который используют для видео с платным просмотром или загрузкой, указывая валюту (атрибут currency) в формате ISO 4217;
— тег для доступа к видео по подписке;
— тег, в котором указано, сколько просмотров получило видео;
— рейтинг видеоролика в диапазоне от 0.0 до 5.0;
— тег для пометки прямых трансляций;
— теги в виде ключевых слов, которые помогают целевой аудитории находить контент.
Пример фрагмента Sitemap для видео:
sitemaps.org
В этом документе приведено описание XML-схемы протокола Sitemap.
Формат протокола Sitemap состоит из XML-тегов. Для всех значений данных в файле Sitemap должно использоваться маскирование. В файле необходимо использовать кодировку UTF-8.
Все теги необязательны. Поддержка необязательных тегов может отличаться в зависимости от поискового сервера. Чтобы получить более подробную информацию, обратитесь к документации поискового сервера.
Также все URL-адреса в файле Sitemap должны быть с одного узла, например www.example.com или store.example.com. Дополнительные сведения см. в разделе Расположение файла Sitemap
Пример XML-файла Sitemap
Ниже приведен пример файла Sitemap, в котором содержится только один URL-адрес и использованы все необязательные теги. Необязательные теги выделены курсивом.
Определения XML-тегов
Ниже описаны доступные XML-теги.
Атрибут | Описание | ||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
обязательный |
Символ | Маскирование | |
---|---|---|
Амперсанд | & | & |
Одинарные кавычки | ‘ | ‘ |
Двойные кавычки | « | « |
Больше | > | > |
Меньше |
Кроме того, для всех URL (включая URL из вашего файла Sitemap) должны использоваться маскирование и кодировка для удобочитаемости веб-сервером, на котором они размещаются. Однако, если для создания своих URL Вы используете какой-либо вид скрипта, инструментального средства или журнала (любой способ кроме ввода их вручную), то маскировка и кодировка применяются автоматически. Убедитесь в том, что все URL-адреса соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и XML-стандарту.
Ниже приведен пример URL-адреса, в котором используется символ, отличный от ASCI ( ü ), а также символ, для которого необходимо маскирование ( & ):
Ниже этот же URL-адрес приведен в кодировке ISO-8859-1 (для размещения на сервере, который использует эту кодировку) с маскированием:
Ниже этот же URL-адрес приведен в кодировке UTF-8 (для размещения на сервере, который использует эту кодировку) и с использованием маскирования:
Ниже приведен тот же URL-адрес, но с использованием маскирования:
Пример XML-файла Sitemap
В следующем примере показан файл Sitemap в XML-формате. Sitemap в этом примере содержит небольшое число URL-адресов, каждый из которых использует разное сочетание необязательных параметров.
Использование файлов индекса Sitemap (для создания группы из нескольких файлов Sitemap)
Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 50 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора gzip, чтобы уменьшить требования к пропускной способности канала. Однако размер файла sitemap без сжатия не должен превышать 50 МБ. Если необходимо перечислить более 50000 URL-адресов, следует создать несколько файлов Sitemap.
Если требуется передать несколько файлов Sitemap, необходимо перечислить каждый из этих файлов в файле индекса Sitemap. В файле индекса Sitemap может быть перечислено не более 50000 файлов Sitemap. Размер этого файла не должен превышать 50 МБ (52 428 800 байт) и может быть сжат. У вас может быть несколько файлов Sitemap. Формат XML-файла индекса Sitemap очень похож на формат XML-файла Sitemap.
Файл индекса Sitemap должен:
Необязательный тег также доступен для файлов индекса Sitemap.
Примечание. Файл индекса Sitemap может указывать только файлы Sitemap, которые находятся на том же сайте, что и файл индекса Sitemap. Например, файл индекса http://www.vashsait.ru/sitemap_index.xml может включать файлы Sitemap, размещенные на сайте http://www.vashsait.ru, но не на сайте http://www.primer.ru или http://vashkhost.vashsait.ru. Для файла индекса Sitemap, как и для файлов Sitemap, необходимо использовать кодировку UTF-8.
Пример индекса XML Sitemap
В следующем примере показан файл индекса Sitemap, который содержит два файла Sitemaps.
Определения XML-тегов индекса Sitemap
Атрибут | Описание |
---|---|
обязательный | Инкапсулирует информацию о всех файлах Sitemap в этом файле. |
обязательный | Инкапсулирует информацию об отдельном файле Sitemap. |
обязательный |