Sitemap.xml – co to je a jak vytvořit mapu stránek ve formátu XML

SEO
Jakub TrybułaJakub Trybuła
Opublikowano: 17.05.2021
21 minut

Mapa stránek obsahuje informace o obsahu webových stránek. Jedná se o soubor většinou připravený ve formátu XML, který je umístěn přímo na serveru. Díky mapě stránek Google má bot, který navštíví naše stránky, přístup k obsahu webu a jeho struktuře. Z tohoto textu se dozvíte, co je to mapa stránek, seznámíte se s různými typy map stránek a naučíte se je vytvářet.

Na úvod si projdeme typy map stránek, abyste získali představu o tom, která z nich by mohla být pro váš web nejvhodnější a co by měla obsahovat. Některé prvky je třeba upravit a doplnit, ale pokud se naučíte obecné zásady a budete se řídit tím, co jsem zde napsal, neměli byste mít problém.

Později v textu zodpovím asi nejdůležitější otázky: jak takovou mapu vytvořit a jak ji odeslat společnosti Google pomocí nástroje Google Search Console.

Nemusíte být odborník na se, to vše je poměrně jednoduché udělat i pro „netechnického“ člověka, za jedné podmínky – musíte vědět co a jak. Začněme tedy prozkoumávat tajemství mapy stránek!

KeyT_Here

Proč je mapa stránek důležitá?

.
Největším přínosem toho, že máte pro své stránky soubor sitemap.xml, je usnadnění práce robotům společnosti Google. Robot Google bude procházet váš web rychleji, takže se zvýší počet indexovaných stránek ve vyhledávači. To bude fungovat zejména u velkých webů, protože indexovací roboti budou určitě vědět, že se na webu nachází konkrétní URL. To je důležité v případě adres na nové položky nebo podstránky.

Díky souboru sitemap.xml se indexovací boti dostanou do zákoutí webů, které nepraktikují správná pravidla vnitřního prolinkování, poměrně efektivně a rychle.

Je také třeba vzít v úvahu, že ve srovnání s weby bez mapy stránek získáte výhodu díky rychlejšímu dosažení zákoutí vašeho webu roboty Google…..

Kromě samotných odkazů na podstránky můžete Googlebotu poskytnout informace o:

    .
  • datum poslední změny na uvedené url,
  • .

  • název položky,
  • .

  • grafika,
  • .

  • jazyk, ve kterém byl záznam vytvořen (hreflangs),
  • .

  • priorita podstránky v doméně
  • .

Vyzkoušejte Senuto Suite na 14 dní zdarma

Pojďme na to!

Co je soubor sitemap.xml

.
Mapa stránek je v podstatě textový soubor obsahující seznam adres URL. Pokud tento soubor není skrytý, lze jej často najít tak, že do adresy URL domény přidáte příponu /sitemap.xml (příklad: https://seomatch.senuto.com/sitemap.xml).

XML(Extensible Markup Language) je jazyk, ve kterém je mapa stránek vytvořena. Není to nic jiného než značkovací jazyk, který se používá k reprezentaci dat ve strukturované podobě, takže je snadno čitelný pro lidi i stroje.

Soubor mapy stránek by měl:

  • neobsahovat více než 50 000 adres URL,
  • .

  • být menší než 50 MB,
  • .

  • mít kódování UTF-8
  • .

Pokud je váš web větší a nesplňuje výše uvedené požadavky, nic vám samozřejmě nebrání připravit několik samostatných map stránek, např. pro produkty, pro příspěvky na blogu, pro statické stránky atd. Je ovšem nepravděpodobné, že by se sitemapy vytvářely ručně. K jejich vytvoření můžete použít různé nástroje, generátory nebo pluginy (o nich napíšu více později). Je však dobré vědět, jak má správná mapa stránek vypadat, už jen proto, abyste si po jejím vytvoření programem mohli zkontrolovat, zda je určitě dobrá.

Typy map stránek

.
Především máme několik typů map stránek. Výběr té správné závisí pouze na tom, co se na vašich stránkách nachází.

Pokud máte internetový obchod, můžete si připravit samostatnou mapu stránek pro produkty, což v případě blogu nebude úplně nutné. Rozdělení na různé mapy stránek však není povinné. Pomůže vám to uspořádat a systematizovat data. U velkých webů je to užitečné, protože se vám může stát, že se nevejdete do pokynů (50 000 adres URL), takže rozdělení na produkty, blog a kategorie je nanejvýš vhodné.

Index mapy stránek – souhrnná mapa

.
Sitemap_index.xml je soubor, ve kterém shromažďujeme všechny mapy stránek vytvořené v rámci jednoho webu.

Měl by obsahovat značky jako např:

    .
  • <sitemapindex> – informace uvedená na začátku a na konci souboru, že tento soubor bude indexem mapy stránek,
  • .

  • <sitemap> – informace uvedená na začátku a na konci souboru o tom, že se jedná o přidání mapy stránek,
  • .

  • <loc> – adresa URL mapy stránek
  • .

Příklad kódu indexu mapy stránek:

.
<?xml version=“1.0 „encoding=“UTF-8“?>

.

<sitemapindex xmlns=„http://www.sitemaps.org/schemas/sitemap/0.9“>

.

<mapa stránek>

.

<loc>http://www.dowolnadomena.com/post-sitemap.xml</loc>

.

</mapa stránek>

.

<mapa stránek>

.

<loc>http://www.dowolnadomena.com/page-sitemap.xml</loc>
</mapa stránek>

.

</sitemapindex>

.

V tomto příkladu jsem zařadil dvě mapy stránek, které jsem připravil dříve. Jejich název je samozřejmě libovolný a nemusí vypadat jako v příkladu. Jak jsem již zmínil, některé weby mapy stránek speciálně přejmenovávají. Důležité je, abyste věděli, který soubor je zodpovědný za kterou část webu.

Vlastní mapa stránek

.
Zde jde o to připravit soubor, který je velmi podobný indexu mapy stránek, ale místo mapy stránek bude obsahovat adresy URL z vašeho webu.

Bude tedy obsahovat jiné značky:

    .
  • <urlset> spolu se specifikací jmenného prostoru uvnitř značky,
  • .

  • <url> počáteční značka pro jednu stránku,
  • .

  • <loc> adresa URL jedné stránky,
  • .

Nepovinné značky mohou být umístěny uvnitř značky <url>:

  • <lastmod> předává údaje o poslední změně obsahu v dané adrese URL
  • .

  • <changefreq> poskytuje informace o četnosti změn na stránce
  • .

  • <priority> priorita adresy URL na stránce určená na stupnici 0,0 – 1,0
  • .

Příklad mapy stránek:

.
<?xml version=“1.0″ encoding=“UTF-8″?>

.

<urlset>

.

<url>

.

<loc>www.dowolnadomena.com/archiwa</loc>
<lastmod>2021-05-01</lastmod>
<priorita>0.5</priorita>
</url>

.

<url>

.

<loc>www.dowolnadomena.com/archiwa/wpis-o-sitemapie</loc>
<lastmod>2021-05-11</lastmod>
<priorita>1</priorita>
</url>

.

<url>

.

<loc>www.dowolnadomena.com/oferta</loc>
<lastmod>2020-05-11</lastmod>
<priorita>0.8</priorita>
</url>

.

</urlset>

.

V tomto příkladu jsem vytvořil mapu stránek, kde jsem u každé podstránky uvedl adresu URL, datum poslední změny a prioritu. Všimněte si, že pokud přidáte značku <lastmod> nebo <priority> do jednoho odkazu, je dobré tyto značky umístit vedle každé adresy URL.

Mapa stránek v rámci Zpráv Google

.
Pokud publikujete obsah v Zprávách Google, pak vězte, že je třeba připravit samostatnou mapu stránek speciálně pro tento obsah.

Je důležité udržovat adresy URL svých stránek aktuální. Google doporučuje, aby mapa stránek připravená pro Zprávy Google obsahovala adresy URL publikované během posledních 2 dnů. Tyto články mají být v této mapě po dobu 2 dnů. Po uplynutí této doby je můžete z mapy stránek odstranit. Důležité – v indexu zůstanou dalších 30 dní, ale pokud vám na těchto článcích záleží, můžete je přesunout do běžné mapy stránek.

Takové žonglování s články v rámci mapy stránek pod službou Zprávy Google je důležité, protože na rozdíl od jiných map stránek v ní může být pouze 1 000 článků.

Můžete také použít jiné řešení. Rozdělte mapu stránek na menší mapy stránek a umístěte je do indexu mapy stránek. Nevytvářejte však novou mapu stránek pro každou aktualizaci – to se Googlu nelíbí. Index mapy stránek by měl obsahovat maximálně 50 000 map stránek, takže jeho pomocí můžete poskytnout informace maximálně o 50 000 000 článcích.

Značky v rámci Zpráv Google se liší od dřívějších, takže:

  • <news> – informace o typu příspěvku
  • .

  • <publikace> – typ publikace
  • .

  • <name> – název zpravodajské publikace. Musí odpovídat názvu zobrazenému v článku na news.google.com
  • .

  • <language> – jazyk publikace
  • .

  • <publication_date> – datum zveřejnění ve formátu W3C
  • .

  • <title> – název novinového článku
  • .

Obsah, který se má zobrazit ve Zprávách Google, by měl být označen příslušnými strukturovanými daty. Pokyny pro uvádění tohoto typu dat ve zpravodajských příspěvcích najdete zde.

Ukázka mapy stránek v části Zprávy Google:

.
<?xml version=“1.0″ encoding=“UTF-8″?>

.

<urlset xmlns=„http://www.sitemaps.org/schemas/sitemap/0.9“

.

xmlns:news=„http://www.google.com/schemas/sitemap-news/0.9“>

.

<url>

.

<loc>http://www.dowolnadomena.com/seo/kompleksowy-poradnik-po-sitemapach</loc>
<novinky:news>

.

<novinky:publikace>

.

<novinky:name>Jak má vypadat mapa stránek</news:name>
<novinky:language>en</news:language>
</novinky:publikace>
<news:publication_date>2021-05-11</news:publication_date>
<novinky:title>Mapa stránek – jak má vypadat mapa stránek v xml</news:title>

.

</novinky:news>

.

</url>

.

</urlset>

.

Do této ukázkové mapy webu jsem zařadil pouze jeden záznam o novinkách. Pokud bych chtěl přidat další, je třeba ihned po uzavření tagu url, tedy </url>, otevřít další se stejným tagem <url> a postupovat podle uvedeného schématu.

Video mapy stránek

.
Vytvoření takové mapy vám dává možnost zobrazit další informace o videích, která se na vašem webu nacházejí. Pokyny pro velikost tohoto typu mapy stránek jsou stejné jako u ostatních typů, s výjimkou map stránek v rámci služby Google News.

Společnost Google doporučuje, aby takové mapy stránek obsahovaly pouze stránky související s profilem webu, tj. například u obchodu s elektronikou recenze zařízení nebo u videotéky stránku s portfoliem. Proto si můžeme odpustit umístění alespoň krátkých vložek nebo videí propagujících naše obchodní partnery.

Nezapomeňte také na to, abyste neblokovali robota Google prostřednictvím souboru robots.txt. Tím byste efektivně ztížili přístup robota Google k vašemu videu. Totéž platí pro odesílání videí, která vyžadují přihlášení. Bohužel – to neprojde. Videa musí být veřejně přístupná.

Povinné značky, které musí taková mapa obsahovat:

  • <url> – počáteční tag
  • .

  • <loc> – url adresa, na které se video nachází
  • .

  • <video:video> – počáteční tag, do kterého vložíme údaje o videu
  • .

  • <video:thumbnail_loc> – odkaz na miniaturu videa
  • .

  • <video:title> – název videa
  • .

  • <video:description> – popis videa, maximálně 2048 znaků
  • .

  • <video:content_loc> – url adresa videa
  • .

  • <video:player_loc> – url adresa přehrávače videa

Doporučené tagy:

  • <video:duration> – udává délku videa v sekundách od 1 do 28800 – 8 hodin, není třeba počítat ????
  • <video:expiration_date> – datum, po kterém již video nebude k dispozici, samozřejmě ve formátu podle pokynů W3C. Můžete jej vynechat, pokud chcete, aby toto video bylo na vašich stránkách dostupné stále.

Příklad: V případě, že se jedná o video, které se nachází na internetu, můžete si vybrat, jestli chcete, aby se video nacházelo na internetu:

.
<urlset xmlns=„http://www.sitemaps.org/schemas/sitemap/0.9“

.

xmlns:video=„http://www.google.com/schemas/sitemap-video/1.1“>

.

<url>

.

<loc>http://www.dowolnadmena.com/strona-z-filmem</loc>
<video:video> <video:thumbnail_loc>http://www.anydomain.com/media/miniature_your_film.jpg</video:thumbnail_loc>

.

<video:title>Titulek vašeho videa</video:title>

.

<video:description>Popis videa, pro které právě vytváříte mapu stránky</video:description>

.

<video:content_loc>
www.dowolnadomena.com/media/link_do_twojego_filmu.mp4</video:content_loc>

.

<video:player_loc>
http://www.dowolnadomena.com/videoplayer.php?link_do_twojego_filmu=123

.

</video:player_loc>

.

<video:trvání>600</video:trvání>
<video:expiration_date>2021-11-05T19:20:30+08:00</video:expiration_date>
<video:publication_date>2007-11-05T19:20:30+08:00</video:publication_date>
.

Mapa stránek pro grafiku a fotografie

.

.

Pokyny pro velikost mapy stránek pro grafiku a fotografie jsou stejné jako u ostatních, samozřejmě bez Zpráv Google.

Při vytváření tohoto typu mapy stránek použijte jmenný prostor xml: xmlns_image=“http://www.google.com/schemas/sitemap-image/1.1″.

Stejně jako každý typ mapy stránek má i tento typ své vlastní jedinečné značky:

    .
  • <image:image> – informace o jednom obrázku
  • .

  • <image:loc> – odkaz na grafiku
  • .

Nepovinné značky:

  • <image:caption> – popisek obrázku
  • .

  • <image:geo_location> – zeměpisná poloha obrázku
  • .

  • <image:title> – název obrázku
  • .

  • <image:license> – URL adresa licence obrázku
  • .

Příklad:

.
<?xml version=“1.0″ encoding=“UTF-8″?>

.

<urlset xmlns=„http://www.sitemaps.org/schemas/sitemap/0.9“

.

xmlns:image=„http://www.google.com/schemas/sitemap-image/1.1“>

.

<url>

.

<loc>www.dowolnadomena.com/strona_ze_zdjęciem</loc>
<image:image> <image:loc>www.anydomain.com/media/photo_from_page1.jpg</image:loc>
</image:image>

.

<image:image>

.

<image:loc>www.dowolnadomena.com/media/zdjęcie_ze_strony2.jpg

.

</image:image>

.

</url>

.

</urlset>

.

V tomto příkladu jsem ukázal, jak vytvořit mapu stránek pro jednu podstránku se dvěma fotografiemi. Pokud by těchto obrázků bylo více, začnu novou značkou </url> před značkou <image:image>. V případě, že byste chtěli do mapy přidat novou stránku, začnete od </urlset> s novým tagem <url> a budete postupovat podle vzoru.

Jak vytvořit dobrou mapu stránek?

.
Nyní, když už víte, jaké typy map stránek máte k dispozici a jaké je schéma jejich tvorby, bych vám rád poskytl několik tipů. Jejich uplatněním budete mít jistotu, že Google správně pochopí vaše záměry.

Nejvíce práce je s absolutními odkazy. Je to poměrně monotónní práce, nicméně je třeba se na ni co nejvíce zaměřit. Odkazy, které umístíte do mapy stránek, musí být přesně stejné jako ty, které jsou na vašich stránkách. Pokud je váš web https://www.twojastrona.pl, pak odkaz uložený v mapě stránek nesmí mít tento tvar: https://twojastrona.pl.

V mapě stránek uvádějte pouze kanonické adresy URL. Pokud používáte své stránky ve dvou verzích, např. s www a bez www, pak si vyberte tu, která vám vyhovuje, ale spíše doporučuji tu, která vám vyhovuje více, a v ní mapu stránek zveřejněte. V druhé verzi webu nastavte přesměrování na verzi s mapou stránek.

Všechny adresy URL, které jsou v mapě stránek, musí být umístěny tak, aby je server, na kterém jsou, mohl přečíst. Pokud však mapu stránek neprovádíte ručně, pravděpodobně se o to nebudete muset starat.

Poslední rada se týká znaků používaných v mapách stránek. Jak jsem napsal na začátku, mapa stránek musí být vytvořena ve formátu UTF-8. V tomto případě je nutné, aby mapa stránek byla ve formátu UTF-8. V důsledku toho v ní nemůžete používat polské znaky. Pokud název vaší domény obsahuje polský znak, nezapomeňte, že se převede na odpovídající řetězec. Například doména wisła.pl bude mít takový řetězec: xn--wisa-21a.pl.

Jaké adresy URL vyloučit z mapy stránek?

.
Mapa stránek má ve svém názvu mapu z nějakého důvodu. Připomeňme si základní úkol mapy. Ten, kdo ji používá, se má co nejrychleji dostat na místo, které si vybral. Někdy se však stává, že mapa je zastaralá a místo rychlé trasy se člověk setká s výtluky na silnici a objížďkou přes výmoly a další díry. Nakonec osoba do cíle dorazí, ale po menším tápání a stresu z toho, že musí hledat jinou trasu, protože neví, kam ji tato objížďka zavede.

Nyní místo slova „osoba“ použijte základy Googlebot. Vidíte? Struktura webových stránek musí být prezentována jednoduše a konzistentně. Proto nezapomeňte do mapy stránek zahrnout stránky, které:

  • neexistují – ty s chybou 404
  • .

  • vedou na adresy URL s přesměrováním 301,302 – tím pouze duplikujete návštěvy robota Google na cílové stránce
  • .

  • jsou blokovány souborem robots.txt
  • .

  • vyžadují přihlášení
  • .

  • jsou chráněny heslem
  • .

  • stránky pro předpisy, RODO atd
  • .

Generátory mapy stránek

.
Ruční práce na mapě stránek pro velké weby je prakticky nemožná. Naštěstí můžete použít programy, weby nebo pluginy, které vám pomohou vytvořit dokonalou mapu stránek.

V případě systému WordPress můžete použít pluginy RankMath nebo YoastSEO. Jedná se o dvě kombinace, které pomáhají optimalizovat SEO vašeho webu a mimo jiné za vás provedou mapu stránek. Kromě těchto dvou je velmi oblíbený doplněk XML Sitemaps, který slouží právě ke generování map stránek.

Takto vypadá mapa stránek vygenerovaná nástrojem RankMath

Pokud však váš web není založen na systému CMS, můžete použít cloudová řešení:

K dispozici je také třetí možnost. Použití crawleru, který prohledá vaše webové stránky. Osobně používám Screaming Frog a pomocí něj můžete samozřejmě vygenerovat mapu stránek. V bezplatné verzi až do 500 URL.

Zde najdete návod, jak vygenerovat mapu stránek pomocí Srcreaming Frog.

Nezapomeňte, že generátor mapy stránek je užitečný nástroj pro vytvoření mapy stránek, nicméně před odesláním mapy stránek společnosti Google nebo jejím umístěním na server je vždy dobré ji ručně zkontrolovat.

Kam umístit soubor sitemap.xml?

.
Mapu stránek lze zveřejnit kdekoli na webu. Mějte však na paměti, že ovlivňuje prvky, které se nacházejí pouze v daném adresáři. Nejčastějším řešením je umístit mapu webu do kořenového adresáře webu.

Odeslání mapy stránek společnosti Google

.
Pomalu se blížíme ke konci naší cesty. Už víte, co je to mapa stránek, jaké existují typy map stránek, znáte správné postupy a víte, kam na serveru umístit soubory.

Nyní je čas na poslední krok, kterým je odeslání souboru sitemap.xml společnosti Google.

Nejjednodušší způsob, jak to provést, je prostřednictvím služby Google Search Console. Pokud nevíte, co je GSC, zvu vás k přečtení kompletního průvodce službou Google Search Console..

V něm je od A do Z popsáno vše o tomto nástroji od Googlu.

Já se v této části zaměřím na sekci Index a záložku Mapa webu. Jedná se o kouzelné místo, kde můžete nahlásit všechny své mapy stránek. Když se tam čas od času podíváte, zjistíte, kdy se Google naposledy podíval na vaši mapu stránek – tato informace se nachází ve sloupci Naposledy přečteno. Vedle vašich map stránek se také nachází ikona grafu. Když na ni kliknete, budete přesměrováni na kartu Stav, kde můžete podrobně zkontrolovat, zda daná mapa stránek odesílá chybné adresy URL.

Google Search Console – karta Sitemap

.
Existuje ještě jeden způsob, jak ukázat robotovi Google, zda a kde máme mapu stránek. Tímto řešením je soubor robots.txt. Stačí, když v tomto souboru použijeme směrnici:

Sitemap: anydomain.com/sitemap.xml

A je to. Samozřejmě, pokud je těchto map stránek více, nic vám nebrání v tom, abyste je do tohoto souboru zahrnuli.

Na co ještě stojí za to pamatovat při vytváření souboru sitemap.xml

.
Určitě se vyplatí nezapomenout se do něj čas od času podívat a provést pravidelnou kontrolu, zda je s ním určitě vše v pořádku. V tom vám jistě pomůže služba Google Search Console.

A nezapomínejme ani na změny, které se na webu občas dějí, jako je například instalace SSL certifikátu, která zcela změní naše odkazy. Pokud nepoužíváme žádný doplněk, budete muset co nejdříve vše provést ručně.

Nezapomeňte na stránky, které jste odstranili, nebo na stránky s přesměrováním. Někdy něco odstraníte, někdy něco upravíte nebo změníte a mapa stránek, jaká byla, taková je.

Jak vidíte, mapa stránek je trochu legrace a spousta pokynů, ale dobře provedená pomůže robotovi Googlebot lépe poznat vaše stránky. A nezapomeňte na aktualizace. Buďte lepší než Google a aktualizujte mapy stránek rychleji!
FAQ_Here

Share this post:  
Jakub Trybuła

SEO Specialist

Vyzkoušejte Senuto na 14 dní zdarma

Vyzkoušejte zdarma

Vyzkoušejte Senuto Suite na 14 dní zdarma

Pojďme na to!

Seznamte se se Senuto v hodinovém online tréninku. Zdarma.

Vyberte si termín a přihlaste se