Sitemap.xml – čo to je a ako vytvoriť mapu stránok vo formáte XML

SEO
Jakub TrybułaJakub Trybuła
Publikovaný: 17.05.2021
20 minút

Mapa stránok obsahuje informácie o obsahu webovej lokality. Je to súbor väčšinou pripravený vo formáte XML, ktorý sa umiestňuje priamo na server. Vďaka mape stránok Google má bot, ktorý navštívi našu stránku, prístup k obsahu stránky a jej štruktúre. Z tohto textu sa dozviete, čo je to mapa stránok, spoznáte rôzne typy máp stránok a naučíte sa ich vytvárať.

Na úvod si prejdeme typy máp stránok, aby ste získali predstavu o tom, ktorá z nich by mohla byť pre vašu lokalitu najvhodnejšia a čo by mala obsahovať. Niektoré prvky je potrebné upraviť a doplniť, ale ak sa naučíte všeobecné zásady a budete sa riadiť tým, čo som tu napísal, nemali by ste mať problém.

Neskôr v texte odpoviem na azda najdôležitejšie otázky: ako takúto mapu vytvoriť a ako ju odoslať spoločnosti Google pomocou nástroja Google Search Console.

Nemusíte byť odborník na se, všetko toto je pomerne jednoduché urobiť aj pre „netechnického“ človeka, pod jednou podmienkou – musíte vedieť čo a ako. Začnime teda objavovať tajomstvá mapy stránok!

Prečo je mapa stránok dôležitá?

.
Najväčším prínosom súboru sitemap.xml pre vašu stránku je uľahčenie práce robotom spoločnosti Google. Googlebot prejde vašu stránku rýchlejšie, takže sa zvýši počet indexovaných stránok vo vyhľadávači. Toto bude fungovať obzvlášť dobre pri veľkých stránkach, pretože indexovacie roboty budú určite vedieť, že na stránke sa nachádza konkrétna URL. Je to dôležité v prípade adries na nové položky alebo podstránky.

Vďaka súboru sitemap.xml sa indexovacie roboty dokážu pomerne efektívne a rýchlo dostať do zákutí stránok, ktoré nepraktizujú dobré pravidlá vnútorného prepojenia.

Treba tiež vziať do úvahy, že v porovnaní s webmi bez mapy stránok získate výhodu vďaka rýchlejšiemu dosiahnutiu zákutí vášho webu robotom Google….

Okrem samotných odkazov na podstránky môžete poskytnúť Googlebotovi informácie o:

    .
  • dátum poslednej zmeny na uvedenej url,
  • .

  • názov položky,
  • .

  • grafika,
  • .

  • jazyk, v ktorom bol záznam vytvorený (hreflangs),
  • .

  • priorita podstránky v doméne
  • .

Čo je súbor sitemap.xml

.
Sitemap je v podstate textový súbor obsahujúci zoznam adries URL. Ak tento súbor nie je skrytý, často ho možno nájsť pridaním v adrese URL domény prípony /sitemap.xml (príklad: https://seomatch.senuto.com/sitemap.xml).

XML(Extensible Markup Language) je jazyk, v ktorom je vytvorená mapa stránok. Nie je to nič iné ako značkovací jazyk, ktorý sa používa na reprezentáciu údajov štruktúrovaným spôsobom, vďaka čomu sú ľahko čitateľné pre ľudí aj stroje.

Súbor s mapou lokality by mal:

  • obsahovať najviac 50 000 adries URL,
  • .

  • byť menší ako 50 MB,
  • .

  • mať kódovanie UTF-8
  • .

Samozrejme, ak je vaša stránka väčšia a nespĺňa vyššie uvedené požiadavky, nič vám nebráni pripraviť niekoľko samostatných máp stránok, napr. pre produkty, pre príspevky na blogu, pre statické stránky atď. Samozrejme, je nepravdepodobné, že by sa sitemapy vytvárali ručne. Na ich vytvorenie môžete použiť rôzne nástroje, generátory alebo pluginy (o nich napíšem neskôr). Je však dobré vedieť, ako má správna mapa stránok vyzerať, už len preto, aby ste si po jej vytvorení programom mohli skontrolovať, či je určite dobrá.

Typy máp stránok

.
V prvom rade máme niekoľko typov máp stránok. Výber tej správnej závisí výlučne od toho, čo sa nachádza na vašom webe.

Ak máte internetový obchod, môžete pripraviť samostatnú mapu stránok pre produkty, čo v prípade blogu nebude úplne potrebné. Rozdelenie na rôzne mapy stránok však nie je povinné. Pomôže vám to usporiadať a systematizovať údaje. V prípade veľkých lokalít je to užitočné, pretože sa vám môže stať, že sa nezmestíte do usmernení (50 000 adries URL), preto je rozdelenie na produkty, blog a kategórie nanajvýš vhodné.

Index mapy stránok – súhrnná mapa

.
Sitemap_index.xml je súbor, v ktorom zhromažďujeme všetky mapy stránok vytvorené v rámci jedného webu.

Mal by obsahovať značky ako napr:

    .
  • <sitemapindex> – informácia uvedená na začiatku a na konci súboru, že tento súbor bude indexom mapy stránok,
  • .

  • <sitemap> – informácia uvedená na začiatku a na konci súboru o tom, že sa pridá mapa stránok,
  • .

  • <loc> – adresa URL mapy lokality
  • .

Príklad kódu indexu mapy lokality:

.
<?xml version=“1.0 „encoding=“UTF-8“?>

.

<sitemapindex xmlns=„http://www.sitemaps.org/schemas/sitemap/0.9“>

.

<mapa stránky>

.

<loc>http://www.dowolnadomena.com/post-sitemap.xml</loc>

.

</mapa stránky>

.

<mapa stránky>

.

<loc>http://www.dowolnadomena.com/page-sitemap.xml</loc>
</mapa stránky>

.

</sitemapindex>

.

V tomto príklade som zahrnul dve mapy lokalít, ktoré som pripravil skôr. Samozrejme, názov je ľubovoľný a nemusí vyzerať ako v príklade. Ako som už spomenul, niektoré weby mapy stránok špeciálne premenúvajú. Dôležité je, aby ste vedeli, ktorý súbor je zodpovedný za ktorú časť lokality.

Vlastná mapa lokality

.
Ide tu o prípravu súboru, ktorý je veľmi podobný indexu mapy stránok, ale namiesto mapy stránok bude obsahovať adresy URL z vášho webu.

Preto bude obsahovať iné značky:

    .
  • <urlset> spolu so špecifikáciou menného priestoru vnútri značky,
  • .

  • <url> počiatočná značka pre jednu stránku,
  • .

  • <loc> adresa URL jednej stránky,
  • .

Nepovinné značky môžu byť umiestnené vo vnútri značky <url>:

  • <lastmod> prenáša údaje o poslednej zmene obsahu v danej adrese URL
  • .

  • <changefreq> poskytuje informácie o frekvencii zmien na stránke
  • .

  • <priority> priorita adresy URL na stránke určená na stupnici 0,0 – 1,0
  • .

Príklad mapy lokality:

.
<?xml version=“1.0″ encoding=“UTF-8″?>

.

<urlset>

.

<url>

.

<loc>www.dowolnadomena.com/archiwa</loc>
<lastmod>2021-05-01</lastmod>
<priorita>0.5</priorita>
</url>

.

<url>

.

<loc>www.dowolnadomena.com/archiwa/wpis-o-sitemapie</loc>
<lastmod>2021-05-11</lastmod>
<priorita>1</priorita>
</url>

.

<url>

.

<loc>www.dowolnadomena.com/oferta</loc>
<lastmod>2020-05-11</lastmod>
<priorita>0.8</priorita>
</url>

.

</urlset>

.

V tomto príklade som vytvoril mapu stránok, kde som pre každú podstránku uviedol adresu URL, dátum poslednej úpravy a prioritu. Všimnite si, že ak pridáte značku <lastmod> alebo <priority> do jedného odkazu, je dobrým zvykom umiestniť tieto značky vedľa každej adresy URL.

Mapa stránok v rámci služby Google News

.
Ak publikujete obsah v Zprávach Google, potom vedzte, že musíte pripraviť samostatnú mapu stránok špeciálne pre tento obsah.

Je dôležité udržiavať adresy URL vášho webu aktuálne. Spoločnosť Google navrhuje, aby mapa stránok pripravená pre službu Google News obsahovala adresy URL uverejnené za posledné 2 dni. Tieto články majú byť v tejto mape 2 dni. Po uplynutí tejto doby ich môžete z mapy stránok odstrániť. Dôležité – v indexe zostanú nasledujúcich 30 dní, ale ak vám na týchto článkoch záleží, môžete ich presunúť do bežnej mapy stránok.

Takéto žonglovanie s článkami v rámci mapy stránok pod službou Google News je dôležité, pretože na rozdiel od iných máp stránok v nej môže byť len 1 000 článkov.

Môžete použiť aj iné riešenie. Rozdeľte mapu lokality na menšie mapy lokality a umiestnite ich do indexu mapy lokality. Nevytvárajte však novú mapu stránok pre každú aktualizáciu – Google to nemá rád. Index mapy stránok by mal obsahovať maximálne 50 000 máp stránok, takže pomocou neho môžete poskytnúť informácie maximálne o 50 000 000 článkoch.

Značky v rámci služby Google News sa líšia od tých predchádzajúcich, takže:

    .
  • <news> – informácie o type záznamu
  • .

  • <publikácia> – typ publikácie
  • .

  • <name> – názov spravodajskej publikácie. Musí sa zhodovať s názvom zobrazeným v článku na stránke news.google.com
  • .

  • <language> – jazyk publikácie
  • .

  • <publication_date> – dátum uverejnenia vo formáte W3C
  • .

  • <title> – názov novinového článku
  • .

Obsah, ktorý sa má zobraziť v službe Google News, by mal byť označený príslušnými štruktúrovanými údajmi. Pokyny na zahrnutie tohto typu údajov do spravodajských príspevkov nájdete tade.

Vzorová mapa lokality v časti Správy Google:

.
<?xml version=“1.0″ encoding=“UTF-8″?>

.

<urlset xmlns=„http://www.sitemaps.org/schemas/sitemap/0.9“

.

xmlns:news=„http://www.google.com/schemas/sitemap-news/0.9“>

.

<url>

.

<loc>http://www.dowolnadomena.com/seo/kompleksowy-poradnik-po-sitemapach</loc>
<novinky:news>

.

<news:publication>

.

<novinky:name>Ako má vyzerať mapa stránky</news:name>
<novinky:language>en</news:language>
</news:publication>
<news:publication_date>2021-05-11</news:publication_date>
<novinky:title>Mapa stránok – ako má vyzerať mapa stránok xml</news:title>

.

</novinky:news>

.

</url>

.

</urlset>

.

V tejto ukážke mapy stránky som zahrnul iba jeden záznam o novinkách. Ak by som chcel pridať ďalšiu, hneď po uzavretí tagu url, t. j. </url>, je potrebné otvoriť ďalšiu s rovnakým tagom <url> a postupovať podľa uvedenej schémy.

Video mapy stránok

.
Vytvorenie takejto mapy vám dáva možnosť zobraziť ďalšie informácie o videách, ktoré sa nachádzajú na vašej stránke. Pokyny pre veľkosť tohto typu mapy stránok sú rovnaké ako pre ostatné typy, s výnimkou máp stránok v rámci služby Google News.

Spoločnosť Google odporúča, aby takéto mapy stránok obsahovali len stránky súvisiace s profilom lokality, t. j. napríklad v prípade obchodu s elektronikou recenzie zariadení alebo v prípade videotéky stránku s portfóliom. Preto si môžeme odpustiť umiestnenie aspoň krátkych vložiek alebo videí propagujúcich našich obchodných partnerov.

Nezabudnite tiež na to, aby ste neblokovali robota Google prostredníctvom súboru robots.txt. Tým by ste účinne sťažili prístup robota Google k vášmu videu. To isté platí pre odosielanie videí, ktoré vyžadujú prihlásenie. Bohužiaľ – to neprejde. Videá musia byť verejne prístupné.

Povinné značky, ktoré musia byť súčasťou takejto mapy:

  • <url> – začiatočný tag
  • .

  • <loc> – url adresa, kde sa video nachádza
  • .

  • <video:video> – začiatočný tag, do ktorého vložíme údaje o videu
  • .

  • <video:thumbnail_loc> – odkaz na miniatúru videa
  • .

  • <video:title> – názov videa
  • .

  • <video:description> – popis videa, maximálne 2048 znakov
  • .

  • <video:content_loc> – url adresa videa
  • .

  • <video:player_loc> – url prehrávača videa

Odporúčané značky:

  • <video:duration> – určuje dĺžku videa v sekundách od 1 do 28800 – 8 hodín, nie je potrebné počítať ????
  • <video:expiration_date> – dátum, po ktorom už video nebude k dispozícii, samozrejme vo formáte podľa smerníc W3C. Môžete ho vynechať, ak chcete, aby toto video bolo na vašej stránke dostupné stále.

Príklad: V prípade, že ste si prečítali článok, ktorý sa nachádza na stránke, môžete si ho stiahnuť:

.
<urlset xmlns=„http://www.sitemaps.org/schemas/sitemap/0.9“

.

xmlns:video=„http://www.google.com/schemas/sitemap-video/1.1“>

.

<url>

.

<loc>http://www.dowolnadmena.com/strona-z-filmu</loc>
<video:video> <video:thumbnail_loc>http://www.anydomain.com/media/miniature_your_film.jpg</video:thumbnail_loc>

.

<video:title>Titul vášho videa</video:title>

.

<video:description>Opis videa, pre ktoré práve vytvárate mapu stránky</video:description>

.

<video:content_loc>
www.dowolnadomena.com/media/link_do_twojego_filmu.mp4</video:content_loc>

.

<video:player_loc>
http://www.dowolnadomena.com/videoplayer.php?link_do_twojego_filmu=123

.

</video:player_loc>

.

<video:trvanie>600</video:trvanie>
<video:expiration_date>2021-11-05T19:20:30+08:00</video:expiration_date>
<video:publication_date>2007-11-05T19:20:30+08:00</video:publication_date>
.

Mapa_stránky pre grafiku a fotografie

.

.

Pokyny pre veľkosť mapy lokality pre grafiku a fotografie sú rovnaké ako pri ostatných, samozrejme, bez správ Google.

Pri vytváraní tohto typu mapy stránok použite menný priestor xml: xmlns_image=“http://www.google.com/schemas/sitemap-image/1.1″.

Ako každý typ mapy stránok, aj tento má svoje vlastné jedinečné značky:

  • <image:image> – informácie o jednom obrázku
  • .

  • <image:loc> – odkaz na grafiku
  • .

Nepovinné značky:

  • <image:caption> – titulok obrázka
  • .

  • <image:geo_location> – geografická poloha obrázka
  • .

  • <image:title> – názov obrázka
  • .

  • <image:license> – adresa URL licencie obrázka

Príklad:

.
<?xml version=“1.0″ encoding=“UTF-8″?>

.

<urlset xmlns=„http://www.sitemaps.org/schemas/sitemap/0.9“

.

xmlns:image=„http://www.google.com/schemas/sitemap-image/1.1“>

.

<url>

.

<loc>www.dowolnadomena.com/strona_ze_zdjęciem</loc>
<obraz:image> <obraz:loc>www.anydomain.com/media/photo_from_page1.jpg</image:loc>
</image:image>

.

<image:image>

.

<image:loc>www.dowolnadomena.com/media/zdjęcie_ze_strony2.jpg

.

</image:image>

.

</url>

.

</urlset>

.

V tomto príklade som ukázal, ako vytvoriť mapu stránky pre jednu podstránku s dvoma fotografiami. Ak by týchto obrázkov bolo viac, začnem s novou značkou </url> pred značkou <image:image>. V prípade, že by ste chceli do mapy pridať novú stránku, začnete od </urlset> s novým tagom <url> a postupujete podľa vzoru.

Ako vytvoriť dobrú mapu lokality?

.
Teraz, keď už viete, aké typy máp stránok máte k dispozícii a aká je schéma ich tvorby, rád by som vám poskytol niekoľko tipov. Ich uplatnením budete mať istotu, že Google správne pochopí vaše zámery.

Najviac práce je s absolútnymi odkazmi. Je to pomerne monotónna práca, avšak musíte sa na ňu čo najviac zamerať. Odkazy, ktoré umiestňujete do mapy stránok, musia byť presne také isté ako tie, ktoré sa nachádzajú na vašej stránke. Ak je vaša stránka https://www.twojastrona.pl, potom odkaz uložený v mape stránok nemôže mať tento tvar: https://twojastrona.pl.

V mape stránok uvádzajte len kanonické adresy URL. Ak používate svoju stránku v dvoch verziách, napr. s www a bez www, potom si vyberte tú verziu, ktorá sa vám páči, ale skôr odporúčam tú, ktorá sa vám páči viac, a v nej zverejnite mapu stránok. V druhej verzii webu nastavte presmerovania na verziu s mapou stránok.

Všetky adresy URL, ktoré sú v mape stránok, musia byť umiestnené tak, aby ich server, na ktorom sa nachádzajú, mohol prečítať. Ak však mapu stránok nerobíte ručne, pravdepodobne sa o to nebudete musieť starať.

Posledná rada sa týka znakov používaných v mapách stránok. Ako som napísal na začiatku, mapa stránok musí byť vytvorená vo formáte UTF-8. V dôsledku toho v nej nemôžete používať poľské znaky. Ak názov vašej domény obsahuje poľský znak, nezabudnite, že sa prevedie na príslušný reťazec. Napríklad doména wisła.pl bude mať takýto reťazec: xn--wisa-21a.pl

Aké adresy URL vylúčiť z mapy stránok?

.
Mapa stránok má vo svojom názve mapu z určitého dôvodu. Pripomeňme si základnú úlohu mapy. Osoba, ktorá ju používa, sa má čo najrýchlejšie dostať na miesto, ktoré si vybrala. Niekedy sa však stane, že mapa je neaktuálna a namiesto rýchlej trasy sa osoba stretne s výtlkmi na ceste a obchádzkou cez výmole a iné jamy. Nakoniec sa osoba dostane do cieľa, ale po menšom trápení a strese z toho, že musí hľadať inú trasu, pretože nevie, kam ju táto obchádzka zavedie.

Teraz namiesto slova „osoba“ použite základy Googlebot. Vidíte? štruktúra webovej stránky musí byť prezentovaná jednoducho a konzistentne. Preto nezabudnite do mapy stránok zahrnúť stránky, ktoré:

  • neexistujú – tie, ktoré majú chybu 404
  • .

  • vedú na adresy URL s presmerovaniami 301,302 – takto budete iba duplikovať návštevy robotov Google na cieľovú stránku
  • .

  • sú blokované súborom robots.txt
  • .

  • vyžadujú prihlásenie
  • .

  • sú chránené heslom
  • .

  • stránky pre predpisy, RODO atď
  • .

Generátory mapy stránok

.
Ručná práca na mape stránok pre veľké weby je prakticky nemožná. Našťastie môžete použiť programy, stránky alebo pluginy, ktoré vám pomôžu vytvoriť dokonalú mapu stránok.

V prípade systému WordPress môžete použiť doplnky RankMath alebo YoastSEO. Ide o dve kombinácie, ktoré pomáhajú optimalizovať SEO vášho webu a okrem iného za vás vykonajú mapu lokality. Okrem týchto dvoch je veľmi obľúbený aj doplnok XML Sitemaps, ktorý slúži práve na generovanie mapy stránok.

Takto vyzerá mapa stránok vygenerovaná nástrojom RankMath

Ak však vaša stránka nie je založená na systéme CMS, môžete použiť cloudové riešenia:

K dispozícii je aj tretia možnosť. Použitie prehľadávača, ktorý prehľadá vašu webovú stránku. Osobne používam Screaming Frog a pomocou neho môžete, samozrejme, vygenerovať mapu stránok. V bezplatnej verzii až do 500 adries URL.

Tu nájdete návod na generovanie mapy stránok pomocou aplikácie Srcreaming Frog.

Nezabudnite, že generátor mapy stránok je užitočný nástroj na vytvorenie mapy stránok, avšak pred odoslaním mapy stránok spoločnosti Google alebo jej umiestnením na server je vždy dobré ju manuálne skontrolovať.

Kam umiestniť súbor sitemap.xml?

.
Mapu lokality môžete zverejniť kdekoľvek na lokalite. Majte však na pamäti, že ovplyvňuje prvky, ktoré sa nachádzajú len v danom adresári. Najbežnejším riešením je umiestniť mapu lokality do koreňového adresára lokality.

Odoslanie mapy lokality spoločnosti Google

.
Pomaly sa blížime ku koncu našej cesty. Už viete, čo je to mapa lokality, aké typy máp lokality existujú, poznáte osvedčené postupy a viete, kam na serveri umiestniť súbory.

Teraz je čas na posledný krok, ktorým je odoslanie súboru sitemap.xml spoločnosti Google.

Najjednoduchší spôsob, ako to urobiť, je prostredníctvom služby Google Search Console. Ak neviete, čo je GSC, pozývam vás, aby ste si prečítali kompletného sprievodcu konzolou vyhľadávania Google.

V nej je od A po Z popísané všetko o tomto nástroji od spoločnosti Google.

Ja sa v tejto časti zameriam na časť Index a záložku Mapa stránok. Toto je čarovné miesto, kde môžete nahlasovať všetky svoje mapy stránok. Tým, že sa tam z času na čas pozriete, zistíte, kedy sa Google naposledy pozrel na vašu mapu stránok – táto informácia sa nachádza v stĺpci Posledné čítanie. Vedľa vašich máp stránok sa nachádza aj ikona grafu. Keď na ňu kliknete, budete presmerovaní na kartu Stav, kde môžete podrobne skontrolovať, či daná mapa stránok odosiela chybné adresy URL.

Google Search Console – karta Sitemap

.
Existuje aj ďalší spôsob, ako zobraziť Googlebotovi, či a kde máme mapu stránok. Týmto riešením je súbor robots.txt. Jediné, čo musíme urobiť, je použiť smernicu v tomto súbore:

Sitemap: anydomain.com/sitemap.xml

A je to. Samozrejme, ak je takýchto máp stránok viac, nič vám nebráni zahrnúť ich do tohto súboru.

Na čo ďalšie sa oplatí pamätať pri vytváraní súboru sitemap.xml

.
Určite sa oplatí nezabudnúť sa naň z času na čas pozrieť a urobiť pravidelnú kontrolu, či ste si istí, že je s ním všetko v poriadku. V tomto vám určite pomôže služba Google Search Console.

A nezabúdajme ani na zmeny, ktoré sa na stránke občas udejú, napríklad inštalácia certifikátu SSL, ktorá úplne zmení naše odkazy. Ak nepoužívame doplnok, budete musieť čo najskôr vykonať všetky práce ručne.

Nezabudnite na stránky, ktoré ste odstránili, alebo na stránky s presmerovaniami. Niekedy niečo odstránite, niekedy niečo upravíte alebo zmeníte a mapa stránok, aká bola, taká je.

Ako vidíte, mapa stránok je trochu zábavy a veľa usmernení, ale dobre urobená pomôže robotovi Google lepšie spoznať vašu stránku. A nezabudnite na aktualizácie. Buďte lepší ako Google a aktualizujte svoje mapy stránok rýchlejšie!

Zdieľajte tento príspevok:  
Jakub Trybuła

SEO Specialist

Vyskúšajte Senuto Suite na 14 dní zadarmo

Vyskúšajte si 14-dňovú bezplatnú verziu

Poznaj Senuto na 1-godzinnym szkoleniu online. Za darmo.

Vyberte si termín a prihláste sa