Duplikace obsahu – najděte a vyřešte tento problém

SEO
Marcin CichockiMarcin Cichocki
Opublikowano: 26.08.2021
15 minut

Duplicitní obsah je závažný problém, který může vést ke snížení viditelnosti podstránek a tím výrazně snížit organickou návštěvnost webu. Podívejte se, jak duplicitní obsah najít a efektivně se s ním vypořádat.

 

Co je to duplicitní obsah?

.
Duplicitní obsah je jev, který zahrnuje duplicitní (duplicitní) obsah na podstránkách v rámci jednoho webu – interní duplicita; nebo na různých externích webech – externí duplicita. Pokud se tedy stejný obsah objevuje pod různými adresami URL, pak máme co do činění s jevem známým také jako duplicitní obsah.

K duplicitě může dojít v důsledku omylu, krádeže obsahu nebo vytvořením chyb ve fázi technické SEO optimalizace webové stránky nebo internetového obchodu.

Problém externí duplicity obsahu v oblasti elektronického obchodování obvykle spočívá v bezmyšlenkovitém kopírování popisů produktů nebo kategorií z webových stránek výrobců.

S interní duplikací se obvykle setkáváme v důsledku zveřejnění stejných popisů, které se týkají produktů, jež se liší pouze v detailech – například velikosti nebo barvy.

 

Jaký je rozdíl mezi duplikací obsahu a kanibalizací?

.
Rozdíl mezi duplikací obsahu a kanibalizací klíčových slov je poměrně důležitý.

Duplikace obsahu je jakýkoli nevyhnutelný (identický) obsah, který se objevuje na více než jedné adrese URL. Jinými slovy: k duplikaci obsahu dochází, když se stejný větší kus textu objeví na dvou, třech nebo více stránkách v rámci webu nebo mezi různými weby.

Ke kanibalizaci klíčových slov dochází, když jsou v rámci jednoho webu zveřejněny různé podstránky s různým obsahem, které jsou optimalizovány pro stejné klíčové fráze.

Kanibalizace klíčových slov je jev, který se může týkat pouze jednoho webu. Duplikace obsahu může vznikat jak v rámci jednoho webu, tak mezi externími weby.

Navíc duplikace obsahu může současně vést ke kanibalizaci klíčových slov (stejné klíčové fráze ve stejném obsahu). Kanibalizace frází však nevede současně k duplikaci obsahu (stejné klíčové fráze, jiný obsah).

 

Škodí duplikace obsahu SEO?

.
Rozhodně ano, duplikace obsahu poškozuje SEO. A to hodně. Duplicitní obsah negativně ovlivňuje viditelnost stránek s duplicitním obsahem a může vést ke snížení pozice webu v organických výsledcích vyhledávání.

Proč duplicitní obsah škodí SEO? Algoritmy Googlu při procházení několika adres URL webu se stejným obsahem nevědí, která podstránka je důležitější a kterou by měly ve výsledcích vyhledávání zobrazovat výše.

V důsledku toho se Google může chovat několika způsoby.

  • Poprvé mohou algoritmy Google zobrazit všechny adresy URL vedle sebe, ale na rozhodně nižších pozicích (např. na 2., 3. nebo dokonce 4. stránce).
  • Druhé, Google může podle svého rozmaru vybrat pouze jednu adresu URL a zobrazit ji výše vzhledem k ostatním adresám URL s duplicitním obsahem. Toto řešení může vést k tomu, že se uživatelům na vrcholu výsledků vyhledávání zobrazí adresa URL, která nemusí být nutně ta správná.
  • .

  • Zatřetí může Google jednoduše ignorovat jakoukoli adresu URL s duplicitním obsahem, což povede k poklesu hodnocení celého webu.
  • .

Bez ohledu na to, jak Google přistupuje k podstránkám s duplicitním obsahem, si můžete být jisti, že jeho reakce negativně ovlivní viditelnost vašeho webu, sníží organickou návštěvnost a může narušit cestu zákazníka trychtýřem, čímž se sníží konverze.

 

Příčiny duplikace obsahu

.
Problém duplikace obsahu je poměrně komplexní a může postihnout internetové obchody, blogy, portály i stránky s vizitkami. Ve skutečnosti se s duplicitním obsahem může setkat každý, kdo publikuje obsah online.

Jaké jsou tedy příčiny duplikace obsahu? Mezi nejčastější patří např:

  • špatně provedené stránkování (mimo jiné neprovedení vlastního stránkování na každé podstránce stránkování),
  • .

  • duplicitní popisy kategorií a produktů,
  • .

  • chybné zavedení certifikátu SSL,
  • .

  • objevení podstránek pod různými adresami URL,
  • .

  • Nesprávná implementace jazykových verzí na webu,
  • .

  • Indexace stránek vývojářů,
  • .

  • Nesprávné parametry GET,
  • .

  • kopírování velkých částí obsahu z jiných podstránek (uvnitř i vně webu),
  • .

  • duplikace metaznaček,
  • .

 

Nesprávně provedené stránkování

.
Špatně provedená paginace může vést k mnoha problémům z hlediska UX i SEO. Stránkování se obvykle používá k rozdělení podstránek kategorií s velkým počtem produktů nebo k rozdělení rozsáhlých publikací.

Nejčastěji je problém se stránkováním způsoben špatně provedeným přesměrováním podstránek.

Například první stránka se stránkováním může být dostupná na dvou adresách:

  • senuto.com/en/category
  • .

  • senuto.com/en/category?p=1
  • .

Pak dochází k duplikaci obsahu celé podstránky.

Problém nesprávného stránkování lze vyřešit vytvořením přesměrování 301 z duplicitní adresy, tedy adresa senuto.com/en/en/category?p=1 by měla být přesměrována na senuto.com/en/category. Je však vhodné změnit skript tak, aby se parametr p=1 v adrese URL neobjevoval.

 

Duplicitní popisy kategorií a produktů

.
Duplicita popisů produktů a kategorií je jedním z nejčastějších problémů. Duplicita obsahu na podstránkách kategorií může vzniknout duplicitním obsahem v důsledku stránkování nebo při nastavování filtrů či řazení produktů v rámci kategorie.

V takovém případě můžete také implementovat značku odkazu s atributem rel nastaveným na kanonickou hodnotu. Používáme jej na duplicitních stránkách a v kódu uvádíme odkaz na hlavní stránku kategorie.

K duplicitě popisů produktů obvykle dochází, pokud nabídka produktů obsahuje mnoho položek, které se výrazně neliší – například dráty různých délek nebo ploché tyče různých rozměrů.

Řešením takové situace může být také značka rel=“canonical“, která bude umístěna na každé duplicitní stránce produktu a bude odkazovat na hlavní produkt. Alternativním řešením může být zavedení sekce zpětné vazby nebo komentářů. Ty umožní uživatelům obohatit obsah na stránkách produktu o jedinečný obsah, čímž se sníží nebo zcela odstraní problém duplicitního obsahu.

Duplicitní obsah popisů kategorií a produktů může vznikat také v důsledku jeho kopírování z webových stránek výrobce. V takovém případě se ujistěte, že obsah na vašich stránkách je 100% jedinečný.

 

Nesprávné zavedení certifikátu SSL

.
Při implementaci certifikátu SSL na své stránky nezapomeňte provést přesměrování z HTTP na HTTPS ve všech adresách URL. Častou chybou je, že takové přesměrování buď neprovedete, nebo ho provedete jen na několika vybraných adresách (např. jen na domovské stránce).

V takovém případě, abyste se vyhnuli duplicitnímu obsahu, proveďte globální přesměrování všech adres URL z HTTP na HTTPS.

 

Publikování podstránek pod různými adresami URL

.
Zveřejnění podstránek webu pod různými adresami URL může vzniknout v důsledku větších či menších technických chyb.

Nejčastěji dochází k vytvoření duplicitních podstránek z důvodu:

    .
  • objevení stejných produktů v různých kategoriích produktů (adresa URL obsahuje názvy kategorií, takže produkt má různé adresy),
  • .

  • odkazování na stejnou stránku s příponou „.html“ i bez ní,
  • .

  • Výskyt kategorií na různých místech ve struktuře internetového obchodu,
  • .

V každém z popsaných případů je řešením provedení přesměrování 301 z duplicitních podstránek na správnou adresu URL.

 

Nesprávná implementace jazykových verzí na webu

.
Duplicita obsahu v důsledku implementace jazykových verzí na webu vzniká, pokud nejsou přeloženy všechny podstránky. Pak se v cizojazyčné verzi webu může objevit text publikovaný například v polštině – stejný text, který je již na „původním“ webu.

Tento problém vyřešíte tak, že na každé z podstránek, které se mají zobrazovat v cizím jazyce, zveřejníte unikátní přeložený obsah. Na druhou stranu, pokud se určitá podstránka nemá zobrazovat v určitém jazyce, pak můžete použít značku „noindex“.

 

Indexování vývojového webu

.
Někdy se omylem stane, že je vývojářská stránka indexována dříve, než je skutečně zveřejněna.

Pokud web ještě není hotový, je třeba vývojovou verzi zablokovat před indexací zavedením značky „noindex“.

 

Neplatné parametry GET

.
Parametry GET se používají k přenosu dat mezi po sobě jdoucími zobrazeními podstránek v protokolu HTTP. Řetězce „type=new“ nebo „sort=up“ se používají k vygenerování kódu HTML podle preferencí klienta.

Problém s nadměrným počtem parametrů GET v adresách URL se týká především webových obchodů. Při založení více filtrů produktů pak vznikají takové adresy URL:

  • senuto.com/en?type=new&sort=up&page=2,
  • .

  • senuto.com/en?page=2&type=new&sort=up,
  • .

  • senuto.com/en?sort=up&page=2&type=new,
  • .

V této situaci vede každá z výše uvedených adres URL na stejnou stránku. Nejjednodušší způsob, jak tento problém vyřešit, je provést kanonické zobrazení na správné adrese URL.

 

Kopírování větších částí obsahu z jiných stránek

.
Kopírování velkých částí obsahu 1:1 a jejich publikování na vlastních stránkách není nejlepší nápad. Google obvykle velmi rychle zjistí, že obsah byl zkopírován, a omezí viditelnost podstránky, která si obsah „vypůjčila“.

Pokud zkopírovaný obsah pochází z podstránky téhož webu, pak může snížení viditelnosti postihnout všechny podstránky, na kterých je nevyhnutelný obsah zveřejněn.

 

Nahlášení duplicitního obsahu v nástroji plagiarisma.net
Zdroj: plagiarisma.net
.

 

Poznámka: Duplicita obsahu v rámci jedné stránky může být také důsledkem výskytu stejného textu v zápatí stránky. V takovém případě lze delší část textu ze zápatí použít pouze na domovské stránce a z ostatních podstránek ji odstranit.

Obětí duplikace obsahu se můžete stát i bez vlastního přičinění. Stačí, když někdo zkopíruje obsah z vašich stránek a zveřejní ho na svých vlastních. V takové situaci se vyplatí nejprve zkusit kontaktovat vlastníka webu s žádostí o odstranění duplicitního obsahu. Vyplatí se také nahlásit záležitost poskytovateli hostingu.

 

Duplikace metaznaček

.
Kopírování tagů Meta Title a Meta Description rovněž nese znaky duplicitního obsahu. V takové situaci mohou nevyhnutelné tagy přispět ke snížení viditelnosti webu.

Řešení tohoto problému je jednoduché – stačí vytvořit jedinečný obsah meta tagů.

 

Jak najít duplicitní obsah na vašem webu

.
Existuje několik způsobů, jak efektivně najít duplicitní obsah na vlastním webu. Mezi nejčastější řešení patří např:

  • Ruční analýza webu,
  • .

  • Prohlížeče webových stránek,
  • .

  • Konzola vyhledávání Google,
  • .

  • vkládání úryvků obsahu přímo do vyhledávače,
  • .

 

Ruční analýza webu

.
Jedná se o časově nejnáročnější řešení, které se může ukázat jako vhodný způsob hledání duplicitního obsahu na malých webových stránkách. Nicméně u rozsáhlejších webů se vyplatí použít další metody popsané níže.

 

WebCrawlers

.

Sitebulb tool duplicate content report
Zdroj: sitebulb.com
.

 

Pomocí crawlerů je možné získat úplné informace o struktuře a obsahu webu. Tyto nástroje jsou neocenitelným pomocníkem při provádění auditu webových stránek – včetně vyhledávání duplicitního obsahu. Mezi nejčastěji používané crawlery patří např:

    .
  • ScreamingFrog,
  • .

  • Sitebulb,
  • .

  • NetPeak,
  • .

  • Siteliner,
  • .

  • DeepCrawl,
  • .

.
 

SEO screaming frog duplicate content report
Zdroj: screamingfrog.co.uk
.

 

Každý z uvedených crawlerů umožňuje poměrně snadno najít adresy URL s duplicitním obsahem.

 

Google Search Console

.
V nástroji Google Search Console můžete snadno zkontrolovat, zda má web duplicitní obsah. Chcete-li ověřit duplicitní obsah, přejděte na kartu „Stav“ a poté zkontrolujte zprávy v kategoriích: „Chyba“, „Opravit s varováním“.

Můžete také přejít na záložku „Účinnost“ a tam zkontrolovat, zda nejsou duplicitní adresy URL. Například zdánlivě dvě různé adresy URL, ale jedna s http a druhá s https.

 

Google search console duplicate content detection

 

Vkládání úryvků obsahu do vyhledávače

.
Do vyhledávače můžete zadávat také úryvky duplicitního obsahu. Toto řešení se může osvědčit při kontrole klíčových stránek vašeho webu – například záložek s nabídkou nebo obsahu blogu.

 

Jak zkontrolovat duplicitní obsah z webu?

.

Kontrola duplicitního obsahu pomocí nástroje copywritely
Zdroj: copywritely.com
.

 

Ke kontrole duplicitního obsahu z webu můžete použít jeden z několika dostupných nástrojů. Mezi nejčastěji používané patří Copyscape, Copywritely, Siteliner a Plagiarism. Stačí vložit část obsahu nebo adresu URL a vybraný nástroj vyhledá obsah na webu.

 

Panel nástroje pro kontrolu duplicity obsahu Plagiarisma
Zdroj: Plagiarisma: Zdroj: Plagiarisma.net
.

 

Alternativně můžete také vložit úryvek textu přímo do vyhledávače a podívat se, jaké výsledky Google vrátí.

 

Jak vyřešit problém duplicitního obsahu?

.
Problém duplicitního obsahu lze vyřešit několika způsoby. Jedním z nich je provedení přesměrování 301 z duplicitních podstránek na správné adresy URL. Při tomto řešení je možné zachovat sílu duplicitních podstránek, protože duplicita není odstraněna. Přesměrování 301 se zároveň snadno provádí.

Dalším řešením je implementace tagu rel=“noindex“, čímž se zablokuje indexace podstránek společností Google. Nezapomeňte však, že použitím tagu „noindex“ snížíte potenciál viditelnosti svých stránek.

Třetím způsobem je použití metaznačky rel=“canonical“. Kanonické stránky skvěle fungují například při publikování velkého počtu stránek produktů s identickými nebo téměř identickými popisy. Použitím kanonických adres URL označíte společnosti Google, která adresa URL je ze sady duplicitních podstránek nejreprezentativnější.

V případě duplicitního obsahu, který je důsledkem implementace různých jazykových verzí webu, se rozhodně vyplatí použít značku „hreflang“. Tím společnosti Google naznačíte rozdíly mezi různými jazykovými verzemi webu.

Problém duplicitního obsahu lze také vyřešit vytvořením a zveřejněním jedinečného obsahu na každé duplicitní podstránce.

 

Souhrn

.
Duplicitní obsah je významný problém, který se týká zejména větších obchodů a webových stránek. Vyplatí se pravidelně ověřovat, zda nedochází k duplicitě externího a interního obsahu, a rychle přijmout příslušná opatření k odstranění problému. Duplicitní obsah může výrazně snížit viditelnost webu ve výsledcích vyhledávání, a vést tak k poklesu organické návštěvnosti.

Share this post:  
Marcin Cichocki

Założyciel i CEO agencji contentowej Kuźnia Treści. Jego teksty trafiały między innymi na łamy: Newsweeka, Wyborczej, Forbesa, Business Insidera, Rzeczpospolitej i portalu Komputer Świat.

Vyzkoušejte Senuto Suite na 14 dní zdarma

Pojďme na to!

Seznamte se se Senuto v hodinovém online tréninku. Zdarma.

Vyberte si termín a přihlaste se