Duplicarea conținutului – găsiți și rezolvați această problemă

SEO
Marcin CichockiMarcin Cichocki
Publicat: 26.08.2021
14 minute

Conținutul duplicat este o problemă semnificativă care poate duce la scăderea vizibilității subpaginilor și, astfel, la scăderea semnificativă a diminuarea traficului organic către un site. Aflați cum să găsiți conținutul duplicat și să îl rezolvați eficient.

 

Ce este conținutul duplicat?

.
Conținutul duplicat este un fenomen care implică conținut duplicat (duplicat) pe subpagini în cadrul unui singur site – duplicare internă; sau pe diferite site-uri externe – duplicare externă. Astfel, atunci când același conținut apare sub diferite URL-uri, atunci avem de-a face cu un fenomen cunoscut și sub numele de conținut duplicat.

Duplicarea poate apărea ca urmare a unei greșeli, a furtului de conținut sau prin crearea de erori în etapa de optimizare tehnică SEO a unui site sau magazin online.

Problema duplicării externe a conținutului în sectorul comerțului electronic se rezumă, de obicei, la copierea nechibzuită a descrierilor de produse sau a categoriilor de pe site-urile producătorilor.

Duplicarea internă se întâlnește, de obicei, ca urmare a publicării unor descrieri identice care se referă la produse care diferă doar prin detalii – cum ar fi mărimea sau culoarea.

 

Care este diferența dintre duplicarea conținutului și canibalizarea?

.
Diferența dintre duplicarea conținutului și canibalizarea cuvintelor cheie este destul de importantă.

Duplicarea conținutului este orice conținut inevitabil (identic) care apare la mai multe URL-uri. Cu alte cuvinte: duplicarea conținutului are loc atunci când aceeași bucată mai mare de text apare pe două, trei sau mai multe pagini în cadrul unui site sau între site-uri diferite.

Canibalizarea cuvintelor cheie apare atunci când în cadrul unui site sunt publicate diferite subpagini cu conținut diferit, care sunt optimizate pentru aceleași fraze de cuvinte cheie.

Canibalizarea cuvintelor cheie este un fenomen care poate afecta doar un singur site. Duplicarea de conținut poate apărea atât în cadrul unui singur site, cât și între site-uri externe.

Mai mult, duplicarea conținutului poate duce simultan la canibalizarea cuvintelor-cheie (aceleași fraze-cheie în același conținut). Cu toate acestea, canibalizarea frazelor nu duce simultan la duplicarea conținutului (aceleași fraze-cheie, conținut diferit).

 

Duplicarea de conținut dăunează SEO?

.
Categoric da, duplicarea de conținut dăunează SEO. Și o face foarte mult. Conținutul duplicat afectează în mod negativ vizibilitatea paginilor cu conținut duplicat și poate duce la scăderea poziției site-ului în rezultatele căutărilor organice.

De ce dăunează conținutul duplicat SEO? Algoritmii Google, parcurgând mai multe URL-uri ale unui site cu același conținut, nu știu care subpagină este mai importantă și pe care ar trebui să o afișeze mai sus în rezultatele căutării.

Ca urmare, Google se poate comporta în mai multe moduri.

  • În primul rând, algoritmii Google pot afișa toate URL-urile una lângă alta, dar în poziții net inferioare (de exemplu, pe pagina a 2-a, a 3-a sau chiar a 4-a).
  • În al doilea rând, Google poate selecta doar un singur URL după bunul său plac și îl poate afișa mai sus în raport cu celelalte URL-uri cu conținut duplicat. Această soluție poate duce la afișarea de către utilizatori a unui URL care nu este neapărat cel corect în partea de sus a rezultatelor căutării.
  • .

  • În al treilea rând, Google poate ignora pur și simplu orice URL cu conținut duplicat, ceea ce duce la o scădere a ratingului întregului site.
  • .

Indiferent de modul în care Google tratează subpaginile cu conținut duplicat, puteți fi sigur că reacția sa va afecta negativ vizibilitatea site-ului dvs., va reduce traficul organic și poate întrerupe traseul clientului prin pâlnie, reducând astfel ratele de conversie.

 

Cauzele duplicării conținutului

.
Problema duplicării conținutului este destul de complexă și poate afecta magazinele online, blogurile, portalurile, precum și site-urile de cărți de vizită. De fapt, conținutul duplicat poate fi întâlnit de oricine care publică conținut online.

Așadar, care sunt cauzele duplicării conținutului? Printre cele mai frecvente se numără:

  • paginarea executată necorespunzător (printre altele, neimplementarea autocanonicelor pe fiecare subpagină a paginării),
  • .

  • duplicate categorie și descrieri de produse,
  • .

  • implementarea incorectă a certificatului SSL,
  • .

  • apariția de subpagini sub diferite URL-uri,
  • .

  • implementarea incorectă a versiunilor lingvistice pe site,
  • .

  • indexarea paginilor de dezvoltare,
  • .

  • parametrii GET incorecți,
  • .

  • copierea unor bucăți mari de conținut din alte subpagini (în interiorul și în afara site-ului),
  • .

  • duplicarea meta tag-urilor,
  • .

 

Paginare executată incorect

.
O paginare prost executată poate duce la multe probleme atât în ceea ce privește UX, cât și SEO. Paginarea este folosită de obicei pentru a împărți subpaginile unor categorii cu un număr mare de produse sau pentru a diviza publicații extinse.

De cele mai multe ori, problema paginării se datorează unei redirecționări de sub-pagini prost executate.

De exemplu, prima pagină cu paginare poate fi disponibilă la două adrese:

  • senuto.com/en/categorie
  • .

  • senuto.com/en/category?p=1
  • .

Atunci există o dublare a conținutului întregii subpagini.

Problema paginării incorecte poate fi rezolvată prin crearea unei redirecționări 301 de la adresa duplicată, adică adresa senuto.com/en/en/category?p=1 trebuie redirecționată către senuto.com/en/category. Cu toate acestea, merită să modificați scriptul astfel încât parametrul p=1 să nu mai apară în URL.

 

Duplicarea descrierilor de categorii și produse

.
Duplicarea descrierilor produs și a descrierilor categoriilor este una dintre cele mai frecvente probleme. Duplicarea conținutului de pe subpaginile categoriilor poate apărea prin conținut duplicat ca urmare a paginării sau la setarea filtrelor sau la sortarea produselor dintr-o categorie.

În acest caz, puteți implementa, de asemenea, o etichetă link cu atributul rel setat la o valoare canonică. Noi o folosim pe paginile duplicate și includem în cod un link către pagina principală a categoriei.

Duplicarea descrierilor de produse apare, de obicei, atunci când o ofertă de produse include mai multe articole care nu diferă semnificativ – de exemplu, fire de diferite lungimi sau bare plate de dimensiuni diferite.

O etichetă rel=”canonical”, care va fi plasată pe fiecare pagină de produs duplicată și va indica spre produsul principal, poate fi, de asemenea, o soluție pentru o astfel de situație. O soluție alternativă poate fi implementarea unei secțiuni de feedback sau de comentarii. Acestea vor permite utilizatorilor să îmbogățească conținutul paginilor de produs cu conținut unic, ceea ce va reduce sau va elimina complet problema conținutului duplicat.

Conținutul duplicat al descrierilor categoriilor și produselor poate apărea și ca urmare a copierii acestuia de pe site-ul web al producătorului. Într-un astfel de caz, asigurați-vă că conținutul de pe site-ul dvs. este 100% unic.

 

Implementare incorectă a certificatului SSL

.
Atunci când implementați un certificat SSL pe site-ul dumneavoastră, asigurați-vă că efectuați o redirecționare de la HTTP la HTTPS în toate URL-urile. O greșeală frecventă este fie de a nu efectua o astfel de redirecționare, fie de a o efectua doar la câteva adrese selectate (de exemplu, doar pe pagina principală).

În acest caz, pentru a evita conținutul duplicat, implementați o redirecționare globală a tuturor URL-urilor de la HTTP la HTTPS.

 

Publicarea de subpagini sub diferite URL-uri

.
Publicarea subpaginilor unui site sub URL-uri diferite poate apărea din cauza unor erori tehnice majore sau minore.

Cel mai adesea, crearea de subpagini duplicate se datorează:

  • apariția acelorași produse în diferite categorii de produse (URL-ul conține numele categoriilor, deci produsul are adrese diferite),
  • .

  • legarea la aceeași pagină cu și fără „.html”,
  • .

  • apariția categoriilor în locuri diferite în structura magazinului online,
  • .

În fiecare dintre cazurile descrise, soluția este de a efectua o redirecționare 301 de la subpaginile duplicate la URL-ul corect.

 

Implementarea incorectă a versiunilor lingvistice pe site

.
Duplicarea conținutului ca urmare a implementării versiunilor lingvistice pe un site apare atunci când nu toate subpaginile sunt traduse. Atunci, în versiunea în limba străină a site-ului poate apărea un text publicat în poloneză, de exemplu – același text care se află deja pe site-ul „original”.

Pentru a rezolva această problemă, publicați conținut unic tradus pe fiecare dintre subpaginile care urmează să fie afișate într-o limbă străină. Pe de altă parte, atunci când o anumită subpagină nu trebuie să fie afișată într-o anumită limbă, atunci puteți utiliza eticheta „noindex”.

 

Indexarea unui site de dezvoltare

.
Uneori, din greșeală, o pagină de dezvoltare este indexată înainte de a fi publicată efectiv.

Dacă site-ul nu este încă gata, atunci versiunea de dezvoltare trebuie blocată de la indexare prin introducerea tag-ului „noindex”.

 

Parametrii GET nevalabili

.
Parametrii GET sunt utilizați pentru a transfera date între vizualizările succesive ale subpaginilor în protocolul HTTP. Șirurile de caractere „type=new” sau „sort=up” sunt utilizate pentru a genera codul HTML în funcție de preferințele clientului.

Problema numărului excesiv de parametri GET în URL-uri afectează în principal magazine web. Apoi, atunci când sunt stabilite mai multe filtre de produse, sunt create astfel de URL-uri:

  • senuto.com/en?type=new&sort=up&page=2,
  • .

  • senuto.com/en?page=2&type=new&sort=up,
  • .

  • senuto.com/en?sort=up&page=2&type=new,
  • .

În această situație, fiecare dintre URL-urile de mai sus duce la aceeași pagină. Cel mai simplu mod de a rezolva această problemă este de a efectua canonical pe URL-ul corect.

 

Copierea unor bucăți mai mari de conținut din alte pagini

.
Copierea 1:1 a unor bucăți mari de conținut și publicarea lor pe propriul site nu este cea mai bună idee. De obicei, Google află foarte repede că conținutul a fost copiat și limitează vizibilitatea subpaginii care a „împrumutat” conținutul.

Dacă conținutul copiat provine de la o subpagină a aceluiași site, atunci o reducere a vizibilității se poate abate asupra oricăreia dintre subpaginile care au publicat conținutul inevitabil.

 

Raportează raportarea conținutului duplicat în instrumentul plagiarisma.net
Sursa: plagiarisma.net
.

 

Note: duplicarea conținutului în cadrul aceluiași site poate rezulta și din apariția aceluiași text în subsolul paginii. În acest caz, o bucată mai lungă de text din footer poate fi folosită doar pe pagina principală și eliminată din celelalte subpagini.

De asemenea, puteți cădea victimă a duplicării conținutului fără a avea vreo vină. Este suficient dacă cineva copiază conținut de pe site-ul dvs. și îl publică pe cont propriu. Într-o astfel de situație, merită să încercați mai întâi să contactați proprietarul site-ului cu o cerere de eliminare a conținutului duplicat. De asemenea, merită să raportați problema furnizorului de găzduire.

 

Duplicarea meta tag-urilor

.
Copierea etichetelor Meta Title și Meta Description poartă, de asemenea, semnele distinctive ale conținutului duplicat. Într-o astfel de situație, tag-urile inevitabile pot contribui la scăderea vizibilității site-ului.

Soluția la această problemă este simplă – trebuie doar să creați conținut unic pentru meta tag-uri.

 

Cum găsiți conținutul duplicat pe site-ul dvs.
Există mai multe modalități de a găsi eficient conținutul duplicat în cadrul propriului site. Unele dintre cele mai comune soluții includ:
  • analiza manuală a site-ului,
  • .

  • scrawlere web,
  • .

  • Google Search Console,
  • .

  • inserția de fragmente de conținut direct în motorul de căutare,
  • .

 

Analiza manuală a site-ului

.
Aceasta este soluția care necesită cel mai mult timp, care se poate dovedi a fi o modalitate potrivită pentru a căuta conținut duplicat pe site-urile mici. Cu toate acestea, pentru site-uri mai extinse, merită să folosiți celelalte metode descrise mai jos.

 

WebCrawlers

.

Sitebulb tool duplicate content report
Sursa: sitebulb.com
.

 

Cu ajutorul crawlerelor este posibil să se adune informații complete despre structura și conținutul unui site. Aceste instrumente sunt un ajutor neprețuit atunci când se realizează un audit de site web – inclusiv pentru conținutul duplicat. Unele dintre cele mai frecvent utilizate crawlere includ:

  • ScreamingFrog,
  • .

  • Sitebulb,
  • .

  • NetPeak,
  • .

  • Siteliner,
  • .

  • DeepCrawl,
  • .

 

SEO screaming frog duplicate content report
Sursa: screamingfrog.co.uk
.

 

Fiecare dintre crawlerele indicate permite găsirea relativ ușoară a URL-urilor cu conținut duplicat.

 

Google Search Console

.
În instrumentul Google Search Console, puteți verifica cu ușurință dacă un site are conținut duplicat. Pentru a verifica conținutul duplicat, mergeți la fila „Status” (Stare) și apoi verificați mesajele din categorii: „Error” (Eroare), „Correct with warning” (Corectare cu avertisment).

De asemenea, puteți merge la fila „Eficacitate” și acolo verificați dacă există URL-uri duplicate. De exemplu, aparent două URL-uri diferite, dar unul cu http și celălalt cu https.

 

Google search console duplicate content detection

 

Introducerea fragmentelor de conținut în motorul de căutare

.
De asemenea, puteți introduce fragmente de conținut duplicat în motorul de căutare. Această soluție se poate dovedi a fi o modalitate bună de a verifica paginile cheie ale site-ului dvs. – cum ar fi filele de ofertă sau conținutul blogului.

 

Cum să verificați conținutul duplicat de pe web?

.

Verificați dacă există conținut duplicat cu instrumentul copywritely
Sursa: copywritely.com
.

 

Pentru a verifica dacă există conținut duplicat de pe web, puteți utiliza unul dintre cele câteva instrumente disponibile. Printre cele mai frecvent utilizate se numără Copyscape, Copywritely, Siteliner și Plagiarism. Tot ce trebuie să faceți este să introduceți un fragment de conținut sau un URL, iar instrumentul selectat va căuta conținutul respectiv pe web.

 

Plagiarisma content duplication checker tool panel
Sursă: Plagiarisma: Plagiarisma.net
.

 

Alternativ, puteți, de asemenea, să lipiți un fragment de text direct într-un motor de căutare și să vedeți ce rezultate oferă Google.

 

Cum se rezolvă problema conținutului duplicat?

.
Problema conținutului duplicat poate fi rezolvată în mai multe moduri. Unul dintre ele este de a efectua redirecționări 301 de la subpaginile duplicate la URL-urile corecte. Cu această soluție, este posibil să se păstreze puterea subpaginilor duplicate, deoarece duplicatul nu este eliminat. În același timp, redirecționările 301 sunt ușor de realizat.

O altă soluție este implementarea tag-ului rel=”noindex”, blocând astfel indexarea subpaginii de către Google. Nu uitați însă că, prin utilizarea tag-ului „noindex”, veți scădea potențialul de vizibilitate al site-ului dumneavoastră.

A treia modalitate este de a utiliza metatag-ul rel=”canonical”. Canonicals funcționează foarte bine, de exemplu, atunci când publicați un număr mare de pagini de produse cu descrieri identice sau aproape identice. Prin utilizarea URL-urilor canonice, veți indica Google care este cel mai reprezentativ URL dintr-un set de subpagini duplicate.

În cazul conținutului duplicat care rezultă din implementarea unor versiuni lingvistice diferite ale site-ului, merită neapărat să folosiți eticheta „hreflang”. În acest fel, îi veți indica lui Google diferențele dintre diferitele versiuni lingvistice ale site-ului.

Problema conținutului duplicat poate fi rezolvată, de asemenea, prin crearea și publicarea unui conținut unic pe fiecare subpagină duplicată.

 

Summary

.
Conținutul duplicat este o problemă semnificativă care afectează în special magazinele și site-urile web mai mari. Merită să verificați în mod regulat dacă nu există o duplicare a conținutului extern și intern și să luați rapid măsurile adecvate pentru a elimina problema. Conținutul duplicat poate reduce în mod semnificativ vizibilitatea unui site în rezultatele căutărilor și, prin urmare, poate duce la o scădere a traficului organic.

Distribuie aceasta postare:  
Marcin Cichocki

Założyciel i CEO agencji contentowej Kuźnia Treści. Jego teksty trafiały między innymi na łamy: Newsweeka, Wyborczej, Forbesa, Business Insidera, Rzeczpospolitej i portalu Komputer Świat.

Încearcă Senuto Suite gratuit timp de 14 zile

Încearcă gratuit 14 zile

Descoperă Senuto într-o oră de training online, gratuit

Alege o dată și conectează-te