Oldalszámozás – a keresőmotorok indexelésének egyik legfontosabb eleme

SEO Tutorials
Dawid MedwediukDawid Medwediuk
Közzétett: 11.08.2017
13 percek

Az oldalszámozásra vonatkozó SEO-irányelvek, pl. a webáruház kategóriáira vagy a blogcikkekre vonatkozóan, visszatérő téma, és többféle megközelítés létezik. Most arról fogunk beszélni, hogyan kezeljük a paginálást, hogy a webkúszók könnyebben feldolgozhassák a tartalmat.

KeyT_Here

Mi az a paginálás?

A paginálás egyszerűen egy adott erőforrás oldalankénti felosztását jelenti egy weboldalon. A legegyszerűbb példa erre a webáruházak többségében megtalálható kategóriák lehetnek, ahol egy adott számú termék felsorolása után a felhasználó a terméklista következő részére léphet. Egy másik módja a termékek kategórián belüli bemutatásának a végtelen görgetéses paginálás, ahol a felhasználó lefelé görgetésekor újabb és újabb termékek jelennek meg. Ugyanez a helyzet a blogok esetében is. Általában nem számít, hogy egy weboldal melyik erőforrása van részekre osztva, sokkal inkább az hogyan csinálod, és hogyan értesíted a Googlebotot a következő tartalomról.

Próbáld ki a Senuto Suite-ot 14 napig ingyen

Próbáld ki a Senuto Suite-ot 14 napig ingyen

Let let web crawlers do what they do

Az egyik alapvető hiba, amit a lapozás során elkövetnek, az a kanonikus címkék használata az első lapozási oldalon. És bár egy-egy helyzetben indokolt, általában mégis helytelenül végzik.

Ha például egy termékkategória több oldalra van felosztva, az azt jelenti, hogy az alapoldal egy bizonyos számú terméket tartalmaz, a második oldal egy másik termékcsoportot, és így tovább, egészen az utolsó paginálási oldalig.

A paginációs oldalak a következők:

https://website.com/ termékkategória/oldal-2
https://website.com/ termékkategória/3. oldal
https://website.com/product-category/page-4

stb.

ezért nem sok értelme van az ilyen kanonikus linkek használatának:

<link rel=„canonical” href=„https://website.com/product-category”/>

mivel egy adott kategória termékeinek további részéről van szó, a 2,3,4 stb. oldalak nem duplikátumai a főoldalnak (kivéve, ha ez nem így van, akkor a kanonikus link használata indokolt).

Természetesen lehet kanonikus linkeket adni, de magukra. Ilyen esetben a következőket írja be az oldalra https://website.com/product-category/ :

<link rel="canonical" href="https://website.com/product-category" />

és a következő az oldalon https://website.com/product-category/page-2:

<link rel=„canonical” href=„https://website.com/product-category/page-2” />

Egy oldal az összes tartalommal

Van egy kivétel – egy alapoldal az összes tartalommal, ráadásul néhány kevesebb tartalommal rendelkező aloldalra osztva. Ilyen helyzetben van értelme kanonikus linket használni. Ezt a gyakorlatot gyakran használják meglehetősen hosszú, sok tartalommal rendelkező cikkeknél.

Így a következő oldalakon:

https://website.com/product-category/page-1.
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4

egyetlen logikai sorozattá kombinálva valójában az összes olyan tartalmat tartalmazni fogja az alapoldalon https://website.com/product-category/, amelyet a keresőmotorok indexeléséhez használni szeretne.

Ez a szerencsétlen első oldallap…

Még egy hiba a kategória alapoldal https://website.com/product-category/ duplikálása az első paginációs oldallal https://website.com/product-category/page-1.

Ha az alapoldal ugyanazt a tartalmat tartalmazza, mint a /page-1,akkor felesleges duplikátumot készíteni – bizonyos tartalomkezelő rendszerek általában (az alapoldal mellett)az /page-1-gyel kezdődő első paginációs oldalt generálják;ilyen esetben a cím a címnek pl. átirányítani az alapoldalra a Redirect 301 segítségével, és a kódban nem a https://website.com/product-category/page-1, hanem a https://website.com/product-category/ linket kell megadni.

Ellenkező esetben belső átirányítási problémába ütközik, így a Googlebotnak az adott weboldal feltérképezésére szánt feltérképezési költségvetését pazarolja. Más szóval, nincs értelme belső linkkel átirányítani a 301-es átirányítással, amikor közvetlenül a céloldalra lehet linkelni a 200-as HTTP státuszkódú HTTP-oldal segítségével.

A rel=”next „andrel=”prev” attribútumok

Ha úgy dönt, hogy az alábbiak szerint oldallapozunk:

https://website.com/product-category/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4

akkor jelezheti az egyes oldalak közötti kapcsolatokat a lánctalpasok számára. A <head>szakaszban rel attribútummal ellátott releváns linkek megadása kiemeli a sorozat egyes oldalait.

Az első (alap)oldalra tegye a következőket:

<link rel=„next” href=„https://website.com/product-category/page-2”>

mint egy másik oldal, amely ugyanannak az erőforrásnak egy részét tartalmazza.

A következő oldalon, azaz https://website.com/product-category/page-2,put a következőket:

<link rel=„prev” href=„https://website.com/product-category/”>
<link rel=„next” href=„https://website.com/product-category/page-3”>

Továbblépve, a harmadik oldalon, azaz https://website.com/product-category/page-3:

<link rel=„prev” href=„https://website.com/product-category/page/page-2”>
<link rel=„next” href=„https://website.com/product-category/page-4”>

Feltételezve, hogy a /page-4 az utolsó a lapozási sorrendben, tegyük oda a következőket:

<link rel=„prev” href=„https://website.com/product-category/page-3”>

Ez a leggyakrabban használt linkkombináció a „rel next/prev” attribútumokkal ellátott címsorokban. A linkekhez néha a kódban (pl. a lista alatt) „<a href=” attribútumokat adnak, bár jobb, ha a<fej> részbe kerülnek – minél hamarabb kap egy lánctalpas fogalmat arról, hogy hol van az erőforrás többi része, annál jobb.

Nem szabad elfelejteni, hogy a „rel next/prev” attribútummal ellátott linkek nem abszolút direktívák, azaz figyelembe vehetők, de nem kötelező figyelembe venni őket egy weboldal feltérképezése során. Emellett érdemes abszolút elérési utakat használni a következő oldalakhoz, bár a Google irányelvei szerint „az értékek lehetnek abszolút elérési utak és relatív elérési utak.”Mégis, ha egy oldal URL-je paramétereket tartalmaz, pl. válogatási paramétereket, akkor ezeket is „rel next/prev” linkekbe kell tenni – például a következő oldalra:

https://website.com/product-category/page-3&sort=desc

a <head> részben a következő linkeket fogja tartalmazni:

<link rel=„prev” href=„https://website.com/product-category/page-2&sort=desc”>
<link rel=„next” href=„https://website.com/product-category/page-4&sort=desc”>

hanem egy olyan kanonikus tag, amely csak önmagára mutat (a csökkenő sorrendbe rendezés paramétere nélkül):

<link rel=„canonical” href=„https://website.com/product-category/page-3”/>

Indexelni vagy nem indexelni?

Egy másik probléma, amivel a paginálás során szembesülünk, a robotok meta-címkékkel való visszaélés. A Google azt állította, hogyaz egyes oldalakat logikai sorrendnek kell tekinteni, ami a linkjeik attribútumainak figyelembevételét eredményezi, és a legtöbb esetben segít a felhasználónak az első oldal megjelenítésében.

Nagyon gyakran előfordul, hogy az egyes oldalakat a keresőmotorok indexében annak ellenére, hogy a „rel next/prev” attribútumokkal ellátott linkekkel kapcsolódnak egymáshoz, az egyes oldalakat paginálják. Ha ez problémát jelent, akkor a legjobb lesz a következőket használni:

<meta name=„robots” content=„noindex, follow” />

A következő oldalakon, azaz a /page-2 és magasabb oldalakon. A webes lánctalpas program az utolsó oldalig feltérképezi a linkeket, de nem indexeli azokat.

So what about canonicals?

A John Muellerrel folytatott beszélgetésből (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) egyértelműen következik, hogy nem szabad „no index” meta tageket indexelhető URL-re mutató kanonikusokkal kombinálni. Tehát ebben az esetben, ha egy oldalszámozású oldalon egy kanonikus link önmagára irányít, akkor nem szabad ‘no index’ meta taget tenni, és fordítva.

Nem észleltem semmilyen problémát a paginált oldalak feltérképezésével kapcsolatban, ha a kanonikus linkek magukra az oldalakra mutatnak, és a ‘no index’ meta taget is; azonban a Google saját maga akarja eldönteni, hogy mit indexel és mit nem, így talán hagyni kellene, hogy a Google csinálja.

Pagination és egy weboldal XML sitemap

Itt van egy érdekes eset: a sitemap.xml-be inkább nem adunk meg paginációs linkeket, hanem csak például egy kategória vagy az összes tartalmat tartalmazó fő cikk alapcímét. Elvileg egy XML sitemapbe azokat a címeket kell beírni, amelyeket indexelni szeretnénk, tehát ha nem érdekel a paginációs indexelés, akkor ne írjuk be oda a /page-2 és magasabb URL-eket. Természetesen, ha „no index” robots meta taggel blokkolja, akkor még egyszerűbb – ne adja meg őket.

Pagination pages as parameters

Ha támogatni szeretné a termék/cikk indexelését az utolsó paginált oldaltól kezdve, biztosítson korlátlan hozzáférést a webkúszóknak az alapkategórián túli más kategóriák oldalaihoz. Gyakran előfordul, hogy az egyes oldalak „?page=” vagy „?p=” paraméterekkel rendelkeznek, és a robots.txt-ben a többi paraméterrel együtt tévesen blokkolhatók.

Hasonló a helyzet az URL-paraméterek esetében a Google Search Console-ban. Érdemes megmutatni a Googlebotnak, hogy az ilyen paraméterek felelősek az erőforrások oldalakra való felosztásáért, és hagyni, hogy a bot döntsön.

Kategóriák tagolása és leírása

Gyakran követett gyakorlat a kategóriák tartalmának bővítése, pl. webáruházakban. Gyakran előfordul, hogy a hozzáadott leírás változatlan formában jelenik meg az összes paginálási URL-nél. Ha az összes oldalt logikai sorozatként kezeljük, és a „rel next/prev” attribútumokkal egy egésszé egyesítjük, akkor feleslegesnek tűnik ugyanazt a szöveget megkettőzni a /page-2, /page-3 stb. oldalakon.

Hasonló a helyzet a felsorolt termékek esetében is: minden következő oldal új termékcsoportot jelenít meg, és a felhasználó nem akarja, hogy minden egyes oldalon mindig ugyanazt a kategórialeírást olvassa, és nem akarja, hogy a kategórián belül ugyanazokat a termékeket tovább nézegesse. Van azonban egy kérdés – ki olvassa a kategórialeírásokat? A Googlebot valószínűleg igen, ezért ne etesse duplikátumokkal.

Szükséged van-e oldalszámozásra, ha végtelen görgetést használsz?

Kiderült, hogy a paginálás a „végtelen görgetés” megoldásnál is járható út, ahol egy kategórián belül a termékek/cikkek listáját lefelé görgetve újabb források jelennek meg. John Mueller (http://scrollsample.appspot.com/items) adott egy értelmes példát: a lista görgetése közben a következő oldalakra mutató új paraméterek kerülnek hozzá az URL-hez.

http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3

és így tovább és így tovább.

Nyilvánvaló, hogy itt „rel next/prev” attribútummal ellátott linkeket használnak, és a megadott kanonikus link önmagára vonatkozik; például a http://scrollsample.appspot.com/items?page=5-nál ez a következőképpen néz ki:

<link rel=„canonical” href=„/items?page=5” />
<link rel=„next” href=„/items?page=6”/>
<link rel=„prev” href=„/items?page=4”/>

A pagination mint az indexelési stratégia eleme

A döntés, hogy egy adott oldalszámozási megoldást alkalmazzunk, természetesen a tiéd. A fenti példák nem minden helyzetben jelentenek tökéletes lehetőséget, mert előfordulhat, hogy technikai nehézségekbe, CMS-problémákba ütközik, vagy egyszerűen csak ellentétes az elfogadott indexelési stratégiával. Érdemes azonban a paginálást olyan mértékben optimalizálni, hogy legalább ne akadályozza meg a Googlebotot a weboldal feltérképezésében, valamint elősegíti az eltemetett termék/cikk oldalak indexelését, amelyek nem olyan könnyen elérhetők egyetlen látogatás során.

FAQ


A paginálás a weboldalon található tartalmak oldalankénti felosztását jelenti, amely segít a felhasználóknak és a webkúszóknak könnyebben feldolgozni az információkat. Fontos az SEO szempontjából, mert segíti a tartalom hatékony indexelését és a felhasználói élmény javítását.


A kanonikus címkék helytelen használata, mint például minden paginált oldalra az alapoldalra mutató kanonikus link, megzavarhatja a keresőmotorokat a tartalom relevanciájának és egyediségének értékelésekor. Helyesen alkalmazva segíthetnek elkerülni a tartalom duplikációját és javíthatják az SEO-t.


„Noindex, follow” meta címkéket akkor érdemes használni, amikor nem szeretnénk, hogy a keresőmotorok indexeljék a paginált oldalakat, de mégis szeretnénk, hogy kövessék az oldalon található linkeket. Ez segíthet a crawl költségvetés hatékonyabb felhasználásában.


A végtelen görgetés SEO szempontból való kezeléséhez használj „rel=next” és „rel=prev” linkeket a lapozás során, és biztosítsd, hogy a paginált tartalom könnyen elérhető legyen a keresőmotorok számára is, például a lapozáshoz használt URL paraméterekkel együtt.


Az abszolút URL-ek használata a „rel=next/prev” linkekben biztosítja, hogy a keresőmotorok pontosan értelmezzék az oldalak közötti kapcsolatokat, függetlenül attól, hogy honnan kerülnek feldolgozásra. Ez elősegíti a tartalom hatékony indexelését és a weboldal szerkezetének jobb megértését. További információ a paginációról és annak SEO-ra gyakorolt hatásáról itt.
Oszd meg ezt a posztot:  
Dawid Medwediuk

Od 2011 roku związany z Search Engine Marketingiem. Pasjonat SEO, nowych technologii i gadżetów.

Próbáld ki a Senuto 14 napig ingyen

Próbáld ki ingyen

Próbáld ki a Senuto Suite-ot 14 napig ingyen

Próbáld ki a Senuto Suite-ot 14 napig ingyen

1 órás INGYENES Senuto bemutató

Válassz időpontot és jelentkezz