Ismétlődő tartalom: okok és megoldások * Yoast

Joost De Valk

Joost De Valk a Yoast alapítója és termékigazgatója. Ő egy internetes vállalkozó, aki a Yoast alapítása mellett számos induló vállalkozásba fektetett be és tanácsot adott. Fő szakterülete a nyílt forráskódú szoftverfejlesztés és a digitális marketing.

az olyan keresőmotoroknak, mint a Google, problémája van – ezt duplikált tartalomnak hívják. A duplikált tartalom azt jelenti, hogy a hasonló tartalom több helyen (URL-en) jelenik meg az interneten, és ennek eredményeként a keresőmotorok nem tudják, melyik URL-t jelenítsék meg a keresési eredmények között. Ez ronthatja a weboldal rangsorolását, és a probléma csak súlyosbodik, ha az emberek ugyanazon tartalom különböző verzióira hivatkoznak. Ez a cikk segít megérteni a duplikált tartalom különböző okait, és megtalálni a megoldást mindegyikre.

mi az ismétlődő tartalom?
- illusztráljuk ezt egy példával
a duplikált tartalom okai
- félreértés az URL fogalma
- munkamenet-azonosítók
- URL-paraméterek nyomon követéséhez és rendezéséhez
- kaparók és tartalomszindikáció
- paraméterek sorrendje
- Megjegyzés oldalszámozás
- Nyomtatóbarát oldalak
- WWW vs. nem www
koncepcionális megoldás: a ‘canonical’ URL
ismétlődő tartalom azonosítása problémák
gyakorlati megoldások ismétlődő tartalomhoz
- ismétlődő tartalom elkerülése
- 301 ismétlődő tartalom átirányítása
- hivatkozások használata
- visszahelyezés az eredeti tartalomra
következtetés: az ismétlődő tartalom javítható, és rögzíteni kell

mi az ismétlődő tartalom?

a duplikált tartalom olyan tartalom, amely az interneten több URL-en is elérhető. Mivel egynél több URL ugyanazt a tartalmat jeleníti meg, a keresőmotorok nem tudják, melyik URL-t kell magasabbra sorolni a keresési eredmények között. Ezért előfordulhat, hogy mindkét URL-t alacsonyabban rangsorolják, és más weboldalakat részesítenek előnyben.

ebben a cikkben elsősorban a duplikált tartalom technikai okaira és azok megoldásaira összpontosítunk. Ha szélesebb perspektívát szeretne kapni a duplikált tartalomról, és megtudja, hogyan kapcsolódik a másolt vagy lekapart tartalomhoz, vagy akár a kulcsszó kannibalizációjához, javasoljuk, hogy olvassa el ezt a bejegyzést: mi a duplikált tartalom.

illusztráljuk ezt egy példával

a duplikált tartalom hasonlítható egy kereszteződéshez, ahol az útjelző táblák két különböző irányba mutatnak ugyanahhoz a célhoz: melyik úton érdemes menni? Tovább ront a helyzeten, a végső cél is más, de csak annyira kissé. Olvasóként nem bánja, mert megkapja azt a tartalmat, amelyért jött, de a keresőmotornak ki kell választania, hogy melyik oldalt jelenítse meg a keresési eredmények között, mert természetesen nem akarja kétszer ugyanazt a tartalmat megjeleníteni.

tegyük fel, hogy az x kulcsszóról szóló cikked címen jelenik meg, ugyanez a tartalom pedig címen is megjelenik. Ez a helyzet nem fiktív: sok modern tartalomkezelő rendszerben előfordul. Akkor tegyük fel, hogy cikkét több Blogger felvette, és néhányan az első URL-re hivatkoznak, míg mások a másodikra. Ez az, amikor a keresőmotor problémája megmutatja valódi természetét: ez a te problémád. A duplikált tartalom a probléma, mert ezek a linkek mind különböző URL-eket népszerűsítenek. Ha mind ugyanarra az URL-re hivatkoznának, akkor nagyobb lenne az esélyed az ‘X kulcsszó’ rangsorolására.

ha nem tudja, hogy a rangsorban szenved ismétlődő tartalom problémák, ezek ismétlődő tartalom felfedezés eszközök segítenek kideríteni!

a duplikált tartalom okai

a duplikált tartalomnak több tucat oka van. Legtöbbjük technikai jellegű: nem túl gyakran fordul elő, hogy egy ember úgy dönt, hogy ugyanazt a tartalmat két különböző helyre teszi anélkül, hogy világossá tenné, melyik az eredeti. Hacsak nem klónozott egy posztot, és természetesen véletlenül közzétette. De egyébként a legtöbbünk számára természetellenesnek tűnik.

sok technikai oka van, és ez leginkább azért történik, mert a fejlesztők nem úgy gondolkodnak, mint egy böngésző vagy akár egy felhasználó, nemhogy egy keresőmotor pók – úgy gondolkodnak, mint egy programozó. Vegyük azt a korábban említett cikket, amely a és a oldalon jelenik meg. Ha megkérdezi a fejlesztőt, azt mondják, hogy csak egyszer létezik.

félreértés a koncepció egy URL

nem, hogy a fejlesztő nem ment őrült, ők csak beszél egy másik nyelvet. A CMS valószínűleg táplálja a weboldalt, és ebben az adatbázisban csak egy cikk található, de a webhely szoftvere csak lehetővé teszi, hogy ugyanazt a cikket az adatbázisban több URL-en keresztül lehessen letölteni. Ennek oka az, hogy a fejlesztő szemében az adott cikk egyedi azonosítója az az azonosító, amelyet a cikk tartalmaz az adatbázisban, nem pedig az URL. De a keresőmotor számára az URL egy tartalom egyedi azonosítója. Ha ezt elmagyarázza egy fejlesztőnek,akkor elkezdik a problémát. És miután elolvasta ezt a cikket, akkor is képes lesz arra, hogy számukra a megoldás azonnal.

munkamenet-azonosítók

gyakran szeretné nyomon követni látogatóit, és például lehetővé teszi számukra, hogy a vásárolni kívánt tárgyakat egy bevásárlókosárban tárolják. Ahhoz, hogy ezt megtehesd, meg kell adnod nekik egy ülést. A munkamenet egy rövid története annak, amit a látogató tett a webhelyén, és tartalmazhat olyan dolgokat, mint a kosárban lévő elemek. Annak érdekében, hogy a munkamenetet a látogató egyik oldalról a másikra kattintva tartsa fenn, a munkamenet egyedi azonosítóját – az úgynevezett munkamenet – azonosítót-valahol el kell tárolni. A leggyakoribb megoldás a cookie-k használata. A keresőmotorok azonban általában nem tárolnak sütiket.

ezen a ponton egyes rendszerek visszatérnek a munkamenet-azonosítók használatához az URL-ben. Ez azt jelenti, hogy a webhely minden belső hivatkozása hozzáadja a munkamenet-azonosítót az URL-hez, és mivel ez a munkamenet-azonosító egyedi az adott munkamenethez, új URL-t hoz létre, és ezért duplikálja a tartalmat.

nyomon követéshez és rendezéshez használt URL-paraméterek

a duplikált tartalom másik oka olyan URL-paraméterek használata, amelyek nem változtatják meg az oldal tartalmát, például a linkek nyomon követésében. Egy keresőmotor számára a és a nem ugyanaz az URL. Ez utóbbi lehetővé teheti, hogy nyomon kövesse, milyen forrásból származnak az emberek, de ez megnehezítheti a jó rangsorolást is – nagyon nem kívánt mellékhatás!

ez természetesen nem csak a nyomkövetési paraméterekre vonatkozik. Minden olyan paraméterre vonatkozik, amelyet hozzáadhat egy URL-hez, amely nem változtatja meg a létfontosságú tartalmat, függetlenül attól, hogy ez a paraméter a termékkészlet rendezésének megváltoztatására vagy egy másik oldalsáv megjelenítésére vonatkozik-e: mindegyik ismétlődő tartalmat okoz.

Scrapers and content syndication

a duplikált tartalom legtöbb oka vagy az Ön vagy a webhelye hibája. Néha azonban más webhelyek használják az Ön tartalmát, az Ön beleegyezésével vagy anélkül. Nem mindig hivatkoznak az eredeti cikkre, ezért a keresőmotor nem kapja meg, és ugyanazon cikk egy másik verziójával kell foglalkoznia. Minél népszerűbb a webhelye, annál több kaparót kap, így ez a probléma egyre nagyobb lesz.

paraméterek sorrendje

egy másik gyakori ok az, hogy a CMS nem használ szép tiszta URL-eket, hanem olyan URL-eket, mint a /?id=1&cat=2, ahol az ID a cikkre, a cat pedig a kategóriára utal. Az URL /?cat=2&id=1 ugyanazokat az eredményeket jeleníti meg a legtöbb webhelyrendszerben, de egy keresőmotor esetében teljesen eltérőek.

Megjegyzés oldalszámozás

szeretett WordPress-ben, de néhány más rendszerben is lehetőség van a Megjegyzések oldalszámozására. Ez azt eredményezi, hogy a tartalom duplikálódik a cikk URL-jén, és a cikk URL + /comment-page-1/, /comment-page-2/ stb.

Nyomtatóbarát oldalak

ha a tartalomkezelő rendszer nyomtatóbarát oldalakat hoz létre, és Ön a cikkoldalain található oldalakra hivatkozik, a Google általában megtalálja őket, kivéve, ha kifejezetten letiltja őket. Most kérdezd meg magadtól: melyik verziót szeretné megjeleníteni a Google? Az egyik a hirdetések és a perifériás tartalom, vagy az egyik, hogy csak azt mutatja, a cikket?

WWW vs.non-WWW

ez az egyik legrégebbi a könyvben, de néha a keresőmotorok még mindig tévednek: WWW vs. nem WWW duplikált tartalom, ha webhelyének mindkét verziója elérhető. Egy másik, kevésbé gyakori helyzet, de én is láttam a HTTP vs. HTTPS duplikált tartalom, ahol ugyanazt a tartalmat szolgálják ki mindkettőn.

fogalmi megoldás: a ‘kanonikus’ URL

mint már láttuk, az a tény, hogy több URL vezet ugyanahhoz a tartalomhoz, probléma, de megoldható. Egy személy, aki egy kiadványnál dolgozik, általában elég könnyen meg tudja mondani, hogy mi legyen egy adott cikk ‘helyes’ URL-je, de néha, amikor három embert kérdez meg egy cégen belül, három különböző választ kap…

ez egy olyan probléma, amelyet meg kell oldani, mert végül csak egy lehet (URL). A tartalom helyes URL-jét a keresőmotorok kanonikus URL-nek nevezik.

ironikus mellékjegyzet

a kanonikus kifejezés a Római Katolikus hagyományból származik, ahol a szent könyvek listáját létrehozták és valódinak fogadták el. Az Újszövetség kanonikus Evangéliumaként ismerték őket. Az irónia az, hogy a római katolikus egyháznak körülbelül 300 évbe és számos küzdelembe telt, hogy előálljon ezzel a kanonikus listával, és végül ugyanannak a történetnek négy változatát választották…

a duplikált tartalmak azonosítása problémák

lehet, hogy nem tudja, hogy van-e duplikált tartalom problémája a webhelyén vagy a tartalmával. A Google használata az egyik legegyszerűbb módszer a duplikált tartalom észlelésére.

számos keresési operátor van, amelyek nagyon hasznosak az ilyen esetekben. Ha meg szeretné találni az összes URL-t a webhelyén, amely tartalmazza az X kulcsszó cikket, írja be a következő keresési kifejezést a Google-ba:

site:example.com intitle:"Keyword X"

a Google ezután megmutatja az összes oldalt example.com ez tartalmazza ezt a kulcsszót. Minél konkrétabbá teszi a lekérdezés intitle részét, annál könnyebb kiszűrni az ismétlődő tartalmat. Ugyanezt a módszert használhatja az ismétlődő tartalom azonosítására az interneten. Tegyük fel, hogy a cikk teljes címe ‘X kulcsszó-miért fantasztikus’, keresne:

intitle:"Keyword X - why it is awesome"

a Google pedig minden olyan webhelyet megadna, amely megfelel ennek a címnek. Néha érdemes még egy vagy két teljes mondatot is keresni a cikkéből, mivel egyes kaparók megváltoztathatják a címet. Bizonyos esetekben, amikor ilyen keresést végez, a Google ilyen értesítést jeleníthet meg az eredmények utolsó oldalán:

ez annak a jele, hogy a Google már ‘de-duping’ az eredményeket. Még mindig nem jó, ezért érdemes rákattintani a linkre, és megnézni az összes többi eredményt, hogy meg tudja-e javítani néhányat.

Olvass tovább: DIY: duplicate content check “

gyakorlati megoldások duplikált tartalomhoz

miután eldöntötte, melyik URL A tartalom kanonikus URL-je, el kell indítania a kanonizálás folyamatát (igen, tudom, próbáld meg ezt gyorsan háromszor hangosan kimondani). Ez azt jelenti, hogy el kell mondanunk a keresőmotoroknak az oldal kanonikus változatát, és hagynunk kell, hogy minél hamarabb megtalálják. A probléma megoldására négy módszer létezik, preferencia sorrendben:

nem hoz létre duplikált tartalmat
duplikált tartalom átirányítása a kanonikus URL-re
kanonikus link elem hozzáadása a duplikált oldalhoz
HTML link hozzáadása a duplikált oldalról a kanonikus oldalhoz

duplikált tartalom elkerülése

a duplikált tartalom fenti okai közül néhány nagyon egyszerű javítással rendelkezik:

vannak munkamenet-azonosítók Az URL-ekben?
ezeket gyakran csak le lehet tiltani a rendszer beállításaiban.
van duplikált nyomtatóbarát oldala?
ezek teljesen feleslegesek: csak nyomtatási stíluslapot kell használnia.
használja a Megjegyzések oldalszámozását a WordPress programban?
csak tiltsa le ezt a funkciót (a Beállítások “vita” alatt) a webhelyek 99% – án.
a paraméterek más sorrendben vannak?
mondja meg a programozónak, hogy készítsen egy szkriptet, amely mindig ugyanabba a sorrendbe helyezi a paramétereket (ezt gyakran URL-gyárnak nevezik).
vannak nyomon követési linkek problémák?
a legtöbb esetben a kivonatcímke alapú kampánykövetést használhatja a paraméteralapú kampánykövetés helyett.
van WWW vs. nem WWW kérdés?
válasszon egyet, és ragaszkodjon hozzá úgy, hogy átirányítja az egyiket a másikra. Beállíthat egy beállítást a Google Webmestereszközökben is, de a domain név mindkét verzióját igényelnie kell.

ha a probléma nem olyan könnyen megoldható, még mindig érdemes erőfeszítéseket tenni. A cél az, hogy megakadályozzuk a duplikált tartalom teljes megjelenését, mert ez messze a legjobb megoldás a problémára.

301 duplikált tartalom átirányítása

bizonyos esetekben lehetetlen teljesen megakadályozni, hogy az Ön által használt rendszer rossz URL-eket hozzon létre a tartalomhoz, de néha lehetséges átirányítani őket. Ha ez nem logikus számodra (amit meg tudok érteni), tartsd szem előtt, miközben beszélsz a fejlesztőkkel. Ha megszabadul a duplikált tartalommal kapcsolatos problémáktól, győződjön meg arról, hogy az összes régi duplikált tartalom URL-jét átirányítja a megfelelő kanonikus URL-ekre.

hivatkozások használata

néha nem akar vagy nem tud megszabadulni egy cikk duplikált verziójától, még akkor sem, ha tudja, hogy az nem a megfelelő URL. Ennek a kérdésnek a megoldására a keresőmotorok bevezették a kanonikus link elemet. A webhely <head> részében található, és így néz ki:

<link rel="canonical" href="http://example.com/wordpress/seo-plugin/" />

a kanonikus hivatkozás href szakaszában helyezze el a cikk megfelelő kanonikus URL-jét. Amikor a canonical-t támogató keresőmotor megtalálja ezt a linkelemet, puha 301-es átirányítást hajt végre, az adott oldal által összegyűjtött linkérték nagy részét áthelyezve a canonical oldalára.

ez a folyamat kissé lassabb, mint a 301-es átirányítás, tehát ha csak 301-es átirányítást végezhet, akkor az előnyösebb lenne, amint azt a Google John Mueller említette.

Olvass tovább: rel=canonical * mi ez és hogyan (nem) kell használni “

visszahelyezés az eredeti tartalomra

ha a fentiek egyikét sem tudja megtenni, valószínűleg azért, mert nem irányítja a tartalom <head> szakaszát annak a webhelynek, amelyen a tartalom megjelenik, mindig jó ötlet az eredeti cikkhez való hivatkozás hozzáadása a cikk tetején vagy alatt. Érdemes ezt az RSS feed hozzáadásával egy linket vissza a cikket is. Néhány kaparó kiszűri ezt a linket, de mások bent hagyhatják. Ha a Google több linket talál, amelyek az eredeti cikkre mutatnak, akkor elég hamar rájön, hogy ez a tényleges kanonikus változat.

következtetés: a duplikált tartalom javítható, és javítani kell

a duplikált tartalom mindenhol előfordul. Még nem találkoztam olyan, több mint 1000 oldalas oldallal, amelynek nincs legalább egy apró duplikált tartalmi problémája. Ez valami, amit folyamatosan szemmel kell tartania, de javítható, és a jutalmak bőségesek lehetnek. Minőségi tartalma szárnyalhat a rangsorban, csak azáltal, hogy megszabadul a webhely ismétlődő tartalmától!

olvassa tovább: Rel=canonical: a végső útmutató ”

ismétlődő tartalom: okok és megoldások

mi az ismétlődő tartalom?

illusztráljuk ezt egy példával

a duplikált tartalom okai

félreértés a koncepció egy URL

munkamenet-azonosítók

nyomon követéshez és rendezéshez használt URL-paraméterek

Scrapers and content syndication

paraméterek sorrendje

Megjegyzés oldalszámozás

Nyomtatóbarát oldalak

WWW vs.non-WWW

fogalmi megoldás: a ‘kanonikus’ URL

ironikus mellékjegyzet

a duplikált tartalmak azonosítása problémák

gyakorlati megoldások duplikált tartalomhoz

duplikált tartalom elkerülése

301 duplikált tartalom átirányítása

hivatkozások használata

visszahelyezés az eredeti tartalomra

következtetés: a duplikált tartalom javítható, és javítani kell

Vélemény, hozzászólás? Kilépés a válaszból

Bacitracin adagolás

11 fizikai tünetek nem tudta, hogy a stressz okozta

ismétlődő tartalom: okok és megoldások

mi az ismétlődő tartalom?

illusztráljuk ezt egy példával

a duplikált tartalom okai

félreértés a koncepció egy URL

munkamenet-azonosítók

nyomon követéshez és rendezéshez használt URL-paraméterek

Scrapers and content syndication

paraméterek sorrendje

Megjegyzés oldalszámozás

Nyomtatóbarát oldalak

WWW vs.non-WWW

fogalmi megoldás: a ‘kanonikus’ URL

ironikus mellékjegyzet

a duplikált tartalmak azonosítása problémák

gyakorlati megoldások duplikált tartalomhoz

duplikált tartalom elkerülése

301 duplikált tartalom átirányítása

hivatkozások használata

visszahelyezés az eredeti tartalomra

következtetés: a duplikált tartalom javítható, és javítani kell

Vélemény, hozzászólás? Kilépés a válaszból

More:

Bacitracin adagolás

11 fizikai tünetek nem tudta, hogy a stressz okozta