Joost de Valk on Yoastin perustaja ja tuotejohtaja. Hän on internet-yrittäjä, joka Yoastin perustamisen jälkeen on sijoittanut ja neuvonut useita startup-yrityksiä. Hänen pääosaamistaan ovat avoimen lähdekoodin ohjelmistokehitys ja digitaalinen markkinointi.
hakukoneet kuten Google on ongelma-sitä kutsutaan ”päällekkäistä sisältöä”. Duplicate content tarkoittaa, että samanlainen sisältö näkyy useissa paikoissa (URL) verkossa, ja sen seurauksena hakukoneet eivät tiedä, mikä URL näyttää hakutuloksissa. Tämä voi vahingoittaa verkkosivun sijoitusta, ja ongelma vain pahenee, kun ihmiset alkavat linkittää saman sisällön eri versioihin. Tämä artikkeli auttaa sinua ymmärtämään eri syitä päällekkäistä sisältöä, ja löytää ratkaisu jokaiseen niistä.
- mikä on kaksoiskappalesisältö?
- havainnollistetaan tätä esimerkillä
- causes of duplicate content
- Rekonstruction the concept of a URL
- Session IDs
- URL parameters used for tracking and lajittelu
- Scrapers and content syndication
- paragraph
- Comment pagination
- Printer-friendly pages
- WWW vs. Ei-www
- käsitteellinen ratkaisu: ”kanoninen” URL
- kaksoiskappalesisältöä koskevien kysymysten tunnistaminen
- käytännön ratkaisut päällekkäistä sisältöä varten
- päällekkäisen sisällön välttäminen
- 301 päällekkäisen sisällön uudelleenohjaaminen
- linkkien avulla
- linkittäminen takaisin alkuperäiseen sisältöön
- johtopäätös: duplicate content is fixable, and should be fixed
- What is duplicate content?
- havainnollistetaan tätä esimerkillä
- syitä päällekkäiselle sisällölle
- väärin käsite URL
- Sessiotunnukset
- jäljitykseen ja lajitteluun käytettävät URL-parametrit
- kaapimet ja sisällön syndikointi
- parametrien Järjestys
- Kommenttipakinointi
- Tulostusystävälliset sivut
- WWW vs. non-WWW
- käsitteellinen ratkaisu: ”kanoninen” URL
- ironinen sivuhuomautus
- tunnistamalla päällekkäisiä sisältöasioita
- käytännön ratkaisut duplicate content
- päällekkäisen sisällön välttäminen
- 301 päällekkäisen sisällön uudelleenohjaaminen
- käyttämällä linkkejä
- linkittäminen takaisin alkuperäiseen sisältöön
- johtopäätös: duplicate content is fixable, and should be fixed
What is duplicate content?
päällekkäinen sisältö on sisältöä, joka on saatavilla useilla Verkko-osoitteilla verkossa. Koska useampi kuin yksi URL näyttää samaa sisältöä, hakukoneet eivät tiedä, minkä URL-osoitteen pitäisi luetella hakutuloksissa korkeammalle. Siksi ne saattavat sijoittaa molemmat URL-osoitteet alemmas ja suosia muita verkkosivuja.
tässä artikkelissa keskitytään lähinnä päällekkäisen sisällön teknisiin syihin ja niiden ratkaisuihin. Jos haluat saada laajemman näkökulman päällekkäistä sisältöä ja oppia, miten se liittyy kopioitu tai kaavittu sisältöä tai jopa avainsanan kannibalisointi, neuvomme sinua lukemaan tämän postauksen: mikä on päällekkäistä sisältöä.
havainnollistetaan tätä esimerkillä
päällekkäistä sisältöä voidaan verrata risteykseen, jossa liikennemerkit osoittavat kahteen eri suuntaan samaan määränpäähän: kumpaa tietä kannattaa kulkea? Tilannetta pahentaa se, että myös lopullinen määränpää on erilainen, mutta vain vähän. Lukijana sinua ei haittaa, koska saat hakemasi sisällön, mutta hakukoneen on valittava, mikä sivu näytetään hakutuloksissa, koska se ei tietenkään halua näyttää samaa sisältöä kahdesti.
sanotaan, että artikkelisi ”keyword x” esiintyy ja sama sisältö esiintyy myös
. Tämä tilanne ei ole kuvitteellinen: se tapahtuu monissa nykyaikaisissa Sisällönhallintajärjestelmissä. Oletetaan sitten, että artikkeli on poimittu useita bloggaajia ja jotkut heistä linkki ensimmäiseen URL, kun taas toiset linkki toiseen. Tällöin hakukoneen ongelma näyttää todellisen luonteensa: se on sinun ongelmasi. Päällekkäinen sisältö on ongelmasi, koska nämä linkit molemmat edistävät eri URL-osoitteita. Jos ne kaikki linkittävät samaan URL-osoitteeseen, mahdollisuutesi sijoitus ”keyword x” olisi korkeampi.
jos et tiedä, kärsivätkö rankingissasi päällekkäisistä sisältöongelmista, nämä päällekkäiset sisällönetsintätyökalut auttavat sinua selvittämään!
syitä päällekkäiselle sisällölle
päällekkäiselle sisällölle on kymmeniä syitä. Suurin osa niistä on teknisiä: ei ole kovin usein niin, että ihminen päättää laittaa saman sisällön kahteen eri paikkaan selvittämättä, kumpi on alkuperäinen. Paitsi jos olet kloonannut viestin ja julkaissut sen vahingossa. Mutta muuten se tuntuu useimmille meistä luonnottomalta.
teknisiin syihin on kuitenkin monia syitä ja se tapahtuu useimmiten siksi, että kehittäjät eivät ajattele kuin selain tai edes käyttäjä, saati sitten hakukonehämähäkki – he ajattelevat kuin ohjelmoija. Otetaanpa tuo aiemmin mainitsemamme artikkeli, joka esiintyy ja
. Jos kysyt kehittäjältä, he sanovat, että se on olemassa vain kerran.
väärin käsite URL
ei, että kehittäjä ei ole tullut hulluksi, he vain puhuvat eri kieltä. CMS todennäköisesti valtaa sivuston, ja että tietokanta on vain yksi artikkeli, mutta sivuston ohjelmisto vain mahdollistaa saman artikkelin tietokannassa voidaan hakea kautta useita URL-osoitteita. Tämä johtuu siitä, että kehittäjän silmissä, kyseisen artikkelin yksilöllinen tunniste on tunnus, joka artikkelissa on tietokannassa,ei URL. Mutta hakukone, URL on yksilöllinen tunniste pala sisältöä. Jos selität, että kehittäjä, he alkavat saada ongelma. Ja kun olet lukenut tämän artikkelin, voit jopa tarjota heille ratkaisun heti.
Sessiotunnukset
haluat usein pitää kirjaa kävijöistäsi ja antaa heidän esimerkiksi säilyttää haluamiaan tavaroita ostoskorissa. Jotta voit tehdä sen, sinun täytyy antaa heille ’ istunto.”Istunto on lyhyt historia siitä, mitä kävijä teki sivustosi ja voi sisältää asioita, kuten kohteita niiden ostoskorissa. Jotta istunto säilyisi vierailijana, sen yksilöllinen tunniste – jota kutsutaan Istuntotunnukseksi – on tallennettava jonnekin. Yleisin ratkaisu on tehdä se evästeiden kanssa. Hakukoneet eivät kuitenkaan yleensä tallenna evästeitä.
tässä vaiheessa jotkin järjestelmät palaavat käyttämään Istuntotunnuksia URL-osoitteessa. Tämä tarkoittaa, että jokainen verkkosivuston sisäinen linkki saa kyseisen istuntotunnuksen lisättyä URL-osoitteeseensa, ja koska kyseinen Istuntotunnusaineisto on ainutlaatuinen kyseiselle istunnolle, se luo uuden URL-osoitteen ja siten päällekkäistä sisältöä.
jäljitykseen ja lajitteluun käytettävät URL-parametrit
toinen päällekkäisen sisällön aiheuttaja on URL-parametrit, jotka eivät muuta sivun sisältöä, esimerkiksi seurantalinkit. Hakukoneelle näet, että ja
eivät ole sama URL. Jälkimmäinen voi antaa sinun seurata, mistä lähteestä ihmiset tulivat, mutta se voi myös vaikeuttaa sijoitusta hyvin-hyvin paljon ei-toivottu sivuvaikutus!
tämä ei tietenkään koske vain seurantaparametreja. Se koskee jokaista parametria, jonka voit lisätä URL-osoitteeseen, joka ei muuta tärkeää sisältöä, riippumatta siitä, onko kyseinen parametri ’tuotesarjan lajittelun muuttamiseksi’ tai ’toisen sivupalkin näyttämiseksi’: Kaikki ne aiheuttavat päällekkäistä sisältöä.
kaapimet ja sisällön syndikointi
useimmat syyt päällekkäiseen sisältöön ovat joko sinun tai verkkosivustosi ”vika”. Joskus muut verkkosivustot kuitenkin käyttävät sisältöäsi, suostumuksellasi tai ilman. Ne eivät aina linkitä alkuperäiseen artikkeliisi, ja siksi hakukone ei ’saa’ sitä ja joutuu käsittelemään vielä yhden version samasta artikkelista. Mitä suositumpi sivustosi tulee, sitä enemmän kaapimet saat, joten tämä ongelma isompi ja isompi.
parametrien Järjestys
toinen yleinen syy on, että CMS ei käytä Nizzan puhtaita URL-osoitteita, vaan pikemminkin URL-osoitteita kuten /?id=1&cat=2
, jossa ID viittaa artikkeliin ja cat luokkaan. URL /?cat=2&id=1
antaa samat tulokset useimmissa verkkosivustojen järjestelmissä, mutta ne ovat hakukoneelle täysin erilaisia.
Kommenttipakinointi
rakkaassa WordPressissä, mutta myös joissakin muissa järjestelmissä on mahdollisuus pakinoida kommenttisi. Tämä johtaa sisällön kopiointi koko artikkelin URL, ja artikkeli URL + / comment-page-1/,/ comment-page-2 / etc.
Tulostusystävälliset sivut
jos sisällönhallintajärjestelmäsi luo tulostusystävällisiä sivuja ja linkität niihin artikkelisivuiltasi, Google yleensä löytää ne, ellet erityisesti estä niitä. Kysy itseltäsi: minkä version haluat Googlen näyttävän? Se, jossa on mainoksia ja oheissisältöä, vai se, joka näyttää vain artikkelisi?
WWW vs. non-WWW
tämä on yksi kirjan vanhimmista, mutta joskus hakukoneet saavat sen silti väärin: WWW vs. non-WWW päällekkäistä sisältöä, kun sivustosi molemmat versiot ovat saatavilla. Toinen, harvinaisempi tilanne, mutta yksi Olen nähnyt samoin on HTTP vs. HTTPS päällekkäistä sisältöä, jossa sama sisältö tarjoillaan yli molemmat.
käsitteellinen ratkaisu: ”kanoninen” URL
kuten olemme jo nähneet, se, että useat URL-osoitteet johtavat samaan sisältöön, on ongelma, mutta se voidaan ratkaista. Yksi henkilö, joka työskentelee julkaisussa, voi yleensä kertoa sinulle melko helposti, mikä tietyn artikkelin’ oikea ’ URL-osoite pitäisi olla, mutta joskus kun kysyt kolmelta henkilöltä samassa yrityksessä, saat kolme eri vastausta…
se on ongelma, joka tarvitsee käsitellä, koska loppujen lopuksi, voi olla vain yksi (URL). Tämä’ oikea ’ URL pala sisältöä kutsutaan kanoninen URL hakukoneet.
ironinen sivuhuomautus
kanoninen on termi, joka polveutuu roomalaiskatolisesta perinteestä, jossa pyhien kirjojen luettelo luotiin ja hyväksyttiin aidoksi. Ne tunnettiin Uuden testamentin kanonisina Evankeliumeina. Ironista on se, että Roomalaiskatoliselta kirkolta kesti noin 300 vuotta ja lukuisia taisteluita saada aikaan tuo kanoninen luettelo, ja he valitsivat lopulta neljä versiota samasta tarinasta …
tunnistamalla päällekkäisiä sisältöasioita
et ehkä tiedä, onko sivustossasi tai sisällölläsi päällekkäisiä sisältöasioita. Googlen käyttö on yksi helpoimmista tavoista havaita päällekkäistä sisältöä.
on olemassa useita hakuoperaattoreita, jotka ovat erittäin hyödyllisiä tällaisissa tapauksissa. Jos haluat löytää kaikki URL-osoitteet sivustossasi, jotka sisältävät avainsanan X artikkeli, kirjoita seuraava hakulause Google:
site:example.com intitle:"Keyword X"
Google näyttää sitten kaikki sivut example.com jotka sisältävät sen avainsanan. Mitä tarkempi tuo intitle
on osa kyselyä,sitä helpompi on karsia päällekkäistä sisältöä. Voit käyttää samaa menetelmää tunnistaaksesi päällekkäisen sisällön verkossa. Oletetaan, että koko otsikko artikkeli oli ’Keyword X-miksi se on mahtava’, voit etsiä:
intitle:"Keyword X - why it is awesome"
ja Google antaisi sinulle kaikki sivustot, jotka vastaavat tätä otsikko. Joskus kannattaa jopa etsiä artikkelista yksi tai kaksi kokonaista lausetta, sillä jotkut kaapijat saattavat vaihtaa otsikkoa. Joissakin tapauksissa, kun teet haun, että, Google saattaa näyttää ilmoituksen näin viimeisellä sivulla tulokset:
tämä on merkki siitä, että Google on jo ”de-duping” tuloksia. Se ei ole vieläkään hyvä, joten se kannattaa klikata linkkiä ja katsoa kaikki muut tulokset nähdä, jos voit korjata joitakin niistä.
Lue lisää: DIY: duplicate content check ”
käytännön ratkaisut duplicate content
kun olet päättänyt, mikä URL on kanoninen URL sisällölle, sinun täytyy aloittaa kanonisointiprosessi (Joo tiedän, kokeile sanoa, että kolme kertaa ääneen nopeasti). Tämä tarkoittaa, että meidän on kerrottava hakukoneille sivun kanonisesta versiosta ja annettava heidän löytää se mahdollisimman pian. On neljä tapaa ratkaista ongelma, paremmuusjärjestyksessä:
- ei luoda päällekkäistä sisältöä
- päällekkäisen sisällön ohjaaminen kanoniseen URL-osoitteeseen
- kanonisen linkkielementin lisääminen kaksoiskappalesivulle
- HTML-linkin lisääminen kaksoiskappalesivulta kanoniselle sivulle
päällekkäisen sisällön välttäminen
jotkin edellä mainituista syistä kaksoiskappaleen sisältöön ovat hyvin yksinkertaisia korjauksia niihin:
- onko URL-osoitteissasi Istuntotunnukset?
nämä voidaan usein vain poistaa käytöstä järjestelmäsi asetuksista. - onko sinulla tulostusystävällisiä sivuja?
nämä ovat täysin tarpeettomia: kannattaa käyttää vain tulostustyylilevyä. - käytätkö Kommenttisivutusta WordPressissä?
sinun pitäisi vain poistaa tämä ominaisuus (asetukset ” keskustelu) 99%: ssa sivustoista. - ovatko muuttujasi eri järjestyksessä?
Käske ohjelmoijan rakentaa skripti, joka laittaa parametrit aina samaan järjestykseen (tätä kutsutaan usein URL-tehtaaksi). - onko seurantalinkkiongelmia?
useimmissa tapauksissa voit käyttää hash tag-pohjaista kampanjaseurantaa parametripohjaisen kampanjaseurannan sijaan. - Have you got WWW vs. non-WWW issues?
valitse toinen ja pysy siinä ohjaamalla toinen toiseen. Voit myös asettaa mieltymyksen Googlen Webmaster Tools-työkaluissa, mutta sinun täytyy lunastaa verkkotunnuksen molemmat versiot.
jos ongelmasi ei ole niin helposti korjattavissa, kannattaa silti nähdä vaivaa. Tavoitteena pitäisi olla estää päällekkäistä sisältöä ilmestymästä kokonaan, koska se on ylivoimaisesti paras ratkaisu ongelmaan.
301 päällekkäisen sisällön uudelleenohjaaminen
joissakin tapauksissa on mahdotonta täysin estää käyttämääsi järjestelmää luomasta vääriä URL-osoitteita sisällölle, mutta joskus on mahdollista uudelleenohjata ne. Jos tämä ei ole loogista sinulle (jonka voin ymmärtää), älä pidä sitä mielessä, kun puhut kehittäjille. Jos et päästä eroon joitakin päällekkäistä sisältöä kysymyksiä, varmista, että olet uudelleenohjata kaikki vanhat päällekkäistä sisältöä URL oikea canonical URL.
käyttämällä linkkejä
joskus et halua tai voi päästä eroon artikkelin kaksoiskappaleesta, vaikka tiedät, että se on väärä URL. Tämän ongelman ratkaisemiseksi hakukoneet ovat ottaneet käyttöön kanonisen linkin elementin. Se on sijoitettu sivustosi <head> – osioon, ja se näyttää tältä:
<link rel="canonical" href="http://example.com/wordpress/seo-plugin/" />
kanonisen linkin osioon href
asetat artikkelillesi oikean kanonisen URL-osoitteen. Kun hakukone, joka tukee canonical löytää tämän linkin elementti, se suorittaa pehmeä 301 uudelleenohjaus, siirtää suurimman osan linkin arvon keräämät kyseisen sivun canonical sivulle.
tämä prosessi on kuitenkin hieman hitaampi kuin 301 uudelleenohjaus, joten jos voit vain tehdä 301 uudelleenohjaus, se olisi parempi, kuten Googlen John Mueller mainitsi.
Jatka lukemista: rel=kanoninen • mikä se on ja miten (ei) käyttää sitä ”
linkittäminen takaisin alkuperäiseen sisältöön
jos et voi tehdä mitään edellä mainituista, mahdollisesti siksi, että et hallitse <head> – osiota sivustolla, jossa sisältösi näkyy, linkin lisääminen takaisin alkuperäiseen artikkeliin artikkelin ylä-tai alapuolella on aina hyvä idea. Haluat ehkä tehdä tämän RSS-syötteen lisäämällä linkin takaisin artikkelin siinä. Jotkut kaapimet suodattavat tuon linkin pois, mutta toiset saattavat jättää sen sisään. Jos Google kohtaa useita linkkejä, jotka viittaavat alkuperäiseen artikkeliisi, se tajuaa tarpeeksi pian, että se on varsinainen canonical-versio.
johtopäätös: duplicate content is fixable, and should be fixed
Duplicate content happens everywhere. Olen vielä törmännyt sivusto yli 1,000 sivua, joka ei ole saanut ainakin pieni päällekkäistä sisältöä ongelma. Se on jotain sinun täytyy jatkuvasti pitää silmällä, mutta se on korjattavissa, ja palkintoja voi olla runsaasti. Laadukas sisältö voisi kohota rankingissa, vain hankkiutumalla eroon päällekkäistä sisältöä sivustostasi!
Read on: Rel=canonical: the ultimate guide ”