Duplicate content :Årsaker og løsninger

Joost De Valk

Joost De Valk er grunnlegger Og Chief Product Officer Av Yoast. Han er en internett-entreprenør, som ved siden av grunnleggelsen Yoast har investert i og rådet flere oppstart. Hans hovedkompetanse er åpen kildekode programvareutvikling og digital markedsføring.

Søkemotorer Som Google har et problem-det kalles ‘duplikat innhold’. Duplikat innhold betyr at lignende innhold vises på Flere steder (Nettadresser) på nettet, og som et resultat av søkemotorer ikke vet HVILKEN URL som skal vises i søkeresultatene. Dette kan skade rangeringen av en nettside, og problemet blir bare verre når folk begynner å koble til de forskjellige versjonene av det samme innholdet. Denne artikkelen vil hjelpe deg å forstå de ulike årsakene til duplikatinnhold, og å finne løsningen på hver av dem.

  • hva er duplikatinnhold?
    • la oss illustrere dette med et eksempel
  • årsaker til duplikatinnhold
    • Misforståelse av BEGREPET EN URL
    • Økt-Ider
    • URL-parametere som brukes til sporing og sortering
    • Skrapere og innholdssyndikering
    • rekkefølge av parametere
    • kommentarpaginering
    • Utskriftsvennlige sider
    • WWW Vs. ikke-www
  • Konseptuell løsning: En’ kanonisk ‘ URL
  • Identifisere problemer med duplikatinnhold
  • Praktiske løsninger for duplikatinnhold
    • Unngå duplikatinnhold
    • 301 Omdirigering av duplikatinnhold
    • ved hjelp av koblinger
    • Kobling tilbake til det opprinnelige innholdet
  • konklusjon: duplikatinnhold kan løses, og bør løses

Hva er duplikatinnhold?

Duplikatinnhold er innhold som er tilgjengelig på flere Nettadresser på nettet. Fordi flere NETTADRESSER viser det samme innholdet, vet ikke søkemotorene hvilken NETTADRESSE som skal vises høyere i søkeresultatene. Derfor kan de rangere Begge Nettadressene lavere og gi preferanse til andre nettsider.

I denne artikkelen vil vi for det meste fokusere på de tekniske årsakene til duplikatinnhold og deres løsninger. Hvis du vil få et bredere perspektiv på duplikatinnhold og lære hvordan det relaterer seg til kopiert eller skrapt innhold eller til og med nøkkelordkannibalisering, anbefaler vi deg å lese dette innlegget: Hva er duplikatinnhold.

la oss illustrere dette med et eksempel

Duplikatinnhold kan sammenlignes med å være ved et veikryss der veiskilt peker i to forskjellige retninger for samme destinasjon: Hvilken vei skal du ta? For å gjøre vondt verre, den endelige destinasjonen er annerledes også, men bare aldri så litt. Som leser har du ikke noe imot at du får innholdet du kom for, men en søkemotor må velge hvilken side som skal vises i søkeresultatene fordi den selvfølgelig ikke vil vise det samme innholdet to ganger.

la oss si at artikkelen din om’ søkeord x ‘ vises på og det samme innholdet vises også på . Denne situasjonen er ikke fiktiv: det skjer i mange moderne Innholdsstyringssystemer. La oss si at artikkelen din har blitt plukket opp av flere bloggere, og noen av dem lenker til den første NETTADRESSEN, mens andre lenker til den andre. Dette er når søkemotorens problem viser sin sanne natur: det er ditt problem. Duplikat innhold er ditt problem fordi disse koblingene både fremme Ulike Nettadresser. Hvis de var alle linking til SAMME URL, sjansene for rangering for ‘søkeord x’ ville være høyere.

hvis du ikke vet om rangeringen din lider av problemer med duplikatinnhold, vil disse verktøyene for oppdagelse av duplikatinnhold hjelpe deg med å finne ut!

Årsaker til duplikatinnhold

det er dusinvis av grunner til duplikatinnhold. De fleste av dem er tekniske: det er ikke så ofte at et menneske bestemmer seg for å sette det samme innholdet på to forskjellige steder uten å gjøre det klart som er originalen. Med mindre du har klonet et innlegg og publisert det ved et uhell selvfølgelig. Men ellers føles det unaturlig for de fleste av oss.

det er mange tekniske grunner skjønt, og det skjer for det meste fordi utviklere ikke tenker som en nettleser eller en bruker, enn si en søkemotor edderkopp – de tenker som en programmerer. Ta den artikkelen vi nevnte tidligere, som vises på og . Hvis du spør utvikleren, vil de si at den bare eksisterer en gang.

Misforståelse konseptet MED EN URL

Nei, den utvikleren har ikke blitt gal, de snakker bare et annet språk. ET CMS vil trolig drive nettstedet, og i den databasen er det bare en artikkel, men nettstedets programvare tillater bare at samme artikkel i databasen hentes gjennom flere Nettadresser. Det er fordi, i utviklerens øyne, er den unike identifikatoren for den artikkelen IDEN som artikkelen har i databasen, ikke NETTADRESSEN. MEN for søkemotoren ER NETTADRESSEN den unike identifikatoren for et innhold. Hvis du forklarer det til en utvikler, vil de begynne å få problemet. Og etter å ha lest denne artikkelen, vil du selv kunne gi dem en løsning med en gang.

Økt-Ider

du vil ofte holde oversikt over dine besøkende og la dem for eksempel lagre varer de vil kjøpe i en handlekurv. For å gjøre det, du må gi dem en ‘ økt .’En økt er en kort historie om hva den besøkende gjorde på nettstedet ditt og kan inneholde ting som varene i handlekurven. For å opprettholde den økten som en besøkende klikker fra en side til en annen, må den unike identifikatoren for den økten – Kalt Økt – ID-lagres et sted. Den vanligste løsningen er å gjøre det med cookies. Søkemotorer lagrer vanligvis ikke informasjonskapsler.

på det tidspunktet faller noen systemer tilbake til Å bruke Økt-Ider i NETTADRESSEN. Dette betyr at hver intern lenke på nettstedet får Den Økt-ID-en lagt TIL I NETTADRESSEN, og Fordi Den Økt-ID-EN er unik for den økten, oppretter Den en ny NETTADRESSE, og derfor duplikat innhold.

URL-parametere som brukes til sporing og sortering

En annen årsak til duplikatinnhold er Å bruke URL-parametere som ikke endrer innholdet på en side, for eksempel i sporingskoblinger. Du ser, til en søkemotor, og er ikke DEN SAMME NETTADRESSEN. Sistnevnte kan tillate deg å spore hvilken kilde folk kom fra, men det kan også gjøre det vanskeligere for deg å rangere bra – veldig mye en uønsket bivirkning!

Dette går ikke bare for sporingsparametere, selvfølgelig. Det gjelder for hver parameter du kan legge til I EN URL som ikke endrer det viktige innholdet, enten den parameteren er for å endre sorteringen på et sett med produkter eller for å vise et annet sidebar: alle forårsaker duplikatinnhold.

Skrapere og innholdssyndikering

de fleste årsakene til duplikatinnhold er enten feilen til deg eller nettstedet ditt. Noen ganger bruker imidlertid andre nettsteder innholdet ditt, med eller uten ditt samtykke. De kobler ikke alltid til den opprinnelige artikkelen, og derfor søkemotoren ikke ‘ få ‘ det og har å håndtere enda en versjon av den samme artikkelen. Jo mer populært nettstedet ditt blir, jo flere skraper får du, noe som gjør dette problemet større og større.

rekkefølge av parametere

En annen vanlig årsak er at ET CMS ikke bruker fine rene Nettadresser, Men Heller Nettadresser som /?id=1&cat=2, HVOR ID refererer til artikkelen og cat refererer til kategorien. NETTADRESSEN /?cat=2&id=1 vil gi de samme resultatene i de fleste nettstedssystemer, men de er helt forskjellige for en søkemotor.

Kommentar paginering

i min elskede WordPress, men også i noen andre systemer, er det et alternativ å paginere dine kommentarer. Dette fører til at innholdet blir duplisert over artikkelen URL, og artikkelen URL + / kommentar-side-1/, / kommentar-side-2 / etc.

Utskriftsvennlige sider

Hvis innholdsstyringssystemet ditt oppretter utskriftsvennlige sider og du kobler til dem fra artikkelsidene dine, Vil Google vanligvis finne dem, med mindre du spesifikt blokkerer dem. Spør Deg Selv: Hvilken versjon Vil Du At Google skal vise? Den med annonsene og perifert innhold, eller den som bare viser artikkelen din?

WWW vs ikke-WWW

dette er en av de eldste i boken, men noen ganger søkemotorer fortsatt får det galt: WWW vs ikke-WWW duplikat innhold, når begge versjoner av nettstedet ditt er tilgjengelige. En annen, mindre vanlig situasjon, men en jeg har sett også ER HTTP vs HTTPS duplikatinnhold, hvor det samme innholdet serveres ut over begge.

Konseptuell løsning:en’ kanonisk ‘ URL

som vi allerede har sett, er det faktum at flere Nettadresser fører til det samme innholdet et problem, men det kan løses. En person som jobber på en publikasjon vil normalt kunne fortelle deg ganske enkelt hva den ‘riktige’ NETTADRESSEN for en bestemt artikkel skal være, men noen ganger når du spør tre personer i samme firma, får du tre forskjellige svar…

Det er et problem som må adresseres fordi det til slutt bare kan være EN (URL). At ‘riktig’ URL FOR et stykke innhold er referert Til Som Kanoniske URL av søkemotorer.

Ironisk sidenote

Kanonisk er et begrep som stammer fra Den Romersk-Katolske tradisjonen, hvor en liste over hellige bøker ble opprettet og akseptert som ekte. De var kjent som de kanoniske Evangeliene I Det Nye Testamente. Ironien er at det tok Den Romersk-Katolske kirke ca 300 år og mange kamper for å komme opp med den kanoniske listen, og de valgte til slutt fire versjoner av samme historie…

Identifisere duplikat innholdsproblemer

du vet kanskje ikke om du har et duplikat innholdsproblem på nettstedet ditt eller med innholdet ditt. Å Bruke Google Er en av de enkleste måtene å få øye på duplikatinnhold.

det er flere søkeoperatører som er svært nyttige i tilfeller som disse. Hvis du vil finne Alle Nettadressene På nettstedet ditt som inneholder søkeordet X-artikkelen Din, skriver du inn følgende søkefrase I Google:

site:example.com intitle:"Keyword X"

Google vil da vise deg alle sidene på example.com som inneholder det søkeordet. Jo mer spesifikk du gjør den intitle delen av spørringen, desto lettere er det å luke ut duplikatinnhold. Du kan bruke samme metode for å identifisere duplikatinnhold på nettet. La oss si at hele tittelen på artikkelen din var ‘Søkeord X-hvorfor det er kjempebra’ ,du vil søke etter:

intitle:"Keyword X - why it is awesome"

Og Google vil gi deg alle nettsteder som samsvarer med den tittelen. Noen ganger er det verdt å søke etter en eller to komplette setninger fra artikkelen din, da noen skraper kan endre tittelen. I noen tilfeller, Når Du gjør et slikt søk, Kan Google vise et varsel som dette på den siste siden med resultater:

Dette er et tegn På At Google allerede er ‘de-duping’ resultatene. Det er fortsatt ikke bra, så det er verdt å klikke på linken og se på alle de andre resultatene for å se om du kan fikse noen av dem.

LES mer: DIY: duplicate content check «

Praktiske løsninger for duplikatinnhold

Når du har bestemt hvilken URL som er den kanoniske NETTADRESSEN for innholdet ditt, må du starte en kanoniseringsprosess (ja jeg vet, prøv å si det tre ganger høyt fort). Dette betyr at vi må fortelle søkemotorer om den kanoniske versjonen av en side og la dem finne DEN ASAP. Det er fire metoder for å løse problemet, i rekkefølge av preferanse:

  1. Ikke opprette duplikatinnhold
  2. Omdirigere duplikatinnhold til DEN kanoniske NETTADRESSEN
  3. Legge til et kanonisk koblingselement til duplikatsiden
  4. Legge TIL EN HTML-kobling fra duplikatsiden til den kanoniske siden

Unngå duplikatinnhold

Noen av de ovennevnte årsakene til duplikatinnhold har svært enkle løsninger på dem:

  • Finnes Det Økt-ID-ER i Nettadressene dine?
    Disse kan ofte bare deaktiveres i systemets innstillinger.
  • Har du dupliserte utskriftsvennlige sider?
    Disse er helt unødvendige: du bør bare bruke et skriv ut stilark.
  • bruker du kommentar paginering I WordPress?
    du bør bare deaktivere denne funksjonen (under innstillinger » diskusjon) på 99% av nettstedene.
  • er parametrene dine i en annen rekkefølge?
    Fortell programmereren din å bygge et skript for alltid å sette parametere i samme rekkefølge(dette kalles ofte EN URL-fabrikk).
  • er det problemer med sporingskoblinger?
    I de fleste tilfeller kan du bruke hash tag-basert kampanjesporing i stedet for parameterbasert kampanjesporing.
  • Har DU WWW vs ikke-WWW problemer?
    Velg en og hold deg til den ved å omdirigere den ene til den andre. Du kan også angi en preferanse I Googles Verktøy For Nettredaktører, men du må kreve begge versjoner av domenenavnet.

hvis problemet ditt ikke er så lett løst, kan det fortsatt være verdt å sette inn innsatsen. Målet bør være å forhindre at duplikatinnhold vises helt, fordi det er langt den beste løsningen på problemet.

301 Omdirigere duplikatinnhold

i noen tilfeller er det umulig å helt forhindre at systemet du bruker, oppretter feil Nettadresser for innhold, men noen ganger er det mulig å omdirigere dem. Hvis dette ikke er logisk for deg (som jeg kan forstå), må du huske det mens du snakker med utviklerne dine. Hvis du blir kvitt noen av de dupliserte innholdsproblemene, må du sørge for at du omdirigerer alle de gamle dupliserte innholdsadressene til de riktige kanoniske Nettadressene.

bruke koblinger

Noen ganger vil du ikke eller kan ikke kvitte seg med en duplikatversjon av en artikkel, selv når du vet at det er feil URL. For å løse dette problemet har søkemotorene introdusert det kanoniske koblingselementet. Den er plassert i <head> delen av nettstedet ditt, og det ser slik ut:

<link rel="canonical" href="http://example.com/wordpress/seo-plugin/" />

I delen href i den kanoniske lenken plasserer du RIKTIG KANONISK URL for artikkelen din. Når en søkemotor som støtter canonical finner dette koblingselementet, utfører den en myk 301-omdirigering, og overfører det meste av koblingsverdien samlet av den siden til din kanoniske side.

denne prosessen er litt tregere enn 301 redirect skjønt, så hvis du bare kan gjøre en 301 redirect som ville være å foretrekke, som nevnt Av Googles John Mueller.

Fortsett å lese: rel=canonical * Hva det er og hvordan (ikke) å bruke det «

Kobling tilbake til det opprinnelige innholdet

hvis du ikke kan gjøre noe av det ovennevnte, muligens fordi du ikke kontrollerer <head> delen av nettstedet innholdet ditt vises på, er det alltid en god ide å legge til en lenke tilbake til den opprinnelige artikkelen på toppen av eller under artikkelen. Du vil kanskje gjøre DETTE I RSS-feeden ved å legge til en kobling tilbake til artikkelen i den. Noen skraper vil filtrere som kobler ut, men andre kan la den i. Hvis Google møter flere koblinger som peker til den opprinnelige artikkelen, vil det finne ut snart nok at det er den faktiske kanoniske versjonen.

Konklusjon: duplikatinnhold kan løses, og bør løses

Duplikatinnhold skjer overalt. Jeg har ennå ikke møtt et nettsted på mer enn 1000 sider som ikke har minst et lite duplikat innholdsproblem. Det er noe du må hele tiden holde øye med, men det er fikserbart, og belønningene kan være rikelig. Kvalitetsinnholdet ditt kan sveve i rangeringen, bare ved å bli kvitt duplikatinnhold fra nettstedet ditt!

Les videre: Rel=canonical: den ultimate guiden «

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

More: