Marcel Fuursted

SEO, entrepreneurship & Internet Marketing

SEO, entrepreneurship & Internet Marketing by Marcel Fuursted

Hvad er Duplicate Content

Duplicate content er flere ting. Det er flere indgange til samme side, det er brug af flere domæner med samme indhold og det er kopier af indholdet rundt omkring på andre sider - hver af disse dukker op på flere måder og kan have indflydelse på din ranking.

Når vi taler flere indgange til samme side, er det emnet om CMS, webshops og blogværktøjer, der ofte dukker op. Jeg har senest set emnet på Kurt Moskjærs blog, hvor Wordpress og duplicate content blev taget op. Lige præcis ved Wordpress ser jeg ikke problemet, da det er et blogværktøj der har en webarkitektur og infrastruktur der pleaser søgemaskinerne. Som jeg skrev i Kurts indlæg:

Hej, Kurt

Som jeg også nævner på Grosens blog, så er der nogle misforståelser i forbindelse med duplicate content og kategorisering. Der er kun ÉT oprindeligt indlæg, og det er indlæggets adresse f.eks. www.fuursted.net/søgemaskineoptimering-det-er-de-sma-ting.aspx
Denne er så placeret på bl.a. forsiden og www.fuursted.net/category/seo/ men forkortet! Teoretisk set kan du have dublikeret indhold overalt, bare du linker til den oprindelige artikel… Det vigtigste er bare, at hele indlægget ikke ligger rundt omkring - hellere kun uddrag

Grunden til at problemet med duplicate content ofte er ekstremt i CMS’er er deres manglende evner til at lukke af for de andre indgange eller dårlig brug af printvenlig side - men derfor er der heldigvis folk, som mig selv :grin: . Hvorfor er det så slemt? Det er der flere årsager til!

  1. Linkværdien fordeles over flere sider, hvilket kunne udnyttes meget bedre på en side, som alt fokus skal være på.
  2. Flere sider med samme indhold i søgemaskinerne gør ofte, at Google må vælge, hvilken side de helst vil beholde, da de ikke vil lade en Google-bruger få de samme sider listet ned i SERPs
  3. Hvis en printvenlig side bliver indekseret i stedet for den oprindelige artikel har vi samme problem, som med frames - en indholdsrig, flot side uden CTA og navigation :???:
  4. Når Googlebot besøger dit site har den på forhånd en idé om, hvor meget den skal crawle på dit site - og hvis der så pludselig er flere sider end først beregnet, så bliver din kvote (crawling budget) brugt på crawling af sider, som egentligt bare er replikeret.

Sidstnævnte er faktisk også årsag til, at Googlebot sommetider havner i et loop. Hvis dette sker kan det være dit site ikke bliver indekseret ordentligt og derfor falder kraftigt i søgeresultaterne UDEN, at det er Googles formål at straffe dig…

Men for at vende tilbage til duplicate content uden for dit website, så er der de to, jeg nævner: Du bruger selv flere domæner eller andre benytter dine artikler. Sidsnævnte er ikke slem, hvis de referer til kilden - det er jo det hele blogosfæren går ud på. Det er også det, jeg nævner på Kurts blog - at Wordpress sørger for at have én rigtig artikel - en sand side - og den linkes der til HVER gang, den vises i en kategori eller lignende. Hvad angår brug af flere domæner, så kan de to første punkter vist dække ret godt over, hvorfor det bare er no go.

Hvis du mener, du ikke er dækket ordentligt ind - uanset om du har en webmaster/programmør eller ej - så kan du tage fat på mig til rådgivning på min mail marcel@fuursted.net eller spørge mere ind til de specifikke ting her på bloggen :smile: .

16 comments for “Hvad er Duplicate Content”
  1. Marcel Fuursted siger:

    Hvorfor er Paris Hiltons nye bryster relateret til duplicate content??? :lol:

  2. Stefan Juhl siger:

    Flere domæner med EKSAKT samme indhold, er generelt ikke noget problem ifm. Google. Domænerne bliver identificeret som indeholdende samme website, og det site med “mest link popularitet” bliver vist i søgeresultater, men den samlede “link masse” tæller for det primære domæne.

    Men jeg er enig i, at man skal publicerer sit indhold på kun ét domæne (inkl. specifikt subdomæne). Og det af tre årsager:

    1) Andre søgemaskiner, der ikke ser verden på samme måde, som Google.

    2) Branding.. Kreative SEO’er kan “flytte” rankings fra branddomænet over på sekundære domæner…

    3) Rigtige kreative SEO’er har nemmere ved at hijacke rankings, hvis link populariteten er spredt udover flere domæner…

  3. Marcel Fuursted siger:

    Hej, Stefan… Jeg har desværre set eksempler på hvor flere domæner med EKSAKT samme indhold begge er indekseret i søgeresultaterne. Så jeg tror desværre, det hører under duplicate content :cry:

    Men jeg er enig med dig i de sidstnævnte punkter - især hvor kreative SEO’er er SEO’er til de konkurrerende sites :lol:

  4. Stefan Juhl siger:

    Okay, og der var ingen minimale forskellige, som f.eks. rendertime, datotid el.lign. i html’en..?

    Normalt tager det ikke mere end 3 dage for Google og forstå, at sitet er det samme, medmindre de nærmest aldrig crawler det, så kan det tage lidt længere. Effekten derimod varer gerne 1-3 måneder selvom indholdet er ændret så det er forskelligt næsten lige efter Google har besluttet at det er det samme.

    Jeg har endnu ikke set tilfælde, hvor der ikke var en eller anden forskel. Jeg bruger typisk metoden til at lave en “blød” flytning af sites i tilfælde hvor det ikke haster.

  5. Marcel Fuursted siger:

    Jeg sad med www.kristensengroup.dk, hvor der skulle ryddes op og det var faktisk lidt af noget rod, der var dér… Der var ingen forskel what so ever.

    Men jeg er enig med dig i, at Google godt kan skelne - og som du selv påpeger kan de andre søgemaskiner det ikke…

  6. Duplicate content siger:

    […] Marcel Fuursted har netop skrevet en artikel om duplicate content, som jeg synes er meget værd for vores læsere, da det er et undervurderet problem, som der bestemt skal løses - og helst med det samme. Efter sigende betyder det også, at de resterende sider på dit website ikke skulle blive crawlet på grund af et crawling budget. […]

  7. Stefan Juhl siger:

    Spøjst.. Jeg må vente på at jeg selv sidder med et eksempel på det. Det er jo heldigvis et sjældent problem i såfald. Og et evt. problem, som jo bør forhindres lige meget om det ikke er gået galt endnu.

  8. Thomas Fjordside siger:

    Nå da, mange tak for det Marcel. Jeg kan da se at jeg får lidt at se til på arbejde imorgen :D

    PS: Har du ikke fået dig et nyt design?

  9. Marcel Fuursted siger:

    Hej, Thomas

    Det var så lidt :)
    Jo, jeg fik et nyt design - jeg kan ikke selv designe en skid, så jeg fik ReFocus’ projektleder, Martin Østergaard, til at stå for det… Inspireret af hans egen blog.

  10. Thomas Fjordside siger:

    kudos til martin, det ser sq godt ud. Menuen på hans egen minder lidt for godt om hans adsense reklamer, jeg klikkede ikke på dem da jeg troede det var en af de vandrette link annoncer ;D det skulle han måske lige vide.

  11. Lars Bachmann siger:

    Fin artikel. Jeg tror nemlig der er mange webmastere der ikke aner hvad duplicate content kan gøre ved deres rankings. og den med Paris Hilton og duplicate content, den var god :lol:

  12. Martin Østergaard siger:

    Att. Thomas
    Hey tak for rosen og ikke mindst din mening om min menu. Kan godt se hvad du mener og har nu rettet lidt på det. Så skulle der være en chance for man ikke kommer i tvivl :smile:

  13. Thomas Fjordside siger:

    Det er jo allerede meget bedre nu martin.

  14. Martin Østergaard siger:

    Det var godt :grin:

  15. Grosen Friis siger:

    >> Lige præcis ved Wordpress ser jeg ikke problemet, da det er et blogværktøj der har en webarkitektur og infrastruktur der pleaser søgemaskinerne.

    Hej Marcel

    WordPress har altså et kæmpe stort problem med at en hel del sider havner i Google Supplemental Index, og det skyldes altså at indhold fra indlæg gengives i forskellige URL’er, fx i et indlægs efen unikke URLL, i URL’er der bruges til at sortere indlæg efter dato/periode eller efter tema/tag. Det er ikke nok at indlæggene i de 2 sidstnævnte situationer er blandet sammen med andre indlæg.

    Min egen blog havde fra starten lynhurtigt en masse sider indekseret i Google Supplemental Index, og jeg styrede jo naturligvis ikke selv hvilke URL’er der havnede i Googles primære indeks, og hvilke der havnede i Googles Supplemental Index. Derudover skete der jo også en skade på min blogs trust, fordi der var så meget der røg i Google Supplemental Index.

    Det har jeg nu fået løst, og jeg har tidligere skrevet et indlæg om, hvordan man teknisk kan gribe det an for en WordPress baseret blog:

    http://www.gblog.dk/wordpress-daarlig-url-struktur.html

    /Grosen Friis

  16. Duplicate content og dynamisk søgemaskineoptimering - er det et problem? siger:

    […] fleste er vel efterhånden stødet på begrebet “duplicate content” - ellers vil jeg anbefale lynhurtigt at læse artiklen, jeg tidligere har skrevet om det […]

Write your comment for this.