Nettisivuilla on arkipäivää, että samaa sisältöä on saatavilla useasta eri osoitteesta, mikä hankaloittaa hakukoneiden indeksointia. Etusivun sisältö voi löytyä osoitteista www.domain.com ja www.domain.com/fin/index.html tai esimerkiksi yksittäinen saman sisältöinen tuotesivu usean eri osoitteen taakaa riippuen siitä miten tuotteet on lajiteltu. Ongelmaa kutsutaan tuplasisällöksi.
Tuplasisältöä on perinteisesti torjuttu ohjaamalla 301-metodilla useat saman sisältöiset sivut haluttuun osoitteeseen. Myös robots.txt tiedostolla voi ohjata hakukoneiden vierailua sivustolla ja estää yksittäisten tuplasisältösivujen indeksointia.
Tähän ongelmaan ovat Google, Yahoo! ja Microsoft yhdessä julkaisseet käytettäväksi uuden sivuston <head> osion <link> tagiin liitettävän rel="canonical" määreen, jonka tarkoituksena on ohjata hakukone halutulle sisältösivulle. Canonical liitetään jokaiseen tuplasisältösivuun ja sen kohteeksi määritetään url halutulle sisältösivulle.
Canonical linkki näyttää tältä:
<link rel="canonical" href="http://www.domain.com/tuotteet/kone.html" />
Oletetaan, että haluttu sisätösivu on edellisen esimerkin mukainen:
http://www.domain.com/tuotteet/kone.html
Sama sisältö löytyy myös sivulta:
http://www.domain.com/tuoteluettelo/kone.html
Tässä tapauksessa tuoteluettelosta löytyvän sivun <head> osioon lisätään:
<link rel="canonical" href="http://www.domain.com/tuotteet/kone.html" />
Kun hakukone vierailee tuoteluettelon sivulla sille ilmoitetaan, että tälle haluttu vastine löytyykin /tuotteet/ kansiosta. Simppeliä!
Googlen verkkovastaavan ohjeissa on aiheesta lisää ohjeistusta sekä Matt Cuttsin presentaatio tuplasisällöstä ja sen estämisestä.
Uutta määrettä tukevien hakukoneiden tiedotteita löydät: Google, Yahoo!, Live, Ask.com
Ei kommentteja | Canonical ohjaa hakukoneita halutulle sisältösivulle
WP Cumulus Flash tag cloud by Roy Tanck and Luke Morton requires Flash Player 9 or better.