5 sierpnia 2009

Rel="Canonical" w praktyce – case study

Tag [rel="canonical"] został wprowadzony przez Google i inne ważne wyszukiwarki w lutym 2009 r. Od tego czasu pojawiło się wiele głosów za i przeciw jego stosowaniu.

Zastosowanie [rel="canonical"] na stronie podpowiada robotom wyszukiwarek, że strona ta (choć ma inny adres URL) jest powieleniem innej - wskazanej strony. Celem stosowania tego tagu jest zapobieżenie duplikacji treści i niejako pójście na skróty w przypadku, gdy inne sposoby (jak np. przekierowania) są zbyt skomplikowane do wdrożenia.

Wiele osób twierdzi jednak, że stosowanie [rel="canonical"] ma również wady - jest to jedynie podpowiedź dla wyszukiwarek, a nie dyrektywa... nie działa tak samo, jak przekierowanie 301 i nie przenosi link popularity. Zrobiliśmy mały test aby sprawdzić, jak [rel="canonical"] wpływa na indeksację i obecność podstron w wynikach wyszukiwania.

Case study

Weźmy pod uwagę serwis ogłoszeniowy Morusek.pl. Konieczność wprowadzenia [rel="canonical"] pojawiła się, gdy Google zaczął indeksować URLe z kanałów RSS (www.morusek.pl/rss/polska/wszystkie.xml), które zawierają parametr [?utm_source=rss] w celu określenia źródła ruchu w Google Analytics. Wtedy to (24 czerwca 2009) na stronach ogłoszeń zawierających ten parametr wprowadzno tag [rel="canonical"] wskazujący na URLe bez [utm_source] jako te ważniejsze (na przykład: www.morusek.pl/ogloszenie/4588/Labradory-czarne-/?utm_source=rss).

Wnioski

Pierwszym wnioskiem po badaniu jest to, że Google nie usuwa z indeksu stron zawierających [rel="canonical"].
Po wprowadzeniu tagu, co kilka dni, sprawdzano liczbę zaindeksowanych stron zawierających parametr [utm_source] (www.google.com/search?q=site:www.morusek.pl+inurl:utm_source). Liczba stron wcale się nie zmniejszyła, a nawet nieznacznie wzrosła...


Co więcej, obie strony - ta z i bez [rel="canonical"] - były (i nadal są) wyświetlane obok siebie przy odpowiednim zapytaniu z "site:" (www.google.com/search?q=site%3Awww.morusek.pl%2Fogloszenie%2F1942%2FBaca-Moskiewski-Strozujacy-%2F).

Z drugiej jednak strony, przy tworzeniu wyników wyszukiwania Google mając do wyboru stronę z [rel="canonical"] i tę, która jest wskazana przez [rel="canonical"], wyświetla tylko tę drugą. Wniosek taki wypływa po analizie list wyników wyszukiwania na hasła będące tytułami zaindeksowanych stron zawierających [utm_source].

Wiemy, że Google zaindeksował stronę www.morusek.pl/ogloszenie/1942/Baca-Moskiewski-Strozujacy-/?utm_source=rss. Zadajemy wyszukiwanie frazy "Baca, Moskiewski Stróżujący - Wrocław". Jak widać, jedyną stroną z Morusek.pl, która się wyświetla, jest ta bez parametru [utm_source].

Przebadano tak ponad 40 fraz. Dla żadnego z zapytań nie wyświetlała się strona z [utm_source], czyli ta zawierająca [rel="canonical"].

Podsumowanie

Jak widać, [rel="canonical"] warto używać, aby wskazywać wyszukiwarkom stronę ważniejszą, tę która ma się znaleźć w indeksie wyszukiwania. Jednak wciąż nie mamy pewności, w jakim stopniu i czy w ogóle, przenoszone jest link popularity... dlatego wykorzystanie [rel="canonical"] musi być uzasadnione (tylko wtedy, gdy inne metody nie są możliwe do zastosowania).

--
Jacek Tkaczuk


Udostępnij:

2 komentarzy:

Cezary Lech pisze...

W tym konkretnym przypadku mogliście skorzystać funkcji Google Analytics podmieniającej ? na #.

W URL byłoby wówczas:
/#utm_source=rss

I GoogleBot nie indeksowałby tego co za hashem.

Anonimowy pisze...

Tak, oczywiście. Google nie indeksuje hashów.

Zabieg z rel="canonical" miał na celu przetestowanie samego tagu, a nie rozwiązanie problemu.