29 maja 2013

Jak program Xenu’s Link Sleuth pomaga przy diagnozie problemów ze stroną WWW?

Wszyscy chcemy, żeby nasza strona WWW była odwiedzana przez internautów oraz żeby była dobrze zoptymalizowana pod kątem technicznym. Dzięki temu googlebot jest wstanie poprawnie ją „przeczytać” oraz prawidłowo umieścić w rankingach. Dobrze skonstruowana strona WWW, bez duplikacji treści, z unikalnymi tytułami - to podstawa, jeśli chcemy w pełni wykorzystać potencjał serwisu.

Część błędów można zauważyć przeglądając stronę ręcznie, część jest bardzo trudna lub wręcz niemożliwa do wychwycenia bez użycia dodatkowych narzędzi.

W tym artykule przedstawię Wam darmowy program Xenu’s Link Sleuth, który jest typem web crawlera, zbierającego informacje o stronie WWW tworząc plik xls z listą adresów URL i dodatkowymi, przydatnymi dla pozycjonera informacjami. Na podstawie takiego pliku, po krótkiej analizie, będziecie w stanie wychwycić najważniejsze problemy techniczne związane z Waszą stronę.

Jakich użytecznych informacji dostarczy Wam program Xenu’s Link Sleuth?
  • Pokaże status wszystkich podstron i plików – wraz z kodem http (potencjalne błędy).
  • Podzieli adresy na typy, dzięki czemu można łatwo odfiltrować i zweryfikować różne sekcje strony. Przykładowe typy to: html, image, CSS, JSS, pdf, xml, jpeg, xml itd.
  • Pokaże rozmiar pliku lub strony.
  • Wyświetli meta title podstrony.
  • Zaprezentuje poziom w strukturze strony, czyli w ilu klikach od głównej strony znajduje się plik lub podstrona.
  • Wyświetli ile linków kieruje do strony (wewnętrznych) i do ilu innych podstron linkuje (ogółem)  ta strona.

Po ściągnięciu programu dostępnego pod tym LINKIEM (426KB), rozpakowaniu i zainstalowaniu, należy  go uruchomić.

Z menu File, wybieramy Check URL:


Wpisujemy adres naszej strony, na potrzeby tego artykułu analizę wykonam dla strony www.zeglujznami.pl, klikamy OK.


W zależności od tego jak duża jest strona (ile ma podstron, zdjęć, itd.) skanowanie może trwać od kilku minut do nawet kilkunastu godzin. W tym przypadku 1500 podstron i plików zostało przeskanowanych przez ok. 2 minuty.

Gdy skanowanie się zakończy wybieramy z menu „Export to tab separated file”:


Na dysku zapisze się nam plik txt. Uruchamiamy następnie Excela, klikamy w komórkę A1 i z zakładki „Dane” importujemy nasz plik poprzez link „z tekstu”.  Ważne, aby podczas importu wybrać typ pliku „Rozdzielany” oraz pochodzenie pliku „UTF-8”. Dzięki temu polskie znaki będą pojawiać się prawidłowo.

W następnym kroku wybieramy Ograniczniki „Tabulator” i Zakończ, Ok.

Dostaniemy tabelkę. Zaznaczamy pierwszy wiersz i klikamy „Dane” i „filtruj”. Przyda się to podczas dalszej analizy.



Opis funkcjonalności programu Xenu:
  • Kolumna Address – tutaj znajduje się adres podstrony/pliku, którego dotyczą pozostałe dane z wiersza. W tym miejscu łatwo możemy odfiltrować strony wewnętrzne od zewnętrznych. Dzięki temu szybko zorientujemy się do kogo linkuje nasza strona i czy wszystkie linki wychodzące są potrzebne i nieszkodliwe (np. zapomniane wymiany linków z innymi stronami).

  • Kolumna Status-Code / Status Text – tutaj znajdują się kody odpowiedzi serwera http. Ta wartość powie nam czy wszystko jest z naszymi stronami ok (status 200), czy strony nie istnieją (kod 404 – jest to potencjalnie błąd linkowania w strukturze strony lub usunięta podstrona), czy np. strona jest zablokowana z powodu zabezpieczeń serwera (403).
    Na powyższym przykładzie widać, że podstrona, która powinna być dostępna dla robotów jest nieosiągalna z powodu zabezpieczeń. Przez to nie pojawia się w wynikach wyszukiwania.

    Więcej kodów odpowiedzi http i ich opisów znajdziecie TUTAJ.
  • Kolumna Type – tutaj można odfiltrować podstrony serwisu od np. plików graficznych czy pdf. Przydatne przy analizie struktury linków wewnętrznych do podstron.
  • Kolumna Size – to rozmiar pliku. Tutaj możemy znaleźć odpowiedź na pytanie czemu np. podstrona z grafikami ładuje się wolno (wiele ciężkich plików na jednej podstronie to potencjalny problem). Wartości podane są w bajtach. Jeśli potrzebujecie bardziej szczegółowych statystyk odnośnie szybkości działania strony i bardziej szczegółowych parametrów technicznych odsyłamy do serwisu:  webpagetest.org.
  • Kolumna Title, czyli meta title to tytuł strony widzianej w wynikach organicznych Google. Bardzo ważne jest to, aby każda istotna pod kątem ruchu podstrona miała unikalny tytuł. Sortując tę kolumnę (np. rosnąco), łatwo można zauważyć, które tytuły są zduplikowane lub wręcz nie mają przypisanych wartości. Warto tutaj filtrować jednocześnie w kolumnie Type, po wartości text/html.


  • Kolumna Level – ta liczba mówi nam w ilu kliknięciach od głównej strony, dostępna jest dana podstrona. Po analizie tej kolumny widać, jaką strukturę ma strona. Wiadomo, że najważniejsze podstrony powinny być dostępne już w pierwszym kliknięciu, inne w dalszych. Warto też zadbać o to, by na głównej stronie nie było za mało linków do dalszych kategorii (gorzej rozchodzi się Link Juice i podstrony na poziomie Level 2 są słabsze niż te na poziomie Level 1). Nie warto też umieszczać linków do wszystkich podstrona serwisu na poziomie Level 1, bo nie wszystkie na to zasługują. Przy tworzeniu rekomendacji na tym etapie analizy, ważne jest doświadczenie SEO specjalisty oraz cele Klienta. Należy wybrać optymalną strukturę serwisu i promować najważniejsze podstrony i sekcje.
  • Kolumna Links Out – to liczba linków wychodzących z danej podstrony. Wewnętrznych i zewnętrznych. Warto zwrócić uwagę, aby ta liczba korespondowała z wielkością serwisu. Nie da się tutaj określić sztywnych wartości, bo zależy to od konkretnego przypadku. Ważne jest, aby tych linków nie było zbyt dużo, gdyż osłabią wtedy inne istotne podstrony.
  • Kolumna Links In – liczba linków wewnętrznych kierujących do danej podstrony. Im więcej linków tym strona jest silniejsza w serwisie. Warto zadbać o to, żeby najważniejsze sekcje, główne kategorie, kluczowe podstrony, które najwięcej sprzedają miały dużą ilość linków wewnętrznych.
  • Kolumna Charset – rodzaj kodowania strony. Przyjętym standardem w Polsce (i nie tylko) jest UTF-8. Działa na wielu platformach i sprawia stosunkowo najmniej problemów z odczytaniem. W Polsce część stron używa jeszcze kodowania latin-2, czyli iso-8859-2.
  • Kolumna Description, czyli meta description – jest to tag, który nie ma bezpośrednio wpływu na pozycje strony w Google, ma jednak wpływ na to czy internauta kliknie w link do naszej strony, czy nie. Warto stworzyć unikalne opisy, które będą odzwierciedlać treść strony, gdyż mogą przyczynić się do zwiększenia klikalności (CTR), a o to nam przecież chodzi. Pisząc taki opis warto wyróżnić się na tle konkurencji. Należy jednak pamiętać, że jeśli opis będzie za bardzo odbiegał od tematyki strony, Google może wybrać dowolny inny tekst z naszej podstrony w celu umieszczenia go w wynikach wyszukiwania, ignorując wartość meta description.


Narzędzie Xenu’s Link Sleuth może też być użyte do stworzenia jednorazowo dokładnej mapy strony.

Dzięki powyższym parametrom dostępnym poprzez raport programu Xenu, możemy w prosty i darmowy sposób zidentyfikować największe problemy techniczne związane z podstronami w naszym serwisie. Przypominamy też, że w poprzednich artykułach opisaliśmy, jak można użyć Google Webmaster Tools do diagnozy problemów ze stroną. Odsyłamy do lektur: artykuł 1, artykuł 2 i artykuł 3.

--
Mateusz  Kicki - SEO Specialist w Bluerank


Udostępnij:

0 komentarzy: