25 kwietnia 2013

Duplicate content - jak poradzić sobie ze złodziejami treści?

W jednym z poprzednich artykułów pt. Najczęstsze powody duplikacji treści - jak sobie z nimi radzić?  opisywałem problem występowania duplikacji treści w obrębie jednego serwisu np. sklepu internetowego. Pokazałem sposoby na wykrycie powtórzonej treści oraz wyjaśniłem, jak możemy uniknąć tego zjawiska.

Dziś zajmę się tematem, który podobnie jak wewnętrzna duplikacja treści, jest niestety bardzo często występującym zjawiskiem. Pewnie wielu z Was prowadzi wartościowe blogi lub serwisy tematyczne, które przyciągają „złodziei treści”. W sieci można spotkać wiele blogów czy mini site`ów powstałych wyłącznie z treści pobranej od innych autorów. W przeważającej części przypadków takie zjawisko nie powinno zagrozić naszej stronie, może jednak dojść do sytuacji kiedy nasze artykuły spadną w wynikach wyszukiwania na rzecz plagiatów. Dzieje się tak ze względu, iż ustalając ranking wyszukiwarka Google bierze pod uwagę nie tylko treść artykułu, ale również całe otoczenie treści oraz wiele innych czynników jak np. linki zwrotne czy sygnały z social media. Może zajść sytuacja, w której robot uzna, że strona ze skopiowanym tekstem lepiej odpowie na zapytanie użytkowników, tym samym w SERP pokaże się ona przed oryginałem.

Jak sprawdzić czy ktoś kopiuje moją treść?


(1)    Google

Najprościej będzie, gdy po prostu poszukamy kopi naszych artykułów za pomocą samego Google. W pierwszym przykładzie używamy zapytania dokładnego z wykorzystaniem całego tytułu naszego wpisu. Zapytanie to pozwoli znaleźć nam wszystkie strony, które w treści lub w tytule strony zawierają tytuł naszego artykułu.



W drugim przypadku wyszukujemy fragmenty naszej treści. Wystarczy wyrywkowo skopiować kilka zdań (do 32 słów) i sprawdzić czy gdzieś w sieci nie istnieje podobny tekst. Czynność tą powtórz kilka razy dla jednego artykułu aby upewnić się, że ktoś nie skopiował tylko części twojego wpisu.



(2)    Copyscape.com

O tej stronie nie muszę chyba za wiele pisać. Pewnie każdy z Was blogerów, autorów, redaktorów, copywriterów miał styczność z tą prostą wyszukiwarką. Wystarczy wpisać adres naszej strony, aby po kilkunastu sekundach otrzymać wyniki prezentujące miejsca, w których wykryto kopie naszej treści.



(3)    Google Alerts

Narzędzie to wykorzystuję w Bluerank na co dzień, nie tylko do monitorowania sieci w poszukiwaniu duplikacji treści, ale również w działaniach link buildingowych.

Jeśli publikujesz regularnie treści, na pewno powinieneś zainteresować się tym narzędziem. Wystarczy, że utworzysz alert dla dokładnego zapytania wykorzystującego tytuł twojego artykułu np. "Najczęstsze powody duplikacji treści - jak sobie z nimi radzić?" oraz dokonasz wyboru pozostałych opcji.



W przypadku, kiedy posiadasz wiele alertów sugeruję ustawić częstotliwość na: raz dziennie. Nie chcemy przecież dostawać co godzinę na naszą skrzynkę kilkunastu/kilkudziesięciu wiadomości.

(4)    CopyLink for Wordpress

Wtyczka do Wordpressa umożliwiająca dodanie do kopiowanej treści tekstu z linkiem zwrotnym do naszej strony. Podobne rozwiązanie mamy zaimplementowane na naszym blogu. Po skopiowaniu tekstu, do treści dołączony zostaje zapis w postaci:

Tekst pochodzi z: http://bluerank.blogspot.com/.

Jest to tylko przykład, a poprzez taką informację możesz promować swoją osobę czy konta w serwisach społecznościowych. Dużym minusem tego rozwiązania jest fakt, iż osoba kopiująca nasz artykuł bez najmniejszego problemu może usunąć doklejoną treść zanim opublikuje tekst na swojej stronie.  Wtyczka CopyLink pozwala dodatkowo śledzić adresy URL, z których skopiowana została treść.



Jak radzić sobie z kradzieżą treści?


Podobnie, jak w przypadku wykrywania kradzieży treści również tu mamy kilka możliwości. Niektóre bardziej, a inne mniej skuteczne.

(1)    Kontakt z administratorem serwisu

To pierwsza w kolejności czynność, jaką powinniśmy podjąć, ale chyba niestety najmniej skuteczna. W przypadku niskiej jakości serwisów z kradzioną treścią, tworzonych wyłącznie w celu pozycjonowania stron, nie mamy co liczyć na odpowiedź od właściciela. Oczywiście może zaistnieć sytuacja kiedy nasz artykuł zostanie skopiowany przez duży serwis. Wtedy możemy pokusić się o kontakt oraz pozyskanie aktywnego odnośnika do naszej strony, jeśli taki jeszcze nie istnieje. Czasem takie rozwiązanie będzie lepsze niż usunięcie artykułu.

(2)    Kontakt z rejestratorem domeny/dostawcą hostingu

Jeśli administrator serwisu nie odpowiada lub z jakichś przyczyn nie jesteście w stanie się z nim skontaktować, sprawdź dane domeny w Whois. Napisz do rejestratora domeny lub dostawcy hostingu i poinformuj go o kradzieży twojej treści przez jednego z ich klientów.

(3)    Usuwanie treści z Google - DMCA

Google udostępnia nam możliwość zgłoszenia kradzieży naszej treści za pomocą tego formularza. W dość łatwy sposób możemy zgłosić stronę, która skopiowała np. nasz artykuł. Jeśli udowodnimy, iż to my jesteśmy autorem skopiowanej treści i jeśli nasze zgłoszenie zostanie pozytywnie rozpatrzone z SERP znikną strony, które zgłosiliśmy. A w ich miejsce pojawi się poniższa informacja.


Na zakończenie krótki film, w którym Matt Cutts, odpowiada na dość ciekawe pytanie:

Google crawls site A every hour and site B once in a day. Site B writes an article, site A copies it changing time stamp. Site A gets crawled first by Googlebot. Whose content is original in Google's eyes and will rank highly? If it's A, then how does that do justice to site B?



  • No właśnie czy fakt późniejszej indeksacji artykułu na naszej stronie może spowodować, że nasz artykuł będzie traktowany jako duplikacja treści? 
  • Co dzieje się w przypadku, gdy nasz artykuł zostanie skopiowany przez serwis o lepszej jakości?
  • Co możemy zrobić aby pomóc Google w przyporządkowaniu nam autorstwa danych treści?
Odpowiedzi na te pytania znajdziecie w kolejnych artykułach z cyklu Duplicate Content. Serdecznie zapraszam!

--
Mateusz Rzetecki, SEO Specialist w Bluerank


Udostępnij:

6 komentarzy:

Łukasz pisze...

Kiedyś mojemu koledze jakiś pomysłowy Dobromir skopiował całego bloga o motoryzacji. Jak się okazało tych blogów, które skopiował było kilkanaście tysięcy. I tak sobie pasł swoją stronę na czyichś tekstach. A że kombinował dobrze, to często kradzione teksty widziane były w Google szybciej niż na oryginalnych stronach :\
Jakimś rowiązaniem jest krótki kanał RSS, zamiast pełnego - bo tak najczęściej są kradzione teksty.

Czytelnik do nas pisze... pisze...

Witam,

Jestem od dawna czytelnikiem Waszego bloga, nie komentuje zbytnio z uwagi na długą moderacje komentarzy i brak feedbacku ;) Kilkanaście dni temu skomentowałem jednak wasz post
http://bluerank.blogspot.com/2013/04/duplicate-content-jak-poradzic-sobie-ze.html

I z tego co widzę po tych kilkunastu dniach moderacja zadziałała. Co więcej podczas tej moderacji dziwnym trafem, zmieniony został nick i link mojego bloga na link do jakiegoś Waszego zaplecza. No super, pięknie po prostu. Bardzo zachęcające, czas wyrzucić z rss, czynniki ludzki - widać cel waszego "bloga".

p.s. Komentarz to tez treść, fajnie to wygląda w kontekście treści tego artykułu. Niezła hipokryzja, aż mam to ochotę gdzieś opisać.

p.s. Widzę ze jeszcze dodatkowo treść została zmodyfikowana na potrzeby linka przy nicku, az sobie zrzuty ekranu porobiłem.

Nie wiem czy jest sens wogle do Was pisać, skoro to tylko blog na potrzeby seo nie mający nic wspólnego z szeroko pojętą społecznością, wstyd!

--
pozdrawiam,
Biter
http://biter.bartoszrakowski.com/

Redakcja odpowiada... pisze...

Szanowny Bartoszu

1.
Blogger nie pozwala na edytowanie komentarzy. Można je tylko opublikować albo usunąć. Nawet, gdybyśmy bardzo chcieli je edytować :-) po prostu nie damy rady.
2.
Moderacja na naszym blogu zawsze była i będzie. Takie nasze prawo i taką przyjęliśmy zasadę. Czasem rzeczywiście trwa ona dłużej, niż 24h, ale - przypominamy - to nie jest forum dyskusyjne tylko blog.
3.
Nie mamy nic wspólnego z blogiem rowerowym, o którym tu mowa (no może poza pasją wielu z nas :) bo połowa zespołu przyjeżdża do pracy na rowerach). BTW Prosimy Łukasza (autora komentarza)o ujawnienie się i potwierdzenie autentyczności własnego komentarza wpisanego na naszym blogu.
4.
Prosimy o niezarzucanie nam BEZPODSTAWNIE związków z zapleczami i hipokryzji. Nie mamy sobie nic do zarzucenia i nie musimy niczego ukrywać, dlatego też opublikowaliśmy treść powyższej wiadomości i odpowiadamy na nią publicznie.
5.
Pozdrawiam.

Aneta Mitko

Aneta Mitko pisze...

Tak dla pełnej jasności sprawy dodam tylko, że wypowiedzi Pana Bartosza (wraz z linkiem do jego strony WWW) były już u nas publikowane (na przykład tutaj http://bluerank.blogspot.com/2013/01/parametry-i-jakosc-ruchu-z-wyszukiwania.html?showComment=1359384603912#c5674800969864286202). Czy własny blog także uważa Pan za nasze zaplecze?

kojot001 pisze...

Czekam z niecierpliwością na odpowiedź na pytanie o DC ze stroną A i B. Czy mogliby Państwo przetłumaczyć wypowiedź Cuttsa?

Mateusz Rzetecki pisze...

@kojot001
Na problem przedstawiony przez Matta wpływa wiele czynników. Już niedługo zaprezentuję wyniki testu (z duplikacją treści), który dobiega właśnie końca. Mam nadzieję, że wnioski wyciągnięte z tego badania będą dla Ciebie satysfakcjonującą odpowiedzią :)