28 lipca 2006

Jak Google radzi sobie z click fraud?

Nie od dziś wiadomo, że głównym źródłem dochodów Google są dwa produkty - AdWords i AdSense. Nie od dziś wiadomo również, że regularnie powracają dyskusje na temat wiarygodności statystyk kliknięć (i tym samym kosztów) przedstawianych reklamodawcom korzystającym z tych usług wyszukiwarki. Co trochę słychać głosy o zliczaniu kliknięć, które są wynikiem aktywności nieuczciwej konkurencji, działania programów czy po prostu złego funkcjonowania mechanizmu.

Google, zdając sobie sprawę z wagi problemu (zaufanie do usługi wpływa przecież na jej popularność), odsłoniło swoje tajemnice przed niezależnym ekspertem. Jego zadaniem było dokonanie oceny jakości i skuteczności funkcjonujących mechanizmów i polityki działania wyszukiwarki w zakresie 'click fraud'. Wyniki przeprowadzonej kontroli, które mają być również wykorzystane przez amerykański sąd, zostały przedstawione w obszernym, 47-stronnicowym raporcie. Oprócz samych wniosków, które przytaczamy niżej, dokument zawiera bardzo ciekawe informacje na temat specyfiki poszczególnych usług, na podstawie czego autor próbuje zdefiniować m.in. przyczyny 'click fraud' (z jednej strony konkurujące ze sobą firmy, pragnące wyeliminować przeciwnika, z drugiej strony administratorzy serwisów, pragnący zarobić jak najszybciej i najwięcej).

Pisząc o problemie 'click fraud', autor prezentuje również definicję nieważnych (ułomnych, fałszywych?) kliknięć (bo tak chyba należy przetłumaczyć stosowane pojęcie - 'invalid clicks') stosowaną przez wyszukiwarkę, która stara się zrozumieć intencje klikającego oraz zweryfikować techniczne aspekty każdej akcji, by zakwalifikować ją do grupy ważnych, uznawanych przez system lub wręcz przeciwnie.

Kryteria ewaluacji często są bardzo trudne do zdefiniowania (w sensie matematycznym), a dla zobrazowania problemu podano dwa podobne, ale jednocześnie zupełnie różne zjawiska, które często mają miejsce.

  • Efekt wielokrotnego klikania w reklamę przez użytkowników dokonujących porównań na różnych witrynach - internauta np. klika w odnośnik linku sponsorowanego strony A, następnie odwiedza inną stronę (B), by za jakiś czas wrócić na stronę A, odnajdując odnośnik do niej znowu wśród linków sponsorowanych. Bardzo trudno jest w takim przypadku zdefiniować czas upływający między obydwoma kliknięciami, który powinien stanowić granicę między zakwalifikowaniem kliknięcia jako unikalne lub nie. Dodatkowo, należy podjąć próbę rozpoznania intencji klikającego (czy rzeczywiście szuka informacji, jest zainteresowany zakupem, itd.) czy może jest to regularne działanie firmy, która sukcesywnie próbuje 'wyklikać' budżet konkurencji?
  • Efekt 'podwójnego kliknięcia' - pochodzący z przyzwyczajeń użytkowników do uruchamiania aplikacji w systemie Windows w taki właśnie sposób - tutaj czas upływający między obydwoma kliknięciami jest bardzo krótki i łatwy do zweryfikowania (co ciekawe, do marca 2005 roku wyszukiwarka w ogóle nie brała pod uwagę podwójnych kliknięć, czyli innymi słowy - zliczała je na niekorzyść reklamodawcy).
W jaki sposób Google identyfikuje nieważne kliknięcia?
Wykorzystywane są trzy różne podejścia.
  • Analizy statystyczne i analizy trendów - np. jeżeli reklama generuje określoną liczbę kliknięć w danym przedziale czasu, nagłe skokowe zwiększenie liczby kliknięć może wzbudzić podejrzenia. Przydatność tego podejścia jest szczególnie duża w przypadku wielu zgromadzonych danych (kiedy można porównać stan obecny z przeszłym).
  • Filtry dotyczące różnych kryteriów - znajdujące zastosowanie np. w przypadku opisanego wyżej efektu 'podwójnego kliknięcia'.
  • Data mining - najbardziej skomplikowane i efektywne, potrzebujące jednak dużej ilości informacji, które nie zawsze są dostępne dla wyszukiwarki (np. czy internauta, który kliknął w reklamę obejrzał tylko stronę docelową kampanii czy jego wizyta była dłuższa i wygenerowała zamówienie produktu w sklepie internetowym).

Równie ciekawa jest analiza etapów rozpoznawania i dyskwalifikowania nieważnych kliknięć,.
  • Prefiltering - kiedy usuwane są najbardziej oczywiste kliknięcia (np. wykonane testowo przez pracowników wyszukiwarki).
  • Online filtering - realizowane przez opisane wyżej filtry. Co ciekawe, na początku istnienia usługi AdWords funkcjonowały tylko 3 takie filtry. Obecnie jest ich więcej, a ostatnio dodawane filtry poprawiają skuteczność zaledwie o kilka (2 - 3 procent), co w pewien sposób pokazuje obecny poziom ich skuteczności działania. Jak wyraził się autor opracowania, reguły stosowane w filtrach są bardzo proste (i oczywiście pozostają tajemnicą), co nie powinno dziwić w obliczu ilości analizowanych danych, i automatycznie usuwają nieważne kliknięcia ze statystyk. Prostota nie oznacza jednak braku skuteczności - zdecydowana większość prób oszukiwania jest równie banalna, co powoduje, że filtry znajdują praktyczne zastosowanie i odgrywają ważną rolę.
  • Post filtering - tutaj są przepuszczane dane z etapu wcześniejszego, które podlegają analizie wielokryterialnej (inaczej mówiąc mamy do czynienia z gęstszym sitem, które wymaga większych nakładów pracy do analizy przepuszczanych informacji). Wyniki otrzymywane na tym etapie są też mniej oczywiste i jednoznaczne, dlatego też w przypadku wykrycia potencjalnych problemów, nadawany jest sygnał ostrzeżenia, analizowany następnie przez pracowników wyszukiwarki. Na tym etapie są również uwzględniane zgłaszane przez klientów reklamacje.
Sedno raportu, czyli końcowa ocena działań podejmowanych przez wyszukiwarkę, wypada pozytywnie. Autor stwierdził, że chociaż niemożliwe jest jednoznaczne określenie skuteczności operacji wykonywanych na wszystkich wymienionych wyżej etapach (jak również skali całego zjawiska), to patrząc przez pryzmat przesłanek:
  • wprowadzanie kolejnych filtrów i reguł nie zwiększa istotnie ilości wykrytych nieważnych kliknięć (maksymalnie o kilka procent),
  • ilość wykrywanych nieważnych kliknięć na etapie automatycznym w stosunku do efektów działania ludzi jest nieporównywalnie duża (być może zatem ludzie nie mają już czego wykrywać),
można wnioskować, że ogólny poziom skuteczności jest zadowalający. Oczywiście przy tak dużej liczbie reklamujących się firm i jeszcze większej liczbie osób, które klikają w linki sponsorowane, będą zdarzały się reklamacje i pomyłki, ale w ogólnej liczbie wykrytych przypadków stanowią one dopuszczalny margines błędu. A polityka działania wyszukiwarki w postępowaniu z wyjątkami jest akceptowalna.

Powinniśmy zatem być chyba zadowoleni z jakości usług oferowanych przez Google, jakkolwiek nie zaszkodzi przeprowadzać regularnych, dodatkowych kontroli (np. zachowania użytkowników na stronie) i porównywać ich wyników z danymi raportowanymi przez wyszukiwarkę.

Tak na wszelki wypadek...

--
Maciek Gałecki


Udostępnij:

0 komentarzy: