Semalt: Super przewodnik po blokowaniu spamu polecającego w Google Analytics

Nik Chaykovskiy, ekspert firmy Semalt , zapewnia, że spam polecający jest jednym z problemów, z którymi borykają się obecnie webmasterzy. Z biegiem lat sytuacja pogarsza się, co oznacza, że ktoś zarabia dużo pieniędzy na tworzeniu spamu polecającego.

Spam Ducha i Polecenia

Spam trafił teraz do raportów Google Analytics. Spamerzy szukają luk w systemie, aby pojawili się w raportach danych witryny. Robią to z nadzieją, że wzbudzą wystarczającą ciekawość do tego stopnia, że webmaster odwiedza ich witrynę, aby zobaczyć, dlaczego są w raporcie. Problem polega na tym, że nie zwiększają one ruchu. Nawet tego nie robią, ponieważ są botami. Używają kodu śledzenia JavaScrip używanego przez Google Analytics, aby utworzyć powiadomienie o wizycie. W rezultacie wypaczają istotne statystyki, takie jak współczynniki odrzuceń i inne elementy wykorzystywane do analizy zaangażowania. Konieczne jest blokowanie spamu polecającego, jeśli potrzebne są dokładne dane, zwłaszcza jeśli polegają na nich przy podejmowaniu decyzji marketingowych.

Blokowanie spamu polecającego staje się trudne, zwłaszcza, że spamerzy pracują bardzo szybko, zwiększając współczynnik trafień spamu oraz źródła. Oznacza to, że webmasterzy muszą zwiększyć wysiłek włożony w eliminację i umieszczenie na czarnej liście tych źródeł. Jest to szczególnie kłopotliwe dla osób, które mają nowe witryny, które nie otrzymują znacznego ruchu. Wzrost współczynnika spamu w takich witrynach spowodowałby większe zniekształcenie, które może być nawet większe niż otrzymywane codziennie odwiedziny.

Jak łatwo to jest?

Ładowanie jednej strony rekordów jako pojedynczej wizyty. Duchowi spamerzy używają kodu śledzenia Google Analytics i wysyłają dane o ruchu bezpośrednio do raportów, tym samym przygotowując wizytę. Załadowanie jednej strony na serwerze może zająć 0,001 sekundy. Mogli jednak wymusić ponad 100 takich sfałszowanych wizyt na kontach Google w wielu innych witrynach na całym świecie. Łatwo jest kupić jednego hosta. Tak długo, jak spamerzy są pewni ROI, istnieje wiele szkód, które mogą z nimi zrobić.

Krótkie rozwiązania

Niektóre techniki są czasami tak zaawansowane, że rozwiązania zastosowane do blokowania spamu referencyjnego nie działają. Jednym z nich jest tajemnicza usługa online o nazwie Darodar. Następujące metody nie usunęły go z GA.

  • Plik .htaccess. To nie działa, ponieważ spam-duch nie dotyka witryny
  • Lista wykluczeń odesłań. Brakuje aktualizacji.
  • Filtry wykluczeń. Jest to przestarzała metoda, ponieważ koncentruje się tylko na przyszłym spamie, a nie działa wstecz na wcześniejsze bazy danych spamu.

Filtr Wykluczeń prawie zbliżył się do wyeliminowania spamu polecającego Darodar. Jedynym ograniczeniem było to, że nie ma stałej i konsekwentnie aktualizowanej listy spamerów polecających.

Brakujący element układanki

Reaktywne rozwiązanie do identyfikacji i blokowania skierowań i danych o duchach powinno być bardzo aktualizowane, pochodzić z szerszej bazy danych i działać wstecz na wcześniejsze informacje. Oparty na trzech elementach optymalnego rozwiązania, oto jeden, który działa.

Krok 1: Używanie segmentów do wykluczania spamu

Lepiej jest używać segmentów, ponieważ nie zmieniają one danych na stałe. Jeśli ktoś przypadkowo odfiltruje prawdziwe strony odsyłające podczas korzystania z filtrów, nie ma możliwości ich odzyskania. Możliwe jest budowanie na starych danych przy użyciu segmentów, pomimo tego, jak długo tam były. Można je również zastosować z mocą wsteczną.

Krok 2: Utrzymanie listy wykluczeń

Slack to narzędzie, którego webmasterzy mogą używać do monitorowania źródeł poleceń. Powiadamia użytkownika o wszelkich nowych poleceniach i wyświetla mu monit: czy dodać do białej listy, czy czarnej listy podejrzane źródło poleceń.

1. Slack otrzymuje wszystkie polecenia i

2. Używa PHP do sortowania wszystkich wyników według kolejności zliczania, a następnie zapętla ostateczną listę do webmastera, aby sprawdzić, czy coś wygląda znajomo. Jeśli nie,

3. Przesyła cały podejrzany spam do luźnego kanału, który oferuje użytkownikowi wybór między białą lub czarną listą. Niezależnie od wybranej opcji, prowadzi to do kroku 4,

4. Przekierowuje do strony, która weryfikuje werdykt jako potwierdzenie wyboru.

5. Slack następnie przechowuje i blokuje wszystkich zidentyfikowanych spamerów w bazie danych

6. Ostateczne wyświetlanie czystych danych będzie w formacie wyrażenia regularnego. Skopiuj i wklej go w Google Analytics.

Slack pozwala webmasterom aktualizować listę wykluczeń co najmniej pięć razy dziennie.

W rzeczywistości może działać kilka rozwiązań:

Pomimo tego, że jest to sprawdzona metoda, działałoby to jeszcze lepiej, gdyby webmaster uzupełnił ją innymi technikami, aby upewnić się, że obejmują wszystkie podstawy. Oprócz wspomnianego rozwiązania:

  • Kliknij pole wyboru, które powoduje, że Google Analytics wyklucza znane boty i pająki,
  • Zastosuj „uwzględnij filtr nazwy hosta”
  • Używaj plików cookie

Wspomniany powyżej filtr włączający jest czasem wydajny, ale nie jest najlepszym rozwiązaniem na dłuższą metę, ponieważ:

  • Fałszowanie nazw hostów nie jest trudne, a spamerzy analityczni coraz częściej wykorzystują je jako podatne na ataki.
  • Jeśli konfiguracja jest nieprawidłowa, może odfiltrować prawdziwe strony odsyłające.