Home / Journal / Tieni lontano lo spam dai tuoi dati in Google Analytics

Written by Michele Pisani

18 Febbraio 2021

Tieni lontano lo spam dai tuoi dati in Google Analytics

A fine gennaio 2021 sono stati molti gli account Google Analytics colpiti da un’ondata di spam che si è tradotta in picchi di traffico e metriche sballate nei report della piattaforma di analisi.

Tra le impostazioni delle Viste di Google Analytics Universal è presente una checkbox che consente di attivare una protezione automatica al fine di escludere i dati provenienti da spam e bot noti. Nonostante questa funzionalità sia stata notevolmente migliorata nel tempo da parte di Google, il traffico anomalo di questi giorni è riuscito a fare breccia nel sistema di raccolta.

Con l’avvento di Google Analytics 4, le Proprietà Analytics saranno più protette da queste pratiche fraudolente.

Un bot insidioso dal momento che le sue interazioni sembrano provenire da una sorgente effettiva, come se esistesse un link all’interno di un sito web che punta verso il tuo, con accessi effettuati da diversi paesi quali Cina, Stati Uniti, India, Germania, … e acquisizione del dato nell’arco di alcune ore ad intervalli non costanti.

Abbiamo tuttavia notato che in una serie di viste di alcuni clienti per i quali gestiamo i relativi Analytics questo traffico indesiderato non si è presentato. E non è stato un caso. La configurazione personalizzata dei filtri che abbiamo applicato ad alcune viste utilizzate a fini di reportistica, prevedeva l’esclusione di interazioni qualora non fossero rispettate determinate condizioni. Questo tipo di implementazione, a supporto del filtro automatico di esclusione antispam di Google Analytics Universal, aiuta a mantenere puliti il più possibile i dati raccolti.

Questo tipo di filtri prevede ad esempio l’esclusione di nomi di sorgenti meno conosciute, risoluzioni dello schermo non definite ed altre condizioni che raramente sono associate ad una navigazione reale su un sito da parte di un utente.

Il bot incriminato infatti presentava una falla, il valore della dimensione del browser pari a (not set) e i nostri filtri lo hanno bloccato.

In realtà applichiamo questi filtri in modo oculato, con finalità prevalentemente mirate al debugging di potenziali anomalie, e non su tutte le viste della stessa Proprietà Analytics. Questo perché, come nel caso della dimensione del browser, possono esserci dei falsi positivi. Si tratta di un valore spesso trascurabile rispetto al totale delle visite, tuttavia cerchiamo di mantenere traccia anche di queste sessioni trattandosi a tutti gli effetti di navigazioni legittime.

In ogni caso, coloro che si ritrovano tali sessioni indesiderate in Google Analytics e vogliono analizzare i dati al netto di questo inquinamento possono creare un segmento con la seguente configurazione:

 

È importante sottolineare che per evitare inconvenienti come quello appena descritto non ci sono interventi efficaci che possono essere effettuati né sulle pagine del sito né tramite Google Tag Manager. Il motivo è che questa pratica di spam sfrutta la caratteristica del Protocollo di Misurazione di Universal Analytics. In questo caso infatti i dati vengono inviati effettuando chiamate dirette ai server di Google, senza aprire effettivamente le pagine del sito.

Con l’avvento di Google Analytics 4, e della nuova versione del Protocollo di Misurazione (v2), le Proprietà Analytics saranno più protette da queste pratiche fraudolente poiché per l’invio dei dati è richiesta una chiave di autenticazione che non è pubblica. Inoltre, in caso di divulgazione accidentale di questa chiave è possibile intervenire tempestivamente revocandola e creandone una nuova.

Written by Michele Pisani

Head of Analytics 

Contattaci

Unlock your digital
potential