Anonimizza veramente gli IP degli utenti di Google Analytics

Set 30, 2020Journal, Technical Deep

Il recente rilascio di Google Tag Manager Sever-Side ha portato una serie di entusiasmanti vantaggi e, allo stesso tempo, alcuni dubbi sull’utilizzo dello strumento. Per questi ultimi sono sicuro che l’esaustivo articolo di Simo Ahava sul Server-side tagging possa chiarire qualunque tipo di preoccupazione in merito.

L’importanza della privacy è ormai oggi un tema centrale e in ambito di analisi digitale è fondamentale essere certi che i dati vengano raccolti a norma di legge per poter essere utilizzati

Focalizzando invece l’attenzione sugli aspetti positivi di questa nuova tecnologia di Tag Management System, troviamo, rispetto all’uso della nota soluzione lato client:

  • Meno JavaScript di Script e Pixel sul sito, ovvero velocità di caricamento migliorata;
  • Maggiore efficacia contro spam e bot con l’utilizzo di chiavi e filtri, che si traduce in dati più puliti e affidabili;
  • Controllo sul traffico HTTP, grazie al proxy tra il dispositivo e l’endpoint;
  • Superamento del limite della durata di 7 giorni dei cookie di prima parte, vi ricordate il mio articolo “ITP 2.3 di Safari e gli utenti in Google Analytics“?;
  • Politica sulla sicurezza dei contenuti più robusta e semplificata, cioè comunicazioni del browser attraverso un unico endpoint (il Server-side tagging) anziché quelli di ciascun servizio (Facebook, Criteo, ecc…);
  • Pulizia e convalida del payload più estesa, che funziona in modo simile al customTask ma vale anche per altre richieste oltre a quelle di Universal Analytics;
  • Pieno controllo e proprietà dei dati raccolti dal contenitore, garantita dalla policy sulla sicurezza della Google Cloud Platform;
  • Maggiore controllo su cosa viene inviato a Google Analytics, possiamo intervenire sulle PII (Personally Identifiable Information) in modo più completo, ad esempio anonimizzando l’intero indirizzo IP dell’utente anziché solo l’ultimo ottetto (come avviene attualmente grazie al parametro anonimyzeIp).

L’ultimo punto sopra menzionato, non per importanza, è quello che andrò a descrivere in questo articolo.

È noto che la funzionalità di anonimizzazione dell’IP in Analytics imposta l’ultimo ottetto di indirizzi IP dell’utente IPv4, e gli ultimi 80 bit degli indirizzi IPv6, su zero in memoria subito dopo l’invio alla rete di raccolta di Analytics.

Fig. 1 – Processo di anonimizzazione dell’IP in Google Analytics tramite il parametro anonimyzeIp

In questo caso, l’indirizzo IP completo non è mai scritto su disco, di conseguenza i cookie statistici di Google Analytics possono essere assimilati ai cookie tecnici. A sostegno di questa affermazione, il Garante italiano, nelle sue linee guida [Individuazione delle modalità semplificate per l’informativa e l’acquisizione del consenso per l’uso dei cookie – 8 maggio 2014] ha chiarito che in un’ottica di semplificazione i cookie analitici di terze parti con IP anonimizzato e accordo di non arricchimento o incrocio con altri dati in possesso di tali terze parti, sono equiparabili a cookie tecnici.

Di diverso avviso sono tuttavia alcuni garanti di altri Stati Membri. Quello francese, ad esempio, richiede la possibilità di rifiutare i cookie statistici e quello inglese non li ritieni affatto necessari.

Alla luce di queste indicazioni, un atteggiamento “zero rischi” prevede l’installazione di cookie analitici (anche se anonimizzati) solo con il consenso dell’utente. Tuttavia molti siti, soprattutto in Italia poiché applicano le indicazioni locali, continuano ad applicare le linee guida del Garante di riferimento.

Difficile valutare oggettivamente quale sia la motivazione dietro la quale uno stesso dato viene interpretato in modo disomogeneo da diversi Garanti se pur all’interno dello stesso contesto.
Ricordo ad esempio che, all’inizio delle operazioni di sensibilizzazione volte alla protezione dei dati personali, trasmessi e incrociabili tramite i cookie, c’era chi sosteneva che anche anonimizzando l’ultimo ottetto dell’indirizzo IP di un utente, se quest’ultimo si trovava da solo in un’area geografica localizzata dalla porzione leggibile dell’IP, poteva essere identificato. Non sto dicendo che questo, effettivamente, possa essere il motivo, o uno dei motivi, alla base del disaccordo tra i Garanti, ad ogni modo è bene sapere che con il Server-side tagging l’anonimizzazione dell’indirizzo IP dell’utente non prevede più solo l’ultimo ottetto, bensì l’intero valore può essere offuscato!
Sicuramente questo aspetto non può essere trascurato nella diatriba tra cookie tecnici e cookie statistici.

Dal punto di vista pratico, con la soluzione server di Google Tag Manager, poiché tutte le hits di Google Analytics passano attraverso il proxy lato server, il tag di Universal Analytics nel contenitore Server effettua una copia dell’indirizzo IP dell’utente (parametro &uip), e dello user-agent di navigazione (parametro &ua), nella richiesta in uscita del protocollo di misurazione. Questo garantisce che le informazioni come il tipo di browser, il dispositivo, la risoluzione dello schermo, ecc… non risultino provenire dalla macchina virtuale bensì mantengano il valore di quelle reali dell’utente che sta navigando il sito.

Consapevoli di questo funzionamento, all’interno del tag di Universal Analytics del contenitore lato server è possibile sovrascrivere il valore di tali parametri. Inserendo come “Campo da impostare” il nome campo “ip_override” e lasciando vuoto il valore è possibile impedire il passaggio dell’intero indirizzo IP dell’utente ai server di Google Analytics.

Continua a leggere

Contattaci