Michele Pisani
Scritto da 7 min di lettura

Come l’intelligenza artificiale sta cambiando il modo di leggere i dati (e prendere decisioni)

L’AI ha reso l’analisi dei dati più conversazionale e veloce. Ma chi lavora sui dati ogni giorno sa che la parte difficile non è mai stata scrivere una query: è decidere cosa significa davvero un numero. E questo, l’AI da sola non lo risolve.

La risposta convincente che è anche sbagliata

Lavoriamo da poco con un’azienda che ci ha mostrato un’analisi prodotta da un sistema di AI. L’output era già impacchettato per la riunione del lunedì: titolo in maiuscolo, IL BOOM DELLA SEO, accompagnato da numeri, percentuali di crescita a tre cifre e un commento articolato sul successo della strategia organica negli ultimi sei mesi.

All’AI erano state passate le sessioni organiche mensili degli ultimi sei mesi, confrontate con gli stessi mesi dell’anno precedente. La conclusione, dal punto di vista del sistema, era inattaccabile: rispetto al periodo di confronto, il traffico organico era esploso. La frase “crescita straordinaria” sarebbe stata difficile da contestare guardando solo quei numeri.

Solo che l’anno precedente, nei mesi messi a confronto, la proprietà Google Analytics dell’azienda non esisteva ancora. Era stata attivata cinque mesi dopo la nascita del sito. I dati “dell’anno prima” erano per la maggior parte zeri, perché non c’era nessuno strumento che misurasse, non perché non ci fosse traffico. La SEO non aveva fatto alcun boom: era passata da “non misurata” a “misurata”. Una variazione di setup, raccontata come una variazione di performance.

L’AI non aveva sbagliato i conti, anzi i conti erano giusti. Aveva sbagliato qualcosa di più sottile: non sapeva che dietro quei numeri c’era una storia. È un errore difficile da intercettare se non si conosce il contesto del cliente, ed è esattamente per questo che lo abbiamo trovato, perché quel contesto è il nostro lavoro.

Il punto è importante e va generalizzato. L’AI non è curiosa. Non si chiede da sola “ma è cambiato qualcosa nel modo in cui misuravamo l’anno scorso?”. Prende quello che le dai e ci ragiona sopra. Se nei dati non c’è scritto che la proprietà Analytics è stata attivata in ritardo, per lei quell’informazione non esiste. Eppure, è proprio quell’informazione — che una volta nota è qualcosa di estremamente banale — che ribalta la lettura. Il contesto, quasi sempre, non è dentro i dati: è intorno ai dati, nelle teste delle persone che li conoscono. E senza quelle teste, l’AI legge tutto e capisce niente.

“L’AI non sbaglia perché non sa leggere i numeri. Sbaglia perché non sa cosa c’è intorno ai numeri.”

Il secondo modo di inciampare: l’aritmetica fragile

Questo è il primo modo in cui l’AI inciampa sui dati: il contesto. Ma c’è anche un secondo modo, che riguarda direttamente i conti. E lì la questione è ancora più tecnica.

Quando carichi un foglio di calcolo a un modello linguistico, lui non lo “apre” come fa Excel: lo legge come testo. Non vede una griglia con celle e formule, vede una sequenza di parole e numeri da elaborare con lo stesso meccanismo con cui scrive un’email. Su quel meccanismo, l’aritmetica esatta è un effetto collaterale, non una garanzia. È come chiedere a uno scrittore bravissimo di sommare a mente una colonna di migliaia di numeri davanti al cliente: probabilmente prenderà l’ordine di grandezza giusto, qualche dettaglio lo sbaglierà, e in entrambi i casi te lo dirà con lo stesso tono sicuro.

Dati di ricerca. Uno studio intitolato “Large Language Models in Numberland” ha testato cinque modelli di punta (o1 di OpenAI, Gemini, Claude e Copilot, oltre a o1-mini) su un benchmark di 100 problemi numerici. Sui task con percorso deterministico i modelli hanno totalizzato tra il 74% e il 95% di accuratezza. Sul gioco del 24, che richiede ricerca per tentativi, le prestazioni sono crollate al 10–73%. E quando lo stesso gioco è stato proposto in versione più difficile, il modello migliore è sceso al 27%. Razeghi et al., arXiv:2504.00226

Tra contesto sbagliato e aritmetica fragile, l’AI lasciata da sola ha due strade per portarti fuori rotta. In entrambi i casi il problema non si risolve cambiando modello: si risolve a un livello più profondo, e meno glamour.

Il vero collo di bottiglia: il dizionario aziendale

Vai in azienda e chiedi a tre persone diverse: “quanti clienti attivi abbiamo?”. Il commerciale conterà chi ha firmato un contratto. Il customer success conterà chi ha usato il prodotto. Il CFO conterà chi ha effettivamente fatturato. Tre numeri diversi, nessuno sbagliato.

Finché a rispondere sono umani, non è un problema: in riunione ci si chiede “in che senso attivi?” e si trova la lingua comune per quella conversazione. Quando a rispondere è un’AI, l’ambiguità esplode. La macchina non chiede chiarimenti: sceglie una definizione, magari diversa ogni volta, e risponde con la solita sicurezza. Due manager fanno la stessa domanda a un’ora di distanza e ricevono numeri diversi. Fine della fiducia nel sistema.

La soluzione esiste e non c’entra con l’AI: avere un dizionario aziendale dei dati, scritto, versionato, uno solo. Dove “cliente attivo” è definito una volta per tutte, e quella definizione è quella che ogni strumento — dashboard, report, AI — usa per rispondere. In gergo si chiama semantic layer; il concetto è quello del dizionario.

Questo lavoro andava fatto comunque. L’AI non ha creato il problema, l’ha reso visibile e urgente. Una survey Gartner pubblicata a febbraio 2025 ha rilevato che il 63% delle organizzazioni non ha — o non è certa di avere — pratiche di data management adatte all’AI; lo stesso report stima che entro il 2026 il 60% dei progetti AI non supportati da dati “AI-ready” verrà abbandonato. Fonte: Gartner, febbraio 2025. Il modello è quasi sempre l’ultimo dei problemi.

Quando l’insight è solo teatro

C’è un secondo rischio. L’AI è bravissima a produrre narrazioni: dagli un dato qualsiasi e ti scriverà un commento articolato, con cause, effetti, raccomandazioni. Lo farà anche quando il dato non dice niente.

Esempio: una campagna gira una settimana su 400 persone, il tasso di conversione passa dal 2,1% al 2,4%. L’AI commenta: “la nuova creatività funziona, performance +14%, suggerisco di aumentare il budget”. Bella frase. Solo che, su quei numeri, la differenza è dentro la normale oscillazione casuale. Un calcolo statistico standard (test di significatività su due proporzioni, livello 95%, potenza 80%) mostra che per concludere con un minimo di affidabilità che 2,4% è davvero meglio di 2,1% servirebbero circa 76.000 persone. Non 400. Su un campione così piccolo, qualsiasi differenza inferiore a 4 punti percentuali è rumore. E tu stai per spostare budget sulla base di una narrazione convincente costruita sul nulla.

La risposta non è rinunciare all’AI, è metterle attorno dei paletti: sistemi che dicano “campione troppo piccolo”, “differenza non significativa”, “trend dentro la varianza naturale”. Si automatizza, ma va voluto. E richiede che qualcuno, in azienda, abbia la responsabilità esplicita di dire “questo insight è fragile, non lo pubblichiamo”. Un ruolo che oggi quasi nessuno presidia.

L’AI sui dati non sostituisce un’infrastruttura semantica e una cultura della misurazione onesta.

Le nasconde, e rende gli errori più veloci e convincenti.

Due domande prima di mettere l’AI sui dati

Se stai valutando di introdurre AI sui tuoi sistemi di analytics, fatti queste due domande. Non sono tecniche, bensì organizzative. Se a una sola la risposta è no, il problema non è scegliere il tool, ma è prima.

  • DIZIONARIO Le mie metriche chiave hanno una definizione unica, scritta, condivisa? Se chiedo a tre persone cosa significa “cliente attivo” o “fatturato netto”, ricevo la stessa risposta?
  • RESPONSABILITÀ C’è qualcuno, nel mio team, che ha il mandato di dire “questo insight non lo pubblichiamo perché statisticamente fragile”? O tutti sono incentivati a produrre conclusioni, qualsiasi siano?

PRIMA IL DIZIONARIO, POI IL MODELLO

Chi inverte questo ordine si ritrova con un sistema che risponde a tutto e sbaglia su molto, scritto in italiano perfetto.


Fonti

(1) Razeghi et al., “Large Language Models in Numberland: A Quick Test of Their Numerical Reasoning Abilities”, arXiv:2504.00226, aprile 2025. arxiv.org/abs/2504.00226

(2) Gartner, “Lack of AI-Ready Data Puts AI Projects at Risk”, comunicato stampa del 26 febbraio 2025, basato su survey Q3 2024 su 1.203 data management leader. gartner.com

(3) Calcolo proprio, basato sul test di significatività per il confronto fra due proporzioni (alpha = 0,05; potenza = 0,80). Il calcolo è replicabile con qualunque sample size calculator pubblico.


Fortop è una società di consulenza strategica di marketing data-driven. Aiutiamo le aziende a costruire l’infrastruttura — tecnica, semantica e organizzativa — perché i dati diventino davvero decisioni. Parla con noi.