L’utilizzo dell’AI generativa nel settore bancario può rivelarsi efficace strumento per creare simulatori di transazioni e dati sintetici, come illustrato da Valerio Consorti, Associate Partner e Lead Data Scientist di Prometeia durante l’Artificial Intelligence Talk organizzato martedì 23 settembre 2025 dall’Osservatorio Artificial Intelligence del Politecnico di Milano. L’obiettivo è duplice: da un lato, sostenere la lotta all’antiriciclaggio con approcci innovativi; dall’altro, esplorare nuove applicazioni di modelli che permettono di analizzare scenari complessi in assenza di dati reali.
Indice degli argomenti
Un terzo uso della Generative AI: la simulazione
Nell’immaginario comune la Generative AI viene associata soprattutto a chatbot, testi o sintesi automatiche. Consorti ha sottolineato come esista una terza via, quella della simulazione di sistemi complessi. “Noi abbiamo utilizzato questa tecnologia per costruire un simulatore di dati sintetici finanziari che rappresenti il comportamento dei clienti”, ha spiegato.
L’idea di fondo è quella di sviluppare digital twin del sistema bancario, in grado di replicare fedelmente flussi transazionali e dinamiche di mercato. Una prospettiva che apre possibilità non solo per la prevenzione dei reati finanziari, ma anche per l’analisi delle strategie di gestione del rischio.
La sfida dell’antiriciclaggio
Il progetto descritto da Consorti nasce da una richiesta di un’istituzione internazionale, che ha chiesto a Prometeia di simulare il mercato dei pagamenti britannico. Il compito era particolarmente complesso: ricreare in modo virtuale un ecosistema di transazioni in cui interagiscono banche, istituzioni finanziarie e sistemi di pagamento, senza poter contare su dati reali.
Secondo Consorti, lo scopo era testare l’impatto di nuove regole, come l’ipotesi di centralizzare dati anonimi e topologici delle transazioni per valutare se questo potesse rafforzare l’efficacia degli algoritmi di transaction monitoring. “Farlo sul dato reale by design non si può, fintanto che non c’è la normativa a supporto. La scommessa era costruire un sistema virtuale”, ha raccontato.
I tre pilastri del modello
Per raggiungere questo risultato, Prometeia ha lavorato su un sistema di modelli generativi articolato in tre componenti principali. Consorti li definisce “building block”. Il primo è il Large Transaction Model, progettato per apprendere il linguaggio delle transazioni e riconoscere pattern comportamentali ricorrenti. Il secondo è un generatore capace di simulare l’evoluzione futura degli account, producendo serie storiche coerenti con i comportamenti osservati. Il terzo è un generatore di account sintetici, in grado di riprodurre la frequenza e la variabilità dei movimenti, fino a replicare giorni con venti operazioni o periodi di inattività.
L’integrazione di questi tre moduli ha permesso di costruire una rete di transazioni con caratteristiche molto vicine alla realtà.
La creazione di un dataset sintetico su larga scala
Il risultato è stato la simulazione di circa due milioni di conti correnti, ciascuno con un anno di storico. Al suo interno sono stati modellati diversi tipi di istituzioni: due grandi banche di sistema, tre banche locali, una grande banca digitale e due istituti online più piccoli.
Grazie a questo livello di dettaglio è stato possibile riprodurre anche la distribuzione statistica dei clienti, le caratteristiche dei conti correnti e i fenomeni di multibancarizzazione tipici del mercato inglese.
Testare diverse prospettive di controllo
Una volta generato il dataset, i ricercatori hanno sperimentato differenti modalità di analisi. Consorti ha parlato di tre punti di vista: quello delle singole banche, che restano la baseline dell’attuale sistema; quello di un operatore dei sistemi di pagamento, come Visa, che vede i flussi interbancari solo per il proprio canale; e quello di un regolatore centrale, che avrebbe accesso a dati anonimizzati e topologici, senza informazioni personali.
Da queste simulazioni è emerso che l’integrazione di score sintetici derivati dalle diverse prospettive può rafforzare la capacità di rilevare schemi di riciclaggio. Un approccio, ha osservato Consorti, che potrebbe trovare spazio anche dal punto di vista normativo, poiché non prevede lo scambio di dati personali ma solo contributi di analisi.
Oltre l’antiriciclaggio: nuove applicazioni possibili
Consorti ha evidenziato come questo tipo di simulazioni possa avere valore ben oltre la lotta al riciclaggio. La capacità di riprodurre sistemi complessi consente infatti di analizzare scenari macroeconomici, come l’impatto dei rialzi dei tassi sui conti correnti o l’evoluzione dei comportamenti di spesa delle famiglie.
Un altro ambito cruciale è il training dei modelli di machine learning. Laddove i dati reali siano insufficienti, i dati sintetici possono essere utilizzati per addestrare algoritmi con un livello di complessità e variabilità comparabile a quello delle informazioni reali. “Abbiamo mostrato come si possono addestrare modelli di Machine Learning laddove non ci sono abbastanza dati, simulando efficacemente un dato complesso”, ha affermato.
La questione della privacy e il valore dei dati sintetici
Il tema della privacy è stato un altro punto centrale. Con normative sempre più stringenti sulla protezione dei dati personali, i dataset sintetici rappresentano una risorsa che permette di coniugare innovazione e tutela dei diritti. La generazione di account e transazioni artificiali, ha spiegato Consorti, porta alla costruzione di modelli “by design privacy preserving”, poiché privi di informazioni personali.In questo senso, l’AI generativa nel settore bancario non si limita a fornire un supporto tecnico, ma diventa un mezzo per garantire conformità normativa e al tempo stesso rafforzare la capacità di analisi.





