The Economist del 14 maggio 2026 dedica la copertina al possibile impatto occupazionale dell’AI e con l’articolo “Prepare for an AI jobs apocalypse” osserva che non esistono ancora prove empiriche di una distruzione massiva di posti di lavoro, nonostante gli investimenti siano esplosi e Anthropic punti a $50 miliardi di ricavi ricorrenti annuali entro giugno. Apparentemente è una contraddizione: enormi spese AI, ma nessun collasso occupazionale visibile nei dati.
Una parte della risposta sta nei costi reali del lavoro degli agenti AI.
Molte aziende stanno scoprendo che gli agenti AI non si comportano economicamente come software tradizionale. Si comportano come una nuova forma di forza lavoro digitale, con costi variabili, supervisione umana, consumo infrastrutturale e dinamiche operative che assomigliano molto più a un centro di costo operativo che a una licenza SaaS.
Bryan Catanzaro, Vice President of Applied Deep Learning di Nvidia, ha dichiarato ad Axios che i costi di calcolo del suo team superano già le spese per il personale. Uber, secondo quanto riportato da The Information, avrebbe consumato gran parte del budget AI previsto per il 2026 in costi token già nel primo semestre.
Non sono anomalie isolate. Sono segnali di un cambiamento strutturale. Il fenomeno è globale, ma nelle organizzazioni italiane assume caratteristiche specifiche legate alla struttura verticale delle funzioni e alla concentrazione degli accordi cloud su uno o due provider.
Indice degli argomenti
Agenti AI e costi operativi: il modello SaaS non funziona più
Per anni le aziende hanno valutato l’intelligenza artificiale con la logica del software enterprise: licenza, costo per utente, abbonamento annuale, marginalità crescente con la scala. Gli agenti AI rompono questa logica.
Un software classico tende ad avere costi marginali relativamente bassi all’aumentare degli utenti. Un sistema agentico aumenta il costo operativo a ogni iterazione, verifica, chaining di modelli, retrieval documentale o chiamata API.
Un agente non si limita a rispondere. Pianifica, esegue task, controlla risultati, corregge errori, richiama altri modelli, consulta memoria persistente, interroga strumenti esterni. Ogni passaggio consuma token e capacità computazionale. Ricerche recenti su implementazioni agentiche in produzione mostrano che i flussi multi-step moltiplicano il consumo di token da 20 a 30 volte rispetto a una classica interazione generativa.
La conseguenza è che molte organizzazioni stanno trattando un costo operativo dinamico come se fosse una semplice spesa software prevedibile.
Il framework Virtual FTE: calcolare il costo dell’AI agentica
Tra i framework che stanno emergendo nella letteratura recente sull’economia degli agenti AI, uno dei più utili è quello del Virtual FTE, o vFTE. L’idea è diretta: un agente AI in produzione deve essere valutato come una nuova unità di lavoro digitale, con un Total Cost of Ownership comparabile a quello di una risorsa umana.
Il TCO di un vFTE ha cinque componenti.
La prima è il costo API per i token, che nelle implementazioni reali rappresenta tra il 60 e l’80 percento del totale. La seconda è l’infrastruttura: memoria persistente, vector database, cloud compute e sistemi di retrieval, tra $500 e $2.500 al mese a seconda della scala. La terza è l’integrazione con i sistemi aziendali esistenti. La quarta è l’AgentOps: osservabilità, monitoraggio anomalie, versionamento dei prompt e governance operativa. Serve sapere cosa sta facendo l’agente, quanto sta costando e quando sta uscendo dai parametri previsti. La quinta è la supervisione umana: nei contesti regolamentati qualcuno deve verificare output, gestire eccezioni e assumersi la responsabilità finale del processo.
Sommando queste componenti, il costo realistico di un agente in produzione oscilla tra $3.200 e $13.000 al mese. Non è una voce IT marginale. Questo non significa che gli agenti AI non generino produttività reale. Significa che la produttività non coincide automaticamente con una riduzione immediata dei costi, e che le due variabili vanno misurate separatamente.
Il moltiplicatore invisibile dei costi degli agenti AI
Il problema più sottovalutato è che i costi agentici non crescono in modo lineare.
La scelta del modello è ormai una decisione economica prima ancora che tecnica. A maggio 2026 i modelli di punta costano fino a 20 volte di più delle versioni economiche della stessa famiglia: Claude Opus 4.6 tocca $25 per milione di token in output, Haiku si ferma a $1,25. In un workflow agentico multi-step questo differenziale non si applica una sola volta. Si replica a ogni passaggio. Cinque iterazioni significano cinque moltiplicatori di costo.
Il secondo problema è la coda di distribuzione. Su oltre 1.100 esecuzioni agentiche monitorate in produzione, il costo mediano era $1,22 a run. Il 95° percentile superava $22,14. Un rapporto di 18 a 1. I budget costruiti sulla media si rompono sulla coda.
Il contesto di mercato amplifica il fenomeno. Goldman Sachs stima che il consumo globale di token crescerà 24 volte entro il 2030. Il budget che molte organizzazioni vedono oggi è solo la prima fase della curva.
Governance aziendale: la nuova alleanza fra CFO, CIO e CHR
La trasformazione più rilevante non è tecnica. È organizzativa. Gli agenti AI stanno facendo convergere tre categorie aziendali che finora erano rimaste relativamente separate: costo del lavoro, architettura IT e governance organizzativa. Per questo l’adozione di agenti AI in produzione sta costringendo CFO, CIO e CHR a collaborare in modo molto più stretto rispetto al passato.
Per il CFO il problema è la prevedibilità. Un dipendente ha un costo relativamente stabile. Un agente AI può costare $3.200 un mese e $13.000 quello successivo. La classificazione contabile tradizionale diventa fragile: molte aziende registrano questi costi come spesa software, ma il comportamento economico assomiglia a un costo operativo variabile. Senza attribuzione per workflow il ROI diventa impossibile da misurare.
Per il CIO il problema è che l’architettura è diventata una decisione finanziaria. La scelta del modello, i limiti di iterazione, il routing tra modelli premium ed economici e il layer di osservabilità incidono direttamente sulla struttura di costo. Un errore architetturale può moltiplicare il budget operativo molto più rapidamente di quanto accadesse nel software tradizionale.
Per il CHR emerge il tema più delicato. Gli agenti vengono spesso presentati come sostituzione del lavoro umano. In pratica molte organizzazioni stanno creando nuove attività di revisione, escalation e controllo qualità. Quel lavoro esiste, ma non compare nei business case iniziali. Nei settori regolamentati, sanità, finanza e pubblica amministrazione, la supervisione umana non è opzionale. È un requisito operativo e legale. Una parte del risparmio promesso dagli agenti viene riassorbita dalla necessità di costruire nuovi layer di governance.
Separare queste tre dimensioni produce quasi sempre business case fragili.
Gestire i costi dell’AI nelle aziende: 3 azioni prioritarie
La prima priorità è trattare i costi degli agenti AI con la stessa disciplina con cui le aziende più mature gestiscono i costi cloud. Ogni workflow deve avere un’attribuzione di costo propria, non aggregata a livello di progetto. Finché i costi sono visibili solo in fattura, non si sa quale agente sta consumando, per quale processo e con quale rendimento. Definire limiti di consumo, alert automatici e soglie di iterazione prima del go-live non è una misura tecnica. È la condizione minima per poter gestire la spesa invece di subirla.
La seconda è trattare il budget token come infrastruttura critica. Questo significa definire soglie di iterazione, routing intelligente verso modelli meno costosi per task semplici e controlli automatici sulle anomalie di consumo. Il routing vale soprattutto per i task classificatori, estrattivi e di orchestrazione, che rappresentano il volume maggiore in quasi tutti i flussi agentici in produzione e che raramente richiedono un modello di frontiera.
La terza è costruire una governance condivisa tra CFO, CIO e CHR con almeno un mese di anticipo rispetto alla messa in produzione, con un modello di costo che includa esplicitamente la stima del costo orario della supervisione umana per il primo trimestre. È la logica che guida AITO, il programma di trasformazione AI che coordiniamo con alcune tra le principali organizzazioni italiane: portare allo stesso tavolo le funzioni direttamente implicate nella governance dell’AI prima che i costi operativi diventino una sorpresa contabile. Il framework vFTE è utile proprio perché traduce una struttura di costo tecnica in un linguaggio che CFO, CIO e CHR sanno leggere insieme.
AI e lavoro: il dibattito che non c’è sui modelli economici
The Economist chiede ai governi di costruire reti di sicurezza prima che l’evidenza empirica del danno sia conclusiva, perché a quel punto sarà troppo tardi. La stessa logica si applica alle organizzazioni sul piano operativo: chi aspetta la prima fattura anomala per costruire una governance del costo agentico parte già in ritardo.
Il dibattito pubblico sull’AI e il lavoro si concentra sul piano macro: quanti posti spariranno, quali policy redistributive serviranno, se servirà un reddito universale. È un dibattito necessario. Manca però il livello intermedio, quello aziendale, dove le decisioni di messa in produzione vengono prese oggi con modelli economici che non riflettono ancora il comportamento reale dei sistemi agentici in produzione.
Finché il costo reale degli agenti AI rimarrà invisibile nei modelli di budget, il confronto tra AI e lavoro umano continuerà a essere costruito più su aspettative che su dati operativi. Questo vale nelle sale riunioni quanto nei parlamenti.






























