Il Transformer: il motore nascosto dietro ChatGPT, Claude e Gemini
Dietro ChatGPT, Claude e Gemini c'è la stessa idea di base. Si chiama Transformer ed è nata nel 2017 da un gruppo di ricercatori di Google. Capire questa idea aiuta a capire come "ragiona" l'IA di oggi. Te la spieghiamo con metafore, senza una sola formula.
In breve
- Il Transformer è l'architettura del 2017 che fa funzionare quasi tutta l'IA moderna.
- Nasce dal paper "Attention Is All You Need", scritto da otto ricercatori di Google.
- La sua idea chiave è l'"attenzione": ogni parola guarda tutte le altre per capire il senso.
- La "T" di GPT sta proprio per Transformer.
L'idea che ha cambiato tutto
Immagina di leggere questa frase: "Ho portato il cane al parco perché era stanco". Chi era stanco? Il cane, ovviamente. Tu lo capisci subito. Ma per un computer collegare "era stanco" a "cane" non è facile.
Prima del 2017, i programmi leggevano le frasi parola dopo parola, in fila, come chi legge tenendo un dito sotto le righe. Era lento. E con frasi lunghe il programma "dimenticava" l'inizio prima di arrivare alla fine.
Nel 2017 un gruppo di ricercatori di Google ha proposto un modo diverso. Il loro paper si chiama "Attention Is All You Need". In italiano: "L'attenzione è tutto ciò che serve". E presenta una nuova architettura: il Transformer.
L'"attenzione" (in inglese attention) è il trucco centrale. Funziona così: mentre la macchina elabora una parola, guarda allo stesso tempo tutte le altre parole della frase e decide a quali dare peso. È come a una cena con tanti discorsi: tu ascolti tutti, ma "presti attenzione" solo alle voci che contano per capire il senso. La macchina fa lo stesso con le parole.
Tutto insieme, non in fila
Il vantaggio più grande è la velocità. I vecchi sistemi leggevano una parola alla volta, in ordine. Il Transformer guarda tutta la frase in una volta sola, in parallelo.
Pensa alla differenza tra leggere un libro pagina per pagina e avere tutte le pagine aperte sul tavolo davanti a te. Nel secondo caso puoi collegare subito un punto a un altro, anche lontano.
Questo cambio ha avuto un effetto pratico enorme: si potevano addestrare modelli molto più grandi, su molti più testi, in meno tempo. È da qui che parte la corsa dell'IA degli ultimi anni.
Dal paper a ChatGPT
Il paper era nato per tradurre testi da una lingua all'altra. Ma l'idea si è rivelata utile per molto altro: scrivere, riassumere, rispondere a domande.
Ed ecco il collegamento più diretto. La sigla GPT sta per "Generative Pre-trained Transformer". Quella "T" finale è proprio il Transformer del 2017. ChatGPT, Claude e Gemini usano tutti, in forme diverse, la stessa architettura di base.
In altre parole: un'idea pubblicata in un articolo scientifico è oggi il motore nascosto di strumenti usati da centinaia di milioni di persone.
Cosa cambia per te
Tre cose concrete da portarti a casa.
- Il Transformer è l'architettura del 2017 alla base dell'IA moderna.
- L'"attenzione" permette a ogni parola di guardare tutte le altre, in parallelo.
- La "T" di GPT, ChatGPT incluso, sta per Transformer.
Quando usi un'IA che scrive, sotto sta girando un'idea del 2017: l'attenzione.
Fonti
- Vaswani et al., "Attention Is All You Need" (arXiv)
- Wikipedia — Attention Is All You Need
- Wikipedia — Generative pre-trained transformer
Articolo divulgativo: i fatti sono rielaborati con parole nostre a partire dalle fonti citate. Per i dettagli ufficiali rimandiamo alle pagine originali. Aggiornato al 28 giugno 2026.
Domande frequenti
Chi ha inventato il Transformer e quando?
Lo hanno presentato nel 2017 otto ricercatori di Google, nel paper "Attention Is All You Need". Tra loro Ashish Vaswani, Noam Shazeer e altri sei colleghi.
Cosa significa la "T" di GPT?
Significa Transformer. GPT sta per "Generative Pre-trained Transformer", cioè un modello basato proprio su quell'architettura del 2017.