Spiegoni · Storia

Il Transformer: il motore nascosto dietro ChatGPT, Claude e Gemini

Redazione IA da Zero · 28 giugno 2026 · Lettura 4 min

Dietro ChatGPT, Claude e Gemini c'è la stessa idea di base. Si chiama Transformer ed è nata nel 2017 da un gruppo di ricercatori di Google. Capire questa idea aiuta a capire come "ragiona" l'IA di oggi. Te la spieghiamo con metafore, senza una sola formula.

In breve

Il Transformer è l'architettura del 2017 che fa funzionare quasi tutta l'IA moderna.
Nasce dal paper "Attention Is All You Need", scritto da otto ricercatori di Google.
La sua idea chiave è l'"attenzione": ogni parola guarda tutte le altre per capire il senso.
La "T" di GPT sta proprio per Transformer.

L'idea che ha cambiato tutto

Immagina di leggere questa frase: "Ho portato il cane al parco perché era stanco". Chi era stanco? Il cane, ovviamente. Tu lo capisci subito. Ma per un computer collegare "era stanco" a "cane" non è facile.

Prima del 2017, i programmi leggevano le frasi parola dopo parola, in fila, come chi legge tenendo un dito sotto le righe. Era lento. E con frasi lunghe il programma "dimenticava" l'inizio prima di arrivare alla fine.

Nel 2017 un gruppo di ricercatori di Google ha proposto un modo diverso. Il loro paper si chiama "Attention Is All You Need". In italiano: "L'attenzione è tutto ciò che serve". E presenta una nuova architettura: il Transformer.

In parole povere

L'"attenzione" (in inglese attention) è il trucco centrale. Funziona così: mentre la macchina elabora una parola, guarda allo stesso tempo tutte le altre parole della frase e decide a quali dare peso. È come a una cena con tanti discorsi: tu ascolti tutti, ma "presti attenzione" solo alle voci che contano per capire il senso. La macchina fa lo stesso con le parole.

Tutto insieme, non in fila

Il vantaggio più grande è la velocità. I vecchi sistemi leggevano una parola alla volta, in ordine. Il Transformer guarda tutta la frase in una volta sola, in parallelo.

Pensa alla differenza tra leggere un libro pagina per pagina e avere tutte le pagine aperte sul tavolo davanti a te. Nel secondo caso puoi collegare subito un punto a un altro, anche lontano.

Questo cambio ha avuto un effetto pratico enorme: si potevano addestrare modelli molto più grandi, su molti più testi, in meno tempo. È da qui che parte la corsa dell'IA degli ultimi anni.

Dal paper a ChatGPT

Il paper era nato per tradurre testi da una lingua all'altra. Ma l'idea si è rivelata utile per molto altro: scrivere, riassumere, rispondere a domande.

Ed ecco il collegamento più diretto. La sigla GPT sta per "Generative Pre-trained Transformer". Quella "T" finale è proprio il Transformer del 2017. ChatGPT, Claude e Gemini usano tutti, in forme diverse, la stessa architettura di base.

In altre parole: un'idea pubblicata in un articolo scientifico è oggi il motore nascosto di strumenti usati da centinaia di milioni di persone.

Cosa cambia per te

Tre cose concrete da portarti a casa.

Il Transformer è l'architettura del 2017 alla base dell'IA moderna.
L'"attenzione" permette a ogni parola di guardare tutte le altre, in parallelo.
La "T" di GPT, ChatGPT incluso, sta per Transformer.

In una riga

Quando usi un'IA che scrive, sotto sta girando un'idea del 2017: l'attenzione.

Fonti

Articolo divulgativo: i fatti sono rielaborati con parole nostre a partire dalle fonti citate. Per i dettagli ufficiali rimandiamo alle pagine originali. Aggiornato al 28 giugno 2026.

Domande frequenti

Chi ha inventato il Transformer e quando?

Lo hanno presentato nel 2017 otto ricercatori di Google, nel paper "Attention Is All You Need". Tra loro Ashish Vaswani, Noam Shazeer e altri sei colleghi.

Cosa significa la "T" di GPT?

Significa Transformer. GPT sta per "Generative Pre-trained Transformer", cioè un modello basato proprio su quell'architettura del 2017.