Quando 16 agenti AI costruiscono un compilatore C capace di compilare il kernel Linux

di Alex · 7 Febbraio 2026

Con un comunicato del 5 febbraio 2026, Anthropic, un’azienda statunitense leader nella ricerca sull’intelligenza artificiale, ha pubblicato un articolo che, per chi vive nel mondo delle distribuzioni GNU/Linux e dell’ingegneria del software, rappresenta qualcosa di davvero rivoluzionario. Un gruppo composto da 16 agenti Claude, un modello di intelligenza artificiale avanzato, lasciati lavorare in autonomia per 2 settimane, è riuscito a sviluppare da 0 un compilatore C scritto in Rust. Questo compilatore è in grado di compilare il kernel Linux 6.9 (versione disponibile nel maggio 2024) per le principali architetture: x86, ARM e RISC‑V.

Non si tratta di un semplice prototipo sperimentale, né di un esercizio accademico. Parliamo di un compilatore composto da circa 100.000 righe di codice, capace di costruire software complesso come QEMU, FFmpeg, SQLite, Postgres, Redis e persino di compilare Doom, un classico banco di prova per verificare la solidità di un ambiente di compilazione.

Tutto questo è stato ottenuto senza alcun accesso a Internet, all’interno di un ambiente isolato definito clean‑room. In questo contesto gli agenti non possono consultare risorse esterne e devono basarsi esclusivamente sulle informazioni fornite localmente, che non hanno nulla a che vedere con il loro addestramento generale. Si tratta infatti dei materiali specifici caricati dagli sviluppatori all’interno dell’ambiente di lavoro, come il codice sorgente iniziale, la struttura del progetto, la documentazione tecnica necessaria, i test da superare e ogni altro contenuto utile allo sviluppo del compilatore.

In altre parole, anche se gli agenti possiedono una conoscenza generale derivante dal loro addestramento, quando operano in modalità clean‑room possono utilizzare solo ciò che è stato reso disponibile nella macchina in cui lavorano. Non possono recuperare esempi, soluzioni o frammenti di codice da Internet, né accedere a risorse esterne. Tutto ciò che elaborano deve derivare dal materiale locale fornito dagli sviluppatori e dalla loro capacità di ragionamento.

Questo approccio impedisce la copia involontaria di codice esistente e costringe il sistema a produrre soluzioni originali, rendendo il risultato finale molto più significativo dal punto di vista tecnico e metodologico.

Il risultato finale ha dell’incredibile, soprattutto per chi conosce la complessità di un compilatore C e del kernel Linux, uno dei progetti software più articolati e difficili da costruire correttamente. La capacità di generare un compilatore funzionante, scritto interamente in Rust e in grado di gestire un progetto così vasto, rappresenta un traguardo che fino a pochi anni fa sarebbe stato considerato irraggiungibile per un sistema di intelligenza artificiale.

Un nuovo paradigma: gli “agent teams”

L’esperimento nasce da un’idea semplice ma radicale: invece di usare un singolo LLM (Large Language Model) come assistente interattivo, Anthropic ha orchestrato più istanze di Claude che lavorano in parallelo, ognuna con un proprio ruolo, su un’unica insieme di codice sorgente condiviso.

Come funziona il sistema

Ogni agente gira in un container dedicato.
Tutti condividono un repository software Git.
Ogni agente crea una propria copia del progetto, affronta un compito specifico, registra le modifiche nel sistema di controllo versione, risolve eventuali conflitti con il lavoro degli altri e poi passa al compito successivo.
Un semplice sistema di “lock” (file di testo) impedisce che 2 agenti lavorino sullo stesso problema.
Il ciclo è infinito: finito un task, l’agente ne sceglie un altro.

Il risultato è una sorta di team di sviluppatori virtuali, sempre attivi, sempre focalizzati, sempre pronti a iterare.

La sfida: costruire un compilatore C da zero

L’obiettivo era ambizioso: realizzare un compilatore C capace non solo di tradurre il codice sorgente in un programma eseguibile, ma anche di applicare ottimizzazioni avanzate per migliorare le prestazioni del software prodotto. Per farlo, il progetto utilizza una rappresentazione intermedia chiamata IR (Intermediate Representation), organizzata in SSA (Static Single Assignment), una tecnica che semplifica l’analisi del codice e permette di applicare trasformazioni più efficaci. Inoltre, il compilatore doveva essere multi‑backend, cioè in grado di generare codice per diverse architetture hardware, e doveva mantenere una compatibilità con GCC, il compilatore storico del mondo GNU/Linux, così da poter compilare software reale senza modifiche.

Il traguardo finale era il più impegnativo: riuscire a compilare il kernel Linux, il cuore della distribuzione GNU/Linux, uno dei progetti software più complessi esistenti.

Cosa ha funzionato sorprendentemente bene

Test suite di altissima qualità: l’AI si orienta grazie ai test, quindi la qualità dei test determina la qualità del codice.
Parallelizzazione intelligente: quando i test fallivano in punti diversi, gli agenti potevano lavorare in parallelo senza pestarsi i piedi.
Specializzazione dei ruoli: alcuni agenti ottimizzavano il codice, altri miglioravano la qualità Rust, altri ancora eliminavano duplicazioni o scrivevano documentazione.

Dove gli agenti si sono bloccati

Compilare il kernel Linux è un compito estremamente complesso e indivisibile. Significa che, quando qualcosa va storto, tutti gli agenti finiscono per incontrare lo stesso errore, bloccandosi nello stesso punto. Per superare questo ostacolo, Anthropic ha adottato una soluzione particolarmente ingegnosa: utilizzare GCC come una sorta di oracolo. GCC è il compilatore storico del mondo GNU/Linux, considerato un riferimento affidabile per verificare se un file viene compilato correttamente.

Il sistema ha iniziato a compilare la maggior parte dei file del kernel con GCC e solo una parte con il nuovo compilatore generato dagli agenti. La scelta dei file veniva fatta in modo casuale. Se il kernel risultante non funzionava, era possibile capire che l’errore si trovava all’interno del piccolo gruppo di file compilati dal nuovo compilatore, e non in tutto il progetto. In questo modo gli agenti potevano concentrarsi su problemi diversi senza intralciarsi, lavorando in parallelo su bug distinti invece di rimanere bloccati tutti sullo stesso.

Questa strategia ha trasformato un compito che normalmente richiederebbe un lavoro sequenziale e molto lento in un processo altamente distribuito, permettendo agli agenti di avanzare molto più rapidamente nella correzione degli errori.

Risultati: impressionanti ma non perfetti

Il compilatore risultante è straordinario, ma non privo di limiti.

Cosa funziona

Compila il kernel Linux 6.9 per x86, ARM e RISC‑V.
Passa il 99% dei test delle suite GCC.
Compila grandi progetti reali.
È scritto interamente in Rust, senza dipendenze esterne.

Cosa manca

Non genera codice 16‑bit x86 (necessario per il boot): per questa fase chiama GCC.
Non ha un assembler e linker propri (ancora troppo instabili).
Il codice generato è molto meno efficiente di quello di GCC.
La qualità Rust è buona, ma lontana da quella di un esperto umano.

In altre parole: è un compilatore reale ma non ancora un sostituto di GCC o Clang.

Perché questo esperimento è importante per il mondo GNU/Linux

Questo progetto segna un punto di svolta per diversi motivi:

1. Dimostra che gli LLM possono costruire software complesso e reale

Non parliamo di script o micro‑tool, ma di uno dei software più difficili da implementare: un compilatore C.

2. Mostra che la parallelizzazione degli agenti è la chiave

Un singolo LLM non avrebbe mai potuto completare un progetto simile.
Un team di agenti sì.

3. Apre scenari inquietanti e affascinanti

Se un team di agenti può costruire un compilatore, cosa potrà costruire tra 2–3 anni?
Interi sistemi operativi?
Driver?
Distribuzioni GNU/Linux personalizzate?

4. Rende evidente la necessità di nuove pratiche di sicurezza

Il rischio di software generato autonomamente, non verificato da umani, è reale.
Anthropic stessa lo ammette: l’esperimento è promettente e affascinante, ma allo stesso tempo un po’ inquietante.

Il futuro dello sviluppo software? Forse è già iniziato

Il codice sorgente del compilatore è disponibile pubblicamente su Github. Chiunque può scaricarlo, studiarlo e provarlo sui propri progetti C. Secondo gli sviluppatori, il modo più efficace per comprendere davvero le capacità di un modello linguistico è metterlo alla prova in situazioni complesse e osservare con attenzione i punti in cui iniziano a emergere i limiti. Il team continuerà a far generare a Claude nuove modifiche e miglioramenti, offrendo così la possibilità di seguire l’evoluzione del progetto e i tentativi dell’intelligenza artificiale di superare le proprie attuali limitazioni.

L’esperimento di Anthropic non è solo un benchmark tecnico: è un’anteprima del futuro. Un futuro in cui gli sviluppatori non scriveranno più ogni riga di codice, ma progetteranno sistemi di agenti, definiranno test, orchestreranno pipeline, e lasceranno che team di AI costruiscano il software.

Per la comunità GNU/Linux, questo significa 2 cose:

Possibilità immense: toolchain alternative, porting più rapidi, ottimizzazioni automatiche, manutenzione continua.
Responsabilità enormi: verificare, controllare, auditare, mantenere la sicurezza.

Il compilatore di Claude non è perfetto.
Ma è reale.
E soprattutto: è solo l’inizio.

Fonte: https://www.anthropic.com/engineering/building-c-compiler

Visited 1 times, 1 visit(s) today

Se vuoi sostenermi, puoi farlo acquistando qualsiasi cosa dai diversi link di affiliazione che ho nel mio sito o partendo da qui oppure alcune di queste distribuzioni GNU/Linux che sono disponibili sul mio negozio online, quelle mancanti possono essere comunque richieste.

Se ti senti generoso, puoi anche donarmi solo 1€ o più se vuoi con PayPal e aiutarmi a continuare a pubblicare più contenuti come questo. Grazie!

Hai dubbi o problemi? Ti aiutiamo noi!

Se vuoi rimanere sempre aggiornato, iscriviti al nostro canale Telegram.
Se vuoi ricevere supporto per qualsiasi dubbio o problema, iscriviti alla nostra community Facebook o gruppo Telegram.

Cosa ne pensi? Fateci sapere i vostri pensieri nei commenti qui sotto.
Ti piace quello che leggi? Per favore condividilo con gli altri.