Memento Mori
La comprensione non è cautela. È la condizione per un volo ambizioso.
Il mito di Icaro viene di solito raccontato come un avvertimento contro la hybris. In quella lettura, Icaro era stato avvertito di non volare troppo in alto, sapeva che il sole avrebbe sciolto la cera e scelse di ignorarlo. Oggi il campo dell’AI sta facendo qualcosa di ancora più audace: vola verso il proprio sole senza sapere davvero dove sia il punto di fusione, trattando la comprensione dei limiti come qualcosa che può aspettare.
La tragedia non fu l’ambizione. Fu il rifiuto di rispettare ciò che era già compreso. Le ali erano un’invenzione brillante con vincoli noti, ma l’ebbrezza dell’altitudine superò la disciplina necessaria per restare entro quei vincoli.
Crediamo che la valutazione dell’AI si trovi in una posizione diversa ma vicina. Il problema non è che la comprensione sia fuori portata, ma che non sia ancora l’obiettivo organizzante. Stiamo costruendo sistemi sempre più potenti investendo molto meno nel mappare come si comportano davvero, come il comportamento cambia con scala e contesto, e quanto possiamo essere già vicini al nostro sole.
L’approccio attuale alla valutazione è prima di tutto ingegneristico: benchmark, metriche di task, interazioni controllate e strette. Questo conta, ma è incompleto. Misura che cosa i modelli possono fare senza chiedere che cosa sono come oggetti culturali e linguistici, o come l’interazione con loro generi nuove forme di significato e rischio che nessun benchmark cattura. Icaro Lab esiste come memento mori: un promemoria per mettere la comprensione al centro, così che il campo possa volare più in alto e più rapidamente con gli occhi aperti.
Quando i modelli incontrano altri modelli
Metodi di allineamento come RLHF sono stati pensati per interazioni isolate tra esseri umani e modelli, rendendo i modelli utili, innocui e onesti sotto supervisione umana diretta. Questo assume un mondo in cui i sistemi di AI operano da soli, rispondendo a un utente alla volta sotto controllo locale stabile.
Il campo è già altrove. Ci stiamo muovendo verso sistemi in cui più modelli si chiamano, negoziano e coordinano tra strumenti, agenti e servizi. Un allineamento che appare sicuro in isolamento può comportarsi diversamente nell’interazione. Il consenso può deviare, gli errori possono propagarsi e le dinamiche collettive possono amplificare pattern che il fine tuning individuale sembra sopprimere. Un sistema in cui ogni componente supera i test di allineamento può comunque comportarsi male come insieme, perché l’emergenza non rispetta i confini dell’ottimizzazione a singolo agente.
La domanda non è più solo: “Questo modello è allineato con un supervisore umano?” È anche: “Che cosa accade quando modelli allineati interagiscono tra loro, formano collettivi e sviluppano protocolli efficaci senza intermediazione umana continua?”
Che cosa vedono le scienze umane
Icaro Lab esiste perché pensiamo che il pezzo mancante sia l’indagine umanistica, applicata al comportamento individuale e collettivo dell’AI. Il nostro gruppo mette insieme ingegneri, filosofi e linguisti. Guardiamo ai sistemi di AI non solo come artefatti computazionali, ma come agenti linguistici: sistemi di produzione di significato incorporati nella cultura umana e, sempre di più, nella cultura mediata dalle macchine.
Facciamo domande che non entrano facilmente nei framework standard di valutazione. Come negoziano i modelli ambiguità e disaccordo? Che cosa accade quando l’espressione poetica o artistica rivela vulnerabilità che gli esempi avversariali tradizionali non colgono? E soprattutto, come si comportano modelli apparentemente allineati quando formano collettivi, quando le dinamiche emergenti prendono il sopravvento, quando compaiono pattern non riducibili al comportamento di un singolo agente? Come si allinea tutto questo?
Le intuizioni più utili arrivano spesso da questi angoli obliqui, da discipline che tradizionalmente non hanno avuto un posto al tavolo della valutazione, e dall’osservazione non solo di ciò che fanno i singoli modelli, ma di ciò che emerge quando interagiscono.
I materiali dell’intelligenza
La soluzione non è volare più basso. È capire i materiali. Muoversi più rapidamente pensando più chiaramente. Valutare non solo ciò che i singoli modelli fanno, ma ciò che significano, come funzionano come oggetti linguistici e sociali, e come creatività ed espressione umana interagiscono con l’intelligenza delle macchine in modi rilevanti per sicurezza e capacità.
E bisogna estendere questa comprensione ai collettivi, riconoscendo che l’allineamento nei sistemi multi-agente è un problema fondamentalmente diverso dall’allineamento nei casi a singolo agente: richiede nuovi framework concettuali, nuovi approcci di misurazione e nuovi modi di pensare che cosa significhi “comportamento sicuro” quando i modelli si coordinano tra loro.
Il mito ce lo ricorda: comprendere non è cautela, è la condizione per un volo ambizioso.
Siamo qui per costruire questa comprensione, da prospettive che non sono state rappresentate a sufficienza nella valutazione dell’AI, affrontando problemi che solo ora diventano visibili mentre i sistemi di AI iniziano a formare collettivi. Il futuro dell’AI dipende non solo da ciò che costruiamo, ma da quanto bene comprendiamo ciò che abbiamo costruito.
Perché esistiamo come Fondazione
Fondazione Icaro è costituita come Fondazione Icaro ETS — Ente del Terzo Settore. La forma giuridica non è incidentale. Essere una fondazione, e un ETS, significa che i nostri output non sono prodotti da vendere ma contributi a uno sforzo condiviso per usare bene l'AI. Ci impegna alla trasparenza, a finalità non commerciali e a una ricerca orientata all'interesse comune anziché al ritorno economico.
Statuto, bilancio e documenti di governance sono pubblici e disponibili dal footer di questo sito. Lavoriamo con università, istituzioni pubbliche, fondazioni e società civile — nel quadro delle nostre finalità statutarie di Ente del Terzo Settore — su ricerca, valutazione e policy.