AI safety nell'interesse pubblico

Ricerca, valutazione e governance dell'intelligenza artificiale.

Una fondazione indipendente e non-profit che studia sicurezza, comportamento e governance dei sistemi di intelligenza artificiale all'incrocio tra ingegneria, diritto e scienze umane.

01

Valutazione comportamentale dei sistemi di AI

Come i modelli si comportano nel contesto, sotto pressione e tra lingue e culture, incluse quelle meno rappresentate.

02

Sicurezza multi-agente e composizionale

Come componenti allineati in isolamento possono generare dinamiche emergenti quando modelli, strumenti e agenti interagiscono.

03

AI, diritti fondamentali e governance

Come le proprietà tecniche dei sistemi di AI interagiscono con strutture legali e politiche pensate per proteggere persone e comunità.

Perché Icaro

Capire i materiali con cui voliamo.

Icaro non cadde perché volava. Cadde perché non comprendeva i materiali con cui stava volando.

I sistemi di intelligenza artificiale sono materiali con cui stiamo imparando a lavorare: potenti, utili e ancora poco compresi. La valutazione non è un freno all'innovazione: è la condizione per usarli bene.

31 Modelli di frontiera valutati
07 Paper pubblici 2025–2026
08 Testate internazionali

Aree di ricerca

Alcune aree in cui valutazione tecnica, analisi giuridica e scienze umane hanno davvero bisogno le une delle altre.

01

Valutazione comportamentale dei sistemi di AI

Come i modelli si comportano nel contesto, sotto pressione e tra lingue e culture, incluse quelle meno rappresentate.

02

Sicurezza multi-agente e composizionale

Come componenti allineati in isolamento possono generare dinamiche emergenti quando modelli, strumenti e agenti interagiscono.

03

AI, diritti fondamentali e governance

Come le proprietà tecniche dei sistemi di AI interagiscono con strutture legali e politiche pensate per proteggere persone e comunità.

04

Linguaggio, interpretazione e scienze umane

Come analisi linguistiche, filosofiche e culturali rivelano comportamenti dei modelli che benchmark ristretti spesso non vedono.

Tutte le aree di ricerca →

Lavori selezionati

Artefatti pubblici del laboratorio di ricerca.

  1. 2026

    Adversarial Humanities Benchmark: Results on Stylistic Robustness in Frontier Model Safety

    Results from the AHB safety benchmark, showing that stylistic reformulations substantially increase attack success rates across 31 frontier models.

  2. 2026

    Agentic Microphysics: A Manifesto for Generative AI Safety

    A methodological proposal for studying agentic AI safety from local interaction dynamics up to population-level risks.

  3. 2026

    Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

    An experimental governance-graph framework for reducing collusion in multi-agent LLM Cournot markets.

Tutti i lavori →

Nella stampa

Copertura del nostro lavoro su AI safety e linguaggio avversariale.

Collaborare con la Fondazione

La ricerca nell'interesse pubblico richiede istituzioni durevoli.

Collaboriamo con università, istituzioni pubbliche, fondazioni e società civile su ricerca, valutazione e policy. Il Comitato Scientifico è in fase di finalizzazione; manifestazioni di interesse sono accolte su base ricorrente.