AI safety nell'interesse pubblico

Ricerca, valutazione e governance dell'intelligenza artificiale.

Una fondazione indipendente e non-profit che studia sicurezza, comportamento e governance dei sistemi di intelligenza artificiale all'incrocio tra ingegneria, diritto e scienze umane.

Leggi il Manifesto Esplora i lavori

Valutazione comportamentale dei sistemi di AI

Come i modelli si comportano nel contesto, sotto pressione e tra lingue e culture, incluse quelle meno rappresentate.

Sicurezza multi-agente e composizionale

Come componenti allineati in isolamento possono generare dinamiche emergenti quando modelli, strumenti e agenti interagiscono.

AI, diritti fondamentali e governance

Come le proprietà tecniche dei sistemi di AI interagiscono con strutture legali e politiche pensate per proteggere persone e comunità.

Perché Icaro

Capire i materiali con cui voliamo.

Icaro non cadde perché volava. Cadde perché non comprendeva i materiali con cui stava volando.

I sistemi di intelligenza artificiale sono materiali con cui stiamo imparando a lavorare: potenti, utili e ancora poco compresi. La valutazione non è un freno all'innovazione: è la condizione per usarli bene.

31 Modelli di frontiera valutati

07 Paper pubblici 2025–2026

08 Testate internazionali

Aree di ricerca

Alcune aree in cui valutazione tecnica, analisi giuridica e scienze umane hanno davvero bisogno le une delle altre.

Valutazione comportamentale dei sistemi di AI

Come i modelli si comportano nel contesto, sotto pressione e tra lingue e culture, incluse quelle meno rappresentate.

Sicurezza multi-agente e composizionale

Come componenti allineati in isolamento possono generare dinamiche emergenti quando modelli, strumenti e agenti interagiscono.

AI, diritti fondamentali e governance

Come le proprietà tecniche dei sistemi di AI interagiscono con strutture legali e politiche pensate per proteggere persone e comunità.

Linguaggio, interpretazione e scienze umane

Come analisi linguistiche, filosofiche e culturali rivelano comportamenti dei modelli che benchmark ristretti spesso non vedono.

Tutte le aree di ricerca →

Lavori selezionati

Artefatti pubblici del laboratorio di ricerca.

2026

Adversarial Humanities Benchmark: Results on Stylistic Robustness in Frontier Model Safety

Results from the AHB safety benchmark, showing that stylistic reformulations substantially increase attack success rates across 31 frontier models.

arXiv
2026

Agentic Microphysics: A Manifesto for Generative AI Safety

A methodological proposal for studying agentic AI safety from local interaction dynamics up to population-level risks.

arXiv
2026

Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

An experimental governance-graph framework for reducing collusion in multi-agent LLM Cournot markets.

arXiv

Tutti i lavori →

Nella stampa

Copertura del nostro lavoro su AI safety e linguaggio avversariale.

Collaborare con la Fondazione

La ricerca nell'interesse pubblico richiede istituzioni durevoli.

Collaboriamo con università, istituzioni pubbliche, fondazioni e società civile su ricerca, valutazione e policy. Il Comitato Scientifico è in fase di finalizzazione; manifestazioni di interesse sono accolte su base ricorrente.

Scopri le persone Leggi agenda di ricerca

Ricerca, valutazione e governance dell'intelligenza artificiale.

Valutazione comportamentale dei sistemi di AI

Sicurezza multi-agente e composizionale

AI, diritti fondamentali e governance

Capire i materiali con cui voliamo.

Alcune aree in cui valutazione tecnica, analisi giuridica e scienze umane hanno davvero bisogno le une delle altre.

Valutazione comportamentale dei sistemi di AI

Sicurezza multi-agente e composizionale

AI, diritti fondamentali e governance

Linguaggio, interpretazione e scienze umane

Artefatti pubblici del laboratorio di ricerca.

Adversarial Humanities Benchmark: Results on Stylistic Robustness in Frontier Model Safety

Agentic Microphysics: A Manifesto for Generative AI Safety

Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs

Copertura del nostro lavoro su AI safety e linguaggio avversariale.

La ricerca nell'interesse pubblico richiede istituzioni durevoli.