ChatGPT: la Lockdown Mode contro il prompt injection

Il 6 giugno 2026 OpenAI ha introdotto in ChatGPT la Lockdown Mode, un interruttore di sicurezza opzionale che disattiva le funzioni connesse al web e ai servizi esterni per bloccare il modo piu' comune con cui gli attacchi di prompt injection rubano i dati. Insieme alla modalita' arrivano anche le etichette "Elevated Risk", pensate per avvisare l'utente quando una conversazione comporta rischi piu' alti.

Cosa fa la Lockdown Mode

La Lockdown Mode e' progettata per interrompere l'ultimo stadio di un attacco di prompt injection: il trasferimento non autorizzato di dati sensibili verso una destinazione controllata dall'attaccante tramite richieste di rete in uscita. In altre parole, anche se un'istruzione malevola riuscisse a "infiltrarsi" in ChatGPT - per esempio nascosta in una pagina web o in un documento caricato - con la modalita' attiva il modello non avrebbe i canali per spedire i tuoi dati fuori dalla conversazione.

La Lockdown Mode blocca i canali con cui un attacco potrebbe esfiltrare i dati. Foto: Pexels

Cosa si disattiva quando e' attiva

Quando si accende la Lockdown Mode, ChatGPT limita o spegne una serie di funzioni che lo collegano all'esterno:

l'accesso live al web e la navigazione;
Deep Research, comprese le ricerche per gli acquisti;
l'Agent Mode, ossia la modalita' agentica che compie azioni autonome;
le immagini nelle risposte e i download di file;
i connettori live e le funzioni di rete di Canvas.

E' una scelta di compromesso esplicita: si rinuncia a comodita' e capacita' avanzate in cambio di una superficie di attacco molto piu' ridotta. Non e' un caso che OpenAI dichiari che la modalita' "non e' pensata per tutti", ma per chi tratta dati sensibili e vuole una protezione piu' rigida.

Come attivarla e a chi e' destinata

La Lockdown Mode viene distribuita inizialmente agli account ChatGPT Business self-serve e agli account personali idonei. L'attivazione avviene dalle impostazioni di sicurezza dell'account: e' un interruttore che l'utente accende quando ne ha bisogno - per esempio durante una sessione di lavoro su documenti riservati - e che puo' spegnere quando torna a usare ChatGPT per compiti ordinari che richiedono web e agenti.

Il target sono professionisti e organizzazioni che maneggiano informazioni delicate: studi legali, sanita', finanza, pubbliche amministrazioni. Per loro il rischio di esfiltrazione dei dati e' concreto, e poter "blindare" l'assistente con un clic e' una garanzia in piu'.

La modalita' si attiva dalle impostazioni di sicurezza dell'account. Foto: Pexels

Cosa NON protegge (e perche' conta)

OpenAI e' onesta su un punto cruciale: la Lockdown Mode non impedisce alle prompt injection di comparire nei contenuti che ChatGPT elabora. Un'istruzione malevola puo' comunque trovarsi in una pagina web in cache o in un file caricato e influenzare il comportamento o l'accuratezza di una risposta. Cio' che la modalita' fa e' tagliare le vie d'uscita dei dati, non eliminare l'inganno alla radice.

Il prompt injection e' considerato uno dei problemi di sicurezza piu' difficili dell'IA generativa proprio perche' non esiste, al momento, una soluzione definitiva: i modelli faticano a distinguere tra le istruzioni legittime dell'utente e quelle nascoste nei contenuti che leggono. Strumenti come la Lockdown Mode sono mitigazioni - utili, ma non risolutive - e segnalano una maturazione del settore, che inizia a trattare la sicurezza degli assistenti con la stessa serieta' con cui si trattano i browser e i sistemi operativi. I dettagli ufficiali sono sul blog di OpenAI.