Al Computex di Taipei, il 5 giugno 2026, Perplexity ha presentato quello che definisce il primo orchestratore di inferenza ibrido locale-server: un software che decide in autonomia quali operazioni di IA far girare sul computer dell'utente e quali, invece, inviare ai potenti modelli di frontiera in cloud. L'obiettivo dichiarato è tenere i dati sensibili sul dispositivo, senza rinunciare alla potenza dei grandi modelli quando serve davvero.

È un approccio diverso dalla logica dominante degli ultimi anni, in cui ogni richiesta — banale o riservata — veniva spedita a un data center remoto. Perplexity prova a fondere i due mondi: la privacy e la velocità del calcolo locale, la capacità del calcolo in cloud.

Come funziona il “vigile” che smista le richieste

Il meccanismo è ingegnoso. Un modello compatto gira in locale sul dispositivo e si comporta come un vigile del traffico: valuta ogni compito o sottocompito e decide se l'informazione è abbastanza delicata da dover restare sul computer, oppure se richiede la piena potenza di un modello in cloud. Così i dati più sensibili — documenti finanziari, informazioni sanitarie, file personali — non lasciano mai la macchina, mentre i compiti che esigono più intelligenza vengono indirizzati ai server.

Nella dimostrazione, i modelli locali giravano su processori Intel Core Ultra Series 3, frutto di una collaborazione tra Perplexity e Intel: è il chip che decide, sul posto, cosa tenere e cosa inviare. L'idea risponde a un'esigenza concreta delle aziende e dei professionisti: usare l'IA su dati riservati senza che quei dati finiscano sui server di terzi.

Un piccolo modello locale decide quali dati restano sul PC e quali vanno in cloud.

Quando arriva e su quali dispositivi

La funzione è attesa su Perplexity Computer — l'ambiente dell'azienda pensato per il PC — a partire da luglio 2026. Per ora si tratta di una dimostrazione, ma il calendario è vicino, e l'alleanza con Intel suggerisce che i primi a beneficiarne saranno i portatili equipaggiati con i nuovi processori della casa di Santa Clara.

L'annuncio si inserisce in una tendenza più ampia, emersa con forza proprio al Computex di quest'anno: riportare parte del calcolo dell'IA sui dispositivi, dopo anni di centralizzazione totale nel cloud. La stessa direzione è quella imboccata da NVIDIA con il superchip RTX Spark e dai modelli aperti come Gemma di Google, pensati per girare in locale.

Come provare Perplexity oggi, in attesa dell'ibrido

In attesa dell'orchestratore ibrido, Perplexity è già utilizzabile come motore di ricerca conversazionale. Ecco come iniziare:

  • Vai su perplexity.ai o scarica l'app per smartphone: il piano gratuito permette di porre domande e ottenere risposte con le fonti citate, ideale per la ricerca rapida.
  • Il piano Pro, a circa 20 dollari al mese, sblocca un numero molto maggiore di ricerche “approfondite” e l'accesso ai modelli più potenti.
  • Prova una domanda concreta, ad esempio: “Confronta i piani tariffari di tre operatori di telefonia mobile italiani e mostrami una tabella”. Perplexity cercherà in rete, sintetizzerà la risposta e citerà le fonti, che potrai verificare.

La forza del prodotto, rispetto a un chatbot tradizionale, è proprio la trasparenza delle fonti: ogni affermazione è collegata a una pagina web, riducendo il rischio di “allucinazioni”. Con l'arrivo dell'inferenza ibrida, a questa trasparenza si aggiungerà un nuovo livello di controllo sui dati: la garanzia che le informazioni più private non escano dal tuo computer. È una promessa che, se mantenuta, potrebbe rendere l'IA molto più appetibile per chi finora l'ha tenuta lontana dai documenti riservati.