Copilot Researcher: GPT e Claude insieme

Microsoft ha aggiornato Researcher, l'agente di ricerca approfondita di Copilot, con un'idea controintuitiva: invece di affidarsi a un solo modello, fa lavorare insieme i due rivali per eccellenza, GPT di OpenAI e Claude di Anthropic. Le due nuove modalità si chiamano Critique e Council e puntano a un obiettivo concreto: ridurre gli errori nei report di ricerca facendo controllare un modello dall'altro.

È una mossa che dice molto sulla direzione del settore: i grandi assistenti smettono di essere "monogami" e orchestrano più modelli per ottenere risposte più affidabili.

Come funziona Critique: una scrive, l'altra corregge

Con Critique il lavoro è diviso in due fasi sequenziali. Nella prima, un modello GPT pianifica la ricerca, recupera le fonti e produce una bozza. Nella seconda, Claude assume il ruolo di revisore esperto: controlla la bozza per accuratezza, completezza e qualità delle citazioni, poi la rifinisce prima che il report finale arrivi all'utente. È, di fatto, una redazione automatica con un autore e un editor che parlano due "lingue" diverse.

Secondo Microsoft, l'approccio porta un miglioramento del 13,8% di accuratezza rispetto al miglior strumento di ricerca IA precedente sul mercato (Perplexity Deep Research con Claude Opus 4.6) su un benchmark di riferimento. Non è un dettaglio: nei compiti di ricerca, la qualità e la correttezza delle citazioni sono il vero punto debole degli assistenti, come mostrano diversi studi recenti.

Con Critique, GPT redige la bozza e Claude la verifica prima della consegna.

Council: due pareri indipendenti più un arbitro

La modalità Council ribalta lo schema. Due modelli producono ciascuno un report completo e indipendente sulla stessa domanda; poi un terzo modello scrive una sorta di "lettera di accompagnamento" che li confronta, evidenziando dove concordano, dove divergono e quali spunti unici porta ciascuno. È pensata per le decisioni importanti, quando avere due prospettive distinte vale più di una singola risposta "media".

Come usarlo, quanto costa e i limiti

Le due funzioni vivono dentro l'agente Researcher di Microsoft 365 Copilot. Per usarle servono però due condizioni: una licenza Microsoft 365 Copilot (circa 30 dollari per utente al mese) e l'iscrizione al programma di accesso anticipato Frontier. C'è inoltre un tetto di 25 richieste al mese sia per Critique sia per Council, segno che si tratta di funzioni costose da eseguire (ogni risposta richiede più passaggi su più modelli).

In pratica, una volta abilitate, si apre Researcher in Copilot, si seleziona la modalità (Critique o Council) e si formula la domanda di ricerca come si farebbe con un assistente "deep research". Esempio di richiesta adatta a queste modalità:

Prepara un report sui rischi e i benefici dell'adozione dell'IA generativa nel customer care di una PMI italiana del retail. Includi normativa UE rilevante, costi indicativi e tre casi d'uso prioritari, con fonti verificabili.

Il risultato atteso è un documento strutturato con citazioni che, grazie alla revisione incrociata, dovrebbero reggere meglio al controllo rispetto a un singolo modello.

Per chi ha senso e quando evitarlo

Critique e Council sono pensati per chi fa ricerca documentale seria in azienda — analisti, consulenti, uffici studi — e ha già una licenza Copilot. Per l'uso personale e leggero restano più adatti gli assistenti gratuiti o i piani consumer. Va ricordato anche che far girare più modelli aumenta tempi e costi: per una domanda semplice è uno spreco. Ma per i report dove un errore costa caro, far "litigare" GPT e Claude potrebbe diventare una prassi sensata.