Mistral Medium 3.5: 128B aperto, Le Chat e Vibe

Mistral AI continua a essere l'eccezione tra i grandi laboratori: l'unico a rilasciare a pesi aperti un modello davvero capace. Mistral Medium 3.5 è un modello denso da 128 miliardi di parametri, distribuito con licenza MIT modificata, che fonde in un'unica rete ciò che prima era diviso tra il modello di ragionamento Magistral e quello di codice Devstral 2. Oggi alimenta sia la nuova modalità Work di Le Chat sia gli agenti remoti di Mistral Vibe, gli strumenti con cui la società francese punta a conquistare chi programma.

Un 128B aperto che unisce ragionamento e codice

La scelta di consolidare ragionamento e coding in un solo modello denso da 128B ha una logica precisa: semplificare. Invece di scegliere tra un modello "che pensa" e uno "che programma", gli sviluppatori ne hanno uno solo, con una finestra di contesto da 256.000 token e prestazioni rispettabili, come il 77,6% su SWE-Bench Verified, il benchmark che misura la capacità di risolvere problemi reali di software. Non è un punteggio da primato assoluto, ma è notevole per un modello che si può scaricare e modificare liberamente.

Il fatto che sia a pesi aperti è il vero punto di forza: aziende e ricercatori possono ospitarlo sui propri server, adattarlo ai propri dati e usarlo senza dipendere da un fornitore esterno. Per chi ha requisiti di privacy o di sovranità del dato — un tema sentito nella pubblica amministrazione e nella sanità italiane — è una caratteristica decisiva.

Mistral Medium 3.5 fonde ragionamento e coding in un unico modello denso da 128 miliardi di parametri.

Le Chat e Vibe: gli agenti remoti per programmare in cloud

Attorno al modello, Mistral ha costruito due prodotti. Le Chat, l'assistente conversazionale, introduce la modalità Work (in anteprima): un agente capace di gestire compiti complessi in più passaggi, come ricerche, analisi e azioni che attraversano più strumenti. Mistral Vibe, invece, è l'ambiente per programmare: ora offre agenti remoti per il coding asincrono, con sessioni che girano nel cloud e possono essere avviate dalla riga di comando o da Le Chat. Una sessione locale può anche essere "teletrasportata" nel cloud per continuare a lavorare senza tenere il computer acceso.

Come usarlo subito su Le Chat (gratis)

Il modo più immediato è Le Chat, raggiungibile dal sito ufficiale di Mistral (chat.mistral.ai). Si crea un account, si seleziona Mistral Medium 3.5 come modello e si inizia. Il piano gratuito consente di provare la chat e le funzioni di base; per la modalità Work avanzata e per limiti d'uso più alti servono i piani a pagamento. È la via consigliata per chi vuole valutare la qualità del modello in italiano prima di investirci tempo tecnico.

Eseguirlo in locale con Ollama: i requisiti reali

Trattandosi di un modello aperto, lo si può eseguire sul proprio hardware. Con Ollama, una volta installato lo strumento, il comando è semplice:

ollama run mistral-medium-3.5

Attenzione però ai requisiti, perché qui sta il punto critico: un modello denso da 128B in piena precisione richiede centinaia di gigabyte di memoria, ben oltre la portata di un comune portatile. In pratica si usano versioni quantizzate (per esempio a 4 bit), che riducono la memoria necessaria a circa 70-90 GB: significa server con GPU professionali o macchine con molta RAM, e velocità comunque ridotte. Per la maggior parte degli utenti, l'esecuzione in locale ha senso solo con hardware dedicato; per tutti gli altri, l'API o Le Chat restano più pratici. I pesi sono comunque scaricabili anche da Hugging Face, nel repository ufficiale di Mistral.

Eseguire un 128B in locale richiede hardware dedicato: per molti restano API e Le Chat.

Chiamarlo via API con codice Python

Per integrarlo nei propri programmi, Mistral offre La Plateforme con un'API compatibile con lo standard OpenAI. Dopo aver ottenuto una chiave dal sito, il codice è essenziale:

from openai import OpenAI

client = OpenAI(
    api_key="LA_TUA_CHIAVE_MISTRAL",
    base_url="https://api.mistral.ai/v1",
)

risposta = client.chat.completions.create(
    model="mistral-medium-3.5",
    messages=[
        {"role": "user", "content": "Scrivi una funzione Python che conta le parole in un testo."},
    ],
)

print(risposta.choices[0].message.content)

Il risultato atteso è una funzione Python pulita, con una breve spiegazione. La compatibilità con la libreria di OpenAI rende il passaggio da un fornitore all'altro questione di poche righe.

Pro, contro e a chi conviene

Mistral Medium 3.5 è la scelta più interessante per chi vuole un modello capace ma aperto: ottimo per aziende europee attente alla sovranità del dato, per chi sviluppa applicazioni di coding e per chi vuole sperimentare il fine-tuning sui propri dati. Le Chat e Vibe offrono un ecosistema completo e curato. Lo svantaggio principale è l'hardware: la versione locale non è alla portata del singolo utente, e per le prestazioni di assoluta frontiera modelli chiusi come Claude o GPT restano spesso avanti. Per iniziare, però, bastano cinque minuti su Le Chat.