MiniMax, il laboratorio di Shanghai noto per i suoi modelli di generazione video, ha rilasciato all'inizio di giugno 2026 il suo modello di punta a pesi aperti, MiniMax M3. La caratteristica che lo distingue e' la combinazione, rara in un modello open, di tre cose insieme: una finestra di contesto da 1 milione di token, capacita' multimodali native (immagini e video) e prestazioni di alto livello sul codice. Nelle ultime settimane i pesi sono diventati pienamente disponibili al download, e questo lo rende una delle opzioni open piu' interessanti del momento.

Cosa offre MiniMax M3

Il contesto da 1 milione di token significa che il modello puo' "tenere in testa" l'equivalente di interi codebase, libri o lunghi dossier in un'unica conversazione, senza perdere il filo. A renderlo possibile e' una nuova architettura chiamata MiniMax Sparse Attention (MSA), che secondo l'azienda accelera in modo netto sia la generazione sia la fase di lettura del contesto rispetto alla versione precedente, M2.

La multimodalita' nativa permette di analizzare immagini e video, non solo testo, in un unico modello. E' una dotazione che molti modelli open ancora non hanno, e che apre a usi pratici come l'analisi di documenti con grafici, screenshot e diagrammi.

MiniMax M3 unisce contesto lungo, multimodalita' e forza nel codice in un modello aperto.

I benchmark (con le dovute cautele)

Sui numeri MiniMax e' ambiziosa. Il modello dichiara 59,0% su SWE-Bench Pro, uno dei test piu' usati per misurare la capacita' di risolvere problemi reali di ingegneria del software, superando - secondo i dati dell'azienda - sia GPT-5.5 di OpenAI sia Gemini 3.1 Pro di Google su questo specifico benchmark. Vengono indicati anche 66,0% su Terminal-Bench 2.1 e 83,5 su BrowseComp.

Una precisazione doverosa: questi risultati sono dichiarati dal produttore, non ancora verificati da terze parti indipendenti. E' la prassi al lancio, ma vale la regola di sempre: i benchmark vanno presi come indicazione, non come verita' assoluta, finche' la comunita' non li replica. Detto questo, il fatto che un modello open punti dichiaratamente ai modelli proprietari di frontiera e' di per se' notevole.

Come provarlo: API e pesi su Hugging Face

Ci sono due strade per usare MiniMax M3. La prima, senza installare nulla, e' tramite API. Il modello e' disponibile su aggregatori come OpenRouter, con un prezzo di lancio promozionale indicato attorno a 0,30 dollari per milione di token in ingresso e 1,20 dollari per milione in uscita: cifre molto competitive rispetto ai modelli proprietari di pari livello.

La seconda strada e' scaricare i pesi da Hugging Face e farli girare in proprio, opzione adatta a chi ha bisogno di privacy totale o vuole integrarlo nei propri sistemi. Per il download si usa la riga di comando:

pip install -U huggingface_hub
huggingface-cli download MiniMaxAI/MiniMax-M3 --local-dir ./minimax-m3

Attenzione ai requisiti: un modello di questa classe richiede hardware importante, tipicamente piu' GPU di fascia data center con molta memoria. Per la maggior parte degli utenti e degli sviluppatori, l'API resta la scelta piu' pratica; l'auto-hosting ha senso per aziende con esigenze specifiche e infrastruttura adeguata.

Un esempio di chiamata API

MiniMax M3 e' compatibile con l'interfaccia in stile OpenAI, quindi si usa con la stessa libreria Python cambiando l'indirizzo del servizio e la chiave. Ecco un esempio minimo via OpenRouter:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="LA_TUA_CHIAVE"
)

risposta = client.chat.completions.create(
    model="minimax/minimax-m3",
    messages=[
        {"role": "user", "content": "Riassumi in 5 punti questo contratto e segnala le clausole rischiose."}
    ]
)
print(risposta.choices[0].message.content)

Il risultato atteso e' un riassunto strutturato in cinque punti con l'evidenziazione delle clausole critiche: un compito in cui il contesto lungo fa la differenza, perche' permette di passare al modello l'intero documento senza spezzarlo.

Perche' tutto questo conta? Perche' un modello open di livello frontiera, scaricabile e a basso costo via API, e' esattamente cio' che molte aziende cercano per non dipendere da un singolo fornitore proprietario. Non a caso, in una fase in cui alcuni modelli commerciali sono finiti al centro di restrizioni e sospensioni, l'argomento principale dei modelli a pesi aperti come MiniMax M3 e' proprio questo: una volta scaricati, nessuno puo' spegnerli da remoto.