Al Summit di Alibaba Cloud del 20 maggio 2026 il team Qwen ha presentato Qwen3.7-Max, il nuovo modello di punta della famiglia, costruito esplicitamente per i compiti 'agentici': azioni di lunga durata, uso di strumenti, coding. Due numeri lo definiscono: una finestra di contesto da 1 milione di token e un output massimo di circa 64.000 token. L'API commerciale e' attiva su Alibaba Cloud Model Studio dal 19 maggio.
Cosa promette Qwen3.7-Max
Rispetto alle generazioni precedenti, Qwen3.7-Max e' tarato sull'esecuzione autonoma di compiti complessi: pianificare, chiamare strumenti esterni, mantenere il filo su sessioni molto lunghe grazie all'enorme contesto. E' la stessa direzione presa da quasi tutti i grandi modelli del 2026, ma con un posizionamento aggressivo su prezzo e disponibilita', tipico della strategia cinese di rendere l'IA capace e a basso costo.
I benchmark agentici e di coding
Sui test piu' usati per misurare le capacita' di agente e di programmazione, Qwen3.7-Max riporta circa 69,7 su Terminal-Bench 2.0 (compiti da riga di comando), 60,6 su SWE-Bench Pro (problemi software reali) e 76,4 su MCP-Atlas (uso di strumenti via Model Context Protocol). Sono risultati che lo mettono in concorrenza diretta con i modelli di frontiera occidentali sui casi d'uso da sviluppatore, pur non primeggiando ovunque.
Come provarlo gratis su Qwen Chat
Il modo piu' semplice per metterlo alla prova senza spendere e' chat.qwen.ai: creando un account gratuito si possono usare le versioni in anteprima Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview, con limiti d'uso. Basta selezionare il modello dal menu in alto, attivare se serve la modalita' di ragionamento e incollare la richiesta. Un esempio utile per saggiarne le capacita' di analisi su testi lunghi:
Agisci come analista. Ti incollo il bilancio di un'azienda (testo lungo). Estrai ricavi, utile netto e debito degli ultimi tre anni in una tabella, calcola la variazione percentuale anno su anno e segnala i tre rischi principali con una frase ciascuno.
Con un contesto cosi' ampio puoi incollare documenti di decine di pagine e aspettarti che il modello ne tenga conto per intero, senza doverli spezzare.
Accesso via API e quanto costa
Per integrarlo in un'applicazione, Qwen3.7-Max e' disponibile via API su Alibaba Cloud Model Studio e su aggregatori come OpenRouter e Together AI. Il prezzo si aggira sui 2,50 dollari per milione di token in input e 7,50 in output, con l'input in cache che scende a circa 0,25 dollari: tariffe competitive per un modello di questa fascia. Su OpenRouter l'endpoint e' compatibile con lo stile OpenAI, quindi basta cambiare base URL e nome del modello in un client esistente:
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3.7-max",
"messages": [{"role": "user", "content": "Riassumi in 5 punti i pro e i contro del lavoro da remoto."}]
}'Vale la pena ricordare che Qwen ha una lunga tradizione di rilasci open-weight per i modelli piu' piccoli della famiglia, scaricabili da Hugging Face e utilizzabili in locale con strumenti come Ollama: la versione 'Max', invece, resta accessibile via chat e API.
Quando sceglierlo (e i suoi limiti)
Qwen3.7-Max ha senso soprattutto in tre scenari: quando devi analizzare documenti molto lunghi sfruttando il milione di token di contesto; quando costruisci agenti che usano strumenti e devono ragionare su molti passaggi; e quando il budget conta, grazie a tariffe API piu' basse di molti concorrenti occidentali. La forte componente in lingua cinese e' un vantaggio per chi lavora su quei mercati.
I limiti vanno conosciuti. Sui benchmark non e' sempre il primo della classe: modelli come Claude Opus o GPT-5.5 restano avanti su alcuni test di coding e ragionamento complesso. C'e' poi il tema, per molte aziende europee delicato, di dove vengono elaborati i dati: usando l'API ufficiale su Alibaba Cloud le richieste passano per l'infrastruttura del gruppo cinese, un aspetto da valutare per documenti riservati o dati personali soggetti al GDPR. Per i casi sensibili, una buona strategia e' usare le varianti open-weight piu' piccole della famiglia Qwen direttamente in locale, rinunciando a un po' di qualita' in cambio del pieno controllo sui dati.




