Cognition - la societa' che la settimana scorsa ha chiuso il round da un miliardo di dollari a 26 di valutazione - ha rilasciato a maggio Devin in Terminal, la versione CLI del suo agente di programmazione. La novita' e' inclusa senza costi extra in tutti gli abbonamenti Windsurf attivi, e completa il trittico Devin-nel-cloud, Devin-nell-IDE, Devin-da-terminale. Per gli sviluppatori italiani significa avere a portata di prompt un agente che, da uno shell qualsiasi, prende in carico un task, lo esegue in una macchina virtuale in cloud, fa girare i test e restituisce una pull request gia' pronta da revisionare.
Cosa fa esattamente
Il flusso e' semplice: si lancia devin nella radice del progetto, si descrive il task in linguaggio naturale e Devin sceglie se eseguirlo localmente o passare il lavoro al cloud. Quando il task e' complesso - patch su molti file, refactor, fix di bug con ricerca su Stack Overflow e ChangeLog - Devin lo passa a una VM remota dove ha accesso a una propria shell, a un browser headless, alla possibilita' di installare pacchetti, di eseguire test, di registrare video della sessione. Al termine apre una PR sul branch indicato.
La differenza rispetto ad altri agenti CLI come Claude Code o Codex e' che Devin non lavora in foreground: una volta passato il task in cloud, il terminale dell'utente si libera. Si lavora ad altro e si riceve la notifica quando la PR e' pronta. Il modello sottostante e' SWE-1.5, l'LLM proprietario di Cognition annunciato a marzo, che la societa' dichiara essere tredici volte piu' veloce di Claude Sonnet 4.5 sui benchmark di coding.
Come installarlo passo passo
L'installazione richiede di avere un abbonamento Windsurf attivo (Pro o superiore, a partire da 15 dollari al mese). I passi sono questi:
- Accedere a windsurf.com e copiare il token di sessione dal profilo.
- Aprire un terminale e lanciare
curl -fsSL https://windsurf.com/cli/install.sh | shsu macOS/Linux oppure scaricare l'eseguibile per Windows dalla pagina ufficiale. - Configurare le credenziali con
devin logine incollare il token. - Posizionarsi nella radice di un progetto Git e lanciare
devin init: lo strumento crea il file.devin/config.yamldove si possono specificare branch di default, comandi di test, modello preferito.
A questo punto si puo' iniziare. Un comando tipico e':
devin task "Aggiungi un endpoint POST /api/posts che valida i campi con Pydantic, scrive nel database, ritorna 201 e ha test pytest" --cloud
Devin parte, crea un branch devin/add-posts-endpoint, scrive il codice, lancia pytest, sistema eventuali errori, apre la PR sul repository GitHub o GitLab collegato e manda una notifica.
Devin Review e Quick Review
Insieme a Devin in Terminal, Cognition ha annunciato due nuove funzioni: Devin Review e Quick Review. Devin Review e' l'agente di code review automatico - integrato sia in CLI sia in IDE - che, alla creazione di una PR, lascia commenti di stile: trova problemi di logica, suggerisce refactor, controlla la coverage di test. Quick Review fa la stessa cosa ma in pochi secondi e direttamente nel terminale: utile prima del commit.
Entrambe le funzioni sono disponibili per gli utenti self-serve con due settimane di prova gratuita. Una volta scaduto, il piano e' incluso in Windsurf Pro a 15 dollari al mese.
Esempio d'uso reale
Un caso tipico per uno sviluppatore italiano e' la migrazione di un repository da Django 4 a Django 5. Sulla CLI:
devin task "Migra il progetto da Django 4.2 a Django 5.1: aggiorna requirements.txt, rinomina USE_L10N, sistema tutti i deprecation warning e fai passare i test" --cloud --branch main --max-runtime 90m
Devin clona il repository nella sua VM, aggiorna le dipendenze, applica i fix di compatibilita', esegue python manage.py test, debugga i fallimenti e apre una PR con la lista dei file modificati e un riassunto degli step. Tempo medio osservato per repository di taglia media: 30-60 minuti.
Limiti e quando non usarlo
Devin in Terminal lavora bene su task ben definiti dove esiste un metro oggettivo di successo (test che passano, lint pulito). Funziona male su problemi creativi o ambigui - design di prodotto, architettura di sistema - perche' ha la tendenza, come tutti gli LLM agentici, a accontentarsi della prima soluzione funzionante. Su codebase grandi (>500.000 righe) la scansione iniziale del repository puo' richiedere diversi minuti. E, come per tutti gli agenti, va attivata la modalita' "PR draft": le merge automatiche restano una pessima idea.
Sul fronte costi, il piano Pro a 15 dollari include un numero limitato di task in cloud al mese (la documentazione cita 200 sessioni cloud); per usi piu' intensi serve un piano Team (50 dollari per utente) o Enterprise. In confronto, Claude Code Max parte da 200 dollari al mese ma include credito molto piu' largo. La scelta dipende dal volume di task che si vogliono delegare alla macchina.




