Nel mondo dei chatbot di intelligenza artificiale (IA) per la creazione di immagini, Midjourney merita un posto d'eccezione, e l'ultimo aggiornamento, che porta lo strumento alla versione V6, ribadisce un concetto: i concorrenti devono inseguire. Perché? Prima di tutto il realismo: secondo il fondatore David Holz, Midojurney V6 rappresenta il terzo modello addestrato da zero sui loro "supercluster" di dati, e ci sono voluti nove mesi per addestrarlo. Ma c'è un'altra caratteristica estremamente importante: le scritte. Gli strumenti IA per la generazione di immagini normalmente hanno problemi a elaborare i testi (date un'occhiata alla nostra prova di Immagina con Meta per farvi un'idea). Con Midjourney V6 il problema non è completamente alle spalle, ma quantomeno attenuato e si riescono a mostrare dei testi leggibili (un po' come V5 era riuscito a risolvere la questione mani con cinque dita, un altro aspetto che i chatbot IA faticano a comprendere).

Nel complesso, ecco le nuove funzionalità di V6: Segue i prompt in maniera molto più accurata e riesce a gestire prompt più lunghi

Coerenza e conoscenza del modello migliorate

Prompt e remix delle immagini migliorati

Capacità minori di disegno del testo (è necessario scrivere il testo tra "virgolette" e utilizzare valori --style come raw o inferiori, inoltre valori - -stylize possono aiutare). Per esempio: "/imagine a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6"

come raw o inferiori, inoltre valori - possono aiutare). Per esempio: "/imagine a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6" Upscaler migliorati, con modalità sia "subtle" che "creative" (aumenta la risoluzione di 2x)" Holz ha inoltre dichiarato che hanno lavorato molto sul prompt (il testo che dovete inserire per specificare al modello cora volete che crei), sviluppando un metodo completamente nuovo. Per ottenere risultati migliori con questi strumenti, è infatti necessario essere estremamente precisi, e ci sono pagine e pagine di tutorial dove si spiega come inserendo termini come i nomi delle fotocamere (ad esempio Leica M11), della pellicola (35 mm) e la risoluzione (8k), si riescono a ottenere risultati fotorealistici o cinematografici di alta qualità. Ora cambia tutto, tanto che Holz ha dichiarato esplicitamente "Dovrete imparare di nuovo a scrivere un prompt". Con V6 il prompt è infatti molto diverso, in quanto V6 è MOLTO più sensibile. Questo significa che bisogna evitare termini ("spazzatura" è la parola usata dal fondatore del progetto) come "premium, fotorealistico, 4K, 8K". Se si vuole qualcosa di più fotografico/ o realistico, bisogna utilizzare per impostazione predefinita --style raw. Valori più bassi di --stylize (default 100) possono avere una migliore comprensione mentre valori più alti (fino a 1000) possono avere un'estetica migliore. Il nuovo modello è in test alfa e infatti non è abilitato per impostazione predefinita, inoltre manca ancora di alcune funzioni disponibili nella V5.2, come la panoramica a sinistra e a destra e lo zoom indietro, ma Holz ha detto che questi arriveranno ​​negli aggiornamenti successivi. Chi l'ha provato ha opinioni contrastanti. C'è chi è rimasto sbalordito e chi non ha rilevato sostanziali miglioramenti rispetto alla generazione precedente. Ma probabilmente è una questione di come si imposta il prompt (in fondo all'articolo trovate un confronto con tutte le versioni del modello).