Un nuovo generatore IA di immagini gratuito e incredibile: come usare FLUX.1

Midjourney, DALL-E e Stable Diffusion hanno un nuovo concorrente: FLUX.1. Ecco perché devi iniziare a usarlo subito!
Alessandro Nodari
Alessandro Nodari
Un nuovo generatore IA di immagini gratuito e incredibile: come usare FLUX.1

Midjourney, DALL-E, Stable Diffusion: fatevi da parte. C'è un nuovo modello IA per la creazione di immagini a partire da testo, FLUX.1 AI.

Ma cos'è e come funziona FLUX.1 AI? Andiamo a scoprirlo, perché questo modello, open source e sviluppato da ex membri del team di Stability AI, non solo è disponibile gratuitamente, ma per qualità delle immagini (anche con testi) è in grado di tenere testa a modelli come Midjourney v6.1.

Questo modello, che si propone quindi come un nuovo punto di riferimento nel settore delle immagini (e dell'arte) creata tramite IA, ha un'altra caratteristica: non è censurato. Quindi consente di generare immagini protette da copyright (ma non esplicite). Vediamo come funziona, quali sono le sue varianti e come usarlo gratuitamente.

Indice

Cos'è FLUX.1

FLUX.1 è un modello di intelligenza artificiale da testo a immagine, ovvero in grado di generare immagini altamente dettagliate a partire da descrizioni scritte.

Il modello è stato creato da Black Forest Labs, una società fondata da un gruppo di sviluppatori provenienti dal team originale di Stable Diffusion e da diversi ex ricercatori di Stability AI.

Black Forest Labs, che come Stability AI si dedica allo sviluppo di modelli multimodali di alta qualità e di renderli open source, vuole "spingere i confini della creatività, dell'efficienza e della diversità" per quanto riguarda la generazione di immagini e video.

La società a fine agosto 2024 ha completato un round di finanziamenti da ben 31 milioni di dollari, e si propone come un attore di primo piano nel settore della generazione di immagini.

Forte di tre modelli, destinati a differenti scopi e utenti, si propone come il nuovo "stato dell'arte nella sintesi delle immagini". Scopriamo perché. 

Perché usare FLUX.1

Immagine creata con FLUX.1

FLUX.1 AI è quindi in grado di generare immagini da testo, ma perché dovrei preferirlo ad altri strumenti più popolari come DALL-E, Midjourney o Stable Diffusion?

Secondo i suoi creatori, i modelli FLUX.1 stabiliscono nuovi standard nelle rispettive classi: FLUX.1 [pro] e [dev] superano modelli popolari come Midjourney v6.0, DALL·E 3 (HD) e SD3-Ultra in ciascuno dei seguenti aspetti: qualità visiva, precisione nel seguire il prompt, variabilità di dimensioni/aspetto, tipografia e diversità di output.

Inoltre FLUX.1 è incredibilmente veloce rispetto ai modelli concorrenti: in meno di 2 secondi è possibile ottenere un'immagine. 

Generazione di testo

La generazione di testo leggibile è senz'altro una delle caratteristiche più interessanti, in quanto solo con Stablet Diffusion 3 e Midjourney v6 i modelli IA hanno iniziato a essere convincenti da questo punto di vista.  

FLUX.1 IA però porta questo aspetto a un altro livello, e con il prompt giusto si possono facilmente controllare carattere, dimensioni, colore e posizionamento del testo.

Con questo modello si possono creare poster, modelli di copertine di libri, loghi e molto altro. La ricchezza di opzioni, sia per uso personale che professionale, è enorme.

Capacità di seguire prompt complessi

Un'altra caratteristiche di FLUX.1 AI è la capacità di seguire con precisione i prompt complessi. Uno dei problemi dei modelli che generano immagini a partire da prompt, infatti, è riuscire a seguire con precisione prompt lunghi e dettagliati, che spesso portano a  ignorare una parte del prompt o comunque l'idea del creatore.

Per aggirare questo problema in genere si utilizzano pesi o la scala CFG (classifier-free guidance scale), un parametro che controlla quanto il processo di generazione dell'immagine segue il prompt del testo, ma con FLUX.1 non è necessario regolare alcun parametro. 

Si possono inserire scene con più elementi, stili artistici specifici e istruzioni compositive dettagliate, il tutto in un unico prompt, con la certezza che l'output corrisponderà strettamente alla loro visione.

Ad esempio, un interior designer può specificare una disposizione della stanza con dettagliate disposizioni di mobili, schemi di illuminazione, tavolozze di colori e dettagli architettonici.

Capacità di creare immagini in tutte le forme e stili

FLUX.1 è in grado di padroneggiare tutti i tipi di stili, dai ritratti fotorealistici alla pixel art, dai progetti architettonici agli anime.  

Non solo, ma riesce rendere dettagli complessi come mani o piedi in maniera estremamente naturale, e grazie alla sua variabilità riesce a non far sembrare immagini diverse tutte simili tra loro: ogni creazione sembra unica.

Certo, non è perfetto al 100%, ma grazie al fatto di essere open source si appoggia anche al supporto della comunità. 

Come funziona FLUX.1

Immagine creata con Flux.1

Cosa rende FLUX.1 AI così eccezionale? L'utilizzo di una tecnica chiamata trasformatori di flusso rettificati (Rectified Flow Transformers), che consente di preservare i dettagli in maniera incredibile durante il processo di diffusione.

Qui puoi trovare un articolo che spiega molto bene come funzionano i trasformatori di flusso rettificati, che sono utilizzati anche in Stable Diffusion 3, mentre qui puoi trovare la nostra spiegazione su come funziona un modello di diffusione

In pratica, i flussi rettificati sono un costrutto matematico che, applicando una funzione di rettificazione (rectification function), consente al modello di imparare il processo di diffusione inversa (l'ODE).

Sfruttando i flussi rettificati, il modello può catturare efficacemente la traiettoria complessa dalla distribuzione del rumore alla distribuzione dei dati.

Il che gli consente di perfezionare le sue previsioni in più passaggi, portando a migliorare le prestazioni di generazione delle immagini con meno rumore e sfocatura.

Quindi immagini più nitide e precise, quindi di maggiore qualità rispetto ai modelli di diffusione precedenti, oltre che estremamente realistiche. 

Quali sono le versioni di FLUX.1

Come abbiamo anticipato nei capitoli precedenti, FLUX.1 offre tre versioni: [pro], [dev] e [schnell]. Che differenze ci sono tra loro?

[schnell] è la variante open source, veloce e potente, disponibile con una licenza Apache 2.0. Progettata per generazioni rapide e accessibilità, è il modello più veloce, su misura per lo sviluppo locale e l'uso personale.

Come per FLUX.1 [dev], i suoi pesi sono disponibili su Hugging Face e il codice di inferenza può essere trovato su GitHub. FLUX.1 [schnell] è disponibile anche tramite Replicate, fal.ai, mystic e deepinfra

[dev] è una soluzione open weight di livello aziendale che fornisce output ancora migliori, progettata per uso non commerciale. Direttamente ottenuto da FLUX.1 [pro], FLUX.1 [dev] offre una simile qualità simile, ma con un'efficienza maggiore di un modello standard delle stesse dimensioni.

Come per FLUX.1 [schnell], i pesi di FLUX.1 [dev] sono disponibili su HuggingFace e possono essere provati direttamente su Replicate, fal.ai, mystic e deepinfra. Qui trovi il codice su GitHub.

[pro] è invece il meglio di FLUX.1, un modello closed source che offre la generazione di immagini prestazionali all'avanguardia con il follow-top del prompt top-line, qualità visiva, dettagli dell'immagine e diversità di output.

Variante di punta a livello aziendale [pro] offre la possibilità di utilizzo commerciale tramite API ufficiale. Inoltre è possibile accedere a FLUX.1 [pro] tramite i partner Replicate, fal.ai e mystic.

Secondo FLUX.1, primi due modelli superano i modelli tradizionali come SD3-Ultra, mentre il più piccolo FLUX.1 [schnell] supera i modelli come Midjourney v6.0 e DALL·E 3.

Come usare FLUX.1 AI gratis

Come usare FLUX.1? La società offre diverse piattaforme per provare e usare i suoi modelli:

Vediamo qualche esempio. HuggingFace è la soluzione più semplice da cui partire, in quanto gratuita. Per usarlo, vai sul sito indicato qui sopra e inserisci nel campo di testo il prompt.

Poi clicca su Run e attendi che si liberi una GPU.

In pochi secondi, verrà generata l'immagine, che puoi scaricare cliccando sulla freccia verso il basso, in alto a destra. Cliccando in basso su Advanced Settings, puoi scegliere il numero di seed, impostare le dimensioni e il numero di passi di inferenza.

Su HuggingFace, FLUX.1 schnell ha poche restrizioni di utilizzo, ma dopo aver generato più immagini con FLUX.1 dev, ci sarà un periodo di recupero prima di poterlo utilizzare di nuovo.

Preferisci usare fal.ai? Clicca su uno dei link sopra indicati e dopo aver effettuato l'accesso con GitHub, riceverai 1 dollaro di credito, che ti consente di utilizzare FLUX.1 pro 20 volte, FLUX.1 dev 40 volte o FLUX.1 schnell 333 volte gratuitamente.

Superati questi limiti, dovrete pagare. Ecco i prezzi per fal.ai (addebitati per immagine):

  • FLUX. 1 [schnell]: 0,003 dollari per megapixel
  • FLUX. 1 [dev]: 0,025 dollari per megapixel
  • FLUX.1 [pro]: 0,05 dollari per megapixel

Anche mystic consente di usare FLUX.1 gratuitamente, in tutte e tre le varianti.

Vai a questo indirizzo e scegli un modello, poi scorri in basso e digita un input. Effettua le selezioni per regolare il modello e clicca in basso a sinistra su Run. 

Adesso dovrai registrarti cliccando su Signup for free e scegli se usare il tuo account Google o creare un account via email. 

Un altro sistema per usare FLUX.1 gratuitamente, che sia la versione schnell, dev o pro, è Poe (i modelli sono quelli ospitati su fal.ai). Per usarlo, vai sul sito del servizio, registrati e in basso a destra cliccate su Vedi tutto. In alto digita FLUX.1 e seleziona il modello dedicato, poi usatelo, oppure clicca sui seguenti link:

Come tutti i chatbot AI su Poe, ci sono dei limiti di utilizzo.

Anche Flux AI Image Generator consente di usare FLUX.1, ma gratuitamente solo FLUX.1 [schnell]. Inoltre, le immagini generate gratuitamente devono essere condivise pubblicamente.

Al momento della registrazione, riceverai 100 punti gratuiti, e avrai 5 punti disponibili ogni giorno. Ogni immagine generata consuma 1 punto.

Un altro modo per usare FLUX.1 gratuitamente è Seaart.ai, che permette di usare circa 150 crediti al giorno. Per usare il servizio, vai sul sito e clicca su Swift AI, poi seleziona Flux Text-to-image o, se preferisci, Flux Image-to-image (se vuoi creare un'immagine a partire da un'altra immagine). La prima opzione consumerà circa un credito, mentre la seconda un po' di più. 

Infine, Replicate offre tutti e tre i modelli FLUX.1, ma sono tutti a pagamento: 

  • FLUX. 1 [schnell]: 0,003 dollari per immagine
  • FLUX. 1 [dev]: 0,030 dollari per immagine
  • FLUX.1 [pro]: 0,055 dollari per immagine

Per usare Replicate, vai a questo indirizzo e seleziona un modello. Poi dovrai effettuare l'accesso con il tuo account GitHub, inserire un metodo dii pagamento e potrai inserire il prompt per generare l'immagine. 

Gruppo Facebook

Community SmartWorld +15k
Confrontati con altri appassionati di tecnologia nel gruppo segreto
Entra