Google Gemini: cos'è e come provarlo

Google Gemini (precedentemente Bard) è la risposta a ChatGPT. In realtà Gemini è anche qualcos'altro, perché in pieno stile Google c'è un po' di confusione: facciamo chiarezza!
Alessandro Nodari
Alessandro Nodari
Google Gemini: cos'è e come provarlo

L'intelligenza artificiale ha colto tutti di sorpresa, persino i suoi stessi creatori, e se Microsoft ha cambiato in corsa del suo chatbot IA Bing Chat in Copilot, anche Google ha effettuato un cambiamento di marchio, rinominando Bard e Duet (le funzionalità IA per Workspace) in Gemini. 

Quindi il nuovo chatbot di Google ora si chiama Gemini: ma cos'è e come provarlo? Andiamo a scoprire tutti i dettagli di questo strumento, che non solo si pone come seria alternativa a ChatGPT, ma sui telefoni promette anche di sostituire Assistente Google (anche se al momento questa funzione in Italia non è disponibile). 

E per chi vuole di più, è disponibile anche Gemini Ultra tramite un chatbot chiamato Gemini Advanced: scopriamo cosa comporta e quanto costa, ma non prima di ricordarvi il nostro approfondimento su come usare ChatGPT.

Indice

Cos'è Google Gemini

Con Gemini, Google ha semplificato le cose: non solo Gemini è il nuovo chatbot IA dell'azienda, che sostituisce dopo un anno Google Bard e Duet AI (l'IA pensata per le funzionalità Workspace), ma anche il modello IA che lo alimenta, disponibile nelle versioni Nano, Pro e Ultra. 

E non basta: Gemini è anche un'app per Android (in iOS integrata nell'app Google) che può sostituire l'Assistente Google, in modo da aiutarvi a creare, cercare o impartire comandi tramite l'intelligenza artificiale generativa. 

Cominciamo però dall'inizio.

Come per Bard, alla base di Gemini ci sono due tecnologie: una rete neurale chiamata Transformer e un modello linguistico di grandi dimensioni (LLM) chiamato LaMDA, basato su di essa. 

Tutti i modelli di linguaggio si basano su reti neurali, in genere ricorrenti, ma Transformer, introdotto nel 2017, è un'innovativa architettura che oltre a offrire elevate prestazioni computazionali e una maggiore precisione, è in grado di visualizzare altre parti di una frase su cui la rete sta lavorando, ottenendo così informazioni su come le informazioni viaggiano attraverso la rete stessa e fornendo così una migliore comprensione del testo.

LaMDA (Language Model for Dialogue Applications) è stato invece annunciato nel 2021 ed è un modello come GPT-3.5, allenato sui dati dal Web.

Google Gemini: cos'è e come provarlo

Rappresentazione grafica del modello LaMDA. Fonte: Google

La differenza principale è che lo strumento di Google non è stato solo addestrato su testo, ma in modalità multimodale, quindi anche su immagini, audio, video e codice allo stesso tempo, mentre normalmente si aggiunge un altro modello separato allenato su questi dati.

Il tutti dovrebbe in teoria consentire di "comprendere" le domande in maniera più intuitiva.

Lo strumento è rimasto in fase prototipale, e Google nel 2023 ha presentato il suo successore, PaLM 2, il modello poi usato per "dare vita" a Bard.

Nel frattempo però lo sviluppo di LaMDA è continuato, andando a confluire in Gemini, il nuovo modello della GrandeG che a dicembre 2023 è stato annunciato al mondo e che è poi stato integrato in Bard, sostituendo così PaLM 2. 

Ma Google non ha lavorato solo a un modello. Come OpenAI ha sviluppato due versioni di GPT, GPT-3.5 per tutti gli utenti (ChatGPT) e GPT-4 per chi ha bisogno di maggiori funzioni ed è disposto a pagare (abbonamento ChatGPT Plus), cosi Google ne ha sviluppati ben tre:

  • Gemini Nano è progettato per funzionare localmente su smartphone e altri dispositivi mobili, il che dovrebbe permettere al telefono di rispondere a semplici richieste e fare cose come riassumere il testo molto più velocemente che se dovesse connettersi a un server esterno. Per ora, Gemini Nano è disponibile solo su Google Pixel 8 Pro e alimenta funzionalità come le risposte intelligenti in Gboard.
  • Gemini Pro offre un equilibrio tra scalabilità e prestazioni. È progettato per essere utilizzato per una varietà di compiti diversi. Gemini Pro è stato integrato a dicembre in Bard e ora è il modello alla base di Gemini disponibile per tutti. In test indipendenti, Gemini Pro ha raggiunto una "precisione vicina ma leggermente inferiore al corrispondente modello GPT 3.5 Turbo".
  • Gemini Ultra è il modello più grande progettato per le attività più complesse. Nei benchmark LLM come MMLU, Big-Bench Hard e HumanEval, ha sovraperformato GPT-4 e in benchmark multimodali come MMMU, VQAv2 e MathVista, ha superato GPT-4V (una versione di GPT-4 addestrata come Gemini su testo e immagini insieme).

A febbraio 2024, poi, la GrandeG ha rilasciato il suo modello Gemini Ultra 1.0, ha rinominato Bard in Gemini (che se basato sul modello Gemini Ultra diventa Gemini Advanced) e rilasciato una nuova app per dispositivi mobili: andiamo a scoprire tutti i dettagli.

Nel complesso, Google ha fatto con Gemini quello che Microsoft ha fatto con Copilot: ha integrato il suo strumento AI in tutto l'ecosistema, con l'idea di renderlo il centro dell'esperienza utente. 

Cos'è Gemini Pro

Gemini Pro è il modello IA "per tutti" di Google, lanciato a febbraio 2024 nella sua versione 1.0 e disponibile di default nella versione gratuita di Gemini, in oltre 40 lingue e 230 Paesi. Questo significa che potete accedervi sia da Web, attraverso il sito dello strumento, che da app per Android (Gemini) e iOS (Google), ma queste ultime al momento solo negli Stati Uniti.  

Il modello era stato implementato già per Google Bard, e poi con il cambio di nome del chatbot in Gemini è stato ulteriormente affinato. 

Ma quali sono le caratteristiche di Gemini Pro? Come abbiamo detto, è basato sul modello LLM LaMDA e come dichiarato da Google continua a imparare "leggendo" miliardi di parole che lo aiutano a individuare i pattern che compongono il linguaggio.

Questo gli consente di capire e rispondere alle domande seguendo pattern linguistici comuni, continuando a imparare da prompt, risposte e feedback

I vantaggi di Gemini Pro rispetto al precedente modello di Bard, Palm 2, sono il fatto di essere multimodale, il che gli consente di gestire diversi tipi di dati in maniera più "intuitiva", perché addestrato nativamente, ed è integrato nell'ecosistema Google, spaziando da strumenti come la Ricerca Google, Chrome, l'Assistente Google e le app Android, oltre che le app Workspace. 

PaLM 2, di contro, è più specializzato nell'elaborazione del linguaggio, con prestazioni superiori nella comprensione e nella generazione del linguaggio. Inoltre mostra capacità eccezionali nel ragionamento multi-step e nella risoluzione di problemi complessi, il che lo rende adatto a una vasta gamma di applicazioni basate sulla lingua, tra cui la creazione di contenuti e l'intelligenza artificiale conversazionale.

Nondimeno, Google ha deciso di portare avanti la soluzione Gemini, anche perché le ha permesso di implementare soluzioni scalabili, dal modello on-device Gemini Nano a quello a pagamento Gemini Ultra.

Gemini Pro quindi è in grado, attraverso il chatbot Gemini, di rispondere alle vostre domande in modo conversazionale, e può inoltre generare codice, accedere alle API per integrarsi con ambienti di sviluppo come Google AI Studio e Vertex AI, supportare la comprensione multilingue (40 lingue), effettuare ricerche di mercato, analizzando grandi volumi di dati, e cimentarsi in scrittura creativa e narrazione.

Gemini Pro quindi è implementato su Gemini da Web e nell'app omonima per Android, dove può sostituire Assistant (in iOS è nell'app Google).

Per quanto riguarda quest'ultimo, le funzionalità di Gemini non cambiano in quanto è integrato in app come Gmail e Docs e serve per redigere un'email, organizzare un foglio di calcolo e svolgere altre attività legate al lavoro.

Su Web, Gemini Pro offre alcune caratteristiche interessanti. Innanzi tutto, Google ha implementato la doppia verifica dei risultati. Questa funzione funziona in maniera molto semplice: dopo aver effettuato una ricerca, si può premere sull'icona "G" in fondo al risultato, il che permetterà al chatbot di valutare se sul Web ci sono contenuti che confermano la sua risposta.

In caso affermativo, verranno evidenziate delle frasi nella risposta. Cliccandoci sopra potrete vedere la fonte da cui è stato estratto il contenuto ed eventualmente visitarla per saperne di più, in modo da capire se sia in contraddizione con quelle trovate nella ricerca. 

Un altro strumento di Gemini Pro è l'integrazione con il modello Imagen 2 per la generazione di immagini, che consente al chatbot Gemini di creare un'immagine a partire da testo (solo in inglese e in alcune parti del mondo, ma non in Italia).

Nell'app per Android, Gemini sostituirà Assistente Google, ma non completamente. Se infatti, come potete vedere qui, dopo aver installato l'app sul vostro telefono acconsentite a sostituire l'assistente vocale, Gemini potrà rispondere alle vostre domande e fare le seguenti cose:

  • Creare o modificare allarmi e timer
  • Effettuare telefonate, inviare messaggi e leggere i messaggi in arrivo
  • Controlla il tuo dispositivo, come accendere la torcia o il Bluetooth, o aprire un'app
  • Controlla le luci, la sicurezza domestica e altri dispositivi domestici intelligenti 
  • Trasmettere messaggi su dispositivi connessi in casa
  • Leggi una pagina web ad alta voce (Pixel 8 o successivo)
  • Ottieni aiuto con il tuo Pixel dicendo "Aiutami con il mio Pixel" (Pixel 8 o successivo)

Gemini però non potrà accedere ad alcune funzioni, come:

  • Provider di servizi multimediali: podcast, notizie e stazioni radio e fornitori di musica di terze parti non sono attualmente supportati in Gemini.
  • Routine: l'avvio di una routine in Gemelli non è supportato. Sui telefoni Android, le scorciatoie per avviare una routine e le routine collegate agli allarmi nell'app Orologio non funzionano più, ma si può ancora iniziare una routine con l'Assistente Google sui dispositivi domestici, come gli altoparlanti e i display intelligenti.
  • Promemoria: torna all'Assistente Google per impostare promemoria e attività.
  • Modalità Interprete: torna all'Assistente Google per utilizzare la modalità Interprete

Cosa sono Gemini Ultra e Gemini Advanced

Gemini Ultra è il livello successivo del modello di Google, come GPT-4 rispetto a GPT-3.5. Lanciato nella versione 1.0 a febbraio 2024, Gemini Ultra è pensato per supportare piattaforme più complesse rispetto a Gemini Pro.

Una delle caratteristiche principali di Gemini Ultra rispetto al modello gratuito è non solo la maggiore velocità, ma anche il fatto di essere il primo modello a superare gli esperti umani nel test MMLU (massive multitask language understanding), che utilizza una combinazione di 57 argomenti - tra cui matematica, fisica, storia, legge, medicina ed etica - per testare le conoscenze e le capacità di risoluzione dei problemi.

Gemini Ultra è pensato per operazioni più complesse, e infatti è in grado di elaborare, codice, immagini, audio e video senza soluzione di continuità, fornendo una comprensione del contesto senza precedenti.

Il modello presenta inoltre caratteristiche di ragionamento e pianificazione avanzati, che gli consentono di analizzare situazioni complesse, trarre inferenze e generare piani a lungo termine con notevole precisione.

Lo strumento è particolarmente ferrato nella comprensione e generazione del codice in vari linguaggi, basato su specifiche o esempi, oltre a continuare a imparare e migliorare da nuovi dati e feedback. 

Google ha quindi rinominato anche il chatbot che si avvantaggia della potenza di uno strumento così avanzato, che infatti è accessibile utilizzando Gemini Advanced.

Grazie a Gemini Ultra, Gemini Advanced è in grado di svolgere compiti altamente complessi come la programmazione, il ragionamento logico, la possibilità di seguire istruzioni complesse e collaborare a progetti creativi.

Gemini Advanced non solo permette di avere conversazioni più lunghe e dettagliate, ma comprende anche meglio il contesto delle richieste precedenti.

Questo gli consente di aiutare gli utenti in diversi contesti, dalla creazione di un piano di studio a quiz esemplificativi in base allo stile di apprendimento nel settore educativo, all'assistenza di sviluppatori nello sviluppo di un progetto di programmazione, all'assistenza di creator digitali nel generare contenuti sempre nuovi e di imprenditori con analisi di tendenze di mercato.

Gemini Advanced è disponibile dall'8 febbraio 2024 in più di 150 Paesi e territori (inclusa l'Italia) solo in lingua inglese, e col tempo verrà esteso ad altre lingue.

Ma Gemini Advanced non è gratuito: è infatti disponibile come parte di un nuovo piano Google One chiamato AI Premium che costa 21,99 euro al mese, con due mesi di prova senza costi. Potete iscrivervi da qui.

Questo piano è in pratica il piano Google One Premium da 9,99 euro al mese don 2 TB di spazio con in più Google Advanced, e a breve permetterà anche di utilizzare Gemini in Gmail, Documenti, Presentazioni, Fogli e altro (dove sostituirà Duet AI).

Duet AI infatti diventerà Gemini for Workspace per gli utenti con piano Google One AI Premium, mentre per i clienti Google Cloud Duet AI diventerà Gemini per aiutare le aziende ad aumentare la produttività.

Quanto costa Google Gemini

Come abbiamo visto, Google crede così tanto in Gemini da averlo integrato in tutte le sue piattaforme: dal Web ai dispositivi Android all'Assistente Google ai servizi come Gmail e Workspace.

Ma quanto costa Gemini? Abbiamo già risposto a questa domanda. Si potrà utilizzare Gemini con il modello Gemini Pro gratuitamente da Web e app omonima su Android o Google su iOS (solo negli Stati Uniti, al momento su iOS non è ancora disponibile).

Per chi vuole di più, c'è Gemini Advanced che si avvale del modello Gemini Ultra 1.0. Questo chatbot fa parte di un nuovo piano Google One da 21,99 euro al mese con i primi due mesi gratuiti, chiamato Google One AI Premium e al momento disponibile solo in inglese.

Google Gemini: cos'è e come provarlo

Che differenza c'è tra Gemini e Bard

Abbiamo quindi visto come Bard sia stato rinominato in Gemini, ma qual è la differenza? Per gli utenti gratuiti, non cambierà molto.

Accedendo al sito di Google Bard, si verrà reindirizzati automaticamente a quello di Gemini, e si verrà accolti da una schermata di introduzione che spiega come ora Bard si chiami Gemini. Le funzionalità restano le stesse, e miglioreranno nel tempo, assicura Google.

Google Gemini: cos'è e come provarlo

Ma sotto c'è molto di più. Se infatti a fine 2023 Bard aveva potuto già avvantaggiarsi del nuovo modello Gemini Pro e del suo approccio multimodale per una migliore comprensione del contesto, ora Google ha aggiornato il modello, che è stato migliorato con la comprensione di 40 lingue e rilasciato una versione più avanzata, Gemini Ultra.

Per accedere a questo strumento è stato introdotto il chatbot Gemini Advanced, disponibile per il momento anche in Italia ma solo in inglese. 

L'altra novità è che ora Gemini non è solo limitato al Web, ma, almeno negli Stati Uniti, è diventato un'app per Android e sostituisce (almeno fino a un certo punto) l'Assistente Google.

Se quindi prima Bard era "solo" un chatbot IA con ambizioni di integrarsi con l'assistente vocale della GrandeG, ora Gemini è entrato di prepotenza in tutto l'ecosistema Google, rendendolo di colpo uno dei prodotti più importanti dell'azienda.

Come usare Google Gemini in Italia

Ora che abbiamo visto cosa sia Gemini, vediamo come provarlo. Sostanzialmente, usare Gemini online è come usare Google Bard. Per prima cosa, andate all'indirizzo di Gemini, poi cliccate sul pulsante Accedi ed effettuate l'accesso con il vostro account Google. 

Nel caso sbagliaste e per abitudine andaste sul sito di Bard, nessuna paura, verrete reindirizzati automaticamente a quello di Gemini, e se avete già effettuato l'accesso a Google vi verrà mostrato un messaggio in cui vi si avverte che Bard ora si chiama Gemini. Cliccate su Fine o sulla "X" in alto a destra e siete pronti a iniziare. 

Nella schermata iniziale non c'è molto. In alto a sinistra trovate l'icona con tre linee orizzontali che vi permette di espandere la scheda laterale.

Qui trovate, dall'alto verso il basso, il pulsante "+" Nuova chat, che cancellerà la conversazione attuale e ne inizierà una nuova.

Subito sotto, in caso abbiate effettuato ricerche con Bard e non le abbiate cancellate, troverete la cronologia delle conversazioni, poi la Guida, le Attività e le Impostazioni, che vi consentono di accedere ai link pubblici (chat che avete condiviso con altri), cambiare tema e attivare le risposte in tempo reale. 

Al centro c'è il messaggio di benvenuto e sotto alcuni suggerimenti per iniziare. Subito sotto, un avvertimento che spiega come le conversazioni con Gemini saranno monitorate, quindi di non inserire informazioni personali

In basso, c'è il campo di ricerca, ce presenta sulla destra un'icona a forma di immagine (per caricare un'immagine e usarla per la richiesta tramite l'integrazione di Gemini con Lens) e quello del microfono, per effettuare una richiesta vocale. 

Le vostre richieste (le conversazioni non sono salvate) appariranno al centro della finestra di chat e potete fermare Gemini in caso stia dando risposte troppo lunghe cliccando a destra del campo di ricerca sul pulsante a forma di quadrato.

Dopo che il chatbot AI ha risposto alla domanda, vedrete in alto il menu a tendina Mostra bozze, che consente di visualizzare altre bozze per ogni risposta. A destra in alto c'è un'icona a forma di altoparlante, Ascolta che consente di ascoltare la risposta di Gemini invece di leggerla.

Le risposte possono presentare dei link per mostrare le fonti e permettere di saperne di più, e sotto gli argomenti correlati alla ricerca. In basso trovate le icone pollice su e pollice giù per esprimere un voto positivo o negativo, mentre se cliccate sull'icona con tre cursori, a destra di pollice giù, potete accedere a un menu per modificare la risposta e renderla più breve, più lunga, più semplice, più informale e più professionale. 

Google Gemini: cos'è e come provarlo

L'icona di condivisione ("<") vi permette di condividere la chat, esportarla in Documenti e allegarla come bozza in Gmail, mentre se cliccate sulla "G" colorata attiverete la verifica dei risultati, che evidenzierà alcuni passaggi della risposta: se ci cliccate sopra, potrete accedere a contenuti simili che consentono di verificare la correttezza di una risposta.

Cliccando sull'icona con tre puntini verticali, potete infine copiare la chat o segnalare un problema

Nel nostro esempio, abbiamo chiesto quando è stato presentato Xiaomi 14, e come vedete le risposte sono quasi soddisfacenti. Quasi, perché se la data di presentazione in Cina è corretta e anche quella futura per la versione globale, Gemini si riferisce al 25 febbraio al passato (è stato presentato), mentre la data attuale è il 9 febbraio. Piccolezze, ma giusto notarle. 

Infine, in alto a destra troverete l'icona del vostro account Google. 

Come abbiamo anticipato, purtroppo con Gemini in Italia non potete creare immagini, mentre negli Stati Uniti sì. Lo strumento funziona esattamente come ChatGPT Plus o Copilot: scrivete semplicemente un prompt per generare l'immagine che vorreste vedere nella stessa finestra di chat.

Una volta generata, l'immagine (ne verrà creata più di una tra cui scegliere) può essere scaricata e condivisa.

In generale, Gemini risponde sulla base di informazioni che già conosce o che ottiene da altre fonti, come i servizi Google, e imparerà dalle vostre risposte e feedback. Google ricorda che Gemini può sbagliare e non può sostituire persone importanti nella vostra vita, come familiari, amici, insegnanti o medici, non può fare il vostro lavoro e non può prendere decisioni importanti per voi.

Download APK Google Gemini

Abbiamo più volte ribadito il fatto che l'8 febbraio Google non ha presentato solo il nuovo Gemini, ma ha anche lanciato un'app per Android che consente di utilizzare il chatbot IA al posto di Assistente Google.

Dopo aver scaricato l'app e aver effettuato l'accesso, Gemini diventerà l'assistente principale del telefono, e potrete accedervi da una nuova scorciatoia o attraverso i punti di accesso esistenti dell'Assistente Google (ad esempio il pulsante di accensione su telefoni selezionati, il passaggio dell'angolo o "Ehi Google").

Per poterla utilizzare, dovete avere un dispositivo Android con 4 GB di RAM o più e Android 12 o superiore.

Come abbiamo spiegato, molte funzioni vocali dell'Assistente Google saranno disponibili attraverso l'app Gemini, tra cui l'impostazione di timer, l'effettuazione di chiamate e il controllo dei dispositivi per la smart home, e Google sta lavorando per aggiungerne altre in futuro.

Su iOS, Gemini è integrato nell'app Google: bisognerà (quando disponibile) toccare il tasto Gemini che troverete qui e potrete avviare una chat con il chatbot (su iOS non sostituirà l'assistente vocale).

Queste funzioni sono in via di distribuzione anche in Italia, almeno per quanto riguarda l'app Android, e potete provarle in anticipo, in italiano, scaricando l'ultima versione da APK Mirror (nel momento in cui scriviamo l'app non si può ancora scaricare dal Play Store). 

Andate a questo indirizzo, scorrete verso il basso e cliccate sulla freccia verso il basso a destra di Google Gemini 1.0.605683889 (o successive).

Nella pagina successiva scorrete verso il basso e cliccate nuovamente sulla freccia verso il basso a destra della variante Google Gemini 1.0.605683889 (o successive). 

Poi nella pagina successiva scorrete verso il basso e toccate il pulsante Download APKProcedete comunque, anche se venite avvisati del potenziale pericolo e se vi viene chiesta l'autorizzazione di installare app dal browser, toccate Autorizza e attivate l'interruttore corrispondente, poi procedete con l'installazione. 

Adesso avviate Gemini (l'icona a forma di stella) e toccate in basso a destra Inizia. Nella pagina successiva, scorrete verso il basso e leggete cosa può fare lo strumento, poi toccate in basso a destra Acconsenti.

Google Gemini: cos&#039;è e come provarlo

Apparirà la schermata iniziale del chatbot, sostanzialmente una versione portatile di Gemini da Web. Al centro della pagina, vi verrà proposto di aggiungere il widget alla home: scegliete se farlo o meno.

Adesso potete utilizzare Gemini come qualsiasi altro chatbot IA: fate domande, anche vocali, aggiungete immagini o quello che desiderate, anche in italiano. 

Ma la novità è che su Android sostituisce l'Assistente Google, con alcune limitazioni, quindi usando la frase Hey Google richiamerete il nuovo chatbot IA, ora in italiano (per un breve periodo è stato disponibile solo in inglese e bisognava cambiare lingua dell'Assistente).

Nel caso vogliate tornare a utilizzare Assistente Google, e in italiano, potete aprire l'app Gemini, toccate l'icona del vostro profilo in

Nel caso vogliate tornare a utilizzare Assistente Google, e in italiano, potete aprire l'app Gemini, toccate l'icona del vostro profilo in alto a destra e selezionate Impostazioni. 

Nella pagina che si apre, toccate Assistenti digitali di Google e selezionate Google Assistant, per poi toccareDisattiva (curiosamente al momento il titolo della pagina non è ancora tradotto).

Purtroppo, se fate così non potrete continuare a utilizzare Gemini neanche da app, che quindi su Android è legata indissolubilmente alla sostituzione dell'Assistente. A questo punto dovrete accedere al sito per usarlo. 

Google Gemini: cos&#039;è e come provarlo

C'è però un aspetto curioso. Se installate l'app Assistente Google, noterete due icone per Gemini, e il motivo è perché Google ha aggiornato l'"app" per l'Assistente con lo stesso nome e logo di Gemini. Se le toccate, funzionano entrambe allo stesso modo, quindi si può eliminarne una. 

Ma quale? In teoria è consigliato eliminare quella che è usata come scorciatoia per l'Assistente. Per capire quale sia, bisogna toccare e tenere premuta l'icona di una delle due app, poi toccare l'icona con la "i". Ora entrerete nella pagina delle informazioni dell'app: se si chiama Gemini, non toccatela, mentre se si chiama Assistente Google, potete toccare Disinstalla ed eliminarla.

Google Gemini: cos&#039;è e come provarlo
Mostra i commenti