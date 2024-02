Dalle parti di Mountain View sta succedendo qualcosa di strano: neanche una settimana dopo aver annunciato Gemini 1.0, il nuovo avanzatissimo modello IA declinato nelle versioni Gemini Nano, Pro e Ultra, è già la volta del successore, Gemini 1.5 (se volete sapere cosa sia Gemini, date un'occhiata al nostro approfondimento, mentre qui potete scoprire come provarlo in anteprima, in italiano).

Stando a Google, il nuovo modello "offre prestazioni notevolmente migliorate", soprattutto per quanto riguarda la "comprensione dei contesti lunghi", tanto che Gemini 1.5 Pro è già ai livelli di Gemini 1.0 Ultra, ma necessita di meno potere computazionale.

Quindi in teoria gli utenti gratuiti potrebbero a breve accedere a funzionalità comparabili a quelle degli utenti a pagamento (il modello Pro è disponibile nel chatbot Gemini gratuito, mentre il modello Ultra è accessibile usando il chatbot Gemini Advanced a pagamento, grazie Google per confondere sempre).

Nel suo annuncio, che non prende in considerazione la versione Ultra del modello (probabilmente ancora in fase di sviluppo), Google afferma che Gemini 1.5 rappresenta una nuova generazione di LLM (Large Language Models) che "offre una svolta nella comprensione del contesto lungo" e che se al momento nella versione Gemini 1.5 Pro elabora una finestra di contesto di 128.000 token, alcuni sviluppatori sono in grado di provare già fino a 1 milione di token, "raggiungendo la finestra di contesto più lunga di qualsiasi modello di fondazione su larga scala".

I token, rappresentano i frammenti di una parola: più ce ne sono, più grande è il contesto che si può dare al chatbot nel prompt per farlo "ragionare" su un argomento. Una finestra di contesto più grande consente di elaborare documenti più lunghi e di avere conversazioni più lunghe.

Per confronto, Gemini 1.0 gestisce 32.000 token, mentre GPT-4 Turbo di Open AI ha una finestra di contesto di 128.000 token, equivalenti a circa 300 pagine di testo in un prompt.

Google ha pubblicato un articolo a supporto delle potenzialità del modello in cui spiega che Gemini 1.5 utilizza una nuova architettura mixture-of-experts (MoE), il che significa che il sistema attiva selettivamente diversi "esperti" o sottomodelli specializzati all'interno di una rete neurale più ampia per attività specifiche basate sui dati di input.

Nel rapporto, la GrandeG spiega che Gemini 1.5 offre un miglioramento sostanziale rispetto a 1.0, dicendo che supera 1.0 Pro del 28,9% in "Math, Science & Reasoning" e 1.0 Ultra del 5,2%, nelle stesse materie.

Allo stesso modo, Google confronta il nuovo modello con GPT-4 Turbo, rivelando prestazioni mediamente migliori.