Cosa significa essere open source per un modello IA?

Altri modelli come Mistral 8x7B sono invece open source, e poi ci sono i modelli come Pythia o Bloom, che sono completamente open source, in quanto comprendono i dati di addestramento e i dataset.

Per essere open source, un modello deve consentire l'accesso ad altri due aspetti : il codice sorgente e, in un mondo ideale, i dati di addestramento .

Ma cosa significa esattamente quando un modello IA diventa open source? La domanda sembra banale, ma non lo è. La maggior parte dei modelli che si definiscono "aperti" non sono open source, ma consentono di modificare solo i pesi, ovvero i parametri pre-addestrati, per affinare il modello su operazioni specifiche.

xAI spiega di aver rilasciato sotto licenza Apache 2.0 una versione di Grok che include i "pesi del modello di base e l'architettura di rete" del "modello Mixture-of-Experts di 314 miliardi di parametri, Grok-1". Questo modello proviene da un checkpoint dello scorso ottobre e non è stato sottoposto a messa a punto "per qualsiasi applicazione specifica, come il dialogo".

Cosa significa esattamente? In pratica il modello è realmente open source, ma non completamente, in quanto è consentito l'uso commerciale ma non sono stati inclusi i dati utilizzati per addestrarlo. Inoltre mancano le connessioni a X per ottenere i dati in tempo reale.

Al momento se volete utilizzare Grok dovete essere abbonati a X, e a novembre 2023 xAI aveva scritto in un post che il chatbot è destinato agli usi relativi alla generazione di codice, alla scrittura creativa e alla risposta alle domande.

Chi l'ha provato però non ne è rimasto impressionato. Addirittura The Verge ha scritto "Grok non ha senso di esistere".