Home Business Information Tecnology Gemma 3n, com’è la versione open source di Google del modello di...

Gemma 3n, com’è la versione open source di Google del modello di AI da usare offline

Alla base di Gemma 3n c'è il MatFormer, un'architettura che incorpora più sottostrutture in un unico modello

Set 16, 2025

Nel panorama sempre più affollato dei modelli generativi, Gemma 3n rappresenta uno spartiacque che merita un’analisi attenta. Non è soltanto l’ennesima release di Google, ma un progetto che unisce pesi aperti, funzionamento multimodale e la possibilità di essere eseguito interamente offline su dispositivi comuni come smartphone, laptop o tablet. La filosofia che sorregge questo modello è chiara: dare agli sviluppatori e agli utenti un controllo diretto sui dati, garantire privacy by design e ridurre la dipendenza dal cloud. È un cambio di paradigma che non parla solo agli addetti ai lavori, ma a chiunque veda nell’intelligenza artificiale un’infrastruttura di base, non un servizio da affittare a distanza.

Architettura e innovazioni strutturali

Alla base di Gemma 3n c’è il MatFormer, un’architettura che incorpora più sottostrutture in un unico modello. L’idea è quella delle “matrioske”: il modello più grande contiene al suo interno versioni ridotte, pronte per essere attivate quando la memoria o la potenza di calcolo non consentono l’uso completo. Questa flessibilità consente di eseguire lo stesso modello con taglie diverse, mantenendo coerenza nei risultati.

Un’altra novità è il sistema PLE (Per-Layer Embeddings), che permette di “spostare” una quota dei parametri dal cuore dell’acceleratore grafico alla CPU o persino allo storage locale. Questo significa che un modello che ha cinque o otto miliardi di parametri si comporta come un 2B o 4B in termini di memoria necessaria in RAM. È questa ingegnosità a rendere Gemma 3n davvero praticabile offline, senza hardware estremo o server dedicati.

Non è solo testo: Gemma 3n integra un encoder audio derivato dal modello universale di Google per il parlato e un encoder visivo MobileNet-V5 pensato per ridurre la latenza su dispositivi mobili. Questo rende il modello capace di affrontare input vocali, traduzioni, riconoscimento di immagini e video con tempi di risposta adeguati all’uso quotidiano. La sua vocazione multimodale è la chiave che lo differenzia dai precedenti esperimenti di intelligenza artificiale “da tasca”.

Prestazioni, taglie e applicazioni pratiche

Gemma 3n si presenta in due varianti: E2B ed E4B, che corrispondono a modelli effettivi da due e quattro miliardi di parametri, pur avendo in realtà dimensioni fisiche maggiori. La finestra di contesto arriva a 32.000 token, consentendo di gestire documenti complessi, sessioni prolungate e compiti che prima richiedevano modelli più ingombranti.

Nei test pubblici, in particolare su piattaforme come LMArena, la variante E4B ha superato la soglia dei 1300 punti, un risultato mai raggiunto prima da un modello sotto i dieci miliardi di parametri. Questo colloca Gemma 3n tra i piccoli modelli più potenti disponibili e lo rende un candidato ideale per applicazioni che richiedono equilibrio tra qualità e velocità.

La compatibilità con ecosistemi già diffusi come Transformers, MLX (su Apple), Ollama, llama.cpp e MediaPipe significa che Gemma 3n non è un progetto teorico. Può essere provato e integrato da subito, sia in ambienti mobili sia su desktop. Su un Pixel, ad esempio, è in grado di eseguire trascrizioni e traduzioni vocali senza connessione, mentre su un MacBook può affrontare analisi di testi o immagini senza inviare dati al cloud.

Conseguenze e prospettive

In un momento storico in cui la gestione dei dati sensibili è al centro delle preoccupazioni di aziende e cittadini, la possibilità di eseguire un modello AI interamente offline rappresenta un punto di svolta. Le informazioni rimangono sul dispositivo, riducendo drasticamente i rischi di esposizione accidentale o di violazioni da parte di terzi.

Gemma 3n non è propriamente “open source” secondo la definizione classica, ma open-weight: Google rilascia i pesi con una licenza che ne permette l’uso anche commerciale entro limiti di responsabilità. Questa scelta crea un ponte tra la comunità open e il mondo aziendale, aprendo possibilità di personalizzazione e distribuzione che vanno ben oltre i modelli chiusi.

Il lancio di Gemma 3n segna l’inizio di una nuova stagione per l’intelligenza artificiale distribuita. Non più soltanto grandi modelli centralizzati nei data center, ma sistemi agili, adattabili e capaci di funzionare in periferia, ovvero vicino all’utente finale. È un cambio che potrebbe ridisegnare gli equilibri fra giganti del cloud e sviluppatori indipendenti, riportando parte del potere di calcolo nelle mani degli utenti.

Google Lens, l’app che riconosce oggetti, testi e luoghi usando la fotocamera

Fotoscan di Google per digitalizzare le vecchie foto stampate eliminando riflessi e distorsioni

Snapseed, l’editor fotografico completo e intuitivo, per migliorare le immagini sullo smartphone

Google Registratore per registrare l’audio e trascrive il testo di conversazioni, lezioni e riunioni

Dark Reader, come cambiare look a ogni sito

Quando l’intelligenza artificiale diventa troppo compiacente: perché gli assistenti AI rischiano di sbagliare di più

WhatsApp prepara i nomi utente: perché la nuova funzione può diventare una corsa alla registrazione

L’IA di Google accusa due aziende tedesche di truffe mai commesse: il caso riapre il tema dell’affidabilità degli algoritmi

Chat di lavoro su WhatsApp, gli errori da evitare: cosa molti scrivono ai colleghi senza valutarne le conseguenze

Google Lens, l’app che riconosce oggetti, testi e luoghi usando la fotocamera

Fotoscan di Google per digitalizzare le vecchie foto stampate eliminando riflessi e distorsioni

Snapseed, l’editor fotografico completo e intuitivo, per migliorare le immagini sullo smartphone

Google Registratore per registrare l’audio e trascrive il testo di conversazioni, lezioni e riunioni

Kindle Scribe: più sottili, veloci e intelligenti, anche con schermo a colori

PocketBook InkPad One, il taccuino digitale per leggere ogni cosa

Lenovo Tab One, come va il tablet economico e leggero

Cuffie, TV, utensili ed elettrodomestici: le offerte tech di Lidl, Eurospin, Carrefour ed Esselunga sfidano Amazon

Oura Ring alla prova: ottimi risultati nel monitoraggio, ma restano due limiti da considerare

Euro digitale, via libera al regolamento Ue: la vera sfida è ridurre la dipendenza da Visa e Mastercard

Satispay amplia l’ecosistema: nuovi servizi, tre carte di credito, investimenti in azioni ed ETF e costi aggiornati

Windows 11, Microsoft corregge il bug che saturava la memoria dei PC

Podcast, il nuovo business italiano: quanto incassano i nomi più seguiti

Come migliorare l’indicizzazione di Windows 11 per trovare file e documenti

Come usare le sottolineature in Microsoft Word per evidenziare testi e creare moduli compilabili

Come trasformare le presentazioni PowerPoint in video da distribuire ovunque

Quali sono gli accessori smart più utili per chi va in vacanza

Pacchi danneggiati dal maltempo: quali sono i diritti dei consumatori negli acquisti online

Gemma 3n, com’è la versione open source di Google del modello di AI da usare offline

Architettura e innovazioni strutturali

Prestazioni, taglie e applicazioni pratiche

Conseguenze e prospettive

LASCIA UN COMMENTO Cancella la risposta

ULTIMI ARTICOLI

Google Lens, l’app che riconosce oggetti, testi e luoghi usando la...

Come migliorare l’indicizzazione di Windows 11 per trovare file e documenti

Kindle Scribe: più sottili, veloci e intelligenti, anche con schermo a...

Fotoscan di Google per digitalizzare le vecchie foto stampate eliminando riflessi...

Come usare le sottolineature in Microsoft Word per evidenziare testi e...