Google ha appena rilasciato Gemini Pro 1.5, un aggiornamento del suo modello di intelligenza artificiale. Questa versione è più potente e può gestire grandi quantità di testo, video e audio. Ha superato il suo predecessore nelle capacità di elaborazione e comprende il senso del contenuto.
Gemini 1.5 è stato testato su un PDF di 402 pagine con la trascrizione delle comunicazioni dell’Apollo 11, trovando passaggi divertenti. Può anche rispondere a domande su scene specifiche di film. È in grado di elaborare video di un’ora, file audio di 11 ore, 700.000 parole o 30.000 righe di codice in una volta.
Questo aggiornamento è più performante grazie a una tecnica chiamata “mixture of expert” che ottimizza le prestazioni senza aumentare la potenza di calcolo. Gemini Pro 1.5 può eseguire un numero di compiti paragonabile al modello più potente, Gemini Ultra.
Gemini Pro 1.5 sarà disponibile per gli sviluppatori tramite AI Studio e Vertex AI di Google. L’azienda sta anche introducendo nuovi strumenti per l’analisi audio e video. Questo sviluppo è parte della corsa all’oro nell’intelligenza artificiale generativa, ma solleva anche preoccupazioni sui rischi. Google ha limitato l’accesso per raccogliere feedback sulla sicurezza.
Hassabis prevede ulteriori progressi nei prossimi mesi, con un approccio di mentalità da startup.