Ricerca, video e assistenti digitali. Google svela le sue novità per l’AI

Condividi

AI Overviews, Project Astra che vede e parla e Veo per creare immagini. Mountain View ribatte alle novità di OpenAi. “Siamo in piena era Gemini” dice il ceo Sundar Pichai

A poche ore dalla presentazione delle novità in casa OpenAI, Google non è rimasta ferma a guardare e, dalla conferenza degli sviluppatori, ha snocciolato le sue novità per l’AI.
“Investiamo nell’intelligenza artificiale da più di dieci anni. Siamo in piena era Gemini”, ha detto il ceo Sundar Pichai, lasciando spazio ai nuovi prodotti chhe vedono la tecnologia ulteriormente inserita nella ricerca, con assistenti digitali che parlano e vedono.

Nel search

Pichai ha annunciato l’apertura “agli Stati Uniti e presto ad altri paesi” della funzione AI Overview, grazie alla quale gli utenti visioneranno risposte su domande complesse generate dall’IA.
La funzione AI Overviews utilizza l’intelligenza artificiale generativa per sintetizzare informazioni e rispondere a domande più complesse degli utenti. Nelle intenzioni, l’obiettivo è di raggruppare grazie all’IA le risposte alle domande degli utenti in maniera più veloce ed esaustiva. In più, si potranno formulare in una volta sola domande più complesse e porre questioni anche usando i video.
“Contiamo di portarlo a più di un miliardo di persone entro la fine dell’anno”, ha precisato Liz Reid a capo della ricerca Google.

Project Astra per sfidare Gpt-4o

Rispondendo direttamente a OpenAI e al nuovo Gpt-4o, Google ha presentato Project Astra, assistente digitale “multimodale” in grado di elaborare testo, voce e immagini in tempo reale mentre interagiamo, capendo anche il contesto.
Durante l’evento è stato mostrato un filmato, come esempio, in cui mentre si gira un video con uno smartphone si possono fare domande all’assistente digitale riguardanti l’ambiente circostante. L’assistente risponde con la voce in tempo reale a domande relative all’ambiente in cui si trova l’utente. Project Astra, ha spiegato Google, fa parte degli ‘AI Agents’, “sistemi intelligenti che faranno il lavoro per noi sotto la nostra supervisione”.

Veo, l’IA che genera video e sfida Sora di OpenAI

Google ha svelato poi anche Veo, l’AI che genera filmati di alta qualità in sfida a Sora. Con una comprensione avanzata del linguaggio naturale e della semantica visiva, può generare video che rappresentino con precisione la visione creativa dell’utente, cogliendo il tono delle richieste.

In campo multimediale, viene annunciato anche un avanzamanto con Imagen 3, che genera foto da testo. Infine grazie all’IA di Gemini, viene aggiornato anche Google Foto con la funzione ‘Ask’, chiedi a Foto. Nelle gallerie di immagini si potrà trovare più semplicemente una foto formulando una richiesta a voce, senza dover passare in rassegna manualmente immagini e video.
“Le vostre foto e i vostri video non vengono mai utilizzati per la pubblicità. E nessuno esaminerà le vostre conversazioni”, ha ribadito la società.

Novità in musica

Google ha annunciato anche novità musicati, con Music AI Sandbox, un insieme di strumenti che aiutano a comporre. Una mossa, grazie anche alla sperimentazione con il musicista vincitore di Grammy Wyclef Jean, per rassicurare il mondo degli artisti riguardo gli effetti dell’intelligenza artificiale sulla creatività. “Vogliamo farlo responsabilmente ascoltando il loro feedback”, ha spiegato il vice presidente Product management Eli Collins.

Gemini, inoltre, si espande anche ai luoghi di lavoro. La versione 1.5 Pro, ad esempio, entra nelle mail per un sommario oppure fornisce i momenti clou di una riunione o scrive un riassunto. Poi Gemini 1.5 Flash “più veloce e efficiente”.
Infine, Google ha svelato Trillium, la sesta generazione di processori, un acceleratore per il Cloud con l’intelligenza artificiale, “più performante e ad alta efficienza energetica”.