ȘtiriTech&IT

Gemini Live poate acum să „vadă” conținutul ecranului și împrejurimile tale, conectându-se la camera foto

Google lansează o nouă capabilitate screen-sharing pentru Gemini Live, utilizatorii care folosesc Gemini în modul de conversație putând include și conținutul ecranului atunci când solicită ajutorul AI-ului. De asemenea, pot deschide accesul la camera foto, permițând Gemini să analizeze împrejurimile pentru a răspunde la solicitări relevante

De asemenea,  Gemini poate folosi noua opțiune screen-sharning pentru descrie conținutul ecranului pentru persoanele nevăzătoare, generând descrieri audio mai detaliate ale imaginilor. Această funcționalitate este disponibilă inclusiv pentru imaginile din mesajele text sau întâlnite pe rețelele sociale. De asemenea, nevăzătorii pot folosi camera foto pentru a obține descrieri audio detaliate ale obiectelor și împrejurimilor, generate cu ajutorul inteligenței artificiale.

Însă pentru utilizatorii de rând, opțiunea screen-sharning funcționează ca o modalitate de a da mai mult context conversațiilor purtate cu Gemini Live, permițând chatbot-ului să acționeze ca un ajutor intuitiv, ghidându-te în activitățile mai mult sau mai puțin complicate, pe care încerci să le duci la bun sfârșit în timp ce butonezi telefonul mobil sau tableta.

Demonstrate prima dată la expoziția MWC 2025 și disponibile abonaților Gemini Advanced începând cu finalul acestei luni, noile capabilități Gemini Live intră sub umbrela Project Astra, o inițiativă Google pentru lărgirea capacității de înțelegere a modelelor sale AI prin includerea unor modele mai avansate de analiză în timp real.

Potrivit unui clip demonstrativ încărcat pe Reddit, Gemini poate „ține minte” diferite părți ale conversației purtate cu utilizatorul, incluzând în discuție obiecte văzute anterior pe ecran. Totuși, s-ar părea că observația nu funcționează chiar în timp real, Gemini înghețând temporar imaginea pentru a prelua capturi de ecran pe care le analizează ulterior folosind procesare cloud. Iar de aici rezultă și o posibilă limitare, Gemini Live neputând „înțelege” la fel de bune situații dinamice surprinse pe video. Cu toate acestea, posibilitatea ca Gemini să „vadă” prin camera telefonului aproape în timp real și să-ți răspundă la întrebări nu poate fi decât o evoluție majoră pentru chatbot-ul Google, destui utilizatori urmând să găsească folositoare această capabilitate.

Aurelian Mihai

Îmi place să fiu la curent cu ultimele inovații și gadgeturi high-tech. Când nu scriu articole pentru Zona IT, îmi ocup timpul cu seriale SF, documentare sau periind internetul după tot felul de știri sau informații care-mi captează atenția. În week-end mă găsești cu bicicleta în parc sau colindând prin țară cu familia.

Articole asemanatoare

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.

Back to top button