Google a anunțat lansarea Gemini 2.0 Flash Thinking, o actualizare a modelului său de inteligență artificială, disponibil acum în versiune experimentală în Google AI Studio. Printre îmbunătățirile tehnice iese în evidență abilitatea de a explica raționamentul, procesul său de „gândire”, oferind utilizatorilor o fereastră deschisă în „mintea” sa.
Cu performanțe ridicate în teste standardizate de matematică și știință, Gemini 2.0 Flash Thinking este gândit să ofere o alternativă gratuită (în faza de testare) la modelele premium de pe piață, precum cele de la OpenAI. Noul model a obținut 73,3% la examenul de matematică AIME și 74,2% la benchmarkul științific GPQA Diamond.
De la AlphaGo, la Gemini 2.0 Flash Thinking
Demis Hassabis, CEO al Google DeepMind, a scris într-o postare pe X că această tehnologie are rădăcini mai vechi, începând cu programe precum AlphaGo. Cu Gemini 2.0 Flash Thinking, Google combină idei cu modele de inteligență artificială generale, antrenate pe volume uriașe de date și capabile să rezolve o gamă largă de sarcini, rezultând un instrument care nu doar rezolvă probleme complexe, dar și explică cum a ajuns la soluție.
Unul dintre aspectele deosebite ale acestui model este capacitatea sa de a procesa până la un milion de tokeni de text. Această „fereastră de context” extinsă permite analiza simultană a unor volume masive de informații, de la documente de cercetare la seturi de date complexe. Pentru cercetători și analiști, această funcționalitate poate fi extrem de utilă.
De ce contează dezvăluirea „gândirii” AI
Una dintre cele mai mari probleme în domeniul AI a fost întotdeauna lipsa de transparență. Modelele tradiționale funcționează ca niște „cutii negre”, oferind rezultate fără a explica cum au fost obținute. Gemini 2.0 Flash Thinking schimbă acest model de funcționare, arătând pașii pe care îi urmează pentru a ajunge la o concluzie. Această transparență simplifică verificarea rezultatelor de către utilizatori, crescând astfel încrederea în tehnologie.
Ca să înțelegi ce înseamnă dezvăluirea „gândirii” AI m-am conectat la model, și l-am întrebat simplu „Înțelegi limba română?”. A răspuns la fel de simplu „Da, înțeleg limba română”, dar dacă extinzi „căsuța” Thoughts explică cum a gândit. Captura de ecran te va ajuta să înțelegi mai bine modul de funcționare al Gemini 2.0 Flash Thinking.
Poate nu pare mare lucru, ținând cont că prima întrebare a fost extrem de simplă. Pentru a înțelege mai bine modul de raționare i-am adresat încă o întrebare. Iată răspunsul.
Și modul în care a gândit.
Gemini 2.0 Flash Thinking traduce și adaptează conținutul între română și engleză, creează o structură a răspunsului, își observă propriile limite și se concentrează pe îmbunătățire, înțelegându-și rolul de instrument tehnic.
În plus față de transparență, Gemini 2.0 Flash Thinking vine și cu capacități native de execuție de cod, permițând dezvoltatorilor să ruleze și să testeze cod direct în sistem. Această funcționalitate, combinată cu îmbunătățirile în gestionarea contradicțiilor, face din acest model un instrument versatil atât pentru cercetare, cât și pentru aplicații comerciale.
Nu putem verifica afirmațiile legate de calcul matematic ale Google cu privire la Gemini 2.0 Flash Thinking, dar fără îndoială partea în care explică cum raționează e extrem de interesantă, promițătoare. Așteptăm mai multe informații de la cercetătorii în domeniu și de ce nu de la alți pasionați de tehnologie ca și noi.