ReviewsAltele

Inteligenta Artificială, proprie și personală: ce poți face cu o PLACĂ VIDEO dibace! AI „pe persoana fizică”, by Nvidia RTX

Cum sună asta: Inteligență Artificială, proprie si personală. Nu pe un server cloud, ci PC-ul tău de pe masa de birou, echipat cu un acceelerator Nvidia RTX, pe care tot tu îl controlezi. Iată ce poți face cu cu inteligența artificială, administrată direct de pe hardware-ul tău.

Cică doi prieteni alergau cu limba scoasă după trenul care tocmai părăsea gara. Si aia tot alergau și gâfâiau, iar trenul accelera. Iar la un moment dat se opresc oboțiți, iar unul îi spune celuilalt: vezi, așa e când nu-i lucrul tău! Așa si cu inteligența artificială: ChatGPT, Gemini, Claude nu-i lucrul tău, e al OpenAI, Google, Anthropic etc., iar tu doar plătești abonament. Dar se poate oare… să ai lucrul tău în acest domeniu?

Oricât de puțin probabil ar putea părea pentru cei mai multi utilizatori de AI din această lume, răspunsul este un răsunător DA… your own, personal AI, la o apăsare de taste. Conform statisticilor celor mai recente, sunt deja peste 1 miliard de utilizatori de AI în lume, și probabil cei mai multi asociază inteligența artificială cu coloșii din industrie, Google, Open AI, Meta, Microsoft, cu centrele de date gigantice care consumă energie cât cuprinde și care țin acum prima pagină a tuturor publicațiilor, cu state care se bat pentru supremație in domeniu. Deci cu orice altceva în afară de inteligenta artificiala artizanală… asupra căreia să ai tu personal/control total.

Dar în tot acest talmeș-balmeș corporatisto-statal, există o portiță. Și ea a fost deschisă in mod paradoxal chiar de către cel mai mare jucător din industrie, cel care a avut cel mai mult de castigat in urma revoluției AI, și care s-a transformat aproape peste noapte dintr-un producător de nișă de plăci video pentru gameri, în cea mai bogată companie a lumii, cu o capitalizare de aproape 5 trilioane de dolari: Intel! Pardon, AMD! Ptiu, nu bai… Cum îi chema Doamne? Așa, că uitasem: Nvidia! Deci care-i treaba cu Nvidia?

Păi foarte simplu spus, fără Nvidia „miracolul AI” nu ar fi fost posibil. De ce? Pentru că hardware-ul și software-ul lor s-au potrivit ca o mânușă cu ceea ce se numește deep learning, pe vremea când AI-ul generativ era încă in stadiul de proiect de laborator. Au fost compania potrivită, la momentul potrivit.

Cum să ai propriul AI, cu Nvidia RTX

Deep learning-ul, sau pe românește învățarea profundă, se bazează pe un număr colosal de calcule matriceale făcute în paralel. Si ce să vezi, GPU-urile sunt construite fix pentru o treabă de felul ăsta: au mii și mii de nuclee care execută aceeași operație simultan, fiind astfel mult mai rapide decât CPU-urile tradiționale la antrenarea rețelelor neuronale. Încă un factor decisiv a fost acela că Nvidia dezvoltase deja CUDA, o platformă matură de programare pentru GPU-uri, și asta cu ani înainte ca AI-ul să explodeze.

Deci cercetătorii au putut folosi imediat GPU-urile lor împreună cu un software stabil. Niciuna dintre companiile concurente nu avea nici măcar pe aproape vreun ecosistem comparabil. Și pe măsură ce AI-ul a tot evoluat, Nvidia a ajuns sa controleze întregul stack: de la cipuri, drivere, librarii matematice si comunicarea între mai multe GPU-uri, pana la sisteme complete pentru centre de date. Iar acest lucru a făcut la rândul sau posibilă scalarea eficientă de la un singur GPU la infrastructuri gigantice.

Pe scurt, Nvidia a ajuns la nivelul la care este acum pentru ca GPU-urile Nvidia RTX se potrivesc perfect matematicii AI. CUDA a apărut devreme, descoperirile cheie și evoluțiile ulterioare au validat abordarea, iar ecosistemul creat de ei a devenit extrem de greu de înlocuit.

Și pentru a descrie acest status quo, am folosit adesea metafora goanei după aur: adevărații câștigători sunt întotdeauna vânzătorii de lopeți. Deci se poate spune fără a greși prea tare, ca Nvidia RTX este piatra de temelie a revoluției AI, fără de care nimic din ce vedem astăzi NU ar fi fost posibil. Dar partea si mai fascinantă, pe care mai puțină lume o știe, este ca Nvidia rămân cumva loiali crezului inițial. Revoluția AI NU a început cu centrele de date de azi, cu cloud-ul colosal care găzduiește soluții precum ChatGPT, Gemini sau Claude, ci cu niște băieți si fete din niște universități… și cu niște placi video de gaming. Nu foarte multe, si cu siguranță nu la fel de performante ca cele de azi.

Deci Nvidia, în ciuda poziției sale dominante din piața clienților Enterprise, continuă sa fie un motor al democratizării tehnologiei la nivel individual. Hai s-o zicem și altfel: dacă de exemplu, deții in PC-ul tău propriu si personal o placa video RTX 5090 doar ca sa te joci Cyberpunk sau să omori demoni in Doom the Dark Ages, este ca și cum ai avea un reactor nuclear personal, și ai alegi să-l folosești doar ca să „fierbi apa pentru ceai”.

Exagerez, dar o fac tocmai pentru vă ajuta să înțelegeți mai bine partea tehnică mai aridă a ce urmează în continuare. „Tradiționala” placă video Nvidia RTX din PC-ul sau laptopul tău, pe care o folosești ca să te joci, să vezi un film, să lucrezi intr-un document Word sau Excel, să vizualizezi un feed de social media sau un site, POATE face mult mai mult decât atât.

Este o mica uzină, care iți permite să experimentezi, să construiești și să implementezi inteligența artificială la nivel local, direct pe laptopul sau PC-ul tău personal. Iar acum… the hard part, la propriu și la figurat. Ceea ce voi povesti in continuare ar trebui sa înlăture această prejudecată despre care povesteam la început, și anume că inteligenta artificială este apanajul exclusiv la coloșilor gen Google, Microsoft, Amazon sau OpenAI, cu capitalizări si resurse de ordinul trilioanelor. Poți face și tu asta, sigur, nu la același nivel, dar nu se știe niciodată de unde sare iepurele.

Și inteligența artificială a avut aceleași începuturi umile: un om cu o placa video. Iar acest om, a făcut zilele astea un experiment: am luat una bucata GeForce RTX 5090 (da știu, mă pot considera un bogat doar pentru ca dețin așa ceva) și i-am dat o cu totul altă destinație decât jocurile. Am vrut să vedem, cât mai hands-on, ce poți face cu ea în materie de inteligentă artificială locală, sau artizanală cum îmi place mie sa-i zic.

Am mai făcut și în trecut astfel de experimente, și n-as zice că au fost simple pentru un om obișnuit, ca mine, ca tine, și ca majoritatea celor care nu sunt programatori de meserie. Adică respectivele experimente din trecut au presupus oarece cunoștințe minime de programare, măcar să știi ce-i ala Python, si o cunoaștere fie ea si basic a resurselor disponibile, gen GitHub sau HuggingFace.

Dar ce am constat cu încântare acum față de anul trecut, este că lucrurile s-au simplificat substanțial. De exemplu Comfy UI, o interfață cheie pentru rularea locala a acestor modele, dacă în trecut se instala manual și destul de dificil pentru un Noob, a primit acum o instalare cu executabil, sau pe românește spus cu next, next, next. Și găsești în ea simplu și intuitiv organizat cam tot ce iți trebuie, adică inclusiv o galerie cu template-uri/modele pe care să le descarci și să le rulezi local, cu toate nodurile și conexiunile gata făcute. Doar sa scrii prompt-ul și să experimentezi până la Dumnezeu și o stație mai încolo.

Și în ultimele două zile m-am jucat pe săturate cu câteva astfel de modele. Este vorba despre Flux 2 pentru imagine statică, si LTX2 pentru video.

Să le luam pe rând. În ambele cazuri ai mai multe variante, de la Text to Image, adică scrii un prompt și obții o poză sau un clip, si până la Image Edit sau Image to Video, adică încarci o imagine pe care fie vrei s-o modifici, fie s-o transformi într-un clip video. Și totul, absolut totul se întâmplă local, pe PC-ul tău, fără cloud, fără abonamente, fără limitări si restricții, asta gratie faptului că Nvidia RTX iți permite să rulezi toate astea direct pe placa video din dotare.

Iar aici vă rog să-mi permiteți o mică paranteză legată de hardware. Rar mi-a fost dat să vad un RTX 5090, adică o bestie de placă, maximizată în felul acesta. GPU la 100% load, memorie video full, 32 GB VRAM din 32, ocupați. Este complet altceva, chiar dacă compari cu cele mai în vogă jocuri AAA. Și e un scenariu în care înțelegi repede de ce ai dat atâția bani pe ea.

De partea cealaltă, n-ai cum să nu te gândești cât de puțin o folosești în toate celelalte „chestii” pe care le rulezi pe o placă video. Și aș îndrăzni să adaug aici inclusiv gaming-ul.

Deci, RTX 5090-ul nostru a stat încărcat la capacitate maximă timp de ore întregi, procesând tot felul de clipuri si poze. Am generat inclusiv proiecte rafinate presetate, cum este această motocicletă vintage din Flux, dar și trenuri cu aburi realiste intrând in gări din secolul al 19-lea, sau traversând peisaje in stil Harry Potter, sau soldați de pe vremea lui Napoleon, dar si pe LeBron James arătând ceva cu degetul. Toate astea local, cu Flux 2, direct pe RTX 5090.

Dar cu adevărat fascinant este procesul video. Uite de exemplu această păpușă animată care cântă ceva, sau acest tren care traversează un pod la apus, o scena cu cowboy in vestul sălbatic, niște fete jucând volei pe plajă, sau acest peisaj urban nocturn cu vibe-uri de Bladerunner. Toate astea au fost făcute in câteva minute in LTX 2, fie ca text to video, fie ca image to video. Sau acest avion de hârtie care planează pe deasupra unui oraș modern, sau acești doi boxeuri care se înfruntă in ovațiile publicului, toate generate cu Hunyuan, si care au presupus doar câteva zeci de minute de render.

Sigur, rezultatele nu sunt nici cele mai finisate, nici cele mai rafinate sau detaliate, dar sunt ceva ce acum 3 ani nici măcar nu concepeam că ar putea exista. Si asta fără să ai nevoie de ChatGPT, Midjourney, Gemini sau alte astfel de „servicii” oferite de marile corporații gen Google, OpenAI si alții, ci direct pe PC-ul tău de acasă sau de la birou.

Și îndrăznesc să spun că asta este doar începutul. In zona asta de imagine, Nvidia RTX promite update-uri majore si repede. De exemplu posibilitatea de a face upscaling la 4K folosind mult mai puțin VRAM decât in acest moment, adică o optimizare a utilizării resurselor, sau sa te ajute sa poți genera durate mai lungi ale clipurilor, o limitare importanta in acest moment, de pana la zeci de secunde in 4K, sa poți anima scene folosind doar doua imagini, gen keyframe de start si de finish, si multe altele asemenea.

Nvidia Blueprints

Un alt asset cu care ne-am jucat in draci zilele astea, este ceea ce Nvidia numește Blueprints.

Imaginează-ți că ai putea construi o aplicație AI complexă la fel cum ai asambla o biblioteca de la IKEA, cam asta este Blueprints. Fiecare astfel de Blueprint vine pre-antrenat pentru o sarcină specifică, iar asta le permite dezvoltatorilor sa fure startul în loc să reinventeze apa caldă. Îți trebuie un chatbot de client service? Există un Blueprint pentru asta. Ai nevoie să cauți ceva anume într-un munte de PDF-uri? Există și pentru asta un Blueprint, un soi de asistent care scanează documentele și găsește răspunsurile.

Dar cel mai fain astfel de Blueprint pe care l-am experimentat, ăsta poate și pentru că se aliniază cu interesele mele in materie de creare de conținut, este unul menit sa genereze rapid obiecte si scene 3D. Ok, n-am sa intru foarte adânc in detalii tehnice aride, dar funcționează cam așa: iți instalezi un Blender, adică un soft de creație 3D extrem de popular, si in loc sa stai sa modelezi si sa texturezi de mână fiecare obiect si fiecare scenă, poți face toate astea mai repede și mai eficient… cu un Blueprint.

Mai exact, în Blender iți apar câteva tab-uri noi de „generare de obiecte 3D”, astea care se văd în partea dreaptă. Practic, la Blender este legat un LLM generativ, și după instalarea nu tocmai simplă, am să va zic imediat și despre asta, nu mai rămâne decât să apeși tab-ul pe care scrie „open 3D object generation UI” si se deschide o interfață simplă în care introduci un prompt. Iar aici se întâmplă… magia!

Îi spui… generează-mi obiecte antice grecești, și instant primești o întreagă galerie de statui, amfore, coloane si mai știu ce naiba mai asociază oamenii cu Grecia Antica. Sau: generează-mi elementele unei sufragerii in stil scandinav, și librăria se umple de canapele, rafturi, măsuțe, fotolii și chiar veioze în stil IKEA. Sau: generează-mi o mașină de curse….

În prima faza imaginile sunt 2D, dar apoi apeși butonul pe care scrie 3D, și miracol, obiectul respectiv se transformă rapid într-unul 3D, gata modelat și texturat, pe care apoi îl imporți direct in Blender.

Cine știe un pic de grafica 3D, înțelege cât de important este acest moment, atât în sensul bun, de eficiență, economie de timp și efort, dar și în ăla mai puțin bun, adică o hiperspecializare pe un segment îngust, gen un job axat exclusiv pe modelare sau texturare, așa cum se întâmplă acum în marile companii producătoare de jocuri sau filme, este sortit șomajului.

Și nu cred că mai există vre-un dubiu în acest sens. Consecințele sunt enorme. Ceea ce până mai ieri era un soi de gatekeeping pentru creatorii indie, adică lipsa disponibilității unor resurse umane și materiale ample, este deodată accesibil pentru un om cu un PC, grație acestor modele generative conectate la un software profesional.

Nu vă spun ce idei de animație, de efecte speciale sau de lumi virtuale îmi treceau prin cap în timp ce îmi făceam de cap prin Blender. Și asta în condițiile în care Blender este un soft pe care nu-l stăpânesc prea bine, dar care deodată îmi devine mult mai accesibil. Iar ceea ce reprezenta până nu demult o muncă îndelungată și migăloasă pentru o echipa întreagă, poate fi făcut acum în respectivul soft cu ajutorul unui model AI, de către un singur om, in câteva minute.

Dacă ești în domeniu, n-ai cum să nu înțelegi cât de mare este chestia asta. Da, este o veste proastă pentru o întreagă categorie profesională, DAR: progresul nu așteaptă pe nimeni, iar dacă această afirmație va sună cinic, următoarea compensează: o astfel de soluție îți oferă ție, om, mai mult timp pentru a te concentra pe aspectele cu adevărat creative care fac diferența. Ca să luam exemplul de fafață, nu mai stai sa faci o muncă sisifică modelând și texturând de mână acel obiect, acea scenă, ci te concentrezi pe detalii, pe finish, și mai ales pe idee, pe scopul final al acelui proiect.

Revenind la meandrele concretului, soluția în stadiul actual nu este nici cea mai stabilă, nici cel mai ușor de instalat și configurat. Am transpirat până am făcut-o să funcționeze, și chiar după ce am reușit asta, merge cu glitch-uri si sincope. Dar tineti cont că încă este într-o faza experimentală și incipientă, și pun pariu ca într-un an-doi, toate aceste dificultăți vor fi doar istorie.

Revenind la Blueprints în general, ele acoperă practic o colecție de scenarii AI, de la avataruri vorbitoare și până la asistenți specializați în căutarea de date, toate disponibile GRATUIT ca si kit-uri de pornire pentru dezvoltatori. Nu iți trebuie un doctorat în AI ca să le folosești, gândește-te la ele ca la un kit DIY: deschizi cutia și găsești în ea un model pre-antrenat și un set complet de instrucțiuni pentru a-l implementa pe PC-ul tău sau in cloud.

Tot ce trebuie să faci este să adaugi propriile tale date și să faci câteva ajustări, iar AI-ul ala „personalizat” prinde viață. În multe cazuri, nici măcar nu trebuie să scrii cod pentru a-l rafina. Iar povestea nu se încheie odată ce AI-ul tău este activ și funcțional, aceste „schițe” sunt concepute pentru a învăța și a se îmbunătăți în timp. Fiecare interacțiune a AI-ului respectiv generează informații noi, și tot acest feedback poate fi reintegrat pentru a rafina modelul. În practică, asta înseamnă că chatbot-ul tău pentru client service de exemplu, va deveni mai bun in a înțelege si a răspunde la întrebări din ce în ce mai complicate, sau, cu ajustările potrivite, asistentul care citește documente va deveni mai rapid și mai precis pe măsură ce absoarbe mai multă informație. Dar să construiești un astfel de AI de la zero este extrem de greu, de scump și de consumator de timp.

Răspunsul NVIDIA este să ofere aceste schițe predefinite așa încât să nu pornești de la zero. Iei un Blueprint, adaugi propriile tale date și expertiza ta, și obții rapid o aplicație AI funcțională, adaptată nevoilor tale. Si pentru că NVIDIA furnizează toate ingredientele, de la plăci grafice si până la software optimizat, aceste aplicații pot rula eficient oriunde, adică direct pe PC-ul tău sau în cloud. Este un model „plug-and-play” aplicat inteligenței artificiale. NVIDIA zice ca nu se va opri la doar câteva astfel de kituri prestabilite, si intenționează să lanseze în mod regulat noi Blueprints, un veritabil catalog de fluxuri AI, asemănător librăriilor de filme de pe serviciile de streaming, de unde îți poți alege și personaliza unealta în funcție de nevoile tale.

Nvidia Chat RTX

Și apropo de personalizare, poți avea inclusiv propriu tău Chatbot local, care sa nu fie nici ChatGPT, nici Gemini, nici Perplexity. El se numește Chat RTX si este accelerat de placa ta video, adică rulează pe your own personal PC! Unul pe care îl „antrenezi” pe propriile tale fișiere, așa încât el se va dezvolta și va învața ce si cum vrei tu.

Sau cum îl descrie chiar Nvidia, „este o aplicație AI care te lasă sa personalizezi un model larg de limbaj de tip GPT conectat la propriul tău conținut: documente, notițe, clipuri si alte tipuri de date si care se folosește de acceleratorul grafic așa încât sa-ti livreze răspunsuri contextual relevante”, închei citatul.

Instalarea este simplă și cere în total vreo 70 GB de spațiu, apoi „l-am conectat” la un mare folder cu texte de-ale mele, ca bază de date. Odată ce ai dat cheie, te întâmpină cu o interfață familiară, adică un spațiu pentru prompt-uri jos si niște meniuri dropdown sus, de unde ii dai calea către baza de date si selectezi modelul de limbaj dorit. Daca ai nevoie sa-ti cauți, sa-ti gestionezi, sa-ti sumarizezi propriile documente, sau sa pui întrebări in legătură cu ele, Chat RTX se descurca onorabil.

Nu este la fel de rafinat precum Chat GPT sau Gemini, dar este rapid, personalizat, răspunsurile sunt prompte, si in timp Nvidia i-au tot adăugat capabilități noi, precum suport pentru input in mai multe limbi, posibilitatea de a căuta prin imagini, and so on. Dacă ești mai strict cu securitatea și confidențialitatea datelor tale, this is the way. Si desigur, nu te oprește nimeni sa-l descarci și să-l instalezi tu însuți pentru a te juca cu el.

Și mai sunt nenumărate alte chestii pe care le poți face local, cu o placa video RTX. De exemplu să accelerezi anumite efecte în aplicații gen Photoshop, DaVinci Resolve, Premiere sau After Effects, sau să-ți micșorezi substanțial timpii de render gratie suportului din ce in ce mai extins pe care îl oferă Nvidia la nivel de codec-uri suportate pe GPU-urile lor. Și chiar noi folosim asta in fiecare zi, aici la studio. Am făcut din build-ul acesta cu RTX 5090 inima unui întreg ecosistem in DaVinci Resolve, cu un Project server central în care fiecare coleg care termină de editat materialul îl poate trimite pentru a fi randat pe vânjoasă placa video Nvidia in timp record, și poate face asta atât din birou cât și de acasă. Asta ca să nu mai zic despre lucrul colaborativ pe același proiect simultan. Sau nu mai zic despre Broadcast, care le permite atâtor creatori de conținut indi-streameri sa aibă în propria casă un studio încărcat de funcții utile, de la înlocuirea fundalului și până la eliminarea zgomotului ambiental. Toate bazate pe algoritmi AI care rulează pe placa video.

Deci da, iți cumperi o placa video puternică pentru aceasta nobilă activitate numita gaming, dar s-o folosești doar pentru asta… n-ar fi si păcat? Zic si eu, mai ales ca iată, poți face atâtea lucruri noi și interesante cu ea.

Back to top button