
Acționând după principiul „dacă e furat de alții, atunci nu ne deranjează să-l folosim”, Meta ar fi apelat la conținut piratat distribuit pe torrenți pentru antrenarea motorului Llama, parte din suita de tehnologii Meta AI.
Potrivit dovezilor depuse la dosar în cadrul unui proces deschis împotriva companiei lui Mark Zuckerberg pentru presupuse încălcări ale legii dreptului de autor, Meta a recurs la conținut piratat pentru antrenare AI. În special, este vorba de operele noveliștilor Richard Kadrey și Christopher Golden, folosite de Meta fără acordul celor doi autori.
Și probabil că acesta nu este un caz singular, o eventuală decizie în defavoarea Meta deschizând calea unui viitor proces colectiv, potențial mult mai costisitor în privința despăgubirilor solicitate proprietarului Facebook.
Dacă în deschiderea procesului început în anul 2023, Meta a predat instanței documente cu informații redactate, judecătorul Vince Chhabria de la Tribunalul Districtual al Statelor Unite pentru Districtul de Nord al Californiei a ordonat ca documentele originale să fie făcute publice. Iar documentele nou apărute redau conversații purtate între angajații Meta, despre Meta AI și Llama. Într-una dintre discuții, un inginer spune că „torrentul de pe un laptop corporativ [deținut de Meta] nu se simte bine”, ceea ce confirmă faptul că compania a folosit conținut piratat pentru a-și antrena AI. O altă conversație sugerează că „MZ” (Mark Zuckeberg) a autorizat în mod explicit folosirea materialului piratat.
Potrivit investigației desfășurate, Meta a folosit conținut de la LibGen, o uriașă bibliotecă de cărți în format electronic, reviste și articole academice piratate.
LibGen a fost creat în Rusia în anul 2008 și a vizată de-a lungul timpului de numeroase procese pentru încărcarea drepturilor de autor. Însă toate încercările de închidere a platformei au eșuat, în principal pentru că nimeni nu știe cine operează de fapt această platformă găzduită pe servere rusești. De asemenea există suspiciuni că Meta ar fi folosit și alte surse clandestine de conținut pentru instruire AI.
Însă poziția oficială a companiei este că a folosit doar materiale public disponibile, acționând în conformitate cu doctrina legală a „utilizarii corecte”, care permite utilizarea conținutului protejat prin drepturi de autor fără permisiune în anumite circumstanțe, care sunt analizate de la caz la caz.
De asemenea, este vorba doar de „folosirea textului pentru a modela statistic limbajul și a genera o expresie originală”, ceea ce, potrivit Meta, exclude scopul artistic al creațiilor respective.
Cert este că Meta nu ar fi singurul gigant tehnologic care să fie acuzat de folosirea fără drept a conținutului protejat prin dreptul de autor, Apple fiind suspectat că a recurs la o strategie similară pentru a dezvolta pe repede înainte noile capabilități Apple Intelligence.