
Suno, un startup situat în apropierea campusului Harvard din Cambridge, Massachusetts, a uimit comunitatea online și pe cei din industria tehnologică cu capacitatea sa de a produce muzică de calitate prin simpla introducere a unor cereri în format text, scrie RollingStone. Compania are doi anișori și, în total, 12 angajați.
Piesa lor cea mai cunoscută, Soul of the Machine, a fost creată de Suno în colaborare cu ChatGPT, care a generat versurile. Este parte a genului blues Delta Mississippi și are ca subiect o inteligență artificială tristă. Deși tentant, e greu să contești calitatea cânteculului, dacă-l asculți fără să te raportezi la sursă, la cine sau mai precis ce l-a creat.
Viziunea arhitecților Suno și cum funcționează
Fondatorii Suno sunt Mikey Shulman, Keenan Freyberg, Georg Kucsko și Martin Camacho. Ei sunt experți în învățare automată și au lucrat împreună până în 2022 la Kensho Technologies, o companie din Cambridge, Massachusetts, axată pe găsirea soluțiilor AI pentru probleme complexe de afaceri. Shulman și Camacho sunt, de asemenea, muzicieni și au cântat împreună în timp ce lucrau la Kensho. Grupul a dezvoltat o pasiune pentru explorarea potențialului neutilizat al AI în domeniul audio și, în cele din urmă, s-au concentrat pe crearea de muzică prin inteligență artificială, ceea ce a dus la fondarea Suno.
Mikey Shulman spune, pentru RollingStone, că visează la un miliard de oameni care plătesc o taxă de 10 dolari pe lună pentru Suno și că ideea le-a venit pentru că muzica a rămas în urmă față de text și imagine, în domeniul inteligenței artificiale.
Suno folosește aceeași abordare generală ca modelele mari de limbaj precum ChatGPT, care descompun limba umană în segmente cunoscute sub numele de token-uri, absorb milioanele de utilizări, stiluri și structuri ale acesteia, apoi o reconstruiesc la cerere. Dar crearea unui AI audio este mai complicată decât procesarea textului pentru că, pe când cuvintele sunt elemente clar separate, sunetul este o undă continuă, un semnal neîntrerupt.
Pentru a face față acestei complexități e nevoie de utilizarea unor reguli euristice (metode de rezolvare bazate pe experiență) și de diverse alte trucuri, modele și tehnici. În final, Suno își propune să dezvolte alternative la interfața actuală de creare a muzicii bazată pe text, introducând modalități de input mai avansate și intuitive. Una din ideile explorate este generarea de cântece bazate pe înregistrările vocale ale utilizatorilor, ceea ce ar presupune o înțelegere și o procesare și mai sofisticate ale sunetului de către AI.
Fondatorii au refuzat să dezvăluie cu ce ”hrănesc” Suno, cu ce materiale îl antrenează, au spus în schimb că respectă artiștii și proprietatea intelectuală. Din acest motiv nu poți să-i ceri lui Suno să creeze melodii care să sune ca vocea unui anumit artist.
Principalul competitor al lui Suno este Google’s Dream Track, un alt serviciu de AI care permite utilizatorilor să creeze muzică prin intermediul unei interfețe bazate pe cereri. Dream Track a obținut licențe care permit utilizatorilor să facă piese muzicale folosind voci celebre, precum cea a lui Charlie Puth.
Primul contact cu Suno
Am intrat pe pagina lor, m-am logat cu un cont Google și mi-au oferit 50 de credite pentru a genera cântece. În stânga sus apare o fereastră în care introduci cererea în format text.

Am cerut în engleză ”create a chearful song about spring” și a creat două. Unul mai alert, de 44 de secunde, și unul într-o notă mai liniștită, de 56 de secunde.
Cântecele sunt puțin copilărești din punct de vedere al textului și au în comun dragostea, soarele, florile și păsările. Interpretarea e ciudată pe alocuri, ca și cum nu ar înțelege legătura dintre cuvinte. La refren parcă se descurcă mai bine, dar apoi piesa se încheie brusc.
Al doilea cântec fiind mai lent, și interpretarea e mai bună. Poate acesta e și motivul pentru care Soul of The Machine a ieșit atât de bine, faptul că e blues și AI-ul are mai mult timp să înțeleagă ce cântă. Pe de altă parte, e prima mea încercare și nici cererea nu a fost foarte detaliată.
Are și un mod personalizat unde poți introduce mai multe informații, cum ar fi:
- propriile versuri;
- stilul muzical;
- titlul piesei.
Cu cele 40 de credite rămase mă gândesc să-mi creez o sonerie personalizată pentru telefon. Tu ai încerca Suno, la ce crezi că ar putea fi folosit în afară de distracție?