Ce tehnologie face ca noul model AI din China să fie la fel de eficient ca un creier uman?

Curiozitate.ro

Ce tehnologie face ca noul model AI din China să fie la fel de eficient ca un creier uman?

Ce -ar fi dacă mașinile ar putea raționa cu eficiența uimitoare a creierului uman, consumând în același timp doar o fracțiune din energia necesară giganților actuali ai inteligenței artificiale?

Aceasta este miza ambițioasă a unei echipe de cercetători de la Academia Chineză de Științe din Beijing, care a dezvăluit recent SpikingBrain 1.0, un model de limbaj de generație nouă.

Inspirat de modul de funcționare neuronală, acest sistem are potențialul de a revoluționa abordarea noastră asupra inteligenței artificiale, îmbinând rapiditatea, eficiența energetică și independența tehnologică.

Modelele de limbaj la scară mare, cunoscute și sub acronimul LLM, precum cele care propulsează ChatGPT, se bazează în principal pe arhitectura Transformer. Deși această abordare a generat progrese spectaculoase, ea rămâne extrem de dependentă de un consum masiv de energie și de resurse de calcul.

Explicația este simplă: fiecare secvență de text procesată implică miliarde de operațiuni repetitive, ceea ce creează blocaje pe măsură ce volumul de date crește. SpikingBrain 1.0, în contrast, adoptă o abordare radical diferită.

Creatorii săi îl descriu ca un model „asemănător creierului”, deoarece reproduce, în linii mari, modul în care neuronii noștri comunică între ei. Rezultatul este o arhitectură mult mai economică, capabilă să gestioneze volume imense de informații fără o încetinire drastică.

Secretul acestei inovații constă în ceea ce este numit „calculul cu impulsuri” (spiking computation). Spre deosebire de rețelele neuronale clasice, unde fiecare neuron artificial rămâne activat permanent, SpikingBrain funcționează într-o manieră bazată pe evenimente.

Neuronii virtuali se activează doar atunci când primesc un semnal specific, exact ca în creierul uman. Acest mod de operare reduce drastic consumul de energie și accelerează procesarea datelor.

Acolo unde un model Transformer depune eforturi pentru a gestiona fiecare detaliu al unei secvențe, SpikingBrain adoptă o strategie selectivă, concentrându-se exclusiv pe ceea ce este esențial.

Sistemul, care a utilizat sute de cipuri MetaX, a funcționat stabil timp de mai multe săptămâni, demonstrând robustețea acestei abordări. Rezultatele anunțate de echipa de cercetare sunt impresionante.

În faza de testare, versiunea cea mai compactă a modelului, echipată cu 7 miliarde de parametri, a putut răspunde unei cereri compuse din 4 milioane de token-uri de peste o sută de ori mai repede decât un sistem standard. Într

-un alt scenariu, SpikingBrain a generat un prim răspuns de 26,5 ori mai rapid decât un model Transformer, confruntându-se cu un context de un milion de token-uri.

Toate acestea s-au realizat cu un volum de antrenament surprinzător de redus: aproximativ 150 de miliarde de token-uri în total, ceea ce reprezintă mai puțin de 2% din ceea ce este necesar în mod obișnuit pentru modele de o asemenea anvergură.

Aceste cifre prefigurează o nouă paradigmă în modul de concepere a eficienței în inteligența artificială.

Dincolo de performanțe, SpikingBrain 1.0 ilustrează și o voință politică și industrială clară: aceea de a se desprinde de dependența față de Nvidia, liderul mondial în producția de cipuri pentru inteligența artificială.

Sistemul a fost proiectat să ruleze pe sute de cipuri MetaX, produse în China de MetaX Integrated Circuits Co., cu sediul în Shanghai.

Cercetătorii au raportat că modelul a funcționat stabil timp de mai multe săptămâni pe această platformă locală, un semnal puternic pentru autonomia tehnologică a țării. Deși SpikingBrain 1.0 se află încă la începuturile sale, perspectivele sale de aplicare sunt vaste.

Analiza documentelor juridice sau medicale, cercetările în fizica energiilor înalte sau secvențierea genetică sunt doar câteva dintre domeniile în care rapiditatea și eficiența procesării datelor reprezintă atuuri decisive.

La o scară mai largă, dezvoltarea modelelor inspirate de creier ar putea deschide calea către o nouă eră a informaticii neuromorfice, unde puterea de calcul se îmbină în sfârșit cu o eficiență energetică până acum de neatins pentru arhitecturile clasice.

Încercând să imite eficiența energetică a creierului uman, care funcționează cu doar aproximativ douăzeci de wați, SpikingBrain 1.0 trasează o cale originală.

Departe de a-și propune să înlocuiască modelele existente, el oferă o alternativă complementară, adaptată în mod special sarcinilor care necesită analiza unor contexte foarte lungi. Rămâne de văzut dacă această abordare se va impune în fața dominației modelelor Transformer.

Un lucru este cert: inteligența artificială intră într-o nouă fază, în care creierul uman nu mai este doar o sursă de inspirație, ci un adevărat model de urmat.

Surse și detalii suplimentare