Inginerii de la Universitatea Northwestern au dezvoltat un nou algoritm de inteligență artificială (AI) destinat roboților inteligenți, care depășește constant sistemele de ultimă generație. Această metodă inovatoare ajută roboții să învețe rapid și fiabil abilități complexe, îmbunătățind semnificativ practicitatea și siguranța roboților pentru diverse aplicații, inclusiv mașini autonome, drone de livrare, asistenți casnici și automatizare.
Algoritmul MaxDiff RL
Algoritmul, numit Maximum Diffusion Reinforcement Learning (MaxDiff RL), își bazează succesul pe capacitatea de a încuraja roboții să exploreze mediul înconjurător cât mai aleator posibil, pentru a obține un set divers de experiențe. Această „aleatorietate controlată” îmbunătățește calitatea datelor pe care roboții le colectează despre mediul lor. Folosind date de înaltă calitate, roboții simulați au demonstrat o învățare mai rapidă și mai eficientă, îmbunătățindu-și fiabilitatea și performanța generală.
Performanța Superioară a MaxDiff RL
Când a fost testat împotriva altor platforme AI, roboții simulați folosind noul algoritm de la Northwestern au depășit constant modelele de ultimă generație. Noul algoritm funcționează atât de bine încât roboții au învățat noi sarcini și le-au executat cu succes din prima încercare, spre deosebire de modelele AI actuale, care necesită învățare lentă prin încercare și eroare.
„Alte cadre AI pot fi oarecum nesigure,” a spus Thomas Berrueta, cercetător la Northwestern care a condus studiul. „Uneori vor reuși perfect o sarcină, dar alteori vor eșua complet. Cu cadrul nostru, atâta timp cât robotul este capabil să rezolve sarcina, de fiecare dată când pornești robotul te poți aștepta să facă exact ceea ce i s-a cerut să facă. Acest lucru face mai ușor de interpretat succesele și eșecurile robotului, ceea ce este crucial într-o lume din ce în ce mai dependentă de AI.”
Problemele Metodelor Tradiționale
Deconectarea Dintre Sistemele Discorporate și Cele Corporale
Pentru a antrena algoritmii de învățare automată, cercetătorii și dezvoltatorii folosesc cantități mari de date mari, care sunt atent filtrate și curate de oameni. AI învață din aceste date de antrenament folosind încercări și erori până ajunge la rezultate optime. În timp ce acest proces funcționează bine pentru sistemele discorporate, cum ar fi ChatGPT și Google Gemini, nu funcționează pentru sistemele AI corporale, cum ar fi roboții, care colectează date singuri, fără luxul curatorilor umani.
Avantajele MaxDiff RL
Învățarea din Prima Încercare
Pentru a testa noul algoritm, cercetătorii l-au comparat cu modelele actuale de ultimă generație. Folosind simulări pe calculator, cercetătorii au cerut roboților simulați să efectueze o serie de sarcini standard. În toate cazurile, roboții folosind MaxDiff RL au învățat mai repede decât celelalte modele și au realizat sarcinile corect mult mai consistent și mai fiabil.
„Roboții noștri au fost mai rapizi și mai agili, capabili să generalizeze eficient ceea ce au învățat și să aplice aceste cunoștințe în situații noi,” a spus Berrueta. „Pentru aplicații din lumea reală, unde roboții nu își pot permite să petreacă timp nelimitat pentru încercări și erori, acesta este un avantaj imens.”
Deoarece MaxDiff RL este un algoritm general, poate fi utilizat pentru o varietate de aplicații. Cercetătorii speră că acesta va aborda probleme fundamentale care împiedică progresul în domeniu, deschizând calea pentru luarea deciziilor fiabile în robotică inteligentă.
„Aceasta nu trebuie să fie folosită doar pentru vehiculele robotice care se deplasează,” a spus Allison Pinosky. „Ar putea fi folosită și pentru roboți staționari – cum ar fi un braț robotic într-o bucătărie care învață cum să încarce mașina de spălat vase. Pe măsură ce sarcinile și mediile fizice devin mai complicate, rolul corporalității devine și mai crucial de luat în considerare în timpul procesului de învățare. Acesta este un pas important către sisteme reale care efectuează sarcini mai complicate și mai interesante.”