Visul roboților cu adevărat autonomi, capabili să gândească și să acționeze independent în timp real, a făcut un salt monumental înainte. Google DeepMind a anunțat lansarea unei noi versiuni a modelului său de inteligență artificială pentru robotică, Gemini. Această versiune este suficient de mică și de eficientă pentru a rula direct pe hardware-ul unui robot, eliminând dependența de o conexiune la internet sau la un server din cloud și depășind astfel una dintre cele mai mari bariere în calea roboticii avansate, relatează GadgetReport.ro
Ce înseamnă AI „on-device” pentru robotică?
Până acum, majoritatea roboților inteligenți se bazau pe un model hibrid, așa cum explică Carolina Parada, șefa departamentului de robotică de la Google DeepMind, afirmă TheVerge.
Aceștia foloseau procesare locală pentru sarcini simple, dar pentru raționamente complexe, trimiteau date către servere puternice din cloud.
Acest lucru crea două probleme majore: latența (întârzierea dintre percepție și acțiune) și dependența de conectivitate. Un robot care își pierde conexiunea Wi-Fi devine, practic, inutil.
Noul model Gemini Robotics „on-device” rezolvă aceste probleme. Plasând întreaga capacitate de procesare direct „în corpul” robotului, acesta poate reacționa instantaneu la mediul înconjurător și poate funcționa în orice locație, fie că este vorba de o fabrică, o locuință sau chiar o altă planetă.
„Mă gândesc la el ca la un model de pornire sau ca la un model pentru aplicații care au pur și simplu o conectivitate slabă,” a declarat Parada pentru The Verge, adăugând că ar putea fi util și pentru companiile cu cerințe stricte de securitate a datelor.
VLA – Modelul care vede, înțelege și acționează
Noul model este de tip VLA (Vision-Language-Action), ceea ce înseamnă că poate procesa informații din trei surse distincte: viziune (prin camere), limbaj (comenzi vocale sau scrise) și acțiune (interacțiunea cu obiectele fizice).
Acest lucru îi conferă robotului capacitatea de a înțelege comenzi complexe, de a generaliza cunoștințele pentru a rezolva sarcini noi, pe care nu a fost antrenat în mod specific, și de a efectua acțiuni care necesită o motricitate fină și dexteritate.
De la ALOHA la Apollo – O inteligență adaptabilă
Unul dintre cele mai impresionante aspecte ale noului model este adaptabilitatea sa. Deși a fost antrenat inițial pe robotul de cercetare ALOHA al Google, compania a reușit să îl transfere cu succes pe platforme hardware complet diferite.
Printre acestea se numără robotul umanoid Apollo de la Apptronik și brațul robotic colaborativ Franka FR3. Conform Carolinei Parada, adaptarea la o nouă situație sau la un nou tip de sarcină se poate face cu un număr surprinzător de mic de demonstrații, între 50 și 100.
„Modelul hibrid Gemini Robotics este încă mai puternic, dar suntem de fapt destul de surprinși de cât de puternic este acest model on-device,” a adăugat ea.
Deschiderea către dezvoltatori – Lansarea primului SDK
Odată cu lansarea acestui model, Google face un pas crucial către democratizarea tehnologiei, lansând și un Kit de Dezvoltare Software (SDK).
Aceasta este o premieră pentru un model VLA de la Google DeepMind și va permite dezvoltatorilor și companiilor din afara Google să evalueze, să testeze și să-și perfecționeze propriile aplicații robotice folosind „creierul” Gemini. Această deschidere promite să accelereze exponențial inovația în întregul domeniu al roboticii.
Deocamdată, noul model on-device și SDK-ul său vor fi disponibile pentru un grup restrâns de „testeri de încredere” (trusted testers), în timp ce Google continuă să lucreze la minimizarea riscurilor de siguranță asociate cu mașinăriile autonome.
SF devine realitate! Roboţii DeepMind vor fi capabili să viseze

Cu o experiență de 10 ani în domeniul jurnalismului IT&C, Marius Ivan este un expert în a traduce complexitatea tehnologică în termeni simpli și ușor de înțeles pentru publicul larg. Pasionat de inovație și tehnologie, el urmărește îndeaproape evoluțiile din industrie și le aduce la cunoștința cititorilor într-un mod captivant și informativ.
Marius a lucrat pentru publicații de top, atât online, cât și offline, unde a acoperit o gamă largă de subiecte, de la lansări de produse noi și tendințe tehnologice emergente, până la probleme de securitate cibernetică și impactul tehnologiei asupra societății. El a intervievat lideri din industrie, experți și utilizatori obișnuiți, oferind cititorilor perspective unice și valoroase asupra lumii tehnologiei.
Pe lângă activitatea sa profesională, Marius este un pasionat de tehnologie și un utilizator avid de gadgeturi. El este mereu în căutarea de noi tehnologii și gadgeturi care să-i facă viața mai ușoară și mai interesantă.