Google DeepMind a învățat roboții să joace fotbal. Într-un material publicat în Science Robotics, cercetătorii detaliază abordarea lor inovatoare, care utilizează învățarea profundă de întărire (deep RL) pentru a antrena roboții cum să joace fotbal.
Spre deosebire de experimentele anterioare, care s-au axat pe roboți cu patru picioare, munca celor de la DeepMind reprezintă un pas înainte semnificativ în antrenarea mașinilor umanoide bipede pentru sarcini fizice dinamice.
Succesul Google DeepMind în stăpânirea unor jocuri precum șahul și Go este deja de notorietate.
Cu toate acestea, aceste realizări au implicat în primul rând gândirea strategică, mai degrabă decât coordonarea fizică.
Prin adaptarea Deep RL la roboții care joacă fotbal, DeepMind își demonstrează capacitatea de a aborda în mod eficient provocări fizice complexe.
Un software revoluționar
Inginerii Google DeepMind au antrenat mai întâi roboții în simulări pe calculator, concentrându-se pe două abilități cheie: ridicarea de la sol și marcarea de goluri împotriva unui adversar.
Combinând aceste abilități și introducând scenarii de meciuri simulate, roboții au învățat să joace meciuri de fotbal complete unu la unu.
Prin antrenamente iterative, aceștia și-au îmbunătățit treptat abilitățile, inclusiv cele de a lovi cu piciorul, de a trage, de a se apăra și de a reacționa la acțiunile adversarilor.
În cadrul testelor, roboții au demonstrat o agilitate și o eficiență remarcabile.
Cu toate acestea, aceste teste s-au bazat exclusiv pe o pregătire bazată pe simulare, iar eforturile viitoare vizează integrarea unei pregătiri de întărire în timp real pentru a îmbunătăți și mai mult adaptabilitatea roboților.
Deși tehnologia este promițătoare, mai sunt încă obstacole de depășit înainte ca roboții alimentați de DeepMind să poată concura în evenimente precum RoboCup.
Extinderea la scară a roboților și rafinarea capacităților lor vor necesita o experimentare și un rafinament extins.
Cu toate acestea, munca de pionierat a Google DeepMind evidențiază potențialul RL profund pentru a îmbunătăți mișcarea și adaptabilitatea roboților bipedali în scenarii din lumea reală.