Un program de inteligenta artificiala i-a invins pentru prima data pe oameni intr-un joc multiplayer

Vineri, 31 Mai 2019, ora 23:17

5659 citiri

Un program de inteligenta artificiala i-a invins pentru prima data pe oameni intr-un joc multiplayer

Foto: Arhiva Facebook/Deep Blue

O echipa de programatori de la o companie britanica specializata in inteligenta artificiala (AI) a antrenat "agenti" autonomi intr-un joc de tip multiplayer (la care participa mai multi utilizatori, n.r.), care au devenit atat de eficienti, incat i-au invins pe utilizatorii umani si au stabilit astfel o premiera mondiala, informeaza AFP.

Aceasta realizare i-a adus echipei de la DeepMind, filiala a companiei-mama ce detine Google, Alphabet, un studiu publicat joi in prestigioasa revista Science.

Pana la aceasta reusita, computerele i-au invins pe oameni in jocuri, insa in cadrul unor confruntari fata in fata, in formatul "unu la unu": Deep Blue l-a invins pe Gari Kasparov la sah in 1997 si AlphaGo, construit de Google, l-a invins pe marele maestru sud-coreean al jocului de go Lee Se-Dol in 2016.

Jocurile multiplayer sunt insa diferite, deoarece necesita o competenta umana complexa: cooperare si munca in echipa, in medii complexe.

Programatorii de la DeepMind, coordonati de Max Jaderberg, au folosit o versiune modificata a celebrului joc "Quake III Arena", lansat pentru prima data pe piata in 1999 si care a ramas popular in universul pasionatilor de Esport.

Slabeste rapid si usor cu ajutorul Lipovon. Ingrediente naturale. Livrare imediata.

Modul selectat a fost "Capture the Flag" ("Capturarea steagului") . Jucatorii trebuiau sa intre in posesia drapelului echipei adverse, protejandu-l in acelasi timp pe al lor. Acest lucru ii obliga sa atace si sa se apere in acelasi timp, fapt care necesita stabilirea unei strategii.

Agentii AI s-au antrenat singuri la acest joc, apoi au infruntat profesionisti umani angajati pentru a testa jocuri video.

"Chiar si dupa 12 ore de practica, profesionistii umani in testare nu reuseau sa castige decat 25% dintre partidele jucate contra echipei agentilor AI", au dezvaluit autorii studiului.

Performanta agentilor AI a ramas superioara chiar si atunci cand timpii lor de reactie au fost incetiniti pentru a ramane la nivelul celor umani.

Fara utilizare militara

Pentru antrenarea agentilor autonomi, programatorii au recurs la ceea ce se numeste "invatare prin consolidare".

"La inceput, ei nu stiau absolut nimic si actionau intr-o maniera complet aleatorie, se loveau de toate colturile", a explicat Max Jaderberg pentru AFP.

Programatorii doar le-au trasat un obiectiv: capturarea steagului. Agentii AI au trebuit sa isi dezvolte propriul sistem de recompensa interna pentru fiecare actiune necesara obtinerii acelui rezultat.

O alta inovatie a constat in antrenarea mai multor agenti AI impreuna, nu separat. Cercetatorii si-au dat seama ca agentii progresau mult mai repede daca lucrau in grup.

De asemenea, programatorii au inoculat agentilor AI "doua viteze de gandire", inspirandu-se din titlul bestsellerului "Thinking Fast and Slow", publicat de Daniel Kahneman, laureatul premiului Nobel pentru economie pe anul 2002.

"O parte a agentului reactioneaza foarte repede si isi actualizeaza propriile convingeri foarte repede, in timp ce o alta parte a agentului le actualizeaza mai lent. Aceste doua tipuri de convingeri se influenteaza reciproc si modeleaza perceptia agentului asupra lumii", a explicat Max Jaderberg.

Cercetatorii din echipa DeepMind au preferat sa nu faca niciun fel de comentariu atunci cand au fost intrebati despre eventuale utilizari militare ale acestui tip de inteligenta artificiala.

DeepMind are drept principiu general declarat sa nu colaboreze niciodata cu sectorul militar si cu cel al supravegherii si monitorizarii. Cuvantul "trage" nu apare deloc in studiul publicat in revista Science (autorii au preferat sa scrie ca agentii AI "indreptau" un laser catre adversarii lor).

In schimb, la nivel conceptual, echipa de programatori doreste sa poata sa foloseasca aceste forme de inteligenta artificiala pentru a rezolva probleme ale lumii reale, a precizat Max Jaderberg.

Candidatul USR la Primăria Sectorului 5 a depus o plângere la DIICOT împotriva lui Cristian Popescu Piedone

Avocatul şi liderul consilierilor USR din Sectorul 5, Alexandru Dimitriu, a depus joi dimineaţă, 25 aprilie, o plângere la DIICOT împotriva primarului Cristian Popescu Piedone şi ”a...

BEC vine în sprijinul PSD și PNL. Decizia surpriză care le permite să aibă candidați separați la Primăria Capitalei

Biroul Electoral Central (BEC) a adoptat miercuri, 24 aprilie, o hotărâre prin care permite desființarea unei alianțe electorale până la data de 26 aprilie,astfel că PSD și PNL vor putea...