Bluffand perfect, AI-ul "Pluribus" a batut 12 profesionisti la formatul 6-max!

ai poker pluribus

Pasul de care se temeau toti fanii pokerului a fost facut: o inteligenta artificiala a facut ravagii la o partida de Texas Hold'em No Limit 6-max impotriva unor profesionisti de top.

Robotii au mai batut oameni la poker (acum doi ani), insa doar la heads-up. Formatul de joc in sase oponenti era insa atunci imposibil de batut, datorita numarului exponential mai mare de combinatii pe care AI-ul trebuia sa le calculeze. Recent insa, urmasul lui Libratus, noul computer numit Pluribus s-a antrenat si a reusit sa castige decisiv la o masa de 6-max.

Cum a decurs experimentul

Jocul a durat 12 zile, s-au jucat 10.000 de maini si 12 profesionisti au fost cobaii pusi sa joace in doua scenarii: mai intai cinci oameni versus un AI, apoi 5 instanțe AI (care nu colaborau) impotriva unui jucator uman. Bilantul: computerul a castigat o medie de 5 blinduri la suta de maini — "o marja decisiva pentru a declara victoria", conform cercetatorilor care au antrenat reteaua neurala din spatele robotului.

Experimentul a fost condus de universitatea Carnegie Melon in colaborare cu laboratorul AI al celor de la Facebook. "Putem spune fara sa gresim ca am atins un nivel super-uman, fara cale de intoarcere", a decretat Noam Brown, unul din creatorii lui Pluribus, intr-o discutie cu publicatia The Verge.

Formatul 6-max din Texas Hold'em este de departe cea mai grea provocare de pana acum pentru un computer, mai dificila decat sahul sau GO-ul, se specifica intr-un studiu publicat in Science.

Complexitatea jocului in sase a fost depasita insa de Brown si de colegul sau de la Carnegie, Tuomas Sandholm, dupa o serie de ajustari.

Mai intai, ei au pus computerul sa joace un numar urias de maini impotriva lui insusi. Apoi, au creat o functie complexa care chiar a schimbat totul. Numita "functie de cautare", aceasta este menita sa ia decizii de joc in functie nu de posibilitatile de reactie ale oponentilor (ceea ce ar necesita o putere imensa de calcul), ci in functie de rezultatul cel mai avantajos de peste cateva miscari, nu mai mult de doua-trei. Altfel spus, computerul s-a concentrat sa castige "pe termen scurt", fara sa-si mai dezvolte strategii de ansamblu. Aceasta a fost miscarea revolutionara, spun cercetatorii, ceea ce a si permis folosirea unui computer ceva mai ieftin: un server cu 64 de nuclee si 512 Gb Ram.

Si apropo, spunea cineva ca termenul scurt nu conteaza? Cine e pestele acum?

Blufful dus la perfectiune

Astfel, Pluribus a reusit sa stoarca profit din orice situatie, din orice maini, oricat de slabe, gratie unei abilitati inumane de a bluffa perfect. Daca pana acum credeam ca abilitatea de a bluffa este exclusiv umana, Brown subliniaza ca nu mai e cazul: "AI-ul nu vede blufful drept o pacaleala. El doar decide ce trebuie sa faca in fiecare situatie pentru a extrage cat mai multi bani de la oponent. Rezulta un AI care bluffeaza si o face mai bine decat orice om."

Ba chiar, robotul a dezvoltat strategii pe care oponentii sai umani le-au inclus in bagajul lor de trucuri. De pilda, a gasit un mod de a rentabiliza infamul donk bet pe care toti profesionistii il considera aproape imposibil de balansat si un semn de amatorism. "De cate ori joc cu robotul, dau peste ceva nou ce pot incorpora in jocul meu", spune Jimmy Chou, unul din profesionistii implicati in experiment.

Iata o mostra de joc in care Pluribus infrunta cinci oponenti umani:

Aplicatii la scara larga

Insa cercetatorii de la Carnegie Melon nu se joaca cu pokerul. O masina in stare sa bata jocul de poker are utilizari extrem de importante in multe domenii in care informatia incompleta prevaleaza, precum cibersecuritatea, in negocieri, medicina, meteorologie etc. "Putem extinde asta pana si in softurile de navigatie autonoma la masini", spune Brown.

Intrebarea de pe buzele tuturor jucatorilor este: vor aparea astfel de masinarii infernale la mesele de poker online? Nu am vrea sa va descurajam, dar... P̡͏̰̫̫͚̮̫̟͉R̺̗̹͕̪̺̞͟O̷̡̻̻̖̫͍B̶̲̜̠̼̺̞̬̳̰A̜̲̱͘Ḅ̩͕̠I̪͖͍͖̮̙̠͟L̛̖̖͚͍̯̙͇͟ ҉͕̯͚̺C̶̙A̧̦͖͈̟͓͟͞ ͕͔̟͈D̮̮̦͖͈̳̀͠A҉̮͙̗̦̣͜

ai poker antrenament
Regimul de antrenament al lui Pluribus. Dupa multe simulari, robotul a decis ca limp nu este o strategie buna

Ramaneti alaturi de noi pentru a afla primii cele mai bune informatii, strategii si promotii din poker facandu-va cont pe Pokernews Romania sau direct de pe Facebook! Urmariti-ne pe iOS, Android sau iPad.


DISTRIBUIE SUMARUL ARTICOLULUI
  • Bluffand perfect, AI-ul "Pluribus" a batut 12 profesionisti la formatul 6-max!

  • "Putem spune fara sa gresim ca am atins un nivel super-uman, fara cale de intoarcere"

MAI POTI CITI:

Alte articole