Robotul Libratus, la jumatatea drumului catre o victorie epocala impotriva oamenilor

Atat ne mai ramasese noua, oamenilor: pokerul. La asa zisul "sport al mintii", sahul, am luat bataie inca din 2007, iar acum orice site de sah are un bot care snopeste online aproape pe oricine. Iar acum ne aflam la jumatatea drumului spre infrangere la ceea ce am considerat a fi un joc exclusiv uman, pokerul.
58.330 de maini s-au jucat din cele 120.000 programate, in ultima confruntare intre oameni si masini de la Universitatea Carnegie Mellon din Pittsburgh. Rezultatul este pana acum strivitor in favoarea lui Libratus (masina care se pare ca si-a facut si un cont pe Twitter, de unde rade de noi): oamenii au pierdut 34,33 buyin-uri, adica 5,88 blinduri la suta de maini impotriva celui mai performant bot de poker din toate timpurile. Adversarii umani sunt jucatori de top la formatul Texas Hold'em No Limit Headsup (Jason Les, Dong Kim, Daniel McAulay si Jimmy Chou) si pana acum au pierdut cu un winrate de peste.
Doua consolari mai avem: partida, programata intre 11 si 30 ianuarie, e abia la jumatatea drumului. Mai sunt inca sanse sa nu scapam din mana ultima jucarie cu care ne laudam in fata inteligentei artificiale. A doua consolare este ca, intr-un mediu de joc cu rake, cele 5,88 de blinduri cu care este in fata Libratus ar fi decimate serios de taxa camerei (la mize mici si oamenii si robotul ar iesi pe minus), asa incat, chiar daca cei patru iau bataie, macar stim ca nici capra vecinului nu o duce prea bine.
Ca o paranteza, inteligenta artificiala nu functioneaza ca laptopul nostru, pe baza unor algoritmi de tipul "daca > atunci". Un nucleu AI este de fapt un creier electronic dotat cu neuroni organizati ierarhic. Toti neuronii isi transmit deciziile in sus pe scara ierarhica si sunt recompensati sau pedepsiti cu o putere mai mare sau mai mica de decizie, in functie de corectitudinea estimarilor personale. Astfel, reteaua neurala (nu "neuronala", asa cum e numit un creier biologic) se antreneaza. Si se poate antrena la nesfarsit pe o sarcina primita, caci nu se plictiseste si nu se odihneste. Libratus s-a antrenat 15 milioane de ore cumulate pentru aceasta partida, iar acum continua antrenamentul cu noile date din partida curenta, intr-un razboi dur al adaptarii si readaptarii.
Insa ambele tabere se adapteaza dinamicii partidei, zi de zi. Daca Libratus foloseste 24/24 super-computerul universitatii pentru a calcula si dezvolta strategii impotriva celor patru, nici acestia nu dorm. Ei se aduna dupa partida si discuta noile tendinte ale robotului, dezvoltand strategii de contracarare.
Este de remarcat ca Libratus nu a invatat poker analizand maini reale. El a primit regulile si instructiunile pe baza carora si-a dezvoltat propria strategie generala de comportament intr-un mediu concurential cu informatie incompleta, strategie pe care o aplica la poker, dar pe care o poate aplica la orice: la evolutia pietelor financiare, la estimari meteorologice, la sicanele pe care ni le joaca unele boli si la alte domenii unde oamenii gresesc deoarece natura le ofera "informatie incompleta". Asadar, scopul partidei este unul care depaseste cu mult orgoliul nostru de jucatori de poker, caci un robot bine antrenat in acest domeniu va putea sa ne ofere un ajutor esential in domenii care pana acum scapau controlului nostru.
Si intrebam iarasi: cu cine sa tinem? O victorie a oamenilor ne-ar mai mangaia orgoliul inca un an (caci cei de la Carnegie Mellon sunt neobositi in proiectarea de masini AI), iar o victorie a lui Libratus ar deschide noi directii de cercetare, menite sa ne faca viata mai sigura si mai buna. Deci situatia e "win-win".
Nu in ultimul rand, partida este nepretuita pentru cei care vor sa invete jocul. Meciurile se transmit aici si va invitam sa le urmariti cu atentie, caci nu exista mod mai bun de antrenament.
Ramaneti alaturi de noi pentru a afla primii cele mai bune informatii, strategii si promotii din poker facandu-va cont pe Pokernews Romania sau direct de pe Facebook! Urmariti-ne pe iOS, Android sau iPad.