All In: Kunstlik Intelligentsus Võidab Maailma Parima Pokkerimängija

{h1}

Libratus'is tuntud tehisintellekti algoritm on võitnud maailma suurimaid pokkerimängijaid tohutul turniiril.

Maailma parim tehisintellekti pokkerimängija näib täpselt teada, millal hoida neid ja millal need kokku panna.

Libratu järgi tuntud tehisintelligentsusprogramm on võitnud maailma absoluutsed parimad pokkerimängijad 20-päevase No-Limit Texas Hold'em turniiril, võites Pittsburghi Riversi kasiino järgi neli oponentit pokkerimänge kasutades umbes 1,77 miljonit dollarit. "Brains vs. Tehisintellekti" pokkeriturniir peeti.

Iga päeva lõpus hukkus vähemalt üks inimestest AI-programm. Kuid lõpuks ei piisa.

"Me hindame nende rasket tööd, kuid kahjuks võitis arvuti," ütles Rivers Casino peadirektor Craig Clark.

Arvutiteadlased saavad nüüd lisada Texas Hold'emi üha enam mängude loendisse - sh male, Go ja "Jeopardy!" - kus AI saab võita maailma parimat inimest konkurenti. [Super-intelligentsed masinad: 7 robotfutuurid]

Tehis-intelligentsus edenedes

Alates 1997. aasta IBMi Deep Blue-i meisterlikust male-mängija Garry Kasparovist on robotid inimestele hoogustunud. Möödunud aastal oli AI maailmas šokeeritud, kuna ta võitis musta ja valget kivimit sisaldava strateegia mänguga maailma parimaid Go mängijaid mängude komplekti. Ülesanne oli nii raske, sest Go sisaldab rohkem potentsiaalseid käiku kui universum aatomid. Selle probleemi lahendamiseks kasutas AlphaGo tuntud arvuti sügavõpetusstrateegiat, õrnalt võimas meetodit, mis hõlmas arvutuste arvutamist ühes kihis ja seejärel söötmist algoritmis teisele kihile.

Ja veel, Texas Hold'em on paljudel juhtudel veelgi raskemad, ütles Carnegie Melloni Ülikooli arvutiteadlane Tuomas Sandholm, kes aitasid kujundada Libratusit ja aitasid korraldada turniiri. (Heads-Up Texas Hold'em'is on kahel mängijal kaks kaarti ja seejärel on need parimad käed viiest kaardist, mis lõpuks lauale asetatakse nägu ülespoole mitme mängu vältel. Pärast iga kaardi pööramist, mängijad saavad helistada või sobitada teise mängija panust, tõsta panust või panna oma kaarte või loobuda.)

Tundub, et seda tüüpi mängud võivad olla isegi keerukamad kui õppimise käivitamine, kus iga mängija tunneb teise positsiooni ideaalselt. [5 Intrigeerivad kasutusviisid tehisintellekti jaoks (mis ei ole killerrobotid)]

"Sellistes mittetäieliku teabe mängudes nagu pokker, on see palju raskem," ütles Sandholm WordsSideKick.com.

Näiteks, kujutage ette, et mängite vastase vastu kätt. Peate mitte ainult mõtlema käe ajdele, vaid kaaluma ka seda, mis teisel mängijal on, mida ta võidab, mis tema panus ütleb sulle tema kaartide kohta ja mida ta püüab oma ennustustega õppida.

Nii et Sandholm ja tema kolleegid tuginesid Libratuti programmi teistsugusele kontseptsioonile. Tuntud kui Nashi tasakaalu, on see matemaatiline viis, kuidas määrata kindlaks parim mängustrateegia, et maksimeerida oma tasumisi, minimeerides samal ajal vastaseid. Ükskõik millises pokkeri käes juhuslik juhus eeldab, et Nashi tasakaalu mängimine võib kaotada, kuid paljud käed mõjutavad Nashi tasakaalu strateegia "ületamatut mängimist", ütles Sandholm.

Kuid "mängul on kümme 160 erineva olukorra võimsust", mis tähendab, et see sisaldab palju rohkem arvutusvõimalusi kui Go. Selle tulemusena ei suuda programm välja arvutada täiusliku Nashi tasakaalu lahendust, vaid peab selle asemel olema ligikaudne.

Varem on see komistuskiviks. Libratus osales 2015. aastal pokkeriüritusel ja ei suutnud inimesi võita, kuna mängu lõpeb statistiline lüli. Kuid hiljutisel turniiril kasutatud Libratuti täiustatud versioonil on parem otsustusvõime strateegia, ütles Sandholm.

Turniir

"Brains vs. Artificial Intelligence" turniiril võtsid neli maailma parimaid pokkerimängijaid 120 000 pokkeris käega vastu üksinda Libratuti vastu. Kaalul oli 200 000 dollarit pot, mille inimesed mängisid isegi siis, kui nad kaotasid.

"Nad on professionaalid, nii et nad võitlesid kibedalt, tõesti raske," ütles Sandholm. "Nad õppisid oma arvutite juures igal õhtul tõesti kõvasti, püüdes leida AI-des avasid."

Lõpuks polnud see võistlus: AI võitis.

Planeerimise käigus osutus bluffimine loomulikult matemaatiliselt usaldusväärseks strateegiaks, märkis Sandholm.

Selle võit sisaldas ka üllatusi. Näiteks oli AI inimestest suurema tõenäosusega ülemäära suurema tõenäosusega - see tähendab, et nad panustavad panga kolme, viie või isegi 20-kordse žetoonide hulka. Huvitav on see, et need üleküpsed mõnikord on matemaatiline tähendus kahel väga erinevates olukordades.

"Väga tugeva käega ja kõige nõrgemate kätega tahad teha need suured üleküpsud," ütles Sandholm.

Sandholm ütles, et Libratus on ka tõenäolisem kui inimestel mõnel üllataval olukorras. Ja igal õhtul läks ta koju ja kohandas oma strateegiat vastavalt kätele, mida ta oli mänginud.

"Kohanemiseks ei olnud õppida vastast ära kasutama, vaid pigem määrati, milliseid auke vastane oli leidnud AI-strateegias, ja automaatselt parandasid neid auke," ütles Sandholm.

Siiski on lootus ainult surelike jaoks. Heads-Up Texas Hold'emis konkureerivad kaks mängijat. Kuid Libratusel pole aimugi, kuidas võita mängijat pokkerimängus viie või kuue mängijaga. Sandholmi sõnul ei tööta Nashi tasakaalu lahendused.

"Ma ütleksin, et peamised inimesed midagi sellist oleksid tõenäoliselt paremini kui parimad AI-d," ütles Sandholm.

Algselt avaldatud WordsSideKick.com.


Video Täiendada: .




ET.WordsSideKick.com
Kõik Õigused Reserveeritud!
Mistahes Materjalide Reprodutseerimine Lubatud Ainult Prostanovkoy Aktiivne Link Saidile ET.WordsSideKick.com

© 2005–2019 ET.WordsSideKick.com