Tehisintellekt "Võidab Kõige Keerulisema Inimese Poolt Välja Töötatud Mängu"

{h1}

Google'i sügava meele kunstliku luure süsteem on võitnud professionaalse go mängija, lahendades ühe suurema väljakutse selles valdkonnas.

Tehke teed robotile.

Tehase luure süsteem on võitnud professionaalse Go mängija, kes purustas ühe pikaajalise suure väljakutse selles valdkonnas. Veelgi enam, uus süsteem, mida nimetatakse AlphaGoks, võitis inimestööjõudu, õppides mängu nullist, kasutades lähenemisviisi tuntud kui "sügavat õppimist", kaasatud teadlased ütlevad.

Uimast lüüasaamist näitavad teadlased, et uus tehisintellekti õppimise strateegia võiks olla võimas vahend teistel arenatel, näiteks analüüsida kliimandmete reamsi, millel pole ilmset struktuuri ega keerukaid meditsiinilisi diagnoose.

Uurijad teatasid uutest matchupist täna (27. jaanuar) veebiajakirjas Nature. [Super-intelligentsed masinad: 7 robotfutuurid]

Mees versus masin

Alates sellest, kui IBM Deep Blue võitis 1997. aastal oma ikooniks võidujooksu Gary Kasparoviga, on AI-i teadlased vaikselt robotid käepärased, kes oskavad üha rohkem inimesi mängida. Aastal 2014 võitis IBM Watson Jeopardy! meister Ken Jennings, ja eelmisel aastal arvuti Claudico - mis võib "bluffida" läbi Heads-Up No-Limit Texas Hold 'em - andis inimese pokkerimängijatele oma raha Pittsburghi kasiinos.

Kuid Go oli palju raskem mutter puruneda. Hiinast pärit strateegiline mäng, mis oli umbes 2500 aastat tagasi, põhineb petlikult lihtsatel reeglitel. Mängijad asetavad valgeid ja mustaid kive suurel võrguplaadil, et ümbritseda enamiku territooriumi. Ühe värvi kivid, mis võivad puudutada teisi sõbralikke kive, on öelnud, et need on elus, samas kui need, kelle evakuatsiooniteed on katkenud, on surnud.

Kuid lihtsate reeglite taga seisab mäng, mis on uskumatult keeruline. Parimad mängijad veedavad mängu igapäevaelu, õppides tundma selliste käitumiste järjestusi nagu "redel", töötades välja strateegiad, mille abil vältida lõputuid lahinguid territooriumil nimega "ko sõjad" ja töötades välja ebauskliku võime vaadata Goi ja teadke kohe, millised tükid on elus, surnud või lõdvalt.

"See on tõenäoliselt kõige keerukam mäng inimestele," selgitas eile (26. jaanuaril) pressikonverentsil kaasasutaja, arvutiteadlane Demis Hassabis Londonis Google DeepMindis. "Sellel on võimsus 10 võimsusega 170 võimalikku parda positsiooni, mis on suurem kui universumis olevate aatomite arv."

Selle keerukuse võti on Goi "hargnemismudel", ütles Hassabis. Igal mängijal on võimalus valida 200 käigust igal käigul, võrreldes 20 võimaliku käiguga males turniiril. Lisaks pole lihtsat vaadet juhatusel ja kvantifitseerida, kui hästi mängija mängib igal ajahetkel. (Seevastu inimesed saavad põhjalikku ettekujutust sellest, kes on võitnud malemängu, lihtsalt määranud punktiväärtused kõikidele mängudele, mis on veel mängitud või hõivatud, ütles Hassabis.)

Selle tulemusena on parimad AI-süsteemid, näiteks IBMi Deep Blue, suutnud võita ainult amatööril olevaid inimese Go-mängijat. [10 tehnoloogiaid, mis muudavad teie elu]

Sügav õppimine

Minevikus on eksperdid õpetanud AI-süsteemide konkreetseid samme või taktikalisi mustreid. Selle meetodi asemel harrastab Hassabis ja tema kolleegid programmi, mida nimetatakse AlphaGoks, ilma eelnevalt arusaadavate mõistedeta.

Programmis kasutatakse lähenemist, mida nimetatakse sügavateks õppetükkideks või sügavatele neuronitevõrkudele, kus arvutused toimuvad mitmes hierarhiliselt organiseeritud kihis, ja programm toidab sisendit madalamal tasemel igasse järjestikku kõrgemale kihti.

Sisuliselt jälgis AlphaGo "miljonite Go mängude vahel inimesi mängureeglite ja põhistrateegia õppimiseks. Seejärel mängis arvutis uusi miljoneid teiste mängude vastu, et leiutada uusi Goi strateegiaid. Teadlased ütlesid, et AlphaGo lõpetas omalt poolt kohalike sammude baasjärjestuste omandamise, et mõista suuremaid taktikarakte.

Selle ülesande täitmiseks tugineb AlphaGo kahele närvivõrgustikule - väärtusvõrgule, mis põhiliselt vaatab parda positsioone ja otsustab, kes võidab ja miks, ja poliitikavõrku, mis valib käigud. Aja jooksul koolitati poliitikavõrgustikke väärtusvõrgud, et näha, kuidas mäng oli edenenud.

Erinevalt varasematest meetoditest, mis püüdsid arvutada kasu igast võimalikust liikumisest jõuga, kaalub programm ainult parimat võitu võitlevat käiku, ütlevad teadlased, mis on lähenemine, mida head inimesed kasutavad.

"Meie otsingut vaadates tulevad mängu mängides mitu korda oma kujutlusvõimesse," ütles pressikonverentsil kõnelevas Google DeepMindi arvutiteadlane David Helge. "See muudab AlphaGo otsingu palju inimlikumaks kui eelmised lähenemised."

Kogu inimelu lüüatus

Inimest õppimine näib olevat võitnud strateegia.

AlphaGo võitis rivaali AI-süsteeme umbes 99,8 protsenti ajast ja võitis turniiril valitseva Euroopa Go'i meistrivõistluse, võites kõik viis mängu. Teiste AI-süsteemide vastu võib programm käivitada tavalise lauaarvutiga, kuigi turniiril Hui vastu võitlemise meeskond kiirendas AlphaGo töötlemisvõimsust, kasutades arvutuslikku tööd jagades umbes 1200 keskprotsessorit (CPU).

Ja AlphaGo pole veel inimestega lõppenud. Ta on seadnud oma vaatamisväärsused Lee Sedolile, maailma parimale Go mängijale, ning nägemisvõistlus on kavandatud mõne kuu pärast.

"Sa võid mõelda teda Roger Federer of the Goi maailmas," ütles Hassabis.

Maailma paljud olid hämmeldust saanud hämmeldunud - ja ikkagi avaldasid lootust ainult surelikele, kes seisavad märtsis AlphaGo vastu.

"AlfaGo jõud on tõeliselt muljetavaldav! Mul oli küll üllatunud, kui kuulsin Fan Hui kaotust, kuid tundub, et mänguregistreid on näha rohkem," ütles Rahvusvahelise Minge Konföderatsiooni peasekretär Hajin Lee. "Minu üldine mulje oli see, et AlphaGo tundus tugevam kui Fan, kuid ma ei oska öelda, kui palju. Ma kahtlen, et see on piisavalt tugev, et mängida maailma tippspetsialisatsioone, kuid võib-olla muutub see tugevamaks, kui ta seisab silmitsi tugevama vastasega."

Jälgi Tia Ghose'i Twitterja Google+. Jälgi WordsSideKick.com @wordssidekick, Facebook & Google+. Originaal artikkel on WordsSideKick.com.


Video Täiendada: .




ET.WordsSideKick.com
Kõik Õigused Reserveeritud!
Mistahes Materjalide Reprodutseerimine Lubatud Ainult Prostanovkoy Aktiivne Link Saidile ET.WordsSideKick.com

© 2005–2019 ET.WordsSideKick.com