Latihan menjadi sempurna, bahkan jika Anda adalah kecerdasan buatan.

Ini adalah premis dari percobaan yang dipimpin oleh Michael Bowling dari University of Alberta, yang membuat sebuah program bernama Cepheus untuk memainkan satu triliun (ya, satu triliun) tangan variasi poker. Idnpoker disebut Texas Hold’Em dengan batas kepala. melawan dirimu sendiri. Cepheus berjalan pada 4.600 prosesor, melihat 6 miliar tangan per detik, belajar dari setiap kemenangan, perpecahan, dan kekalahan. Setelah setara dengan 1.000 tahun CPU dalam 70 hari sebenarnya, Cepheus telah memainkan lebih banyak poker daripada seluruh umat manusia.

Dalam sebuah artikel yang diterbitkan di jurnal Science, tim Bowling mengumumkan bahwa dengan Cepheus, mereka secara efektif “menyelesaikan” batasan Texas Hold’Em head-to-head – yang berarti keputusan acara tersebut sangat dekat dengan kesempurnaan sehingga tidak ada cara lain. . untuk melihat apakah Texas Hold’Em secara teoritis bisa menjadi orang yang sempurna bermain 200 tangan per jam, 12 jam sehari selama 70 tahun. Definisi yang agak kabur dari ahli statistik tentang “menyelesaikan” permainan diperlukan karena Cepheus tidak benar-benar tak terkalahkan sama sekali – justru karena ada unsur keberuntungan yang tidak dapat diminimalkan dalam permainan. tangan.

Keputusan program sangat dekat dengan kesempurnaan sehingga tidak ada cara untuk mengetahui apakah manusia yang sempurna secara teoritis bisa berbuat lebih baik.

“Skenario terburuknya adalah ketika Anda memiliki tangan yang bagus dan lawan Anda memiliki tangan yang lebih baik,” kata Mike Johanson, rekan penulis studi. “Kamu pikir kamu akan menang, jadi kamu bertaruh banyak dan kemudian kehilangan banyak uang.”

Tapi begitu efek kebisingan stat habis lebih dari ribuan tangan, keterampilan Cepheus memastikan bahwa dia tidak akan rugi lama. Dalam versi Texas Hold’Em yang digunakan dalam penelitian, 2 pemain (“Head to Head”) bersaing dengan memasang taruhan tetap (“terbatas”), dengan 2 kartu tersembunyi. Yang benar-benar baru di sini adalah Cepheus harus belajar membuat keputusan meski memiliki “informasi yang tidak sempurna” tentang kartu yang dipegang lawannya.

Meskipun ilmuwan komputer telah memecahkan permainan “informasi sempurna” seperti Connect Four atau Checkers, di mana komputer memiliki pengetahuan penuh tentang gerakan sebelumnya dan kemungkinan hasil. Untuk masa depan, penelitian Alberta adalah solusi pertama untuk permainan informasi tidak sempurna nontrivial yang dimainkan oleh manusia.

“Dan Cepheus harus belajar cara bermain tanpa bantuan ahli manusia,” kata Johanson. “Kami mengajarinya aturan, dan dia dilatih untuk bekerja melawan dirinya sendiri, memikirkan trik psikologis yang rumit seperti cara memperlambat dan menggertak.”