Το Facebook ανέπτυξε bot που παίζει… πόκερ

15:52 14/7/2019 - Πηγή: Fortune

του Aaron Pressman

Τα bot εισέρχονται πλέον και στον κόσμο του πόκερ. Ναι, είναι αλήθεια. Μια ομάδα ερευνητών τεχνητής νοημοσύνης στο Πανεπιστήμιο Carnegie Mellon σε συνεργασία με το Facebook ανέπτυξαν ένα bot που παίζει πόκερ. Το όνομά του: Pluribus. Και φαίνεται ότι τα πήγε πολύ καλύτερα από κάποιους από τους κορυφαίους παίκτες πόκερ στον κόσμο. Το Pluribus έμαθε πρώτα να παίζει μέσω της μηχανικής μάθησης, και

στη συνέχεια απέδειξε την αξία του σε παρτίδες Texas Hold’em των έξι παικτών.

Όπως κάθε καλός ανθρώπινος παίκτης, το Pluribus κάποιες φορές θα μπλοφάρει, αλλά κερδίζει παρόλο που δεν μελετάει τις τάσεις των αντιπάλων παικτών για να προσαρμόσει τη στρατηγική του – όπως θα έκαναν οι περισσότεροι παίκτες. Και κάπως έτσι, το παλιό ρητό του πόκερ ότι «παίζεις τον άνθρωπο, όχι τα χαρτιά» ίσως πρέπει να αναθεωρηθεί. «Εν τέλει, έβγαλε αρκετά λεφτά παίζοντας εναντίον κορυφαίων επαγγελματιών παικτών. Νομίζω ότι αυτό σημαίνει πως το συγκεκριμένο κλισέ είναι – τουλάχιστον εν μέρει – λάθος» έγραψε ο ερευνητής Noam Brown σε μια ενδιαφέρουσα διαδικτυακή συζήτηση που διεξήχθη στην ενότητα σχολίων του Hacker News.

Δεν προκαλεί έκπληξη που ένα μαθηματικά πανίσχυρο μηχάνημα μπορεί να κερδίζει στο πόκερ, δεδομένων των άλλων παιχνιδιών τα οποία έχουν ήδη κατακτηθεί από bots. Όμως, είναι αξιοσημείωτο το γεγονός ότι το Pluribus εκπαιδεύτηκε σε συνηθισμένες υπολογιστικές υποδομές, χρησιμοποιώντας πόρους υπολογιστικής cloud αξίας μόλις 150 δολαρίων. Προηγούμενες παρεμφερείς προσπάθειες απαίτησαν σαφώς μεγαλύτερη ισχύ· για παράδειγμα, το DeepMind της Google που κυριάρχησε στο Go το 2016 χρειάστηκε 1.200 CPU και 176 GPU.

Το δεύτερο αξιοσημείωτο στοιχείο είναι η απόφαση της ομάδας που βρίσκεται πίσω από το Pluribus να μην το διαθέσει στο διαδίκτυο και να μην δημοσιοποιήσει τον κώδικα για να το μελετήσουν οι ειδικοί του πόκερ. «Ουσιαστικά, όλο αυτό αφορά την προαγωγή της τεχνητής νοημοσύνης και όχι την κατασκευή ενός bot για πόκερ» σημείωσε ο Brown. Αυτό σημαίνει ότι θα πρέπει να συνεχίσουμε να λαμβάνουμε εμείς τις αποφάσεις που αφορούν μια παρτίδα πόκερ, χωρίς τη βοήθεια της γνώσης που ενσωματώθηκε στο Pluribus.

Keywords
Τυχαία Θέματα