Wissensartikel
08:08 Uhr, 08.07.2017

Dieser Poker-Computer könnte der nächste Super-Trader werden!

Das war schon eine kleine Sensation, als der Poker-Computer „Libratus“ Anfang des Jahres gegen vier Profi-Spieler in einem Turnier gewann und dabei 1,7 Millionen Dollar erspielte.

Bislang galt vor allem die Poker-Variante „Texas Hold'Em“ als zu komplex für eine künstliche Intelligenz, da durch die verdeckten Karten ein Zustand „nicht-perfekter Informationen“ vorliegt. Eine Herausforderung, der auch Trader jeden Tag an den Finanzmärkten begegnen.

Um beim Poker erfolgreich zu sein, braucht es nicht nur eine langfristige „Betting-Strategy“, also das Kennen des eigenen statistischen Vorteils, sondern auch ein grundlegendes Wissen der Spieltheorie und eine Prise Intuition bei der Einschätzung der Gegenspieler.

Es gibt einige Parallelen zwischen dem Trading und Poker, vor allem was den „Spiel-Charakter“ betrifft. Poker ist einfach zu erlernen, jeder kann daran schon mit kleinen Einsätzen teilnehmen und viele spielen einfach für den „Kick“ des Gewinnens und Verlierens.

Nur wenige Spieler wollen wirklich lernen, wie man systematisch durch die Auswertung der eigenen Erfahrungen bessere Fähigkeiten aufbaut.

Übrigens funktioniert genau so die Logik des Super-Computers Libratus.

Der Poker-Computer analysiert mögliche Spielzüge, reduziert diese auf die mit den besten Wahrscheinlichkeiten und setzt dann entsprechende Beträge.

Für mich faszinierend (und auch ein bisschen beängstigend) daran war, dass der Computer durch diese Logik auch anfing zu „bluffen“ - also Geldbeträge auf schlechte Karten in guten Ausgangssituationen setzte. Ein Verhalten des Täuschens und „Lügens“, das ich so bisher als rein menschlich betrachtet hatte.

Die Strategie von Libratus nennt sich „Reinforcement-Learning“ - also verstärkendes Lernen. Ein Ansatz, den wir auch in der Trading-Ausbildung anwenden: Besseres Trading durch positives Denken.


Hinweis: Nächste Woche beginnt meine erste Online-Trader-Ausbildung: Mein 5-Tage-Online-Coaching nach Feierabend


Der Erfolg des Computers basierte natürlich auch auf seiner Rechenkapazitität. Er traf immer die statistisch beste Wahl - einer Herausforderung, der wir auch beim Trading immer wieder begegnen und die uns manchmal an die Grenzen unserer Entscheidungskräfte bringt.

Ich hatte im Zusammenhang von Trefferquote und Qualität eines Tradingsignals schon mal einen Artikel darüber geschrieben, wie schwer es unserem menschlichen Gehirn fällt mit statistischen Aussagen umzugehen: Handelsstrategien (Teil 5): Das "Death-Cross"-Signal

Dem Computer Libratus gelang letztlich der Durchbruch im Poker-Turnier, weil er in der Lage war, aus seinen Erfahrungen und Fehlern zu lernen.

Zur Vorbereitung des Turniers ließen die Wissenschaftler den Computer unglaubliche 16 Millionen Stunden trainieren (das sind umgerechnet etwas über 17.000 Jahre). Möglich machen das sogenannte Super-Computer mit extremen Rechenleistungen.

Nach dem ersten Spieltag, an dem die menschlichen Profi-Spieler dem Computer noch überlegen waren, ließen die Wissenschaftler ihren Computer auch in der Nacht weiter trainieren.

Während die Profi-Spieler schliefen, trainierte Libratus nochmal 4 Millionen Stunden und verarbeitete die Erfahrungen des ersten Spieltages.

Am nächsten Morgen schon saßen die Spieler einer künstlichen Intelligenz gegenüber, der aus seinem Fehler gelernt hatte und die Schwäche des Vortages nicht mehr spielte.

Daniel McAuley, einer der Profi-Spieler sagte hinterher: „Es schien, als lernte er [Libratus] die ganze Zeit wie wir uns verhielten und nutzte das kurze Zeit später aus. Kein Mensch kann das.“

Ein wesentlicher Erfolgfaktor beim Poker ist die Kenntnis des eigenen statistischen Vorteils, aber auch das kontinuierlichen Lernen aus der Beobachtung des aktuellen Spielverlaufs. Gerade hier sind die Parallelen zum Trading faszinierend. Letztlich geht es ja auch in unserem Geschäft immer wieder darum, sich auf die aktuellen Bedingungen einzustellen und den Markt und nicht die eigene Meinung zu traden.

Übrigens haben die Entwickler von Libratus schon durchblicken lassen, dass ihr Ansatz des kontinuierlichen Lernens nicht nur beim Poker funktioniert. Bald wollen sie Libratus schon bei der Suche nach wirksamen Arzneimitteln oder bei Unternehmensverhandlungen einsetzen. Der Weg zur Börse dürfte dann für Libratus nicht mehr weit sein, wenn er nicht dort schon längst in ähnlicher Form aktiv ist.

Viele Grüße
Jakob Penndorf

Mein 5-Tage-Online-Coaching nach Feierabend im Juli.

10 Kommentare

Du willst kommentieren?

Die Kommentarfunktion auf stock3 ist Nutzerinnen und Nutzern mit einem unserer Abonnements vorbehalten.

  • für freie Beiträge: beliebiges Abonnement von stock3
  • für stock3 Plus-Beiträge: stock3 Plus-Abonnement
Zum Store Jetzt einloggen
  • Mr. O
    Mr. O

    Ja Sascha, sehr coole Sache, aber nur so lange bis so ein Rechner Deinen Job übernimmt.

    15:52 Uhr, 07.07.2017
    2 Antworten anzeigen
  • Sascha Huber
    Sascha Huber Experte für Kryptowährungen

    Sehr coole Sache!!

    11:45 Uhr, 07.07.2017