Bots, Neuronale Netze und RNG-Integrität

Backgammon war das erste komplexe Zwei-Personen-Spiel, in dem ein Computer nachweislich die besten menschlichen Spieler schlagen konnte. Der Beweis wurde 1992 veröffentlicht — vier Jahre, bevor Deep Blue Kasparov besiegte, und vierundzwanzig Jahre vor AlphaGo — und kam von einem einzigen neuronalen Netzwerk, das durch Selbstspiel bei IBM Research trainiert wurde. Die Linie von diesem Programm — Gerald Tesauros TD-Gammon — über Jellyfish, Snowie, GNU Backgammon, eXtreme Gammon (XG), BGBlitz bis hin zu den modernen Open-Source-Engines bildet die technische Geschichte des Computer-Backgammons.

Diese Seite verfolgt diese Linie, erklärt, wie moderne Bots ausgewertet werden, dokumentiert die ursprüngliche GamesGrid-Bot-Familie von 1996 bis 2008 und legt unsere Position zur Integrität des Zufallszahlengenerators dar — inklusive des Mersenne-Twister-Algorithmus, den wir nutzen, und eines dokumentierten Gegenbeispiels aus der Betreibergeschichte von Online-Backgammon.

Die englischsprachige Performance Rating (PR) & ELO-Seite deckt den Standard-Rahmen zur Skill-Messung ab, den die gesamte moderne Wettkampf-Szene nutzt.

1. Die Engine-Zeitlinie

Die Bot-Geschichte des Backgammons verläuft in fünf unterscheidbaren Phasen. Jede Phase entspricht einem grundlegend anderen Ansatz zur Stellungsbewertung.

Phase	Ansatz	Repräsentative Engine	Jahr
Vor-neuronal	Von Hand kodierte Heuristik und Rollouts	BKG 9.8 (Berliner)	1979
Erste NN-Generation	Temporal-Difference-Selbstspiel auf flachen Netzwerken	TD-Gammon	1992
Kommerzielle NN	Ausgereifte kommerzielle Neuronale-Netz-Programme	Jellyfish, Snowie	1994–1998
Open-Source-NN	Gemeinschaftlich gebaut, frei nutzbar	GNU Backgammon	2002+
Moderne Referenz	Tiefere Netze, größere Feature-Sets, schnellere Rollouts	eXtreme Gammon (XG), BGBlitz, Wildbg	2009+

1.1 Vor-neuronal: BKG (Hans Berliner, 1979)

Das erste Computerprogramm, das einen amtierenden Weltmeister in einem komplexen Brettspiel schlug, war BKG 9.8, geschrieben von Hans Berliner an der Carnegie Mellon University. 1979 besiegte es Luigi Villa, den amtierenden Backgammon-Weltmeister, in einem Geld-Match in Monte Carlo. Der Sieg wurde — zurecht — zum Teil auf außergewöhnliche Würfel zurückgeführt; Berliner selbst schrieb, dass sein Programm über eine größere Stichprobe vermutlich schwächer als Villa sei. Aber das Ergebnis stand: Die Ära "Computer können kein Backgammon spielen" war vorbei, bevor die nächste Phase richtig begann.

BKG bewertete Stellungen mit von Hand kodierten Heuristiken: Merkmale wie Prime-Länge, Blot-Belastung und Pip-Count, gewichtet durch Parameter, die Berliner an repräsentativen Teststellungen kalibriert hatte. Es gab keine Lern-Komponente. Es war das stärkste nicht-lernende Programm, das je für das Spiel gebaut wurde.

1.2 TD-Gammon (Tesauro, IBM Research, 1992)

Der Durchbruch kam aus einem anderen Paradigma. Gerald Tesauro bei IBM Research wandte Temporal-Difference-Reinforcement-Learning auf Backgammon an. Sein Programm, TD-Gammon, war ein Feedforward-Neuronales-Netzwerk mit einer 198-Einheit-Eingangsschicht, die das Brett kodierte (4 Einheiten pro Punkt pro Farbe für die Stein-Verteilung, plus 6 zusätzliche Einheiten für die Bar, ausgewürfelte Steine und die Seite am Zug), das in eine einzige verborgene Schicht von 40 bis 80 Sigmoid-Einheiten je nach Version führte (TD-Gammon 2.1 nutzte 80 verborgene Einheiten). Es wurde durch Selbstspiel trainiert — das Programm spielte hunderttausende Partien gegen sich selbst, und passte nach jedem Zug seine Gewichte an, um seine Bewertung der Stellung vor dem Zug näher an seine Bewertung der Stellung nach dem Zug zu bringen.

Das bemerkenswerte Ergebnis, veröffentlicht 1992 und bis 1995 verfeinert, war, dass TD-Gammon wettkampftaugliche Eröffnungen entdeckte, die Jahrzehnten menschlicher Theorie widersprachen. Die Rollout-Analyse, die durch TD-Gammon angestoßen und in den Folgejahren durch Jellyfish und Snowie konsolidiert wurde, kippte den slot-lastigen Konsens der Siebzigerjahre auf verschiedenen Eröffnungswürfen zugunsten von Split-Builder-Zügen (unter anderem auf 2-1, 4-1 und 5-1). Der Standard, den heute jeder ernsthafte Turnierspieler auf verschiedenen Eröffnungswürfen spielt, wurde teilweise durch diese erste Welle der Neuronalen-Netz-Analyse gesetzt. Siehe die Eröffnungswürfe-Seite.

1.3 Jellyfish, Snowie, GNU Backgammon (1994–Anfang Zweitausender)

Das erste kommerzielle NN-Programm war Jellyfish, veröffentlicht von Fredrik Dahl im Jahr 1994. Jellyfish folgte einer TD-Gammon-ähnlichen Architektur (ein Feedforward-Netzwerk mit einer verborgenen Schicht) und war jahrelang das stärkste öffentlich verfügbare Programm. Snowie, veröffentlicht 1998, nutzte ein verfeinertes Netzwerk und fügte einen ausgereiften Cube-Aktion-Analyzer hinzu; es war die dominierende kommerzielle Engine der späten Neunziger.

GNU Backgammon (auch GNUbg oder gnubg) ist der Open-Source-Erbe dieser Linie. Die Entwicklung begann in den späten Neunzigern; große Releases stabilisierten sich Anfang der Zweitausender. Die Bewertung von GNUbg ist ein Multi-Layer-Feedforward-Netz, trainiert auf Rollouts von Millionen Stellungen; die 0-Ply-, 1-Ply-, 2-Ply- und 3-Ply-Bewertungsmodi geben Wettkampfspielern eine Bandbreite an Geschwindigkeit/Genauigkeit-Abwägungen zur Analyse. GNU Backgammon veröffentlicht zudem die Standard-Referenz-Match-Equity-Tabelle (Rockwell-Kazaross MET), die die breitere Gemeinschaft nutzt.

1.4 eXtreme Gammon (XG) und danach (2009+)

eXtreme Gammon, veröffentlicht 2009 von Xavier Dufaure de Citres, ist die aktuelle Weltreferenz. XG kombiniert ein tieferes neuronales Netz mit optimierten Rollouts, einem integrierten Cube-Aktion-Analyzer und der meistgenutzten Analyse-Benutzeroberfläche der Wettkampfszene. XG2 (die große Revision) ist der Bot, gegen den moderne PR-Ratings meistens geeicht werden. Performance Ratings auf Turnierniveau werden routinemäßig gegen XG2-Rollouts bei 4-Ply-Truncation geeicht.

BGBlitz, von Frank Berger, ist eine unabhängige NN-Engine in aktiver Entwicklung. Wildbg, eine Open-Source-Rust-basierte Engine aus 2023, fällt weniger durch rohe Spielstärke auf als durch Trainings-Transparenz — die Trainings-Pipeline ist öffentlich nachprüfbar, und die Engine ist zu einer Forschungsplattform geworden, auf der verschiedene Netzwerkarchitekturen und Trainingsstrategien getestet werden. Diese Transparenz-Philosophie schließt nahtlos an unsere eigene RNG- und Analyse-Stack-Dokumentation unten an.

2. Wie Bots Partien analysieren: die FIBS / GamesGrid → GNUbg-Pipeline

Der Standard-Workflow im Wettkampf-Backgammon — von 1996 bis heute — besteht darin, Partien online zu spielen, sie in einem standardisierten Textformat zu exportieren, und sie im Nachhinein in einer Neuronalen-Netz-Engine zu analysieren. Die ursprüngliche Pipeline:

Spiel die Partie auf FIBS, GamesGrid oder einem vergleichbaren Server.
Exportiere die Partie in eine Textdatei im SGF- oder JF-Format (Jellyfish). FIBS unterstützte den Export über den oldboard-Befehl; GamesGrid hatte eigene Export-Funktionalität.
Importiere die Partie in Jellyfish, Snowie, GNU Backgammon oder (später) XG.
Analysiere auf gewählter Bewertungstiefe — meist 2-Ply für die tägliche Auswertung, volle Rollouts für ernsthaftes Studium.
Bericht mit Fehlerraten pro Zug, pro Cube-Entscheidung und einem Gesamt-Performance-Rating für die Partie.

Die GamesGrid-Plattform war in ihrer Version von 1996 bis 2008 unter den kommerziellen Servern ungewöhnlich, weil Partie-Export eine erstklassig unterstützte Funktion war. Die Gemeinschaft der starken Spieler, die ihren Ruf auf GamesGrid aufbauten — tausende gewertete Partien spielten und jede davon gegen GNU Backgammon und Snowie analysierten — bildete einen wesentlichen Teil der Wettkampf-Elite der frühen Zweitausender.

Die Plattform von 2026 führt diese Linie fort. Jede Partie auf GamesGrid ist auf Wunsch in Standardformaten exportierbar und kann in GNU Backgammon, eXtreme Gammon oder BGBlitz importiert werden — für eine unabhängige Auswertung nach der Partie. Kein Vendor-Lock-in. Das Stellungs-Bewertungs-Orakel ist die eigene Wahl des Spielers.

3. Die ursprüngliche GamesGrid-Bot-Familie (1996–2008)

Die GamesGrid-Plattform von 1996 bis 2008 lieferte eine abgestufte Familie von Bots, alle gebaut auf einem Fork von GNU Backgammon durch GamesGrid Engineering (den Engineering-Arm von CyberArts Inc., dem Mutterunternehmen). Anpassungen an der Engine — darunter Verbesserungen an den n-Ply-Bewertungsalgorithmen — wurden ans upstream GNU-Projekt zurückgegeben, was GamesGrid zu einem der wenigen kommerziellen Betreiber machte, die das Open-Source-Backgammon-Ökosystem materiell vorangebracht haben.

Die Bot-Abstufung wurde durch gezieltes Induzieren von Fehlern in unterschiedlicher Häufigkeit erreicht, nicht durch das Training schwächerer Netze von Grund auf. Alle Bots nutzten dasselbe zugrunde liegende GNUbg-abgeleitete neuronale Netz; die schwächeren Bots machten einfach in kontrollierter Frequenz suboptimale Züge. Die ursprünglich veröffentlichten Ratings:

Bot	Ziel-Rating	Vorgehen	Original-ELO-Bereich (niedrig / Durchschnitt / hoch)
GG Forever	Keines (volle Stärke, nur für Life Members)	2-Ply Lookahead	1850 / 1920 / 2114
GG Raccoon	Keines (volle Stärke)	0-Ply (kein Lookahead)	1850 / 1920 / 2114
GG Otter	~1700 (Fortgeschritten)	Induzierte Fehler	1543 / 1701 / 1827
GG Weasel	~1500 (Anfänger)	Häufiger induzierte Fehler	1410 / 1516 / 1652
GG Chipmunk	~1300 (Novize)	Hochfrequenz-Fehlermodus	1171 / 1275 / 1487

Die Bots spielten 2.000 bis 4.000 Partien pro Tag über die Plattform, mit einer maximalen Matchlänge von 9 Punkten. Sie spielten sowohl Standard-Backgammon als auch Nackgammon (die Nack-Ballard-Eröffnungsvariante). Partie-Einladungen waren nach Rating begrenzt: GGotter nahm nur Einladungen von Spielern unter 1800 an, GGweasel nur von Spielern unter 1600, und GGchipmunk nur von Spielern unter 1400.

MrHyperBot — eine andere Architektur

Daneben spielte MrHyperBot die Variante Hypergammon — die Drei-Steine-Schnellvariante, in der jeder Spieler mit nur drei Steinen auf den 24-, 23- und 22-Punkten beginnt. MrHyperBot nutzte kein neuronales Netz. Stattdessen verwendete er eine vollständige Stellungs-Datenbank mit dem berechneten besten Zug für jede mögliche Hypergammon-Stellung, entwickelt von Hugh Sconyers (Handle "hugh" auf GamesGrid). Der kleinere Zustandsraum von Hypergammon machte die vollständige spieltheoretische Lösung rechnerisch machbar, und die Datenbank von Sconyers bleibt die kanonische Referenz für die Variante.

Xbot — der Bot von Paul Magriel

Ein separater unabhängiger Bot, Xbot, wurde auf GamesGrid von Paul Magriel (Handle "X22") betrieben. Magriel — Autor von Backgammon (1976), dem kanonischen Text zur Positionstheorie, und New York Times-Kolumnist 1977 bis 1980 — betrieb einen Neuronalen-Netz-Bot für Geld-Partien mit kleinen Einsätzen bis zu 9 Punkten. Magriels Präsenz als aktiver Betreiber auf GamesGrid war kennzeichnend für die kulturelle Position der Plattform in der Zeit von 1996 bis 2008 im Wettkampf-Backgammon.

Die vollständige Bot-Familie — GG Forever, GG Raccoon, GG Otter, GG Weasel, GG Chipmunk, MrHyperBot und der Geist von Xbot — kommt zurück auf der Plattform von 2026, rekonstruiert anhand ihrer dokumentierten Spielfingerabdrücke und ergänzt durch eine neue Generation namentlich genannter Bot-Gegner. Die Details folgen kurz vor dem Launch.

4. Zufallszahlen-Generierung: warum es zählt

Ein Backgammon-Server ist im Kern ein Würfelgenerator. Die technische Entscheidung, wie der Server zufällige Würfe erzeugt, hat enorme Auswirkungen auf die Wettkampf-Integrität — und die Geschichte des Online-Backgammons kennt dokumentierte Fälle, in denen Betreiber daran gescheitert sind.

4.1 Mersenne Twister (MT19937)

Die GamesGrid-Plattform von 2026 nutzt den Mersenne Twister-Pseudozufallszahlengenerator, konkret die MT19937-Variante, entwickelt von Makoto Matsumoto und Takuji Nishimura im Jahr 1997. Der Algorithmus hat:

Eine Periode von $2^{19937} - 1$ — astronomisch größer als die Zahl der Würfe in jeder denkbaren Lebensdauer der Plattform.
Eine 623-dimensionale Gleichverteilung bei 32-Bit-Genauigkeit — das heißt, aufeinanderfolgende Blöcke von 623 Ausgaben sind in hoher Dimension statistisch gleichverteilt, nicht nur in einer Dimension.
Geschwindigkeit: ~ $10^7$ Würfe pro Sekunde auf Standardhardware, so schnell, dass der RNG nie zum Flaschenhals wird.

MT19937 ist der Standard-RNG in GNU Backgammon, im random-Modul von Python und in einer langen Liste wissenschaftlicher Monte-Carlo-Simulatoren. Zwei technische Einschränkungen sind ausdrücklich zu nennen:

Er ist nicht kryptographisch sicher. Ein Angreifer, der 624 aufeinanderfolgende Ausgaben beobachtet, kann den internen Zustand rekonstruieren und zukünftige Ausgaben vorhersagen. Für die Würfelerzeugung in einem authentifizierten Spieleserver, der seinen Rohzustand nicht freigibt, ist das nicht relevant — aber es schließt MT19937 als alleinige Entropie-Quelle für sicherheitskritische Zwecke aus.
Er hat bekannte statistische Schwächen bei Linearitäts-Tests. Weil der Algorithmus auf linearem Feedback über dem Zwei-Elementen-Körper $\mathbb{F}_2$ aufgebaut ist, scheitert er vorhersehbar an bestimmten Linearitäts-Tests innerhalb der TestU01-BigCrush-Suite. Er besteht Diehard und die Standard-NIST-Batterien, und die Fehlermuster sind gut charakterisiert und stehen orthogonal zu unserem Anwendungsfall (gleichverteilte Integer-Würfe 1–6); aber eine vollständige Beschreibung von MT19937 sollte sie benennen, nicht wegwischen.

Für die Würfelerzeugung wiegen Periode und Gleichverteilung jede Linearitäts-Sorge bei weitem auf. Kryptographische Alternativen (etwa AES-CTR-DRBG) sind ebenfalls verfügbar, und das Audit-Protokoll der Plattform speichert Algorithmus und Seed-Quelle jeder Partie.

4.2 Seed-Audit-Richtlinie

Jede Partie auf GamesGrid ist mit einem servergenerierten Seed verknüpft. Dieser Seed wird:

Zu Partie-Beginn geloggt in einem Append-Only-Audit-Protokoll.
Aus einer hochentropischen Quelle abgeleitet (Hardware-RNG kombiniert mit dem System-Entropie-Pool) zum Zeitpunkt des Partie-Starts — nicht vorhersagbar aus früheren Partien.
Mit dem Partie-Eintrag gespeichert, was eine nachträgliche Reproduktion der Würfelreihenfolge durch einen unabhängigen Auditor ermöglicht.

Praktisch heißt das: Jeder Wurf in einer GamesGrid-Partie ist unabhängig nachprüfbar als von MT19937 aus einem bestimmten Seed zu einem bestimmten Zeitpunkt erzeugt. Die Würfel sind nicht "festgelegt" gegen oder für bestimmte Accounts, und es gibt keinen algorithmischen Mechanismus, der Ergebnisse für oder gegen einzelne Spieler verzerrt.

4.3 Der Gegenfall: SafeHarbor Games

Die Geschichte des Online-Backgammons kennt Betreiber, die von einer neutralen RNG-Richtlinie abgewichen sind. Der dokumentierte Fall ist SafeHarbor Games, das zu verschiedenen Zeitpunkten Räume betrieb, in denen die Pasch-Häufigkeit absichtlich reduziert wurde, um Spieler zu beruhigen, die sich von "Glückswürfen zermalmt" fühlten.

Die Absicht war Spieler-Bindung. Die Wirkung war ein ausnutzbarer RNG: Jeder Spieler, der wusste, dass die Pasch-Verteilung verzerrt war, hatte einen messbaren Erwartungswert-Vorteil gegenüber Spielern, die das nicht wussten. In einem Echtgeld-Kontext ist das ein Verstoß gegen die Wettkampf-Integrität — und die breitere Online-Backgammon-Szene reagierte entsprechend. Diese Episode wird in den Spieler-Foren der Zeit erwähnt und gehört zur Betreibergeschichte, die die Position der Plattform von 2026 zu neutraler, transparent algorithmischer Würfelerzeugung untermauert.

Die Position der Plattform von 2026 ist unmissverständlich: Gleichverteilung, Algorithmus mit Namen genannt, audit-geloggte Seeds. Die Würfel sind für jeden Spieler gleich, in jedem Raum, bei jedem Stand.

5. Die Plattform von 2026: Was öffentlich ist, was noch kommt

Das neue GamesGrid behält die architektonischen Entscheidungen, die den Server von 1996 bis 2008 ausgezeichnet haben — Closed-Client-Spiel mit serverseitigem Zustand, transparenter Partie-Export nach GNU Backgammon und XG, eine abgestufte Familie von Bots in der Linie der ursprünglichen GG-Bot-Crew — und baut sie auf moderner Engineering-Basis neu auf. Der genaue Funktionsumfang, inklusive der Struktur der Career-Mode-Bot-Ligen und der neuen Bot-Aufstellung, wird kurz vor dem Launch öffentlich.

Was heute schon öffentlich feststeht:

Gleichverteilte Würfel über MT19937, mit audit-geloggten Seeds.
Partie-Export in Standardformaten (SGF / JF) zur unabhängigen Auswertung.
Kein Vendor-Lock-in bei der Stellungs-Bewertung. Spieler wählen ihre eigene Analyse-Engine.
Die legendäre GG-Bot-Familie kommt zurück, rekonstruiert aus dokumentierten Spielfingerabdrücken.
Eine neue Generation namentlich genannter Bot-Gegner deckt die Skill-Leiter ab — vom Anfänger bis zum Weltmeister-Niveau.

Der vollständige Performance-Rating-Rahmen, in dem die Bot-Familie agiert, steht auf der PR & ELO-Seite.

Siehe auch

Performance Rating (PR) & ELO — Methodik zur Skill-Messung.
Geschichte — die Zeit von 1996 bis 2008 von GamesGrid und die Domain-Rückgewinnung nach 2020.
Backgammon-Mathematik — Match Equity, Take-Points, Cube-Theorie.
Regeln und Aufbau — Grundlagen.
Backgammon online — das Manifest für die neue Plattform.