Bots, Neurale Netwerken en RNG-integriteit

Backgammon was het eerste complexe twee-spelersspel waarin een computer aantoonbaar de beste menselijke spelers verslaan kon. Het bewijs werd in 1992 gepubliceerd — vier jaar voordat Deep Blue Kasparov versloeg, en vierentwintig jaar voor AlphaGo — en kwam van één enkel neuraal netwerk getraind via zelfspel bij IBM Research. De lijn van dat programma — Gerald Tesauro's TD-Gammon — via Jellyfish, Snowie, GNU Backgammon, eXtreme Gammon (XG), BGBlitz en de moderne open-source engines, vormt de technische geschiedenis van computer-backgammon.

Deze pagina traceert die lijn, legt uit hoe moderne bots geëvalueerd worden, documenteert de originele GamesGrid-bot-familie van 1996–2008, en zet onze positie uit rond random-number-generator-integriteit — inclusief het Mersenne Twister-algoritme dat we gebruiken en een gedocumenteerde tegen-case uit de operatorgeschiedenis van online backgammon.

De Engelstalige Performance Rating (PR) & ELO-pagina dekt het standaard skill-meet-kader dat de hele moderne competitieve ecosysteem gebruikt.

1. De engine-tijdlijn

De bot-geschiedenis van backgammon loopt door vijf onderscheidbare fasen. Elke fase komt overeen met een andere fundamentele benadering van positie-evaluatie.

Fase	Benadering	Representatieve engine	Jaar
Pre-neuraal	Handmatig gecodeerde heuristiek en rollouts	BKG 9.8 (Berliner)	1979
Eerste-generatie NN	Temporal-difference zelfspel op ondiepe netwerken	TD-Gammon	1992
Commerciële NN	Gepolijste commerciële neurale-net-programma's	Jellyfish, Snowie	1994–1998
Open-source NN	Gemeenschap-gebouwd, vrij te gebruiken	GNU Backgammon	2002+
Moderne referentie	Diepere netwerken, grotere feature-sets, snellere rollouts	eXtreme Gammon (XG), BGBlitz, Wildbg	2009+

1.1 Pre-neuraal: BKG (Hans Berliner, 1979)

Het eerste computerprogramma dat een regerend wereldkampioen versloeg op een complex bordspel was BKG 9.8, geschreven door Hans Berliner aan Carnegie Mellon. In 1979 versloeg het Luigi Villa, de regerend wereldkampioen backgammon, in een geldwedstrijd in Monte Carlo. De winst werd terecht deels toegeschreven aan buitengewone dobbelstenen — Berliner zelf schreef dat het programma over een grotere steekproef vermoedelijk zwakker was dan Villa. Maar het resultaat stond: het tijdperk van "computers kunnen geen backgammon spelen" was voorbij voordat de volgende fase echt begon.

BKG evalueerde posities met handmatig gecodeerde heuristieken: kenmerken zoals primelengte, blot-blootstelling en pipcount, gewogen door parameters die Berliner had afgesteld op representatieve testposities. Er was geen leer-component. Het was het sterkste niet-lerende programma ooit gebouwd voor het spel.

1.2 TD-Gammon (Tesauro, IBM Research, 1992)

De doorbraak kwam uit een ander paradigma. Gerald Tesauro bij IBM Research paste temporal-difference reinforcement learning toe op backgammon. Zijn programma, TD-Gammon, was een feedforward neuraal netwerk met een 198-eenheid-input-laag die het bord coderde (4 eenheden per punt per kleur voor de stenen-verdeling, plus 6 extra eenheden voor de bar, uitgespeelde stenen en de zet-aan-zet) gevoed in een enkele verborgen laag van 40 tot 80 sigmoid-eenheden afhankelijk van de versie (TD-Gammon 2.1 gebruikte 80 verborgen eenheden). Het werd getraind via zelfspel — het programma speelde honderdduizenden partijen tegen zichzelf, en stelde na elke zet zijn gewichten bij om zijn evaluatie van de positie vóór de zet dichter bij zijn evaluatie van de positie ná de zet te brengen.

Het opmerkelijke resultaat, gepubliceerd in 1992 en verfijnd tot 1995, was dat TD-Gammon competitieve openingen ontdekte die decennia van menselijke theorie tegenspraken. Rolloutanalyse die door TD-Gammon werd aangejaagd, en geconsolideerd door Jellyfish en Snowie in de jaren erna, zette de slot-zware consensus uit de jaren zeventig op verschillende openingsworpen op zijn kop ten gunste van split-builder-zetten (onder andere op de 2-1, 4-1 en 5-1). De standaard die elke serieuze toernooispeler vandaag op verschillende openingsworpen speelt is mede gezet door deze eerste golf van neurale-net-analyse. Zie de openingsworpen-pagina.

1.3 Jellyfish, Snowie, GNU Backgammon (1994–begin jaren 2000)

Het eerste commerciële NN-programma was Jellyfish, uitgebracht door Fredrik Dahl in 1994. Jellyfish volgde een TD-Gammon-achtige architectuur (een feedforward-netwerk met één verborgen laag) en was jarenlang het sterkste publiek beschikbare programma. Snowie, uitgebracht in 1998, gebruikte een verfijnder netwerk en voegde een gepolijste cube-actie-analyzer toe; het was de dominante commerciële engine van de late jaren negentig.

GNU Backgammon (ook GNUbg of gnubg) is de open-source erfgenaam van die lijn. De ontwikkeling begon in de late jaren negentig; grote releases stabiliseerden in de vroege jaren 2000. De evaluatie van GNUbg is een multi-layer feedforward-netwerk getraind op rollouts van miljoenen posities; de 0-ply-, 1-ply-, 2-ply- en 3-ply-evaluatiemodi geven competitieve spelers een reeks snelheid/nauwkeurigheid-trade-offs voor analyse. GNU Backgammon publiceert ook de standaard referentie-match equity-tabel (Rockwell-Kazaross MET) die de bredere gemeenschap gebruikt.

1.4 eXtreme Gammon (XG) en daarna (2009+)

eXtreme Gammon, uitgebracht in 2009 door Xavier Dufaure de Citres, is de huidige wereldstandaard. XG combineert een dieper neuraal netwerk met geoptimaliseerde rollouts, een geïntegreerde cube-actie-analyzer, en de meest-gebruikte analytische gebruikersinterface in de competitieve scene. XG2 (de grote revisie) is de bot waar moderne PR-ratings meestal tegen geijkt worden. Toernooi-niveau Performance Ratings worden routinematig geijkt tegen XG2-rollouts op 4-ply truncatie.

BGBlitz, door Frank Berger, is een onafhankelijke NN-engine in actieve ontwikkeling. Wildbg, een open-source Rust-gebaseerde engine uit 2023, valt minder op door rauwe speelkracht dan door trainings-transparantie — de trainings-pipeline is publiek inspecteerbaar, en de engine is een onderzoeksplatform geworden voor het evalueren van verschillende netwerkarchitecturen en trainings-strategieën. Die transparantie-filosofie sluit naadloos aan op onze eigen RNG- en analyse-stack-documentatie hieronder.

2. Hoe bots wedstrijden analyseren: de FIBS / GamesGrid → GNUbg-pijplijn

De standaard workflow in competitieve backgammon — van 1996 tot vandaag — is om wedstrijden online te spelen, ze in een gestandaardiseerd tekstformaat te exporteren, en ze achteraf in een neuraal-net-engine te analyseren. De oorspronkelijke pijplijn:

Speel de wedstrijd op FIBS, GamesGrid of een vergelijkbare server.
Exporteer de wedstrijd naar een tekstbestand in SGF- of JF-formaat (Jellyfish). FIBS ondersteunde export via het oldboard-commando; GamesGrid had eigen export-functionaliteit.
Importeer de wedstrijd in Jellyfish, Snowie, GNU Backgammon of (later) XG.
Analyseer op een gekozen evaluatie-diepte — meestal 2-ply voor dagelijkse review, volledige rollouts voor serieuze studie.
Rapport met foutpercentages per zet, per cube-beslissing, en een totale Performance Rating voor de wedstrijd.

Het GamesGrid-platform was, in zijn versie van 1996–2008, ongebruikelijk onder commerciële servers omdat wedstrijd-export een first-class ondersteunde functie was. De gemeenschap van sterke spelers die hun reputatie op GamesGrid opbouwden — duizenden rated wedstrijden spelend en elke daarvan analyserend tegen GNU Backgammon en Snowie — vormde een substantieel deel van de competitieve elite van het begin van de jaren 2000.

Het platform van 2026 zet die lijn voort. Elke wedstrijd op GamesGrid is op verzoek exporteerbaar in standaardformaten en kan in GNU Backgammon, eXtreme Gammon of BGBlitz geïmporteerd worden voor onafhankelijke post-game-analyse. Geen vendor-lock-in. Het positie-evaluatie-orakel is de eigen keuze van de speler.

3. De originele GamesGrid-bot-familie (1996–2008)

Het platform GamesGrid van 1996–2008 leverde een gegradeerde familie bots, allemaal gebouwd op een fork van GNU Backgammon door GamesGrid Engineering (de engineering-tak van CyberArts Inc., het moederbedrijf). Aanpassingen aan de engine — waaronder verbeteringen aan de n-ply-evaluatie-algoritmen — werden teruggedragen aan het upstream GNU-project, wat GamesGrid één van de weinige commerciële operators maakte die het open-source backgammon-ecosysteem materieel hebben bevorderd.

De bot-gradatie werd bereikt door fouten te induceren in verschillende frequenties, niet door zwakkere netwerken vanaf nul te trainen. Alle bots gebruikten hetzelfde onderliggende GNUbg-afgeleide neurale netwerk; de zwakkere bots maakten gewoon op een gecontroleerde frequentie suboptimale zetten. De oorspronkelijke gepubliceerde ratings:

Bot	Doel-rating	Aanpak	Originele ELO-bereik (laag / gem. / hoog)
GG Forever	Geen (volle sterkte, alleen voor Life Members)	2-ply lookahead	1850 / 1920 / 2114
GG Raccoon	Geen (volle sterkte)	0-ply (geen lookahead)	1850 / 1920 / 2114
GG Otter	~1700 (gevorderd)	Geïnduceerde fouten	1543 / 1701 / 1827
GG Weasel	~1500 (beginner)	Frequentere geïnduceerde fouten	1410 / 1516 / 1652
GG Chipmunk	~1300 (novice)	Hoge-frequentie-foutmodus	1171 / 1275 / 1487

De bots speelden 2.000 tot 4.000 wedstrijden per dag over het platform, met een maximale wedstrijdlengte van 9 punten. Ze speelden zowel standaard-backgammon als Nackgammon (de Nack Ballard-openingsvariant). Wedstrijduitnodigingen waren beperkt op rating: GGotter nam alleen uitnodigingen aan van spelers onder 1800, GGweasel alleen van spelers onder 1600, en GGchipmunk alleen van spelers onder 1400.

MrHyperBot — een andere architectuur

Daarnaast speelde MrHyperBot de variant hypergammon — de drie-stenen-snelvariant waar elke speler met slechts drie stenen op de 24-, 23- en 22-punten begint. MrHyperBot gebruikte geen neuraal netwerk. In plaats daarvan gebruikte hij een uitputtende positie-database met de berekende beste zet voor elke mogelijke hypergammon-positie, ontwikkeld door Hugh Sconyers (handle "hugh" op GamesGrid). De kleinere toestandsruimte van hypergammon maakte volledige spel-theoretische oplossing computationeel haalbaar, en de database van Sconyers blijft de canonieke referentie voor de variant.

Xbot — de bot van Paul Magriel

Een aparte onafhankelijke bot, Xbot, werd op GamesGrid bediend door Paul Magriel (handle "X22"). Magriel — auteur van Backgammon (1976), het canonieke positionele theorie-boek, en New York Times-columnist 1977–1980 — draaide een neuraal-net-bot voor geldwedstrijden met kleine inzetten tot 9 punten. De aanwezigheid van Magriel als actieve operator op GamesGrid was tekenend voor de culturele positie van het platform in het tijdperk 1996–2008 van competitief backgammon.

De volledige bot-familie — GG Forever, GG Raccoon, GG Otter, GG Weasel, GG Chipmunk, MrHyperBot en de geest van Xbot — keert terug op het platform van 2026, gereconstrueerd op basis van hun gedocumenteerde speelvingerafdrukken en aangevuld met een nieuwe generatie genoemde bot-tegenstanders. Meer details volgen dichter bij de lancering.

4. Random-getalsgeneratie: waarom het ertoe doet

Een backgammon-server is, in de kern, een dobbelsteen-generator. De technische keuze rond hoe de server willekeurige worpen produceert heeft enorme gevolgen voor competitieve integriteit — en de geschiedenis van online backgammon kent gedocumenteerde gevallen waarin operators dit fout deden.

4.1 Mersenne Twister (MT19937)

Het platform GamesGrid 2026 gebruikt de Mersenne Twister-pseudo-random-getalsgenerator, specifiek de MT19937-variant ontwikkeld door Makoto Matsumoto en Takuji Nishimura in 1997. Het algoritme heeft:

Een periode van $2^{19937} - 1$ — astronomisch groter dan het aantal worpen in welke denkbare levensduur van het platform dan ook.
Een 623-dimensionele equidistributie tot op 32-bit-nauwkeurigheid — dat betekent dat opeenvolgende blokken van 623 uitvoeren statistisch uniform zijn in hoge dimensie, niet alleen in één dimensie.
Snelheid: ~ $10^7$ worpen per seconde op standaardhardware, zo snel dat de RNG nooit een bottleneck is.

MT19937 is de standaard-RNG in GNU Backgammon, Python's random-module en een lange lijst wetenschappelijke Monte Carlo-simulators. Twee technische kanttekeningen verdienen expliciete vermelding:

Hij is niet cryptografisch veilig. Een aanvaller die 624 opeenvolgende uitvoeren observeert kan de interne staat reconstrueren en toekomstige uitvoeren voorspellen. Voor dobbelstenen-generatie in een geauthenticeerde game-server die zijn rauwe staat niet blootstelt is dat geen relevante zorg, maar het sluit MT19937 wel uit als enige entropie-bron voor security-kritieke doeleinden.
Hij heeft bekende statistische zwaktes op lineariteits-tests. Omdat het algoritme is opgebouwd op lineaire feedback over het twee-elementenveld $\mathbb{F}_2$ , faalt het voorspelbaar op bepaalde lineaire-complexiteits-tests binnen de TestU01 BigCrush-suite. Het doorstaat Diehard en de standaard NIST-batterijen, en de faalmodi zijn goed gekarakteriseerd en orthogonaal aan onze use case (uniforme integer-worpen 1–6); maar een volledig verslag van MT19937 hoort die te benoemen, niet weg te wuiven.

Voor dobbelstenen-generatie wegen de periode en de equidistributie-eigenschappen ruim op tegen enige lineariteits-zorg. Cryptografische alternatieven (bijvoorbeeld AES-CTR-DRBG) zijn ook beschikbaar, en het audit-spoor van het platform registreert het algoritme en de seed-bron voor elke wedstrijd.

4.2 Seed-audit-beleid

Elke wedstrijd op GamesGrid is gekoppeld aan een server-gegenereerde seed. Die seed wordt:

Aan het begin van de wedstrijd gelogd in een append-only audit-log.
Afgeleid uit een hoge-entropie-bron (hardware-RNG gecombineerd met de system-entropy-pool) op het moment dat de wedstrijd start — niet te voorspellen uit eerdere wedstrijden.
Opgeslagen met het wedstrijd-record, wat post-hoc reproductie van de dobbelreeks door een onafhankelijke auditor mogelijk maakt.

Praktisch gezegd: elke worp in een GamesGrid-wedstrijd is onafhankelijk te verifiëren als gegenereerd door MT19937 vanuit een specifieke seed op een specifiek moment. De dobbelstenen zijn niet "gefixt" tegen of voor specifieke accounts, en er is geen algoritmisch mechanisme om uitkomsten te kantelen voor of tegen bepaalde spelers.

4.3 De tegen-case: SafeHarbor Games

De geschiedenis van online backgammon kent operators die afweken van een neutraal RNG-beleid. Het gedocumenteerde geval is SafeHarbor Games, dat op verschillende momenten kamers bediende waarin het aantal doubletten bewust werd verminderd om spelers die klaagden dat ze "weggevaagd werden door de dobbelstenen" tevreden te stellen.

De intentie was speler-retentie. Het effect was een exploiteerbare RNG: elke speler die wist dat de doubletverdeling vertekend was, had een meetbaar verwacht-rendement-voordeel op spelers die het niet wisten. In een echt-geld-context staat dat gelijk aan een schending van competitieve integriteit — en de bredere online-backgammon-scene reageerde dienovereenkomstig. Deze episode wordt genoemd op spelersfora uit die periode en is onderdeel van de operator-geschiedenis die de positie van het 2026-platform onderbouwt op het punt van neutrale, transparant algoritmische dobbelstenen-generatie.

De positie van het 2026-platform is ondubbelzinnig: uniforme verdeling, algoritme bij naam genoemd, audit-gelogde seeds. De dobbelstenen zijn voor elke speler hetzelfde, in elke kamer, op elke score.

5. Het platform van 2026: wat is publiek, wat komt nog

Het nieuwe GamesGrid behoudt de architectonische keuzes die de server van 1996–2008 onderscheidden — gesloten-client-spel met server-side staat, transparante wedstrijd-export naar GNU Backgammon en XG, een gegradeerde familie bots afgeleid van de oorspronkelijke GG-bot-cast — en bouwt ze op moderne engineering. De specifieke feature-set, inclusief de structuur van de Career-Mode-bot-leagues en de nieuwe bot-roster, wordt dichter bij de lancering publiek.

Wat vandaag al publiek vaststaat:

Uniforme dobbelsteen-verdeling via MT19937, met audit-gelogde seeds.
Wedstrijd-export in standaardformaten (SGF / JF) voor onafhankelijke analyse.
Geen vendor-lock-in op positie-evaluatie. Spelers kiezen zelf hun analyse-engine.
De legendarische GG-bot-familie keert terug, gereconstrueerd vanuit gedocumenteerde speelvingerafdrukken.
Een nieuwe generatie genoemde bot-tegenstanders spant de skill-ladder van beginner tot wereldkampioen-niveau.

Het volledige Performance-Rating-kader waarbinnen de bot-familie opereert staat op de PR & ELO-pagina.

Zie ook

Performance Rating (PR) & ELO — skill-meetmethodologie.
Geschiedenis — het tijdperk 1996–2008 van GamesGrid en de domeinverwerving na 2020.
Backgammon-wiskunde — match equity, take-points, cube-theorie.
Spelregels en Opstelling — fundamenten.
Backgammon online — het manifest van het nieuwe platform.