Bots, neurale netværk og RNG-integritet

Backgammon var det første komplekse to-spiller-spil, hvor en computer påviseligt overgik de bedste menneskelige spillere. Beviset blev udgivet i 1992, fire år før Deep Blue slog Kasparov og fireogtyve år før AlphaGo. Det kom fra et enkelt neuralt netværk trænet ved selvspil hos IBM Research. Linjen fra det program — Gerald Tesauros TD-Gammon — gennem Jellyfish, Snowie, GNU Backgammon, eXtreme Gammon (XG), BGBlitz og de moderne open source-motorer definerer den tekniske historie for backgammon på computer.

Denne side følger den linje, forklarer hvordan moderne bots evalueres, dokumenterer den oprindelige GamesGrid-bot-familie fra 1996–2008 og fremlægger platformens holdning til integritet i generering af tilfældige tal — herunder Mersenne Twister-algoritmen, vi bruger, og et dokumenteret kontrasteksempel fra historien om online backgammon-operatører.

Følgesiden Performance Ratings (PR) & ELO dækker den standardiserede færdighedsmålingsramme, som hele det moderne kompetitive økosystem bruger.

1. Motor-tidslinjen

Backgammons bot-historie løber gennem fem distinkte faser. Hver fase svarer til en grundlæggende forskellig tilgang til positionsvurdering.

Fase	Tilgang	Repræsentativ motor	År
Pre-neural	Håndkodede heuristikker og rollouts	BKG 9.8 (Berliner)	1979
Første generation NN	Temporal-difference selvspil på netværk med få lag	TD-Gammon	1992
Kommerciel NN	Færdigpolerede kommercielle neural-netværks-programmer	Jellyfish, Snowie	1994–1998
Open source NN	Fællesskabsbygget, gratis at bruge	GNU Backgammon	2002+
Moderne reference	Dybere netværk, større feature-sæt, hurtigere rollouts	eXtreme Gammon (XG), BGBlitz, Wildbg	2009+

1.1 Pre-neural: BKG (Hans Berliner, 1979)

Det første computerprogram, der besejrede en regerende verdensmester i et komplekst brætspil, var BKG 9.8, skrevet af Hans Berliner på Carnegie Mellon. I 1979 slog det Luigi Villa, den regerende verdensmester i backgammon, i en 7-points pengematch i Monte Carlo. Sejren blev bredt (og korrekt) delvist tilskrevet ekstraordinære terninger — Berliner skrev selv, at programmet sandsynligvis var svagere end Villa over et større antal spil. Men resultatet var ubestrideligt: æraen, hvor »computere ikke kan spille backgammon«, var slut, før næste fase overhovedet var begyndt.

BKG evaluerede positioner med håndkodede heuristikker: features som prime-længde, blot-eksponering og pip count, vægtet af parametre, som Berliner havde finjusteret mod repræsentative testpositioner. Der var ingen lærende komponent. Det var det stærkeste ikke-lærende program, der nogensinde er blevet bygget til spillet.

1.2 TD-Gammon (Tesauro, IBM Research, 1992)

Gennembruddet kom fra et andet paradigme. Gerald Tesauro hos IBM Research anvendte temporal-difference reinforcement learning på backgammon. Hans program, TD-Gammon, var et feedforward-neuralt netværk med et 198-enheders inputlag, der kodede brættet (4 enheder pr. felt pr. farve for brikfordeling, plus 6 ekstra enheder, der kodede bar, udspillede brikker og side-i-tur), som førte ind i et enkelt skjult lag på 40 til 80 sigmoide enheder afhængigt af versionen (TD-Gammon 2.1 brugte 80 skjulte enheder). Det blev trænet ved selvspil — programmet spillede mod sig selv i hundredtusindvis af spil og justerede efter hvert træk sine vægte for at gøre dets vurdering af positionen før trækket tættere på dets vurdering af positionen efter trækket.

Det bemærkelsesværdige resultat, udgivet i 1992 og forfinet frem til 1995, var, at TD-Gammon opdagede kompetitive åbninger, der modsagde årtiers menneskelig teori. Rollout-analyse, sat i gang af TD-Gammon og konsolideret af Jellyfish og Snowie i de efterfølgende år, omstødte 1970'ernes slot-tunge konsensus om flere åbningskast (især 2-1, 4-1 og 5-1) til fordel for split-builder-træk. Standarden, som enhver seriøs turneringsspiller i dag spiller for flere åbningskast, blev delvist sat af denne første bølge af neural-netværks-analyse. Se siden om åbningskast på engelsk.

1.3 Jellyfish, Snowie, GNU Backgammon (1994 – tidlige 2000'ere)

Det første kommercielle NN-baserede program var Jellyfish, udgivet af Fredrik Dahl i 1994. Jellyfish fulgte TD-Gammon-arkitekturen (feedforward-netværk med et enkelt skjult lag) og var i flere år det stærkeste offentligt tilgængelige program. Snowie, udgivet i 1998, brugte et mere sofistikeret netværk og tilføjede en gennemarbejdet doblerterningshandlingsanalysator; det var den dominerende kommercielle motor i sluthalvfemserne.

GNU Backgammon (også kaldt GNUbg eller gnubg) er den open source-arvtager til den linje. Den indledende udvikling begyndte i slutningen af 1990'erne; større udgivelser stabiliserede sig i begyndelsen af 2000'erne. GNUbgs evaluering er et flerlags feedforward-netværk trænet på rollouts af millioner af positioner; dets 0-ply, 1-ply, 2-ply og 3-ply evalueringsmodes giver en række hastighed/præcision-afvejninger, som kompetitive spillere bruger til analyse. GNU Backgammon udgiver også den standard-reference Match Equity-tabel (Rockwell-Kazaross MET), som det bredere fællesskab bruger.

1.4 eXtreme Gammon (XG) og videre (2009+)

eXtreme Gammon, udgivet i 2009 af Xavier Dufaure de Citres, er den aktuelle verdensreferencestandard. XG kombinerer et dybere neuralt netværk med optimerede rollouts, en integreret doblerterningshandlingsanalysator og den mest brugte analytiske brugergrænseflade i den kompetitive scene. XG2 (den store revision) er den bot, der oftest citeres, når moderne PR-ratings rapporteres. Turneringsklasse Performance Ratings kalibreres rutinemæssigt mod XG2-rollouts ved 4-ply-trunkering.

BGBlitz, af Frank Berger, er en uafhængig NN-motor i aktiv udvikling. Wildbg, en open source-motor i Rust udgivet i 2023, er bemærkelsesværdig mindre for ren spillestyrke end for træningsgennemsigtighed — træningspipelinen er offentligt auditerbar, og motoren er blevet en forskningsplatform til at evaluere forskellige netværksarkitekturer og træningsstrategier. Gennemsigtighedsfilosofien stemmer direkte overens med vores egen dokumentation af RNG og analyseværktøjer, behandlet nedenfor.

2. Sådan analyserer bots kampe: FIBS / GamesGrid → GNUbg-pipelinen

Standardarbejdsgangen i kompetitivt backgammon — fra 1996 og frem til i dag — er at spille kampe online, eksportere dem i et standardiseret tekstformat og analysere dem i en neural-netværks-motor efterfølgende. Den oprindelige pipeline:

Spil kampen på FIBS, GamesGrid eller en lignende server.
Eksportér kampen til en tekstfil i SGF- eller JF-format (Jellyfish). FIBS understøttede eksport via oldboard-kommandoen; GamesGrid havde sin egen eksportfunktion.
Importér kampen i Jellyfish, Snowie, GNU Backgammon eller (senere) XG.
Analysér ved valgt evalueringsdybde — typisk 2-ply til daglig gennemgang, fulde rollouts til seriøst studie.
Rapport med fejlrater pr. træk, pr. doblerterningshandling og en samlet Performance Rating for kampen.

GamesGrid-platformen, i sin 1996–2008-inkarnation, var usædvanlig blandt kommercielle servere ved, at kamp-eksport var en førsteklasses understøttet funktion. Det fællesskab af stærke spillere, der opbyggede deres ry på GamesGrid — ved at spille tusindvis af ratede kampe og analysere hver enkelt mod GNU Backgammon og Snowie — udgjorde en betydelig del af den kompetitive elite i begyndelsen af 2000'erne.

2026-platformen fortsætter dette. Hver kamp spillet på GamesGrid eksporteres på forespørgsel i standardformater og kan importeres i GNU Backgammon, eXtreme Gammon eller BGBlitz til uafhængig efter-kamp-gennemgang. Der er ingen proprietær lock-in. Positionsvurderings-oraklet er spillerens eget valg.

3. Den oprindelige GamesGrid-bot-familie (1996–2008)

1996–2008-GamesGrid-platformen leverede en gradueret familie af bots, alle bygget på en fork af GNU Backgammon af GamesGrid Engineering (ingeniørafdelingen i CyberArts Inc., moderselskabet). Ændringer af motoren — herunder forbedringer af n-ply-evalueringsalgoritmerne — blev bidraget tilbage til upstream GNU-projektet, hvilket gjorde GamesGrid til en af de få kommercielle operatører, der materielt fremmede det open source backgammon-økosystem.

Bot-gradueringen blev opnået ved at fremkalde fejl af varierende størrelse i stedet for at træne svagere netværk fra bunden. Alle bots brugte det samme underliggende GNUbg-afledte neurale netværk; de svagere bots foretog blot suboptimale træk i en kontrolleret frekvens. De oprindelige offentliggjorte ratings:

Bot	Mål-rating	Tilgang	Oprindelig rating-spændvidde (lav / gns. / høj)
GG Forever	Ingen (fuld styrke, kun Life Members)	2-ply lookahead	1850 / 1920 / 2114
GG Raccoon	Ingen (fuld styrke)	0-ply (ingen lookahead)	1850 / 1920 / 2114
GG Otter	~1700 (mellemniveau)	Fremkaldte fejl	1543 / 1701 / 1827
GG Weasel	~1500 (begynder)	Mere hyppige fejl	1410 / 1516 / 1652
GG Chipmunk	~1300 (nybegynder)	Højfrekvens-fejl-tilstand	1171 / 1275 / 1487

Botterne spillede 2.000 til 4.000 kampe om dagen på platformen, med maksimal kamplængde på 9 point. De spillede både standard-backgammon og Nackgammon (Nack Ballard-åbningspositionsvarianten). Kampinvitationer var rate-begrænset efter spillerens rating: GG Otter accepterede kun invitationer fra spillere ratet under 1800, GG Weasel kun fra spillere ratet under 1600, og GG Chipmunk kun fra spillere ratet under 1400.

MrHyperBot — en anden arkitektur

Separat spillede MrHyperBot Hypergammon-varianten — tre-brikkers hurtighedsvarianten, hvor hver spiller starter med kun tre brikker på felt 22, 23 og 24. MrHyperBot brugte ikke et neuralt netværk. I stedet brugte den en udtømmende positionsdatabase, der indeholdt det beregnede bedste træk for hver mulig hypergammon-position, udviklet af Hugh Sconyers (brugernavn »hugh« på GamesGrid). Hypergammons mindre tilstandsrum gjorde fuld spilteoretisk løsning beregningsmæssigt mulig, og Sconyers' database forbliver den kanoniske reference for varianten.

Xbot — Paul Magriels bot

En separat, uafhængig bot, Xbot, blev opereret på GamesGrid af Paul Magriel (brugernavn »X22«). Magriel — forfatter til Backgammon (1976), den kanoniske tekst om positionsteori, og New York Times-backgammon-klummeskribent 1977–1980 — drev en neural-netværks-bot til pengematches med små indsatser på op til 9 point. Magriels tilstedeværelse som aktiv operatør på GamesGrid sagde noget om platformens kulturelle plads i 1996–2008-æraen for kompetitivt backgammon.

Den fulde bot-familie — GG Forever, GG Raccoon, GG Otter, GG Weasel, GG Chipmunk, MrHyperBot og ånden fra Xbot — vender tilbage på 2026-platformen, genskabt fra deres dokumenterede spil-fingeraftryk og suppleret med en ny generation af navngivne bot-modstandere. Flere detaljer offentliggøres tættere på genåbningen.

4. Tilfældig talgenerering: hvorfor det betyder noget

En backgammon-server er grundlæggende en terningegenerator. Den tekniske beslutning om, hvordan serveren producerer tilfældige kast, har enorme implikationer for konkurrencemæssig integritet — og historien om online backgammon indeholder dokumenterede tilfælde af operatører, der har truffet denne beslutning forkert.

4.1 Mersenne Twister (MT19937)

GamesGrid 2026-platformen bruger Mersenne Twister-pseudo-tilfældig-tal-generatoren, specifikt MT19937-varianten udviklet af Makoto Matsumoto og Takuji Nishimura i 1997. Algoritmen har:

En periode på $2^{19937} - 1$ — astronomisk større end antallet af terningekast i enhver tænkelig platformlevetid.
En 623-dimensional ligefordelig fordeling med 32-bit nøjagtighed — hvilket betyder, at successive blokke af 623 udgange er ensartet fordelt i en høj-dimensional forstand, ikke kun i 1D.
Hastighed: ~ $10^7$ kast pr. sekund på standardhardware, hurtig nok til, at RNG'en aldrig bliver en flaskehals.

MT19937 er standard-RNG i GNU Backgammon, Pythons random-modul og en lang liste af videnskabelige Monte Carlo-simulatorer. To tekniske forbehold er værd at nævne udtrykkeligt:

Den er ikke kryptografisk sikker. En angriber, der observerer 624 på hinanden følgende udgange, kan rekonstruere den interne tilstand og forudsige fremtidige udgange. Til terningegenerering i en autentificeret spilserver, der ikke eksponerer sin rå tilstand, er det ikke et relevant problem, men det udelukker brug af MT19937 som eneste entropikilde til sikkerhedskritiske formål.
Den har kendte statistiske svagheder ved linearitetstests. Fordi algoritmen er bygget på lineær feedback over to-elements-feltet $\mathbb{F}_2$ , fejler den forudsigeligt visse test af lineær kompleksitet i TestU01 BigCrush-suiten. Den klarer Diehard og de almindelige NIST-tilfældighedstest-batterier, og fejltyperne er velkarakteriserede og ortogonale til brugsscenariet her (ensartede heltalskast af 1-6); men en fuld beskrivelse af MT19937 bør anerkende dem snarere end at beskrive algoritmen som universelt test-bestående.

Til terningegenerering dominerer periode- og ligefordeligheds-egenskaberne afgørende enhver linearitetsbekymring. Kryptografiske alternativer (f.eks. AES-CTR-DRBG) er også tilgængelige, og platformens audit-spor registrerer algoritmen og seed-kilden for hver kamp.

4.2 Seed-audit-politik

Hver kamp på GamesGrid er knyttet til et server-genereret seed. Seedet:

Logges ved kampens start til en append-only audit-log.
Udledes fra en høj-entropi-kilde (hardware-RNG kombineret med systemets entropipool) på tidspunktet for kampens initialisering — ikke forudsigelig ud fra tidligere kampe.
Registreres med kampoptegnelsen, hvilket muliggør efterfølgende reproduktion af terningesekvensen af en uafhængig auditor.

I praksis: hvert terningekast i en GamesGrid-kamp kan uafhængigt verificeres som genereret af MT19937 fra et bestemt seed på et bestemt tidspunkt. Terningerne er ikke »riggede« mod nogen bestemt spiller, og der er ingen algoritmisk mekanisme til at vippe udfaldene for eller imod specifikke konti.

4.3 Kontrasteksemplet: SafeHarbor Games

Historien om online backgammon inkluderer operatører, der har afveget fra en neutral RNG-politik. Det dokumenterede tilfælde er SafeHarbor Games, der på forskellige tidspunkter drev rum, der bevidst reducerede frekvensen af dobbeltslag for at berolige spillere, der klagede over at tabe til »heldige« kast.

Intentionen var spillerfastholdelse. Effekten var en udnyttelig RNG: enhver spiller, der vidste, at dobbeltslagsfordelingen var skæv, havde en målbar forventningsmæssig fordel over spillere, der ikke vidste det. I en pengespils-kontekst udgør dette en krænkelse af konkurrencemæssig integritet — og den bredere online-backgammon-scene reagerede tilsvarende. Episoden refereres i tidens spillerfora og er en del af operatør-historien, der ligger til grund for GamesGrid-platformens dokumenterede engagement i neutral, gennemsigtigt algoritmisk terningegenerering.

2026-platformens holdning er utvetydig: ensartet fordeling, navngivet algoritme, audit-loggede seeds. Terningerne er de samme for hver spiller, i hvert rum, ved hver score.

5. 2026-platformen: hvad der er offentligt, hvad der kommer

Det nye GamesGrid bibeholder de arkitektoniske valg, der adskilte 1996–2008-serveren — lukket-klient-spil med serverside-tilstand, gennemsigtig kamp-eksport til GNU Backgammon og XG, en gradueret familie af bots nedstammet fra den oprindelige GG-bot-besætning — og bygger dem op på moderne ingeniørarbejde. Det specifikke funktionssæt, herunder strukturen af karrieretilstandens bot-ligaer og den nye bot-besætning, offentliggøres tættere på genåbningen.

Hvad der er offentligt bekræftet i dag:

Ensartet fordelte terninger via MT19937, med audit-loggede seeds.
Kamp-eksport i standardformater (SGF / JF) til uafhængig analyse.
Ingen proprietær lock-in på positionsvurdering. Spillerne vælger deres egen analytiske motor.
Den klassiske GG-bot-familie vender tilbage, genskabt fra dokumenterede spil-fingeraftryk.
En ny generation af navngivne bot-modstandere dækker færdighedsstigen fra begynder til verdensmesterskabsklasse.

Den fulde Performance-Rating-ramme, som bot-familien opererer inden for, er på PR & ELO-siden.

Se også

Performance Ratings (PR) & ELO — metodologi for færdighedsmåling.
Historie — 1996–2008 GamesGrid-æraen og post-2020-genanskaffelsen.
Matematik — match equity, take-points, doblerterningsteori.
Ordliste — formelle definitioner af PR, ELO, neuralt netværk, Mersenne Twister, Hypergammon, Nackgammon.