Bots, neurala nätverk och RNG-integritet

Backgammon var det första komplexa tvåspelarspelet där en dator påvisbart överträffade de bästa mänskliga spelarna. Beviset publicerades 1992, fyra år innan Deep Blue slog Kasparov och tjugofyra år före AlphaGo. Det kom från ett enda neuralt nätverk tränat genom självspel hos IBM Research. Linjen från det programmet — Gerald Tesauros TD-Gammon — genom Jellyfish, Snowie, GNU Backgammon, eXtreme Gammon (XG), BGBlitz och de moderna open source-motorerna definierar den tekniska historien för datorbackgammon.

Den här sidan följer den linjen, förklarar hur moderna bots utvärderas, dokumenterar den ursprungliga GamesGrid-botfamiljen från 1996–2008 och lägger fram plattformens hållning till integritet i slumptalsgenerering — inklusive Mersenne Twister-algoritmen vi använder, och ett dokumenterat motexempel från historien om online backgammon-operatörer.

Följesidan Performance Ratings (PR) & ELO täcker det standardiserade färdighetsmätningsramverket som hela det moderna tävlingsekosystemet använder.

1. Motortidslinjen

Backgammons bot-historia löper genom fem distinkta faser. Varje fas motsvarar en grundläggande annorlunda inställning till positionsutvärdering.

Fas	Inställning	Representativ motor	År
Pre-neural	Handkodade heuristiker och rollouts	BKG 9.8 (Berliner)	1979
Första generationens NN	Temporal-difference självspel på nätverk med få lager	TD-Gammon	1992
Kommersiell NN	Färdigpolerade kommersiella neural-nätverks-program	Jellyfish, Snowie	1994–1998
Open source NN	Community-byggd, gratis att använda	GNU Backgammon	2002+
Modern referens	Djupare nätverk, större feature-uppsättningar, snabbare rollouts	eXtreme Gammon (XG), BGBlitz, Wildbg	2009+

1.1 Pre-neural: BKG (Hans Berliner, 1979)

Det första datorprogrammet som besegrade en regerande världsmästare i ett komplext brädspel var BKG 9.8, skrivet av Hans Berliner vid Carnegie Mellon. 1979 slog det Luigi Villa, den dåvarande världsmästaren i backgammon, i en 7-poängs pengamatch i Monte Carlo. Segern tillskrevs allmänt (och med rätta) delvis extraordinära tärningar — Berliner skrev själv att programmet förmodligen var svagare än Villa över ett större urval. Men resultatet var obestridligt: eran då "datorer inte kan spela backgammon" var över innan nästa fas ens hade börjat.

BKG utvärderade positioner med handkodade heuristiker: drag som prime-längd, blot-exponering och pip count, viktade av parametrar som Berliner hade finjusterat mot representativa testpositioner. Det fanns ingen lärande komponent. Det var det starkaste icke-lärande programmet som någonsin byggts för spelet.

1.2 TD-Gammon (Tesauro, IBM Research, 1992)

Genombrottet kom från ett annat paradigm. Gerald Tesauro vid IBM Research tillämpade temporal-difference reinforcement learning på backgammon. Hans program, TD-Gammon, var ett feedforward-neuralt nätverk med ett 198-enheters indatalager som kodade brädet (4 enheter per punkt per färg för brickfördelning, plus 6 extra enheter som kodade bar, utplockade brickor och sida-i-tur) som matades in i ett enda dolt lager om 40 till 80 sigmoida enheter beroende på version (TD-Gammon 2.1 använde 80 dolda enheter). Det tränades genom självspel — programmet spelade mot sig självt i hundratusentals spel och justerade efter varje drag sina vikter för att göra dess utvärdering av positionen före draget närmare dess utvärdering av positionen efter draget.

Det anmärkningsvärda resultatet, publicerat 1992 och förfinat fram till 1995, var att TD-Gammon upptäckte tävlingsmässiga öppningar som motsade decennier av etablerad teori. Rollout-analys, igångsatt av TD-Gammon och konsoliderad av Jellyfish och Snowie under efterföljande år, vände 1970-talets slot-tunga konsensus om flera öppningsslag (särskilt 2-1, 4-1 och 5-1) till förmån för split-builder-drag. Standarden som varje seriös turneringsspelare idag spelar för flera öppningsslag sattes delvis av denna första våg av neural-nätverks-analys. Se sidan om öppningsslag på engelska.

1.3 Jellyfish, Snowie, GNU Backgammon (1994 – tidiga 2000-talet)

Det första kommersiella NN-baserade programmet var Jellyfish, släppt av Fredrik Dahl 1994. Jellyfish följde TD-Gammon-arkitekturen (feedforward-nätverk med ett enda dolt lager) och var i flera år det starkaste publikt tillgängliga programmet. Snowie, släppt 1998, använde ett mer sofistikerat nätverk och lade till en genomarbetad kubhanteringsanalys; det var den dominerande kommersiella motorn under sena 1990-talet.

GNU Backgammon (även kallad GNUbg eller gnubg) är open source-arvtagaren till den linjen. Den inledande utvecklingen började i slutet av 1990-talet; större releaser stabiliserades i början av 2000-talet. GNUbgs utvärdering är ett flerlagers feedforward-nätverk tränat på rollouts av miljoner positioner; dess 0-ply, 1-ply, 2-ply och 3-ply utvärderingslägen ger en rad hastighet/precisions-avvägningar som tävlingsspelare använder för analys. GNU Backgammon publicerar också den standard-referens Match Equity-tabell (Rockwell-Kazaross MET) som det bredare communityt använder.

1.4 eXtreme Gammon (XG) och vidare (2009+)

eXtreme Gammon, släppt 2009 av Xavier Dufaure de Citres, är den aktuella världsreferensstandarden. XG kombinerar ett djupare neuralt nätverk med optimerade rollouts, en integrerad kubhanteringsanalys och det mest använda analytiska användargränssnittet i tävlingsscenen. XG2 (den stora revisionen) är den bot som oftast citeras när moderna PR-ratings rapporteras. Turneringsklass Performance Ratings kalibreras rutinmässigt mot XG2-rollouts vid 4-ply trunkering.

BGBlitz, av Frank Berger, är en oberoende NN-motor i aktiv utveckling. Wildbg, en open source-motor i Rust släppt 2023, är anmärkningsvärd inte så mycket för ren spelstyrka som för träningstransparens — träningspipelinen är publikt granskningsbar, och motorn har blivit en forskningsplattform för att utvärdera olika nätverksarkitekturer och träningsstrategier. Transparensfilosofin stämmer direkt överens med vår egen dokumentation av RNG och analysverktyg, behandlad nedan.

2. Hur bots analyserar matcher: FIBS / GamesGrid → GNUbg-pipelinen

Standardarbetsflödet i tävlings-backgammon — från 1996 fram till idag — är att spela matcher online, exportera dem i ett standardiserat textformat och analysera dem i en neural-nätverks-motor efteråt. Den ursprungliga pipelinen:

Spela matchen på FIBS, GamesGrid eller en liknande server.
Exportera matchen till en textfil i SGF- eller JF-format (Jellyfish). FIBS stödde export via oldboard-kommandot; GamesGrid hade sin egen exportfunktion.
Importera matchen till Jellyfish, Snowie, GNU Backgammon eller (senare) XG.
Analysera vid vald utvärderingsdjup — vanligtvis 2-ply för daglig genomgång, fullständiga rollouts för seriöst studium.
Rapport med felfrekvenser per drag, per kubbeslut, och en samlad Performance Rating för matchen.

GamesGrid-plattformen, i sin 1996–2008-version, var ovanlig bland kommersiella servrar genom att matchexport var en fullt integrerad funktion. Det community av starka spelare som byggde sina rykten på GamesGrid — genom att spela tusentals rankade matcher och analysera var och en mot GNU Backgammon och Snowie — utgjorde en betydande del av tävlingseliten i början av 2000-talet.

2026-plattformen fortsätter detta. Varje match som spelas på GamesGrid exporteras på begäran i standardformat och kan importeras till GNU Backgammon, eXtreme Gammon eller BGBlitz för oberoende efter-match-granskning. Det finns ingen proprietär låsning. Positionsutvärderings-oraklet är spelarens eget val.

3. Den ursprungliga GamesGrid-botfamiljen (1996–2008)

1996–2008-GamesGrid-plattformen levererade en graderad familj bots, alla byggda på en fork av GNU Backgammon av GamesGrid Engineering (ingenjörsgrenen i CyberArts Inc., moderbolaget). Ändringar av motorn — inklusive förbättringar av n-ply-utvärderingsalgoritmerna — bidrogs tillbaka till upstream GNU-projektet, vilket gjorde GamesGrid till en av de få kommersiella operatörer som materiellt främjade open source backgammon-ekosystemet.

Bot-graderingen uppnåddes genom att framkalla fel av varierande storlek snarare än att träna svagare nätverk från grunden. Alla bots använde samma underliggande GNUbg-härledda neurala nätverk; de svagare botarna gjorde helt enkelt suboptimala drag vid en kontrollerad frekvens. De ursprungliga publicerade ratings:

Bot	Målrating	Inställning	Ursprungligt rating-spann (lågt / snitt / högt)
GG Forever	Inget (full styrka, endast Life Members)	2-ply lookahead	1850 / 1920 / 2114
GG Raccoon	Inget (full styrka)	0-ply (ingen lookahead)	1850 / 1920 / 2114
GG Otter	~1700 (mellannivå)	Framkallade fel	1543 / 1701 / 1827
GG Weasel	~1500 (nybörjare)	Mer frekventa fel	1410 / 1516 / 1652
GG Chipmunk	~1300 (novis)	Högfrekvens-fel-läge	1171 / 1275 / 1487

Botarna spelade 2 000 till 4 000 matcher per dag på plattformen, med maximal matchlängd 9 poäng. De spelade både standard backgammon och Nackgammon (Nack Ballards öppningspositions-variant). Matchinbjudningar var rate-begränsade efter spelarens rating: GG Otter accepterade endast inbjudningar från spelare under 1800, GG Weasel endast från spelare under 1600, och GG Chipmunk endast från spelare under 1400.

MrHyperBot — en annan arkitektur

Separat spelade MrHyperBot Hypergammon-varianten — tre-brickors hastighetsvarianten där varje spelare börjar med endast tre brickor på punkterna 22, 23 och 24. MrHyperBot använde inte ett neuralt nätverk. Istället använde den en uttömmande positionsdatabas som innehöll det beräknade bästa draget för varje möjlig hypergammon-position, utvecklad av Hugh Sconyers (alias "hugh" på GamesGrid). Hypergammons mindre tillståndsrum gjorde fullständig spelteoretisk lösning beräkningsmässigt möjlig, och Sconyers databas förblir den kanoniska referensen för varianten.

Xbot — Paul Magriels bot

En separat, oberoende bot, Xbot, drevs på GamesGrid av Paul Magriel (alias "X22"). Magriel — författare till Backgammon (1976), den kanoniska texten om positionsteori, och New York Times-backgammonkrönikör 1977–1980 — drev en neural-nätverks-bot för pengamatcher med små insatser på upp till 9 poäng. Magriels närvaro som aktiv operatör på GamesGrid vittnade om plattformens kulturella plats i 1996–2008-eran för tävlingsbackgammon.

Hela botfamiljen — GG Forever, GG Raccoon, GG Otter, GG Weasel, GG Chipmunk, MrHyperBot och andan från Xbot — återkommer på 2026-plattformen, återskapade från sina dokumenterade spel-fingeravtryck och kompletterade med en ny generation namngivna botmotståndare. Fler detaljer publiceras närmare återöppningen.

4. Slumptalsgenerering: varför det spelar roll

En backgammon-server är i grunden en tärningsgenerator. Det tekniska beslutet om hur servern producerar slumpmässiga kast har enorma implikationer för tävlingsintegritet — och historien om backgammon online innehåller dokumenterade fall där operatörer tog det beslutet fel.

4.1 Mersenne Twister (MT19937)

GamesGrid 2026-plattformen använder Mersenne Twister-pseudoslumpmässiga talgeneratorn, specifikt MT19937-varianten utvecklad av Makoto Matsumoto och Takuji Nishimura 1997. Algoritmen har:

En period på $2^{19937} - 1$ — astronomiskt större än antalet tärningskast i någon tänkbar plattformslivstid.
En 623-dimensionell likformig fördelning med 32-bitars noggrannhet — vilket betyder att efterföljande block av 623 utdata är likformigt fördelade i en hög-dimensionell mening, inte bara i 1D.
Hastighet: ~ $10^7$ kast per sekund på standardhårdvara, snabb nog för att RNG:n aldrig ska bli en flaskhals.

MT19937 är standard-RNG i GNU Backgammon, Pythons random-modul och en lång lista vetenskapliga Monte Carlo-simulatorer. Två tekniska reservationer är värda att nämna uttryckligen:

Den är inte kryptografiskt säker. En angripare som observerar 624 på varandra följande utdata kan rekonstruera det interna tillståndet och förutsäga framtida utdata. För tärningsgenerering i en autentiserad spelserver som inte exponerar sitt råa tillstånd är det inget relevant problem, men det utesluter användning av MT19937 som enda entropikälla för säkerhetskritiska syften.
Den har kända statistiska svagheter vid linjäritetstester. Eftersom algoritmen är byggd på linjär återkoppling över tvåelementsfältet $\mathbb{F}_2$ misslyckas den förutsägbart med vissa tester av linjär komplexitet i TestU01 BigCrush-sviten. Den klarar Diehard och de vanliga NIST-slumptal-batterierna, och feltyperna är väl karakteriserade och ortogonala mot användningsfallet här (likformiga heltalskast 1-6); men en fullständig beskrivning av MT19937 bör erkänna dem snarare än att beskriva algoritmen som universellt test-godkänd.

För tärningsgenerering dominerar period- och likformighetsegenskaperna avgörande över varje linjäritetsoro. Kryptografiska alternativ (t.ex. AES-CTR-DRBG) finns också tillgängliga, och plattformens granskningsspår registrerar algoritmen och frökällan för varje match.

4.2 Fröets granskningspolicy

Varje match på GamesGrid är kopplad till ett serverskapat frö. Fröet:

Loggas vid matchens start till en append-only granskningslogg.
Härleds från en hög-entropi-källa (hårdvaru-RNG kombinerat med systemets entropipool) vid tidpunkten för matchens initialisering — inte förutsägbart från tidigare matcher.
Registreras med matchprotokollet, vilket möjliggör efterföljande reproduktion av tärningssekvensen av en oberoende revisor.

I praktiken: varje tärningskast i en GamesGrid-match kan oberoende verifieras ha genererats av MT19937 från ett visst frö vid en viss tidpunkt. Tärningarna är inte "riggade" mot någon särskild spelare, och det finns ingen algoritmisk mekanism för att vinkla utfall för eller mot specifika konton.

4.3 Motexemplet: SafeHarbor Games

Historien om backgammon online inkluderar operatörer som har avvikit från en neutral RNG-policy. Det dokumenterade fallet är SafeHarbor Games, som vid olika tidpunkter drev rum som medvetet minskade frekvensen av dubbelslag för att lugna spelare som klagade över att förlora till "lyckliga" kast.

Avsikten var spelarbehållning. Effekten var en exploaterbar RNG: varje spelare som visste att dubbelslagsfördelningen var skev hade en mätbar förväntningsmässig fördel över spelare som inte visste det. I ett pengaspelssammanhang utgör detta en kränkning av tävlingsintegriteten — och den bredare online-backgammon-scenen reagerade därefter. Episoden hänvisas till i dåtidens spelarforum och är en del av operatörshistorien som ligger till grund för GamesGrid-plattformens dokumenterade engagemang för neutral, transparent algoritmisk tärningsgenerering.

2026-plattformens hållning är otvetydig: likformig fördelning, namngiven algoritm, granskningsloggade frön. Tärningarna är desamma för varje spelare, i varje rum, vid varje poäng.

5. 2026-plattformen: vad som är offentligt, vad som kommer

Det nya GamesGrid bibehåller de arkitektoniska valen som särskilde 1996–2008-servern — stängd-klient-spel med serversidetillstånd, transparent match-export till GNU Backgammon och XG, en graderad familj bots som härstammar från den ursprungliga GG-bot-uppsättningen — och bygger upp dem på modernt ingenjörsarbete. Den specifika funktionsuppsättningen, inklusive strukturen för karriärlägets bot-ligor och den nya bot-uppsättningen, publiceras närmare återöppningen.

Vad som är offentligt bekräftat idag:

Likformigt fördelade tärningar via MT19937, med granskningsloggade frön.
Match-export i standardformat (SGF / JF) för oberoende analys.
Ingen proprietär låsning på positionsutvärdering. Spelarna väljer sin egen analytiska motor.
Den klassiska GG-botfamiljen återvänder, återskapad från dokumenterade spel-fingeravtryck.
En ny generation namngivna botmotståndare täcker färdighetsstigen från nybörjare till världsmästarklass.

Hela Performance-Rating-ramverket som botfamiljen verkar inom finns på PR & ELO-sidan.

Se även

Performance Ratings (PR) & ELO — metodologi för färdighetsmätning.
Historia — 1996–2008 GamesGrid-eran och post-2020-återanskaffningen.
Matematik — match equity, take points, kubteori.
Ordlista — formella definitioner av PR, ELO, neuralt nätverk, Mersenne Twister, Hypergammon, Nackgammon.