Backgammons matematik

Backgammon er formelt et stokastisk to-spiller-nulsumsspil med perfekt information, imperfekt equity-asymmetri og en justerbar indsatsmultiplikator. Den noget tunge beskrivelse er nødvendig, fordi hver klausul svarer til en distinkt gren af spillets matematik:

Denne side dækker det matematiske apparat, som kompetitive spillere bruger til at håndtere dette maskineri: pip count, race equity-formler, match equity-tabeller, Janowski-formlen for doblerterningen, og de heuristiske genveje (Neil's Numbers), der komprimerer den formelle matematik til mentale beregninger ved brættet.

Undersider:


1. Positionsoptællinger og tilstandsrum

Antallet af lovlige backgammon-positioner er i størrelsesordenen 1,85×10191{,}85 \times 10^{19} — beregnelig som antallet af måder at fordele 30 brikker over de spilbare placeringer (24 felter, 2 udspilningsbakker, 2 bar-positioner), med begrænsningen på 15 brikker pr. side og reglen om, at felter ikke kan have blandet belægning, og med passende rettelser for ugyldige overlappende konfigurationer. Dette tal er stort nok til, at brute force-løsning via opslagstabel er uigennemførlig for det fulde spil; det er lille nok til, at race-positioner (dem ude af kontakt) tillader komplette bearoff-databaser.

Tom Keiths bearoff-databaser gemmer eksakte equity-værdier for race-fase-positioner og bruges af GNU Backgammon og eXtreme Gammon som race-fase-oraklet. De distribuerede databaser varierer i størrelse afhængigt af brikantal og dybde: typiske to-sidede 11-brikkers kontaktfri databaser er i størrelsesordenen 1–2 GB, med mindre undersæt distribueret til klient-side-brug. Databaserne konstrueres via dynamisk programmering over den rekursive bearoff-tilstand.


2. Pip count

Pip count er den grundlæggende metrik for enhver backgammon-position. Det er summen, på tværs af alle en spillers brikker, af de pips, hver brik skal tilbagelægge for at nå udspilningsbakken. Formelt:

Pip count=i=115di\text{Pip count} = \sum_{i=1}^{15} d_i

hvor did_i er afstanden (i pips) fra den ii-te briks aktuelle felt til den spillers udspilningsbakke.

Pip count ved start er 167 for hver spiller:

2×24+5×13+3×8+5×6=48+65+24+30=1672 \times 24 + 5 \times 13 + 3 \times 8 + 5 \times 6 = 48 + 65 + 24 + 30 = 167

Det gennemsnitlige kast i backgammon flytter en spiller 8⅙ pips pr. tur (forventningsværdien over de 21 distinkte kast vægtet med dobbeltslags-konventionen, der tæller hvert dobbeltslag fire gange). Det forventede antal ture for at få alle brikker hjem og spillet ud fra startpositionen er derfor omkring 167/8,1720,4167 / 8{,}17 \approx 20{,}4 ture.

I et rent race oversættes det førende pip count direkte til en vindersandsynlighed. Flere lukkede approksimationer er blevet udgivet. De to mest citerede er Thorp Count og Keith Count.


3. Thorp Count og Keith Count

Thorp Count (Edward Thorp, Backgammon: The Cube in the Money Game, 1978) justerer det rå pip count for strukturelle faktorer, der forskubber race equity ud over rå pip-afstand:

T=P+2×CO+S5×GT = P + 2 \times C - O + S - 5 \times G

hvor PP er det rå pip count, CC er antallet af brikker (15 ved start), OO er antallet af besatte felter (dem med 2 eller flere brikker), SS er antallet af nødvendige crossovers (et strukturelt udjævningsled), og GG er antallet af huller. Thorp Count beregnes for hver side, og forskellen mellem de to Thorp Counts forudsiger doblerterningshandling.

Keith Count (Tom Keith) er en mere nøjagtig senere forfining:

K=P+max(0,4position-pa˚-7-felt)+K = P + \max(0, 4 - \text{position-på-7-felt}) + \dots

med justeringer for antallet af stablede brikker på felt 1 og felt 2 (hvor pip count overvurderer race-hastigheden på grund af udspilnings-spild (wastage)). Keith Count er den anbefalede manuelle race-equity-formel i moderne kompetitivt spil.

For meget præcis race equity bruger spillerne den publicerede Tom Keith-bearoff-database eller stoler på neurale netværks-motorer, men både Thorp og Keith forbliver kanoniske mentale værktøjer.


4. Race equity og 8-9-12-reglen

Standardreglerne for doblerterningen i race gælder, når begge sider er ude af kontakt. Den meget citerede 8-9-12-regel for racets leder sammenfatter årtiers rollout-analyse til tre tærskler:

Disse tærskler er approksimationer. Eksakte race-equity-tabeller (Snowie, GNUbg, XG) forfiner dem position for position og tager højde for wastage, crossovers og bearoff-strukturens jævnhed.


5. Doblerterningens equity: take-point

Det mest citerede enkeltresultat i backgammon-matematik er det døde take-point25 %. Formelt:

For en spiller, der får tilbudt terningen med værdi CC: at acceptere og vinde giver +2C+2C point, og at acceptere og tabe koster 2C-2C point; at droppe koster C-C point ubetinget. Sæt forventet værdi af at tage lig med tabet ved at droppe:

p(+2C)+(1p)(2C)=Cp \cdot (+2C) + (1-p) \cdot (-2C) = -C 2pC2C+2pC=C2pC - 2C + 2pC = -C 4pC2C=C4pC - 2C = -C p=14=25%p = \frac{1}{4} = 25\%

Så modtageren bør tage ved enhver vindersandsynlighed p25%p \geq 25 \%, hvis vi ignorerer redoblet-værdi.

Med redoblet-vigorish — modtagerens værdi fra at kunne redoble — falder det praktiske take-point til omkring 21–22 % i de fleste positioner. Den eksakte reduktion afhænger af doblerterningens effektivitet ved senere vendepunkter og beregnes via rollout i moderne motoranalyse.

Det tilsvarende double-point for dobleren — den equity, hvorved doblingen er korrekt — afhænger af doblerterningens effektivitet (timing) og gammon-priser, og behandles i detaljer på match equity-siden.


6. Match equity

I match play viger den enkle pengespil-equity for match equity: sandsynligheden for at vinde matchen fra den aktuelle position, hvor det nuværende spils udfald integreres med alle efterfølgende spil ved alle nåbare scoringer. Match equity ved enhver score beregnes ud fra Match Equity-tabellen (MET), en to-dimensional tabel indekseret efter begge spilleres away-scores.

Den moderne standard er Rockwell-Kazaross MET, der gengives som en 9×9-kerne på match equity-siden, med den fulde 25×25 kanoniske tabel tilgængelig via GNU Backgammon.

Take-point, double-point og gammon-pris afhænger alle af scoren, ikke kun af det aktuelle spils vindersandsynlighed. En vindersandsynlighed på 22 %, der er et drop i pengespil, kan være et klart take ved visse matchscorer; en 50 %-vinderposition kan være »for stærk til at doble« ved andre.


7. Janowski-formlerne

Den fulde MET er eksakt (inden for den anvendte rollout-præcision), men besværlig at lære udenad. Janowski-stilens lukkede approksimationer, udledt fra arbejde af Rick Janowski og efterfølgende forfining, giver brugbare approksimationer, der passer til tabellen inden for omkring 1–2 % i de fleste celler. Der er brug for to forskellige formler — én for normale pre-Crawford-scorer og én for Crawford-spil-scorer.

Pre-Crawford (begge spillere ≥ 2-away, terning i spil):

M=0,5+0,87×DT+6M = 0{,}5 + 0{,}87 \times \frac{D}{T + 6}

Crawford-specifik (en spiller 1-away, terning ude af spil):

M=0,525+0,57×DT+2M = 0{,}525 + 0{,}57 \times \frac{D}{T + 2}

I begge er DD lederens forspring i point (efterkommerens away-score minus lederens away-score), og TT er efterkommerens away-score. Den fulde udledning, det gennemarbejdede eksempel og den almindelige fejl, der skal undgås (at bruge lederens away som TT), står på match equity-siden.


8. Neural-netværks-equity

Moderne motorer beregner ikke equity ud fra lukkede formler. De bruger trænede neurale netværk, der tager en positionsvektor — typisk ~250 features, der koder brikantal pr. felt, afstand til bearoff, eksponering for direkte og indirekte skud, prime-struktur, ankre, builders og mere — og leverer en equity-værdi eller en fordeling over vinder/gammon/backgammon-udfald.

Linjen fra TD-Gammon (Tesauro, 1992) gennem Jellyfish, Snowie, GNU Backgammon, eXtreme Gammon (XG), BGBlitz og Wildbg dækkes på Bots & AI-siden. Referencestandarden pr. 2026 er XG2-rollouts, som kombinerer fremadrettet søgning over flere plier med neural-netværks-bladevaluering og Monte Carlo-terningesampling ved trunkeringshorisonten.


9. Varians

Et enkelt backgammon-spil har en standardafvigelse på omkring 1,2 point pr. spil på den resulterende score (pengespil, uden Jacoby). Hen over en 7-points match akkumuleres variansen, og standardafvigelsen for færdighedsmålet er i størrelsesordenen 2,5–3,0 point pr. match — hvilket betyder, at individuelle korte matches ikke pålideligt adskiller små færdighedsforskelle. Standardværktøjet til adskillelse er Performance Rating (PR), der måler fejl pr. træk mod en reference-bot. Over hundreder af træk falder PR-variansen til små brøkdele af et millipoint, hvilket muliggør pålidelig færdighedssammenligning over nogle få tusinde træk. Se PR & ELO.


Se også


Fodnoter