La matemática del backgammon

El backgammon es, formalmente, un juego estocástico de suma cero entre dos jugadores, con información perfecta y una estructura de equity asimétrica bajo una palanca de apuesta regulable. La definición es densa, pero cada parte corresponde a una rama distinta de las matemáticas del juego:

Este pilar cubre el aparato matemático que los jugadores competitivos usan para manejar esa maquinaria: pip count, fórmulas de race equity, tablas de match equity, la fórmula de Janowski para el cubo y los atajos heurísticos (Neil's Numbers) que comprimen la matemática formal en cálculo mental al tablero.

Subpáginas (en inglés):


1. Número de posiciones y espacio de estados

El número de posiciones legales del backgammon es del orden de 1,85×10191{,}85 \times 10^{19}: se calcula como el número de formas de repartir 30 fichas entre las casillas jugables (24 puntos, 2 bandejas de salida, 2 posiciones de barra), bajo la restricción de 15 fichas por bando y sin ocupación mixta de puntos, con la corrección por configuraciones superpuestas inválidas. La cifra es lo bastante grande para que una solución por fuerza bruta con tablas no sea viable en el juego completo, y lo bastante pequeña para que las posiciones de carrera pura (fuera de contacto) admitan bases de datos completas de salida de fichas.

Las bases de datos de salida de Tom Keith guardan equities exactas para posiciones en fase de carrera y se usan en GNU Backgammon y eXtreme Gammon como oráculo de la fase de carrera. Las bases distribuidas varían en tamaño según el número de fichas y la profundidad: las de 11 fichas, libres de contacto y a dos bandos, suelen ocupar entre 1 y 2 GB, con subconjuntos más pequeños distribuidos para el lado cliente. Las bases se construyen mediante programación dinámica sobre el estado recursivo de salida.


2. Pip count

El pip count es la métrica fundamental de cualquier posición de backgammon. Es la suma, sobre todas tus fichas, de los pips que cada ficha tiene que recorrer todavía para llegar a la bandeja de salida. Formalmente:

Pip count=i=115di\text{Pip count} = \sum_{i=1}^{15} d_i

donde did_i es la distancia (en pips) desde la posición de la ficha ii hasta tu bandeja de salida.

El pip count inicial es 167 por jugador:

2×24+5×13+3×8+5×6=48+65+24+30=1672 \times 24 + 5 \times 13 + 3 \times 8 + 5 \times 6 = 48 + 65 + 24 + 30 = 167

La tirada media en backgammon hace avanzar a un jugador 8⅙ pips por turno (la esperanza sobre las 21 tiradas distinguibles, ponderada bajo la convención de que cada doble cuenta cuatro veces). El número esperado de turnos para llevar todas las fichas a casa desde la posición inicial y sacarlas es de unos 167/8,1720,4167 / 8{,}17 \approx 20{,}4 turnos.

En una carrera pura, la ventaja en pip count se traduce directamente en probabilidad de victoria. Hay varias fórmulas cerradas publicadas. Las dos más citadas son el Thorp Count y el Keith Count.


3. El Thorp Count y el Keith Count

El Thorp Count (Edward Thorp, Backgammon: The Cube in the Money Game, 1978) corrige el pip count bruto por factores estructurales que sesgan la race equity más allá de la distancia bruta. Incluye el número de fichas, los puntos hechos, los crossovers y los huecos. El Thorp Count se calcula para los dos bandos y la diferencia predice la acción de cubo.

El Keith Count (Tom Keith) es un refinamiento posterior y más preciso, con correcciones por la cantidad de fichas apiladas en los puntos 1 y 2 (donde el pip count sobreestima la velocidad de carrera por el wastage al sacar). El Keith Count es la fórmula manual recomendada para race equity en el juego competitivo moderno.

Para race equity de gran precisión, los jugadores usan la base de datos de salida de Tom Keith o se apoyan en motores neuronales, pero tanto Thorp como Keith siguen siendo herramientas mentales canónicas.


4. Race equity y la regla 8-9-12

Las reglas estándar de decisión con cubo en carrera se aplican cuando los dos bandos están fuera de contacto. La muy citada regla 8-9-12 para el líder de una carrera comprime décadas de análisis con rollouts en tres umbrales:

Son aproximaciones. Las tablas exactas de race equity (Snowie, GNUbg, XG) las refinan posición por posición, con corrección por wastage, crossovers y suavidad de la estructura de salida.


5. Cube equity: el take point

El resultado más citado de las matemáticas del backgammon es el take point de cubo muerto del 25 %. Formalmente:

Para un jugador al que se le ofrece un cubo de valor CC, aceptar significa +2C+2C puntos si gana y 2C-2C puntos si pierde; rechazar le cuesta C-C puntos de forma incondicional. Igualando el valor esperado de aceptar con la pérdida de rechazar:

p(+2C)+(1p)(2C)=Cp \cdot (+2C) + (1-p) \cdot (-2C) = -C 2pC2C+2pC=C2pC - 2C + 2pC = -C 4pC2C=C4pC - 2C = -C p=14=25%p = \frac{1}{4} = 25\,\%

El receptor debe aceptar con cualquier probabilidad de victoria p25%p \geq 25\,\%, sin contar el valor de recubaje.

Con recube vigorish (el valor que tiene para el receptor poder redoblar más tarde) el take point práctico baja a alrededor de 21-22 % en la mayoría de las posiciones. La reducción exacta depende de la eficiencia del cubo en momentos posteriores y la calculan los motores modernos con rollouts.

El double point correspondiente para el que dobla —la equity a partir de la cual doblar es correcto— depende de la eficiencia del cubo (timing) y de los gammon prices, y se trata en detalle en la página de match equity (en inglés).


6. Match equity

En las partidas largas, la equity de dinero simple deja paso a la match equity: la probabilidad de ganar el match desde la posición actual, integrando el resultado de la partida en curso con todas las partidas siguientes en todos los marcadores accesibles. La match equity en cualquier marcador se calcula a partir de la tabla de match equity (MET), una tabla bidimensional indexada por los marcadores "away" de los dos jugadores.

El estándar moderno es la Rockwell-Kazaross MET, reproducida como núcleo de 9×9 en la página de match equity, con la tabla canónica 25×25 disponible vía GNU Backgammon.

El take point, el double point y el gammon price dependen del marcador, no solo de la probabilidad de victoria de la partida actual. Una probabilidad de victoria del 22 % que en juego por dinero es rechazo claro puede ser take claro en ciertos marcadores de match; una posición ganadora al 50 % puede ser "demasiado bueno para doblar" en otros marcadores.


7. Las fórmulas de Janowski

La MET completa es exacta (dentro de la precisión de rollout con que se ha construido), pero engorrosa de memorizar. Las fórmulas al estilo Janowski, surgidas del trabajo de Rick Janowski y refinamientos posteriores, ofrecen aproximaciones útiles que casan con la tabla con un margen de 1-2 % en la mayoría de las celdas. Hacen falta dos fórmulas distintas: una para los marcadores normales pre-Crawford y otra para los marcadores de Crawford.

Pre-Crawford (los dos jugadores ≥ 2-away, cubo en juego):

M=0,5+0,87×DT+6M = 0{,}5 + 0{,}87 \times \frac{D}{T + 6}

Específica de Crawford (un jugador en 1-away, cubo fuera del juego):

M=0,525+0,57×DT+2M = 0{,}525 + 0{,}57 \times \frac{D}{T + 2}

En las dos, DD es la ventaja del líder en puntos (away del rezagado menos away del líder) y TT es el away del rezagado, los puntos que aún necesita el rezagado para ganar. La deducción completa, el ejemplo resuelto y el error típico (usar TT = away del líder) están en la página de match equity en inglés.


8. Equity neuronal

Los motores modernos no calculan la equity desde fórmulas cerradas. Usan redes neuronales entrenadas que toman como entrada un vector de posición —en general unas 250 características que codifican el recuento de fichas por punto, la distancia a sacar, la exposición a disparos directos e indirectos, la estructura de prima, anclas, builders y más— y producen un valor de equity o una distribución sobre los resultados de victoria/gammon/backgammon.

La línea de TD-Gammon (Tesauro, 1992) a Jellyfish, Snowie, GNU Backgammon, eXtreme Gammon (XG), BGBlitz y Wildbg se cubre en la página de Bots & AI. El estándar de referencia en 2026 son los rollouts XG2, que combinan búsqueda hacia delante a varias plies con evaluación neuronal en las hojas y muestreo Monte Carlo de los dados en el horizonte de truncamiento.


9. Varianza

Una partida individual de backgammon tiene una desviación típica cercana a 1,2 puntos en el marcador final (juego por dinero, sin Jacoby). En un match a 7 puntos la varianza se acumula, y el error estándar de medición del nivel queda entre 2,5 y 3,0 puntos por match, lo que significa que los matches cortos sueltos no permiten distinguir con fiabilidad las diferencias de nivel pequeñas. La herramienta estándar para diferenciar niveles es el Performance Rating (PR), que mide el error por jugada contra un bot de referencia. A lo largo de cientos de jugadas, la varianza del PR cae a fracciones pequeñas de milipunto, lo que permite comparaciones de nivel fiables a lo largo de unos pocos miles de jugadas. Consulta PR y ELO en inglés.


Véase también


Notas