Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Baseball'Spytha-wps Office 2
Baseball'Spytha-wps Office 2
carreras anotadas 2
estimació ndeporcentaje
(1)
=
carreras anotadas 2 + carreras permitidas 2 de juegos ganados.
Considere un triá ngulo rectá ngulo con una hipotenusa (el lado má s
largo) de longitud c y otros dos lados de longitud ayb. Recuerde de la
geometría de la escuela secundaria que el teorema de Pitá goras establece
que un triá ngulo es un triá ngulo rectángulo si y solo si a 2 + b 2 = c 2 . Por
ejemplo, un triá ngulo con lados de longitudes 3, 4 y 5 es un triá ngulo
rectá ngulo triá ngulo porque 3 2 + 4 2 = 5 2 . El hecho de que la ecuació n (1)
sume los cuadrados de dos nú meros llevó a Bill James a llamar a la relació n
descrita en (1) Teorema de Pitá goras de Baseball.
Vamos a definir
carreras anotadas
R= como proporció n de puntuació n del equipo. Si
dividimos
carreras permitidas
(1) '
Por ejemplo, los Detroit Tigers (DET) de 2006 anotaron 822 carreras y se
rindieron.
822
675 carreras. Su relació n de puntuació n fue R = = 1.218.
Suganadorpredicho
675
.597.
162
1 DAM=0.020
die 2006 realeza 62 100 757 971 0.780 0.378 0.383 0.005
cis
éis
Figura 1.1. Teorema de Pitá goras del béisbol, 1980 — 2006. SeefileStandings.xls.
error significa que el equipo ganó má s juegos de los previstos, mientras que
un error negativo significa que el equipo ganó menos juegos de los
previstos. Columna Jinfigura
Exp Exp.
R+ 1
.R
(2)
La figura 1.2 muestra los cambios de MAD a medida que varía exp entre 1
y 3. 2 nosotros
vea que, de hecho, exp = 1.9 produce la MAD más pequeñ a (1.96%). Un
valor de exp de 2 es casi tan bueno (MAD de 1,97%), por lo que, por
simplicidad, nos quedaremos con la opinió n de Bill James de que exp = 2.
Por lo tanto, exp = 2 (o 1,9) produce los mejores pronó sticos si usamos una
ecuació n de la forma (2). Por supuesto, puede haber otra ecuació n que
prediga el porcentaje de victorias mejor que el Teorema de Pitá goras a partir
de las carreras anotadas y permitidas. El teorema de Pitá goras es simple
e intuitivo, sin embargo, y funciona muy bien. Después de todo, estamos
prediciendo las victorias del equipo por un promedio de 162 × 0,02, que es
aproximadamente tres victorias por equipo. Por lo tanto, veo una razó n
para buscar un modelo má s complicado (aunque un poco má s preciso).
2
Consulte el apéndice del capítulo para obtener una explicació n de có mo se usó la
excelente funció n Tabla de datos de Excel para determinar có mo MAD cambia segú n
variaba entre 1 y 3.
norte O
2 Exp
3 2
4 Variación de MADasExchanges
5 ENOJADO
6 Exp 0.0197
7 1.0 0.0318
8 1.1 0.0297
9 1.2 0.0277
10 1.3 0.0259
11 1.4 0.0243
12 1.5 0.0228
13 1.6 0.0216
14 1.7 0.0206
15 1.8 0.0200
17 2.0 0.0197
18 2.1 0.0200
19 2.2 0.0207
20 2.3 0.0216
21 2.4 0.0228
22 2.5 0.0243
23 2.6 0.0260
24 2.7 0.0278
25 2.8 0.0298
26 2.9 0.0318
27 3.0 0.0339
Figura 1.2. Dependencia de la precisió n del Teorema de Pitá goras en
exponente.SeefileStandings.xls.
3
En seis series de playoffs, los equipos contrarios tuvieron registros idénticos de victorias y
derrotas, por lo que el enfoque de “Juegos ganados” no pudo hacer una predicció n.
Probablemente me decepcionó que incluso el método de Pitá goras solo
pronosticara correctamente el resultado de menos del 54% de las series
de playoffs de béisbol. Creo que la temporada regular es un predictor
relativamente pobre de los playoffs en el béisbol porque el récord de
temporada regular de un equipo depende en gran medida del desempeñ o de
cinco lanzadores abridores. Durante los playoffs, los equipos solo usan
tres o cuatro lanzadores abridores, muchos de los datos de la temporada
regular (juegos que involucran al cuarto y quinto lanzador abridor) no
son relevantes para predecir el resultado de los playoffs.
800
162(1.0625) 2
1 + (1.0625) 2
= 85.9 juegos.Después de la
comercio,
870
R= = 1,0875,
800
1 + (1.0875) 2
4
En los capítulos 2 a 4 explicaremos en detalle có mo determinar cuántas carreras crea un
bateador.
Fútbol y baloncesto “Teoremas de Pitágoras”
Para las temporadas 2005–7NFL, MAD fue minimizado por exp = 2.7.
Exp = 2,7 rindió un MAD de 5,9 %, mientras que Morey 's exp = 2,37
rindió un MAD de 6,1 % . Dado que los valores de exp de Morey tienen una
precisió n muy cercana a los valores que encontramos en temporadas
recientes, nos quedaremos con los valores de exp de Morey. Estos
porcentajes ganadores pronosticados se basan en datos de la temporada
regular.
Por lo tanto, podríamos observar equipos que se desempeñ aron mucho mejor
de lo esperado durante la temporada regular y predecir que “la suerte los
alcanzaría”.
B C D mi F GRA H yo j k L ME nort
MO TR e
O
3 exp=2.4 MAD=0.061497
Punto puntos % % de
s en ganador ganancia
par contra previsto anual
5 Año Equipo victo Pérdid a Relació Absorr Exp ENOJA
rias as n DO
7 2007 B. Facturas 7 9 252 354 0.711864 0.308853076 0.4375 0.128647 1.5 0.08419
8 2007 Jets de Nueva 4 12 268 355 0.75493 0.339330307 0.25 0.08933 1.6 0.080449
York
9 2007 M. delfines 1 15 267 437 0.610984 0.237277785 0.625 0.174778 1.7 0.077006
10 2007 C.marrones 10 6 402 382 1.052356 0.530199349 0.625 0.094801 1.8 0.073795
11 2007 P. Steelers 10 6 393 269 1.460967 0.710633507 0.625 0.085634 1.9 0.070675
13 2007 B.Cuervos 5 11 275 384 0.716146 0.311894893 0.3125 0.000605 2.1 0.06588
14 2007 I. Potros 13 3 450 262 1.717557 0.782779877 0.8125 0.02972 2.2 0.064002
15 2007 J.Jaguares 11 5 411 304 1.351974 0.67144112 0.6875 0.016059 2.3 0.062394
die 2007 titanes 10 6 301 297 1.013468 0.507925876 0.625 0.117074 2.4 0.061216
cis
éis
17 2007 H.Texanos 8 8 379 384 0.986979 0.492235113 0.5 0.007765 2.5 0.060312
18 2007 Cargadores SD 11 5 412 284 1.450704 0.707186057 0.6875 0.019686 2.6 0.059554
19 2007 D.Broncos 7 9 320 409 0.782396 0.35856816 0.4375 0.078932 ¡mej 2.7 0.059456
or!
20 2007 O.Raiders 4 12 283 398 0.711055 0.308278013 0.25 0.058278 2.8 0.059828
21 2007 KCCjefes 4 12 226 335 0.674627 0.282352662 0.25 0.032353 2.9 0.060934
23 2007 Gigantes de 10 6 373 351 1.062678 0.535957197 0.625 0.089043 3.4 0.063891
Nueva York
37 2006–2007NBA DAM=0.05
38
55 Los Knicks de Nueva York 97.5 100.3 0.97 0.403 0.402 0.000
con ellos.” Esta línea de pensamiento llevaría a creer que estos equipos
se desempeñ arían peor durante los playoffs. Tenga en cuenta que el
Miami Heat y los Dallas Mavericks ganaron aproximadamente un 8% má s
de juegos de lo esperado durante la temporada regular . Por el contrario,
durante la temporada regular, los San Antonio Spurs y los Chicago Bulls
ganaron alrededor de un 8 % menos de juegos de lo que predice el
Teorema de Pitágoras , lo que indica que estos equipos se desempeñ arían
mejor de lo esperado en los playoffs. Efectivamente, los Bulls derrotaron
al Heat y le dieron un tiempo difícil a los Detroit Pistons. Por supuesto,
los Spurs ganaron el título de la NBA en 2007. Ademá s, el Teorema de
Pitá goras tenía a los Spurs como, por mucho, el mejor equipo de la liga
(78% del porcentaje de victorias previsto). Tenga en cuenta que el
equipo que menos logró má s fue el Boston Celtics, que con casi un 9%
menos (o 7)
juegos de lo previsto. Muchas personas sugirieron que los juegos de los
Celtics "se hundieron" durante la temporada regular para mejorar sus
posibilidades de obtener futuras superestrellas potenciales como Greg
Oden y Kevin Durant en la lotería del draft de 2007. El hecho de que los
Celtics ganaran siete juegos menos de lo esperado no prueba esta
conjetura, pero sin duda es consistente con la opinió n de que los Celtics
no lograron ganar todos los juegos cerrados.
APÉNDICE
tablas de datos
(2) para predecir el porcentaje de victorias del equipo depende del valor
de exp. Para ilustrar, vamos a mostrar có mo usar una tabla de datos
unidireccional para determinar có mo la variació n de exp de 1 a 3 cambia
el error promedio al predecir el porcentaje de victorias de un equipo de
la MLB (consulte la figura 1.2) .
+ 4 × jonrones (HR).
Vemos que Ichiro tenía un promedio de bateo más alto que Nomar, pero
debido a que bateó muchos má s dobles, triples y jonrones, Nomar tenía
un porcentaje de slugging mucho má s alto. Ichiro caminó un par de veces
má s que Nomar. Entonces, ¿qué jugador tuvo mejor añ o de bateo?
Whenabatterishitting,hecancausegoodthings(likehitsorwalks)tohappe
norcausebadthings(outs)tohappen.Tocomparehitterswemustdevelopam
etricthatmeasureshowtherelativefrequencyofabatter'sgoodeventsandba
deventsinfluencethenumberofrunstheteamscores.In1979BillJamesdevelo
pedthefirstversionofhisfamousRunsCre-
atedFormulainanattempttocomputethenumberofruns“created”byahitter
duringthecourseofaseason.Themosteasilyobtaineddatawehaveavailablet
odeterminehowbattingeventsinfluenceRunsScoredareseason-
longteambattingstatistics.Asampleofthisdataisshownin
figura 2.1.
TABLA 2.1
EstadísticasparaIchiroSuzukiyNomarGarciaparra
AB 704 684
2B 24 44
3B 5 11
HORA 8 30
BB + HTA 53 41
A B C D mi F GRA H j S
MO
6 2000 792 5630 1503 988 316 32 167 653 B. Medias Rojas
7 2000 978 5646 1615 1041 325 33 216 644 C. Medias Blancas
12 2000 871 5556 1541 1017 294 25 205 688 Yankees de Nueva
York
14 2000 907 5497 1481 957 300 26 198 823 Marineros del S.
die 2000 848 5648 1601 1063 330 35 173 619 T.Rangers
cis
éis
Figura 2.1. Datos de bateo de equipos para la temporada 2000. Ver archivo
equipos.xls.
James se dio cuenta de que debería haber una forma de predecir las
carreras de cada equipo a partir de hits, sencillos, 2B, 3B, HR, outs y BB +
HBP. 1 Usando su gran intuició n, James ideó la siguiente fó rmula
relativamente simple.
1
Por supuesto, estamos omitiendo cosas como Sacrifice Hits, Sacrifice Flies, Stolen Bases
y Caught Stealing. Las versiones posteriores de Ejecuciones creadas utilizan estos eventos
para calcular las Ejecuciones creadas. Consulte
http://danagonistes.blogspot.com/2004/10/brief-history-of-run-estimation-runs.html para
obtener un excelente resumen de la evolució n de las ejecuciones creadas.
(hits + BB + HBP) × (TB)
carreras creadas = .
(AB + BB + HTA)
(1)
tendrá unatemporada.Laotrapartedelaecuació n,
TB (AB + BB + HTA)
,
mide la velocidad a la que los corredores avanzan por aparició n en el
plato. Por lo tanto (1) está multiplicando el nú mero de corredores de
base por la velocidad a la que avanzaron. Utilizando la informació n de la
figura 2.1 podemos calcular las carreras creadas para los Anaheim
Angels de 2000.
(5628 + 655)
ciega !
2
Los datos provienen de la fabulosa base de datos de béisbol de Sean Lahman,
http://baseball1.com/statistics/ .
gran temporada de 2004 en la que tuvo un promedio de bateo de .362,
alcanzó un HR en el 7% de todas las apariciones en el plato y recibió una
base por bolas o HBP durante aproximadamente el 39% de sus
apariciones en el plato. muy diferente de los datos utilizados para ajustar
la relació n. Siguiendo esta ló gica, no debemos esperar que una fó rmula
de carreras creadas basada en datos del equipo prediga con precisió n las
carreras creadas por una superestrella como Barry Bonds o por un
jugador muy pobre. En el capítulo 4 solucionaremos este problema.
Ichirovs.Nomar
A C D mi F GRA H j S T tu
MO
Figura 2.2. Carreras creadas para Bonds, Suzuki y Garcíaparra. Ver archivo
teams.xls.
Vemos que Ichiro creó 133 carreras y Nomar creó 126 carreras. Los bonos
crearon 186 carreras. Esto indica que Ichiro 2004 tuvo un añ o de bateo
ligeramente mejor que Nomar 1997. Por supuesto, el desempeñ o de
Bonds en 2004 fue muy superior al de los otros dos jugadores.
Carreras creadas por juego
3
Dado que el equipo de casa no batea en la novena entrada cuando está adelante y
algunos juegos van a entradas extra, el promedio de outs por juego no es exactamente 27. Para
los añ os 2001–6, el promedio de outs por juego fue de 26.72.
A C D mi F GRA H j S T tu
MO
451,3
= 16,9
26.72
133.16
juegos. Por lo tanto, Ichiro creó = 7.88 carreras por juego. Má s
ejecució n creada
= .
.982(AB) — aciertos + GIDP + SF + SAC + CS
26.72
(2)
variable (llamada
Yoolavariabledependiente)desdeunconjuntoaunavariableindependiente
El bateador anota todo el tiempo en lugar de 1/8 del tiempo, lo que crea
7/8 de una carrera.
0.06 carreras, mientras que ser atrapado robando causa 0.02 carreras.
Vemos que el peso de HR está de acuerdo con nuestro cá lculo simple.
También el hecho de que el doble
1
Si no elevamos al cuadrado el error de predicció n de cada equipo, encontraríamos que
los errores de los equipos que anotaron más carreras de las previstas serían anulados por los
errores de los equipos que anotaron menos carreras de las previstas.
A B C D mi F GRAMO
SALIDA DE
RESUMEN
1
3 Estadísticas de regresión
4 MúltipleR 0.954033
5 R Plaza 0.910179
Ajustado
Rcuadrad
o
6 0.907066
Error
estándar
7 24.48612
8 Observacione 210
s
10 ANOVA
11 d.f SS EM F SignificadoF
.
15
error
estánd
ar
die Coeficientes tEstad valor p Inferior 95% 95% superior
cis
éis
Intercep
ciones _
17 −563.029 37.21595 −15.128695 4.52E-35 −636.4104075 −489.647257
Bases por
bolas+Golpe
ado
22 0.346469 0.025734 13.4633465 6.55E–30 0.295726467 0.397210735
porLanzador
pillado
robando
Todas las variables independientes tienen valores de p < .05, por lo que
todas pasan la prueba de significació n estadística. Usemos la siguiente
ecuació n (derivada de las celdas B17:B22 de la figura 3.2) para predecir
las carreras anotadas por un equipo en una temporada.
SALIDA DE
RESUMEN
1
3 Estadísticas de regresión
4 MúltipleR 0.953776
5 R Plaza 0.909688
Ajustado
Rcuadrad
o
6 0.907475
Error
estándar
7 24.48223
8 Observacione 210
s
10 ANOVA
11 d.f. SS EM F SignificadoF
15
error
estánd
ar
die Coeficiente tEstad valor p Inferior 95% 95% superior
cis s
éis
Intercep
ciones _
17 −559.997 35.52184 −15.76486473 3.81E–37 −630.0341104 −489.9600492
Bases por
bolas+Golpe
ado
22 0.346563 0.025509 13.58610506 2.3E–30 0.296268954 0.396857822
porLanzador
1 Pesos
lineales
ENOJA
DO
2
18.63392992 0.632785531 0.705947 1.2637 1.49074135 0.346563388
4 2000 864 909.5427592 45.54275916 5628 1574 995 309 34 236 655 A. Ángeles
5 2000 794 799.0320991 5.032099146 5549 1508 992 310 22 184 607 B.Orioles
6 2000 792 803.9731688 11.97316875 5630 1503 988 316 32 167 653 B. Medias Rojas
7 2000 978 915.0553052 62.94469483 5646 1615 1041 325 33 216 644 C. Medias Blancas
8 2000 950 963.4255338 13.42553378 5683 1639 1078 310 30 221 736 C.Indios
9 2000 823 832.5769282 9.576928216 5644 1553 1028 307 41 177 605 D.Tigres
10 2000 879 840.3183782 38.6816218 5709 1644 1186 281 27 150 559 KCRoyals
11 2000 748 758.3410712 10.34107117 5615 1516 1026 325 49 116 591 M. Gemelos
12 2000 871 866.7249473 4.275052678 5556 1541 1017 294 25 205 688 Yankees de Nueva
York
13 2000 947 907.8792749 39.12072513 5560 1501 958 281 23 239 802 O.Atletismo
14 2000 907 870.6080889 36.3919111 5497 1481 957 300 26 198 823 Marineros del S.
15 2000 733 716.5050083 16.49499174 5505 1414 977 253 22 162 607 Rayos del diablo TB
die 2000 848 862.2678037 14.26780365 5648 1601 1063 330 35 173 619 T.Rangers
cis
éis
17 2000 861 878.0880125 17.08801249 5677 1562 969 328 21 244 586 T.BlueJays
18 2000 792 775.4920641 16.50793587 5527 1466 961 282 44 179 594 A.Diamondbacks
2 Consulte el excelente
resumen de DanAgonistes, http://danagonistes.blogspot.com/2004/10/brief-
history-of-run-estimation.html;Schwarz , TheNumbersGame ;Palmer,
TheHiddenGameofBaseball ;yBoswell, TotalBaseball .
TABLA 3.1
SB — — 0.3 1.0 —
CS — — — 0,6 —1.0 —
Nota : Los campos vacíos indican eventos que los autores no han utilizado en un modelo específico.
A B C D mi F GRA H j S T
MO
234 Bonos2004 18.016031 6719.98 2432 1081 486.4 54 810.72139 4359.879477 3259.26522574 20.11892114
235 Ichiro2004 9.5916938 6752.55 2513 2158 230.2 48 76.733551 508.3597738 1323.318592 8.168633281
236 Nomar1997 8.646103 5913.93 1807 1072 380.4 95.1 259.38309 354.4902215 1020.697841 6.300603957
Figura 3.4. Estimaciones de pesos lineales de carreras por juego creadas por
Bonds, Suzuki y Garcíaparra.
En las filas 233 a 35, las estadísticas de cada jugador (de las filas 226 a
28) se multiplicaron por 4329/(outs del jugador). Este es el “factor de
escala” del jugador. Luego, en la columna S, se aplicó el modelo de
regresió n de pesos lineales (ecuació n 2) a las filas de datos 233: 35 para
predecir las carreras totales de la temporada para un equipo formado
por un solo jugador (consulte las celdas S233: S235). En las celdas
T233:T235, las carreras pronosticadas para una temporada se dividen
entre 162 para crear carreras pronosticadas por juego. Predecimos un
equipo de Bonds 2004 para anotar 20,12 carreras por juego, un equipo
de Ichiro 2004 para anotar 8,17 carreras por juego y un equipo de
Nomar1997 para anotar 6,30 carreras por juego. Tenga en cuenta que el
uso de carreras creadas da estimaciones de 20,65, 7,88 y 6,72 carreras,
respectivamente, para los tres jugadores. Por lo tanto, para los tres
jugadores, las Carreras Creadas y los Pesos Lineales dan predicciones muy
similares para el nú mero de carreras de las que un jugador es responsable
durante un juego .
=
temporada jugadores outs
temporada
.
Tenga en cuenta que ambos lados de esta ecuació n tienen las mismas unidades.
A B C D mi F GRAMO
SALIDA DE
RESUMEN
1
3 Estadísticas de regresión
4 MúltipleR 0.9520351
5 R Plaza 0.9063709
Ajustado
Rcuadrad
o
6 0.9053129
Error
estándar
7 25.70605
8 Observacione 180
s
10 ANOVA
11 d.f. SS EM F SignificadoF
15
error
estánd
ar
die Coeficientes tEstad valor p Inferior 95% 95% superior
cis
éis
Figura 3.5. Equipo de predicció n de regresió n corre desde OBP y SLG. Consulte el
archivo teamhittingobsslug.xls.
Por supuesto, OPS otorga el mismo peso a SLG y OBP. ¿Es esto
razonable? Para determinar el peso relativo adecuado para dar SLG y
OBPI, se utilizaron datos del equipo de 2000–2006 y se realizó una regresió n
para predecir las carreras anotadas por el equipo usando OBP y SLG como
variables independientes.
La figura 3.5 muestra que tanto OBP como SLG son altamente
significativos (cada uno tiene un valor p cercano a 0). El R cuadrado en la
celda B5 indica que explicamos el 90,6 % de la variació n en las carreras
anotadas. Esto se compara muy favorablemente con el mejor modelo de
pesos lineales, que tenía un R cuadrado de 0,91. Dado que este modelo
parece má s fá cil de entender, es fá cil ver por qué OBP y SLG son muy
valorados por las oficinas centrales del béisbol. Tenga en cuenta, sin
embargo, que predecimos la puntuació n de carreras del equipo como:
1003,65 + 1700,8 × (SLG) + 3157 × (OBP). Esto indica que el OBP es
aproximadamente el doble de importante (3157/1700 es cerca de 2) que
SLG. Tal vez las tarjetas de béisbol deberían incluir una nueva estadística: 2
× OBP + SLG.
Ejecuciones creadas por encima del promedio
outs realizados por Ichiro 2004. Vemos que Ichiro creó 451 outs. La fila 6
muestra las mismas estadísticas para un equipo promedio de la MLB
(basado en las temporadas 2000–2006).
A C D mi F GRAMO H yo j k
1 OutsUsed
2 451.328
Equipo
Promedio
IchiroAña
dido
aAverage
Team
IchiroRu
nsOver
Average
10
11 59.111
Figura 3.6. Cá lculo de cuá ntas carreras agregaría Ichiro a un equipo promedio.
Ver archivo Ichiro por encima del promedio.xls.
— 556 + .633 × (1095.7) + (.706) × 289.13
La figura 3.7 enumera las mejores veinticinco carreras por encima del
desempeñ o promedio (para jugadores con al menos 350 AB) durante las
temporadas 2001–6. Nó tese el dominio creíble de Barry Bonds; él tuvo
las cuatro mejores actuaciones. Albert Pujols tuvo cuatro de las
veinticinco mejores actuaciones, mientras que Todd Helton tuvo tres de
las doce mejores actuaciones.
A B C D
Figura 3.7. Las carreras superiores por encima del rendimiento medio,
2001 — 6.
En el capítulo 4 utilizaremos la simulació n de Monte Carlo para
obtener otra estimació n de cuá ntos jugadores se suman a un equipo
particular.
APÉNDICE
B2:b212 e2:k212
ConstantisZero
Opciones de entrada
Probabilidad Normal
Notas
Gráficos de residuosLineFitplots
Figura 3-b. Cuadro de diá logo Regresió n.
carreras. Señ alamos que para los jugadores que ven las frecuencias de los
eventos
1
Esto me lo describió Jeff Sagarin, estadístico deportivo de USAToday .
k L MET norte O PAGS
RO
Ejecu Carreras
ciones creadas /
creadas Juego
3 Método al bate HOR salida
A s
Figura 4.1. Carreras creadas y pesos lineales previstos carreras por juego para Joe
Hardy. Ver archivosimulationmotivator.xls.
3 1 0.31683256 HORA 0 1 no 2
4 2 0.51244762 afuera 1 1 no
5 3 0.45037806 HORA 1 2 no
6 4 0.634642925 afuera 2 2 no
7 5 0.785525468 afuera 3 2 sí
Figura 4.2. Simulació n de una entrada para Joe Hardy. Ver archivo motivació n de
simulació n.xls.
Suponemos que cada error avanza a todos los corredores de base en una sola base.
Una ventaja individual corta avanza a todos los corredores en una base.
C D
13 Evento
14 1 Tachar
15 2 Caminar
die 3 hitbypitch
cis
éis
17 4 Error
18 5 Longsingle (avance2bases)
21 8 cortodoble
22 9 largodoble
23 10 Triple
24 11 Carrera
26 13 pelota normal
27 14 Linedriveorinfieldfly
28 15 mosca larga
30 17 vuelo corto
Una bola de elevado medio (si hay menos de dos outs) anota un corredor
de tercera.
1 Número Probabilida
d
3 At Bats+Sac.Hits+Sac.Bunts 709
4 errores 13 0.0170604
6 ponches 63 0.0826772
8 HTA 4 0.0052493
10 2B 24 0.0314961
11 3B 5 0.0065617
12 HORA 8 0.0104987
Los outs (en juego) son apariciones en el plato que resultan en outs sin
ponches: outs (en juego) = (AB + SF + SB) - hits - errores - ponches.
Histó ricamente, los errores son el 1,8 % de AB + SB + SF, por lo que calculamos
los errores = 0,018 ×
(AB + SB + SF).
4 = 762.
El 30% de los singles son singles largos, el 50% son singles medianos y el 20%
son singles cortos.
El 53,8 % de los outs en juego son bolas bajas, el 15,3 % son moscas de
campo o líneas, y el 30,9 % son bolas voladoras.
El 20% de todos los fly balls son fly balls largos, el 50% son fly balls medianos
y el 30% son fly balls cortos.
tremecasos.
Para Ichiro 2004, Nomar 1997 y Bonds 2004, nuestra simulació n arroja
las siguientes estimaciones para las carreras creadas por juego.
(b)
Figura 4.5. Dos entradas de muestra de la simulació n de Ichiro 2004.
2 Salir Número
3 PlacaApariciones 5591
4 At Bats+Sac.Hits+Sac.Bunts 5095
5 errores 92
7 ponches 872
9 HPB 57
10 Individual 887
11 2B 259
12 3B 26
13 HORA 135
B mi D
4 At Bats+Sac.Hits+Sac.Bunts 538
5 errores 10 0.015773
7 ponches 50 0.078864
9 HTA 4 0.006309
10 Individual 94 0.148265
11 2B 33 0.05205
12 3B 1 0.001577
13 HORA 49 0.077287
Figura 4.7. Estadísticas de Albert Pujols 2006. Ver archivo Pujols may 26.xls.
1.025 2 + 1
= 82,48 juegos.
habría ganado
.927 2 + 1
que Pujol agregó 82.48 — 74.36 = 8.12 victorias para los Cardenales
(asumiendo
162 × (1.089) 2
(1 + 1.089 2 )
= 87,38
4 At Bats+Sac.Hits+Sac.Bunts 5658.03
9 HTA 50 0.00801761
11 2B 304.5 0.04882726
12 3B 31.73 0.00508798
del récord de bateo de Pujols en 2006 indica que agregó alrededor de 9.5
victorias má s de lo que tendría un jugador promedio.
APÉNDICE
2 Corredor
PromedioEntrada
3 3.00
5 4
6 1 0
7 2 2
8 3 0
9 4 3
10 5 0
11 6 4
12 7 4
13 8 6
14 9 0
15 10 0
dieci 11 3
séis
1003 998 2
1004 999 2
1005 1000 7
no importa
É l no es el lanzador ganador;
1
KalistandSpurr, “Errores de bé isbol”.
2
La definició n oficial de salvamento ha sido reimpresa con permiso especial de la Oficina
del Comisionado de Bé isbol de las Reglas Oficiales de Béisbol . Los derechos de autor de las
Reglas Oficiales de Béisbol son propiedad y han sido registrados por el Comisionado de
Bé isbol.
estadísticas, todo lo que vemos es el nú mero de guardados, por lo que todos
los guardados parecen iguales. Sin embargo, considere un lanzador de
relevo que entra con su equipo por delante 3-2 durante la parte superior de
la ventaja de 4-2 y otro equipo tiene las bases llenas y ninguno fuera. Si este
lanzador mantiene la ventaja, ha hecho un trabajo fabuloso . En el capítulo
8, mostraremos có mo los promedios de victorias de los jugadores
resuelven muchos de los problemas relacionados con la evaluació n del
desempeñ o de los lanzadores.
3
Excel elige la línea que mejor se ajusta, lo que minimiza la suma de las distancias
verticales al cuadrado de los puntos a la línea ajustada. Esto se llama línea de mínimos
cuadrados.
r = 0,34
y 0.353x 2.8484
R 2 0,1158
0 5 10
qué tan bien se ajusta una línea a un conjunto de datos utilizando el valor
R cuadrado (RSQ) y la correlació n, así como la desviació n media absoluta
de los pronó sticos de regresió n.
R 2 y correlación
De la figura 5.1 encontramos que el RSQ para predecir la efectividad del
añ o siguiente a partir de la efectividad del añ o anterior es .116. Esto
indica que la ERA del añ o anterior explica só lo el 11.6% de la variació n
en la ERA del añ o siguiente. En otras palabras, el 88% de la variació n en
la ERA del añ o siguiente no se explica por la ERA del añ o anterior. Los
estadísticos también miden la asociació n lineal observando la raíz
cuadrada de RSQ, que a menudo se llama coeficiente de correlació n.
4 Sin embargo,
si lo desea, puede utilizar Excel para calcular las correlaciones entre dos
columnas de nú meros con la funció n = CORREL . Vea el capítulo apé ndice para má s
detalles.
mayor que el promedio, y cuando X es menor que el promedio, Y tiende a
ser menor que el promedio. Alternativamente, cuando se ajusta una
línea recta a los datos, habrá una línea recta con pendiente positiva que
hace un buen trabajo al ajustar los puntos .
Una correlació n cercana a 0 significa que existe una relació n lineal débil
entre X e Y. Es decir, saber si X es má s grande o má s pequeñ o de lo que
significa
3,000
2,000
1,000
0 500
Unidades producidas
1000
6,000
4,000
2,000
Correlación= 0.94
0 5 10
Precio
400
300
200
100
Ventas
Lineal (Ventas)
0 10 20
Años de experiencia
VorosMcCrackenStunstheBaseballWorld
Voros McCracken parece ser la primera persona en explicar con éxito por
qué las ERA futuras son difíciles de predecir a partir de las ERA pasadas. 5
McCracken observó que la eficacia de un lanzador se basa
principalmente en lo siguiente:
5
Vé ase Voros McCracken, “Pitching and Defense: HowMuchControlDoHurlersHave?” 23
de enero de 2001, http://www.baseballprospectus.com/article.php?articleid=878 .
La fracció n de BFP (bateadores enfrentados por lanzadores) que resulta en
bolas en juego (una bola en juego es una aparició n en el plato que resulta
en un roletazo, error, sencillo, doble, triple, elevado o lineout).
6
Investigadores posteriores encontraron que para ciertos tipos de lanzadores
(particularmente los lanzadores de nudillos ) el resultado de las bolas en juego es mucho
má s fá cil de predecir.
7
McCracken, “Lanzamiento y defensa”.
ERA. Dado que los DIPS son bastante predecibles de un añ o a otro,
parece razonable que debería haber alguna combinació n simple de DIPS
(BB, SO, HTA y FC) que se pueda usar para predecir la ERA con mayor
precisió n que nuestro enfoque anterior. En 2000, Clay Dreslogh ideó una
fó rmula má s simple, conocida como ERA de componentes
independientes de la defensa (DICE), para predecir la ERA. 8
(2)
68BB
7 HTA
292K
9 horas
264 IP
Para los añ os 2001–6 para todos los lanzadores que completaron 100
entradas o má s en temporadas consecutivas, calculé el DICE de cada
lanzador para el añ o x y lo usé para intentar predecir la efectividad para el
añ o x + 1. Por ejemplo, para un lanzador que lanzó má s de 100 entradas
en 2003 y 2004 ,usaríamos el DICE de 2003 del lanzador para predecir la
efectividad de 2004 del lanzador. Los resultados se muestran en la figura
5.5.
Por lo tanto, predecimos la efectividad del añ o dado como .56 (DICE de
la temporada pasada) + 1.975. El DICE del añ o anterior explica el 19%
de la variació n en la ERA del añ o siguiente (en comparació n con la ERA
del añ o anterior, que explicaba só lo el 11% de la ERA del añ o siguiente).
La correlació n entre el DICE del añ o anterior y el ERA del añ o siguiente
es .44 (el ERA del añ o anterior tenía solo una correlació n de .34 con el
añ o siguiente).
8
ClayDreslogh, “DICE:ANewPitchingStat”, 19 de julio de 2000, http://www.sportsmogul
.com/content/dice.htm.
y 0,5598x
1,9751R 2 0,1915
0 5 10
DIPSPronóstico
APÉNDICE
Excel2003 o anterior
0 2 4 6 8
ERAÚltimoAño
excel2007
Seleccione los datos que se van a graficar (rango de celdas D4: E98). Luego
seleccione Insertar y elija la primera opció n de Dispersió n. Luego haga clic
en los puntos graficados hasta que se vuelvan azules. Después de hacer
clic derecho en cualquiera de los puntos, seleccione Agregar línea de
tendencia y elija la opció n Lineal. Luego verifique las opciones Mostrar
ecuació n y Mostrar R Sq. Luego verá el grá fico que se muestra en la figura
5.6. Encontramos que la relació n lineal que mejor predice la efectividad de
un lanzador durante 2006 es 2006 ERA = .3802 (2005 ERA) + 2.75. Esta
ecuació n
ció n explica el 11,1% de la variació n en la ERA de 2006.
TOMA DE DECISIONES DE BÉ ISBOL
0000 0 No No No
1000 1 No No No
2000 2 No No No
0001 0 No No Sí
1001 1 No No Sí
2001 2 No No Sí
0010 0 No Sí No
1010 1 No Sí No
2010 2 No Sí No
0011 0 No Sí Sí
1011 1 No Sí Sí
2011 2 No Sí Sí
0100 0 Sí No No
1100 1 Sí No No
2100 2 Sí No No
0101 0 Sí No Sí
1101 1 Sí No Sí
2101 2 Sí No Sí
0110 0 Sí Sí No
1110 1 Sí Sí No
2110 2 Sí Sí No
0111 0 Sí Sí Sí
1111 1 Sí Sí Sí
2111 2 Sí Sí Sí
base,and2001meanstherearetwooutsandarunneronthirdbase.Intu-itively
we know the best state is 0111 (bases loaded nobody out) and
theworststateis2000(twooutsnobodyon).Howcanweexplicitlymeasureho
wmuchbetteronestateisthananother?
Wesimplylookattheaveragenumberofrunsscoredineachsituationoverthec
ourseofmanygames.In Baseball Hacks , Joseph Adler has tabulated (see
table 6.2) the average num-
berofrunsscoredineachsituationbasedondatafromthe2004season.
un tiro libre (los resultados incluyen un tiro libre exitoso o fallido; rebote
por cualquier equipo)
un pase lanzado por un mariscal de campo (los resultados incluyen pase
incompleto, intercepció n, finalizació n para 10 yardas, finalizació n para
15 yardas, etc.)
Ejecuciones esperadas
Nú mero de
apariciones de
placas
Estado Promedio de para esta
carreras situació n
Valor esperado
todos los resultados
(probabilidad de resultado)
6 6 6
1 1 1
+ (4) + (5) + (6) = 3,5.
6 6 6
Por lo tanto, si tuviéramos que tirar muchas veces y promediar el
nú mero total de puntos, esperaríamos obtener un nú mero cercano a 3,5.
=
todos los resultados
ToBuntoNottoBunt—EsaEsLaPregunta
si está cerca del final del juego, el equipo debe maximizar la probabilidad de
1 Sin embargo,
ganar el juego. Si no está cerca del final del juego, maximizar las decisiones de elecció n
basadas en maximizar el nú mero esperado de puntos por los que un equipo vence a un
oponente es virtualmente equivalente a maximizar la probabilidad de victoria. Usaremos
este enfoque en el capítulo 22 para estudiar la base para tomar decisiones importantes en
el fú tbol, como si el equipo debe buscar un gol de campo en el cuarto down.
TABLA 6.3
El bateador es
seguro y el
corredor avanza
a la segunda
base 0110 .10 1.49
El corredor
avanza a la
segunda base y
el bateador está
a salvo 1010 .70 .71
El corredor es
eliminado en la
segunda base y el
bateador llega a la
primera base .
El bateador sale
y el corredor
permanece en
primera base
1100 .10 .55
Por lo tanto, tocar hace que el equipo, en promedio, .18 carreras (.75 — .93
= — .18) esté peor que si no toca. Por lo tanto, el toque no es una buena
idea si un bateador promedio está arriba y el objetivo es maximizar el
nú mero esperado de carreras en una carrera.
¿Es una buena idea tocar cuando un equipo necesita anotar solo una
carrera? Por ejemplo, suponga que el marcador está empatado en la
parte baja de la novena entrada y un equipo tiene un corredor en
primera sin ningú n out. Si el equipo anota una carrera, gana el juego.
¿Deberían tocar? Sabemos que a menos que haya un bateador muy débil, el
toque disminuirá el nú mero esperado de carreras anotadas. En esta
situació n , sin embargo, queremos observar la probabilidad de anotar al
menos una carrera . En el excelente libro Baseball between the Numbers , los
autores tabulan la probabilidad de anotar al menos una carrera para los
veinticuatro estados. Con un corredor en primera y ninguno eliminado, la
probabilidad de anotar al menos una carrera es
.417.Lasotrasprobabilidadesalemanasanuestroejemplo se resumen en la
tabla 6.4.
de anotar al menos una carrera. Por lo tanto, tocar y no tocar nos da casi
la misma probabilidad de anotar al menos una carrera. Por lo tanto, si un
bateador promedio está al bate, un equipo debe ser indiferente con
respecto a toques y no toques.
Probabilidades de LeastOneRun
puntuar en
Probabilidad
de anotar al
menos una
carrera
Resultado Estado Probabilida
resultante d
El bateador es
seguro y el
corredor avanza
a la segunda
base 0110 .10 .625
El corredor
avanza a la
segunda base y el
bateador está a
salvo 1010 .70 .41
El corredor es
out en la
segunda base y
el bateador
llega a la
primera base.
1100 .08 .272
El bateador sale
y el corredor
permanece en
primera base
1100 .10 .272
Fuente : Equipo de expertos de Baseball Prospectus, Jonah Keri y James Click, Baseball between
the Numbers: Why Everything You Know about the Game Is Wrong (Perseus Publishing, 2006), 129.
2
Vé ase Jeff Angus, “¿Puede el funcionamiento de bases ser el nuevo enfoque Moneyball?”
http://base ballanalysts.com/archives/2005/10/can_baserunning.php.
TABLA 6.5
Punto de Equilibrio
Probabilidad de É xito
Necesario de una
Sola
Corredor Nú mero de
salidas
Primero 0 .72
Primero 1 .73
Primero 2 .85
Segundo 0 .95
Segundo 1 .76
Segundo 2 .43
Insummary,whendeciding betweenstrategicoptionssuchasbuntingor
notbuntingwechoosethestrategythatyieldsthelargestnumberofexpected
runsor(ifthegameistiedlate)maximizestheprobabilityofscoring atleast
onerun.Asageneralrulewecouldchoosethedecision thatmaximizestheex-
pectedprobabilityofwinningthe game.Inmostsituations,adecisionthat
maximizesexpectedruns scoredwillalsomaximizethechanceofwinningthe
game.Thedetermination oftheprobabilityofwinningagameinanygame
situation is discussed in chapter 8 and after reading this chapter the reader
can, if she desires, make decisions based en maximizar la probabilidad de
ganar el juego. Este enfoque siempre producirá la decisió n correcta, pero es
mucho más difícil de implementar que maximizar las ejecuciones
esperadas. Por lo tanto, en este capítulo hemos optado por describir có mo
maximizar las ejecuciones esperadas.
APÉNDICE
carreras por entrada
R 2 = .5 (R 1 ) + .5 (1 + R 2 ).
R 3 = .5 (R 2 ) + .5 (1 + R 3 ).
buen equipo. Veremos que, en la mayoría de los casos, las diferencias en las
habilidades de fildeo de los jugadores no son lo suficientemente
significativas como para ser un factor importante en el desempeñ o del
equipo. Como dice el refrá n, la excepció n confirma la regla y veremos que
los Yankees de 2005 eran un equipo de fildeo muy pobre, y podemos estimar
que su fildeo deficiente le costó aproximadamente once victorias.
PO + A + E
PO = outs realizados por el fildeador. Por ejemplo, un SS obtiene crédito por
un out cuando atrapa una bola elevada o un drive de línea, toca a un
corredor o recibe la bola y pisa la segunda base para completar un out
forzado.
D mi F GRAM H yo j
O
273 + 392 + 13
¿Có mo podemos medir si un campo corto tiene un rango alto o bajo? Bill
James desarrolló una medida ingeniosa pero simple de la efectividad del
campo, que él llama Factor de rango (RF). James define el RF de un
fildeador como la suma de los outs y las asistencias que recibe un
fildeador por partido jugado. Luego, James normaliza esta estadística en
relació n con todos los jugadores en una posició n determinada. Resulta
que los paradores cortos durante 2000–2006 promediaron 4,483 PO + A
por juego. Por lo tanto, un SS que tenía 5 PO + A por juego tendría un
RF de 5/4,48 = 1,11. Este SS coloca un 11 % má s de balones que un SS
típico. Los shortstops con un RF mayor que 1 tienen un rango por encima del
promedio y los shortstops con factores de rango menores que 1 tienen un
rango por debajo del promedio. Calculemos el RF de 2006 de Derek Jeter.
Asumimos 8.9 entradas por juego. La columna InnOuts indica que en
2006 Jeter estuvo en el campo durante 3.877/(8,9 × 3) = 145,2 juegos.
145.2
posibilidades por juego. Esto está muy por debajo del promedio SS, que
manejó con éxito
Hay varios problemas con RF. Suponga que SS1 juega para un equipo
donde los lanzadores ponchan un promedio de 8 bateadores por juego y SS2
juega para un equipo cuyos lanzadores ponchan solo a 5 bateadores por
juego. El equipo de SS2 enfrentará en promedio tres pelotas má s en juego
que el equipo de SS1, así que incluso si ambos parados cortos tienen la
misma habilidad, SS2 tendrá un RF má s alto. Suponga que el equipo de
SS1 tiene principalmente lanzadores zurdos y el equipo de SS2 tiene
principalmente lanzadores diestros. Luego, la mayoría de los
entrenadores apilará n sus alineaciones contra el equipo de SS1 con
bateadores diestros para aprovechar el efecto de pelotó n (vea el capítulo
12). Se cree que los bateadores diestros conectan má s rodados al
campocorto que los bateadores zurdos. Los oponentes de SS2 usará n
principalmente bateadores zurdos (quienes se cree que golpean al
campocorto con menos frecuencia que los bateadores diestros). En tal
situació n, SS1 tendría má s bolas golpeadas cerca de él y tendería a tener
un RF má s grande que SS2.
TheFieldingBible :UNGranSaltoAdelante
Creo que John Dewan (autor de The Fielding Bible ) ha desarrollado una
excelente forma de evaluar la efectividad de los fildeos. Dewan y sus
colegas de Baseball Info Solutions miran cintas de video de cada jugada
de la MLB y determinan qué tan fuerte golpea cada pelota y en qué “zona”
del campo la pelota llega . Por ejemplo, podrían encontrar que el 20% de
todas las pelotas golpeadas suavemente sobre la segunda base son
fildeadas con éxito por los torpederos. Un campocorto que fildea con éxito
una pelota de este tipo ha evitado un hit. Un fildeador promedio habría
fildeado con éxito esta pelota el 20% de las veces, por lo que nuestro
SHas ha prevenido 1 — .2 = .8 hits má s que un jugador promedio. En este
caso, nuestro SS recibe una puntuació n de + 0.8 en la bola bateada.
ha impedido 0 — .2 = — .2 hits y recibe una puntuació n de — 0.2 en la bola
bateada . Note si cuatro SS fildea con éxito 1 en 5 oportunidades en esta
zona, su puntuació n neta es .8 — 4(.2) = 0, como sería de esperar. Si en el
transcurso de una temporada un SS tiene una puntuació n neta de - 20,
entonces efectivamente ha concedido 20 hits má s que un fildeador
promedio. Un SS con una puntuació n de +30 ha evitado efectivamente 30
hits má s que un fildeador promedio.
5 1B Giambi −8
6 2B cano −27
7 SS Jeter −34
8 3B Rodríguez 2
9 LF Matsui 3
10 FC Williams −37
11 RF Sheffield −38
La mayoría de los faná ticos del béisbol está n sorprendidos de que los
Yankees, con su enorme nó mina, no ganen la Serie Mundial todos los
añ os.
DerekJetervs.AdamEverettyRafaelFurcal
Las calificaciones de Fielding Bible muestran (al igual que RF) que
Furcali es mucho mejor parador en corto que Jeter, y Everett es por
mucho el mejor de los tres paradores en corto. - Hijos, los Yankees
habrían ganado 11.2 juegos má s (o alrededor de 4 juegos por
temporada).
1
Durante su serie de playoffs de 2005 contra los Tigres, los Yankees cometieron cinco errores
y fueron eliminados en cuatro juegos.
TABLA 7.1
2003 — 14 + 10 + 21
2004 — 16 +2 + 22
2005 — 34 + 26 + 33
~stjensen/research/safe.html.
PROMEDIOS DE GANANCIAS DEL JUGADOR
1
La lista má s completa de probabilidades de ganar un juego segú n el margen del juego, la
entrada, la situació n y los corredores en base se encuentra en Tango, Lichtman y Dolphin,
TheBook , capítulo 1.
Antes del jonró n de Thompson, el Gigante tenía un 30,1 % de
posibilidades de ganar (má s adelante, có mo calculamos esta
probabilidad). Por lo tanto, WIN-DIFF = 30,1 — 69,9 =— 39,8. Después
de que Thompson conectó este jonró n, WIN- DIFF = 100 — 0 = 100. Por
lo tanto, el jonró n histó rico de Thompson le otorga 100 — ( — 39,8) =
139 puntos.8 WINDIFF y le cuesta al lanzador (¡pobre
RalphBranca!)139.8WINDIFFpuntos.
Usaré el aná lisis Player Win Average de Jeff Sagarin para las temporadas
1957–2006 en esta secció n. 2 Sus ampliamente respetados aná lisis
estadísticos de béisbol, baloncesto y fú tbol se han publicado en USA
Today durante má s de veinte añ os. 3
Aquí hay otro ejemplo. El primer bate del equipo visitante conecta un
doble . ¿Cuá ntos puntos SAGWINDIFF gana? Antes de acertar el doble
SAGWINDIFF = 10(50 — 50) = 0. Después de acertar el doble, la
posibilidad de ganar el juego es del 55,6 %, por lo que SAGWINDIFF =
10(55,6 — 44,4) = 112 puntos SAGWINDIFF. En este caso, el bateador
gana 112 puntos SAGWINDIFF y el lanzador pierde 112 puntos WINDIFF.
Aquí hay un ú ltimo ejemplo. El equipo local está perdiendo por dos
carreras en la parte baja de la novena entrada con las bases llenas y sin
outs. Mariano Rivera entra en un lanzamiento y el bateador logra una
doble jugada, anotando el corredor desde tercera. Antes de la doble
jugada, el equipo local tenía un 52,3% de posibilidades de ganar. Después
de la doble jugada, el equipo de casa tiene corredor en tercera y dos outs
y está una carrera abajo. En esta situació n, el equipo local tiene un 17,2
% de posibilidades de ganar. Así, antes de la doble jugada, SAG-WINDIFF
= 10 × (52,3 — 47,7) = 46. Después de la doble jugada, SAGWIN- DIFF
= 10 × (17,2 — 82,8) =— 656. El bateador gana — 656 — 46 =— 702
puntos (o pierde 702 puntos), mientras que River gana 702 puntos.
2
Benjamin Polak y Brian Lonergan de la Universidad de Yale tambié n tienen un sistema
Player Win Average . Consulte “Cuánto vale un jugador de pelota”,
http://www.businessweek.com/bwdaily/dnflash/nov2003/nf2003115_2313_db016.htm .
3
El aná lisis de Player Win Average de Sagarin está disponible en
http://www.kiva.net/~jsagarin/mills/ seasons.htm.
Win Averages resuelve un problema importante con ERA. El lanzador
reemplazado por Rivera habrá perdido puntos por llenar las bases
(debería ser ceniza), pero Rivera gana, como debe ser, muchos puntos
por obligar al bateador a batear en la doble matanza. Con efectividad, el
lanzador reemplazado por Rivera no sufre penalidad por llenar las bases.
AKeyFact:2,000SAGWINDIFFPuntos = 1Ganancia
Incorporación de índices de
fildeo en promedios de
victorias de jugadores
Adversario SAGWINDIFF
TABLA 8.2
Adversario SAGWINDIFF
SagarinWinAverageLíderes, 2004–6
Recallthatinchapter7wementionedthattheimportanceoffieldingis
overratedbymanybaseballanalysts.PlayerWinAveragesmakethis clear.De-
wan's2005 FieldingBible ratings showthatonlysevenplayershavearating
thatwouldresultinatleasttwowinsmorethanwouldbegeneratedbyanav-
eragefielder.FromSagarin's2005PlayerWinRatingswefindthat44batters
and46pitchers havePlayerWinRatingsthatgeneratetwomorewinsthan are
generated by an average hitter or pitcher, respectively. Esto implica que hay
muchos lanzadores y bateadores que tienen un gran impacto positivo en el
desempeñ o del equipo, pero muy pocos fildeadores tienen tal impacto.
robar bases a menudo y rara vez son atrapados cuando intentan robar;
A B C D mi
17 Clendenon 240
18 Martín −2196
19 Charles −1021
20 Otis −1789
21 Pintor −290
4
Dan Fox, “Circle theWagons: Runningthe BasesPart III”, 11 de agosto de 2005,
http://www.
.hardballtimes.com/main/article/circle-the-wagons-running-the-bases-part-iii.
los lanzadores se desempeñ aron mejor que un grupo de lanzadores
promedio (nuevamente de 20.5 juegos). Esto confirma la opinió n de que
Tom Seaver, Jerry Koosman y Tug McGraw fueron la razó n clave por la
que los Mets se desempeñ aron tan bien durante la temporada regular de
1969. El lector astuto podría observar que los Mets fueron 100-62, lo que
debería rendir para los Mets (100 - 81)
5
Consulte http://winexp.walkoffbalk.com/expectancy/search.
6
Si asumimos que el margen de corrida siempre está entre — 10 y + 10 corridas, entonces
hay 24 × 18 × 21 = 9,072 situaciones posibles. Obtuve este resultado al multiplicar el nú mero
de estados durante una carrera (24) por el nú mero de medias carreras posibles (9 × 2), y luego
lo multipliqué por los 21 posibles diferenciales de carrera.
Figura 8.2. Ejemplo de WinExpectancyFinder.
7
Está n disponibles en http://www.retrosheet.com.
EL VALOR DE LOS JUGADORES DE REEMPLAZO
VORPP:ValorofaReplacementPlayerPoints
Recuerde del capítulo 8 que por cada juego que un equipo termine por
debajo de .500 ganará : 2000 puntos SAGWIN. Por lo tanto, un equipo de
jugadores de reemplazo debería terminar la temporada con — 74,000
puntos.
pequeñ o impacto de fildear, 1 parece razonable suponer que los
lanzadores y bateadores de reemplazo deben compartir por igual la
“culpa” por el mal desempeñ o de un equipo. Esto implica que un equipo
de bateadores de reemplazo generaría : 37,000 puntos para la
temporada al igual que un equipo de lanzadores de reemplazo. Un equipo
promedio de Grandes Ligas tiene alrededor de 6200 apariciones en el plato
durante una temporada. Esto significa que por aparició n en el plato un
bateador de reemplazo promedia - 37,000/6,200 = - 5.97 puntos por
aparició n en el plato. De manera similar, un lanzador de reemplazo tiene
un promedio de 5.97 puntos por bateador enfrentado (BFP). Ahora
vemos có mo un bateador o lanzador “promedio” tiene valor. Considere un
bateador promedio, Joe Hardy, con 500 apariciones en el plato. A través
de sus 500 apariciones en el plato , sin embargo, Joe salvó 5.97 (500) =
2,985 puntos, o casi 1.5 juegos. Se aplica un aná lisis similar a cada
lanzador. Para cada bateador, ahora podemos definir el VORP de la
siguiente manera:
Por ejemplo, durante 2006, Albert Pujol obtuvo 18.950 puntos en 653
apariciones en el plato. Por lo tanto, el VORPP de Pujols = 18.950 + 653
(5,97) = 22.848 . Por lo tanto, la actuació n de Pujols en 2006 le valió a
los Cardenales alrededor de 11,4 victorias má s que un jugador de
reemplazo.
UsandoVORPPparaEvaluarOperaciones
1
De acuerdo con The Fielding Bible , en 2005, los jugadores suplentes tenían casi la misma
calificació n promedio que los jugadores titulares.
Dinals estaría renunciando a má s de 11 victorias por 10 victorias. Esto
supone, por supuesto, que el desempeñ o pasado del jugador es un
predictor perfecto del desempeñ o futuro. La belleza de este enfoque es
que tenemos una ú nica métrica que nos permite comparar el valor de los
lanzadores de relevo y los lanzadores abridores con el valor de los
bateadores.
La Figura 9.1 indica que A-Rod generó alrededor de $14 millones por
añ o en valor. En 2007, su nuevo contrato equivale a $202 millones
C D mi F GRAMO
Salario justo
en dólares de
2006
(millones)
PlacaApar SAGWIN
iciones
Puntos
5 Año VORPPuntos
ExtraPlateAparienciasCrear Valor
2
Equipo de expertos de Baseball Prospectus, Keri y Click, Baseball between the Numbers , 186.
3
Consulte Diamond Dollars de Gennaro para obtener má s detalles sobre có mo incorporar
la probabilidad de carrera por banderines y el tamañ o del mercado en la determinació n de
salarios.
Theo Epstein, usó VORPP para evaluar muchas de las transacciones de
jugadores que llevaron al título de la Serie Mundial 2004 de los Red Sox.
Por ejemplo, Goldman describe có mo el alto VORPP de Keith Foulke para
las temporadas 1999-2003 llevó a los Medias Rojas a firmar a Foulke (un
lanzador de relevo) para 2004. Foulke registró 32 salvamentos durante
la temporada 2004 . Por ejemplo, en 2003, Foulke tenía un VORPP de
10,998, mientras que el relevista yanqui Mariano Riverah, má s
promocionado, tenía un VORPP de solo 9,021.
FACTORES DEL PARQUE
indican que Hawpe tuvo una mejor temporada de bateo que Barfield.
La mayoría de los faná ticos del béisbol, sin embargo, se dan cuenta de
que los Rockies juegan en Coors Field, que es conocido por ser un parque
de bateadores porque el aire es delgado (la pelota llega má s lejos) y el
parque no es tan grande. Por otro lado, los Padres juegan en el espacioso
Petco Park, y los Padres participan habitualmente en juegos de bajo
puntaje. ¿Significa el hecho de que Hawpe jugó en un parque de
bateadores y Barfield en un parque de lanzadores que Barfield realmente
tuvo una mejor temporada de bateo que Hawpe? Como pronto veremos,
Barfield y Hawpe tuvieron temporadas de bateo prá cticamente idénticas.
B C D mi F
2006
ParqueFacto
2 res
3 CoorsField Montañas
Rocosas
9 Parque padres
PETCO
Carreras
ajustada
s al
parque
Creado
Ejecucion
es sin
procesar
14 Equipo creadas
Figura10.1.EjemplosdeParkFactors.VerarchivoParkfactors.xls.
defensa. 1 Por lo tanto, la ú nica diferencia entre las carreras anotadas en
Coors Field y durante los partidos fuera de casa debe ser el resultado de
la influencia de Coors Field . Por lo tanto, 10,73/9,33 = 1,15 veces tantas
carreras anotadas en Coors Field como anotadas en un parque promedio
de la Liga Nacional. 2 A esto lo llamamos el Factor de Coors Field Park.
Aproximadamente un 15% má s de carreras se anotan en el Coors Field
que en un parque promedio de la Liga Nacional. De manera similar,
encontramos que el factor de parque para el parque Petco de los Padres es
8.05/9.35 = .86. Esto indica que en Petco Field se anotan un 14% menos
de carreras que en un parque de la National League promedio.
1
Ignoro el juego entre ligas en este aná lisis,
2
Por supuesto, esto ignora el hecho de que Coors Field es parte del promedio de la Liga
Nacional, pero Coors Field no está incluido en ningú n juego fuera de casa de los Rockies.
Este hecho tiene un pequeñ o efecto en el Factor Parque y vamos a ignorar este problema.
Barfieldjustedrunscreated = 4.21/.93 = 4.53runscreatedpergame
HRperABinteam'shomegames
HRadjustmentforpark = .
Partidos fuera de casa de
HRperABinteam
3
En el Fenway Park de Boston, se logran un 37 % má s de dobles que en un parque
promedio de la liga estadounidense.
STREAKINESSINSPORTS
aleatoriedad en el trabajo?
Secuencia
aleatoria1
4 1 1 55 0 109 1
5 2 0 56 1 110 0
6 3 1 57 0 111 1
7 4 1 58 0 112 0
8 5 1 59 0 113 0
9 6 1 60 1 114 0
10 7 0 61 0 115 1
11 8 0 62 0 116 1
12 9 1 63 1 117 1
13 10 1 64 0 118 1
14 11 0 sesent 0 119 1
ay
cinco
15 12 0 66 1 120 1
diec 13 1 67 0 121 1
iséi
s
17 14 1 68 1 122 0
18 15 0 69 1 123 1
19 diecisé 1 70 1 124 1
is
20 17 0 71 0 125 1
21 18 1 72 1 126 1
22 19 0 73 0 127 0
23 20 1 74 1 128 0
24 21 0 75 0 129 0
25 22 0 76 0 130 1
26 23 0 77 0 131 1
27 24 1 78 1 132 0
28 25 0 79 1 133 0
29 26 0 80 0 134 0
30 27 0 81 0 135 1
31 28 1 82 1 136 0
32 29 0 83 0 137 1
33 30 1 84 0 138 0
34 31 1 85 1 139 1
35 32 0 86 1 140 0
36 33 1 87 1 141 0
37 34 1 88 0 142 1
38 35 1 89 1 143 1
39 36 1 90 0 144 1
40 37 1 91 1 145 1
41 38 1 92 0 146 1
42 39 0 93 0 147 1
43 40 1 94 0 148 1
44 41 1 95 0 149 0
45 42 0 96 0 150 1
46 43 1 97 1 151 1
47 44 1 98 1 152 0
48 45 1 99 0 153 1
49 46 0 100 0 154 1
50 47 0 101 1 155 1
51 48 1 102 0 156 1
52 49 1 103 1 157 1
53 50 1 104 1 158 0
54 51 1 105 1 159 0
55 52 1 106 1 160 1
56 53 1 107 1 161 0
57 54 0 108 0 162 0
Figura 11.1. Ejemplos de secuencias aleatorias.
H yo j k L METRO
10,8,7 y
6 rachas de
1 juego
Secuencia
aleatoria2
4 1 0 55 0 109 1
5 2 0 56 1 110 1
6 3 1 57 0 111 0
7 4 0 58 0 112 1
8 5 0 59 1 113 0
9 6 0 60 0 114 0
10 7 0 61 0 115 1
11 8 1 62 0 116 1
12 9 1 63 0 117 1
13 10 0 64 1 118 1
14 11 1 sesent 0 119 1
ay
cinco
15 12 0 66 1 120 1
die 13 0 67 0 121 1
cis
éis
17 14 0 68 0 122 1
18 15 0 69 1 123 1
19 diecis 0 70 0 124 1
éis
20 17 1 71 1 125 0
21 18 1 72 1 126 0
22 19 0 73 1 127 0
23 20 0 74 1 128 0
24 21 0 75 1 129 1
25 22 0 76 0 130 1
26 23 1 77 0 131 1
27 24 1 78 0 132 0
28 25 1 79 1 133 0
29 26 0 80 1 134 0
30 27 1 81 0 135 0
31 28 1 82 1 136 0
32 29 1 83 0 137 1
33 30 0 84 0 138 1
34 31 1 85 0 139 1
35 32 0 86 0 140 1
36 33 0 87 1 141 0
37 34 1 88 1 142 0
38 35 1 89 1 143 1
39 36 0 90 1 144 1
40 37 0 91 1 145 1
41 38 1 92 1 146 0
42 39 0 93 1 147 1
43 40 1 94 0 148 1
44 41 1 95 1 149 1
45 42 1 96 0 150 1
46 43 1 97 1 151 1
47 44 0 98 1 152 1
48 45 1 99 1 153 1
49 46 1 100 1 154 1
50 47 1 101 1 155 1
51 48 1 102 1 156 0
52 49 0 103 0 157 0
53 50 0 104 1 158 1
54 51 0 105 1 159 1
55 52 1 106 0 160 0
56 53 1 107 1 161 0
57 54 0 108 0 162 1
Figura 11.1.( continuación )
A B C D mi F
Aleatorio Dos5,6,8 y
Secuencia3 9juegos
58
60 1 1 55 0 109 1
61 2 1 56 0 110 1
62 3 1 57 1 111 1
63 4 1 58 0 112 1
64 5 1 59 1 113 1
sese 6 1 60 1 114 0
nta
y
cinc
o
66 7 1 61 1 115 1
67 8 1 62 0 116 1
68 9 1 63 1 117 1
69 10 0 64 1 118 1
70 11 1 sesent 0 119 0
ay
cinco
71 12 0 66 0 120 1
72 13 0 67 1 121 1
73 14 1 68 1 122 1
74 15 1 69 0 123 0
75 diecisé 1 70 0 124 1
is
76 17 0 71 0 125 1
77 18 0 72 1 126 0
78 19 1 73 1 127 0
79 20 1 74 1 128 1
80 21 0 75 0 129 1
81 22 1 76 1 130 1
82 23 1 77 1 131 0
83 24 1 78 1 132 0
84 25 0 79 1 133 1
85 26 1 80 1 134 1
86 27 1 81 1 135 1
87 28 1 82 1 136 0
88 29 1 83 1 137 1
89 30 1 84 0 138 0
90 31 1 85 1 139 1
91 32 1 86 0 140 1
92 33 1 87 0 141 1
93 34 1 88 1 142 1
94 35 0 89 1 143 1
95 36 0 90 1 144 0
96 37 0 91 1 145 1
97 38 0 92 0 146 0
98 39 1 93 0 147 1
99 40 0 94 1 148 1
100 41 1 95 1 149 0
101 42 0 96 1 150 1
102 43 1 97 0 151 1
103 44 1 98 0 152 0
104 45 0 99 1 153 1
Probabilidad
de la racha
más larga
>
12 Racha más Probabilidad
larga
13 1 0,0% 100,0%
14 2 0,0% 100,0%
15 3 0,0% 100,0%
17 5 3,0% 96,8%
18 6 11,5% 85,3%
19 7 17,4% 67,9%
20 8 19,7% 48,2%
21 9 16,5% 31,7%
22 10 11,5% 20,2%
23 11 7,8% 12,4%
24 12 4,7% 7,7%
25 13 2,9% 4,7%
26 14 2,0% 2,7%
27 15 1,0% 1,8%
29 17 0,4% 0,7%
30 18 0,2% 0,5%
31 19 0,1% 0,4%
32 20 0,1% 0,2%
33 21 0,2% 0,1%
34 22 0,0% 0,0%
35 23 0,0% 0,0%
36 24 0,0% 0,0%
37 25 0,0% 0,0%
38 26 0,0% 0,0%
1
Gilovich, Vallone y Tversky, “The Hot Handin Basketball”.
Los faná ticos del ketball sintieron que los jugadores de baloncesto eran
má s propensos a hacer un tiro si el ú ltimo tiro era bueno que si el ú ltimo
tiro fallaba.
0.030
0.025
0.020
0.015
0.010
0.005
CI
la pdf es simétrica (es decir, es tan probable que una variable aleatoria
normal asuma un valor cercano a µ+ x como cercano a µ— x); por lo tanto,
aproximadamente el mismo nú mero de personas tiene coeficientes
intelectuales cercanos a 120 que cerca de 80, y así sucesivamente.
Puntuaciones Z
— 22 — 0
, la puntuació n z para el ejemplo del mercado de valores = =—
14.67,
1.5
Por lo tanto, una caída del 22% del mercado en un día es mucho má s
inusual que ver a una persona de treinta pulgadas de alto caminando por
la calle.
.0286
.424 — .299
= 3.74.
.0334
80
60
40
20
Promedios de bateo
2
Esto tiene en cuenta solo a los jugadores que tenían al menos 300 AB durante la
temporada.
La prueba de carreras de Wald Wolfowitz (WWRT)
norte
( µ— 1)( µ— 2)
.
n— 1
(6 — 1)(6 — 2)
= 1,49.
10 — 1
2— 6
=— 2.68 mientras que la secuencia
1.49
1.49
ennuestrasituacion
TABLA 11.1
Nú mer Nú mero
o real esperad
de o de
ejecucio ejecucio
Jugador buenosfg FG nes nes Puntuac
s perdidos ió n Z
4
Un conjunto de variables aleatorias es independiente si el conocimiento del valor de
cualquier subconjunto de las variables aleatorias no nos dice nada acerca de la distribució n
de los valores de las otras variables aleatorias . para exhibir un comportamiento de tiro con
la mano caliente , por lo que es apropiado suponer que las puntuaciones z de los jugadores
individuales son variables aleatorias independientes.
la puntuació n de nueve jugadores es — 0.56. La desviació n está ndar del
promedio de las puntuaciones de nueve es 9 — .5 = 1/3 = .333.
— 0.56 — 0
ofzscores”es =— 1.68, que no es estadísticamente significativo
en el
.333
4 Signific 225.497
ar
5 Sigma 9.18294
7 puntuaci
ón z
8 0.8171
9 pvalor
10 0.41387
Figura 11.5.CalRipkennoesunastreakhitter.Seefile87ripc1.xls.
5
Albright, “Un aná lisis estadístico de las rachas de golpes en el bé isbol”.
regresió n logística, para predecir la probabilidad de que un jugador
obtenga un hit en un AB en funció n de su historial reciente, así como de
otras variables, incluidas las siguientes:
“ Equipos Calientes”
20
21
22
23
Figura11.6.MomentumparaNBATeams.VerarchivoTeammomentum.xls.
es 1
del promedio de 29 puntajes z = .186, por lo que el puntaje z para el
promedio
29
ofall29teamzscoresis
— .197 — 0
=— 1.05, que no es significativo
.186
1
Adler, BaseballHacks , 330.
C D mi F
PlacaApa
riciones
3 masa Lanzad OBP
or
4 L L 35258 0.327
5 L R 169180 0.349
6 R L 86645 0.339
7 R R 163214 0.326
Figura 12.1. Resultados del pelotó n. Seefile Pelotó n.xls. Fuente: Joseph Adler,
Durante las temporadas 2005–7, Jim Thome (un bateador zurdo) tuvo
una divisió n de pelotó n de 0.121, o 121 puntos OBP. ¿Es razonable
esperar que en 2008 tenga una divisió n de pelotó n de 121 puntos
cuando el bateador zurdo promedio tiene una divisió n de pelotó n de 22
puntos? De acuerdo con la teoría de la regresió n hacia la media,
esperaríamos que las futuras divisiones de pelotones de Thome fueran
má s cercanas al promedio que sus divisiones pasadas. La idea de la
regresió n hacia la media se le atribuyó por primera vez a Francis Galton
en 1886. Galton observó que los padres altos tenían padres que eran má s
altos que el promedio pero estaban má s cerca de la altura promedio que
sus padres. . De manera similar, los padres con hijos má s bajos que el
promedio tienden a tener hijos que son má s altos que ellos pero aú n está n
por debajo del promedio. La regresió n hacia la media explica muchos hechos
en los deportes. Considere lo siguiente:
TABLA 12.1
pelotó n
bateador diestro
PAL 2200
PS + (.013)
Amigo + 2200 Amigo + 2200
bateador zurdo
PAR 1000
PS + (.022)
PAR + 1000 PAR + 1000
lanzador diestro
LHBFP 700
PS + (.023)
LHBFP + 700 LHBFP + 700
lanzador zurdo
RHBFP 450
PS + (.012)
RHBFP + 450 RHBFP + 450
Nota : PS = divisió n del pelotó n anterior del jugador; PAL = apariciones en el plato del
bateador contra el lanzador zurdo; PAR = apariciones en el plato del bateador contra el
lanzador diestro; RHBFP = bateadores diestros enfrentados al lanzador; LHBFP =
bateadores zurdos enfrentados al lanzador.
Fuente : Tom Tango, Mitchell Lichtman y Andrew Dolphin, The Book: Playing the Per-
centagesinBaseball (PotomacBooks, 2007), 377–80.
¿Cuánto puede ayudar el pelotón al equipo?
elegido. Una de las razones por las que Pérez llegó al Saló n de la Fama
fue que su má nager, Sparky Anderson, dijo que Pérez era el mejor
bateador clave que jamá s había visto. ¿Hay alguna manera objetiva de
determinar si Pérez fue un gran “golpeador de embrague”?
1
Adler, BaseballHacks , 345.
el equipo está adelante por siete carreras prá cticamente no tiene
importancia de "embrague". Recuerde que las clasificaciones
SAGWINDIFF discutidas en el capítulo 8 se basan en la importancia
relativa de cada aparició n en el plato para ganar o perder un juego.
Definamos la clasificació n SAGDIFF normalizada como el nú mero de
puntos por aparició n en el plato por el cual un bateador excede la
clasificació n promedio de 0.
normalizedSAGDIFrating =— 42.85
TonyPerez
GRAM H yo j k
O
Sagdif PrevistoNor
normalizad malizadoSa
o real gdif
PrevistoNor RealNormal
malizadoSa izadoSagdif
gdif
2
Equipo de expertos de Baseball Prospectus, Keri y Click, Baseball between the Numbers , 30.
RECUENTO DE PITCH Y EFECTIVIDAD DEL
PITCH
fuera, pero luego Derek Jeter golpeó dos veces. El gerente de los Medias
Rojas, Grady Little, se fue
1
Adler, BaseballHacks , 358.
EFECTIVIDAD DEL LANZADOR 111
2
Tango, Lichtman y Dolphin, TheBook , 30.
3
Vé ase RanyJazayerli, “PitcherAbusePoints:ANewWaytoMeasurePitcherAbuse”, 19 de
junio de 1998, http://www.baseballprospectus.com/article.php?articleid = 148.
TABLA 14.1
WOBAvs.TimethroughBattingOrder
WOBA esperado
(Basado en Actual de
Hitters versus WOBA) Actual WOBA
Expected WOBA
Fuente : Tom Tango, Mitchell Lichtman y Andrew Dolphin, The Book: Playing
the Percentages in Baseball (PotomacBooks, 2007), 186.
140.000
120,000
100,000
80.000
60.000
40.000
20,000
0
0 50
100
Parcelas en el juego
150
200
saber con certeza las respuestas a estas preguntas . Sin embargo, podemos
usar matemáticas
+ (PD1944 — PD1943)
+ ... + (PD2004 — PD2003)
+ (PD2005 — PD2004).
Encontramos lo siguiente:
Esto indica que 1950 PD es 15 puntos mejor que 1941 PD; 1960 PD es 22
puntos mejor que 1941 PD; 1970 P es 39 puntos mejor que 1941
TABLA 15.1
Promedio de bateo para 1941 y 1942 Cohortes de
bateadores que jugaron ambos añ os
Añ o AB Golpes licencia
do en
Letras
1
Véase Baseball Prospectus Team of Experts, Keri, and Click, Baseball between the Numbers ,
xxvii.
¿FUE EL 56-GAMEHITTINGSTREAK DE
JOEDIMAGGIO EL MAYOR RÉ CORD
DEPORTIVO DE TODOS LOS TIEMPOS?
En junio de 1938, Johnny Vander Meer lanzó juegos sin hits consecutivos.
Esto nunca ha sido hecho por nadie má s. ¿Es este el mayor récord deportivo
de todos los tiempos? Después de hacer algunas suposiciones razonables, la
probabilidad y las estadísticas básicas pueden ayudarnos a determinar
que la ocurrencia de una racha de hits de 56 juegos fue menos probable
que la ocurrencia de juegos sin hits consecutivos.
nú merodedefectosenunteléfonocelular
1
Stephen Jay Gould, “The Streak of Streaks”, reseñ a de Streak: Joe DiMaggio and the Sum-
merof'41 de Michael Seidel, 18 de agosto de 1988, NewYorkReviewofBooks , disponible en
http://www.nybooks.com/articles/4337.
Tales variables aleatorias generalmente se rigen por la variable aleatoria de
Poisson. Dado que una variable aleatoria de Poisson tiene la misma media
h , entonces la probabilidad
h x mi —h x
.
¡X!
Aquí x! =
= POISSON(x, h ,Falso).
La funció n Excel
= POISSON(x, h ,Verdadero)
.1 1 e — .1
1!
= .0904.
74.500.
¿Cuál es la probabilidad de los diecisiete
juegos perfectos lanzados desde 1900?
= .0000489883.
nuestro nú mero esperado de juegos perfectos desde 1900 se convierte en
346 000 (0000489883) = 16,95, lo que es claramente consistente con el
nú mero real de 17 juegos perfectos.
Solo los bateadores con al menos 500 AB en una temporada pueden tener
una racha de hits de 56 juegos.
Ahora podemos estimar para cada bateador desde 1900 con al menos 500
AB durante una temporada la posibilidad de que haya tenido una racha de
hits de 56 juegos. Pronto veremos que, en general, hay aproximadamente un
2% de probabilidad de que haya ocurrido al menos una racha de hits de 56
juegos.
probabilidadbattergetsahitin3ABgame
= 1 — (1 — .316) 3 = .678.
Similarmente,
probabilidadbattergetsahitin4ABgame
= 1 — (1 — .316) 4 = .781.
Supongamos que cada jugador tendrá 28 tres juegos AB y 28 cuatro
juegos AB durante una secuencia de 56 juegos (esta suposició n tiene
poco efecto en nuestro resultado final). Entonces la probabilidad de que un
bateador consiga un hit durante cada uno de 56 juegos consecutivos es
1 — VENENO(.0,.024,Verdadero) = .024.
Nuestros cá lculos muestran que dadas todas las oportunidades para que
ocurra una racha de hits de 56 juegos , tal racha es muy poco probable,
pero ciertamente no imposible. Otra forma de poner en perspectiva la
probabilidad de una racha de hits de 56 juegos es determinar cuá ntos
añ os tendría que jugar un bateador antes de tener un 50% de posibilidades
de tener una racha de hits de 56 juegos. La figura 16.1 muestra los
resultados de tales cá lculos, asumiendo que el bateador tenía 4 AB por
juego y un promedio de bateo de 300 a 500. Por ejemplo, encontramos
que un
10 promedio de Estaciones
bateo
11 0.3 134514.9521
12 0.31 53294.89576
13 0.32 22381.65641
14 0.33 9926.429104
15 0.34 4633.715654
17 0.36 1163.246945
18 0.37 622.1841078
19 0.38 346.4659034
20 0.39 200.4140313
21 0.4 120.1772114
22 0.41 74.55979981
23 0.42 47.77425381
24 0.43 31.56151664
25 0.44 21.46397597
26 0,45 15.00394473
27 0,46 10.76553103
28 0.47 7.91818304
29 0.48 5.962542423
30 0.49 4.59130992
31 0.5 3.611179813
Otra forma de demostrar cuá n raros son los juegos sin hits
consecutivos es determinar cuá ntos añ os (con 35 aperturas por añ o)
tendría que lanzar el mejor lanzador sin hits de todos los tiempos (Nolan
Ryan) antes de tener un 50% de posibilidades de lanzar juegos sin hits
consecutivos. -bateadores. Ryan lanzó 6 juegos sin hits en 773 aperturas,
por lo que la probabilidad de que cualquiera de sus aperturas resulte en
un juego sin hits es 6/773 = .00776. Esto produce una probabilidad
de .0018 de juegos sin hits consecutivos durante una temporada.
Un acertijo
No recopilé datos sobre los porcentajes de slugging, pero supongamos que el porcentaje de slugging
también cae alrededor del 11% cuando un jugador pasa de AAA a las ligas mayores. Recuerde del capítulo
2 que la fó rmula original de carreras creadas de Bill James se calcula (para todos los efectos) multiplicando
OBP y SLG .
.89 2 = .78, o el 78% de su capacidad de creació n de carreras en ligas menores y pierden alrededor del 22%.