Está en la página 1de 9

Distribuciones de probabilidad binomial e hipergeométrica en la

selección del jurado

PALABRAS CLAVE: Jude T. Sommerfeld


Enseñanza; Georgia Institute of Technology, Atlanta, EE.UU.
Jurado; e-mail: jude.sommerfeld@che.gatech.edu
Jurados.
Resumen
Este artículo considera la composición de los jurados,
preguntando si esto es representativo de las
poblaciones generales de las que los jurados fueron
extraídos. Las distribuciones binomiales e
hipergeométricas se utilizan para los cálculos de
probabilidad. Se dan varios ejemplos de aplicaciones
de estas dos distribuciones, abordando la distribución
racial, por sexo y por edad en varios casos.

INTRODUCCIÓN
La composición de los jurados en diversos procedimientos judiciales y para-jurídicos se está convirtiendo en una
cuestión cada vez más importante en nuestra sociedad diversa. Particularmente en cuestión es cuán representativo de una
población más grande es un segmento finito más pequeño seleccionado de esa población. Esta cuestión puede plantearse
en relación con la composición de un venire (un panel del que se forman los jurados) construido a partir de jurados
elegibles en un distrito, un grupo de jurados derivados de dicho panel, o incluso un jurado derivado de tal grupo.

Este artículo ilustra el uso de las distribuciones binomiales e hipergeométricas para evaluar la probabilidad de la
composición de un cuerpo más pequeño de jurados potenciales o reales derivados de un grupo o panel más grande.
Cuando el cuerpo más grande está compuesto por un gran número de personas, de manera que el tamaño del grupo
más pequeño es insignificante en comparación, entonces la distribución binomial representa la metodología
estadística apropiada. Por otro lado, si el cuerpo más pequeño comprende una fracción significativa de la población
más grande, digamos más del 10% (Duncan 1959, pp. 84-7), entonces la distribución hipergeométrica debería
usarse más correctamente para evaluar la composición de un jurado o grupo de jurados.

DISTRIBUCIÓN BINOMIAL - APLICACIONES DE ANÁLISIS DE JURADO

La distribución binomial clásica debe emplearse cuando la metodología consiste en el muestreo con sustitución, lo que
claramente no es el caso de selección del jurado. Si el tamaño de la muestra es sólo una pequeña fracción de la entidad
de población original, sin embargo, la distribución binomial es una excelente aproximación para todos los propósitos
prácticos en el muestreo sin reemplazo, como en la selección del jurado. Hay numerosos candidatos para la aplicación de
la distribución binomial en los procedimientos judiciales, en particular en el análisis de las composiciones de los jurados.
Muchas de estas solicitudes tienen que ver con la discriminación por edad, sexo o raza en la construcción del jurado.

Uno de esos ejemplos se basa en el caso de George Bottley, un afroamericano, procesado por agresión criminal en Stockton,
condado de San Joaquín, California en1996. (http://lead.csustan.edu/ppa/llg/statdata/capsja.htm; véase Bell 1998). Un primer
panel de 60 posibles jurados no tenía miembros afroamericanos. Después de la destitución de este panel por el juez, se formó
un segundo panel de 45 aspirantes a jurados. De nuevo, no había afroamericanos en este panel. El Departamento de Finanzas
de California estimó que la población negra del condado de San Joaquín era del 5% en 1996.

El problema estadístico aquí consiste en calcular la probabilidad de que no haya afroamericanos en una muestra
extraída de una población desconocida, pero presumiblemente mucho mayor, en la que el 5% de los miembros son
afroamericanos. Aunque este ejercicio es claramente un caso de muestreo sin reemplazo, la distribución binomial
se utilizará aquí bajo el supuesto de que este tamaño de la población es muy grande en comparación con el tamaño
de la muestra.

Por lo tanto, la probabilidad de cero miembros afroamericanos en una muestra de 105 seleccionados de una
población compuesta por 0,05 miembros afroamericanos es

105!
(0.05)0 (0.05)105 = 0.00458
0! 105!

o menos del 0,5%, lo que es claramente una probabilidad muy baja. El número esperado de afroamericanos en una
muestra de 105 personas elegidas entre una población mayor con una composición fraccionaria de 0,05
afroamericanos es meramente (105) (0,05) = 5,25. De estos resultados se puede concluir que la diferencia entre el
número observado y el esperado de afroamericanos en este grupo de jurados fue estadísticamente significativa.

Un caso anterior de supuesta representación insuficiente de afroamericanos en un jurado ocurrió en el caso de


Swain vs Alabama en 1965 (http:// www.stat.ucla.edu/cases/swain/). Aquí, un hombre negro fue acusado (y
finalmente condenado y sentenciado a muerte) de violar a una mujer blanca. El jurado de este caso, compuesto por
100 personas, tenía ocho personas negras, todas las cuales fueron finalmente golpeadas como resultado de
impugnaciones perentorias de la fiscalía. Este panel fue tomado de una población total de alrededor de 16.000
hombres en el condado de Talla-dega, Alabama, con la proporción de negros en el mismo siendo alrededor del
26%. El número esperado de negros en esta muestra sería simplemente (100) (0.26) = 26.

En términos estadísticos, este problema puede ser considerado como el de determinar la probabilidad acumulada de
ocho o menos personas negras en una muestra de 100 personas de una población mucho mayor que es 26% negro.
La distribución de probabilidad binomial acumulativa es apropiada para este propósito. Los cálculos asociados se
resumen en la tabla 1, que es una hoja de cálculo de Microsoft Excel (ver por ej. Walkenbach 1996). Esta tabla
muestra que la probabilidad acumulada de ocho o menos negros en esta muestra de 100 es de 0.000005, o cinco
posibilidades en un millón. En la tabla 1, estos cálculos se realizan hasta el valor esperado de 26 negros en este
grupo, momento en el que la probabilidad acumulada es ligeramente superior a 0,5 o 50%.

Tal vez uno de los casos más aclamados de supuesta parcialidad en la formación de jurados ocurrió en el juicio del
doctor Benjamin Spock, el renombrado pediatra, por conspiración para violar la Ley del Servicio Militar
(http://www/stat.ucla.edu/cases/spock/). Este juicio, que tuvo lugar en la Cámara de la Corte Federal en Boston,
Massachusetts, comenzó con la construcción de un venire de 350 personas, seleccionadas por el secretario del juez
de una población de distrito que era de 53% mujeres. Este venire contenía 102 mujeres, en contraste con el
recuento femenino esperado de (350)(0.53) = 185. Los cálculos de probabilidad binomial acumulativos asociados
con este caso se dan en la tabla 2, que muestra que hay una oportunidad en un millón para cualquier número de
hembras inferior o igual a 140 en este venire. La probabilidad acumulada real de 102 o menos mujeres es del orden
de 10−19, lo que corresponde a menos de una oportunidad entre mil millones (o quintillón). La Tabla 2 muestra
que esta probabilidad acumulada es esencialmente igual a 0.5 o 50% cuando el número de hembras en la muestra
de 350 personas está en su valor esperado de 185. Por último, hay casi un 100% de probabilidades de que el
número total de mujeres en esta muestra de 350 personas sea inferior o igual a 230. Volveremos al caso del doctor
Spock, particularmente la fase de selección del jurado del juicio, en nuestra discusión de la distribución
hipergeométrica.
Número de Individual Acumulativo
Afroamericanos Probabilidad probabilidad
0 0,000000 0,000000
1 0,000000 0,000000
2 0,000000 0,000000
3 0,000000 0,000000
4 0,000000 0,000000
5 0,000000 0,000000
6 0,000000 0,000000
7 0,000001 0,000001
8 0,000004 0,000005
9 0.000013 0.000018
10 0.000042 0,000059
11 0.000120 0,000179
12 0.000311 0,000490
13 0.000741 0.001231
14 0.001618 0.002849
15 0.003258 0.006107
16 0.006082 0.012189
17 0.010559 0.022748
18 0.017106 0.039854
19 0.025939 0,065793
20 0.036911 0.102704
21 0.049405 0.152109
22 0,062332 0.214441
23 0.074272 0.288713
24 0.083723 0,372436
25 0.089425 0.461861
26 0.090633 0,552494

Tabla 1. Probabilidades del número de afroamericanos en el jurado de 100 personas reunido para Swain vs Alabama

Estos cálculos de distribución binomial (e hipergeométrica) a menudo implican números extremadamente grandes,
que son incluso demasiado grandes para ser manejados por las computadoras de última generación. Por ejemplo, el
factorial de sólo diez es superior a tres millones, no para especular lo que 350! es igual a. De hecho, el programa de
hojas de cálculo de Excel (ver Walkenbach 1996) sólo puede evaluar los factoriales directamente que no son más
de 170! Los cálculos de la tabla 2 se realizaron con la ayuda de la función BINOMDIST, disponible en el conjunto
de herramientas que vienen con Excel. En los casos de grandes argumentos de la función factorial en los cálculos
de probabilidad, es conveniente utilizar una fórmula clásica conocida como aproximación de Stirling (véase, p.
102, p. Spiegel, p. 68). Esta fórmula se aproxima a N! por

𝑁! = √2𝜋𝑁𝑁 𝑁 𝑒 −𝑁

Como ejemplo, según esta fórmula

10! = √20𝜋1010 𝑒 −10 = 3,598,695.6


en comparación con el valor exacto de 10! = 3.628.800. La aproximación da una buena herramienta para calcular
las relaciones de factoriales de números grandes, que de otra manera no serían determinables por el cálculo directo.
Número de mujeres Probabilidad acumulada
120 0,000000
125 0,000000
130 0,000000
135 0,000000
140 0,000001
145 0,000009
150 0,000090
155 0,000663
160 0.003739
165 0.016180
170 0,054205
175 0.142117
180 0,295924
185 0.499572
190 0.703547
195 0.857954
200 0,946167
205 0.984131
210 0,996407
215 0.999382
220 0,999920
225 0.999992
230 0,999999

Cuadro 2. Probabilidades acumuladas de número de mujeres en el venire original de 350 personas seleccionadas en el juicio por
conspiración del Dr. Benjamin Spock

Como última aplicación de la distribución binomial en la selección de jurados, se considera un ejemplo de la


distribución por edades de los grandes jurados en el condado de Alameda, California
(http://www.stat.ucla.edu/cases/jury/). En un estudio de 1973, 33 de 66 (o 50%) posibles miembros del jurado
mayor de 61 años de edad de un condado en el que sólo el 19% de la población era de la misma edad (últimos datos
del Departamento de Salud Pública del condado). Una vez más, esta población se supone que es muy grande, por lo
que la distribución binomial se puede emplear.

Aquí necesitamos usar la distribución de probabilidad acumulada para determinar la probabilidad complementaria de que
la mitad o más de los miembros del jurado sean mayores de 61 años (mientras que representan sólo el 19% de la
población total del condado). La primera columna de la hoja de cálculo del cuadro 3 indica el número mínimo de
potencial jurados que podrían tener esta edad. En la segunda columna se indican las probabilidades acumuladas de
que haya un número entre cero y las cifras mínimas correspondientes de esas personas en esta categoría de edad.
Por lo tanto, hay aproximadamente un 50% de probabilidad de 12 o menos personas de 61 años o más en este
grupo de grandes jurados, lo que se compara favorablemente con el valor esperado de (66) (0.19) = 12.5. Tenga en
cuenta también que hay una pequeña probabilidad finita (0.000001) de no personas de 61 años o más en este grupo.
La tercera columna da el complemento de la probabilidad en la segunda columna, i.e. la probabilidad de que más
de y personas (de la primera columna) son 61 años de edad o más. Está claro que la posibilidad de tener más de 32
personas en este grupo es extremadamente minúscula - menos de una oportunidad en un millón. De hecho, esta
probabilidad es de aproximadamente 1.4 × 10−8 .
Número de Probabilidad de
personas (y)de Probabilidad acumulada más de y
61 años o más para y o menos personas Personas
0 0,000001 0,999999
2 0.000123 0.999877
4 0.002651 0,997349
6 0.022243 0,977757
8 0.098007 0.901993
10 0.267621 0.732379
12 0.508081 0.491919
14 0.737261 0.262739
16 0.890452 0.109548
18 0.964538 0.035462
20 0,991078 0.008922
22 0.998249 0.001751
24 0.999731 0.000269
26 0,999967 0.000033
28 0.999997 0,000003
30 1.000000 0,000000
32 1.000000 0,000000
34 1.000000 0,000000
36 1.000000 0,000000
38 1.000000 0,000000
40 1.000000 0,000000
42 1.000000 0,000000
44 1.000000 0,000000
Tabla 3. Probabilidades acumuladas de representación por edad en potenciales jurados del Condado de Alameda, California

DISTRIBUCIÓN HIPERGEOMÉTRICA - SOLICITUDES DE ANÁLISIS DEL JURADO

Todas las aplicaciones exploradas hasta ahora han empleado la distribución binomial, que es aplicable en el caso
del muestreo con reemplazo o, para todos los fines prácticos, el muestreo de una población muy grande. Sin
embargo, como se ha indicado anteriormente, la distribución hipergeométrica es la herramienta estadística correcta
para el muestreo sin sustitución o cuando el procedimiento de muestreo realmente perturba la distribución de la
población original. En términos generales, estamos interesados en el caso de que se extraiga una muestra aleatoria
de n unidades de una población de tamaño m unidades que contengan s éxitos, sin embargo, puede definirse esta
última. Entonces estamos interesados en la probabilidad de éxitos R en la muestra de n unidades.

Distribución hipergeométrica
Individual Acumulativo Distribución binomial
probabilidad
Número de mujeres Probabilidad probabilidad acumulada
0 0,000000 0,000000 0,000000
1 0,000000 0,000000 0,000000
2 0,000000 0,000000 0,000000
3 0,000000 0,000000 0,000000
4 0,000000 0,000000 0,000000
5 0,000000 0,000000 0,000000
6 0,000000 0,000000 0,000000
7 0,000000 0,000000 0,000000
8 0,000000 0,000000 0,000000
9 0,000000 0,000000 0,000001
10 0,000000 0,000000 0,000004
11 0,000000 0,000001 0.000012
12 0,000002 0,000003 0.000039
13 0,000007 0.000010 0,000114
14 0.000025 0.000035 0,000305
15 0.000078 0,000114 0,000757
16 0,000221 0,000334 0.001742
17 0,000568 0,000903 0.003745
18 0.001342 0.002245 0.007544
19 0.002914 0.005159 0.014288
20 0.005830 0.010989 0.025521

Cuadro 4. Probabilidades de representación femenina en el jurado potencial de 100 personas seleccionadas en el juicio por conspiración del
Dr. Benjamin Spock, utilizando distribuciones binomiales e hipergeométricas
Al igual que con la distribución binomial, existe en Excel (véase Walkenbach 1996) una función conocida como
HYPGEOMDIST, que realiza cálculos de probabilidad individuales basados en la distribución hipergeométrica.
Las probabilidades hipergeométricas acumuladas se pueden calcular a partir de estas probabilidades individuales
de la misma manera que para las probabilidades binomiales.

Volvemos al juicio por conspiración del doctor Spock para una aplicación legal de la distribución
hipergeométrica. El lector recordará que, en este caso, un venire de 350 personas compuesto de 102 mujeres fue
seleccionado originalmente por el secretario del juez de una población de distrito que era de 53% mujeres. En los
cálculos asociados con el desarrollo de la tabla 2, utilizando la distribución binomial, se encontró que la
probabilidad de 102 o menos hembras en una construcción aleatoria de este venire era esencialmente cero - del
orden de 10−19 para ser exactos. En la siguiente etapa del juicio, al seleccionar el jurado real para escuchar este
caso, el juez presidente eligió 100 jurados potenciales de estas 350 personas. Sus opciones incluían sólo nueve
mujeres.

Así, el nuevo ejercicio de probabilidad aquí consiste en calcular la probabilidad de que nueve (= R) o menos
mujeres estén presentes en una muestra de 100 (= n) personas seleccionadas de una población venire original de
350 (= m) personas en la que 102 (= s) mujeres estaban presentes. Ignoramos la probabilidad de la composición
femenina en el venire original en este ejercicio, ya que ya no es relevante. Claramente, un tamaño de muestra de
100 seleccionados de una población total de 350 representa una fracción significativa de esta población, y la
aplicación de la distribución hipergeométrica se dicta aquí.

El cálculo de estas probabilidades se demuestra en la hoja de cálculo de la tabla 4, empleando la función


HYPGEOMDIST en Excel. De la columna para probabilidades hipergeométricas acumuladas, vemos que esta
probabilidad acumulada es esencialmente cero (hasta seis dígitos significativos) para una representación femenina
en este grupo de jurados de diez o menos. El valor específico para nueve o menos mujeres es de aproximadamente
2 × 10−8, o dos posibilidades de un centenar de millones. La probabilidad de 20 o menos mujeres en este jurado
de 100 personas sigue siendo de sólo un 1%. Estos resultados siguen la probabilidad extremadamente pequeña de
orden 10−19 para 102 mujeres en el venire de 350 personas en la primera fase de este ensayo (ver tabla 2). Por
último, la última columna de la tabla 4 presenta las mismas probabilidades acumuladas calculadas a partir de la
distribución binomial, utilizando un valor de probabilidad femenino de p = 102/350 = 0,2914. Estas
probabilidades se presentan únicamente para la comparación con los valores de distribución hipergeométrica
apropiados, y muestran que los valores binomiales sobrestiman consistentemente los valores correctos.
El último ejemplo que se considera aquí se refiere al caso de un miembro de la facultad universitaria que apeló
para una audiencia formal de una queja contra el presidente de su departamento. El procedimiento de la
universidad en este caso era seleccionar, nominalmente al azar, un grupo de jurado potencial de 24 personas, de
las cuales cuatro jurados finales fueron elegidos después de que el agraviado y el acusado golpearan o borraran
diez nombres del jurado original. El jurado de 24 personas se derivó de la población total de profesores
universitarios de 740 personas en este caso, de los cuales 66,5% o 492 eran titulares.
Distribución hipergeométrica
Individual Acumulativo Distribución binomial
probabilida probabilidad
Número de personas titulares d probabilidad acumulada
0 0,000000 0,000000 0,000000
1 0,000000 0,000000 0,000000
2 0,000000 0,000000 0,000000
3 0,000000 0,000000 0,000000
4 0,000000 0,000000 0,000001
5 0,000004 0,000004 0,000006
6 0.000025 0.000029 0.000039
7 0,000134 0,000163 0,000208
8 0,000597 0.000761 0,000919
9 0.002206 0.002966 0.003427
10 0.006829 0.009795 0.010891
11 0.017827 0.027622 0.029736
12 0.039361 0,066983 0.070237
13 0,073587 0,140570 0.144406
14 0.116365 0,256935 0.260018
15 0.155153 0.412089 0.412923
16 0.173457 0,585545 0,583555
17 0.161221 0,746767 0.742854
18 0.123063 0.869829 0,865755
19 0,075805 0,945634 0,942750
20 0.036737 0.982371 0,980937
21 0.013481 0.995852 0,995367
22 0,003520 0.999372 0.999271
23 0,000582 0,999954 0,999944
24 0.000046 1.000000 1.000000
Tabla 5. Probabilidades de miembros titulares de la facultad en un grupo de jurado potencial de 24 personas seleccionadas entre 740
personas, de las cuales 492 son titulares, utilizando distribuciones binomiales e hipergeométricas .

Al recibir la lista original de 24 posibles miembros del jurado, el demandante observó que sólo diez eran
miembros titulares de la facultad. Esto contrasta con un valor esperado de (24)(0.665) = 16. El agraviado procedió
a calcular las probabilidades de Y o menos miembros del profesorado en esta lista, con un rango de Y de 0 a 24,
usando las distribuciones hipergeométricas y binomial. Estos cálculos se resumen en la tabla 5. Ambas
distribuciones muestran la probabilidad de que diez o menos miembros del profesorado en este grupo de jurados
potenciales sean sólo de 1%. Además, la probabilidad de 16 o menos es de alrededor del 58%. Tenga en cuenta
que las probabilidades acumuladas de la distribución binomial sobrestiman las de la distribución hipergeométrica
más correcta hasta el valor esperado de Y = 16. La situación se invierte más allá de ese punto, ya que las
probabilidades binomiales subestiman los valores más correctos. Ambas probabilidades acumulativas se acercan a
la unidad, por supuesto, en el tamaño de muestra total de 24 personas (que cubre todas las posibilidades).
CONCLUSIONES

Este artículo ha demostrado la utilidad de las distribuciones de probabilidad binomial e hipergeométrica en el


análisis de la composición de salas de jurado, paneles o piscinas, así como los propios jurados. Los cálculos
asociados son útiles para asesorar a la hora de determinar qué tan representativo es dicho organismo de la
población original (por ejemplo, distrito electoral) a partir del cual se construyó. La distribución binomial más
simple puede emplearse con precisión cuando el cuerpo más pequeño tiene menos del 10% del tamaño de la
población original. Sin embargo, si el tamaño de la muestra representa una fracción significativa de la población
original, entonces debe usarse la distribución hipergeométrica.

Referencias

Bell, E. (1998). Too few blacks on S. J. juries. The Record, Stockton, CA, 9 November, p. B1.

Duncan, A.J. (1959). Quality Control and Industrial Statistics (rev edn). Homewood, IL: Richard D. Irwin.

Spiegel, M.R. (1968). Mathematical Handbook of Formulas and Tables. New York: McGraw-Hill.

Walkenbach, J. (1996). Excel 97 Bible, pp. 846–8. Foster City, CA: IDG Books Worldwide.
Los derechos de autor de Teaching Statistics son propiedad de Wiley-Blackwell y su contenido no puede copiarse
ni enviado por correo electrónico a múltiples sitios o publicado en un servidor de listas sin el permiso expreso por
escrito del titular de los derechos de autor. Sin embargo, los usuarios pueden imprimir, descargar o enviar
artículos por correo electrónico para uso individual.

También podría gustarte