Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ada Ca U1
Ada Ca U1
Ada Ca U1
Estadística en la
toma de decisiones
Análisis de Datos
Página 1 de 29
Introducción
En esta unidad revisarás las medidas numéricas que te permitirán resumir datos de
aquellas variables, con el propósito de conocer y resumir los datos que presentan cada
una de las variables.
En el contexto estadístico esta unidad es muy importante para el análisis de datos porque
da conocer la información que contienen las variables previas a realizar un método
estadístico avanzado. Por lo general, estos métodos estadísticos se aplican en conjunto
con las medidas de tabulación para dar a conocer al usuario la distribución de las
variables.
Las medidas más utilizadas son las medidas de tendencia central, medidas de localización
y las medidas de variabilidad, pero también revisaremos el concepto de distribuciones de
probabilidad; para saber cómo se comportan estas variables representado sus
características en función de sus respectivos momentos de la distribución.
Lo anterior puede sonar muy teórico, pero cuando lo llevamos a la práctica tiene una
proporción aplicada a los negocios que revisaremos en cada unidad. Además, cada una de
estas medidas entrega información por sí sola, pero cuando se interpretan con otras
medidas el análisis estadístico se hace mucho más robustos e interpretativo para concluir
y conocer los datos.
En esta unidad trabajaremos con una base ejemplos de las recaudaciones por películas de
las empresas Disney y Pixar. Para entregar algo de contexto, en su momento Disney quiso
adquirir a Pixar, por lo cual se necesitaba un análisis exaustivo de las recaudaciones de
Pixar. Durante las unidades iremos analizando las recaudaciones de Pixar, y por qué
Disney lo compró. En la tabla 1, se encontrarán las recaudaciones de cada empresa.
Página 2 de 29
1.2 Datos
Cuando se aplica los conceptos visto en la definición 1, sí o sí, se tiene que aplicar a un
conjunto de datos que están de cierta manera estructurados en alguna estructura de
información. La descripción de información es diferente a la descripción de datos. Cuando
las empresas tienen datos que no son equivalentes a información, sino que cuando tienen
datos tienen una posible información, en donde esa posible información dependerá de los
expertos del analista de datos, y del conocimiento del negocio.
La estadística tiene ese beneficio de entregar información mediante los datos, pero ¿qué
tipos de datos?, ¿cuál es la cantidad de datos ideal?
Como se muestra en la figura 1, la población viene siendo algo teórico, en la cual, para
realizar el análisis, se tiene que extraer de esa población teórica un conjunto de muestras
pero que son representativas a la población (autos de distintos colores).
Por otro lado, las observaciones de una variable de naturaleza cualitativa pueden
diferenciarse de dos formas: Nominal y Ordinal. Estas observaciones vienen dadas por la
cualidad de lo que se quiere medir. Las observaciones de una variable nominal pueden ser
los estados civiles (soltero, casado, viudo, etc.). Las observaciones de una variable ordinal
vienen dadas por una cualidad ordenada, por ejemplo, jerarquías en una empresa (dueño,
gerente general, gerente de división, etc.). Tanto la nominal y la ordinal viene dadas por
cualidades, pero se diferencias en que una sigue un orden jerárquico y la otra no
(nominal).
Cuando tenemos base de datos de corte transversal se hace referencia a un set de datos
capturadas en un instante de tiempo. Por ejemplo, la información de los trabajadores de
una(s) empresa(s) (Tabla 2).
Por otro lado, tenemos otra estructura de información denominada Serie de tiempo en
que hace referencia a una variable seguida en el tiempo (Tabla 3).
En relación con la tabla 3, se tienen variables en que sus datos se encuentran capturados
en diferentes instantes en el tiempo (periodicidad mensual). Estos tipos de métodos
sirven para la realización de pronósticos como ventas, costos, demandas, etc.
Cabe mencionar que en la estadística avanzada hay métodos que sirven para ciertas
estructuras de información es por eso la importancia de identificar a priori qué tipo de
estructura de información se utiliza para así lograr aplicar el método correspondiente.
En todo el mundo se encuentran con ese tipo de presentaciones tabulares, como reportes
anuales, artículos, estudios e investigación, etc. Por eso es útil saber cómo se calculan e
interpretan.
Supongamos que se tiene en una base datos, una variable en que la detalla una lista de
refresco (Coca-Cola, Sprite, Inca-Cola y Pepsi) vendidos en un período de un año. Si se
logra aplicar un método tabular, pasaría esa variable en forma de lista a un cuadro de
resumen (Tabla 4).
Página 8 de 29
En base a la Tabla 4, se puede señalar en que los refrescos más vendidos en un año son
Coca-Cola y Pepsi. Esta tabla resumen aporta mucho más que si se detalla la lista de los
refrescos en la variable. Ahora bien, hay que tener presente que al vender más refrescos
de Coca-Cola y Pepsi no significa que les fue mejor con respecto a los demás refrescos, es
por eso la importancia de los métodos de frecuencia relativa.
Como se señaló anteriormente, los refrescos que más se vendieron en el año fue Coca-
Cola y Pepsi, pero eso no significa que les fue mejor en las ventas ajustado al stock con
respecto a los otros refrescos. Es importante relativizar las frecuencias absolutas con
respecto a tu clase subyacente; en términos matemáticos esto se representaría en base a
la ecuación 1.
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎 (𝐹𝐴𝑐 ) (1)
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑅𝑒𝑙𝑎𝑡𝑖𝑣𝑎 (𝐹𝑅𝑐 ) =
𝑛
Página 9 de 29
Los gráficos de barra o diagrama de barra son una gráfica para representar los datos
cualitativos de una distribución de frecuencias (absoluta) o frecuencias relativas, donde se
señala en el eje horizontal las etiquetas o clases subyacentes a la variable bajo análisis. En
el eje vertical se muestran las magnitudes segundo método estadístico aplicado a graficar.
Observando las gráficas de la figura 3, se puede ver claramente que las ventas en términos
relativos al stock son mayores a los refrescos que se vendieron de forma absoluta.
Por otro lado, existen los gráficos de pastel o anillo que tienen la misma finalidad que los
gráficos de barra pero representado de otra forma. En vez de representar barras verticales
según la magnitud de la frecuencia, los gráficos de pastel o torta señalan regiones o áreas
según la magnitud de la frecuencia. Ambos son válidos para dar a conocer la frecuencia
absoluta o relativa.
En el caso de datos que son cuantitativos se hace un poco más complejo dado que no se
tiene clases subyacentes que a su vez no son semejantes a las observaciones de la
variable. Es por eso por lo que hay que cumplir tres pasos para calcular las respectivas
frecuencias absolutas y relativas, estos pasos serían:
Criterio de Sturges
El criterio de Sturges permite suavizar el número de intervalos cuando la
cantidad de observaciones tiende hacer muy alta. Si se establece un rango
entre 5 y 20 clases para una cantidad de observaciones muy grande, no será
posible observar de forma adecuada la distribución de las frecuencias.
𝑆𝑡𝑢𝑟𝑔𝑒𝑠 = 1 + 3.3 ∗ 𝐿𝑜𝑔(𝑛) (2)
El cálculo del número de clases según Sturges viene dado por la ecuación 2, en
donde la n es el número de observaciones de la variable.
Luego que se determina el número de intervalos o clases se debe definir el ancho de cada
una de clases, es decir, se debe medir el rango entre el límite inferior y superior por cada
una de las clases. Para encontrar el ancho de clases se utiliza ecuación 3.
Cabe destacar que hacer las clases de un mismo ancho de clase reduce la posibilidad de
que los usuarios hagan interpretaciones inapropiadas. En ocasiones, la ecuación 3
entregará un valor decimal, el cual el usuario deberá aproximarlo a un número entero,
siempre y cuando los datos de la variable no sean decimales.
Por último, los límites de clases determinan los límites inferior y superior por clase
asociadas. Cada una de clases (calculadas por la ecuación 2) deberá tener un valor mínimo
y máximo en la unidad de medida en que se está midiendo la variable bajo análisis.
Volviendo al ejemplo de los refrescos, supongamos que adicionalmente a la variable que
lista cada uno de ellos, se tiene otra variable que muestra las ventas anuales con
periodicidad diaria de cada uno de los refrescos. Es decir, tenemos una estructura de
información de serie de tiempo en la que se tienen 365 ventas por cada uno de los
refrescos. Si llevamos a cabo los pasos (1), (2) y (3) podemos observar lo siguiente:
En donde el número de clases para las ventas del refresco sería de diez.
En la tabla 3 se pueden observar los límites inferior y superior de cada una de las clases.
Estos son los tres pasos para definir las clases de una variable con datos cuantitativos,
luego de esto pueden comenzar a calcular las respectivas frecuencias absolutas, relativa y
relativa acumulada como se muestra en la tabla 7.
Página 13 de 29
Tabulación Coca-Cola
Clase Límite Inf. Límite Sup. Rangos Frec. Abs. Frec. Rel. Frec. Rel Ac
1 $ 5,091 $ 14,543 5091 - 14543 45 12% 12%
2 $ 14,543 $ 23,995 14543 - 23995 38 10 23%
3 $ 23,995 $ 33,447 23995 - 33447 45 12% 35%
4 $ 33,447 $ 42,899 33447 - 42899 40 11% 46%
5 $ 42,899 $ 52,351 42899 - 52351 23 6% 52%
6 $ 52,351 $ 61,803 52351 - 61803 38 10% 63%
7 $ 61,803 $ 71,255 61803 - 71255 33 9% 72%
8 $ 71,255 $ 80,707 71255 - 80707 42 12% 83%
9 $ 80,707 $ 90,159 80707 - 90159 29 8% 91%
10 $ 90,159 $ 99,612 90159 - 99612 32 9% 100%
Total 365 100%
Fuente: Elaboración propia
En la tabla 4, se observa que la tabulación de las ventas de Coca-Cola tienen frecuencias
absolutas y relativa medianamente parejas, es decir, que en cada una clase tienen una
igual proporción de cantidad de ventas, siendo el menor valor un 6% hasta un máximo del
12%. En ocasiones hay que observar la frecuencia relativa acumulada dado que existe la
posibilidad en que las frecuencias relativas se acumulan en ciertas clases.
En base al ejemplo de las ventas de refresco, como existe una distribución homogénea en
las clases, se esperaría que la frecuencia relativa acumulada se distribuya de la misma
Página 14 de 29
En relación con la figura 5, se observa que es relativamente homogéneo por clases siendo
las clases de en medio de la que hay una curva en la que representa menor cantidad de
ventas en las clases de al medio (6% y 10% observar tabla 6).
Como el histograma y la ojiva trabajan bajo una variable tabular, estos gráficos se podrían
combinar en uno solo, mostrando los detalles de la compensación. Por ejemplo, si se
combina el gráfico 2 y 3 logramos obtener un detalle en el que las clases de en medio son
las que menor frecuencia tienen por lo que en el gráfico de ojiva se observaría el efecto.
4. Medidas estadísticas
4.1 Medida de Tendencia Central
Principalmente esta es una de las medidas más utilizadas, por la interpretación sencilla
que conlleva, en la que calcula principalmente el valor central de los datos de una
variable, de la cual viene dado por la ecuación 1.
∑ 𝑥𝑖 (1)
𝑥̅ =
𝑛
La ecuación 1 calcula la suma de los valores de la variable dividida por la cantidad de
observaciones de esta. Es decir, es una suma ponderada de igual peso para cada
observación de la variable.
4.1.2 Mediana
La mediana es un método análogo al del promedio (pertenecientes a la misma familia)
pero su interpretación y cálculo se diferencian. La mediana es una medida que a su vez es
equivalente a un percentil, principalmente, al percentil 50 (medida de localización). Lo que
busca la mediana es encontrar el valor de en-medio de las observaciones de la variable.
El cálculo de esta medida viene por dos métodos que se alinean para encontrar el valor de
en-medio de la variable (observar ecuación 2).
interpretación mucho más robusta, y una interpretación adicional que si lo hacemos por si
solas.
Ese mismo ejemplo anterior se desprende que la desviación estándar es una medida de
variabilidad interpretable por el usuario y viene calcula por la ecuación 3.
2 (3)
∑(𝑥𝑖 − 𝑥̅ )
𝑠 = √( )
𝑛−1
La desviación estándar al igual que la media tiene una simbolización cuando se requiere
calcular la desviación estándar poblacional (𝜎) y una desviación estándar muestral (𝑠).
Este método permitiré ser interpretado fácilmente, porque se interpreta con las mismas
unidades de medida que tiene los datos. En otras palabras, la desviación estándar de las
recaudaciones de Disney y Pixar es de $103.4 y 189.8, respectivamente. La desviación
estándar de Pixar es mucho más dispersa que la desviación estándar que Disney con
respecto a su media. Es decir, Pixar es mucho más volátil en sus recaudaciones que
Disney. ¿Pero si la ajustamos con su media, realmente será más homogéneas las
recaudaciones de Pixar con respecto a la de Disney? Para responder esa pregunta se
tendrá que definir qué es un Coeficiente de Variación, lo que se indicará más adelante.
4.2.2 Varianza
Por lo cual, uno denomina la varianza y todas las medidas adimensionales como medidas
de cálculo dado que son medidas que se utilizan para calcular otras medidas, y en
ocasiones esas otras medidas son medidas que se pueden interpretar para el uso del
negocio.
Página 19 de 29
El coeficiente de variación es una medida poca conocida en el área de los negocios, pero
de gran utilidad. Lo que calcula esta medida es una dispersión ajustada por su media, es
decir, calcula un grado de homogeneidad de los datos que está acotado entre 0 y 1 o 0 y
100, si es que se multiplica por cien, como viene dada en la ecuación 4.
𝑠 (4)
𝐶. 𝑉 = ⋅ 100
𝑥̅
El coeficiente de variación también sirve para comparar dos variables en la que sus datos
están con diferentes unidades de medidas, por ejemplo, ventas en pesos ($) y en millones
de pesos (MM$). Teniendo esa figura no podrá utilizar la desviación estándar y
compararlas; pero si podrá utilizar el coeficiente de variación sin la necesidad de
transformar una variable y dejarla en la misma unidad de medida que la otra.
Página 20 de 29
4.3.1 Percentiles
Los percentiles son de la familia de las medidas de localización. Al igual que la mediana,
son medidas que permiten saber la ubicación de un cierto valor dentro de las
observaciones de la variable. Es decir, si se requiere saber la ubicación de un valor dentro
de las observaciones se tendrá que localizar la ubicación que corresponde a ese valor
dentro de las observaciones de la variable.
Existe un ejemplo muy bueno para lograr identificar la utilidad que tienen los percentiles
dentro de las medidas descriptivas, y ese ejemplo es:
“No dice nada que un estudiante tuvo 62 punto de 120 en el examen de estadística en
comparación de otros estudiantes, pero sí dice que ese puntaje se ubicó en el percentil
82%, es decir, el 82% de los estudiantes tuvieron un puntaje menor a 62 puntos y 18% de
los estudiantes tuvieron un puntaje mayor a 62 puntos”.
Por otro lado, volviendo al ejercicio de las recaudaciones de Disney y Pixar, se podrá
obtener una mejor información si cruzamos los valores de las recaudaciones de una
empresa para saber en qué ubicación se encuentran dentro de las recaudaciones del otro.
Es decir, la máxima recaudación de Disney es $448 y esa recaudación se localiza en la
ubicación de las recaudaciones de Pixar en el lugar 33.9%. Lo anterior hace referencia que
la máxima recaudación que obtuvo Disney con sus películas se ubicó en la posición 33.9%
de las recaudaciones de Pixar (relativamente bajo), a su vez, el 66.1% (100-33.9) de las
recaudaciones de Pixar se encuentran sobre la máxima recaudaciones de las películas de
Disney.
Otro análisis interesante es observar en qué lugar se ubica la mínima recaudación de Pixar
dentro de las recaudaciones de Disney.
A medida que se avanza en la unidad se encontrarán que los análisis de los datos ya no
son solo univariados, no solo se analiza por sí sola la variable, sino también se incluye
análisis de dos o más variables. Las medidas de asociación son medidas en las que sí o sí se
necesitan dos variables para que el método funcione.
El coeficiente de correlación es una medida que permite observar la asociación lineal que
existe entre dos variables, en la que viene dada por la ecuación 5.
𝑛∑𝑥𝑖 𝑦𝑖 − ∑𝑥𝑖 ∑𝑦𝑖 𝜎𝑥𝑦 (5)
𝑟𝑥,𝑦 = → 𝜌𝑥𝑦 =
𝜎𝑥 𝜎𝑦
√𝑛∑𝑥𝑖2 − (∑𝑥𝑖 )2 ⋅ √𝑛∑𝑦𝑖2 − (∑𝑦𝑖 )2
La ecuación 5 representa el coeficiente de asociación lineal que existe entre dos variables
y y x. En la que se encuentra acotada en -1 y 1. Por lo tanto, si el coeficiente de correlación
entrega un valor positivo y cercano a uno significa que las dos variables tienen un alto
nivel de correlación y son directamente proporcionales. Lo mismo sucede si el coeficiente
de correlación entrega un valor cercano a menos uno (≈ −1); pero en este caso sería
inversamente proporcional.
4.4.2 Covarianza
La covarianza es una medida que mide variación conjunta entre dos variables. Esta medida
es otra medida de las denominadas medidas de cálculo (al igual que la varianza) porque es
una medida sensible a las magnitudes de las observaciones y no interpretable para el
negocio.
Esta es una de las medidas que viene de la mano con el coeficiente de correlación (Freund,
Miller y Miller, 2000), dado que esta medida es un input dentro del cálculo de este,
mediante el factor (𝜎𝑥𝑦 ), viene dada por la ecuación 6.
Página 22 de 29
En este curso, no nos interesa mucho saber que comportamiento se asocia las
recaudaciones de Disney y Pixar; pero sí nos interesa saber las características que tienen
esas variables para poder interpretarlas.
Los momentos de una distribución son conocidos como cuatro y enumerados: Esperanza,
Varianza, Asimetría y Curtosis (Behar y Grima, 2018). Los dos primeros momentos ya se
Página 23 de 29
En el caso de la curtosis, esta hace referencia a nivel de apuntalamiento que tiene los
datos, esto quiere decir que si los datos tienen un nivel de apuntalamiento alto significa
que existe una mayor probabilidad de ocurrencia que ocurran los datos atípicos o
extremos. Lo anterior se denomina leptocurtosis, como se muestra en la Figura 8.
Si la variable tiene una curtosis negativa significa que es platicurtica (más achatada), en
cambio sí es igual a cero es mesocurtica.
Para caso de las recaudaciones de Disney y Pixar tenemos que Pixar tiene asimetría
positiva, pero con altas probabilidad que ocurran datos extremos, en cambio, Disney
ocurre lo contrario es platicurtico, pero con niveles de asimetría negativa, que a su vez se
puede ver representado en la diferencia de la media y la mediana.
Página 25 de 29
Es en este momento en que entra en juego la estadística. Como solamente obtendrá una
muestra de toda la población es donde la estadística inferencial entra en juego; infiriendo
una hipótesis sobre la población, pero utilizando una muestra. Realmente lo anterior tiene
mucha lógica. Por ejemplo, si necesito medir el tráfico vehicular en un año de una avenida
concurrida, no es necesario estar midiendo los datos durante todo el año, sino más bien
estar solo 3 meses, en donde esos tres meses son significativos para inferir el tráfico
vehicular promedio durante todo el año.
Ahora bien, aunque tenga mucha lógica, debería causar cierta duda, dado que no todo
preciso y perfecto. Porque si utilizamos una muestra para inferir sobre la población se
necesitará tener un nivel de confianza para cuantificar lo que yo estoy tratando de inferir
hacia la población. En otras palabras, se puede hacer referencia que en la Av. Walker
Martínez transitan en promedio 1.250.000 de vehículos anuales, pero es muy diferente
decir, con un nivel de confianza del 95% en la Av. Walker Martínez transitan 1.250.000.
Agregar ese nivel de confianza no solo genera confianza en lo que se está infiriendo, sino
también se están aplicando los métodos estadísticos de forma correcta.
Página 26 de 29
Por ejemplo, las empresas, sobre todo las empresas manufactureras en que transforman
una materia prima en un producto como un clavo, tienen que llevar un control de calidad
óptimo para cumplir los estándares de fabricación, por lo tanto, la empresa no se puede
dar el lujo de controlar la producción de forma manual, es decir, que esté una persona
midiendo y anotando cada uno de los clavos que está fabricando la máquina, en que
fácilmente en una hora puede producir cientos y miles de clavos.
Por lo tanto, para cumplir los estándares de calidad sin incurrir en costos elevados y en
riesgos operacionales se puede utilizar estadística inferencial para saber si las máquinas
están elaborando clavos con los estándares óptimos de calidad.
Entonces, lo que primero que uno se debería preguntar es ¿qué es lo que quiero medir? y
si tengo lo adecuado para comprobar la hipótesis de lo que deseo medir. En caso de los
clavos, deseo medir que todos los clavos tengan un diámetro de 5mm. Para responder la
primera pregunta, hay que tener claro que las hipótesis en estadística se conocen en dos
tipos: Hipótesis Nulas (ℎ0 ) y Alternativa (ℎ1 ), en donde la hipótesis nula hace referencia a
la hipótesis que deseo medir, y la alternativa a todo lo contrario que la nula.
Por lo tanto, la hipótesis nula será que en promedio los clavos tienen de diámetro 5mm, y
la hipótesis alternativa será que los clavos no tienen (distinto, mayor o menor a 5mm), en
promedio, un diámetro de 5mm. Para lograr saber si la hipótesis nula definida se rechaza
o no se rechaza se tendrá que tener una muestra de clavos en que se traduce en una
variable que haga referencia los diámetros de los distintos clavos de esa muestra.
Por último, falta responder ¿Cuánta es la cantidad óptima de observaciones para tener en
la muestra?
Página 27 de 29
7. Errores tipo l y ll
7.1 Error tipo l y ll
Cuando se hacen pruebas de hipótesis para inferir sobre la población, estas pruebas de
hipótesis entre ellas son de características opuestas, es decir, una confirma un valor pero
la otra hipótesis es la contrapuesta, por lo tanto unas de las dos tienen que ser verdadera
pero no así ambas.
En base a la tabla 8, se pueden dar todas las casuísticas en las que dos son
verdaderamente correctas. Por ejemplo, se comete un error del tipo 1 cuando rechazo la
hipótesis nula (h0) siendo la hipótesis nula verdadera. Por otro lado, tenemos un error del
tipo ll cuando se acepta H0 siendo la hipótesis alternativa la correcta.
Ahora bien, cuando se establecen las hipótesis nula y alternativa cabe la posibilidad que
preferimos cometer menos errores de un tipo que de otro. Por ejemplo, si estamos
evaluando el rendimiento de una máquina, y se establece en la hipótesis nula que el
rendimiento de la máquina es igual a 50 sombreros por minuto ¿Qué tipo de error
queremos disminuir? ¿el error tipo 1 o el error tipo 2?
que se usan son 0.05 (5%) y 0.01 (1%). En otras palabras, seleccionar el alpha significa
controlar el error tipo l, y si el costo de cometer un error del tipo 1 es elevado, los valores
pequeños de alpha son preferibles.
En efecto, al no aceptar directamente H0, se evita el riesgo de cometer un error tipo II.
Siempre que no se determine y controle la probabilidad de cometer un error tipo II, no se
dirá “se acepta H0”. En esos casos solo son posibles dos conclusiones: no se rechaza H0 o
se rechaza H0.
Conclusiones
En esta unidad abordamos los contenidos de los métodos de estadística descriptiva
aplicados a la toma de decisiones, en la que para este caso se tomaron las recaudaciones
de Disney y Pixar, y por qué Disney tenía argumento para poder adquirir Pixar.
Por último, encontramos que la empresa Disney tiene fundamentos estadísticos sólidos
para comprar la empresa Pixar. A pesar de que todo análisis lleva un fundamento
estadístico, este debería ir acompañado de un robusto análisis de la industria, análisis de
los fundamentales de la empresa, y un alto nivel del conocimiento del negocio. Los análisis
estadísticos son en ocasiones para fundamentar ciertas decisiones y/o apoyo a la toma de
decisiones en los negocios, por lo tanto, no hay que dejar de lado estos métodos
estadísticos, sobre todo cuando tenemos datos para poder analizar.
Página 29 de 29
Referencias bibliográficas
• Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística en la Administración y
Economía. México DF: Cengage Learning.
• Behar, R. y Grima, P. (2018). 55 respuestas a dudas típicas de Estadística. Díaz de
Santos Biblioteca Digital de Aranjuez.
• DeGroot, M. & Schervish, M. (2002). Probability and Statistics. Boston: Addison-
Wesley.
• Freund, J., Miller, I. y Miller, M. (2000). Estadística matemática con aplicaciones.
México: Pearson.