Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadísticos y
Descripciones de Datos
UCR – ECCI
CI-0115 Probabilidad y Estadística
Prof. Kryscia Ramírez Benavides
Muestreo Aleatorio
En este tipo de muestreo, todos los individuos de la población pueden
formar parte de la muestra, tienen una probabilidad positiva.
Es decir, p es un valor de una variable aleatoria que representamos
con P.
S 2 = i =1 i =1
n(n − 1)
S= ∑
i =1
i
(n − 1)
La cantidad n – 1 a menudo se denomina grados de libertad
asociados con la varianza estimada. Los grados de libertad
representan el número de piezas de información independientes
disponibles para calcular la variabilidad.
Frecuencia
6
[30,60[ 8 5
4
[60,90[ 3
3
[90,120[ 2 2
[120,150[ 1 1
0
[150,180[ 1 30 60 90 120 150 180
Tiempo (min)
CI0115 Probabilidad y Estadística 26
Presentaciones de Datos y Métodos Gráficos
Medidas de Posición
Los cuantiles son puntos tomados a intervalos regulares de la función de
distribución de una variable aleatoria.
Suelen usarse por grupos que dividen la distribución en partes iguales, entendidas
estas como intervalos que comprenden la misma proporción de valores.
Cuartiles son los valores que dividen los datos en cuatro partes
iguales (cuartos):
El primer cuartil (Q1) es el valor tal que el 25% de los datos son menores a él.
El segundo cuartil (Q2) es el valor tal que el 50% de los datos son menores a
él (la mediana).
El tercer cuartil (Q3) es el valor tal que el 75% de los datos son menores a él.
Note que:
El primer cuartil (Q1) es el mismo P25.
El segundo cuartil (Q2) es el mismo P50 (la mediana).
El tercer cuartil (Q3) es el mismo P75.
Ejemplo:
En el gráfico de cajas los outliers se calculan de acuerdo a la distancia que los
separa de la caja del diagrama.
Se definen el límite inferior (LI) y el límite superior (LS).
Si las distribuciones de los cuantiles comparados son idénticas, los puntos del
diagrama formarán una línea recta de 45 grados. Cuanto más lejos se desvíen los
puntos del diagrama de una línea recta, menos similares serán las distribuciones
comparadas.
CI0115 Probabilidad y Estadística 44
Presentaciones de Datos y Métodos Gráficos
Gráfico Cuantil-Cuantil
Un gráfico Q-Q normal de datos N(0,1) Un gráfico Q-Q normal de datos exp(1)
generados aleatoriamente generados aleatoriamente
CI0115 Probabilidad y Estadística 45
Presentaciones de Datos y Métodos Gráficos
Gráfico Cuantil-Cuantil
Se utiliza para comprobar normalidad de la distribución de una
variable en una población.
Si la distribución de la variable es la misma que la distribución de comparación
se obtendrá, aproximadamente, una línea recta, especialmente cerca de su
centro.
En el caso de que se den desviaciones sustanciales de la linealidad, los
estadísticos rechazan la hipótesis nula de similitud.
Ejemplo:
La venta de helados y los ataques de tiburones se correlacionan positivamente en una
playa.
A medida que aumentan las ventas de helados, hay más ataques de tiburones.
Sin embargo, el sentido común nos dice que las ventas de helados no provocan
ataques de tiburones.
Por lo tanto, es una correlación espuria.