Está en la página 1de 17

Estadı́stica y Diseño de Experimentos

David Rozo Osorio, I. M, M.Sc

14 de febrero de 2021
ESTADÍSTICA DESCRIPTIVA
OBJETIVOS
I Calcular e interpretar la media muestral, la varianza muestral, la desviación
estándar muestral y la mediana.
I Identificar la diferencia entre media y varianza muestral, con respecto a la
media y varianza poblacional.
I Construir e interpretar gráficos estadı́sticos.
I Definir el concepto de muestreo aleatorio.
RESUMEN NUMÉRICO DE DATOS [1]
“Estadı́stica” es la ciencia de los datos. La base del análisis estadı́stico,
consisten en organizar y resumir grandes conjuntos de datos de tal forma que
facilite la interpretación y el análisis de los mismos.
Padres [in] Hijos [in] Padres [in] Hijos [in] Padres [in] Hijos [in] Padres [in] Hijos [in] Padres [in] Hijos [in]
65.0485 59.7783 66.7593 65.4901 71.8179 66.4171 67.0912 67.5832 64.5191 68.3383
63.2509 63.2140 67.7976 65.1352 62.4162 67.2256 66.6137 67.2119 66.0269 68.3138
64.9553 63.3424 69.5348 65.5126 64.4908 67.4639 67.4108 66.8163 65.8101 68.1833
65.7525 62.7924 62.5401 66.5844 64.4876 66.9936 67.2772 67.2427 66.0181 68.5106
61.1372 64.2811 63.8102 66.3784 63.9230 66.7665 66.6113 67.5104 65.5374 68.1201
63.0225 64.2422 64.4565 66.1478 65.4459 67.0342 68.1741 67.5703 65.7335 68.3156
65.3705 64.0823 64.9665 65.9726 65.0298 66.8432 67.8056 67.1726 66.7742 68.0477
64.7240 63.9957 64.7066 65.9589 65.6704 69.2989 68.3253 67.5413 66.6787 68.6127
66.0651 64.6134 65.7383 66.4520 68.6608 69.0911 68.0779 67.3711 66.9759 67.9425
66.9674 63.9794 65.5014 65.7480 66.5460 61.6636 68.9680 67.5971 66.9402 68.0838
59.0080 65.2445 65.5542 65.9716 64.8595 65.7288 68.9255 67.2510 66.8458 68.3675
62.9320 65.3510 66.9029 65.9055 69.6069 68.9801 69.6086 66.8253 67.1201 67.8518
63.6706 65.6799 66.5739 65.9077 64.8135 67.3740 70.3565 66.7268 67.7418 68.1981
64.0739 65.4366 66.5320 66.4710 65.3270 67.1746 70.0064 66.9300 68.2719 68.0190
64.6885 65.2939 67.9061 65.7502 65.8317 67.0671 72.7543 67.6485 67.6069 68.2343
65.1547 64.7902 68.2920 66.3467 65.8343 67.2945 62.8215 68.0429 68.4474 67.8974
66.3735 65.0188 67.7412 66.0858 65.5614 67.6267 62.8686 68.4885 67.6583 68.6241
65.5770 65.5464 68.4692 66.2804 65.8688 67.4792 63.9126 68.0478 68.7119 67.9791
67.3677 65.0815 69.3833 66.3435 65.7734 66.9216 64.5412 68.3457 69.3203 68.2668
Padres [in] Hijos [in] Padres [in] Hijos [in] Padres [in] Hijos [in] Padres [in] Hijos [in] Padres [in] Hijos [in]
68.7403 67.9419 66.5723 69.5234 74.9620 69.0328 70.4439 69.7349 70.0440 71.1770
69.1340 68.6207 66.6488 68.7441 64.8822 69.8568 70.8539 70.0840 70.2356 71.0341
69.3500 68.2386 67.7190 69.3099 65.5517 70.0627 71.3007 70.0102 70.8808 71.3728
68.6297 68.5855 68.4873 69.2257 65.6589 69.8977 72.1398 70.6503 71.1909 71.6474
69.5826 68.0657 67.8277 69.2407 65.9283 70.2619 72.1905 70.0125 72.3740 71.1205
70.3952 68.3819 67.5580 69.4912 65.9420 70.5266 75.4339 70.0908 73.0335 70.9176
71.1928 67.7594 68.0776 69.1192 67.4365 70.5274 64.5179 71.3432 74.8083 71.6646
70.8243 68.5999 69.1672 68.9375 67.4844 69.7865 66.3634 70.8154 67.3952 72.3920
71.6537 67.9148 68.6930 69.4577 67.6134 70.3668 65.5686 71.4493 67.3152 71.8793
73.2813 67.8386 68.6178 69.2760 68.4518 69.9760 66.7896 71.1868 67.7795 72.3448
63.0375 68.7756 68.6480 69.2287 68.4946 69.8331 66.9119 71.6628 69.3383 72.1727
63.6643 69.6078 68.6167 68.7055 68.1056 70.6995 68.1714 71.3952 68.7240 72.5208
65.3831 69.6914 70.3649 69.3464 69.4831 70.1687 67.5010 70.7361 69.9899 71.9884
64.6021 69.4149 70.0099 68.8714 69.0739 70.1163 67.8349 71.2608 69.7538 72.3448
66.4066 69.6893 70.1398 69.3026 69.3925 69.9543 68.9526 71.0472 70.6594 72.4535
65.7699 69.2078 70.2073 69.1579 69.4429 70.3128 69.2600 71.2592 71.1088 72.2695
65.6673 69.4563 71.2806 69.6273 69.5213 69.8090 68.7422 70.8949 72.4811 71.9684
66.0571 69.5961 70.9045 69.1101 70.1546 69.9679 69.7429 71.3173 72.4801 72.1817
66.5464 69.2799 72.1904 69.0960 69.8691 69.9394 70.2994 71.5571 67.5221 72.7864
Ejemplo
El Instituto Nacional de Sordera y Otros Trastornos de Comunicación (NIDCD,
por sus siglas en inglés) describe que la exposición larga o repetida a sonidos por
encima de 85.000 dB ± 2.000 dB (valores de referencia) puede causar perdida de
la audición. En una zona de estudio en una Universidad, se desea analizar el nivel
de ruido con el objetivo de evaluar el impacto que este puede tener sobre los
estudiantes que utilizan el espacio. Para el estudio se realizaron 13 mediciones de
forma aleatoria: (79.464, 82.173, 82.265, 82.367, 82.633, 82.946, 83.236, 83.341,
83.346, 83.988, 84.223, 84.312, 86.529) dB.
I Poblacional
I Muestral
RESUMEN NUMÉRICO DE DATOS [1]
Media muestral o promedio aritmético
Para n observaciones en una muestra que son descritas como x1 , x2 , x3 , · · · , xn ,
se tiene: n
P
xi
x1 + x2 + x 3 + · · · + xn i=1
x̄ = =
n n

Varianza y desviación estándar muestral


Para n observaciones en una muestra que son descritas como x1 , x2 , x3 , · · · , xn ,
se tiene:  n 2
P
n n
xi
P 2
P 2 i=1
(xi − x̄) xi −
2 i=1 i=1 n
s = =
n−1 n−1
RESUMEN NUMÉRICO DE DATOS [2]
Rango muestral
Para n observaciones en una muestra que son descritas como x1 , x2 , x3 , · · · , xn ,
se tiene:
r = max(xi ) − min(xi )

Mediana muestral
Este estadı́stico es obtenido, primero ordenando las n observaciones en forma
ascendente (menor a mayor), teniendo en cuenta todas las muestras, incluso los
valores repetidos.

n es impar, se ubica en la posición n + 1


x̃ = 2 n n 
n es par, promedio aritmético entre los datos ,y +1
2 2
RESUMEN NUMÉRICO DE DATOS
Poblacional vs Muestral

Poblacional Muestral

Media µ x̄

Varianza σ2 s2

Desviación estándar σ s

Parámetro θ θ̂
DIAGRAMAS ESTADÍSTICOS [1]
Tallos y Hojas (Stem-and-Leaf Diagram)
Este tipo de diagrama es la primera alternativa, que permite obtener información
gráfica de un conjunto de datos (x1 , x2 , x3 , · · · , xn ). Esta representación requiere
que cada número del conjunto de datos tenga al menos 2 dı́gitos.

Procedimiento
1. Dividir cada número xi en 2 partes: donde el
(tallo), consiste en los primero dı́gitos y la Tallo Hojas
(hola), en los dı́gitos restantes.
6 134556
2. Listar los datos en forma vertical.
3. Registrar cada (hoja) por observación al lado 7 011357889
de su respectivo (tallo). 8 1344788
4. Describir al pie del diagrama las unidades de
9 235
cada sección del gráfico.
DIAGRAMAS ESTADÍSTICOS [1]
Distribución en frecuencia e histogramas
Para construir una distribución en frecuencia de un conjunto de datos, se requiere
general una tabla con 2 columnas. En la primera columna se definen las categorı́as o
subintervalos de la distribución. En la segunda se estable una regla de frecuencia
absoluta o relativa.
Clases Frecuencia

70 ≤ x < 90 2

90 ≤ x < 110 3

110 ≤ x < 130 6

130 ≤ x < 150 14

150 ≤ x < 170 22

170 ≤ x < 190 17

190 ≤ x < 210 10

210 ≤ x < 230 4

230 ≤ x < 250 2


DIAGRAMAS ESTADÍSTICOS [1]
Método de construcción de un histograma
I Primera columna: se pueden tener grupos, categorı́as (discreto) o
subintervalos (continuo). Para este último tipo, se recomienda que el ancho
de subintervalo, se el mismo para todos los necesarios, con el objetivo de
una interpretación visual eficaz. Como regla general, el número de categorı́as
debe estar entre 5 y 20. En la practica, el número de subintervalos es
seleccionado aproximadamente como:

K= n
I Segunda columna: la columna de frecuencia depende de la cantidad de veces
que se repite un dato, en la categorı́a o subintervalo seleccionado.
DIAGRAMAS ESTADÍSTICOS [1]
Consecuencias del uso de un histograma
I Usualmente, esta gráfica ayuda en la selección de un modelo de distribución
de probabilidad que puede ser utilizado para describir a la población en
cuestión.
I Los histogramas por lo general son utilizados en largos grupos de datos,
dado que son más estables (entre 75 y 100 o más observaciones).
I Se pierde parte de la información, dado que ya no se tienen los datos, sino
una representación de su repetitividad.
Consulta
¿Qué tipo de conclusiones se pueden obtener del estudio de un histograma para
un conjunto de datos?
DIAGRAMAS ESTADÍSTICOS [1]
Box Plot
Es un tipo de gráfico que muestra simultáneamente varias caracterı́sticas del
conjunto de datos, tales como, el centro (media), la dispersión, alejamiento de la
simetrı́a y permite la identificación de observaciones inusuales.
DIAGRAMAS ESTADÍSTICOS [1]
Procedimiento de construcción del Box Plot
Cuartiles
Definición: cuando se divide la información (ordenada) de cuatro partes iguales, a
los puntos de división se les denomina cuartiles.
I q1 : primer cuartil describe aproximadamente al 25 % de las observaciones
que están debajo de él.
I q2 : segundo cuartil (mediana) describe aproximadamente al 50 % de las
observaciones que están debajo de él.
I q3 : tercer cuartil describe aproximadamente al 75 % de las observaciones que
están debajo de él.
I q4 : cuarto cuartil describe aproximadamente al 100 % de las observaciones
que están debajo de él.
Rango intercuartil: se define como IQR = q3 − q1 , y es una media de la
variabilidad de los datos.Éste es menos sensible a valores extremos que el rango
muestral simple.
DIAGRAMAS ESTADÍSTICOS [1]
Procedimiento de construcción del Box Plot
1. Ordenar el conjunto de datos de menor a mayor.
2. Por medio de una recta numérica, identificar q1 , q2 , q3 .
3. Trazar una linea vertical sobre los q1 , q2 , q3 .
4. Trazar las lineas de variabilidad, éstas se extienden desde q1 hacia la
izquierda y desde q3 hacia la derecha. Los puntos finales son los valores
existentes en la muestra que estén dentro del rango de: q1 − 1.5IQR y
q3 + 1.5IQR.
Consulta
Si este tipo de gráficos se utilizan con dos muestras que aparentemente tienen
relación, ¿qué tipo de análisis se pueden obtener?
DIAGRAMAS ESTADÍSTICOS: trabajo autónomo
Diagrama de dispersión (gráfico multivariable)
1. ¿En que consiste este tipo de representación gráfica?
2. ¿Procedimiento para uso de este tipo de gráficas con un conjunto de datos?
3. ¿Cómo se interpreta la información en este tipo de diagramas?
4. ¿Ejemplos de uso?

Coeficiente de correlación de Pearson


1. ¿Qué es el coeficiente de correlación de Pearson?
2. ¿Cuál es la ecuación que se asocia con este coeficiente?
3. ¿Qué significa este coeficiente?
4. ¿Cuál es la importancia que tiene en el análisis de información muestral?
BIBLIOGRAFÍA I
[1] D. C. Montgomery and G. C. Runger, Applied statistics and probability for
engineers, 6th ed. John Wiley and Sons, Inc, 2014.
[2] J. L. Devore, Probability and statistics for engineering and the sciences,
9th ed. Cengage Learning, 2016.

También podría gustarte