Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Uso educativo
18 | Estadística para ingeniería y ciencias
0.6 0.6
0.567
0.4 0.4
0.300
0.2 0.2
0.100
0.0 0.0
5.0 7.5 10.0 12.5 15.0 17.5 20.0
Límites de clase
En la figura anterior se observa que 30% de las llamadas telefónicas duraron menos
de 8 minutos y 80% duraron menos de 14 minutos. De manera que 20% de las llama-
das fueron más largas que 14 minutos y así sucesivamente.
Ejemplo 1.26. Con los siguientes 40 datos de la tabla 1.10 construir el diagrama de tallo-hoja.
Tabla 1.10.
2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5
Solución:
Para hacer el diagrama de tallo-hoja, se separa cada observación en dos partes: una
para formar el tallo y otra para la hoja. En este caso, el tallo se forma con el dígito de
Capítulo 1 Estadística descriptiva | 19
los enteros, y la hoja con el dígito de los decimales. Por ejemplo, para el número 3.7,
el dígito 3 representa el tallo y el dígito 7 representa la hoja. El tallo de los datos del
ejemplo está formado por los números 1, 2, 3 y 4.
tallo
1.*
• Primero se forman los tallos con la parte entera de
2.*
los datos.
3.*
4.*
tallo hojas
• Después, se escriben las hojas.
1.*
Para el dato 2.2, se pone en el tallo 2, el decimal 2. 2.* 2
Para el dato 4.1, se pone en el tallo 4, el número 1,
3.*
etcétera.
4.* 1
tallo hojas
1.* 69
• El diagrama de tallo-hoja
2.* 26596
terminado queda así:
3.* 5270413817463913172482905
4.* 15734172
tallo hojas
1.* 69
• Finalmente, en cada clase se
2.* 25669
pueden ordenar los datos
3.* 0011112223334445567778899
4.* 11234577
Si en el diagrama se observa que en una clase hay muchos números, se puede ha-
cer un refinamiento, es decir, para cada elemento del tallo se forman dos diferentes
conjuntos de hojas. En el diagrama de tallo-hoja con dos tallos por clase se puede
representar de la siguiente manera: el primero con los dígitos del 0 al 4 y el segundo
con los dígitos del 5 al 9:
Frecuencia tallo hojas
2 *1 69
3 *2 2
7 *2 5669
15 *3 001111222333444
18 *3 5567778899
8 *4 11234
3 *4 577
1.6.2 Histograma
La manera más común de representación gráfica de los datos son los histogramas que consisten en rectángulos
adyacentes, cuyas alturas son las frecuencias de clases, mientras que sus bases se extienden entre sucesivas
20 | Estadística para ingeniería y ciencias
fronteras de clases. Esto quiere decir que cada barra tiene su base sobre la abscisa con centro en la marca de
clase y con la altura igual a la frecuencia de clase.
Ejemplo 1.27. Elaborar el histograma de los 500 casos de fosfatos agrupados en la siguiente tabla.
Tabla 1.11.
Intervalo
f f. r.(%) f. a. f. r. a. (%)
de clase
< 30.5 13 2.6 13 2.6
30.5 2 35.5 24 4.8 37 7.4
35.5 2 40.5 49 9.8 86 17.2
40.5 2 45.5 78 15.6 164 32.8
45.5 2 50.5 96 19.2 260 52.0
50.5 2 55.5 94 18.8 354 70.8
55.5 2 60.5 72 14.4 426 85.2
60.5 2 65.5 43 8.6 469 93.8
65.5 2 70.5 21 4.2 490 98.0
> 70.5 10 2.0 500 100.0
Solución:
25.5 30.5 35.5 40.5 45.5 50.5 55.5 60.5 65.5 70.5 85.5
Figura 1.3. H
istograma que muestra la distribución de frecuencias
de los datos de la tabla 1.11.
60 60
Capítulo 1 Estadística descriptiva | 21
Solución:
80 80
60
Frecuencia
60
40 40
20 20
0 0
20 30 40 50 60 70
Marca de clase
Definición 1.18. El diagrama de cajas es una representación gráfica que utiliza los valores extremos
y los cuartiles. La forma del diagrama de cajas se representa en la siguiente figura:
mín Q1 M Q3 máx
La distancia entre cada una de las medidas de posición está graduada a escala. Con este diagrama
se visualiza la posición, la dispersión y la simetría de los datos; la caja es un rectángulo que indica la
posición de la mitad de los datos centrales.
22 | Estadística para ingeniería y ciencias
0 1 2 3 4 5 6 7 8
• En la línea ubique la posición del mínimo, máximo, primer cuartil, tercer cuartil y mediana.
0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx
0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx
• Dibuje el diagrama.
0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx
Ejemplo 1.29. Encontrar el diagrama de cajas de los datos que se reportan en el diagrama de tallo-
hoja siguiente:
tallo hojas
1.* 69
2.* 25669
3.* 0011112223334445567778899
4.* 11234577
Capítulo 1 Estadística descriptiva | 23
Solución:
Primero se deben encontrar los valores extremos, los cuartiles y la mediana de estos
datos.
• Los valores extremos son mín 5 1.6 y máx 5 4.7.
• El número de datos es n 5 40.
(40 11)
• La posición de la mediana es 5 20.5.
2
(4031.411
) 3.4
• Entonces, la mediana es el promedio
M 5 2 de los5datos
3.4 que están en la posición 20 y 21.
2
(40 11) 3.4 1 3.4
(20 11) 5 3.4
2M 5 2
2
3.4 1 3.4
• El valor de m es: m 5 20. M 5 (20 11) 5 3.4
22
(20 11)
La posición de los cuartiles es 5 10.5.
2
3.1 1 3.1
El primer cuartil es Q1 5 5 3.1 .
2
3.8 1 3.9
El tercer cuartil es Q3 5 5 3.85 .
2
1.6.5 Simetría
Los histogramas y los diagramas de cajas permiten visualizar la distribución de los datos. Éstos pueden distri-
buirse o comportarse de manera simétrica alrededor del promedio, o pueden estar cargados a uno u otro lado
de la recta numérica; en este sentido la relación entre las tres medidas de centralidad más comunes: media
aritmética (o simplemente media), moda (la barra más alta) y mediana, con respecto a la simetría de los datos,
está dada en las siguientes gráficas:
24 | Estadística para ingeniería y ciencias
Mo Mo
M M
X
X
Figura 1.7. H
istogramas con diferentes sesgos y los diagramas de caja correspondientes
a cada histograma.
Ejemplo 1.30. Se tiene una muestra de tamaño 36 de análisis de fosfatos (PO423), reportados en la
tabla 1.12. Encuentre la media y la varianza de estos datos.
Tabla 1.12.
Valores de x 61 64 67 68 69 70 73
Frecuencia 5 8 4 3 4 7 5
Solución:
El total de datos en la muestra se obtiene sumando las frecuencias de todas las
clases.
5 1 8 1 4 1 3 1 4 1 7 1 5 5 36
Son 36 datos.
La media se obtiene sumando todos los datos y dividiendo el resultado de la
suma entre 36.
La suma de un mismo valor se puede abreviar con una multiplicación, así al sumar
los cinco datos, igual a 61, más los ocho datos, igual a 64, más, etcétera, se obtiene:
61 1 61 1 61 1 61 1 61 1 64 1 64 1 64 1 64 1 64 1 64 1 64 1 64 1 . . . 5 5(61)
1 8(64) 1 . . .