Está en la página 1de 7

Quevedo, H. y Pérez, B. (2014). Estadística para Ingeniería y Ciencias. México: Grupo Editorial Patria. Pp. 18-24.

Uso educativo
18  |  Estadística para ingeniería y ciencias

Gráfica de frecuencia relativa acumulada en función límites de clase


5.0 7.5 10.0 12.5 15.0 17.5 20.0
1.0 1.0
1.000

Frecuencia relativa acumulada 0.8 0.8


0.800

0.6 0.6
0.567
0.4 0.4

0.300
0.2 0.2

0.100
0.0 0.0
5.0 7.5 10.0 12.5 15.0 17.5 20.0

Límites de clase

Figura 1.2. Gráfica de la frecuencia relativa acumulada (ojiva)


contra los límites de clase.

En la figura anterior se observa que 30% de las llamadas telefónicas duraron menos
de 8 minutos y 80% duraron menos de 14 minutos. De manera que 20% de las llama-
das fueron más largas que 14 minutos y así sucesivamente.

1.6  Métodos gráficos


La representación gráfica de la distribución de frecuencia permite tener una mejor imagen de los datos. El
primer método gráfico revisado es el diagrama de tallo-hoja.

1.6.1  Diagrama de tallo-hoja


La manera más simple de explicar qué es un diagrama de tallo-hoja es con un ejemplo:

Ejemplo 1.26.  Con los siguientes 40 datos de la tabla 1.10 construir el diagrama de tallo-hoja.
Tabla 1.10.
2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5

Solución:
Para hacer el diagrama de tallo-hoja, se separa cada observación en dos partes: una
para formar el tallo y otra para la hoja. En este caso, el tallo se forma con el dígito de
Capítulo 1  Estadística descriptiva  |  19

los enteros, y la hoja con el dígito de los decimales. Por ejemplo, para el número 3.7,
el dígito 3 representa el tallo y el dígito 7 representa la hoja. El tallo de los datos del
ejemplo está formado por los números 1, 2, 3 y 4.
tallo
1.*
•  Primero se forman los tallos con la parte entera de
2.*
los datos.
3.*
4.*
tallo hojas
•  Después, se escriben las hojas.
1.*
Para el dato 2.2, se pone en el tallo 2, el decimal 2. 2.* 2
Para el dato 4.1, se pone en el tallo 4, el número 1,
3.*
etcétera.
4.* 1
tallo hojas
1.* 69
•  El diagrama de tallo-hoja
2.* 26596
terminado queda así:
3.* 5270413817463913172482905
4.* 15734172
tallo hojas
1.* 69
•  Finalmente, en cada clase se
2.* 25669
pueden ordenar los datos
3.* 0011112223334445567778899
4.* 11234577
Si en el diagrama se observa que en una clase hay muchos números, se puede ha-
cer un refinamiento, es decir, para cada elemento del tallo se forman dos diferentes
conjuntos de hojas. En el diagrama de tallo-hoja con dos tallos por clase se puede
representar de la siguiente manera: el primero con los dígitos del 0 al 4 y el segundo
con los dígitos del 5 al 9:
Frecuencia tallo hojas
2 *1 69
3 *2 2
7 *2 5669
15 *3 001111222333444
18 *3 5567778899
8 *4 11234
3 *4 577

1.6.2  Histograma
La manera más común de representación gráfica de los datos son los histogramas que consisten en rectángulos
adyacentes, cuyas alturas son las frecuencias de clases, mientras que sus bases se extienden entre sucesivas
20  |  Estadística para ingeniería y ciencias

fronteras de clases. Esto quiere decir que cada barra tiene su base sobre la abscisa con centro en la marca de
clase y con la altura igual a la frecuencia de clase.

Ejemplo 1.27.  Elaborar el histograma de los 500 casos de fosfatos agrupados en la siguiente tabla.

Tabla 1.11.

Intervalo
f f. r.(%) f. a. f. r. a. (%)
de clase
< 30.5 13 2.6 13 2.6
30.5 2 35.5 24 4.8 37 7.4
35.5 2 40.5 49 9.8 86 17.2
40.5 2 45.5 78 15.6 164 32.8
45.5 2 50.5 96 19.2 260 52.0
50.5 2 55.5 94 18.8 354 70.8
55.5 2 60.5 72 14.4 426 85.2
60.5 2 65.5 43 8.6 469 93.8
65.5 2 70.5 21 4.2 490 98.0
> 70.5 10 2.0 500 100.0

Solución:

25.5 30.5 35.5 40.5 45.5 50.5 55.5 60.5 65.5 70.5 85.5

Figura 1.3.  H
 istograma que muestra la distribución de frecuencias
de los datos de la tabla 1.11.

Gráfica de frecuencia vs. marca de clase


1.6.3  Polígonos de frecuencia
100 100
El polígono de frecuencia es una línea quebrada que une los puntos dados por marca de clase y frecuencia.
80 80
ecuencia

60 60
Capítulo 1  Estadística descriptiva  |  21

Ejemplo 1.28.  Encontrar el polígono de frecuencia de los datos de la tabla 1.11.

Solución:

Frecuencia vs. marca de clase


100 100

80 80

60
Frecuencia

60

40 40

20 20

0 0
20 30 40 50 60 70
Marca de clase

Figura 1.4.  Polígono de frecuencia de los datos de la tabla 1.11.

1.6.4  Diagrama de cajas

Definición 1.18.  El diagrama de cajas es una representación gráfica que utiliza los valores extremos
y los cuartiles. La forma del diagrama de cajas se representa en la siguiente figura:

mín Q1 M Q3 máx

Figura 1.5  Diagramas de caja.

La distancia entre cada una de las medidas de posición está graduada a escala. Con este diagrama
se visualiza la posición, la dispersión y la simetría de los datos; la caja es un rectángulo que indica la
posición de la mitad de los datos centrales.
22  |  Estadística para ingeniería y ciencias

Para elaborar la gráfica de cajas siga los pasos:


• Dibuje una línea horizontal y gradúela.

0 1 2 3 4 5 6 7 8

• En la línea ubique la posición del mínimo, máximo, primer cuartil, tercer cuartil y mediana.

0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx

• Dibuje las líneas auxiliares.

0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx

• Dibuje el diagrama.

0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx

Ejemplo 1.29. Encontrar el diagrama de cajas de los datos que se reportan en el diagrama de tallo-
hoja siguiente:
tallo hojas
1.* 69
2.* 25669
3.* 0011112223334445567778899
4.* 11234577
Capítulo 1  Estadística descriptiva  |  23

Solución:
Primero se deben encontrar los valores extremos, los cuartiles y la mediana de estos
datos.
• Los valores extremos son mín 5 1.6 y máx 5 4.7.
• El número de datos es n 5 40.
(40 11)
• La posición de la mediana es 5 20.5.
2
(4031.411
) 3.4
• Entonces, la mediana es el promedio
M 5 2 de los5datos
3.4 que están en la posición 20 y 21.
2
(40 11) 3.4 1 3.4
(20 11) 5 3.4
2M 5 2
2
3.4 1 3.4
• El valor de m es: m 5 20. M 5 (20 11) 5 3.4
22
(20 11)
La posición de los cuartiles es 5 10.5.
2

3.1 1 3.1
El primer cuartil es Q1 5 5 3.1 .
2

3.8 1 3.9
El tercer cuartil es Q3 5 5 3.85 .
2

• Después, elabore la gráfica.

1.6 3.1 3.4 3.85 4.7

Figura 1.6.  Diagrama de cajas de los datos de este ejercicio.

1.6.5  Simetría
Los histogramas y los diagramas de cajas permiten visualizar la distribución de los datos. Éstos pueden distri-
buirse o comportarse de manera simétrica alrededor del promedio, o pueden estar cargados a uno u otro lado
de la recta numérica; en este sentido la relación entre las tres medidas de centralidad más comunes: media
aritmética (o simplemente media), moda (la barra más alta) y mediana, con respecto a la simetría de los datos,
está dada en las siguientes gráficas:
24  |  Estadística para ingeniería y ciencias

Mo Mo

M M
X
X

Oblicua a la derecha Simétrica Oblicua a la izquierda


sesgo positivo sesgo cero sesgo negativo
media > mediana > moda media = mediana = moda media < mediana < moda

Oblicua a la derecha Simétrica Oblicua a la izquierda

Figura 1.7.  H
 istogramas con diferentes sesgos y los diagramas de caja correspondientes
a cada histograma.

1.7  Media y varianza con datos agrupados


Cuando se tienen los datos agrupados en una tabla de frecuencia se puede calcular la media y la varianza con
las fórmula antes dadas.

Ejemplo 1.30. Se tiene una muestra de tamaño 36 de análisis de fosfatos (PO423), reportados en la
tabla 1.12. Encuentre la media y la varianza de estos datos.
Tabla 1.12.
Valores de x 61 64 67 68 69 70 73
Frecuencia 5 8 4 3 4 7 5

Solución:
El total de datos en la muestra se obtiene sumando las frecuencias de todas las
clases.
5 1 8 1 4 1 3 1 4 1 7 1 5 5 36
Son 36 datos.
La media se obtiene sumando todos los datos y dividiendo el resultado de la
suma entre 36.
La suma de un mismo valor se puede abreviar con una multiplicación, así al sumar
los cinco datos, igual a 61, más los ocho datos, igual a 64, más, etcétera, se obtiene:
61 1 61 1 61 1 61 1 61 1 64 1 64 1 64 1 64 1 64 1 64 1 64 1 64 1 . . . 5 5(61)
1 8(64) 1 . . .

También podría gustarte