Está en la página 1de 13

1

Ing. Armando Duarte

Introducción a la Estadística Descriptiva

Febrero de 2022

Presentación grafica de los Datos:

La estadística descriptiva puede dividirse en dos grandes áreas:

a. Métodos Gráficos y
b. Métodos Numéricos

Presentaremos varias técnicas graficas para mostrar y resumir datos, luego se


presentarán varios métodos numéricos.

Diagramas de puntos y diagramas de tallo y hoja

Montgomery (1991) describe un experimento en el que un ingeniero agrega un


polímero de látex a un mortero de cemento portland, para determinar los efectos
del polímero sobre la resistencia a la tensión en (𝐾𝑔𝑓⁄𝑐𝑚2 ). Los datos obtenidos
en este experimento son:

𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 1 2 3 4 5 6 7 8 9 10
(𝐾𝑔𝑓 ⁄𝑐𝑚2 ) 16.85 16.40 17.21 16.35 16.52 17.04 16.96 17.15 16.59 16.57

En la Figura 1, se muestran estos datos en un diagrama de puntos.


2
Ing. Armando Duarte

Figura 1. Diagrama de puntos para la resistencia a la tensión de un mortero de


cemento portland modificado.

El diagrama de puntos es una gráfica muy útil para visualizar un conjunto


pequeño de datos, de unas 20 observaciones. La grafica permite ver con rapidez
y facilidad la ubicación o tendencia central de los datos, así como su
dispersión o variabilidad. La parte media de los datos está muy próxima a
16.8 y que los valores de resistencia a la tensión caen dentro del intervalo
definido por los valores 16.3 y 17.2 𝐾𝑔𝑓 ⁄𝑐𝑚2 .

Con frecuencia, los diagramas de puntos son útiles al comparar dos o mas
conjuntos de datos. Por ejemplo, los siguientes diez datos de resistencia a la
tensión de un mortero portland sin modificar

𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 1 2 3 4 5 6 7 8 9 10
(𝐾𝑔𝑓 ⁄𝑐𝑚2 ) 17.50 17.63 18.25 18.00 17.86 17.75 18.22 17.90 17.96 18.15

El diagrama de puntos de la Figura 2, muestra los dos conjuntos de mediciones


de resistencia a la tensión, donde los puntos solidos del grupo 1 corresponden al
mortero modificado y los del grupo 2 al mortero no modificado.
3
Ing. Armando Duarte

Figura 2. Diagrama de puntos para los datos de resistencia a la tensión de los


grupos de un mortero de cemento portland modificado y otro sin modificación.

El diagrama de puntos, revela de inmediato que el mortero modificado parece


tener una menor resistencia a la tensión, pero que la variabilidad inherente a
ambos grupos de mediciones es la misma.

Considérese los datos de la tabla 1, los cuales representan la resistencia a la


tensión, en libras por pulgada cuadrada (𝑝𝑠𝑖) de 80 muestras de una nueva
aleación de aluminio y litio, que esta siendo evaluada como posible material para
la fabricación de elementos estructurales de aeronaves. Los datos fueron
registrados conforme se realizaba la prueba, y en este formato no conlleva mucha
información con respecto a la resistencia a la tensión.

No es fácil responder a preguntas como ¿Qué porcentaje de las muestras fallaron


bajo 120 𝑝𝑠𝑖? Debido que se tienen muchas observaciones, la construcción de un
diagrama de puntos para estos datos es ineficiente; existen presentaciones
visuales mas eficaces para conjuntos de datos grandes.
4
Ing. Armando Duarte

105 221 183 186 121 181 180 143


97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149

Tabla 1. Resistencia a la tensión de 80 muestras de aleación de aluminio-litio.

El diagrama de tallo y hoja es una buena manera de obtener una representación


visual informativa del conjunto de datos 𝑥1 , 𝑥2 , … , 𝑥𝑛 Lo usual es seleccionar
entre 5 y 20 tallos, en general debe escogerse un numero pequeño de tallos en
comparación con el número de observaciones, una vez elegido el conjunto de
tallos, estos se enlistan en la parte izquierda del diagrama, al lado derecho se
ponen las hojas que corresponden a los valores observados, ordenados tal como
se encuentra en el conjunto de datos.
5
Ing. Armando Duarte

Tallo Hoja Frecuencia


7 6 1
8 7 1
9 7 1
10 5 1 2
11 5 8 0 3
12 1 0 3 3
13 4 1 3 5 3 5 6
14 2 9 5 8 3 1 6 9 8
15 4 7 1 3 4 0 8 8 6 8 0 8 12
16 3 0 7 3 0 5 0 8 7 9 10
17 8 5 4 4 1 6 2 1 0 6 10
18 0 3 6 1 4 1 0 7
19 9 6 0 9 3 4 6
20 7 1 0 8 4
21 8 1
22 1 8 9 3
23 7 1
24 5 1

Tabla 2. Diagrama de Tallo y hoja para los datos de resistencia a la tensión de


la Tabla 1.
6
Ing. Armando Duarte

La inspección rápida de esta gráfica, revela de inmediato que la mayor parte de


los valores de resistencia a la tensión se encuentran entre 110 y 200 psi, y que el
valor central está en algún punto entre 150 y 160 psi. Por otra parte, las
resistencias están distribuidas casi simétricamente alrededor del valor central.

Distribución de Frecuencias e Histogramas

La distribución de frecuencias ofrece un resumen mas compacto de los datos que


el diagrama de tallo y hoja. Para construir una distribución de frecuencias,
primero se divide el rango de los datos en intervalos, los cuales se conocen como
intervalos de clase o celdas. Si es posible las clases deben tener el mismo ancho
con la finalidad de mejorar la información visual en la distribución de
frecuencias.

Intervalo de clase Frecuencia Frecuencia Relativa Frecuencia Relativa


(𝑝𝑠𝑖) acumulativa
70 ≤ 𝑥 < 90 2 0.0250 0.0250
90 ≤ 𝑥 < 110 3 0.0375 0.0625
110 ≤ 𝑥 < 130 6 0.0750 0.1375
130 ≤ 𝑥 < 150 14 0.1750 0.3125
150 ≤ 𝑥 < 170 22 0.2750 0.5875
170 ≤ 𝑥 < 190 17 0.2125 0.8000
190 ≤ 𝑥 < 210 10 0.1250 0.9250
210 ≤ 𝑥 < 230 4 0.0500 0.9750
230 ≤ 𝑥 < 250 2 0.0250 1.0000
7
Ing. Armando Duarte

El número de clases depende del numero de observaciones y de la dispersión de


los datos. Resulta satisfactorio, utilizar entre 5 y 20 clases, y que el numero de

clases debe aumentar en función de 𝑛. En la practica se obtienen buenos


resultados si se hace la selección del numero de clases aproximadamente igual a
la raíz cuadrada del número de observaciones.

Es muy fácil ver que la mayor parte de las muestras tienen una resistencia a la
tensión entre 130 y 190 psi. Y que el 97.5 % de ellas están por debajo de 230 psi
también es útil representar la distribución de frecuencias en forma gráfica, esta
grafica recibe el nombre de histograma.

Figura 3. Histograma de resistencia a la tensión, correspondiente a


80 muestras de aluminio-litio
8
Ing. Armando Duarte

Ejercicios Propuestos

1. Se toman ocho mediciones del diámetro interno de los anillos para los
pistones del motor de un automóvil. Los datos en (𝑚𝑚) son 74.001, 74.003,
74.015, 74.000, 74.005, 74.002, 74.005 y 74.004. construya un diagrama de
puntos y haga comentarios con respecto a los datos.

2. En su obra Applied Life Data Analysis (Wiley, 1982), Wayne Nelson


presenta el tiempo de ruptura de un fluido aislante entre electrodos de
34 kV. Los tiempos en minutos son los siguientes: 0.19, 0.78, 0.96, 1.31,
2.78, 3.16, 4.15, 4.67, 4.85, 6.50, 7.35, 8.01, 8.27, 12.06, 31.75, 32.52, 33.91,
36.71 y 72.89 construya un diagrama de puntos para estos datos.

3. El ejemplar de enero de 1990 de Arizona Trend contiene un suplemento


que describe los doce mejores campos de golf de Arizona, Estados Unidos.
La longitud en yardas de los campos es: 6981, 7099, 6930, 6992, 7518,
7100, 6935, 7518, 7013, 6800, 7041 y 6890. Construya un diagrama de
puntos para estos datos.

4. Un articulo del Journal of Structural Enginneering (Vol. 115, 1989)


describe un experimento para probar la resistencia de tubos circulares con
tapas soldadas en los extremos. Los primeros resultados obtenidos en kN
son los siguientes: 96, 96, 102, 102, 102, 104,104, 108, 126,126, 128,128,
140, 156, 160,160, 164 y 170. Construya un diagrama de puntos para estos
datos.
9
Ing. Armando Duarte

5. Un articulo publicado en Human Factors (junio 1989) presenta datos de


acomodamiento visual (una función del movimiento del ojo) cuando se
reconoce un patrón de manchas sobre la pantalla de un tubo de rayos
catódicos de alta resolución. Los datos son: 36,45,67,90, 38.77, 42.18,
26.72, 50.77, 39.30 y 49.71. Construya un diagrama de puntos para estos
datos.

6. Los datos siguientes son mediciones de la intensidad solar directa


(𝑊𝑎𝑡𝑡⁄𝑚2 ) realizadas en distintos días en una localidad del sur de
España: 562, 869, 708, 775, 775, 704, 809, 856, 655, 806, 878, 909, 918,
558, 768, 870, 918, 940, 946, 661, 820, 898, 935, 952, 957, 693, 835, 905,
939, 955, 960, 498, 653, 730 y 753. Construya un histograma para estos
datos.

7. Un articulo publicado en Technometrics (Vol.19, 1977, pag.425) presenta


los datos siguientes sobre el octanaje de varias mezclas de gasolina.

88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 96.5 93.3
94.7 91.1 91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7
84.3 86.7 88.2 90.8 88.3 98.8 94.2 92.7 93.2 91.0
90.1 93.4 88.5 90.1 89.2 88.3 85.3 87.9 88.6 90.9
89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
89.8 89.6 87.4 88.4 88.9 91.2 89.3 94.4 92.7 91.8
91.6 90.4 91.1 92.6 89.8 90.6 91.1 90.4 89.3 89.7
90.3 91.6 90.5 93.7 92.7 92.2 92.2 91.2 91.0 92.2
90.0 90.7

Construya un diagrama de tallo y hoja para estos datos.


10
Ing. Armando Duarte

8. Los datos siguientes representan el número de ciclos transcurridos hasta


que se presenta una falla en una prueba de piezas de aluminio sujetas a
un esfuerzo alternante repetido de 21 000 psi, a 18 ciclos por segundo

1115 1567 1223 1782 1055 798 1016 2100 910 1501
1310 1883 375 1522 1764 1020 1102 1594 1730 1238
1540 1203 2265 1792 1330 865 1605 2023 1102 990
1502 1270 1910 1000 1608 2130 706 1315 1578 1468
1258 1015 1018 1820 1535 1421 2215 1269 758 1512
1315 845 1452 1940 1781 1109 785 1260 1416 1750
1085 1674 1890 1120 1750 1481 885 1888 1560 1642

a. Construya un diagrama de tallo y hoja para visualizar estos datos.


b. ¿Existe evidencia de que alguna pieza “sobrevivirá” más allá de los
2000 ciclos? Justifique su respuesta.

9. La siguiente tabla muestra el porcentaje de algodón en un material


utilizado para la fabricación de camisas para caballeros. Construya un
diagrama de tallo y hojas para visualizar estos datos

34.2 33.6 33.8 34.7 37.8 32.6 35.8 34.6


33.1 34.7 34.2 33.6 36.6 33.1 37.6 33.6
34.5 35.0 33.4 32.5 35.4 34.6 37.3 34.1
35.6 35.4 34.7 34.1 34.6 35.9 34.6 34.7
36.3 36.2 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.8 35.2 36.8 37.1 33.6 32.8 36.8
34.7 35.1 35.0 37.9 34.0 32.9 32.1 34.3
33.6 35.3 34.9 36.4 34.1 33.5 34.5 32.7
11
Ing. Armando Duarte

10. Los siguientes datos representan el rendimiento de 90 lotes consecutivos


de un sustrato cerámico, en el que se ha aplicado un recubrimiento
metálico mediante un proceso de deposición por vapor. Construya un
diagrama de tallo y hojas para visualizar estos datos

94.1 87.3 94.1 92.4 84.6 85.4


93.2 84.1 92.1 90.6 83.6 86.6
90.6 90.1 96.4 89.1 85.4 91.7
91.4 95.2 88.2 88.8 89.7 87.5
88.2 86.1 86.4 86.4 87.6 84.2
86.1 94.3 85.0 85.1 85.1 85.1
95.1 93.2 84.9 84.0 89.6 90.5
90.0 86.7 78.3 93.7 90.0 95.6
92.4 83.0 89.6 87.7 90.1 88.3
87.3 95.3 90.3 90.6 94.3 84.1
86.6 94.1 93.1 89.4 97.3 83.7
91.2 97.8 94.6 88.6 96.8 82.9
86.1 93.1 96.3 84.1 94.4 87.3
90.4 86.4 94.7 82.6 96.1 86.4
89.1 87.6 91.1 83.1 98.0 84.5

11. Construya una distribución de frecuencias y un histograma para los datos


del octanaje del ejercicio 7.

12. Construya una distribución de frecuencias y un histograma para los datos


de fallas del ejercicio 8.
12
Ing. Armando Duarte

13. Construya una distribución de frecuencias y un histograma para los datos


del contenido de algodón del ejercicio 9.

14. Construya una distribución de frecuencias y un histograma para los datos


de rendimiento del ejercicio 10.

15. Construya una distribución de frecuencias y un histograma con 16 clases


para los datos del octanaje del ejercicio 7. Compare la forma del
histograma con la que tiene el ejercicio 11 donde se emplearon 8 clases.
¿los histogramas presentan información similar?

16. Diagrama de Pareto: una variación importante de un histograma para


datos categóricos es el diagrama de Pareto. Este diagrama tiene un empleo
muy amplio en los esfuerzos por incrementar la calidad, y las categorías
usualmente representan tipos distintos de defectos, modos de falla o
problemas con el producto o el proceso. Las categorías están ordenadas de
modo que en la parte izquierda aparezca la categoría con mayor
frecuencia, seguida por la categoría que tiene la segunda mayor frecuencia
y, así sucesivamente.

En general exhiben la ley de Pareto, esto es, la mayor parte de los defectos
aparece solo en unas cuantas categorías. El grupo minoritario del 20 %
posee el 80 % del fenómeno de los defectos o fallas.
13
Ing. Armando Duarte

Suponga que se tiene la siguiente información sobre defectos estructurales


en las puertas de un automóvil:

• Abolladuras 4
• Picaduras 4
• Partes ensambladas fuera de secuencia 6
• Partes suba justadas 21
• Falta de agujeros o ranuras 8
• Partes no lubricadas 5
• Partes fuera de contorno 30
• Partes con rebabas 3

Construya un diagrama de Pareto e interprétela.

Observación: Este tipo de diagramas llevan el nombre del economista


Italiano Vilfredo Pareto, los diagramas de Pareto y Dispersión, son
herramientas claves de evaluación y control de mantenimiento, donde se
realiza un control estadístico de las fallas ocurridas en un periodo de
análisis, el cual normalmente tiene una frecuencia mensual y es parte del
informe de gestión de la unidad de mantenimiento.

Figura 4. Vilfredo Pareto (1848 − 1923)

También podría gustarte