Está en la página 1de 77

Muestreo y estadística descriptiva

Emigdio Z.Flores López

2018

Instituto
Tecnologico de
Tijuana
Contenido I

1. Introducción

2. Muestreo

3. Resumen estadís co

4. Resúmenes gráficos

1 62
Introducción
Introducción
Generalidades

· En la probabilidad se razona a par r de la población a la muestra.


· En la estadís ca, el razonamiento parte de la muestra para llegar al conocimiento de toda la
población.

3 62
Introducción
Métodos estadís cos - idea básica
Ejemplo

Considere una máquina que hace varillas de acero para su uso en disposi vos óp cos de
almacenamiento. La especificación del diámetro de las varillas es 0.45 ± 0.02 cm. En la úl ma hora, la
máquina ha hecho mil varillas. El ingeniero que supervisa la calidad quiere saber cuántas de estas
varillas sa sfacen la especificación. En este contexto, toma una muestra aleatoria de 50 varillas, las
mide y encuentra que 46 de éstas (92 %) sa sfacen la especificación del diámetro.

4 62
Introducción
Métodos estadís cos - idea básica
Ejemplo

Considere una máquina que hace varillas de acero para su uso en disposi vos óp cos de
almacenamiento. La especificación del diámetro de las varillas es 0.45 ± 0.02 cm. En la úl ma hora, la
máquina ha hecho mil varillas. El ingeniero que supervisa la calidad quiere saber cuántas de estas
varillas sa sfacen la especificación. En este contexto, toma una muestra aleatoria de 50 varillas, las
mide y encuentra que 46 de éstas (92 %) sa sfacen la especificación del diámetro.

1. El ingeniero necesita calcular la magnitud de la diferencia probable entre las proporciones de la


muestra y de la población. ¿Qué tan grande es una diferencia pica para esta clase de muestra?
2. Después de que ha observado que 92 % de las varillas de la muestra estaba bien, indicará los
porcentajes de las varillas aceptables en la población como un intervalo de la forma 92 % ± x %,
donde x es un número calculado para tener una confianza razonable de que los porcentajes
reales de la población están en este intervalo. ¿Cómo se debe calcular x?
3. Por úl mo, quiere estar muy seguro de que el porcentaje de varillas buenas es de al menos 90 %;
en otro caso detendrá el proceso para recalibrarlo. ¿Qué seguridad puede tener de que al menos
90 % de las mil varillas está bien?
4 62
Muestreo
Muestreo
Generalidades

· Una población representa la colección completa de elementos o resultados de la información


buscada.
· Una muestra cons tuye un subconjunto de una población, que con ene elementos o resultados
que realmente se observan.
· Una muestra aleatoria simple de tamaño n es una muestra elegida por un método en el que cada
colección de n elementos de la población ene la misma probabilidad de formar la muestra, de la
misma manera que en una lotería.

6 62
Muestreo
Ejemplo

Una maestra de educación sica quiere estudiar los niveles de condición sica de los estudiantes en
su universidad. Hay 20000 estudiantes inscritos y desea tomar una muestra de tamaño 100 para
hacerles una prueba de sus condiciones sicas. Ob ene una lista de todos los estudiantes, numerada
del 1 al 20000. Usa un generador de números aleatorios de la computadora que genera 100 enteros
aleatorios entre el total de números y después invita a los 100 estudiantes, a quienes corresponden
dichos números, a que par cipen en el estudio. ¿Ésta es una muestra aleatoria simple?

7 62
Muestreo
Ejemplo

Una maestra de educación sica quiere estudiar los niveles de condición sica de los estudiantes en
su universidad. Hay 20000 estudiantes inscritos y desea tomar una muestra de tamaño 100 para
hacerles una prueba de sus condiciones sicas. Ob ene una lista de todos los estudiantes, numerada
del 1 al 20000. Usa un generador de números aleatorios de la computadora que genera 100 enteros
aleatorios entre el total de números y después invita a los 100 estudiantes, a quienes corresponden
dichos números, a que par cipen en el estudio. ¿Ésta es una muestra aleatoria simple?

Solución
Sí, ésta es una muestra aleatoria simple.

7 62
Muestreo
Ejemplo

Una ingeniero que supervisa la calidad quiere inspeccionar rollos de papel tapiz para obtener
información acerca de la tasa de fallas que ene la imprenta. Decide tomar una muestra de 50 rollos
de la producción de un día. Cada hora durante cinco horas, toma los diez úl mos rollos producidos y
cuenta el número de fallas de cada uno. ¿Ésta es una muestra aleatoria simple?

8 62
Muestreo
Ejemplo

Una ingeniero que supervisa la calidad quiere inspeccionar rollos de papel tapiz para obtener
información acerca de la tasa de fallas que ene la imprenta. Decide tomar una muestra de 50 rollos
de la producción de un día. Cada hora durante cinco horas, toma los diez úl mos rollos producidos y
cuenta el número de fallas de cada uno. ¿Ésta es una muestra aleatoria simple?

Solución
No. No todo subconjunto de 50 rollos de papel tapiz ene la misma probabilidad de pertenecer a la
muestra.

8 62
Figura 1: Tres gráficas de valores observados contra el orden en que se hicieron.

9 62
Muestreo
Tipos de poblaciones

· Población tangible. Este po de poblaciones son siempre finitas. Después de que se muestrea un
elemento, el tamaño de población disminuye en 1. En principio, uno podría en algunos casos
regresar el elemento muestreado a la población, con oportunidad de muestrearlo nuevamente,
pero esto rara vez se hace en la prác ca. Estas poblaciones constan de elementos sicos reales:
estudiantes de una universidad, bloques de concreto de una pila, pernos de una remesa, etc.
· Población conceptual. Una muestra aleatoria simple puede consis r de valores obtenidos en un
proceso en condiciones experimentales idén cas. En este caso, la muestra proviene de una
población que consta de todos los valores posibles que se han observado.

10 62
Muestreo
Ejemplo

Un geólogo pesa una roca varias veces en una balanza analí ca. Cada vez, la balanza da una lectura
ligeramente diferente. ¿Bajo qué condiciones se pueden considerar estas lecturas como una muestra
aleatoria simple? ¿Cuál es la población?

11 62
Muestreo
Ejemplo

Un geólogo pesa una roca varias veces en una balanza analí ca. Cada vez, la balanza da una lectura
ligeramente diferente. ¿Bajo qué condiciones se pueden considerar estas lecturas como una muestra
aleatoria simple? ¿Cuál es la población?

Solución
Si las caracterís cas sicas de la balanza permanecen iguales cada vez que se pesa, se puede
considerar que las mediciones se hacen bajo condiciones idén cas, entonces las lecturas se pueden
considerar como una muestra aleatoria simple. La población es conceptual. Consta de todas las
lecturas que la balanza en principio podría producir.

11 62
Muestreo
Independencia

· Los elementos en una muestra son independientes si el conocimiento de algunos de los valores
de los elementos no ayuda a predecir los valores de los otros.
· Los elementos en una muestra aleatoria simple se pueden tratar como independientes en
muchos casos que se encuentran en la prác ca. Ocurre una excepción cuando la población es
finita y la muestra consiste de una parte importante (más de 5 %) de la población.

12 62
Muestreo
Procedimientos de muestreo

1. Probabilis co
· Aleatorio con y sin remplazo. Es aquel en que el proceso de selección de la muestra garan za que todas
las muestras posibles por obtener de la población pueden tener la misma probabilidad de ser elegidas.

13 62
Muestreo
Procedimientos de muestreo

1. Probabilis co
· Aleatorio con y sin remplazo. Es aquel en que el proceso de selección de la muestra garan za que todas
las muestras posibles por obtener de la población pueden tener la misma probabilidad de ser elegidas.
· Por conglomerados. La población se divide en áreas que se llaman conglomerados, cada uno de estos
sera lo mas heterogéneo posible internamente y lo mas homogéneo entre si.

13 62
Muestreo
Procedimientos de muestreo

1. Probabilis co
· Aleatorio con y sin remplazo. Es aquel en que el proceso de selección de la muestra garan za que todas
las muestras posibles por obtener de la población pueden tener la misma probabilidad de ser elegidas.
· Por conglomerados. La población se divide en áreas que se llaman conglomerados, cada uno de estos
sera lo mas heterogéneo posible internamente y lo mas homogéneo entre si.
· Estra ficado. La población se divide en estratos homogéneos internamente y lo mas heterogéneos
externamente entre si.

13 62
Muestreo
Procedimientos de muestreo

1. Probabilis co
· Aleatorio con y sin remplazo. Es aquel en que el proceso de selección de la muestra garan za que todas
las muestras posibles por obtener de la población pueden tener la misma probabilidad de ser elegidas.
· Por conglomerados. La población se divide en áreas que se llaman conglomerados, cada uno de estos
sera lo mas heterogéneo posible internamente y lo mas homogéneo entre si.
· Estra ficado. La población se divide en estratos homogéneos internamente y lo mas heterogéneos
externamente entre si.
· Sistemá co. En este caso se divide la población en subconjuntos de tamaño n; a con nuación, se toma
al azar un elemento del primer grupo que ocupa el lugar k y el resto de los elementos de la muestra
ocupan los lugares:
N N
k + , k + 2 , k, . . . (1)
n n

13 62
Muestreo
Procedimientos de muestreo

1. Probabilis co
· Aleatorio con y sin remplazo. Es aquel en que el proceso de selección de la muestra garan za que todas
las muestras posibles por obtener de la población pueden tener la misma probabilidad de ser elegidas.
· Por conglomerados. La población se divide en áreas que se llaman conglomerados, cada uno de estos
sera lo mas heterogéneo posible internamente y lo mas homogéneo entre si.
· Estra ficado. La población se divide en estratos homogéneos internamente y lo mas heterogéneos
externamente entre si.
· Sistemá co. En este caso se divide la población en subconjuntos de tamaño n; a con nuación, se toma
al azar un elemento del primer grupo que ocupa el lugar k y el resto de los elementos de la muestra
ocupan los lugares:
N N
k + , k + 2 , k, . . . (1)
n n
2. Intencional

13 62
Muestreo
Tipos de experimentos

1. Una-muestra. Hay sólo una población de interés y se extrae únicamente una muestra de ésta.
2. Muestras-mul ples. Hay dos o más poblaciones de interés y se toma una muestra de cada
población.
3. Factoriales. En muchos experimentos de muestras-múl ples, las poblaciones se dis nguen entre
sí al cambiar uno o más factores que pueden afectar el resultado.

14 62
Muestreo
Tipos de datos
1. Numérico o cuan ta vo.
2. Categóricos o cuali vos.

Ejemplo

Muestra Par de torsion (kN· m) Posición de falla


1 165 Soldadura
2 237 Viga
3 222 Viga
4 255 Viga
5 194 Soldadura

¿Qué datos son numéricos y cuáles categóricos?

15 62
Muestreo
Tipos de datos
1. Numérico o cuan ta vo.
2. Categóricos o cuali vos.

Ejemplo

Muestra Par de torsion (kN· m) Posición de falla


1 165 Soldadura
2 237 Viga
3 222 Viga
4 255 Viga
5 194 Soldadura

¿Qué datos son numéricos y cuáles categóricos?

Solución
Los pares de torsión, en la columna de en medio, son datos numéricos. Las posiciones de la falla, en la
columna de la derecha, son datos categóricos.
15 62
Muestreo– Ejercicios
Ejercicio 1

Cada uno de los siguientes procesos implica el muestreo de una población. Defina la población y diga
si es tangible o conceptual.

a) Se recibe una remesa de pernos de un distribuidor. Para verificar si la remesa es aceptable


respecto de la fuerza de corte, un ingeniero selecciona diez pernos, uno tras otro, del recipiente
para probarlos.
b) La resistencia de cierto resistor se mide cinco veces con el mismo óhmetro.
c) Un estudiante de posgrado que se especializa en ciencia ambiental forma parte de un equipo de
estudio que está evaluando el riesgo para la salud humana de cierto contaminante presente en el
agua de la llave en su pueblo. Una parte del proceso de evaluación implica calcular la can dad de
empo que las personas que viven en ese pueblo está en contacto con el agua de la llave. El
estudiante convence a los residentes del pueblo para que lleven una agenda mensual, detallando
la can dad de empo que están en contacto con el agua de la llave día con día.
d) Se hacen ocho soldaduras con el mismo proceso y se mide la fuerza en cada una.

16 62
Muestreo– Ejercicios
Ejercicio 2

Verdadero o falso:

a) Una muestra aleatoria simple garan za que refleja exactamente a la población de la que se
extrajo.
b) Una muestra aleatoria simple está libre de cualquier tendencia sistémica en diferir de la
población de la que se extrajo.

17 62
Muestreo– Ejercicios
Ejercicio 3

Se ha usado durante mucho empo un proceso para la fabricación de botellas de plás co y se sabe
que 10 % de éstas se encuentra defectuoso. Se está probando un nuevo proceso que, se supone,
reduce la proporción de defectos. En una muestra aleatoria simple de 100 botellas producidas con el
nuevo proceso, diez estaban defectuosas.

a) Uno de los ingenieros sugiere que la prueba demuestra que el nuevo proceso no es mejor que el
proceso anterior, ya que la proporción de defectos es la misma. ¿Es ésta una conclusión
jus ficada? Explique.
b) Suponga que hubieran sido solamente nueve las botellas defectuosas de la muestra de 100.
¿Esto habría probado que el nuevo proceso es mejor? Explique.
c) ¿Qué resultado presenta pruebas más evidentes de que el nuevo proceso es mejor: encontrar
nueve botellas defectuosas en la muestra o encontrar dos botellas defectuosas en la muestra?

18 62
Resumen estadís co
Resumen estadís co
Media muestral o media aritmé ca

Sea X1 , . . . , Xn una muestra. La media muestral es

1∑
n
X= Xi (2)
n i=1

20 62
Resumen estadís co
Ejemplo

Una muestra aleatoria simple de cinco hombres se elige de entre una gran población de hombres y se
mide su estatura. Las cinco cifras de estatura (en pulgadas) son 65.51, 72.30, 68.31, 67.05 y 70.68.
Encuentre la media muestral.

21 62
Resumen estadís co
Ejemplo

Una muestra aleatoria simple de cinco hombres se elige de entre una gran población de hombres y se
mide su estatura. Las cinco cifras de estatura (en pulgadas) son 65.51, 72.30, 68.31, 67.05 y 70.68.
Encuentre la media muestral.

Solución
Usamos la ecuación 2. La media muestral es
1
X= (65.51 + 72.30 + 68.31 + 67.05 + 70.68) = 68.77 pulgadas
5

21 62
Resumen estadís co
Varianza muestral y desviación estándar muestral

Sea X1 , . . . , Xn una muestra. La varianza muestral es la can dad

1 ∑
n
s2 = (Xi − X)2 (3)
n − 1 i=1

Sea X1 , . . . , Xn una muestra. La desviación estándar es la can dad


v
u
u 1 ∑ n
s=t (Xi − X)2 (4)
n − 1 i=1

22 62
Resumen estadís co
Ejemplo

Encuentre la varianza muestral y la desviación estándar muestral para los datos de las estaturas del
ejemplo anterior.

23 62
Resumen estadís co
Ejemplo

Encuentre la varianza muestral y la desviación estándar muestral para los datos de las estaturas del
ejemplo anterior.

Solución
Primero se calculará la varianza muestral usando la ecuación 3. La media muestral es X = 68.77. La
varianza muestral es, por lo tanto
1
s2 = [(65.51−68.77)2 +(72.30−68.77)2 +(68.31−68.77)2 +(67.05−68.77)2 +(70.68−68.77)2 ] = 7.47665
4
La desviación estándar muestral es la raíz cuadrada de la varianza muestral:

s = 7.47665 = 2.73

23 62
Resumen estadís co
Datos a picos

A veces una muestra puede contener algunos puntos que son mucho más grandes o pequeños que el
resto. Estos puntos se llaman datos a picos.

Figura 2: Conjunto de datos que con ene un dato a pico.

24 62
Resumen estadís co
Mediana muestral

Si n números están ordenados del más pequeño al más grande:


n+1
· Si n es impar, la mediana muestral es el número en la posición 2
n
· Si n es par, la mediana muestral representa el promedio de los números en las posiciones 2
y
n
2
+ 1.

25 62
Resumen estadís co
Ejemplo

Encuentre la mediana muestral para los datos de la estatura en el ejemplo anterior.

26 62
Resumen estadís co
Ejemplo

Encuentre la mediana muestral para los datos de la estatura en el ejemplo anterior.

Solución
Las cifras de los cinco casos de estatura, en orden creciente, son 65.51, 67.05, 68.31, 70.68, 72.30. La
mediana muestral es el número de en medio, que es 68.31.

Figura 3: Cuando una muestra con ene datos a picos, la mediana podría ser más representa va de la muestra que
la media.

26 62
Resumen estadís co
Moda y rango

· Moda. La moda muestral es el valor que ene más frecuencia en una muestra. Si algunos valores
enen una frecuencia igual, cada uno representa una moda.
· Rango. El rango es la diferencia entre los valores más grandes y más pequeños en una muestra.

27 62
Resumen estadís co
Ejemplo

En el ar culo “Evalua on of Low-Temperature Proper es of HMA Mixtures” (P. Sebaaly, A. Lake y J.


Epps, en Journal of Transporta on Engineering, 2002:578-583) se midieron los siguientes valores de la
tensión de fractura (en megapascales) para una muestra de 24 mezclas de asfalto mezclado caliente
(HMA).
30 75 79 80 80 105 126 138 149 179 179 191
223 232 232 236 240 242 245 247 254 274 384 470
Encuentre las modas y el rango para la muestra.

28 62
Resumen estadís co
Ejemplo

En el ar culo “Evalua on of Low-Temperature Proper es of HMA Mixtures” (P. Sebaaly, A. Lake y J.


Epps, en Journal of Transporta on Engineering, 2002:578-583) se midieron los siguientes valores de la
tensión de fractura (en megapascales) para una muestra de 24 mezclas de asfalto mezclado caliente
(HMA).
30 75 79 80 80 105 126 138 149 179 179 191
223 232 232 236 240 242 245 247 254 274 384 470
Encuentre las modas y el rango para la muestra.

Solución
Hay tres modas: 80, 179 y 232. Cada uno de estos valores aparece dos veces y ningún otro valor
aparece más de una vez. El rango es 470 − 30 = 440.

28 62
Resumen estadís co
Cuar les

La mediana divide la muestra a la mitad. Los cuar les la dividen tanto como sea posible en cuartos.

29 62
Resumen estadís co
Percen les

El p-ésimo percen l de una muestra, para un número p entre 0 y 100, divide a la muestra tanto como
sea posible, el p % de los valores de la muestra es menor que el p-ésimo percen l y el (100 - p) % son
mayores.

30 62
Resumen estadís co
Estadís ca descrip va

El resumen estadís co de datos se conoce como estadís ca descrip va porque describe los datos.

31 62
Resumen estadís co
Estadís ca muestral y parámetros poblacionales

· Un resumen numérico de una muestra se llama estadís co.


· Un resumen numérico de una población se llama parámetro.
· Con frecuencia los estadís cos se usan para es mar los parámetros.

32 62
Resumen estadís co– Ejercicios
Ejercicio 4

Verdadero o falso: para cualquier lista de números, la mitad de ellos estará debajo de la media.

33 62
Resumen estadís co– Ejercicios
Ejercicio 5

¿Es la media de la muestra siempre igual a uno de los valores que está en la muestra? Si es así,
explique por qué. Si no, dé un ejemplo.

34 62
Resumen estadís co– Ejercicios
Ejercicio 6

Encuentre un tamaño de la muestra para el cual la mediana siempre sea igual a uno de los valores en
la muestra.

35 62
Resumen estadís co– Ejercicios
Ejercicio 7

En una compañía, cada trabajador recibió un aumento de 5 %. ¿Cómo afecta esto la media de los
sueldos? ¿Y la desviación estándar de los sueldos?

36 62
Resumen estadís co– Ejercicios
Ejercicio 8

Una clase de estadís ca con 40 estudiantes realizó una prueba. El puntaje posible más alto era de
cuatro puntos. Diez estudiantes obtuvieron cuatro puntos, 12 lograron tres puntos, ocho alcanzaron
dos puntos, seis se beneficiaron con un punto y cuatro obtuvieron cero puntos. Calcule la media, la
mediana y la desviación estándar de los puntajes.

37 62
Resumen estadís co– Ejercicios
Ejercicio 9

En otra clase de estadís ca, el número total de estudiantes no se conoce. En esta clase, 25 % obtuvo
cuatro puntos, 30 % alcanzó tres puntos, 20 % se benefició con dos puntos, 15 % logró un punto y
10 % resultó con cero puntos.

a) ¿Es posible calcular la media de los puntajes para esta clase? Si es así, calcúlela. Si no, explique
por qué.
b) ¿Es posible calcular la mediana de los puntajes para esta clase? Si es así, calcúlela. Si no, explique
por qué.
c) ¿Es posible calcular la desviación estándar de la muestra de los puntajes para esta clase? Si es así,
calcúlela. Si no, explique por qué.

38 62
Resumen estadís co– Ejercicios
Ejercicio 10

¿Por qué nadie habla del cuarto cuar l? ¿O lo hacen?

39 62
Resúmenes gráficos
Resúmenes gráficos
Diagramas de tallo y hoja

La media, mediana y la desviación estándar son resúmenes numéricos de una muestra o de una
población. Los resúmenes gráficos también se usan para ayudar a visualizar una lista de números.
Una gráfica de tallos y hojas cons tuye una manera simple de resumir un conjunto de datos.

41 62
Resúmenes gráficos
Ejemplo

Tabla 1: Duración (en minutos) de los periodos de inac vidad del géiser Old Faithful

42 45 49 50 51 51 51 51 53 53
55 55 56 56 57 58 60 66 67 67
68 69 70 71 72 73 73 74 75 75
75 75 76 76 76 76 76 79 79 80
80 80 80 81 82 82 82 83 83 84
84 84 85 86 86 86 88 90 91 93

Cada elemento de la muestra se divide en dos partes: un tallo, que consta de uno o dos dígitos que
están en el extremo izquierdo, y la hoja, que consta del siguiente dígito significa vo.

42 62
Resúmenes gráficos
Ejemplo (cont...)

En los datos del géiser, el tallo es el dígito de las decenas y las hojas, una unidad. Cada renglón del
diagrama de tallos y hojas con ene todos los elementos de la muestra con un tallo dado. El diagrama
de tallos y hojas es una forma compacta de representar los datos.

Stem Leaf
4 259
5 0111133556678
6 067789
7 01233455556666699
8 000012223344456668
9 013

43 62
Resúmenes gráficos
Ejemplo (MINITAB)

Stem-and-leaf of HiAltitude N = 62
Leaf Unit = 1.0

4 0 1111
19 0 222222223333333
(14) 0 44445555555555
29 0 66666666777777
15 0 8889999
8 1 0
7 1 233
4 1
4 1 7
3 1 89
1 2
1 2 3
44 62
Resúmenes gráficos
Diagramas de puntos

Un diagrama de puntos es un gráfico que se puede usar para tener una impresión aproximada de la
forma de una muestra. Es ú l cuando el tamaño de la muestra no es demasiado grande y cuando la
muestra con ene algunos valores repe dos.

Figura 4: Diagrama de puntos para los datos del géiser.

Para cada valor de la muestra se dibuja una columna ver cal de puntos, con el número de puntos de
la columna igual al número que aparece el valor en la muestra.

45 62
Resúmenes gráficos
Histogramas

Un histograma es una gráfica que da una idea de la “forma” de una muestra, indicando las regiones
donde los puntos de la muestra están concentrados y las regiones donde son escasos.

Tabla 2: Tabla de frecuencias para las emisiones EP de 62 vehículos conducidos a mayor al tud

Intervalo de clase (g/gal) Frecuencia Frecuencia rela va Densidad


1-<3 12 0.194 0.0970
3-<5 11 0.177 0.0885
5-<7 18 0.290 0.1450
7-<9 9 0.145 0.0725
9-<11 5 0.081 0.0405
11-<15 3 0.048 0.0120
15-<25 4 0.065 0.0065

Los intervalos en la columna de la izquierda se llaman intervalos de clase. Dividen la muestra en


grupos.
46 62
Resúmenes gráficos
Ejemplo

Figura 5: Histograma para las emisiones de EP para vehículos a gran al tud.

47 62
Resúmenes gráficos
Ejemplo

Use el histograma de la figura 5 para determinar la proporción de los vehículos en la muestra con
emisiones entre 7 y 11 g/galón.

48 62
Resúmenes gráficos
Ejemplo

Use el histograma de la figura 5 para determinar la proporción de los vehículos en la muestra con
emisiones entre 7 y 11 g/galón.

Solución
La proporción representa el área bajo el histograma entre 7 y 11. Ésta se encuentra sumando las áreas
cubiertas por los rectángulos de los dos intervalos de clase. El resultado es
(2)(0.0725) + (2)(0.0405) = 0.226. Observe que este resultado también se puede obtener de la tabla
de frecuencias. La proporción de puntos de datos con valores entre 7 y 9 es 0.145 y la proporción
entre 9 y 11 es 0.081. La proporción entre 7 y 11 es, por tanto, igual a 0.145 + 0.081 = 0.226.

48 62
Resúmenes gráficos
Resumen

Para construir un histograma:

· Elija los puntos límite para los intervalos de clase.


· Calcule las frecuencias y las frecuencias rela vas para cada clase.
· Calcule la densidad para cada clase, de acuerdo con la fórmula.
Frecuencia rela va
Densidad =
intervalo de clase
· Dibuje un rectángulo para cada clase, cuya altura sea igual a la densidad.

49 62
Resúmenes gráficos
Simetria y sesgo

Un histograma es perfectamente simétrico si su mitad derecha es una imagen de espejo de su mitad


izquierda. Los histogramas que no son simétricos se llaman sesgados. En la prác ca, ninguna muestra
de datos ene un histograma perfectamente simétrico; todos presentan algún grado de sesgadura. En
un histograma sesgado, un lado, o una cola, es más largo que el otro. Un histograma con una cola larga
a la derecha se dice que está sesgado a la derecha o posi vamente sesgado. Un histograma largo con
una cola larga a la izquierda se dice que está sesgado a la izquierda o nega vamente sesgado.

50 62
Resúmenes gráficos
Ejemplo

Figura 6: a) Histograma sesgado a la izquierda, la media es menor que la mediana. b) Histograma casi simétrico, la
media y la mediana son aproximadamente iguales. c) Histograma sesgado a la derecha, la media es más grande que
la mediana.

51 62
Resúmenes gráficos
Histogramas unimodales y bimodales

Un histograma es unimodal si ene solamente un pico, o moda, y bimodal si ene evidentemente dos
modas dis ntas. En principio, un histograma puede tener más de dos modas, pero esto no ocurre a
menudo en la prác ca.

Figura 7: Histograma bimodal.

52 62
Resúmenes gráficos
Ejemplo
Tabla 3: Duración de los periodos de inac vidad (en minutos) y de las erupciones previas del géiser Old Faithful

Inac vidad Erupción Inac vidad Erupción Inac vidad Erupción Inac vidad Erupción
76 Larga 90 Larga 45 Breve 84 Larga
80 Larga 42 Breve 88 Larga 70 Larga
84 Larga 91 Larga 51 Breve 79 Larga
50 Breve 51 Breve 80 Larga 60 Larga
93 Larga 79 Larga 49 Breve 86 Larga
55 Breve 53 Breve 82 Larga 71 Larga
76 Larga 82 Larga 75 Larga 67 Breve
58 Breve 51 Breve 73 Larga 81 Larga
74 Larga 76 Larga 67 Larga 76 Larga
75 Larga 82 Larga 68 Larga 83 Larga
80 Larga 84 Larga 86 Larga 76 Larga
56 Breve 53 Breve 72 Larga 55 Breve
80 Larga 86 Larga 75 Larga 73 Larga
69 Larga 51 Breve 75 Larga 56 Breve
57 Larga 85 Larga 66 Breve 83 Larga

53 62
Resúmenes gráficos
Ejemplo (cont...)

Figura 8: a) Histograma para las 60 duraciones de la tabla 3. Este histograma es bimodal. b) Histograma para las
duraciones de la tabla 3 que siguen a las erupciones breves. c) Histograma para las duraciones en la tabla 3 que
siguen a las erupciones largas. Tanto los histogramas para las duraciones seguidas de erupciones breves como para
los que le siguen erupciones largas son unimodales, pero las modas están en lugares diferentes. Cuando las dos
muestras se combinan, el histograma es bimodal.

54 62
Resúmenes gráficos
Diagrama de caja

Un diagrama de caja cons tuye una gráfica que incluye la mediana, el primero y el tercer cuar l y
cualquier dato a pico que se presente en una muestra. Los diagramas de caja son fáciles de
comprender, pero hay una pequeña terminología asociada con ellos. El rango inter-cuar l es la
diferencia entre el tercer y el primer cuar l.
Se ha definido a los datos a picos como puntos que son inusualmente grandes o pequeños. Si denota
IQR el rango intercuar l, entonces con el propósito de dibujar diagramas de caja, cualquier punto que
está a más de 1.5 IQR por arriba del tercer cuar l, o que está a más de 1.5 IQR por debajo del primer
cuar l, se considera un dato a pico.

55 62
Resúmenes gráficos
Diagrama de caja

Figura 9: Anatomía de un diagrama de caja.

56 62
Resúmenes gráficos
Pasos para la construcción de un diagrama de caja

· Calcule la mediana, el primero y tercer cuar l de la muestra. Indique éstos con líneas
horizontales. Dibuje líneas ver cales para completar la caja.
· Encuentre el valor de la muestra más grande que no esté a más de 1.5 IQR arriba del tercer
cuar l y el valor de la muestra más pequeño que no esté a más de 1.5 IQR debajo del primer
cuar l. Ex enda líneas ver cales (“bigotes”) desde las líneas de los cuar les a estos puntos.
· Puntos a más de 1.5 IQR arriba del tercer cuar l, o a más de 1.5 IQR por debajo del primer
cuar l, se denominan datos a picos. Dibuje cada dato a pico por separado.

57 62
Resúmenes gráficos
Diagramas de caja compara vos

Una ventaja muy importante de los diagramas de caja es que se pueden presentar varios juntos, ello
permite la fácil comparación visual de las caracterís cas de varias muestras.

Figura 10: Diagramas de caja compara vos para los datos de emisiones de EP para vehículos conducidos en
al tudes grandes contra bajas.
58 62
Resúmenes gráficos
Datos mul variados

A veces los elementos de una población pueden tener algunos valores asociados entre sí. Por
ejemplo, imagine que elige una muestra aleatoria de días y determine el promedio de la temperatura y
de la humedad para cada día. Cada día la población proporciona dos valores, la temperatura y la
humedad. Por tanto, la muestra aleatoria constaría de pares de números.
Los datos para cada elemento que constan de más de un valor se llaman datos mul variados. Cuando
cada elemento es un par de valores, se dice que los datos son bivariados. Uno de los resúmenes
gráficos más ú les por los datos bivariados numéricos es el diagrama de dispersión.

59 62
Resúmenes gráficos
Ejemplo
El ar culo “Advances in Oxygen Equivalence Equa ons for Predic ng the Proper es of Titanium
Welds” (D. Harwig, W. I wa ana y H. Castner, The Welding Journal, 200l:l26s-136s) presenta los
datos con respecto a la composición química y las caracterís cas de la intensidad de diferentes
soldaduras de tanio.

Figura 11: a) Un diagrama de dispersión que muestra que no existe mucha relación entre el contenido de carbono y
la intensidad producida para determinado grupo de soldaduras. b) Un diagrama de dispersión que muestra que para
estas mismas soldaduras el contenido de nitrógeno más alto está relacionado con la mayor intensidad producida.
60 62
Resúmenes gráficos– Ejercicios
Ejercicio 11

Parte de un estudio de control de calidad tuvo como obje vo mejorar una línea de producción, se
midieron los pesos (en onzas) de 50 barras de jabón. Los resultados son los siguientes, ordenados del
más pequeño al más grande.

11.6 12.6 12.7 12.8 13.1 13.3 13.6 13.7 13.8 14.1
14.3 14.3 14.6 14.8 15.1 15.2 15.6 15.6 15.7 15.8
15.8 15.9 15.9 16.1 16.2 16.2 16.3 16.4 16.5 16.5
16.5 16.6 17.0 17.1 17.3 17.3 17.4 17.4 17.4 17.6
17.7 18.1 18.3 18.3 18.3 18.5 18.5 18.8 19.2 20.3

a) Construya un diagrama de tallos y hojas para estos datos.


b) Construya un histograma para estos datos.
c) Construya un diagrama de puntos para estos datos.
d) Construya un diagrama de caja para estos datos. ¿El diagrama de caja indica datos a picos?

61 62
Resúmenes gráficos– Ejercicios
Ejercicio 12

Cada uno de los 32 estudiantes, que forman dos secciones de laboratorio con 16 estudiantes cada
una, calculó la circunferencia de una pelota de tenis a simple vista. Aquí se muestran los resultados,
en cen metros.

Grupo 1 18 18 18 20 22 22 22.5 23 24 24 25 25 25 25 26 26.4


Grupo 2 15 18 18 19 19 19 19 19.5 20 20 20 20 20 22 24 25

a) Construya un histograma para cada grupo.


b) Construya diagramas de caja compara vos para los dos grupos.
c) Usando diagramas de caja, ¿qué diferencias se pueden ver entre los resultados del primero y del
segundo grupo?

6262

También podría gustarte