Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(Tomado de http://mx.geocities.com/fracosta11/dmuestral.html)
En estudios pasados de Estadísticas centramos nuestra atención en técnicas que describen los datos,
tales como organizar datos en distribuciones de frecuencias y calcular diferentes promedios y medidas
de variabilidad. Estábamos concentrados en describir algo que ya ocurrió.
También comenzamos a establecer los fundamentos de la estadística inferencial, con el estudio de los
conceptos básicos de la probabilidad, las distribuciones de probabilidad discretas y continuas.
Distribuciones que son principalmente generadas para evaluar algo que podría ocurrir. Ahora veremos
otro tipo de distribución de probabilidad, que se llaman distribuciones muestrales.
Métodos de Muestreo
Muestra Aleatoria. Es una muestra seleccionada de tal forma que cada
artículo o persona de una población que está siendo estudiada tiene la
misma probabilidad de ser incluida en la muestra
No hay un mejor método para seleccionar una muestra aleatoria de una población de interés. El
método utilizado dependerá de las características de la población. Sin embargo, todos los métodos de
muestreo aleatorios tienen una meta similar, dar la misma oportunidad a todos los elementos de la
población de ser incluidos en la muestra.
Una forma podría ser escribir en papelitos los nombres de los elementos de la población y depositarlos
en una caja, si la muestra fuera de diez elementos, entonces sacamos diez papelitos.
Otra forma es usar un número de identificación para cada uno de los integrantes de la población y
seleccionar la muestra mediante una tabla de números aleatorios. Como su nombre lo indica estos
números han sido generados mediante un proceso aleatorio en una computadora. Para cada dígito de
un número la probabilidad es la misma. Entonces la probabilidad de que el elemento 22 sea
seleccionado es igual a la del elemento 382.
Ejemplo
En una compañía con 750 trabajadores se quiere obtener una muestra aleatoria de 14 elementos para
un chequeo médico. Los trabajadores fueron numerados del 1 al 750 y mediante una tabla de números
aleatorios (al final de este documento) se procedió a seleccionarlos. El punto de arranque en la tabla
se fijó mediante la hora en ese momento, 3:04, por lo tanto se inició en la columna 3, renglón 4. Como
los números de los trabajadores van desde 1 hasta 750 solo se toman en cuenta las primeras 3 cifras
de cada número que se encuentren en ese rango. En seguida se muestra una parte de la tabla, con el
primer y segundo seleccionado:
Es decir
xxx 11286 88258 58925 03638 52862 62733 33451 77455 86859 19558
66432 16706 05219 81619 10651 67079 92511 59888 84502 72095 83463 75577
11258
De tal forma fueron seleccionados que la muestra quedó integrada por los trabajadores con los
números:
Suponga que la población de interés consiste de 2000 expedientes en un archivo. Para seleccionar
una muestra de 100 con el método aleatorio simple primero se tendría que numerar todos los
expedientes. En este método se selecciona el primer expediente de acuerdo al método aleatorio
simple, luego como se quiere una muestra de 100, se divide 2000 / 100 = 20, y se selecciona un
expediente cada 20.
Puede haber dos tipos de muestreo estratificado, proporcional y no proporcional. Como su nombre lo
indica, en un muestreo aleatorio estratificado proporcional, el número de elementos de la muestra de
cada estrato tiene la misma proporción de lo encontrado en la población.
Ejemplo.
Suponga que se quiere obtener una muestra de 50 compañías para hacer un estudio sobre los gastos
en publicidad de las 352 compañías más grandes del país. Se dividió a las compañías en 5 estratos de
acuerdo a su rentabilidad.
Número de
Estrato Rentabilidad Porcentaje Muestra
firmas
A 30% o más 8 2 1
B 20 – 30% 35 10 5
C 10 – 20% 189 54 27
D 0 – 10% 115 33 16
E Con pérdida 5 1 1
Total 352 100 50
Error de Muestreo
Si seleccionamos una muestra por el método de muestreo aleatorio simple, por muestreo sistemático,
por muestreo estratificado, por muestreo por bloques o por una combinación de estos métodos, es
poco probable que la media de la muestra sea idéntica a la media de la población de donde fue
obtenida. De la misma forma, es probable que la desviación estándar de la muestra no sea
exactamente igual al valor correspondiente de la población. Por lo tanto podemos esperar alguna
diferencia entre un estadístico muestral y el correspondiente parámetro poblacional. Esta diferencia es
llamada error de muestreo.
Ejemplo.
Tortas “Don Pepe” tiene 5 parrilleros (población), a los cuales se les paga por hora según su trabajo.
Las percepciones de los parrilleros son las siguientes:
Solución.
9+8+8+8+7
µ= = 8.0
5
2. Para construir la distribución muestral de las medias, Las medias de todas las posibles muestras
de tamaño 2 son calculadas
Resolver el problema 1
1.- La Señora López da a sus seis hijos “domingo” para que se lo gasten en dulces. Las cantidades
son las siguientes:
niño Domingo
Javier $ 10.00
Antonio 9.00
José 10.00
Ignacio 8.00
Adolfo 8.00
Andrés 9.00
Si la población está normalmente distribuida, la distribución muestral de las medias también estará
normalmente distribuida. En el primer problema (ingresos de los parrilleros) la forma de la distribución
de la población es aproximadamente normal y la forma de la distribución muestral también es
aproximadamente normal. Estas son las bases del teorema del límite central, uno de los más
importantes teoremas en estadísticas.
Teorema del Límite Central. Para una población con una media µ y una varianza σ², la
distribución de las medias de todas las muestras posibles de tamaño n generadas de la población
estarán distribuidas de forma aproximadamente normal asumiendo que el tamaño de la muestra
es suficientemente grande.
Ejemplo.
Los siguientes datos corresponden a una muestra aleatoria de los pesos, en kilogramos, del equipaje
personal que lleva en un vuelo un jugador de un equipo de baloncesto.
15.4 17.7 18.6 12.7 15.0 15.9 16.3 18.1 16.8 14.1 13.6 16.3
Hacer una estimación puntual de la media poblacional del peso promedio del equipaje de un
basquetbolista.
µ = 15.87
Estimación por Intervalo. Establece el rango de valores dentro del cual se espera que se
encuentre un parámetro poblacional.
Para entender mejor el concepto de intervalo de confianza vamos a suponer que seleccionamos 100
muestras de una población y calculamos la media de las muestras e intervalos de confianza del 95%
para cada muestra. Descubriremos que cerca de 95 de los 100 intervalos de confianza contienen la
media poblacional.
Ejemplo.
Los resultados siguientes representan las calificaciones de una muestra aleatoria de calificaciones de
estudiantes en estadística elemental.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
1 – α = .95
2.- Cuando se trata de estimar la media poblacional la variable aleatoria estándar es el valor Z de la
distribución normal, siempre y cuando la muestra sea grande (n > 30). Como 1 – α es la probabilidad
de que la media poblacional se encuentre dentro del intervalo (centro de la curva), α es la probabilidad
de que no se encuentre en el intervalo (extremos de la curva), y cada extremo de la curva o cola
corresponde a α/2.
En la tabla de la distribución normal se busca el valor Z que corresponde al área de α/2 de la siguiente
manera:
1 – α = .95
α = 1 - .95 = .05
α/2 = .025
Se busca en la tabla normal:
Z 6
1.9 .02500
Entonces Z = 1.96 es el valor que corresponde a la cola positiva de la curva, y Z = - 1.96 es el valor
que corresponde a la cola negativa.
3.- Para estimar la media poblacional necesitamos calcular la media y la desviación estándar de la
muestra:
Es decir que N es muy grande, mucho más grande que el tamaño de la muestra n (N>>>n) por lo que
el numerador N-n es casi N y el denominador N-1 es N. Es decir que
6.- Se calculan los límites del intervalo de confianza, restando a la media de la muestra el error
máximo de estimación se obtiene el límite inferior. Sumando a la media de la muestra el error máximo
de estimación se obtiene el límite superior.
En realidad la formula para calcular el intervalo de confianza, para una muestra aleatoria simple, es :
Este resultado se interpreta de la siguiente manera: “Hay una probabilidad de .95 de que la calificación
media de todos los estudiantes de estadísticas, se encuentre entre 60.13 y 70.83”.
Para poder utilizar la distribución normal es necesario que las muestras sean grandes (n > 30) y
conocer σ. Si no se conoce σ se utiliza S, pero si además la muestra es chica los resultados no serán
satisfactorios. En estos casos se utiliza la distribución t de student.
Esta distribución fue desarrollada por William Gosset, un trabajador de la cervecería Guinness en
Irlanda, quien la publicó utilizando el seudónimo de “Student”. Gossett se interesó en el
comportamiento del valor z cuando se utilizaba S en vez de σ, y particularmente en la discrepancia
entre S y σ cuando S se calcula de muestras muy pequeñas.
En la siguiente gráfica se muestra como la distribución t extendida que la distribución normal Z.
Ejemplo.
Una muestra aleatoria de 12 secretarias escriben a máquina un promedio 85.2 palabras por minuto
con una desviación estándar de 9.3 palabras por minuto. Encuentre un intervalo de confianza de 95%
para el número promedio de palabras por minuto escritas por todas las secretarias.
Solución.
2.- Como la muestra es pequeña (n ≤ 30) se determina el valor de t, para lo cual, antes se determinan
los grados de libertad Φ. El valor de α de la tabla corresponde al área que se encuentra a la derecha
del valor positivo de t que buscamos, por lo tanto en los intervalos de confianza sería α/2
Φ = n – 1 = 12 – 1 = 11 α/2 = .025
Se busca en la tabla t
Φ α .025
11 2.20099
t = 2.20099
En las tablas del apendice se obtiene
2.201
Lo que quiere decir que hay una probabilidad de .95 de que la cantidad promedio de palabras por
minuto que escriben todas las secretarias se encuentre entre 79.52 y 90.88
En este caso se usa la función de probabilidad t student y en realidad la formula para el intervalo de
confianza, a un nivel de confianza del 95% con n-1 grados de libertad es decir 11 es
Ejemplo.
En un estudio de mercado para estimar la proporción de amas de casa que pueden reconocer la
marca de un limpiador basándose en la forma y color del envase. De 1400 amas de casa, solo 420
pudieron identificar la marca. Hacer un intervalo de confianza del 99% para estimar la proporción
poblacional.
1 – α = .99
1 – α = .99
α = 1 - .99 = .01
α/2 = .005
El valor .005 no está en la tabla normal, pero debería encontrarse entre estas dos cantidades
Z 7 ? 8
2.5 .00508 .005 .00494
(A1 - A) (.00508-.005)
Z= Z1 + ( Z2 – Z1) = 2.57 + (2.58-2.57) = 2.5757
(A1 – A2) (.00508-.00494)
x 420
p= = = .3
n 1400
q = 1 – p = 1 - .3 = .7
E = Z σp = (2.5757)(.0122) = .0314
P( p – E ≤ π ≤ p + E) = 1 – α
Hay una probabilidad de .99 de que la proporción de amas de casa que pueden identificar la marca del
limpiador se encuentre entre .2686 y .3314
Resolver los siguientes problemas,
modificando el enunciado y si necesario los
datos de tal forma que se describa un
problema relacionado con su carrera.
1 (1 pt).- El propietario de una estación de gasolina quiere estimar el número promedio de litros de
gasolina vendida a sus clientes. De sus registros seleccionó una muestra de 60 ventas y encontró lo
siguiente:
39 32 30 22 54 27 24 29 23 42 35 21
26 35 36 39 20 25 43 34 29 21 21 30
41 27 44 45 27 33 33 36 11 33 38 24
39 28 33 27 28 31 35 37 40 32 46 37
34 40 29 32 28 25 36 23 26 24 30 34
a) Haga un intervalo de confianza del 94% para estimar el número promedio de litros de gasolina
vendida a sus clientes
b) Haga un intervalo de confianza del 98% para estimar la proporción de clientes que compraron más
de 30 litros de gasolina vendida.
2 (5 pts).- De acuerdo a la explicación dada en clase para fabricar helicópteros de papel con las
medidas que se le indicaron.
a) Fabricar 25 helicópteros, numerarlos del 1 al 25, elegirlos al azar usando la tabla de números
aleatorios (esto es muy importante) y lanzarlos uno por uno desde un edificio de 3 pisos. Obtener
los tiempos de vuelo y calcular los intervalos de confianza del 90%y del 95% para estimar la media
poblacional de los tiempos de vuelo.
b) De los 25 helicopteros elija uno al azar (vea la hora elija la columna, recorra la tabla hasta
encontrar un númerodonde las dos primeras cifras estén entre 1 y 25) y lanzarlo 25 veces Obtener
los tiempos de vuelo y obtener el intervalo de confianza del 90% y del 95% para estimar la media
poblacional de los tiempos de vuelo.
c) Establecer las conclusiones comparando las respuestas a) y b)
Si desea mas instrucciones consultar
4.5 cm
6 a 12 cm
6 a 12 cm
1 cm a 2 cm
3 cm a 6 cm
min max
wing lenght= longitud de ala 6 12
body lenght =longitud del cuerpo 6 12
body width = ancho del cuerpo 3 6
Fold0 doblar 1 cm 2 cm
Poner clip 0 1
Modo de lanzamiento
Materiales
25 clips
Tijeras
Regla
Cronómetro (no redondear tomar el tiempo en segundos)
Usar solamente papel bond blanco, no reciclado,
Se deben entregar todos los helicópteros
Fecha de entrega en archivo electrónico word viernes 10 de diciembre a las 13 P.M. (última hora pues
las calificaciones finales se entregan el mismo día). Todos los datos y errores deben ser
presentados. Indicar como mejoraría esta práctica
3 (2 pts).- Cierto banco encuentra que el uso de cajeros automáticos reduce el costo de las
transacciones bancarias de rutina. Este banco instaló un cajero automático en las instalaciones de Fun
Toy Company. Este cajero es para uso exclusivo de los 500 empleados de Fun Toy Company.
Después de algunos meses de operación, se realizó un estudio sobre el uso del cajero y se encontró lo
siguiente:
4 (2 pts).- Los siguientes datos son las calificaciones dadas a una línea aérea, por los 250 pasajeros
del vuelo Nueva York – Los Angeles. Las calificaciones pueden ir de 0 a 10.
4 5 3 6 6 6 7 5 4 6 7 5 7 5 7 5 5 4 5 3 6 6 6 7 5
6 4 6 6 7 5 3 6 5 6 5 7 6 3 7 4 5 6 4 6 6 7 5 3 6
4 6 5 6 6 6 4 9 4 8 5 6 7 6 6 6 3 4 6 5 6 6 6 4 9
6 2 7 6 6 5 5 5 6 6 6 5 6 4 4 5 4 6 2 7 6 6 5 5 5
5 5 7 3 6 7 5 7 6 6 5 4 6 6 2 7 6 5 5 7 3 6 7 5 7
6 7 7 4 7 2 9 2 8 4 6 6 6 7 6 5 6 6 7 7 4 7 2 9 2
6 5 6 6 8 4 2 5 5 8 5 7 3 4 6 7 7 6 5 6 6 8 4 2 5
5 2 9 4 3 6 6 6 4 4 6 6 5 5 5 8 4 5 2 9 4 3 6 6 6
6 5 9 4 5 7 5 4 6 5 5 5 4 5 6 8 7 6 5 9 4 5 7 5 4
7 5 6 6 7 7 5 5 6 4 6 6 6 10 6 7 7 7 5 6 6 7 7 5 5
d) Obtenga una muestra aleatoria de 35 pasajeros y haga un intervalo de confianza del 95% para
estimar la media poblacional de las calificaciones otorgadas por los pasajeros.
e) Obtenga una muestra de 10 pasajeros y estime con un intervalo de confianza de 90% la proporción
poblacional de pasajeros que otorgaron una calificación reprobatoria (proporción debe de contar
cuales aprueban y cuales no)
f) ¿De que tamaño deberá ser la muestra si el error máximo de estimación es igual a .5?
Tablas
Distribución t
Valores de t tales que la probabilidad sea menor o igual a la especificada (1)
1 0.325 0.727 1.376 1.963 3.078 4.165 6.314 12.706 31.821 63.656
2 0.289 0.617 1.061 1.386 1.886 2.282 2.920 4.303 6.965 9.925
3 0.277 0.584 0.978 1.250 1.638 1.924 2.353 3.182 4.541 5.841
4 0.271 0.569 0.941 1.190 1.533 1.778 2.132 2.776 3.747 4.604
5 0.267 0.559 0.920 1.156 1.476 1.699 2.015 2.571 3.365 4.032
6 0.265 0.553 0.906 1.134 1.440 1.650 1.943 2.447 3.143 3.707
7 0.263 0.549 0.896 1.119 1.415 1.617 1.895 2.365 2.998 3.499
8 0.262 0.546 0.889 1.108 1.397 1.592 1.860 2.306 2.896 3.355
9 0.261 0.543 0.883 1.100 1.383 1.574 1.833 2.262 2.821 3.250
10 0.260 0.542 0.879 1.093 1.372 1.559 1.812 2.228 2.764 3.169
11 0.260 0.540 0.876 1.088 1.363 1.548 1.796 2.201 2.718 3.106
12 0.259 0.539 0.873 1.083 1.356 1.538 1.782 2.179 2.681 3.055
13 0.259 0.538 0.870 1.079 1.350 1.530 1.771 2.160 2.650 3.012
14 0.258 0.537 0.868 1.076 1.345 1.523 1.761 2.145 2.624 2.977
15 0.258 0.536 0.866 1.074 1.341 1.517 1.753 2.131 2.602 2.947
16 0.258 0.535 0.865 1.071 1.337 1.512 1.746 2.120 2.583 2.921
17 0.257 0.534 0.863 1.069 1.333 1.508 1.740 2.110 2.567 2.898
18 0.257 0.534 0.862 1.067 1.330 1.504 1.734 2.101 2.552 2.878
19 0.257 0.533 0.861 1.066 1.328 1.500 1.729 2.093 2.539 2.861
20 0.257 0.533 0.860 1.064 1.325 1.497 1.725 2.086 2.528 2.845
21 0.257 0.532 0.859 1.063 1.323 1.494 1.721 2.080 2.518 2.831
22 0.256 0.532 0.858 1.061 1.321 1.492 1.717 2.074 2.508 2.819
23 0.256 0.532 0.858 1.060 1.319 1.489 1.714 2.069 2.500 2.807
24 0.256 0.531 0.857 1.059 1.318 1.487 1.711 2.064 2.492 2.797
25 0.256 0.531 0.856 1.058 1.316 1.485 1.708 2.060 2.485 2.787
26 0.256 0.531 0.856 1.058 1.315 1.483 1.706 2.056 2.479 2.779
27 0.256 0.531 0.855 1.057 1.314 1.482 1.703 2.052 2.473 2.771
28 0.256 0.530 0.855 1.056 1.313 1.480 1.701 2.048 2.467 2.763
29 0.256 0.530 0.854 1.055 1.311 1.479 1.699 2.045 2.462 2.756
30 0.256 0.530 0.854 1.055 1.310 1.477 1.697 2.042 2.457 2.750
> 30 0.253 0.524 0.842 1.036 1.282 1.440 1.645 1.960 2.326 2.576
(1) Valores calculados usando la función DISTR.T.INV() del Excel.
La probabilidad corresponde al área a la derecha del valor dado en la tabla.
0.6 0.7 0.8 0.85 0.9 0.925 0.95 0.975 0.99 0.995
Distribución normal acumulada -N(0,1)
Valores de la probabilidad acumulada por debajo de z (1)