Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TAMAO DE LAS MUESTRAS Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis.
1. PORCENTAJE DE CONFIANZA La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin.
1. PORCENTAJE DE CONFIANZA
Si llevamos a cabo un experimento 100 veces obtendramos 100 distribuciones muestrales de datos y 100 intervalos de confianza. De estos 100 intervalos, 95 de ellos cubriran el valor del verdadero parmetro poblacional. Desgraciada o afortunadamente, nosotros solo realizamos el experimento una sola vez. Con lo que nunca sabremos si nuestro intervalo es uno de esos 95 que contienen el parmetro de estudio.
2. EL PORCENTAJE DE ERROR
Un error en el muestreo es la diferencia entre el valor de un estadgrafo obtenido mediante una muestra aleatoria, y el valor del correspondiente parmetro de la poblacin debida a variaciones fortuitas en la seleccin de unidades elementales. Se mide por lo que se suele llamar fiabilidad, o precisin en el muestreo que esta relacionado con la varianza del estadgrafo muestral. Cuanto mayor sea la varianza, menor la fiabilidad del resultado de la muestra.
2.
Comnmente se aceptan entre el 1% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.
EL ERROR LO FIJA EL INVESTIGADOR. ENTRE MENOR ES EL PORCENTAJE DE ERROR MAYOR ES EL TAMAO DE LA MUESTRA
3. EL NIVEL DE VARIABILIDAD
La variabilidad es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere investigar. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechaz se la hiptesis es la variabilidad negativa, denotada por q.
3. EL NIVEL DE VARIABILIDAD
Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Adems, cuando se habla de la mxima variabilidad, en el caso de no existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.
2.
2. En el caso de no existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.
1. Por medio de un ensayo o prueba piloto previo a la investigacin actual. P= x
n
donde: n es el tamao de la muestra; Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; E es la precisin o error.
EJEMPLO
En el Colegio de Bachilleres, una institucin de nivel medio superior, se desea realizar una investigacin sobre los alumnos inscritos en primer y segundo aos, para lo cual se aplicar un cuestionario de manera aleatoria a una muestra, pues los recursos econmicos y el tiempo para procesar la informacin resultara insuficiente en el caso de aplicrsele a la poblacin estudiantil completa.
EJEMPLO
Suponiendo:
Que no se conoce el tamao exacto de la poblacin, Se considerar una confianza del 95%, un porcentaje de error del 5% y la mxima variabilidad por no existir antecedentes en la institucin sobre la investigacin y porque no se puede aplicar una prueba previa. Es decir p=0.5 y q=0.5
SOLUCIN As:
Z= 1.96 para un nivel de confianza de 95% p= 0.5 q= 0.5; E=0.05.
n es el tamao de la muestra; Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; N es el tamao de la poblacin; E es la precisin o el error.
EJEMPLO
Supongamos ahora que s se conoce el tamao de la poblacin estudiantil y es de 9,408, entonces se aplicar la segunda frmula. Utilizando los mismos parmetros la sustitucin queda como:
As: SOLUCIN Z= 1.96 para un nivel de confianza de 95% p= 0.5 q= 0.5; E=0.05. N=9,408 REEMPLANDO TENEMOS.
NOTA: PARA OBTENER LA DESVIACIN ESTNDAR LO HACEMOS A TRAVS DEL PILOTO, DE DIEZ MUESTRAS.
EJEMPLO:
SOLUCIN:
En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en que m difiere en menos de 4 libras de x .
EJEMPLO 2
2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se desea tener 96% de confianza que la media real est dentro de 10 horas de la media real?
SOLUCIN-EJEMPLO 2
Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un error mximo de 10 horas.
n es el tamao de la muestra; Z es el nivel de confianza; es la desviacin estndar E es la precisin o el error. N es el tamao de la poblacin
EJEMPLO
Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea saber de que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.
SOLUCIN
Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una muestra sin reemplazo de 56 focos para poder estimar la duracin media de los focos restantes con un error mximo de 10 horas.
ESTIMACIN
P
M
Ejemplo,
Una inferencia estadstica sera el usar los datos de altura de los estudiantes de esta clase para estimar la altura promedio de estudiantes de Ingeniera Industrial de la Universidad Interamericana de Panam. Qu pasa si en realidad NO estamos interesados en saber la altura promedio de todos los estudiantes de Ingeniera Industrial de la Universidad Interamericana de Panam. sino que solamente la altura promedio de los estudiantes de este curso y contamos con todos los datos que ustedes nos entregaron?
Estamos entonces realizando una inferencia estadstica acerca de la altura promedio de los estudiantes este curso?
Respuesta:
La respuesta es NO. En ese caso sabemos cual es el parmetro poblacional pues tenemos un censo de los estudiantes y no necesitamos inferirlo. Podemos entonces simplemente describir nuestra poblacin de datos de altura.
PROBLEMA DE ESTIMACIN:
Por qu una encuesta de 1500 personas permite predecir bastante bien el resultado de una eleccin con 10 millones de votantes? Cmo se consigue? Cmo se mide la precisin del resultado?
PROBLEMA DE ESTIMACIN:
Se busca precisar una caracterstica totalmente desconocida de la poblacin a partir de los datos obtenidos sobre una muestra. Estimar el porcentaje de la poblacin (3 millones) que votar en la prxima eleccin a partir de una muestra de 1500 votantes.
ESTIMACIN DE PARMETROS
En una poblacin cuya distribucin es conocida pero desconocemos algn parmetro, podemos estimar dicho parmetro a partir de una muestra representativa. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona informacin sobre el valor del parmetro.
La estimacin puede ser: PUNTUAL: Una estimacin es puntual cuando se obtiene un slo valor para el parmetro.
POR INTERVALOS: La estimacin por intervalos es la que calculamos dos valores entre los que se encontrar el parmetro, con un nivel de confianza fijado de antemano.
p- Z /2 p*q n
< p<
p + Z /2
p*q n
EJEMPLO: Una mquina fabrica p iezas de p recisin y en una caja de 200 p iezas, recibida p or un cliente han ap arecido 7 p iezas defectuosas, a un nivel de confianza del 99% entre qu valores se p uede esp erar que est la verdadera p rop orcin de p iezas defectuosas fabricadas p or la mquina?
Solucin:
La proporcin de piezas defectuosas en la muestra es 7/200=0,035 Con p'=0,035 q'=0,965 n=200, la distribucin muestral de proporciones se distribuye N(p ; 0,013).
Solucin: p- Z /2 p*q n
< p<
p + Z /2
p*q n
Existe un 99% de confianza que el verdadero valor de piezas defectuosas estn entre 0.002 y 0.068.
EJEMPLO: Para una muestra de 81 habitantes de cierta poblacin se obtuvo una estatura media de 167 cm. Por estudios anteriores se sabe que la desviacin tpica de la altura de la poblacin es de 8 cm. Construye un intervalo de confianza para la estatura media de la poblacin al 95%
SOLUCIN
Con s=8 n=81, y Para 1-a=0,95 a/2=0,025 z /2=1,96 As, el intervalo de confianza para la media es:
Existe un 95% que la verdadera estatura de los estudiantes este entre 165.26 y 168.74cm
Para poder utilizar la distribucin normal es necesario que las muestras sean grandes (n > 30) y conocer . Si no se conoce se utiliza S, pero si adems la muestra es chica los resultados no sern satisfactorios. En estos casos se utiliza la distribucin t de student.
Las caractersticas de la distribucin t son: 1. Es una distribucin continua. 2. Tiene forma de campana y es simtrica. 3. Es una familia de curvas. Todas tienen la misma media de cero, pero sus desviaciones estndar difieren de acuerdo al tamao de la muestra. 4. La distribucin t es ms baja y dispersa que la distribucin normal. Cuando el tamao de la muestra se incrementa, la distribucin t se aproxima a la normal.
Se siguen los mismos pasos de los intervalos de confianza para muestras grandes. Ejemplo. Una muestra aleatoria de 12 secretarias escriben a mquina un promedio 85.2 palabras por minuto con una desviacin estndar de 9.3 palabras por minuto. Encuentre un intervalo de confianza de 95% para el nmero promedio de palabras por minuto escritas por todas las secretarias.
Solucin. 1.- El nivel de confianza es 1 = .95 2.- Como la muestra es pequea (n 30) se determina el valor de t, para lo cual, antes se determinan los grados de libertad . El valor de de la tabla corresponde al rea que se encuentra a la derecha del valor positivo de t que buscamos, por lo tanto en los intervalos de confianza sera /2 = n 1 = 12 1 = 11 /2 = .025
2. Se busca en la tabla t
11 .025 2.20099
t = 2.20099 3.- Los estadsticos de la muestra son: X= 85.2 S = 9.3 4.- Se calcula el error estndar
El valor .005 no est en la tabla normal, pero debera encontrarse entre estas dos cantidades
Z 2.5 7 .00508 ? .005 8 .00494
o1 t 1 Z ? . A 5 . Z 9 t 2. t ,
(q)
.3 .
x t
p q
4. S
gu
t f