Está en la página 1de 55

ESTADSTICA INFERENCIAL) TAMAO DE LA MUESTRA ESTIMACIN

MATERIAL PREPARADO POR LA PROFA ALEJANDRINA DE BOUTAUD

TAMAO DE LAS MUESTRAS Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis.

1. PORCENTAJE DE CONFIANZA La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin.

1. PORCENTAJE DE CONFIANZA

(1- )= coeficiente de confianza z /2 = lmites de confianza =nivel de significancia

COMO SE INTERPRETA UNA CONFIANZA DEL 95%?.

Si llevamos a cabo un experimento 100 veces obtendramos 100 distribuciones muestrales de datos y 100 intervalos de confianza. De estos 100 intervalos, 95 de ellos cubriran el valor del verdadero parmetro poblacional. Desgraciada o afortunadamente, nosotros solo realizamos el experimento una sola vez. Con lo que nunca sabremos si nuestro intervalo es uno de esos 95 que contienen el parmetro de estudio.

CONCLUSIONES SOBRE EL NIVEL DE CONFIANZA EN EL MUESTREO

Segn diferentes niveles de confianza, el coeficiente de Z vara as:


% de Confianza 90% 95% 97.5% 99% Z /2 1.645 1.96 2.24 2.576
EL PORCENTAJE DE CONFIANZA LO ESTABLECE EL INVESTIGADOR

EN INVESTIGACIONES ADMINISTRATIVAS Y DE MERCADO SE UTILIZA 90% o 95%.

2. EL PORCENTAJE DE ERROR

Un error en el muestreo es la diferencia entre el valor de un estadgrafo obtenido mediante una muestra aleatoria, y el valor del correspondiente parmetro de la poblacin debida a variaciones fortuitas en la seleccin de unidades elementales. Se mide por lo que se suele llamar fiabilidad, o precisin en el muestreo que esta relacionado con la varianza del estadgrafo muestral. Cuanto mayor sea la varianza, menor la fiabilidad del resultado de la muestra.

2.

CONCLUSIONES PORCENTAJE DE ERROR

Comnmente se aceptan entre el 1% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.

EL ERROR LO FIJA EL INVESTIGADOR. ENTRE MENOR ES EL PORCENTAJE DE ERROR MAYOR ES EL TAMAO DE LA MUESTRA

3. EL NIVEL DE VARIABILIDAD

La variabilidad es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere investigar. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechaz se la hiptesis es la variabilidad negativa, denotada por q.

3. EL NIVEL DE VARIABILIDAD

Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Adems, cuando se habla de la mxima variabilidad, en el caso de no existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.

2.

CONCLUSIONES DEL NIVEL DE VARIABILIDAD

EL VALOR DE P SE OBTIENE DE:


1. En alguna investigacin anterior.

2. En el caso de no existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.
1. Por medio de un ensayo o prueba piloto previo a la investigacin actual. P= x
n

TAMAO DE LA MUESTRA PARA VARIABLES DISCRETAS.

A partir de Poblaciones Infinitas (Poblacin Desconocida)

donde: n es el tamao de la muestra; Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; E es la precisin o error.

EJEMPLO

En el Colegio de Bachilleres, una institucin de nivel medio superior, se desea realizar una investigacin sobre los alumnos inscritos en primer y segundo aos, para lo cual se aplicar un cuestionario de manera aleatoria a una muestra, pues los recursos econmicos y el tiempo para procesar la informacin resultara insuficiente en el caso de aplicrsele a la poblacin estudiantil completa.

EJEMPLO

Suponiendo:
Que no se conoce el tamao exacto de la poblacin, Se considerar una confianza del 95%, un porcentaje de error del 5% y la mxima variabilidad por no existir antecedentes en la institucin sobre la investigacin y porque no se puede aplicar una prueba previa. Es decir p=0.5 y q=0.5

SOLUCIN As:
Z= 1.96 para un nivel de confianza de 95% p= 0.5 q= 0.5; E=0.05.

Esto quiere decir que el tamao de la muestra es de 385 alumnos.

A partir de poblaciones Finita (Poblacin Conocida)

n es el tamao de la muestra; Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; N es el tamao de la poblacin; E es la precisin o el error.

EJEMPLO
Supongamos ahora que s se conoce el tamao de la poblacin estudiantil y es de 9,408, entonces se aplicar la segunda frmula. Utilizando los mismos parmetros la sustitucin queda como:

As: SOLUCIN Z= 1.96 para un nivel de confianza de 95% p= 0.5 q= 0.5; E=0.05. N=9,408 REEMPLANDO TENEMOS.

En este caso el tamao de la muestra es de 370 alumnos.

TAMAO DE LA MUESTRA PARA VARIABLES CONTINUAS.

A partir de Poblaciones Infinitas (Poblacin Desconocida)

n es el tamao de la muestra; Z es el nivel de confianza; es la desviacin estndar E es la precisin o el error.

NOTA: PARA OBTENER LA DESVIACIN ESTNDAR LO HACEMOS A TRAVS DEL PILOTO, DE DIEZ MUESTRAS.

EJEMPLO:

1. Un bilogo quiere estimar el peso promedio


de los venados cazados en el parque Soberana. Un estudio anterior de diez venados cazados mostr que la desviacin estndar de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?

SOLUCIN:

En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en que m difiere en menos de 4 libras de x .

EJEMPLO 2

2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se desea tener 96% de confianza que la media real est dentro de 10 horas de la media real?

SOLUCIN-EJEMPLO 2

Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un error mximo de 10 horas.

A partir de poblaciones Finita (Poblacin Conocida)

n es el tamao de la muestra; Z es el nivel de confianza; es la desviacin estndar E es la precisin o el error. N es el tamao de la poblacin

EJEMPLO

Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea saber de que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.

SOLUCIN

n es el tamao de la muestra; Z=2.053 para el 96% de confianza es 40 horas E es 10 horas. N es 300

Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una muestra sin reemplazo de 56 focos para poder estimar la duracin media de los focos restantes con un error mximo de 10 horas.

ESTIMACIN

RECORDEMOS EL CONCEPTO DE ESTADSTICA INFERENCIAL


Proceso y resultado de extraer conclusiones respecto a una poblacin a partir de una o ms obtencin de la muestras.
muestra conclusiones

P
M

Ejemplo,
Una inferencia estadstica sera el usar los datos de altura de los estudiantes de esta clase para estimar la altura promedio de estudiantes de Ingeniera Industrial de la Universidad Interamericana de Panam. Qu pasa si en realidad NO estamos interesados en saber la altura promedio de todos los estudiantes de Ingeniera Industrial de la Universidad Interamericana de Panam. sino que solamente la altura promedio de los estudiantes de este curso y contamos con todos los datos que ustedes nos entregaron?

Estamos entonces realizando una inferencia estadstica acerca de la altura promedio de los estudiantes este curso?

Respuesta:
La respuesta es NO. En ese caso sabemos cual es el parmetro poblacional pues tenemos un censo de los estudiantes y no necesitamos inferirlo. Podemos entonces simplemente describir nuestra poblacin de datos de altura.

PROBLEMA DE ESTIMACIN:
Por qu una encuesta de 1500 personas permite predecir bastante bien el resultado de una eleccin con 10 millones de votantes? Cmo se consigue? Cmo se mide la precisin del resultado?

PROBLEMA DE ESTIMACIN:
Se busca precisar una caracterstica totalmente desconocida de la poblacin a partir de los datos obtenidos sobre una muestra. Estimar el porcentaje de la poblacin (3 millones) que votar en la prxima eleccin a partir de una muestra de 1500 votantes.

ESTIMACIN DE PARMETROS

En una poblacin cuya distribucin es conocida pero desconocemos algn parmetro, podemos estimar dicho parmetro a partir de una muestra representativa. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona informacin sobre el valor del parmetro.

MTODOS DE ESTIMACIN DE PARMETROS

La estimacin puede ser:  PUNTUAL: Una estimacin es puntual cuando se obtiene un slo valor para el parmetro.


POR INTERVALOS: La estimacin por intervalos es la que calculamos dos valores entre los que se encontrar el parmetro, con un nivel de confianza fijado de antemano.

La ms utilizada es la estimacin por intervalos.

INTERVALO DE CONFIANZA PARA LA PROPORCIN

p- Z /2 p*q n

< p<

p + Z /2

p*q n

EJEMPLO: Una mquina fabrica p iezas de p recisin y en una caja de 200 p iezas, recibida p or un cliente han ap arecido 7 p iezas defectuosas, a un nivel de confianza del 99% entre qu valores se p uede esp erar que est la verdadera p rop orcin de p iezas defectuosas fabricadas p or la mquina?

INTERVALO DE CONFIANZA PARA LA PROPORCIN

Solucin:
La proporcin de piezas defectuosas en la muestra es 7/200=0,035 Con p'=0,035 q'=0,965 n=200, la distribucin muestral de proporciones se distribuye N(p ; 0,013).

INTERVALO DE CONFIANZA PARA LA PROPORCIN

Solucin: p- Z /2 p*q n

< p<

p + Z /2

p*q n

(0,035-2,575*0,013< p < 0,035+2,575*0,013) (0,002 <p< 0,068)

Existe un 99% de confianza que el verdadero valor de piezas defectuosas estn entre 0.002 y 0.068.

INTERVALO DE CONFIANZA PARA LA MEDIA

EJEMPLO: Para una muestra de 81 habitantes de cierta poblacin se obtuvo una estatura media de 167 cm. Por estudios anteriores se sabe que la desviacin tpica de la altura de la poblacin es de 8 cm. Construye un intervalo de confianza para la estatura media de la poblacin al 95%

INTERVALO DE CONFIANZA PARA LA MEDIA

SOLUCIN
Con s=8 n=81, y Para 1-a=0,95 a/2=0,025 z /2=1,96 As, el intervalo de confianza para la media es:

(167-1,96*0,89 <<167+1,96*0,89) (167-1,74 << 167+1,74)= (165,26 << 168,74)

Existe un 95% que la verdadera estatura de los estudiantes este entre 165.26 y 168.74cm

ESTIMACIN POR INTERVALOS CON MUESTRAS PEQUEAS (N 30)

ESTIMACIN POR INTERVALOS CON MUESTRAS PEQUEAS (N 30)

Para poder utilizar la distribucin normal es necesario que las muestras sean grandes (n > 30) y conocer . Si no se conoce se utiliza S, pero si adems la muestra es chica los resultados no sern satisfactorios. En estos casos se utiliza la distribucin t de student.

CARACTERSTICAS DE LA DISTRIBUCIN T DE STUDENT


Esta distribucin fue desarrollada por William Gosset, un trabajador de la cervecera Guinness en Irlanda, quien la public utilizando el seudnimo de Student. Gossett se interes en el comportamiento del valor z cuando se utilizaba S en vez de , y particularmente en la discrepancia entre S y cuando S se calcula de muestras muy pequeas. En la siguiente grfica se muestra como la distribucin t extendida que la distribucin normal Z.

CARACTERSTICAS DE LA DISTRIBUCIN T DE STUDENT

Las caractersticas de la distribucin t son: 1. Es una distribucin continua. 2. Tiene forma de campana y es simtrica. 3. Es una familia de curvas. Todas tienen la misma media de cero, pero sus desviaciones estndar difieren de acuerdo al tamao de la muestra. 4. La distribucin t es ms baja y dispersa que la distribucin normal. Cuando el tamao de la muestra se incrementa, la distribucin t se aproxima a la normal.

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA PARA MUESTRAS PEQUEAS

Se siguen los mismos pasos de los intervalos de confianza para muestras grandes. Ejemplo. Una muestra aleatoria de 12 secretarias escriben a mquina un promedio 85.2 palabras por minuto con una desviacin estndar de 9.3 palabras por minuto. Encuentre un intervalo de confianza de 95% para el nmero promedio de palabras por minuto escritas por todas las secretarias.

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA PARA MUESTRAS PEQUEAS

Solucin. 1.- El nivel de confianza es 1 = .95 2.- Como la muestra es pequea (n 30) se determina el valor de t, para lo cual, antes se determinan los grados de libertad . El valor de de la tabla corresponde al rea que se encuentra a la derecha del valor positivo de t que buscamos, por lo tanto en los intervalos de confianza sera /2 = n 1 = 12 1 = 11 /2 = .025

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA PARA MUESTRAS PEQUEAS

2. Se busca en la tabla t
11 .025 2.20099

t = 2.20099 3.- Los estadsticos de la muestra son: X= 85.2 S = 9.3 4.- Se calcula el error estndar

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA PARA MUESTRAS PEQUEAS


5.- Se calcula el error mximo de estimacin

6.- El intervalo de confianza resultante es: P( D'- E D'+ E ) = 1

P( 85.2 5.68 85.2 + 5.68) = .95 P( 79.52 90.88 ) = .95


Lo que quiere decir que hay una probabilidad de .95 de que la cantidad promedio de palabras por minuto que escriben todas las secretarias se encuentre entre 79.52 y 90.88

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA


Intervalo de confianza para estimar una proporcin Un intervalo de confianza para estimar una proporcin poblacional se construye de manera similar al procedimiento usado anteriormente. Ejemplo. En un estudio de mercado para estimar la proporcin de amas de casa que pueden reconocer la marca de un limpiador basndose en la forma y color del envase. De 1400 amas de casa, solo 420 pudieron identificar la marca. Hacer un intervalo de confianza del 99% para estimar la proporcin poblacional.

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA


1.- El nivel de confianza ya est establecido: 1 = .99 2.- Como n > 30 entonces se determina Z:
1 = .99 = 1 - .99 = .01 /2 = .005

El valor .005 no est en la tabla normal, pero debera encontrarse entre estas dos cantidades
Z 2.5 7 .00508 ? .005 8 .00494

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA


Cont/- P S tf 1 2 t Z .5 t . Z1 7 . 5 1 t f
Z= Z1 + (Z Z1) (A1 - A (A1 A ) = .57 + ( .5 2.57) (. 5 -. 5 (. 5 . 9 ) = 2.5757

o1 t 1 Z ? . A 5 . Z 9 t 2. t ,

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA


3. L u t t t ( ) u t f
x n p .3

(q)
.3 .

x t

p q

4. S

gu

t f

PASOS PARA CONSTRUIR INTERVALOS DE CONFIANZA


5.- S calcula el error mximo de estimacin E = Z p = (2.5757)(.0122) = .0314 6.- El intervalo que resulta es: P( p E T p + E) = 1 P(.3 - .0314 T .3 + .0314) = .99 P(.2686 T .3314) = .99 Hay una probabilidad de .99 de que la proporcin de amas de casa que pueden identificar la marca del limpiador se encuentre entre .2686 y . 1

También podría gustarte