Está en la página 1de 22

ESTADISTICA INFERENCIAL

INFERENCIA ESTADISTICA: Parte de la estadstica que se encarga de buscar procedimientos inferenciales necesarios para sacar conclusiones valederas sobre una caracterstica poblacional en base a la informacin contenida en una muestra. La caracterstica de la poblacin puede ser representada mediante una v.a X; de modo que si conocemos: La distribucin de X, no hay que seleccionar muestras; Caso contrario hay que seleccionar una muestra para estimar la distribucin y sus parmetros. En el campo de la planificacin, la Inferencia Estadstica, a travs de sus tcnicas permite establecer una relacin entre el mundo real (donde ocurren los fenmenos) y el mundo idealizado (donde se definen los modelos probabilsticos); es decir se usa un modelo de probabilidad para describir la ocurrencia de un fenmeno y predecir el comportamiento futuro, cuando se repite bajo condiciones semejantes.
ROL DEL MUESTREO EN LA INFERENCIA ESTADSTICA.

Mundo Real: POBLACIN Caractersticas verdaderas: Desconocidas


Variable Aleatoria: X Muestreo {experimento: Observaciones}.

Modelo Terico

Lnea Real - x + Con distribucin: fx(x) Inferencia Sobre fx(x)

Muestra { x1, x2, . . . , xn}

Media:

Estimacin Estadstica

Varianza: 2 = S2 Fig. 01. Rol de Muestreo en la Inferencia Estadstica.

MUESTREO - En lugar de examinar toda la poblacin, lo que resultara costoso, muy tedioso y a veces fsicamente imposible o no prctico, puede examinarse una muestra de la poblacin con el fin de inferir resultados encontrados en la muestra a la poblacin correspondiente. El proceso de seleccin de una muestra se denomina muestreo. Las razones para practicar son diversas. Econmicas como:Costos, tiempo, oportunidad; Tcnicas como: Poblaciones infinitas y homogneas, pruebas destructivas, calidad y eficiencia, exactitud y precisin.

Proceso de inferir resultados de la muestra a la poblacin se denomina inferencia


estadstica.

USO DE LAS TABLAS ESTADST1CASA PARA LAS DISTRIBUCIONES DE PROBABILIDAD: JI-CUADRADA, t-STUDENT. F-SNEDECOR. En todos los casos debe ser verificado con el valor ms correcto dado por Microsoft Excel, o cualquier Programa de Software Estadstico: SPSS, MINITAB, STATISTICA, etc. 1. Si X ---------- > x2(23); Encontrar a. P[X35.172] b. P[X 19.021] c. P[13.091 X 38.908] d. P[X>30] 2. 3. 4. 5. Si X --------- > X2(13); hallar c tal que P[ X c] = 0.80 Si X --------- > x2(10); hallar c tal que P[ X c] = 0.85 Si X --------- > x2(10); hallar a, b tal que. P[ a < X< b] = 0.94 y P[ X > b] = 0.04 Si X ---------> x2(400); hallar P[ 160 X 240]. Use la siguiente propiedad: Si X tiene distribucin Chi-cuadrada con n grados de libertad y si n es suficientemente grande (n 30), entonces la v.a. , tiene distribucin aproximadamente normal N( , 1). 6. Si X ---------> t(10); Hallar a. P[X 2.101] b.P[X -2.878]

c. P[-2.303 X -2.214]

d. P[X<2.5]

7. Si X ---------> t(10); Hallar el valor de c, tal que: a. P[X< c] = 0.85, b. P[X c]= 0.99, c. P[|X| c]= 0.90

d. P[X > c] = 0.95

8. Sea X la media de una muestra aleatoria de tamao 4 seleccionada de una poblacin normal N(, 2). 2 a. Calcular , y si P (X < 6)= 0.0228 y P (X> 8) = 0.8413 b. Hallar a y b tales que P ( X < a ) = 0.0668 y P ( X > b ) = 0.0668 9. Si la v.a X-------------- > F(9,20), hallar a. P[X 1.96] b. P[X 2.30] c. P[ 2.84 X 3.96]

d. P[X 2]

10. Si la v.a X----------------- > F(15,13), hallar b tal que P[X b] = 0.05 11. Si la v.a X----------------- > F(16,15), hallar a y b tal que P[ a X b] = 0.94 12. Si la v.a X------------------ > F(22.12), hallar b tal que P[X b] = 0.05. 13. Si la v.a X------------------ > F(6.10), hallar c tal que: a. P[X< c] = 0.99, b. P[X> c]= 0.05, c.. P [ X c ] = 0.025

Nota. Para calcular valores de F correspondientes a reas 1- = 0.10, 0.05, 0.025, 0.01, 0.005 para determinar probabilidades correspondientes a valores de c< 1, en P(X <c) = 1 -a, se usa la siguiente propiedad (Cuando el clculo es manual y usa tablas). Propiedad. Si X tiene distribucin F ( v1, v2), entonces 1/X tiene distribucin F con v2, v1 grados de libertad, es decir:

La confiabilidad de las conclusiones extradas concernientes a una poblacin depende de si la muestra ha sido escogida apropiadamente, es decir, sea representativa de la poblacin. La tcnica que asegura la obtencin de muestras representativas es el muestreo probabilstico El muestreo probabilstico o aleatorio puede ser practicado en una poblacin finita o infinita y puede ser con o sin reemplazo. En trminos generales existen dos tipos de muestreo, el muestreo probabilstico y el muestreo no probabilstico, pero estudiaremos slo el primero. MUESTREO PROBABILSTICO. Dentro de este tipo, consideramos las siguientes clases: Muestreo aleatorio simple Muestreo Sistemtico Muestreo Estratificado Muestreo por conglomerados

Muestreo Aleatorio Simple.


Proceso de seleccin de una muestra donde cada uno de los elementos de la poblacin tienen igual probabilidad de ser incluidos en la muestra. Tericamente el muestren aleatorio puede ser practicado en una poblacin finita o infinita y puede ser con o sin reemplazo. En la prctica, el muestreo siempre se realiza sin reemplazo. Procedimiento para seleccionar una muestra al Azar: 1. Se confecciona una lista de todos os elementos de la poblacin (Marco muestral) y se les asigna nmeros de 1 hasta N (tamao poblacional) 2. La unidad de base de fa muestra debe ser la misma. 3. Se determina el tamao de la muestra (n) 4. Se extraen al azar los n elementos. Se pueden utilizar los procedimientos: o Tabla de nmeros aleatorios. o Sistema de la lotera o Cualquier otro procedimiento de extraccin al azar

La muestra queda constituida por los n elementos que hemos obtenido de la poblacin. Restriccin. Para aplicar el M.A.S. es necesario de que la poblacin sea altamente homognea respecto a la caracterstica de mayor inters de estudio, y adems que las unidades se encuentren concentradas.

Muestreo Aleatorio Sistemtico.


Es una variante pequea del anterior. Aqu se selecciona al azar el primer individuo y los restantes a intervalos fijos, determinados segn la relacin de muestreo. Restriccin. El muestreo sistemtico debe ser aplicado cuando los elementos de la poblacin estn ordenados en alguna secuencia o en funcin del tiempo (series cronolgicas) Procedimiento de seleccin de la muestra: 1. Se enumera las unidades de la poblacin de 1 hasta N

2. Se encuentra una relacin de muestreo denotada por:

Y que determina un intervalo entre 1 y K. Por ejemplo si N= 120 y n=10, se tiene que K = 120/10=12 (No siempre k es un entero y se recomienda redondear al entero ms prximo) y el intervalo que se obtiene est entre 1 y 12. 3. Se elige un nmero al azar comprendido entre 1 y k inclusive, r y se le denomina arranque aleatorio. La muestra queda constituida como: r, r+k, r+2k, ..., r+(n-1)k. De esta manera se selecciona todas las unidades que tienen los rdenes indicados. Ventaja. Con respecto al muestreo aleatorio simple, la muestra es ms fcil de extraer, pues basta un solo nmero aleatorio y, distribuye la muestra ampliamente sobre toda la poblacin. Desventaja. Una de las desventajas de este mtodo de muestreo es que no existe forma confiable para estimar el error estndar de la media muestral, y, las frmulas de algunos estimadores dependen del tipo de poblacin. Existen dos peligros fundamentales en este tipo de muestras La periodicidad:

De modo que la muestra resultar constituida por valores similares que sesgarn la estimacin del parmetro. La tendencia lineal. 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11. Es una poblacin con tendencia lineal. La media es 6. Si k =4 y slo elegida la muestra formada por 1,5, y 9, la media de la muestra sera 5, la que subestima la media de la poblacin. En cambio si la muestra extrada es 4, 8 y 12, la media de la muestra es 8 que, en este caso, sobreestima a la media poblacional

Muestreo estratificado.
Este procedimiento de seleccin es el indicado para poblaciones heterogneas y considera la variabilidad dentro de la poblacin para extraer una muestra ms precisa y eficiente que la que se obtendra al aplicar directamente el muestreo aleatorio simple. Restriccin. Este procedimiento se debe aplicar cuando es posible dividir la poblacin en estratos con gran variabilidad entre estratos y pequea variabilidad dentro de ellos. Procedimiento de seleccin de la muestra: 1. La poblacin de tamao N se divide en L subgrupos llamados estratos. Cuidando que la variabilidad entre estratos sea grande y que sea pequea la variabilidad dentro de los estratos. La estratificacin aumenta la precisin de las estimaciones, haciendo que el error de muestreo sea menor. 2. De cada estrato se toma una muestra aleatoria de tamao n h. 3 . La suma de las muestras de los estratos conforman la muestra total n". 4 . De la muestra de cada estrato se obtienen los diferentes indicadores estadsticos. Estos valores, convenientemente ponderados y sumados a los de los dems estratos, nos permiten obtener los valores generales para la muestra total. Para distribuir el tamao de la muestra entre los L estratos se utiliza la afijacin.
o o

Afijacin. Se denomina afijacin a la distribucin del tamao de la muestra n entre los L estratos. Esto es, determinar los valores de nh tal que verifique: n1 + n2 +... +nL = n. Tipos de afijacin. a. Afijacin igual Cada valor de nh = n/L, es decir, la distribucin no tiene en cuenta ni el tamao ni la variabilidad del estrato. b. Afijacin proporcional. Consiste en distribuir una cantidad de elementos en cada estrato en forma proporcional al tamao del estrato respecto de la poblacin. El tamao de la muestra en cada estrato estar dado por. nh = (Nh/N)*n ; h= 1,2,..,L c. Afijacin ptima. La afijacin ptima distribuye la muestra total (n) entre los estratos, considerando simultneamente el tamao (Nh) y el grado de variabilidad (Sh) del estrato Frmula para afijar ptimamente una muestra:

Si Sh no es conocida, puede ser reemplazada por el valor muestral correspondiente: s h d. Afijacin ptima econmica. Aparte de considerar simultneamente el tamao y la variabilidad de cada estrato (Nh, Sh), a veces es recomendable introducir un tercer elemento: el costo por unidad encuestada en cada estrato (c h). Sucede que en algunas investigaciones hay diferencias sustanciales en cuanto a las facilidades de acceso a la informacin por colectar y puede ser justificado tomar este elemento que tiene su origen en limitaciones financieras. El tamao muestral en cada estrato est dado por:

Ilustracin, ilustraremos el muestreo estratificado considerando el problema de determinar la preferencia politica de la mayora en una cuidad dada. Supngase que, gracias a encuestas y elecciones previas, se sabe que las preferencias polticas en la cuidad tienden a corresponder con los niveles de ingreso. Las familias de altos ingresos, por ejemplo, muestran una tendencia a tener opiniones anlogas, y lo mismo ocurre con las de medianos y bajos ingresos. Supngase, adems, que en esta ciudad es bien conocido que las familias de altos y bajos ingresos tienen menos variabilidad en sus opiniones dentro de sus respectivos grupos que las de ingresos medianos. Puede ocurrir que, en general, las familias de altos ingresos estn a favor de un candidato conservador en cuanto a poltica fiscal, y que las de ingresos bajos apoyan a un candidato que ofrezca incrementar los servicios pblicos en la cuidad,, en tanto que las familias de ingresos medios tienen opiniones menos predecibles. Muestreo por Conglomerados. El muestreo por conglomerados es un esquema en el cual se divide a la poblacin en grupos con el propsito de obtener una muestra eficiente. En este caso a las subdivisiones se les llama conglomerados e, idealmente, cada conglomerado tiene las mismas caractersticas de la poblacin. Suponiendo que cada conglomerado es un representante de la poblacin, las caractersticas de la poblacin pueden estimarse escogiendo (al AZAR) uno de los conglomerados y tomando de l los elementos de la muestra. El muestreo dentro del conglomerado puede efectuarse en cualquiera de las formas estudiadas anteriormente, y hasta puede usarse el muestreo por conglomerados dentro del conglomerado (llamado muestreo por conglomerado en dos etapas). El criterio de seleccin de los conglomerados ptimos es

exactamente opuesto al seguido para los estratos. Podemos definir conglomerados a familias, a salones de clases, manzanas de vivienda, centros de salud, comunidades, etc, segn sea el problema que se estudie. Restriccin. Debe haber poca variabilidad entre los conglomerados, pero una alta variabilidad dentro de cada conglomerado (de modo que cada uno de ellos represente adecuadamente a la poblacin) La precisin de la estimacin en este tipo de muestreo, depende del tamao de los conglomerados y de su estructura interna. En este sentido, es deseable que internamente los conglomerados sean lo ms heterogneos posibles, es decir, que haya muchos valores por arriba de la media y muchos por debajo de ella (Ejemplo una familia formada por nios y adultos es un conglomerado ms heterogneo que una familia formada por adultos, respecto al peso por persona) DETERMINACIN DEL TAMAO DE MUESTRA. Hasta ahora se ha supuesto un tamao de muestra dado, interesa analizar brevemente cules son los factores determinantes de la mag nitud de n. Fundamentalmente hay cuatro factores condicionantes del tamao de muestra: Variabilidad de la poblacin, Precisin de las estimaciones, nivel de confianza, tamao de la poblacin. Adems hay un quinto elemento de extraordinaria importancia prctica: los recursos financieros y recursos humanos y materiales. Del equilibrio de todas estas condicionantes se determina la magnitud del tamao de muestra, como se ver en pginas posteriores.

DISTRIBUCIN MUESTRAL
El propsito de esta unidad, es ofrecer procedimientos para traducir los datos a trminos probabilsticos aplicables a las inferencias del parmetro de inters. Nos ocuparemos de: Revisin de sumas de variables aleatorias y de la desigualdad de Chebyshev. Ley de los grandes nmeros y teorema del lmite central. Distribuciones muestral para estadsticas muestrales y evaluacin de sus propiedades

SUMA DE VARIABLES ALEATORIAS S x ,x ,...,xn son "n" variables aleatorias, independientes cada una con media y varianza finitas, entonces:
1 2

a) b)

E(x1 + x2+... + xn)=E(x1)+E(x2)+...+E(xn) V(x1+x2 +... +xn)=V(x1)+V(x2)+...+V(xn) S las Xi, adems de independientes tienen distribuciones idnticas, es decir, con 2 media y varianza , entonces: E(x1 + x2+... + xn)= n , 2 V(x1 + x2 +... +xn)= n y

LA DESIGUALDAD DE CHEBYSHEV Muestra la relacin entre la esperanza, la varianza y la asignacin de probabilidades de una distribucin probabilstica. Esta desigualdad es vlida para cualquier distribucin siempre y cuando exista su media y su varianza, se expresa de dos modos: 1. El primero asevera que la probabilidad de que una v.a. x se desve absolutamente de su 2 media en ms de k es a lo ms 1/k , k>0 es decir: P(lx- l k ) 1/k
2

2.

El segundo dice que la probabilidad de que una v.a X se desve absolutamente de su 2 media en menos de k , es al menos 1-1/k ; es decir: p(|x- | k ) 1-1/k
2

Ejemplo: Si k = 2 en la desigualdad de Chebyshev vemos que: p(|x- |>2 ) p(|x| 0.25

2 ) > 0.75

Literalmente la probabilidad de que x difiera de su media en ms de 2 desviaciones estndar es menor o igual a 0.25. LEY DE LOS GRANDES NUMEROS La ley de los grandes nmeros afirma que el promedio de un nmero de variables aleatorias, idnticamente distribuidas e independientes converge hacia el valor esperado de la distribucin subyacente de X, cuando aumenta el nmero de variables aleatorias; es decir: p (| - |> ) -> 0 cuando n-> tambin p| - | ) ->1 cuando n ->

Ejemplo: Un fabricante de acumuladores asegura que su producto tiene una vida promedio de 1000 horas y una desviacin estndar de 100 horas. Un comprador desea seleccionar una muestra de acumuladores de modo que la 1 vida promedio muestral difiera de la media poblacional en ms de 50 horas, con una probabilidad de 0.03. Hallar el tamao, de muestra: Solucin En este caso, si en la desigualdad de chebyshev, reemplazamos X por , 2 2 por /n = E( ), tenemos: 2 2 P[ I - I > ] ( /n ); P[ I I >50 ] 0.03 2 2 Luego: = 50, = (100) Reemplazando estos valores en la desigualdad de Chebyshev, resulta: n>(
2

0.03) = [(100 / (50) (0.03)] = 133.33

134 acumuladores

TEOREMA DEL LIMITE CENTRAL Si S es la suma de un gran nmero de variables aleatorias independientes e 2 idnticamente distribuidas con media y varianzas p y o respectivamente. Se cumple que la variable aleatoria. Lim [(S - n )/( n)] ------- ->N(0,1) n -> Donde n es la media de S" y n es su desviacin estndar.

La importancia del T.L.C. para el clculo es que, para n grande, podemos expresar la distribucin acumulada de "S" en funcin de la N(0, 1) como sigue: P(S S0 ) = P[ Z (S0 - n )/ )]

En cuanto a cuan grande debe ser "n" depende de la precisin de la aproximacin requerida y de las formas de distribucin reales de X. Si X es normal, la aproximacin proporciona probabilidades exactas no importa el tamao de "n".

Si no se sabe nada acerca de los tipos de distribucin de X, la regla prctica es que n Para aproximaciones satisfactorias a la normal:

30.

Ejemplo: Una fbrica de productos enlatados produce carne enlatada con una media de 5 2 onzas y una varianza de 0.3 onz por lata. Supongamos que los pesos de las latas son estadsticamente independientes e idnticamente distribuida. Cul es la probabilidad de que una caja de 60 latas tiene un peso menor de 290 onzas o mayor de 310 onzas ? Solucin Peso por cada lata (onzas.) 2 De X no se conoce su distribucin pero tiene media = 5 onzas y varianza = 0.3 onz conocidas Tamao muestral n = 60 latas. P 2 2 eso medio de la caja: n = (60)(5)=300 onz y una varianza de n = (60)(0.3)=18 onz Segn el TLC. el peso de una caja, designado por S, ser distribuida de forma aproximada a la normal, de este modo: N(300i;18). P(S 290 onz) = p[Z (290-300)/( )]=P(Z<-2.36)=0.0091

P(S>310) = P[Z > (310-300)/

)] = P(Z>2.36)=0.0091

DISTRIBUCIN MUESTRAL
Una distribucin muestral es una distribucin de Probabilidad de una estadstica muestral reculada a partir de todas las muestras posibles de tamao "n" elegidas al azar de una poblacin terminada. Generalmente nos interesa conocer una o ms de los siguientes caractersticas de la distrribucin muestral. Su media. Su desviacin estndar (error estndar). Su forma funcional (como aparece en su representacin grfica Trataremos de exponer el mtodo de construir distribuciones mustrales a fin de que el lector comprenda la naturaleza de tales distribuciones y su papel en la inferencia estadstica.

POBLACIN N

MUESTRA1 Media 1 2 Varianza s1 Proporcin P1

MUESTRA2 Media 2 2 Varianza s2 Proporcin P2

MUESTRAm Media m 2 Varianza s3 Proporcin P3

Al observar el diagrama; decidimos que cada estadstica muestral es una v.a.; esto es:

i , S2i, Pi, para i =1,m son variables aleatorias de las cuales es de inters conocer su
distribucin de probabilidad o distribucin muestral

DISTRIBUCIN MUESTRAL DE LA MEDIA ( ) La distribucin muestral de X es la distribucin probabilstica de todos los valores posibles de X que pueden ocurrir cuando se toma una muestra (de tamao n) de alguna poblacin madre con media y con varianza
2

Como el proceso de eleccin de las unidades mustrales pueden hacerse a partir de una poblacin finita o infinita, con o sin reemplazo, consideramos 2 casos: 1 Si la seleccin se hace con reposicin de una poblacin finita o equivalentemente sin reposicin de una poblacin infinita. Si X es la media muestral, entonces:
1) 2)

E ( ) = Var( )=

3) Para n suficientemente grande, la variable aleatoria.

Tiene distribucin aproximada normal N(0,1) Lo que revela que:

1,

adems,

-> 0 cuando n ->


2

Para n suficientemente grande, ------------------ N ( , /n), sta aproximacin es buena si n 30. Sin importar si ia poblacin es discreta o continua. Si la poblacin ----------------------------- N ( cualquier tamao de muestra n > 2.
2

), entonces ---- N (

/n), para

N ( , /n), si el muestreo es con reemplazo de una poblacin finita de tamao N, o sin reemplazo de una poblacin infinita.
-----------------------

Si el muestreo es sin reemplazo en una poblacin finita de tamao N, entonces la media y la desviacin estndar (error estndar) de la variable son:

El coeficiente ( -

) se denomina factor de correccin para poblacin finita (fcpf).

Cuando N >>, el fcpf -----> 1. Y debe obviarse en la formula anterior.

Ejemplo: Consideremos una poblacin hipottica de tamao N=5. Cuyos valores son: Rx = { 2, 4, 6, 8, 10 }. a. Calcular la media y la varianza de la poblacin b. Determinar la distribucin de las medias de muestras de tamao 2, seleccionadas al azar con reposicin. c. Determinar la distribucin de las medias de muestras de tamao 2, seleccionadas al azar sin reposicin. Solucin a. La distribucin de probabilidad de esta poblacin (X) finita de tamao N = 5, es la 'distribucin uniforme:

Xi P(xi) = P(X=xi)

2
1/5

Tabla 01 4 1/5

6
1/5

8
1/5

10
1/5

b. Se pueden extraer m= N =5 = 25 muestras de tamao dos con reposicin. Las muestras y sus medias correspondientes son las siguientes:

Tabla 02 1 Unidad Muestral 2 2 4 6 8 10 Medias en ( )


Aqu tiene una media

2 Unidad Muestral 4 2.4 (3) 4.4 (4) 6.4 (5) 8.4 (6) 10.4 (7) 6 2.6 (4) 4.6 (5) 6.6 (6) 8.6 (7) 10.6 (8) 8 2.8 (5) 4.8 (6) 6.8 (7) 8.8 (8) 10.8 (9) 10 2.10 (6) 4.10 (7) 6.10 (8) 8.10 (9) 10.10 (10) 2.2 (2) 4.2 (3) 6.2 (4) 8.2 (5) 10.2 (6)
=6y

=8

Considerando todas las muestras posibles con reposicin: a) m = N = 5 = 25 b) Clculo de medias i : Ver tabla 02. c) Luego construimos la distribucin de probabilidad de
Valores Posibles 2 3 4 5 6 7 8 9 10 TOTAL Probabilidad (P( )) 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25 25/25 =1.00
n

Para esta distribucin de , se tiene:

Pero el valor de la varianza se puede calcular tambin mediante: Constatndose que la frmula , es correcta.

c. Consideremos todas las muestras posibles de tamao (2) sin reposicin. El nmero m" puede ser determinado de dos maneras diferentes: Considerando el orden m= NPn = N! / (N-n)! Cuando el orden no es importante m = N C n = N! /[ n! (N-n)!] En la prctica se usa la seleccin sin reemplazo, cuando el orden no es importante. ( Diagonal superior o inferior de la matriz)
a) Clculo de las medias correspondientes a cada muestra. b) Distribucin muestral de
Valores Posibles 3 4 5 6 7 8 9 TOTAL Probabilidad (P( )) 1/10 1/10 2/10 2/10 2/10 1/10 1/10 25/25 =1.00

Para distribucin de , se tiene:

( )

NOTA: Si el tamao de la muestra es pequeo en relacin con el de la poblacin (digamos 10% menos), entonces, da resultados correctos an en el caso de muestreo sin reposicin.

A. DISTRIBUCIN MUESTRAL DE CUANDO LA POBLACIN MADRE ES NORMAL [ es conocida) Si la poblacin madre (X) se distribuye normalmente con media y varianza

, entonces

la distribucin de cualquiera que sea su tamao es tambin normal con: a. b.

Ejemplo: En la inspeccin por muestreo de lotes de bananas importadas, se mide la longitud de un banano. Se sabe que la produccin de bananos tiene distribucin normal con media 20 cm y desviacin estndar de 1.5 cm. Se toma una muestra aleatoria de tamao 25. Si la media muestral es menor que 20 cm. No se compra el lote y si es mayor que 20 se compra, pagando sobre el precio base una cantidad adicional C = 1000 ( - 2 0 ) probabilidad de que la cantidad a pagar sea menor que S/. 75? Solucin Sea X la longitud de un banano (cm). X ----- N ( La ----- N ( ) = (20, 2.25). ) = N(20, 0.09)
2

nuevos soles. Cul es la

Luego la probabilidad pedida ser: P (C 7.5) = p[1000 ( = P[-0.075 (-20) ) 0.075 (-20)/ (/ ) (0.075 / )] 75] = p[( 0.075]

= P[-(0.075 / = P [ -0.91 Z

0.091] = 0.63718

2 B. DISTRIBUCIN MUESTRAL DE CUANDO ES CONOCIDA Y SE DESCONOCE

LA DISTRIBUCIN DE LA POBLACIN, Independientemente de la distribucin que tenga la poblacin madre (siempre que tenga una media finita y varianza ), la distribucin ------- N (
2

, /n), cuando n -- .

NOTA: 1/ no se requiere ninguna suposicin acerca de la normalidad de la poblacin madre cuando n es grande.

Ejemplo. Los alambres de acero producidos por cierta fbrica tienen una resistencia media a la traccin de 500 libras y una desviacin estndar de 20 lib. Si se extrae de la lnea de produccin durante cierta semana, una muestra aleatoria de 100 alambres, con una produccin total de 100000 unidades. a. Cual es la probabilidad de que la media muestral difiera de la media poblacional en 4 libras o ms?. b. Qu tamao debe tener una muestra a fin de que la probabilidad de que la media muestral difiera de su media poblacional en ms de 4 libras sea slo del 1 % ? Solucin = 500 lib. = 2 lib.

= / = 20

Aqu no se us el fcpf, puesto que n/N = 100/100000 = 0.001 < 0.05


La probabilidad deseada,es: a) p(| ) -500| 4) = (1- p(| ) -500| 4 = 1-p(-4 -500 4) = 1-p(4/2 Z<4/2) = 1-0.9545 = 0.0456 b) p(|) -500|

4) = 0.01 = l-p(-4 _-500 4) = 1-0.01 =0.99 = p(-4/ ( -500)/ <4/) = 0.99 = p(-z Z z) = 0.99

donde:
z = 4 / = 4/[(/ )] = 4 / pero segn tabla z= 2.575

por tanto:
2.575 = 4 /, y despejando n, se tiene: n = (2.575/4) = (2.575x20/4) = 12.875 = 169 C. DISTRIBUCIN DE LA MEDIA MUESTRAL CUANDO ES DESCONOCIDA. Se consideran 3 casos: 1. Si la poblacin madre no es normal y n es pequea. Este caso no puede resolverse. 2. Si la poblacin no es normal, pero n es grande. Cuando la distribucin es simtrica y unimodal, basta que n 10. Caso contrario debe ser n 30, para que siga una distribucin t-Student con n1 g.l, segn T.L.C., es decir:
2
22 2 2

------- t (n-1)

3. Si la poblacin es normal. - Si n < 30, sigue una distribucin t- Student, es decir: ------- t (n-1)

Si n

30, entonces, ------- N (0,1)

EJEMPLO. Supongamos que en una muestra de tamao n=400, encontramos una media =120 y S = 200 y deseamos calcular P( 120 ), supongamos que es desconocida y que = 100. La poblacin no es normal y n Solucin 30, entonces: Entonces: P( 120) = P [T (120-100)/(200/ 2.00 ) ------- t (n-1) )]= P(t 2.00)

0.01 < P( t

0.025.

As, aunque el valor buscado no aparece en la tabla, sugerimos leer las filas que corresponden a los valores de v situados inmediatamente encima y debajo del valor dado. DISTRIBUCIN DE UNA PROPORCION MUESTRAL Si de una poblacin con distribucin Binomial, donde P proporcin de unidades con cierta caracterstica y 1-P es la proporcin de unidades que no poseen la caracterstica, se seleccionan m muestras aleatorias con reemplazo de tamao n y de cada una se calcula , entonces la distribucin de proporciones muestrales tiene. a.

( ) ( )

b.

c.

Si n es suficientemente grande, entonces la variable aleatoria:


Tiene aproximadamente distribucin N(0,1) Si de una poblacin con distribucin hipergeomtrica de tamao N con K unidades que tienen una caracterstica y N-K no la tienen, donde P es la proporcin de unidades que tienen la caracterstica y 1-P no la tienen; se seleccionan m muestras de tamao n (sin reemplazo) y de cada una se calcula su proporcin ,

entonces la distribucin de las proporciones mustrales tiene:

a.

( ) * +

b.

El error estndar es en este caso: La variable


Tiene distribucin aproximadamente normal N (0,1), para n

suficientemente grande. Observaciones: La distribucin de para una muestra al azar tomada con reposicin tiende a una Normal cuando n------- Para una muestra al azar tomada sin reposicin, cuando (n/N < 0.05 ), la distribucin de se aproxima al modelo Binomial, el cual a su vez, se aproxima al modelo normal como lmite.

Si n es suficientemente grande, entonces

Cuando n es pequea se obtienen aproximaciones satisfactorias si se introduce el factor de correccin por continuidad 1/2n, es decir:

La distribucin muestral de X conocida tambin como la distribucin muestral del

a)

nmero de xitos, es binomial B(n,p) y tiene las siguientes propiedades: x = E (x) = np

b) 2x= V(X) = np(1-p) c) Si n es suficientemente grande, entonces la variable aleatoria:


tiene aproximadamente distribucin normal N(0,1).

EJEMPLO: En una remesa de tubos electrnicos, 30% son defectuosos. Si se extrae una muestra al azar de 500, con reposicin, de esta poblacin. Cul es la probabilidad de que la proporcin muestral sea menor que 0.3? SOLUCION Una distribucin muestral que es normal la definen completamente su esperanza y su varianza. Aqu la muestra es suficientemente grande para que la distribucin de sea aproximada por la normal. Para la distribucin de con n = 500, tenemos: E( ) = p = 0.3

Teniendo en cuenta que: fcc = l / 2 n = 1 / 1 0 0 0 = 0 . 0 0 1 La probabilidad pedida ser: P ( 0.3) = P (Z (0.3+1/2n-0.3)/0.025) = P (Z 0.05) = 0.5199

Ejemplo. Una muestra al azar de 20 tubos de radio extrados de un lote de 100, sin reposicin, 80 de los cuales se sabe que no son defectuosos. Cul es la probabilidad de que la proporcin de tubos no defectuosos de la muestra sea menor de 0.7 ? SOLUCIN Aqu tenemos: E ( )=0.8; fcc = 1/2n = (20) = 0.025

En consecuencia: P( 14/20) = P( 13/20) = P(Z(0.65+0.025 -0.8)/0.0804) = P(Z-1.55) = 0.0606

Ejemplo. Suponga que en un lote de 50 artculos electrricos hay 10 defectuosos. Calcular la probabilidad de que en una muestra aleatoria de n artculos escogidos de este lote, con reposicin, se encuentre: i)

20% de artculos defectuosos


Suponer que: a) n = 5 b) n = 60 SOLUCIN

ii) Ms del 20% de artculos defectuosos.

La proporcin de artculos defectuosos en la poblacin es p = 10/50 = 0.2. Esta poblacin, tiene distribucin de Bernoull B(1,0.2). Sea Xi, X2,, Xn una muestra aleatoria de tamao n extrada con reemplazo de esta poblacin y sea X = Xi + X2 + ... + Xn el nmero de artculos defectuosos en la muestra. Entonces la distribucin de X es B(n,0.2). Luego,

La proporcin muestral de artculos defectuosos en la muestra es:

= X/n a) Para n=5 se tiene: ( )

b) Para n=60 se tiene: ( )

Si se aproxima a la normal resulta,

Usando la distribucin muestral de la proporcin, se tiene: ( )

) y de

El valor exacto de:

Usando la aproximacin de la binomial a la normal ( Luego, en este caso, )

Utilizando la distribucin de muestral de la proporcin, se tiene: ( )

DISTRIBUCION MUESTRAL DE NS /

Si X1, X2, ,Xn es una muestra aleatoria, seleccionada de una poblacin normal N( , 2), y si, a) b)

, tiene distribucin X2(n-1)

Si consideramos la varianza incesgada: , entonces a) b) Cuando n es suficientemente grande: c)


X2 (n-1)

EJEMPLO: Si S es la varianza de una muestra aleatoria de tamao n =15 de una poblacin a) b) normal con media y varianza , calcular: 2 2 P(0.3107 S / 1.9427], P[0.3329 S
2
2

/2 2.0814]
SOLUCIN
2

a)

Con n =15 la variable aleatoria 15S

tiene distribucin Chi-cuadrado con 14 grados de

libertad, entonces, 2 2 2 2 P[0.3107 S / 1.9427] = /[(15)(0.3107) 15S / (15)(1.9427)] = P[4.66 X b) Con n =15 la variable aleatoria 14S
2 2

/(14) 29.14] = 0.99 -0.01 = 0.98

/2

tiene distribucin Chi-cuadrado con 14 grados de

libertad, entonces, 2 2 2 2 P[0.3329 S / 2.0814] =P[(14)(0.3329) 14S / (14)(2.0814)] = P[4.66 X


2

/ (14) 29.14] = 0.99 - 0.01 = 0.98

DISTRIBUCIN MUESTRAL DE LA DIFERENCIA DE DOS MEDIAS CON (VARIANZAS POBLACIONALES CONOCIDAS) TEOREMA: Sean las medias de dos muestras aleatorias independientes de y varianzas y
2 1

tamaos n1 y n2 seleccionadas de dos poblaciones con medias


2 2

respectivamente supuestas conocidas, entonces, la v.a.

tiene las siguientes

propiedades: a) b)

c) Para n1 y n2 suficientemente grandes, la variable aleatoria:


N(0,1)

Si n1 30 y n2 30 la aproximacin es muy buena sin importar si las poblaciones son discretas o continuas y sin importar sus formas. Si las dos poblaciones se distribuyen normalmente, entonces, la distribucin de es N( ) y la de es ( es normal, es decir: , por lo tanto, la v.a.

), luego, la distribucin de la variable aleatoria

N(0,1)

para cualquier valor de n12 y n22


EJEMPLO: Se han extrado dos muestras aleatorias de tamao n de dos mquinas que embolsan automticamente un mismo producto cuya caracterstica medible es el peso en gramos. Se sabe que los pesos de los productos de cada mquina se distribuyen normalmente con medias respectivas iguales a 120 gramos y con varianzas respectivas guales a 18 gramos . Encontrar el valor de n de manera que la probabilidad de que las medias mustrales difieran en menos de 2 gramos se 0.95.
2

SOLUCIN
Sean las medias de los pesos de las muestras respectivas. Los pesos de las tiene distribucin normal, esto es:

poblaciones se distribuyen normalmente con medias iguales y varianzas iguales. Entonces, la diferencia de las dos media mustrales , siendo

, y la varianza sera

Luego, la variable estndar:

N(0,1)

Se debe hallar el valor de n tal que: P (| | | , entonces: (| | )= (


0.95 = P (|

( )

De donde resulta, ( ) ( )

DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE DOS MEDIAS CON (VARIANZAS POBLACIONALES DESCONOCIDAS) Sea la media de una muestra aleatoria de tamao n1 extrada de una poblacin normal N normal N y sea la media de otra muestra aleatoria de tamao n2 extrada de la poblacin , independiente de la anterior.

A) Varianzas poblacionales iguales: En este caso, la variable aleatoria tiene distribucin normal, esto es:

, y la v.a. estndar:

Tiene distribucin normal N(0,1). Por otra parte,


; entonces:

Por lo tanto, la variable aleatoria:



t (n1+n2-2)
( )

Ejemplo. A fin de mejorar el rendimiento, se est utilizando un proceso qumico. Por el momento se est utilizando el catalizador 1, pero un nuevo catalizador 2 es aceptable. Se realiza un experimento en la planta piloto, empleando para el catalizador 1 n1= 8 ensayos y n2 = 8 para el catalizador 2. Las medias y varianzas mustrales observadas son 3.89; = 93.75 y S22 = 4.02

= 91.73, S12 =

a) Determinar la distribucin muestral de

b) Asumiendo que las varianzas poblacionales son desconocidas pero iguales. Presentan los datos suficiente evidencia para indicar que el uso del catalizador 2 mejora el rendimiento promedio?

a)

, tiene una distribucin t-Student con (n1+n2-2), es decir: ( )

SOLUCIN

, se denomina varianza combinada, y estima a

Sustituyendo datos, se tiene: b) Para dar respuesta a la proposicin (b), se calcula p


El clculo de P0 se hace por interpolacin, a partir de tablas: Valor de t 1.761 2.03 2.145 P(Tt) 0.05 P0 0.025 Resultando P0=0.0325 Finalmente p
1- 0.0325 = 0.9675

B) Varianzas poblacionales iguales: En este caso la variable aleatoria: Donde:


-2 ; Si g no es entero se redondea al entero ms cercano.

Ejemplo. Una empresa fabrica un mismo producto en 2 mquinas. Una muestra aleatoria de 9 productos de la mquina uno, ha dado los siguientes tiempos de fabricacin en segundos : 12, 28, 10, 25, 24, 19, 22, 33, 17; mientras que una muestra aleatoria de 8 productos de la

mquina dos, 16, 20, 16, 20, 16, 17, 15, 21. Asumir que las dos poblaciones son normales con varianzas diferentes pero desconocidas. a. Hallar la distribucin de probabilidades de =

b. Calcular la probabilidad de que la mquina uno presenta un tiempo promedio mayor que la mquina dos. Solucin Sean X1 y X2 las v.a que representan los tiempos empleados por las mquinas uno y dos, respectivamente. De las muestras dadas obtenemos: a) b) X1:n1 =9, 1 =21.111, S1 =7.4237 X2: n2 = 8, 2 = 17.625, S2 = 2.326

=
=T

, tiene:

= (7.4237)2/9 + (2.326)2/8] =2.6

Tv (t-Student con v grados de libertad); donde.

V=

También podría gustarte