Está en la página 1de 443
ESTADISTICA Inferencial TH Aplicaciones Segunda edicién Mg. Manuel Cordova Zamora ‘e-mail: mcordov@pucp.edu.pe Profesor Principal T.C. del Departamento de Ciencias de la Pontificia Universidad Catélica del Perti ESTADISTICA: Inferencial Aplicaciones Autor: Manuel Cordova Zamora Prohibida la reproduccién total o parcial de esta obra, por cualquier medio, sin autorizacién escrita del autor: Derechos Reservados : Dec. Leg. 822 N°de Depésito Legal : 1501352002-3878 SBN. : 9972-813-15-0 Composicién y diagramacién: Manuel Cérdova Zamora Primera edicién: Agosto de 1999 Segunda edicién: Febrero del 2006 Obra impresa en los talleres grificos de: Distribuidora, Imprenta, Editorial, Libreria MOSHERA S.R.L. Jr. Tacna 2975 Telefax: 567-9299 in Martin de Porres - Lima - Pertt Pedidos: Telf. : 534-0638 Impreso en el Perd - Printed in Pert Presentacién a la segunda edicién Esta publicacién es la segunda parte revisada y ampliada del libro Estadistica descriptiva e Inferencial en su quinta edicion. Su contenido cubre los métodos bdsicos de la estadistica inferencial, que regularmente son incluidos en un curso de estadistica aplicada. El objetivo de esta obra es explicar en forma sencilla los métodos de la estadistica inferencial, con ejemplos y ejercicios algunos de ellos casos del mundo real, desarrollados con paquetes de computo estadistico 0 con calculadoras con estadistica avanzada, que estimulan la curiosidad cientffica del lector, conduciéndoles a la formulacién de modelos de probabilidad, ANOVA y regresion multivariada, de manera que sirva a su formacién bdsica cualquiera sea su especialidad. Los ejercicios de este texto han sido resueltos utilizando el paquete de cémputo: Métodos estadisticos bdsicos, (MCEST), creado por el autor, cuyos resultados son compatibles con los de los paquetes SPSS, ESTADISTICA, EXCEL, MINITAB y otros. Este segundo volumen contiene 9 capitulos. El primero nominado capitulo 8, contiene las distribuciones muestrales. El 9, estimacién de pardmetos. El 10, prueba de hipétesis. El 11, pruebas con chi-cuadrado. El 12, andlisis de varianza. El 13, regresién simple y multivariada. El 14 introduccion a las series de tiempo. E115, una introduccién a las pruebas no paramétricas. Y el 16, una introduccién a la teoria de la decision estadistica. Estoy muy agradecido por la acogida que recibe esta publicacién, y me motiva entonces, a realizar una revision permanente del texto ampliando sus aplicaciones, Quiero expresar también mi agradecimiento a la Pontificia Universidad Catdlica del Pert por permitirme realizar este trabajo fruto de mi experiencia en sus aulas. A mis alumnos de la facultad Ciencias Administrativas y Contabilidad. A mis alumnos de estudios generales ciencias que aplican conmigo los tres primeros capitulos de este texto. Asi mismo, expreso mi agradecimiento a los colegas de Lima y provincias por la aplicacin del texto a cursos de estadéstica inferencial 0 estadistica aplicada a diversas ramas del saber. Lima, setiembre del 2002 Manuel Cérdova Zamora Capitulo 8: 8.1 8.1.1 8.1.2 8.1.3 8.2 8.2.1 8.2.2 8.2.3 8.3 8.3.1 8.3.2 8.3.3 8.3.4 8.3.5 Capitulo 9: 91 9.2 92.3 9.2.2 9.2.3 9.3 9.3.1 94 94.1 CONTENIDO DISTRIBUCIONES MUESTRALES .. 1 Muestreo aleatorio ... 1 Poblacién y pardmetros I Muestra aleatoria y tipos de muestreo .. 2 Estadisticas ..... 7 Distribuciones muestrales ..... 8 Distribucién muestral de la media 8 Distribucién muestral de la proporcién 15 Distribucién muestral de la varianza .. 19 Otras distribuciones muestrales .. 22 Distribucién de una media con varianza poblacional no conocida .... 22 Distribucién muestral de la diferencia de dos medias con varianzas poblacionales conocidas .. 23 Distribucién muestral de la diferencia de dos medias con varianzas poblacionales desconocidas 25 A) Varianzas poblacionales iguales: 25 B) Varianzas poblacionales diferentes. 26 Distribucién muesiral de diferencia de dos proporciones 27 Distribucién muestral de la raz6n de dos varianzas .... 28 EJERCICIOS . 30 ESTIMACION DE PARAMETROS .. 42 Introduccién .... Estimacién puntual de parémetros Estimador insesgado Estimador eficiente Método de maxi EJERCICIOS . Estimacién de pardmetros por intervalo: Intervalo de confianza .. Intervalo de confianza para la media Varianza poblacional supuesta conocida .. 9.4.2 95 9.6 97 97.1 9.7.2 9.8 9.9 9.10 Capitulo 10: 10.1 10.2 10.3 10.4 10.5 10.6 10.6.1 10.6.2 i nocida .. Varianza poblacional supuesta descot 62 varianza .. iene d cies et a veinc Fer de confanza para la diferencia entre dos mediag St i oblacionales supuestas conocidas "i con varianzas poblacionales supuestas desconocidas . 1” B2) Varianzas desconocidas supuestas distin ‘ - 6 Intervalo de confianza para la diferencia entre dos medias con observaciones pareadas .. - 19 Intervalo de confianza para una proporcion .. 82 Intervalo de confianza para la diferencia entre dos proporciones & EJERCICIOS PRUEBAS DE HIPOTESIS .... 105 Introducci6n .... 105 Hip6tesis estadisticas.. 105 Hipotesis simple y compuesta 106 Hipotesis nula y alternativa 106 Prueba de una hipotesis estadistica 107 Errores tipo Ty tipo II. y Nivel de significacion .. Region critica y regla de decisién ... Procedimiento de la prueba de hipstesis Pruebas de hipétesis acerca de una media con varianza poblacional supuesta conocida La probabilidad P de la Prueba Pruebas de hipstesis acerca poblacional supuesta des Pruebas de hipotesis acerca de una varianza . Pruebas de hij s iptesis acerca de la raz6n de dos varianzas .. Pruebas de hipotesis acerca de dos mei jas Varianzas Poblacionales Supuestas conocidas varianzas poblacionales su i \ Supuestas desconi s B1) Varianzas d wale ‘sconocidas supuestas i, sila i Stas iguales . B2) Varianzas desconocidas Supuestas distintas Diagramas de caj : ‘ajas para compar: i ‘ ‘ar mei Prueba de la diferencia entre as con observaciones @Parejadas 110 de una media con varianza ‘conocida ..., dos medias con 10.8 10.8.1 10.8.2 Capitulo 11: ILL. 11.2 11.2.1 11.2.2 11.2.3 Capitulo 12: 12.1 12.1.1 12.2 12.3 12.3.1 12.3.2 Andlisis de varianza de dos factores con replic Capitulo 13: REGRESION LINEAL Y CORRELACION 13.1. 13.1.1. Modelo de regresién li 13.1.2 Estimacién de la ecu; Prueba de hipétesis acerca de proporciones 152 Una sola proporcién ... Dos proporciones con observaciones independientes EJERCICIOS .... LA PRUEBA DE CHI-CUADRADO .. Introducci6n ... 180 Pruebas de bondad de ajuste 181 Ajuste a una distribucién uniforme 183 Ajuste a una distribucién binomial 185 Ajuste a una distribucién de Poisson 187 Ajuste a una distribucién normal . 188 Diagrama de troncos y hojas .... 189 Ajuste normal por gréfica y por Kolmogorov-Smirnov 191 Grdfica P-P Normal 192 Tablas de contingencia y pruebas chi-cuadrado 193 Prueba de independencia .. 194 Prueba de homogeneidad de muestras 197 Prueba para mas de dos proporciones 199 EJERCICIOS .... 201 ANALISIS DE VARIANZA (ANOVA)...... Introduccién oe Modelo de un factor completamente aleatorizado Comparacién miltiple posterior método DMS Comparacién miiltiple posterior método de Scheffé Modelo de un factor aleatorizado por bloques «. Andlisis de varianza de dos factores ..... ‘Andlisis de varianza de dos factores sin repli EJERCICIOS.... Introduccion Diagrama de dispersin jacién de regresiGn . 13.1.3 13.1.4 13.1.5 13.1.6 13.1.7 Capitulo13.2: 13.2.1 13.2.2 13.2.3 fnil dos ... 263 do de mfnimos cuadrad 1 racewetacién de los coeficiente de regresi6n ‘én Estimacién de la varianza de la regresior Error de estimaci6n ... ; Inferencias acerca de los coeficientes de regresion . Distribucién muestral de b .... Intervalo de confianza de B Prueba de hipstesis para B .. Anélisis de varianza (ANOVA) para B Intervalos de estimacién .... - Intervalo de confianza para la prediccién ply, ,, 268, Intervalo de prediccién para un valor Yo .-. Correlacién ... Coeficiente de determinaci Coeficiente de correlacién .... Inferencias acerca del coeficiente de correlaci61 EJERCICIOS 288 REGRESION MULTIPLE Modelo de regresién lineal miltiple . Determinacién de la ecuacién de regresién muestral Interpretacién de la ecuacién de regresién Coeficientes de regresién beta ... Pruebas de significacién de los Coeficientes de regresién . 1) Anilisis de la varianza (prueba global) ..... 2) Prueba de coeficientes individualmente Intervalo de confianza Prueba t .... Prueba por pasos Coeficiente de determinacién miltiple Coeficiente de correlacion miltiple Modelo de regresi 53 Estimadores de minimos cuadrados. Intervalo de estimacién .. Intervalo de confianza para la me Intervalo de prediccin 319 32 ¥ violaci6n de supuestos ms 13.2.10 Prueba de Durbin Watson... 328 13.2.11 Matriz de correlaciones de orden cero .. 329 13.2.12 Coeficientes de correlacién parcial 331 13.2.13 Modelo de regresién curvilineales . 333 EJERCICIOS .... Capitulo 14: INTRODUCCION A LAS SERIES DE TIEMPO .. 14.1 Introduccién . 14.2 Componentes de las series de tiempo .. 14.3 Modelos de series de tiempo 14.4 Anilisis de la tendencia. 14.4.1 Cambio de origen de la tendencia .. 14.5. Anilisis de las variaciones cfclicas 14.6 Medicidn de las variaciones estacionales EJERCICIOS.... Capitulo 15: PRUEBAS NO PARAMETRICAS .. Introduccién 15.1 Algunas técnicas no paramétricas 15.1.1 Una muestra . Prueba de Kolmogorov-Smirnov 15.1.2 Una muestra .La prueba de los signos 15.1.3 Una muestra. La prueba de los rangos 15.1.4 Dos muestras dependientes. La prueba de los signos 15.1.5 Dos muestras dependientes. La prueba de Wilcoxon . 15.1.6 Dos muestras independientes. Prueba Mann-Whitney 15.1.7 K muestras independientes. Prueba Kruskall-Wallis K muestras independientes. Prueba de la mediana . 15.1.8 K muestras correlacionadas. Prueba F de Friedmann .. 396 15.2 Coeficiente de correlacién por rangos 399 EJERCICIOS.. 402 Capitulo 16: | INTRODUCCION A LA ‘TEORIA DE LA DECISION ESTADISTICA 411 . 411 16.1 Introduccién . 7 Asignacién de probabilidades 16.2. Tabla de pagos-. 16.3 16.4 Toma de decisiones .... Criterio basado sélo en probabilidades Criterio basado s6lo en consecuencias econémicas . Criterio maximin Criterio maximax Criterio de arrepentimiento minimax .. Criterio basado en probabilidades y consecuencias econémicas. ... Criterio del pago esperado .... Criterio de la pérdida de oportunidad esperada . Arboles de decisién ... EJERCICIOS..... Capitulo 8 DISTRIBUCIONES MUESTRALES 8.1 Muestreo aleatorio 8.1.1 Poblacién y parametros Definicién, Se denomina poblacién o universo a la totalidad de personas u objetos que ticnen una o mis caracterfsticas medibles 0 contables de naturaleza cualitativa 0 cuantitativa. a caracteristica medible o contable es una variable esiadistica cuyo valor, numérico 0 no numérico, es una observacion. Si la variable estadf es una sola, cada elemento de la poblacién puede asociarse con una observacidn. En este sentido, se denomina poblacién al conjunto de valores posibles de la yariable. Si los elementos de la poblacién se definen en forma aleatoria, entonces la variable estadfstica cuantitativa es una variable aleatoria cuyos valores constituyen la poblacién. En este caso, la distribucién de la poblacién es la distribucién de la variable aleatoria, por lo tanto, la media y la varianza de la variable aleatoria, vienen a ser la media y la varianza de la poblacién. Si la variable aleatoria X tiene distribucién f(x), se puede referir a la poblacién fx). Por ejemplo, si X esté normalmente distribuida se dice que la poblacion esta normalmente distribuida o que se tiene una poblacin normal. Por el ntimero de observaciones la poblacién puede ser finita de tamafio N, 0 infinita. Algunas poblaciones finitas son tan grandes que en teorfa son asumidas como poblaciones infinitas. Definicién, Se denominan pardmetros alas medidas descriptivas que caracterizan a la distribucién de la poblacién. Entre otros, los pardmetros poblacionales son: 2 Estadistica Inferencial Media oH Proporcién :mOp 2 Varianza 16 Desviacién estandar: 6 En diversas aplicaciones estadisticas al estudiar una poblacién, la Variable aleatoria que la define puede tener distribucion conocida ° ne La distribucién de la _poblacién es conocida, si se conocen sus pardmetros y su forma, es decir sj se conoce su distribucién de probabilidad. Si la distribuci6n de la poblacidn es desconocida, podemos estar interesados en: * Estimar sus pardmetros, si se conoce su distribucidn, y * Probar determinada suposicién acerca de un valor determinado de| parémetro, o probar la suposicién acerca del tipo de distribucign de probabilidades de la poblacién. 8.1.2 Muestra aleatoria En vez de examinar la poblacién entera, lo cual puede resultar fisicamente imposible 0 no préctica, puede examinarse una muestra de la poblacidn con el propésito de inferir los resultados encontrados Una muestra es un subconjunto de la poblacion. El proceso de scleccidn de una muestra de n elementos de la poblacién © lama muestreo. Las ventajas y las_razones Pi a ara el muestreo son diversas, ]as mismas que no explicaremos en este texto. El proceso que consiste en inferir result se denomina inferencia estadistica. concernientes a una poblacién d apropiadamente de manera que Tepre: ‘ados a la poblacién a partir de a muest® La confiabilidad de las conclusiones extraidss lepende de sf la muestra se ha escogi? sente bien a la poblacion. En general existen dos tipos de 1 i muestras: Las no ilisticas (basadas ¢” criterio de expertos) y las probabilisticas "” Probabilisticas ( Las muestras aleatorias s on de estratificado y por grupos (0 c a tic POS: Al azar si siste onglomeraten, r simple, al azar Muestra al azar simple Es aquella en la que los elementos de la muestra se escogen del total de la poblacién en forma individual con una oportunidad igual e independiente. Por lo general se utiliza una tabla de ntimeros aleatorios o un programa de computo generador de ntmeros aleatorios para identificar a los elementos numerados de la poblacién que se eligen para la muestra. Si la poblaci6n es infinita el muestreo aleatorio ocurre cuando la extraccién de Jos elementos de la muestra se hace con o sin reemplazo. Si la poblacién es finita de tamafio N, el muestreo aleatorio ocurre también si la extrac reemplazo. Con reemplazo, la probabilidad de cada elemento de ser extraido es 1/N. Si es sin reemplazo, la probabilidad de cada elemento de ser elegido es 1/N en la primera extraccién, es de 1/(N-1) en la segunda extraccién, es 1/(N-2) en la tercera extraccién, etc. Seleccionar una muestra al azar simple es similar a la que se realiza en la extracci6n aleatoria de nimeros en una loteria. Un modo més conveniente de seleccionar muestras al azar simple es enumerar a todos los elementos de la poblacién y luego usar una tabla de mimeros aleatorios. (Ver por ejemplo pagina 223 y apéndice E de la referencia 8) nes con o sin Por ejemplo, si queremos scleccionar una muestra al azar simple de 4 alumnos de la lista de la clase que tiene 50 alumnos, se escriben los ntimeros 01 a 50, se colocan en una urna, se chocolatea y Inego se escogen 4 de las fichas de la urna. El lector deberfa hacer esta selecci6n con una tabla de nimeros al azar. Muestra al azar sistematica Una muestra aleatoria sistematica es aquella en que sus elementos se eligen de la poblacién a intervalos uniformes a partir de un listado ordenado. El k-ésimo elemento de la muestra es k=N/n, donde n es el tamajio de la muestra y N el tamaiio de la poblacién, Por ejemplo, al clegir una muestra sistematica de 100 alumnos de los 3000 alumnos que tiene Estudios Generales ciencias de la PUCP, k Primero se elige en forma aleatoria de los 30 primeros de la lista y los demas sistematicamente cada 30 alumnos de la lista. Muestreo aleatorio estratificado Primero se clasifican a los elementos de la poblacién en de acuerdo con una o més caracteristicas importantes (estratos). Después se obtiene Por separado una muestra aleatoria simple o sistematica en cada estrato. El tamafio de cada submiuestra debe ser proporcional al tamaiio del estrato para asegurar representatividad. subgrupos separados 4 Estadistica Inferencial leatoria de 600 electores de una pobl jemplo, para obtener una muestra al ; de conn ected de los cuales 300,0000 son de clase baja, 200000 de Clase ha ¥ 100,000 de clase alta, Se deben elegir al azar 300 de clase baja, 200 de clase moa 100 de clase alta. lacign Muestreo aleatorio por conglomerados Denominado también muestreo agrupado se utiliza cuando se trata de obtener una muestra al azar de una poblacién dispersa en una gran Area geogrdfica (ver referencia 8 pagina 227). Los elementos de la poblacién se dividen en forma natural en subgrupos. Luego se eligen al azar los subgrupos que forman la muestra. Por ejemplo, al estudiar los pensiones que se pagan en los colegios particulares de Lima, serfa dificil obtener una lista de todas las pensiones que forman la Poblacién, pero puede obtenerse una lista de los colegios particulares de Lima (grupos). Entonces, con esta lista puede obtener una muestra aleatoria de colegios y asf obtener los pensiones que se pagan en estos colegios. streo aleatorio simple cada jeuyo valor es xj, tiene la misma distribucién de la poblacién de la cual se obtiene. Por ejemplo, Supongamos que una poblacié i ! - n ce cha $s con ¢! nimero 2 cents one amos Ps cConsiste de 8 fichas, dos con *0 5, y dos con el niimero 7 al " : ae 7 - Si se extrae una ficha al azar, ‘a ficha ede om y aalaulera de los tres valores: 2 con probabilidad 0.25. 5 0, col ili i sistibucién dela poblacign, ” POP*DIlidad 0.25,’ que viene a ser la misind Luego, diremos que los val ores x,.2,,.., variables aleatorias x,, x, Llamaremos tambié: : ‘N muestra aleatoria . Heatorias, Formalmente definimos. <7 simple a este Conjunto de variables muestra aleatoria de la forma siguiente,» ™U°Stta aleatoria simple o brevement€ Distribuciones muestrales 5 Definicién. (Muestra aleatoria simple). Dada una poblacién fix) con media wt y varianza 0? se denomina muestra aleatoria de tamafio n de esa poblacién, a un conjunto den variables aleatorias X,,X,,...,X,, tales que: 1) Son independientes. 2) Cada una de ellas est distribuida en forma idéntica a fix). La condicidn 1) implica que la distribucién de probabilidad conjunta de la muestra aleatoria X,,X),...,X,, es la expresion: FO Xp veonty) = fF). LO) La condicién 2) significa que: a) Cada variable aleatoria X; tiene la misma media y varianza de la distribucin de X, es decir: E(X,)=m y Var(X,)=07 b) La distribucién de probabilidad de cada variable aleatoria X, es la misma distribuci6n de probabilidades de X, esto es, f(x;)= f00 - NOTA. El proceso de obtener este tipo de muestra requiere poblacién infinita 0 bien poblacién finita pero con reposicin de elementos. EJEMPLO 8.1. Sea X1,X2uX N(y, 0°). |, una muestra aleatoria de tamafio n de una poblacién normal a) Escriba la funcién de densidad de probabilidad conjunta de la muestra b) Sin=6, p=20 ,y o7=25, calcule la probabilidad de que bl) X, +X, +X4—Xe sea mayor que 52. b2) al menos una de las X; sea menor que 29.8. SOLUCION. a) La funcién de densidad conjunta de la muestra aleatoria es FO kp ky) = FOF 2)L On) = VO! 6 Estadistica Inferencial f(xy Xp Xy bl) La media y la varianza de la variable aleatoria Y = X, +X; +X4—-X. estan dadas respectivamente por: E(Y) = E(X,)+ E(X ;)+ E(X4)- £(X_)= 20+ 20+ 20-20 = 40. V(¥)=V(X,)+V(X5)+V(X4)+V(X_)= 25+ 25 +25 +25 = 100. Por la propiedad reproductiva de la normal la variable aleatoria Y tiene distribucién normal N(40,100), luego, la variable aleatoria esténdar: Y-n, _Y- Za tor 40 icne distribucion NOI, y oy 10 niy >saj= A] 70, 32-80) yz > 1.2) =0.1181. b2) Sea ahora la variable aleatoria o si X,<29.8 '|0, si X;>29.8" Entonces, Y, es Bernoullf B(I,p), donde p= PLY, =1], la probabilidad del éxito es igual a: p= PIX, <29.8]= pf X20 208-20 3 + P(Z <1.96} = 0.975. 6 En consecuencia, la variabli 2 le aleatoria: ¥ = )°Y, es binomial B(6, p), esto es, PY =CyP' (py 0,1,2,3,4,5,6, Por tanto, la probabilidad de que al menos un Xj, sea menor que 29.8 es: PY 21)=1 PIY =0]=1-(0.025)* — 0.000 = 1.000. Distribuciones muestrales 7 8.1.3 Estadisticas Definici6n. Se denomina estadistica a cualquier funcién de las variables aleatorias que constituyen la muestra. Una estadfstica es pues una variable aleatoria Y=H(X,,X3..4X,). cuyo valores el ntimero real y= H(x,,.45,...x,). El término estadistica se usa para referirse tanto a la funcidn de la muestra 0 yariable aleatoria, como al valor de esta variable. En general para cada pardmetro poblacional hay una estadfstica correspondiente acalcularse a partir de la muestra. Algunas estadfsticas importantes y sus valores calculados a partir de una muestra aleatoria de tamafio n son: a) La media muestral: X 'yx, (variable aleatoria), Lys, (valor) na ix i d) La proporcién muestral: Po P = YX; Porcentaje de éxitos en la muestra) né donde X, ~ BC, p) (el pardmetro p es el porcentaje de éxitos en la poblacion) También, donde X ~ Bn, p) El valor de P (o P ), calculada a partir de una muestra es P (0 P = x/n NOTA. Error de muestreo es la diferencia entre una estadistica de la muestra y ef Pardmetro correspondiente de la poblacisn NOTA. Una estadistica importante también es el (otal de fa muestra Y°X, = 1X . Su pardmetro correspondiente es el total de Ia poblacién finita. 8 Estadistica Inferencial 8.2 Distribuciones muestrales n. Se denomina distribucién muestral de una estadistica a la distribucién de probabilidad. de esa variable aleatoria Por ejemplo, a la distribucién de probabilidad de la estadistica media: X , se le denomina distribucién muestral de la media. Las aplicaciones de las distribuciones muestrales son aplicaciones del teorema central del limite 8.2.1 Distribucién muestral de la media X TEOREMA 8.1. Sea X,,X,.....X,,, una muestra aleatoria de tamafio n escogida de una poblacién fix) que tiene media jt y varianza o° Si X es la media muestral , entonces, a) E(X)=p b) Var(X) n c) Para n suficientemente grande, la variable aleatoria, , FW o/vn tiene distribucién aproximadamente normal N(O,1). PRUEBA. Por la definicién de muestra aleatoria, las variables aleatorias X,,X yup. Son independientes € idénticamente distribuidas como fix) con E(X, Hh. y con Var(X ;) = 0? . Entonces, a) E(X)= 15x, -2¥atx,) b) van =u 2504,] : Dvix,)= ws c) Se deduce de! teorema del limite central escribiendo Distribuciones muestrales 9 NOTAS. 1. ta aproximacion de X ala normal N(u,67/n) es buena si n>30, sin importar si la poblacién es discreta 0 continua. ‘ 2. Si la muestra aleatoria es escogida de una poblacién normal N(u.0°) entonces, la distribucién de X es exactamente normal N(u,67/n), para cualquier tamajio de muestra, n>2. s 3. La varianza de la media: Var(X) es valida, si el muestreo es con o sin n reemplazo en una poblacién infinita, (0 ¢s con reemplazo en una poblacién finita de tamafio N). Si el muestreo es sin reemplazo en una poblacién fi entonces, la varianza de la distribucién de X es: wt} n\N-1) se denomina factor de correccién para poblacién de tamaiio N, N-n El coeficiente finita. Observe que cuando N —> + el factor de correccién tiende a uno, 4. La desviacién estindar de una estadistica es conocida como error estandar. EJEMPLO 8.2. Una fabrica textil tiene 5 operarios. operarios son Los afios de servicio en la fabrica de estos 3, 4,7, 9, 12. a) Calcule la media y la varianza de la poblacién de afios de servicios. b) Determine la distribucién de la media de la poblaci6n (sin reposicién). a media de las muestras de tamafio dos escogidas de las muestras de tamafio dos escogidas c) Determine Ia distribucién de I con reposicién. as al azar de tamafio 36 con reposicién, gcudl es la d) Si se extraen muestr , ‘dia muestral esté entre los valores 5 y 8? probabilidad de que Ia met 10 tadistica Inferencial SOLUCION a) La distribucién de probabilidad de esta poblacién finita de tamaiio N=5, distribucién uniforme siguiente: = 10.8. 5 b) Se pueden extraer. C} = 5x4=20 muestras de tamajio 2 (sin reposicin) Las muestras y sus medias respectivas son las siguientes: es la Muestras Medias de las muestras 3,4 AF Lg 3,12 5 6 75 4,3 4,7 4,9 4,12 3.5 a5 65 8 ia 74 7,3 7,12 3 3.8 8 9.5 9,3 4 9,7 9,12 6 65 8 10.5 12,3 12,4 12,7 12,9 75 8 95 10.5 La distribucién de probabilidades de la media es: 3.5 5 ae 6 65 15 8 25 10.5 S(%) | 2/20 | 2/20 | 2/20 | 2/20 | 2720 | 2/20 | 4720 | 2720 | 220 Luego, ¥) =) s@H)¥=140/20=7. Observe también que: =Var(X) =" (x? —p Distribuciones muestrales 1 C) Se pueden extraer $x5=25 muestras de tamafio dos con reposicisn. Las muestras y sus medias son las siguientes. Muestras Medias de las muestras 43 3.4 3,7 3.9 3,12 3 a5 5 6 7S 43 44 4.7 4,9 4,12 3.5 4 55 65 8 a3 74 aa 7,9 7,12 5 5.5 7 8 9.5 93 9,4 9.7 9,9 9,12 6 6.5 8 9 105 12.30 12,4 12,7) 12,9 12,12 15 8 95 105 12 La distribucién de probabilidades de las medias es: 65[ 7175], 8 | 9 [95 [105 fara | 1725 [2/25] 4725 | 1725] 2/25] 2/25 ¥ 13 [35|4]5 [55] 6 f (R) {1/25 2/25]1/25 2/25] 2/25 | 2/25. Luego, = E(X) =} fF = 175/25 =7. _ 1360 25 Observar también que : d) Sea X la media de las muestras de tamafio n= 36 con reposicin. Laestadistica X tiene media y varianza respectivas: by 0 E(X)=py =7 10.8 n 36 Elerror estindar de X es © oy 0 Var(X)= Entonces, la variable esténdar, tanto, tiene distribucién aproximadamente normal N(0,1). Por = P[-3.64 $ Z $1.82] = 0.9655. 12 Estadistica Inferencial STE eto, da automéviles por familia es una variable aleatoria y gy, distribucién de probabilidad es como sigue: x 0 I 2 3 | 4 - fo 4/i2 a2 | 2/12 wi2_ | 12 Halle la media y la varianza de la poblacién del niimero de automviiey jor familia = b) i se escoge al azar una muestra de 49 familias, ,cudl es la probabilidag de que la media muestral de autos por familia esté entre 1 y 2?. a) SOLUCION. a) La media y la varianza de X son respectivamente: 4 4 2 1 1 = = Dx, f(x.) =O0(—) +S ee —) +4(—) =1.25. By =E(X) = xf (aj) OT + 1G) + 25) + 3G) + GD Huy =F fey) (tty =3.08- (1.25)? =1.52. b) Sea X la media del nimero de automéviles en muestras de 49 familias. La estadfstica X tiene distribucidn aproximadamente normal con media y varianza respectivas: Hy 0 E(X)=py =1.25 9} 0 Var(X) =F = 152 _g ys). n 49 El error esténdar de la media X es: = 0.031 = 0.176 Entonces, la variable estindar, 0.176 ene disiibucién aproximadamente normal M(0,1), Por tanto, mis s2yae] 1425 <7 2-125 0.176“ Soa ag- |S PI-1.42 < z < 4.26] = 0.9222. Distribuciones muestrales 13 EJEMPLO 8.4 Un auditor toma una muestra aleatoria de 100 cuentas por cobrar: de una poblacién de 500 cuentas por cobrar. El auditor sabe que las 500 cuentas por cobrar constituyen una poblacién fi cuya desviacién estandar es o = $145. ;Cudl es la brcpotaidad de que la media muestral difiera de la media poblacional en mas de SOLUCION. Sea X la media de la muestra de tamafio n = 100 escogida de la poblacién finita de N=S00casos. Entonces, la variable aleatoria X tiene distribucién aproximadamente normal con media ty =) y error estandar: o [N-n _ 145 [500-100 vnVN-1 Ji00 V 500-1 En consecuencia, la variable aleatoria estandar: X=wy X-p Z = 12.982 tiene distribucién normal N(0,1). La probabilidad de que la media muestral difiera de la media poblacional en mas de $26 es: P|x-n|>26]= alll > “all = Pilz|> 2.00] = 0.0456 EJEMPLO 8.5. Se puede ajustar una maquina de refrescos de tal manera que Ilene los vasos con un promedio de 41 onzas por vaso, donde la cantidad de onzas por vaso tiene una distribucién normal con una desviacién esténdar de 0.5 onzas a) Encuentre el valor de pt de tal manera que al Henar vasos de 10 onzas solamente se derramen el 3% de los vasos Con el valor de jt hallado en a) encucntre la probabilidad de que al lenar b 100 vasos de 10 onzas el promedio del Ifquido derramado sea mayor de 0.06 onzas. , , {Con cudntos vasos de 10 onzas se consigue que el contenido promedio del Tiquido sea menor al promedio de la poblacién en 0.1225 onzas con probabilidad igual a 0.025?. c 14 Estadistica Inferencial SOLUCION. la méoui Sea X el contenido en vasos de 10 onzas oo aquina de refrescos, L distribucién de X es normal, esto es, X ~ N(u, 0.5"). a) Se debe calcular p tal que P[X >10]=0.03 10 .. -pAzZ 0.03 = PLX > 10] a > all de donde resulta: 1O=H 1 gg yp =9.06 0s b) Sea X la media de los contenidos de 100 vasos. Por el teorema del limite central, la variable aleatoria X tiene distribucién aproximadamente normal con media 11 ¢ = 9.06 onzas y error estandar: =o/n =0.5//100 = 0.05. Entonces, la variable aleatoria estandar: o/Vn 0.05 tiene distribucién normal N(O,1). La probabilidad de que al llenar 100 vasos de 10 onzas el promedio del liquido derramado sea mayor de 0.06 onzas es: PLX > 10.06] = 10.06-9.06) _ Y re» 00s |= P12>20]=0.000 ©) Sea ¥, i ‘ x, ) Sea X,, la media de la muestra de ‘amaiio n. Entonces, la distribucién de X,, ¥ ror esténdar igual a 0.5//n. Se debe 0.0250= PLX, <8.9375) = pl 7 < 8:9375-9.06 De donde resulta, asin J 20.1225 ii Os Y"=-1.96 vn =8 n=64 Distribuciones muestrales 1S 8.2.2. Distribucién muestral de la proporcién .Xp una muestra aleatoria de Sea X,,X amafio n_escogida de la poblacién de Bernoulli B(1, p), donde p es cl porcentaje de éxitos en Ia poblacién y sea XytXy tik XxX n n P- la proporcién de éxitos en la muestra, siendo, X =X, +X5 +> variable binomial B(n, p), entonces, -+Xq_ una a) up = E(P)= ~) b) 0% =V(P) -(4) n 1 (=p) V(X) =—Inpil- py}= 2. a n c) Sines suficientemente grande, entonces la variable aleatoria: Zz ae pA p)/n tiene distribucién aproximada N(0,1). NOTAS. _ rl p). 1. Elerrorestindar de P es: o7 - {ee 2. Sila poblacién es finita de tamaiio Ny el mucstreo es sin reposicion el error estandar (desviacion estandar de la hipergeométrica) es pp) [Non oF n N-1 Observe que si el tamaiio N de Ia poblacisn, es grande con respecto an, el factor de correccién se aproxima a la unidad. 16 Estadistica Inferencial > 43, Sines suficientemente grande (7 = 30) Sin embargo aproximaciones satisfactorias se obtienen si se introduce e| factor 1 de correccién por continuidad ma Luego, (et 2m) z| WP ederfz oP 4. Observe que la variable estandarizada Z de la proporcién es la misma de la binomial X donde, P =X/n. = X=np_ P-p vnpd=p) p= py. Z tiene distribucién aproximada N(O,1), si n >30 EJEMPLO 8.6. ea gran corporacién estima en 4% el porcentaje de clientes cuyos créditos han pasado a cobranza dudosa. Un auditor revisa Periddicamente las cuentas por cobrar Para efectivizar la cobranza. . a) Calcule aproximadamente la Probabilidad di : le ‘s 150 clientes con cuentas acobrar, el 6% que en una muestra aleatoria de haya pasado a cobranza dudosa 7 han pasado a cobranza dudosa. {Cul acepte que es 4% el] Porcentaje de clientes cuyos créditos han pasado a c ' as: obranza dudosa si realmente el porcentaje es 6%? SOLUCION Distribuciones muestrales 17 5 x9 1s PP =0.06)= P| X= 2 |_ pry =9)- 50.96)!" t ] [% a PLX =9] = C1"(0.04)" 0.96)""", =0.0688 El célculo, aproximando a la normal, por el teorema central del limite. se puede realizar de dos modos: Uno, es utilizar la aproximacién binomial a la normal. En este caso. 50 q_ © aproximadamente N(O.1) Otro modo, es usar Ia distribucién muestral de la proporcién, P = X/150, que también se aproxima a la normal. En este caso, P-p P-004 _ P-0.04 = ees caaeigy We eccealaes \damente M(0,1) -/pd-p)/n J0.04x0.96/150 0.016 eS ! <8 <0.06+— 2150) 2(150) PIP =0.06]= Aa06- | =o P < 0.0633] P| 0.0567 — 0.04 0.05/ p = 0.06] =1—0.6628 = 0.3372 donde, se ha utilizado la aproximacién normal de la distribucién de P : 0.05 — 0.06 = P(Z = -0.42] = 0.6628 0.0237 PLP =0.05/ p = 0.06] = oz 2 18 Estadistica Inferencial EJEMPLO 8.7. El gerente de ventas de “TVcable” estima en 20% las conexiones dom; clandestinas. ,Cudl es la probabilidad de que en una muestra d domiciliarias seleccionada de una poblacion de 1,000 domi “TVcable”, mas del 30% resulten clandestinas?. SOLUCION. Sea X el ntimero conexiones domiciliarias clandestinas en la muestra de 199 Debido a que el muestreo es sin reposicién, X tiene distribucién de probabiliday hipergeométrica H(1000, 200, 100). Se debe calcular P[X>30] =P[3130] =1-P[X<30] 0.0043 30-20 en donde, PIX tiene también distribucién aproximadamente normal N(0,1) Luego, — ~ PLP < 0.30} = 0.0043 PIZ < 2.63] =0.9957 8.2.3 Distribucién muestral de ck o TEOREMA 8.2. (Distribucién muestral de la varianza) Si X,,X2,.%q €S una muestra aleatoria escogida de una distribucién normal NWO), ¥ si, Dlx, -x) s? atl . n es la varianza muestral, entonces, a) £(s?)-26 n n a. Xx -x} b) > = =, tiene distribuci6n 47(n-1). o PRUEBA. a) Probaremos primero que: dt, -x) de —pP -n(® pn) En efecto, dl, -x/) dex -p+n-X) Sete tiie (x, -n)? - 2m 49? + n(n? Mt Xx, -47 = i= ¢ (x, -wP nl -H) Ms i Luego, 1S- -¥)\-} Yar, =p)? = UX - 0)" ng nl 20 Estadistica Inferencial 1 (ng?) 2) =— (no E(S) tf b) Probaremos primero que: Sx-aP Si P alo En efecto, Ya, -y? => (x, ~X) +n(X -p) _ a Pyaque 2X ~ #2 (x; -X)=0 2 i=l il Dividiendo por o? la identidad probada, resulta, 2 dado que X, ~ N(u,0°) , entonces, Por otra parte, ney 1)? (* *) tiene distribucion x?(n) y fa tiene distribucién7(1) ony vi milizando métodos avanzados mas all de este libro, puede demostats¢ 1 estas dos lkimas. variables sgn independientes, Luego, por la prop Teproductiva de la distribucién chi-c ‘ . ‘ ‘uadrado resulta que: lex} i i ibucicn 42 “GE tiene distribucién x(n -1

También podría gustarte