Está en la página 1de 57

Instituto Tecnolgico Superior de la Sierra Negra de Ajalpan

INGENIERIA INDUSTRIAL

MANUAL: ESTADISTICA INFERENCIAL 1

CATEDRATICO: J.GUADALUPE RODRIGUEZ RAMOS

15 DE DICIEMBRE DEL 2012

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Propsito del curso
La materia de Estadstica Inferencial I. Se plantea como una asignatura bsica de la Carrera de Ingeniera en Logstica e Industrial y comn a la mayor parte de las Ingenieras. Proporciona los elementos bsicos para hacer anlisis a partir del estadstico de la muestra y conceptos de la estimacin estadstica. Permite establecer inferencias sobre una poblacin, conclusiones a partir de la informacin que arrojan las pruebas de hiptesis. A partir de las pruebas de bondad de ajuste, se establece el nivel de aplicabilidad de los conceptos del anlisis estadstico. 2. A continuacin se explica que es lo que se pretende lograr con este curso y cul es su contenido. 3. Relaciones con el curso presente y con los anteriores, tambin se seala lo que se necesita para entender este curso y que habilidades futuras se podr aprender despus de este.

Objetivos del curso


Comprender los mtodos estadsticos para inferir los parmetros de la poblacin a partir de una muestra de inters de estudio. Determinar los intervalos de confianza referentes a la muestra de inters para inferir el valor de los parmetros de la poblacin de partida. Validar por pruebas de hiptesis, alguna medida de inters en la muestra, y la inferencia en la poblacin de estudio las medidas de: especificacin, dimensiones en calidad, tolerancia, prueba destructiva o no destructiva de materiales, empaques embalajes, etc. Determinar mediante las pruebas de bondad de ajuste el nivel de validez de los modelos en los fenmenos logsticos que se presenten en la prctica profesional, su comportamiento y control normado.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 2

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Contenido o ndice
1. Distribuciones Fundamentales para el Muestreo 1.1. Introduccin a la Estadstica Inferencial. 1.2. Muestreo: Introduccin al muestreo y tipos de muestreo. 1.3. Teorema del lmite central. 1.4. Distribuciones fundamentales para el muestreo. 1.4.1. Distribucin muestral de la media. 1.4.2. Distribucin muestral de la diferencia de medias. 1.4.3. Distribucin muestral de la proporcin. 1.4.4. Distribucin muestral de la diferencia de proporciones. 1.4.5. Distribucin t-student. 1.4.6. Distribucin muestral de la varianza. 1.4.7. Distribucin muestral de la relacin de varianzas. 2. Estimacin. 2.1. Introduccin. 2.2. Caractersticas de un estimador. 2.3. Estimacin puntual. 2.4. Estimacin por intervalos. 2.4.1. Intervalo de confianza para la media. 2.4.2. Intervalo de confianza para la diferencia de medias. 2.4.3. Intervalos de confianza para la proporcin. 2.4.4. Intervalos de confianza para la diferencia de proporciones. 2.4.5. Intervalos de confianza para la varianza. 2.4.6. Intervalos de confianza para la relacin de varianzas. 2.5. Determinacin del tamao de muestra. 2.5.1. Basado en la media de la Poblacin. 2.5.2. Basado en la proporcin de la Poblacin. 2.5.3. Basado en la diferencia entre las medias de la Poblacin.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 3

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


3. Pruebas de hiptesis. 3.1. Introduccin 3.2. Confiabilidad y significancia 3.3. Errores tipo I y tipo II 3.4. Potencia de la prueba 3.5. Formulacin de Hiptesis estadsticas 3.6. Prueba de hiptesis para la media 3.7. Prueba de hiptesis para la diferencia de medias 3.8. Prueba de hiptesis para la proporcin 3.9. Prueba de hiptesis para la diferencia de proporciones 3.9.1. Prueba de hiptesis para la varianza 3.9.2. Prueba de hiptesis para la relacin de varianzas. 3.9.3. Uso de software estadstico. 4. Pruebas de bondad de ajuste y pruebas no paramtricas 4.1. Bondad de ajuste. 4.1.1. Anlisis Ji-Cuadrada. 4.1.2. Prueba de independencia. 4.1.3. Prueba de la bondad del ajuste. 4.1.4. Tablas de contingencia. 4.1.5. Uso del software estadstico. 4.2. Pruebas no paramtricas. 4.2.1. Escala de medicin. 4.2.2. Mtodos estadsticos contra no paramtricos. 4.2.3. Prueba de Kolmogorov Smirnov. 4.2.4. Prueba de Anderson Darling. 4.2.5. Prueba de Ryan Joiner. 4.2.6. Prueba de Shappiro Wilk. 4.2.7. Aplicaciones del paquete computacional.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 4

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


5. Regresin lineal simple y mltiple 5.1. Regresin Lineal simple. 5.1.1. Prueba de hiptesis en la regresin lineal simple. 5.1.2. Calidad del ajuste en regresin lineal simple. 5.1.3. Estimacin y prediccin por intervalo en regresin lineal simple. 5.1.4. Uso de software estadstico. 5.2. Regresin lineal mltiple. 5.2.2 Pruebas de hiptesis en regresin lineal mltiple. 5.2.3 Intervalos de confianza y prediccin en regresin mltiple. 5.2.4 Uso de un software.

Bibliografa
1. DeVore, J. (2005). Probabilidad y Estadstica para Ingeniera y Ciencias. Mxico: Thomson 2. Hines, W. y Montgomery, D. (2003). Probabilidad y Estadstica para Ingeniera y Administracin. Mxico: CECSA 3. Montgomery, D. C. y Runger, G. C. (1998). Probabilidad y Estadstica aplicadas a la Ingeniera. Mxico: McGraw Hill. 4. Ross, S. M. (2001). Probabilidad y Estadstica para Ingenieros. Mxico: McGraw Hill. 5. Salvatore, D., Reagle, D. (2004). Estadstica y econometra. Espaa: Mc Graw-Hill. 6. Spiegel, M. R. (1992). Manual de Frmulas y Tablas Matemticas. Mxico: McGraw Hill. 7. Spiegel, M. R. (1988). Probabilidad y Estadstica. Mxico: McGraw Hill. 8. Walpole, R. E., Myers, R. H., Myers, S. L. (1999). Probabilidad y Estadstica para Ingenieros. Mxico: Pearson Prentice Hall.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 5

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Distribuciones Fundamentales para el Muestreo
Introduccin a la Estadstica Inferencial.

Muestreo: Introduccin al muestreo y tipos de muestreo. Uno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de estudio. Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden hacer observaciones probabilsticas sobre una poblacin cuando se usan muestras representativas de la misma. Una poblacin est formada por la totalidad de las observaciones en las cuales se tiene cierto observa. Una muestra es un subconjunto de observaciones seleccionadas de una poblacin. Muestras Aleatorias Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras por muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser econmicamente imposible, o no se cuenta con el tiempo suficiente. A continuacin se ver algunos usos del muestreo en diversos campos: 1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos midan la opinin pblica y el apoyo en las elecciones. 2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan para determinar la eficiencia de una tcnica o programa de enseanza. 3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la calidad. 4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la eficacia de una tcnica o de un frmaco nuevo. 5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin los efectos de un fertilizante nuevo. 6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional. Errores en el Muestreo ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 6

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Cuando se utilizan valores mustrales, o estadsticos para estimar valores poblacionales, o parmetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral. El error muestral se refiere a la variacin natural existente entre muestras tomadas de la misma poblacin. Cuando una muestra no es una copia exacta de la poblacin; an si se ha tenido gran cuidado para asegurar que dos muestras del mismo tamao sean representativas de una cierta poblacin, no esperaramos que las dos sean idnticas en todos sus detalles. El error muestral es un concepto importante que ayudar a entender mejor la naturaleza de la estadstica inferencial. Los errores que surgen al tomar las muestras no pueden clasificarse como errores mustrales y se denominan errores no mustrales. El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones de un parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parmetro real. El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin. La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida con procedimientos aleatorios se llama muestra aleatoria. Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemtico. Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple Teorema del lmite central Si se seleccionan muestras aleatorias de n observaciones de una poblacin con media y desviacin estndar , entonces, cuando n es grande, la distribucin muestral de medias tendr aproximadamente una distribucin normal con una media igual a y una desviacin estndar de . La aproximacin ser cada vez ms exacta a medida de que n sea cada vez mayor.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 7

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Ejemplo Para la distribucin muestral de medias del ejercicio pasado, encuentre: El error muestral de cada media: a. La media de los errores mustrales b. La desviacin estndar de los errores mustrales Solucin: a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores mustrales:
Muestra (0,0) (0,2) (0,4) (0,6) (2,0) (2,2) (2,4) (2,6) (4,0) (4,2) (4,4) (4,6) (6,0) (6,2) (6,4) (6,6) x 0 1 2 3 1 2 3 4 2 3 4 5 3 4 5 6
e,

Error muestral, e=x0 - 3 = -3 1 - 3 = -2 2 - 3 = -1 33=0 1 3 = -2 2 3 = -1 33=0 43=1 2 3 = -1 33=0 43=1 53=2 33=0 43=1 53=2 63=3

b. La media de los errores mustrales es

es:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 8

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


c. La desviacin estndar de la distribucin de los errores mustrales entonces:
e, es

La desviacin estndar de la distribucin muestral de un estadstico se conoce como error estndar del estadstico. Para el ejercicio anterior el error estndar de la media denotado por x, es 1.58. Con esto se puede demostrar que si de una poblacin se eligen muestras de tamao n con reemplazo, entonces el error estndar de la media es igual a la desviacin estndar de la distribucin de los errores mustrales. En general se tiene: Cuando las muestras se toman de una poblacin pequea y sin reemplazo, se puede usar la formula siguiente para encontrar x .

donde es la desviacin estndar de la poblacin de donde se toman las muestras, n es el tamao de la muestra y N el de la poblacin. Como rfegla de clculo, si el muestreo se hace sin reemplazo y el tamao de la poblacin es al menos 20 veces el tamao de la muestra (N 20), entonces se puede usar la frmula.

El factor Ejemplo:

se denomina factor de correccin para una poblacin finita.

Suponga que la tabla siguiente muestra la antiguedad en aos en el trabajo de tres maestros universitarios de matemticas: Maestro de matemticas A B C Antiguedad 6 4 2 Pgina 9

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Suponga adems que se seleccionan muestras aleatorias de tamao 2 sin reemplazo. Calcule la antigedad media para cada muestra, la media de la distribucin muestral y el error estndar, o la desviacin estndar de la distribucin muestral. Solucin: Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles de tamao 2, con sus respectivas medias mustrales. Muestras A,B A,C B,C Antigedad (6,4) (6,2) (4,2) Media Muestral 5 4 3

La media poblacional es:

La media de la distribucin muestral es: La desviacin estndar de la poblacin es:

El error estndar o la desviacin estndar de la distribucin muestral es:

Si utilizamos la frmula del error estndar sin el factor de correccin tendramos que:

Por lo que observamos que este valor no es el verdadero. Agregando el factor de correccin obtendremos el valor correcto:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 10

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del error estndar:

Distribuciones fundamentales para el muestreo Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando estadsticas mustrales. Como el anlisis de las distribuciones asociadas con los estadsticos mustrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro poblacional desconocido. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 11

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribucin de frecuencias. Distribuciones mustrales La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral. En general, la distribucin muestral de un estadstico es la de todos sus valores posibles calculados a partir de muestras del mismo tamao. Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande. Se calcula la madia muestral x para cada muestra; la coleccin de todas estas medias mustrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en la siguiente figura:

Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se calcula la deviacin estndar de cada una. La coleccin de todas estas desviaciones estndar mustrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en la siguiente figura:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 12

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Ejemplo 1.6 Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y 6. Encuentre: , la media poblacional. , la desviacin estndar poblacional.
x, la x,

media de la distribucin muestral de medias.

la desviacin estndar de la distribucin muestral de medias.

Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias. Solucin: a. La media poblacional es:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 13

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

b. La desviacin estndar de la poblacin es:

c. A continuacin se listan los elementos de la distribucin muestral de la media y la correspondiente distribucin de frecuencias.

La media de la distribucin muestral de medias es:

d) La desviacin estndar de la distribucin muestral de medias es:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 14

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

De aqu que podamos deducir que: Como para cualquier variable aleatoria, la distribucin muestral de medias tiene una media o valor esperado, una varianza y una desviacin estndar, se puede demostrar que la distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:

Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y calculndoles a stas su estadstico. Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias ser normal sin importar el tamao de la muestra.

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin muestral de ser normal. Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La forma de la distribucin muestral de medias sea aproximadamente normal, an en casos donde la poblacin original es bimodal, es realmente notable.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 15

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Distribucin Muestral de Medias Si recordamos a la distribucin normal, esta es una distribucin continua, en forma de campana en donde la media, la mediana y la moda tienen un mismo valor y es simtrica. Con esta distribucin podamos calcular la probabilidad de algn evento relacionado con la variable aleatoria, mediante la siguiente frmula:

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta frmula se pueden a hacer los clculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribucin z. Sabemos que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao de una poblacin normal, la distribucin muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la formula de la distribucin normal con y , entonces la frmula para calcular la probabilidad del comportamiento del estadstico, en este caso la media de la muestra , quedara de la siguiente manera:

y para poblaciones finitas y muestro con reemplazo:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 16

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Ejemplo: Una empresa elctrica fabrica focos que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. Solucin:

Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062. Ejemplo: Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal con una media de 174.5 centmetros y una desviacin estndar de 6.9 centmetros. Si se extraen 200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine: a. El nmero de las medias mustrales que caen entre 172.5 y 175.8 centmetros. b. El nmero de medias mustrales que caen por debajo de 172 centmetros. Solucin: Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el denominador de Z para slo sustituirlo en cada inciso.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 17

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

a.

(0.7607)(200)=152 medias mustrales

b.

(0.0336)(200)= 7 medias mustrales

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 18

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Distribucin muestral de Proporciones Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y "n" el tamao de la muestra) en lugar del estadstico media.

Una poblacin binomial est estrechamente relacionada con la distribucin muestral de proporciones; una poblacin binomial es una coleccin de xitos y fracasos, mientras que una distribucin muestral de proporciones contiene las posibilidades o proporciones de todos los nmeros posibles de xitos en un experimento binomial, y como consecuencia de esta relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden evaluarse usando la aproximacin normal a la binomial, siempre que np 5 y n(1-p) 5. Cualquier evento se puede convertir en una proporcin si se divide el nmero obtenido entre el nmero de intentos. Generacin de la Distribucin Muestral de Proporciones Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la distribucin muestral de proporciones para el nmero de piezas defectuosas. Como se puede observar en este ejercicio la Proporcin de artculos defectuosos de esta poblacin es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote estn defectuosas. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 19

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera: Artculos Buenos Artculos Malos Proporcin de artculos defectuoso Nmero de maneras en las que se puede obtener la muestra
8C1*4C4=8 8C2*4C3=112 8C3*4C2=336 8C4*4C1=280 8C5*4C0=56

1 2 3 4 5 Total

4 3 2 1 0

4/5=0.8 3/5=0.6 2/5=0.4 1/5=0.2 0/5=0 792

Para calcular la media de la distribucin muestral de proporciones se tendra que hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el nmero total de muestras. Esto es:

Como podemos observar la media de la distribucin muestral de proporciones es igual a la Proporcin de la poblacin.
p

=P

Tambin se puede calcular la desviacin estndar de la distribucin muestral de proporciones:

La varianza de la distribucin binomial es = npq, por lo que la varianza de la 2 distribucin muestral de proporciones es p =(Pq)/n. Si se sustituyen los valores en esta frmula tenemos que:
2

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 20

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

, este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de correccin para una poblacin finita y un muestreo sin reemplazo:

La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de proporciones est basada en la aproximacin de la distribucin normal a la binomial. Esta frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra.

A esta frmula se le puede agregar el factor de correccin de con las condiciones necesarias.

si se cumple

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 21

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Ejemplo: Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporcin de la muestra de la gente que fuma cigarrillos sea menor que 0.55. Solucin: Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la aproximacin de la distribucin normal a la binomial y el segundo utilizando la frmula de la distribucin muestral de proporciones. Aproximacin de la distribucin normal a la binomial: Datos: n=800 estudiantes p=0.60 x= (.55)(800) = 440 estudiantes p(x< 440) = ? Media= np= (800)(0.60)= 480

p(x< 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 22

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Distribucin Muestral de Proporciones Datos: n=800 estudiantes P=0.60 p= 0.55 p(p< 0.55) = ?

Observe que este valor es igual al obtenido en el mtodo de la aproximacin de la distribucin normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad de 0.0017. Tambin se debe de tomar en cuenta que el factor de correccin de 0.5 se est dividiendo entre el tamao de la muestra, ya que estamos hablando de una proporcin. La interpretacin en esta solucin, estara enfocada a la proporcin de la muestra, por lo que diramos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad, la proporcin de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%. Ejemplo: Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reaccin adversa a l, ms an, se piensa que alrededor del 3% de los usuarios tienen tal reaccin. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporcin de la muestra de los usuarios que realmente presentan una reaccin adversa, exceda el 4%. a. Resolverlo mediante la aproximacin de la normal a la binomial b. Resolverlo con la distribucin muestral de proporciones

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 23

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


a. Aproximacin de la distribucin normal a la binomial: Datos: n=150 personas p=0.03 x= (0.04)(150) = 6 personas p(x>6) = ? Media = np= (150)(0.03)= 4.5

p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una muestra de 150 personas, mas de 6 presentarn una reaccin adversa. b. Distribucin Muestral de Proporciones Datos: n=150 personas P=0.03 p= 0.04 p(p>0.04) = ?

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 24

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Observe que este valor es igual al obtenido y la interpretacin es: existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una proporcin mayor de 0.04 presentando una reaccin adversa. Ejemplo: Se sabe que la verdadera proporcin de los componentes defectuosos fabricados por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamao 60 tenga: a. Menos del 3% de los componentes defectuosos. b. Ms del 1% pero menos del 5% de partes defectuosas. Solucin: Datos: n= 60 artculos P=0.04 p= 0.03 p(p<0.03) = ?

La probabilidad de que en una muestra de 60 artculos exista una proporcin menor de 0.03 artculos defectuosos es de 0.2327.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 25

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


a. Datos: n= 60 artculos P=0.04 p= 0.01 y 0.05 p(0.01<p<0.05) = ?

Distribucin muestral de la diferencia de medias Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviacin estndar 1, y la segunda con media 2 y desviacin estndar 2. Ms an, se elige una muestra aleatoria de tamao n1 de la primera poblacin y una muestra independiente aleatoria de tamao n2 de la segunda poblacin; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La coleccin de todas esas diferencias se llama distribucin muestral de las diferencias entre medias o la distribucin muestral del estadstico

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 26

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


La distribucin es aproximadamente normal para n 1 30 y n2 30. Si las poblaciones son normales, entonces la distribucin muestral de medias es normal sin importar los tamaos de las muestras.

En ejercicios anteriores se haba demostrado que

y que

, por lo que no es

difcil deducir que

y que

La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de medias es:

Ejemplo: En un estudio para comparar los pesos promedio de nios y nias de sexto grado en una escuela primaria se usar una muestra aleatoria de 20 nios y otra de 25 nias. Se sabe que tanto para nios como para nias los pesos siguen una distribucin normal. El promedio de los pesos de todos los nios de sexto grado de esa escuela es de 100 libras y su desviacin estndar es de 14.142, mientras que el promedio de los pesos de todas las nias del sexto grado de esa escuela es de 85 libras y su desviacin estndar es de 12.247 libras. Si representa el promedio de los pesos de 20 nios y es el promedio de los pesos de una muestra de 25 nias, encuentre la probabilidad de que el promedio de los pesos de los 20 nios sea al menos 20 libras ms grande que el de las 25 nias. Solucin: Datos:
1=

100 libras 2 = 85 libras 1 = 14.142 libras 2 = 12.247 libras n1 = 20 nios n2 = 25 nias =? ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 27

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al menos 20 libras ms grande que el de la muestra de las nias es 0.1056.

Ejemplo: Uno de los principales fabricantes de televisores compra los tubos de rayos catdicos a dos compaas. Los tubos de la compaa A tienen una vida media de 7.2 aos con una desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos con una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra aleatoria de 40 tubos de la compaa B. Solucin: Datos: 7.2 aos B = 6.7 aos A = 0.8 aos B = 0.7 aos nA = 34 tubos nB = 40 tubos =?
A=

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 28

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Ejemplo: Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una desviacin estndar de 1.23km/L para la primera gasolina y una desviacin estndar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos. a. Cul es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina? b. Cul es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?. Solucin: En este ejercicio no se cuenta con los parmetros de las medias en ninguna de las dos poblaciones, por lo que se supondrn que son iguales. Datos:
1=

1.23 Km/Lto 2 = 1.37 Km/Lto n1 = 35 autos n2 = 42 autos a. =?

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 29

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


b. ?

La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.

Distribucin Muestral de Diferencia de Proporciones


Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:

Educacin.- Es mayor la proporcin de los estudiantes que aprueban matemticas que las de los que aprueban ingls? Medicina.- Es menor el porcentaje de los usuarios del medicamento A que presentan una reaccin adversa que el de los usuarios del frmaco B que tambin presentan una reaccin de ese tipo? Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales. Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que genera la mquina A a los que genera la mquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones mustrales, la distribucin muestral de diferencia de proporciones es ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 30

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


aproximadamente normal para tamaos de muestra grande (n1p1 5, n1q1 5,n2p2 5 y n2q2 5). Entonces p1 y p2tienen distribuciones mustrales aproximadamente normales, as que su diferencia p1-p2 tambin tiene una distribucin muestral aproximadamente normal.

Cuando se estudi a la distribucin muestral de proporciones se comprob que que , por lo que no es difcil deducir que

y y

que

La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de proporciones es:

Ejemplo: Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgacin de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos estn a favor de la pena de muerte, mientras que slo 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinin sobre la promulgacin de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 31

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Solucin: Datos: PH = 0.12 PM = 0.10 nH = 100 nM = 100 p(pH-pM 0.03) = ? Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin binomial y se est utilizando la distribucin normal.

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562. Ejemplo: Una encuesta del Boston College const de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984, encontr que 20% haban estado sin trabajo durante por lo menos dos aos. Supngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. Cul sera la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston Collage, en 5% o ms? Solucin: En este ejercicio se cuenta nicamente con una poblacin, de la cual se estn extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 32

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


porcentajes en esas dos muestras, por lo que se debe de utilizar la distribucin muestral de proporciones con P1= P2, ya que es una misma poblacin. Otra de las situaciones con la cual nos topamos es que desconocemos la proporcin de trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un perodo de por lo menos dos aos, slo se conoce la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observ esa proporcin. En la frmula de la distribucin muestral de proporciones para el clculo de probabilidad se necesita saber las proporciones de las poblaciones, las cuales en este ejercicio las desconocemos, por lo que se utilizar el valor de 0.20 como una estimacin puntual de P. En el siguiente tema se abordar el tema de estimacin estadstica y se comprender l porque estamos utilizando de esa manera el dato. Tambin debe de comprenderse la pregunta que nos hace este problema, cul sera la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston Collage, en 5% o ms?, la palabra difiera quiere decir que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se tendrn que calcular dos reas en la distribucin y al final sumarlas. Datos: p1 = 0.20 n1 = 320 trabajadores n2 = 320 trabajadores P1 = P 2

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 33

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

La probabilidad de que su proporcin muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston Collage, en 0.05 o ms es de 0.1260.

Ejemplo: Se sabe que 3 de cada 6 productos fabricados por la mquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la mquina 2 son defectuosos; se toman muestras de 120 objetos de cada mquina: a. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 2 rebase a la mquina 1 en por lo menos 0.10? b. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 1 rebase a la mquina 2 en por lo menos 0.15? Solucin: Datos: P1 = 3/6 = 0.5 P2 = 2/5 = 0.4 n1 = 120 objetos n2 = 120 objetos a. p(p2-p1 0.10) = ?

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 34

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Otra manera de hacer este ejercicio es poner P1-P2:

La probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo menos 10% a favor de la mquina 2 es de 0.0011. b. p(p1-p2 0.15)=?

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 35

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

La probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo menos 15% a favor de la mquina 1 es de 0.2357. Distribucin Muestral de Nmero de Defectos En el control de calidad y especficamente en los grficos de control "c" se aplica esta distribucin, la cual consiste en que al extraer un artculo contabilicemos el nmero de defectos que tiene ese artculo. Esta distribucin muestral proviene de la distribucin de Poisson, en la cual le media es y que en este caso es el nmero promedio de defectos por unidad. Como ya es conocido la varianza de la distribucin de Poisson es igual a por lo que se puede deducir la formula de la siguiente manera:

Para la distribucin muestral de nmero de defectos la nomenclatura utilizada es: c = nmero defectos por unidad de inspeccin C = nmero de defectos promedio por unidad de inspeccin Se debe de recordar que la distribucin de Poisson es una distribucin discreta, y se est utilizando la aproximacin de la normal a la Poisson, debiendo aplicar el factor de correccin de 0.5 segn sea el caso. La frmula para la distribucin muestral de nmero de defectos quedara de la siguiente manera:

Ejemplo:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 36

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


En cierta empresa se fabrican productos con un promedio de 8 defectos por unidad. Determine la probabilidad de que el prximo producto inspeccionado tenga un nmero de defectos: a. Mayor o igual a 6 b. Exactamente 7 c. Como mximo 9 a.

La probabilidad de que el siguiente producto inspeccionado tenga por lo menos 6 defectos es de 0.8106.

b.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 37

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


La probabilidad de que el siguiente producto inspeccionado tenga exactamente 7 defectos es de 0.1344. c.

La probabilidad de que el siguiente producto inspeccionado tenga a lo ms 9 defectos es de 0.7019. DISTRIBUCION "t DE STUDENT" Supngase que se toma una muestra de una poblacin normal con media varianza . Si y

es el promedio de las n observaciones que contiene la muestra

aleatoria, entonces la distribucin es una distribucin normal estndar. 2 Supngase que la varianza de la poblacin es desconocida. Qu sucede con la distribucin de esta estadstica si se reemplaza por s? La distribucin t proporciona la respuesta a esta pregunta. La media y la varianza de la distribucin t son respectivamente. = 0y para >2,

La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada se alcanza en la media = 0. Sin embargo, la distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a infinito, la forma lmite de la distribucin t es la distribucin normal estndar. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 38

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Propiedades de las distribuciones t 1. Cada curva t tiene forma de campana con centro en 0. 2. Cada curva t, est ms dispersa que la curva normal estndar z. 3. A medida que aumenta, la dispersin de la curva t correspondiente disminuye. 4. A medida que , la secuencia de curvas t se aproxima a la curva normal estndar, por lo que la curva z recibe a veces el nombre de curva t con gl = La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con

grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con

media

y desviacin estndar

. Entonces la variable aleatoria

tiene una

distribucin t con

= n-1 grados de libertad.

La distribucin de probabilidad de t se public por primera vez en 1908 en un artculo de W. S. Gasset. En esa poca, Gasset era empleado de una cervecera irlandesa que desaprobaba la publicacin de investigaciones de sus empleados. Para evadir esta prohibicin, public su trabajo en secreto bajo el nombre de "Student". En ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 39

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


consecuencia, la distribucin t normalmente se llama distribucin t de Student, o simplemente distribucin t. Para derivar la ecuacin de esta distribucin, Gasset supone que las muestras se seleccionan de una poblacin normal. Aunque esto parecera una suposicin muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana an proporcionan valores de t que se aproximan muy de cerca a la distribucin t. La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la muestra y siempre es mayor a uno. nicamente cuando el tamao de la muestra tiende a infinito las dos distribuciones sern las mismas.

Se acostumbra representar con el valor t por arriba del cual se encuentra un rea igual a . Como la distribucin t es simtrica alrededor de una media de cero, tenemos ; es decir, el valor t que deja un rea de a la derecha y por tanto un rea de a la izquierda, es igual al valor t negativo que deja un rea de en la cola derecha de la distribucin. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc. Para encontrar los valores de t se utilizar la tabla de valores crticos de la distribucin t del libro Probabilidad y Estadstica para Ingenieros de los autores Walpole, Myers y Myers. Ejemplo: El valor t con = 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por tanto un rea de 0.975 a la derecha, es t0.975=-t0.025 = -2.145

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de . La manera de encontrar el valor de t es

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 40

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


buscar el valor de en el primer rengln de la tabla y luego buscar los grados de y se obtendr el valor de t.

libertad en la primer columna y donde se intercepten Ejemplo: Encuentre la probabilidad de t0.025 < t < t0.05. Solucin:

Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de 0.025 a la izquierda, encontramos un rea total de 1-0.05-0.025 = 0.925. P( t0.025 < t < t0.05) = 0.925 Ejemplo: Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15 que se selecciona de una distribucin normal. Solucin:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a . Luego se busca el valor de 0.005 en el primer rengln con 14 grados de libertad y se obtiene

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 41

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


un valor de t = 2.977, pero como el valor de est en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto: P(-2.977 < t < -1.761) = 0.045 Ejemplo: Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto proceso en lotes es 500 gramos por milmetro de materia prima. Para verificar esta afirmacin toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre t0.05 y t0.05, queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40 gramos? Suponga que la distribucin de rendimientos es aproximadamente normal. Solucin: De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante queda satisfecho con esta afirmacin si una muestra de 25 lotes rinde un valor t entre 1.711 y 1.711. Se procede a calcular el valor de t:

Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.
2

Distribucin muestral de la varianza o Distribucin JI-Cuadrada (X ) En realidad la distribucin ji-cuadrada es la distribucin muestral de s2. O sea que si se extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula su varianza, se obtendr la distribucin muestral de varianzas. Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el estadstico X2. Si se elige una muestra de tamao n de una poblacin normal con varianza , el estadstico:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 42

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1 grados de libertad y se denota X2 (X es la minscula de la letra griega ji). El estadstico jicuadrada esta dado por:

donde n es el tamao de la muestra, s2 la varianza muestral y la varianza de la poblacin de donde se extrajo la muestra. El estadstico ji-cuadrada tambin se puede dar con la siguiente expresin:

Propiedades de las distribuciones ji-cuadrada 1. Los valores de X2 son mayores o iguales que 0. 2. La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay un nmero infinito de distribuciones X2. 3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1. 4. Las distribuciones X2 no son simtricas. Tienen colas estrechas que se extienden a la derecha; esto es, estn sesgadas a la derecha. 5. Cuando n>2, la media de una distribucin X2 es n-1 y la varianza es 2(n-1). 6. El valor modal de una distribucin X2 se da en el valor (n-3). La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-2).

La funcin de densidad de la distribucin X2 est dada por: ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 43

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

para x>0 La tabla que se utilizar para estos apuntes es la del libro de probabilidad y estadstica de Walpole, la cual da valores crticos (gl) para veinte valores especiales de . 2 Para denotar el valor crtico de una distribucin X con gl grados de libertad se usa el smbolo (gl); este valor crtico determina a su derecha un rea de bajo la curva X2 y sobre el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado izquierdo y a o largo del lado superior de la misma tabla.

Clculo de Probabilidad El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber como se va a comportar la varianza o desviacin estndar en una muestra que proviene de una distribucin normal. Ejemplos: 1. Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos en una ciudad grande forman una distribucin normal con una desviacin estndar =1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2. Solucin: Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2 como sigue: ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 44

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de libertad y se encuentra que a este valor le corresponde un rea a la derecha de 0.01. En consecuencia, el valor de la probabilidad es P(s2>2)

2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una poblacin normal con varianza a. Mayor que 9.1 b. Entre 3.462 y 10.745 Solucin. a. Primero se proceder a calcular el valor de la ji-cuadrada: , tenga una varianza muestral:

Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea a la derecha de 0.05. Por lo que la P(s2 >9.1) = 0.05 1. Se calcularn dos valores de ji-cuadrada:

y Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al buscar el valor de 13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98 da un rea a la derecha de 0.01. Como se est pidiendo la probabilidad entre dos valores se resta el rea de 0.95 menos 0.01 quedando 0.94. Por lo tanto la P(3.462 s2 10.745) = 0.94

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 45

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Estimacin de la Varianza Para poder estimar la varianza de una poblacin normal se utilizar la distribucin jicuadrada.

Al despejar esta frmula la varianza poblacional nos queda:

Los valores de X2 dependern de nivel de confianza que se quiera al cual le llamamos . Si nos ubicamos en la grfica se tiene:

Ejemplos: 1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 46

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compaa, suponga una poblacin normal. Solucin: Primero se calcula la desviacin estndar de la muestra:

al elevar este resultado al cuadrado se obtiene la varianza de la muestra s 2= 0.286. Para obtener un intervalo de confianza de 95% se elige un = 0.05. Despus con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2.

Se puede observar en la grfica anterior que el valor de X2 corre en forma normal, esto es de izquierda a derecha. Por lo tanto, el intervalo de confianza de 95% para la varianza es:

Graficamente:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 47

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.

2. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los resultados que producen muestras estndar. En un estudio de la cantidad de calcio en el agua potable, el cual se efecta como parte del control de calidad, se analiz seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por milln fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la poblacin para este estndar, usando un nivel de confianza del 90%. Solucin: Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285. Se busca en la tabla los valores correspondientes con 5 grados de libertad, obtenindose dos resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07. Entonces el intervalo de confianza esta dado por:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 48

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

Distribucin muestral de la relacin de varianzas. "F" Fisher La necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos poblaciones es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea comparar la precisin de un instrumento de medicin con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que vara el procedimiento para calificar de un profesor universitario con la de otro.

Intuitivamente, podramos comparar las varianzas de dos poblaciones, y , utilizando la razn de las varianzas mustrales s21/s22. Si s21/s22 es casi igual a 1, se tendr poca evidencia para indicar que y no son iguales. Por otra parte, un valor muy grande o muy pequeo para s21/s22, proporcionar evidencia de una diferencia en las varianzas de las poblaciones. La variable aleatoria F se define como el cociente de dos variables aleatorias jicuadrada independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,

donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad


1

respectivamente.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 49

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Sean U y V dos variables aleatorias independientes que tienen distribucin ji cuadradas con grados de libertad, respectivamente. Entonces la distribucin de la variable

aleatoria

est dada por:

y se dice que sigue la distribucin F con grados de libertad en el denominador.

grados de libertad en el numerador y

La media y la varianza de la distribucin F son:

para

para

La variable aleatoria F es no negativa, y la distribucin tiene un sesgo hacia la derecha. La distribucin F tiene una apariencia muy similar a la distribucin ji-cuadrada; sin embargo, se encuentra centrada respecto a 1, y los dos parmetros proporcionan una flexibilidad adicional con respecto a la forma de la distribucin. Si s12 y s22 son las varianzas mustrales independientes de tamao n 1 y n2 tomadas 2 2 de poblaciones normales con varianzas 1 y 2 , respectivamente, entonces:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 50

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Para manejar las tablas de Fisher del libro de Introduccin a la Inferencia Estadstica del autor Genther, se tendr que buscar primero los grados de libertad dos para luego localizar el rea correspondiente, relacionndola con los grados de libertad uno, para calcular el valor de F. Las tablas tienen la siguiente estructura:

P 6

1 2 3 . .. 500

0.0005 0.001 0.005 . . 0.9995 30.4

El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6 grados de libertad dos con un rea de cero a Fisher de 0.995. Si lo vemos grficamente:

Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de dos variables que son los grados de libertad. Ejemplos : 1. Encontrar el valor de F, en cada uno de los siguientes casos: a. El rea a la derecha de F, es de 0.25 con b. El rea a la izquierda de F, es de 0.95 con c. El rea a la derecha de F es de 0.95 con con ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS =4 y =15 y =6 y =9. =10. =8. Pgina 51

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


d. El rea a la izquierda de F, es de 0.10 con con Solucin: a. Como el rea que da la tabla es de cero a Fisher, se tiene que localizar primero los grados de libertad dos que son 9, luego un rea de 0.75 con 4 grados de libertad uno. =24 y =24

b. En este caso se puede buscar el rea de 0.95 directamente en la tabla con sus respectivos grados de libertad.

c. Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden un rea a la derecha de F de 0.95.

d. Se busca directamente el rea de 0.10, con sus respectivos grados de libertad. ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS Pgina 52

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

1. Si s12 y s22 son las varianzas mustrales de muestras aleatorias independientes de tamaos n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre P(s12/s22 2.42). Solucin: Primero se establecen los grados de libertad. Como en el numerador est la poblacin uno y en el denominador la poblacin dos, entonces los grados de libertad uno equivalen a 10-1=9 y los grados de libertad dos a 20-1=19. Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y se observa que no estn, por lo tanto se tiene que interpolar entre 15 y 20 grados de libertad, buscando el valor de fisher que quedara:

Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de libertad dos, y se encuentra los siguiente: rea 0.90 0.95 2.09 2.59

Al interpolar entre estos dos valores nos queda un rea de 0.933. Se procede a hacer lo mismo pero con 20 grados de libertad dos: rea 0.95 0.975 2.39 2.84 Pgina 53

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Al interpolar entre estos dos valores nos queda un rea de 0.9516. Ahora ya se tienen las dos reas referentes a los grados de libertad dos, por lo que se interpolar para ver cunto le corresponde a los grados libertad dos con un valor de 19. rea 15 20 0.933 0.9516

Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de libertad dos con un valor de Fisher de 2.42 el rea a la izquierda es de 0.9478.

2. Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamao n1= 25 y n2 = 31, tomadas de poblaciones normales con varianzas 2 1 =10 y
2 2

= 15, respectivamente, encuentre P(s12/s22 > 1.26).

Solucin: Calcular el valor de Fisher:

Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24 grados libertad uno. Cuando se est en esta posicin se busca adentro de la tabla el valor Fisher de 1.89. Al localizarlo y ver a la izquierda de este valor se obtiene un rea 0.95, pero esta rea correspondera a la probabilidad de que las relaciones ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

de de de de

Pgina 54

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


varianzas mustrales fueran menor a 1.26, por lo que se calcula su complemento que sera 0.05, siendo esta la probabilidad de que s12/s22 > 1.26.

Intervalo de Confianza para el Cociente de Varianzas de Dos Distribuciones Normales Supngase que se tienen dos poblaciones normales e independientes con varianzas 2 2 desconocidas 1 y 2 , respectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamaos n1 y n2, respectivamente, sean s12 y s22 las dos varianzas mustrales. Se desea conocer un intervalo de confianza del 2 2 100( ) por ciento para el cociente de las dos varianzas, 1 / 2 . Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se coloca la varianza muestral mayor en el numerador del estadstico F. Ejemplos: 1. Un fabricante de automviles pone a prueba dos nuevos mtodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran el la tabla: Mtodo 1 n1 = 31 s12 = 50 Mtodo 2 n2 = 25 s22 = 24
2 1 / 2 2 .

Construya un intervalo de confianza del 90% para Solucin:

Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la siguiente frmula:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 55

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN

al despejar:

F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.

y Estos resultados los podemos interpretar de la siguiente manera:


2 Con un nivel de confianza del 90% se sabe que la relacin de varianzas 1 / 2 2 esta entre 1.07 y 3.93. Esto supondra que la varianza de la poblacin 1 es mayor a la varianza de la poblacin 2 entre 1.07 y 3.93.

2. Una compaa fabrica propulsores para uso en motores de turbina. Al ingeniero de manufactura le gustara seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene una desviacin estndar s 1 = 4.7 micro pulgadas, y una muestra aleatoria de n2=12 partes del segundo proceso, la cual tiene una desviacin estndar s2 = 5.1 micro pulgadas. Se desea encontrar 2 un intervalo de confianza del 90% para el cociente de las dos varianzas 1 /
2 2 .

Suponga que los dos procesos son independientes y que la rugosidad de la superficie est distribuida de manera normal. Solucin:

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 56

INSTITUTO TECNOLGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN


Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la siguiente frmula:

al despejar:

En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.

y Estos resultados los podemos interpretar de la siguiente manera: Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las desviaciones estndar de la rugosidad de la superficie de los dos procesos sean diferentes con un nivel de confianza del 90%.

ESTADISTICA INFERENCIAL I ING. J. G. R. RAMOS

Pgina 57