Está en la página 1de 79

CONTENIDO PROGRAMATICO: CIENCIAS DE LA ADMINISTRACIN ADMINISTRACIN ASIGNATURA: ESTADISTICA II (URBE)

UNIDAD I 1.- Teora de Muestreo 1.1.- Muestreo 1.2.- Ventajas del Muestreo 1.3.- Desventaja del muestreo 1.4.- La Adecuacin de la Muestra 1.5.- Tipos de Muestreos a) Muestreo Probabilstico b) Muestreo no Probabilstico 1.6.- Mtodos de muestreo UNIDAD II 1.- Teorema del Limite Central 2.- Distribucon Mustrales para medias 3.- Estimaciones Puntuales para Medias 4.- Estimaciones por Intervalos para Medias 5.- Estimaciones Puntuales para diferencia de Medias(2 medias poblacionales)(1 - 2) 6.- Estimaciones Por Intervalo para diferencia de Medias(2 medias poblacionales)(1 - 2) 7.- Prueba de hiptesis para medias 8.- Prueba de hiptesis para diferencia de Medias(2 medias poblacionales)(1 - 2) 9.- Prueba de hiptesis para proporciones 10.- Prueba de hiptesis para diferencia de proporciones

UNIDAD III 1.- Diseos experimentales 2.- Diseos experimentales totalmente aleatorizado 3..- ANOVA

ESTRATEGIAS DE EVALUACIN
EVALUATIVO N 1 2 3 UNIDADES I y II II III ESTRATEGIAS EXAMEN ESCRITO EXAMEN ESCRITO EXAMEN ESCRITO PESO 30% 35% 35%

MATERIAL DEL PRIMER CORTE 1.- Teora de Muestreo 1.1.- Muestreo 1.2.- Ventajas del Muestreo 1.3.- Desventaja del muestreo 1.4.- La Adecuacin de la Muestra 1.5.- Tipos de Muestreos a) Muestreo Probabilstico b) Muestreo no Probabilstico 1.6.- Mtodos de muestreo 2.- Teorema del Limite Central 3.- Distribucin Mustrales para medias 4.- Estimaciones Puntuales para Medias 5.- Estimaciones por Intervalos para Medias 1.- TEORIA DE MUESTREO: La teora del muestreo nos ensea la tcnica, para estudiar una poblacin grande y amplia, a travs de una muestra representativa de la misma. 1.1.- MUESTREO 1. Muestreo: Se entiende por muestreo estadstico toda una teora procedimental que nos ensea la tcnica correcta para tomar una parte representativa de los elementos o datos, integrantes de un conjunto ms o menos extenso, con el fn de estudiarlos y analizarlos estadsticamente, para formarnos una idea general de las caractersticas del conjunto total. 2. Distribucin muestral: Representa una distribucin de una muestra de valores tomados de una poblacin 3. Estadstico: Se encarga del desarrollo y uso de procedimientos para analizar diseos y analizar inferencias que resulten ser las mejores para un costo dado.

1.2.- Ventajas del Muestreo a) Cuando se tenga que estudiar una poblacin infinita, o tan grande, que resulte imposible, o demasiado laborioso y costoso, estudiarla en su totalidad: como por ejemplo si queremos conocer el nmero de zapatos que calza la poblacin adulta de Venezuela. b) Cuando para el estudio sea necesario DESTRUIR los elementos, como cuando se trate de apreciar la resistencia de ciertos materiales, la desgustacin de algunos alimentos, los km de recorrido que puede durar un determinado tipo de cauchos para automviles entre otros. c) Cuando la poblacin sea suficientemente homognea d) Ofrece la ventaja de la economa, puesto que resulta mucho ms barato examinar una muestra, que la poblacin entera que representa e) Permite conocer los resultados ms pronto, ya que toma menos tiempo estudiar una muestra, que el universo del cual fue extraida f) Mejor calidad de los resultados, debido a que para el muestreo se entrena y supervisa mejor el personal, al tiempo que se efectan las observaciones con mayor esmero y rigor. 1.3.- Desventajas del Muestreo a) El RIESGO que conlleva a toda inferencia: no conduce a conclusiones 100% confiable. Solamente garantiza las caractersticas de la poblacin con un cierto grado de probabilidad, determinable de antemano b) Si bien requiere menos trabajo, este debe ser de mejor calidad y exige un personal mejor seleccionado y capacitado c) No siempre es factible dar cumplimiento a los supuestos del muestreo probabilstico. 1.4.- La Adecuacin de la muestra Se deben tener presente 2 condiciones fundamentales.

1) Que la muestra sea realmente REPRESENTATIVA de la poblacin: Que debe poseer los mismos atributos y caractersticas de la poblacin o universo al cual sustituye. 2) Que tal muestra sea de TAMAO apropiado: Ni muy pequea ni demasiado grande. Segn Francisco Gmez Rondon: La muestra debe ser digna de confianza, es decir, que debe ser suficientemente GRANDE y tomada con determinado rigor. Existe una frmula matemtica para determinar el TAMAO recomendable que ha de tener la muestra, cuando se debe obtener la media del tamao muestral n y es la siguiente: Cuando la poblacin es INFINITA o el muestreo es con reemplazo n = (Z / E)2 Donde: n = Tamao apropiado de la muestra z = Nivel de confianza del intervalo = Desviacin estndar de la poblacin E = Error muestral mximo que se admite. El TAMAO de la muestra tambin puede obtenerse en atencin a la PROPORCIN POBLACIONAL, P, que se desee. En este caso, la frmula a utilizar es la siguiente: n = Z2pq / E2 Donde: p = Proporcin verdadera de xito o proporcin poblacional estimada q = 1 p probabilidad de fracaso

Cuando la poblacin es FINITA o el muestreo es SIN reemplazo n = Z2 2N / E2(N 1) + Z2 Donde: N = Tamao Poblacional El TAMAO de la muestra tambin puede obtenerse en atencin a la PROPORCIN POBLACIONAL, P, que se desee. En este caso, la frmula a utilizar es la siguiente: n = Z2pqN / E2(N 1) + Z2pq A continuacin se muestra la tabla de Nivel de confianza o significacin o nivel de riesgo de z. Nivel de confianza o significacin o nivel de riesgo: El que realiza la investigacin debe establecer a priori(con anterioridad) un nivel de significacin o probabilidad respecto al cual se va a poner a prueba el estudio. NIVEL DE CONFIANZA (%) 99,74 99,00 98,00 96,00 95,45 95,00 90,00 80,00 68,27 50,00 COEFICIENTE DE CONFIANZA (Z) 3,00 2,58 2,33 2,05 2,00 1,96 1,645 1,28 1,00 0,6745
2

EJEMPLO 1: Supongamos que el dueo de un abasto quiere saber a cunto ascendern las compras promedio de cada uno de sus clientes(n), segn las siguientes premisas: Las ventas promedio del ltimo ao tienen una desviacin estndar de la poblacin de Bs 100,00, quiere un nivel de confianza del 99,74% y aspira un margen de error muestral de unos Bs 20 SOLUCIN Como la poblacin es infinita utilizamos la siguiente frmula n = (Z / E)2 n = [ 3(100) / 20 ]2 n = [ 15 ]2 n = 225 Conclusin: Es decir, que este seor deber tomar una muestra compuesta de 225 de sus clientes ms representativos, para poder obtener una media de sus compras que llenen los requisitos que aspira

EJEMPLO 2: Supongamos que una gran empresa del ramo de ferretera desea tomar un INVENTARIO AL MUESTREO, con las siguientes condiciones: que el error muestral no sea mayor del 2%, con un nivel de confianza del 95,45% y segn la experiencia, las tarjetas con discrepancias suelen alcanzar el 40% SOLUCIN Como la poblacin es infinita utilizamos la siguiente frmula Datos: Z=2 p = 40% = 0,40 q = 1 p = 1 0,40 = 0,60 E = 4% = 0,04 n = Z2pq / E2 n = (22)(0,40)(0,60) / (0,40)2 n = 0,96 / 0,0016 = 600 Conclusin: Para la toma del inventario al muestreo de esa empresa, ha de tomarse una muestra al azar compuesta de 600 tarjetas de su inventario.

EJEMPLO 3: Una determinada empresa tiene 12.000 cuentas de clientes. Esta empresa desea estimar el valor medio por cuenta, con un error igual a 8 y una confianza del 95%. La empresa ha seleccionado una muestra aleatoria previa y ha obtenido una desviacin tpica igual a 63,146. Calcular el tamao muestral correspondiente SOLUCIN Como la poblacin es finita utilizamos la siguiente frmula n = Z2 2N / E2(N 1) + Z2 n = 234,68 n = 235 el tamao muestral correspondiente es de 235 muestras
2

n = (1,96)2(63,146)2(12.000) / (8)2(12.000 1) + (1,96)2(63,146)2

EJEMPLO 4 Supongamos que una gran empresa del ramo de farmacia tiene un inventario al muestreo de 235 frmacos, con las siguientes condiciones: que el error muestral no sea mayor del 5%, con un nivel de confianza del 98,00% y segn la experiencia, los frmacos con discrepancias suelen alcanzar el 30%. Calcular el tamao muestral correspondiente SOLUCIN Como la poblacin es finita utilizamos la siguiente frmula DATOS Z = 2,33 p = 30% = 0,30 q = 1 p = 1 0,30 = 0,70 E = 5% = 0,05 N = 235 n = Z2pqN / E2(N 1) + Z2pq n = (2,33)2(0,30)(0,70)( 235) / (0,05)2(235 1) + (2,33)2(0,30)(0,70) n = 267,9162 / 1,7251 n = 155,30 n = 155 el tamao muestral correspondiente es de 155 1.5. TIPOS DE MUESTREOS a) Muestreo probabilstico b) Muestreo no probabilstico a)MUESTREO PROBABILSTICO: Es cuando los elementos que integran la muestra se toman completamente al azar, dndole as a cada uno el mismo grado de probabilidad de formar parte de la muestra; hablndose entonces de una muestra probabilstica.

Es el mejor mtodo de muestreo estadstico y se puede tomar de 4 maneras: Simple, sistemtico, estratificado y por conglomerado 1. Muestreo aleatorio simple: Consiste en escoger cada elemento de la muestra mediante sorteo o cualquier otro argumento de escogencia al azar. Ejemplo: Vamos a generar nmeros aleatorios, utilicemos para ello mi nmero de cdula de identidad, de ella tomamos los 3 ltimos nmeros lo elevamos al cuadrado y tomamos los 3 ltimos nmeros, esto lo hacemos varias veces hasta obtener un total de 36 nmeros aleatorios. Solucin CI: 5.052.512 512 144 736 696 416 056 136 496 016 256 536 296 EJEMPLO Supongamos que se aplica una auditora a una empresa,y encontramos que tiene un total de 500 cuentas por cobrar a clientes, de las cuales se decide analizar una muestra de 9 clientes.

El procedimiento es el siguiente: a) Se enumeran los clientes correlativamente desde el 1 hasta el 500 b) Tomamos 3 columnas contiguas de la tabla, tomamos 3 porque el total de clientes son 500, o sea 3 cifras, y as tenemos posibilidad de escogerlas a todas. c) De estas 3 columnas tomamos los 9 nmeros aleatorios que necesitamos, a partir de cualquier origen. Supongamos que tomamos los 9 primeros. As: 512 144 736 696 416 056 136 496 016 NOTA: Para nuestra auditora analizaremos las cuentas por cobrar de 9 clientes, cuyo nmero de cuenta nos dice la tabla de nmeros aleatorios. No tomamos 512, 736, y 696, porque no tenemos cuenta alguna con ese nmero, puesto que el nmero total de clientes de esta empresa es solo de 500, tampoco se toma en cuenta los repetidos, aunque esto es poco frecuente que ocurra, as que saltamos estos nmeros. En conclusin solamente analizaremos las cuentas del resto de los clientes o sea de los clientes nmeros 144, 416, 056, 136, 496 y 016 2. Muestreo aleatorio sistemtico: Consiste en seleccionar los elementos de la muestra siguiendo un cierto orden, en la que se toma en cuenta el tamao de la poblacin y el de la muestra. EJEMPLO Vamos a suponer que queremos verificar un inventario al muestreo en una empresa, que tiene un total de 2000 artculos en sus almacenes, con sus

respectivas tarjetas de inventario cada una, y queremos tomar una muestra de solo 25 artculos. PROCEDIMIENTO: a) En este caso dividimos la poblacin entre el tamao de la muestra, es decir, 2000 / 25 = 80 b) Este cociente, llamado factor de elevacin, nos indica que debemos tomar las tarjetas de 80 en 80. c) Esto supone que las tarjetas de inventario estarn numeradas correlativamente, desde el 0001, hasta el 2000 d) Tomamos como origen, o primera tarjeta, una cualquiera al AZAR y luego tomamos la restantes cada 80 ms. Por ejemplo: si tomramos como primera tarjeta la nmero 12, la segunda sera la 12 + 80 = 92 y, la tercera tarjeta habra de ser la 92 + 80 =172 y as, sucesivamente, hasta tomar las 25 tarjetas de la muestra que necesitamos e) En el caso de agotarse las 2000 tarjetas, antes de completarse la muestra, se regresa el conteo, desde la tarjeta 2000, hasta la nmero 0001 y se continua dicho conteo, hasta completar las 25 tarjetas de la muestra.
12 12 + 80 = 92 92 + 80 = 172 172 + 80 = 252 252 + 80 = 332 332 + 80 = 412 412 + 80 = 492 492 + 80 = 572 572 + 80 = 652 652 + 80 = 732 732 + 80 = 812 812 + 80 = 892 892 + 80 = 972 1 2 3 4 5 6 7 8 9 10 11 12 13 972 + 80 = 1052 1052 + 80 = 1132 1132 + 80 = 1212 1212 + 80 = 1292 1292 + 80 = 1372 1372 + 80 = 1452 1452 + 80 = 1532 1532 + 80 = 1612 1612 + 80 = 1692 1692 + 80 = 1772 1772 + 80 = 1852 1852 + 80 = 1932 14 15 16 17 18 19 20 21 22 23 24 25

3. Muestreo aleatorio estratificado: En este mtodo de muestreo se divide primero la poblacin en subconjunto homogneo, o estratos. Luego se toma los elementos para formar la muestra, de cada uno de los estratos, utilizando cualquiera de los mtodos aleatorios. Es recomendable calcular el tanto por ciento que de la poblacin representa cada estrato, para tomar de cada uno de ellos ese mismo porcentaje de elementos para integrar la muestra. Es decir que, si un estrato representa el 20% de la poblacin, se tomar de l el 20% de los elementos que formarn la muestra estratificada EJEMPLO (Muestreo estratificado) En el caso de la auditora de las cuentas por cobrar, mencionadas en el problema anterior, formaremos estratos, de acuerdo a las antigedades de las referidas cuentas y enseguida calcularemos que % del total representa cada estrato, para luego tomar de cada estrato ese mismo %, para formar la muestra deseada. Si tomamos una muestra de 20 cuentas por cobrar, cuales son los estratos ms indicados que seleccionaramos? Vamos a suponer, a tal efecto, que dicha empresa tiene en cartera las siguientes cuentas por cobrar:
De 01 a 30 das De 31 a 60 das De 61 a 90 das Ms de 90 das 40.000 Bs 30.000 Bs 20.000 Bs 10.000 Bs

SOLOUCIN
De 01 a 30 das De 31 a 60 das De 61 a 90 das Ms de 90 das TOTAL 40.000,00 Bs 30.000,00 Bs 20.000,00 B 10.000,00 B 100.000,00 Bs
s s

40% 30% 20% 10% 100%

Si quisiramos tomar una muestra de 20 cuentas por cobrar, escogeramos los estratos indicados siguientes: 8, 6, 4 y 2 cuentas, respectivamente, en forma sistemtica o aleatoria simple
40% (20) = 8 Cuentas 30% (20) = 6 Cuentas 20% (20) = 4 Cuentas 10% (20) = 2 Cuentas TOTAL 20 Cuentas

4. Muestreo aleatorio por conglomerado: Consiste en dividir primero la poblacin de acuerdo a reas geogrficas o por conglomerados sociales. Este mtodo es muy recomendable en las investigaciones de estadsticas de opinin, con fines de estudio de mercado, programas de radio y televisin, preferencias de ciertos productos entre otros. EJEMPLO: Si queremos efectuar un estudio estadstico, para conocer el grado de audiencia de la emisora de radio URBE FM 96.3, entre los estudiantes de la Universidad, procederemos as: a) Dividimos la Universidad en 6 bloques a saber (A,B,C,D,E y F) b) De estos Bloques tomaremos al AZAR 5 salones de cada Bloque c) De entre estos salones seleccionados se entrevistan 20 estudiantes por cada saln.

b) MUESTREO NO PROBABILSTICO: 1. Muestreo accidental: Es el menos recomendable se selecciona los elementos que estn al alcance. Es muy comn en las investigaciones arqueolgicas, histricas y en todos aquellos estudios que se solicitan individuos voluntarios. 2. Muestreo intencional o de opinin: Las muestras de opinin no son aleatorias, son seleccionadas o sugeridas por especialistas en la materia u objeto de estudio, que pueden reconocer con gran acierto las unidades experimentales tpicas y representativas de la poblacin en estudio. La calidad de la muestra esta subordinada nicamente al juicio del experto. Por ejemplo; considrese la prctica de contabilidad de seleccionar las semanas tpicas para una auditora. 3. Muestreo por cuota: Entre los no probabilsticos es el ms importante, ampliamente usado en encuesta de opinin y mercadeo. Est sujeto a varias limitaciones, como la imposibilidad cientfica de determinar cul es el tamao muestral y su error muestral. A cada encuestador se le asigna una cuota o cantidad de personas que le proporcionarn informacin. Tcnicamente es el mismo muestreo estratificado excepto que las unidades experimentales no son seleccionadas al azar. La naturaleza de los controles y de las instrucciones depende del juicio experto de las personas, que practica este tipo de muestreo. 1.6.- MTODOS DE MUESTREOS 1. Muestreo simple: Consiste en tomar una sola muestra de la cual necesariamente a de ser suficientemente grande, por lo que resulta costoso y requieren mucho ms tiempo y trabajo, es el mtodo de muestreo menos

recomendable, salvo que no se tenga otra alternativa y el riesgo involucreado no sea de mucha complicacin. 2. Muestreo doble: Consiste en tomar una muestra pequea y constatar sus resultados con una segunda muestra emanada de la misma poblacin. Ofrece la ventaja de que si la primera muestra se toma con las precauciones de rigor se suelen obtener resultados satisfactorios de la segunda muestra. 3. Muestreo mltiple: Se utiliza en forma similar al muestreo doble, pero con muestras aun ms pequeas y en un nmero mayor a dos hasta obtener los resultados propuestos. 4. Muestreo de juicio: Es cuando se toma la muestra de acuerdo al criterio personal del estadgrafo. Solamente es recomendable cuando el encuestador posee suficiente experiencia y conocimientos. Sin embargo esta expuesto a muchos errores de tipo subjetivo, aunque resulte un mtodo de muestreo ms econmico y mucho ms fcil de tomar. 2.- Teorema del Limite Central Si un universo, aunque no sea de distribucin normal, tiene como media aritmtica un valor y su desviacin estndar es , la distribucin de las medias aritmticas, X , del muestreo aleatorio que se haga con n > 30, tender a una distribucin normal de media promedio de la muestra
x

X = y error estndar:

/ n , para

poblacin infinita, y cuando la poblacin es finita y en este caso X es el

/ n . N - n / N - 1

O TAMBIEN

2 x

/ n . (N - n / N 1)

EJEMPLO 1 Vamos a suponer que un cierto artculo, elaborado por nuestra empresa, tiene un peso medio de 100 gramos, con una desviacin tpica de 16 gramos. Un cliente hace un pedido de 3 docenas de dicho artculo, cuyo peso promedio sea de 96 gramos. Qu probabilidad existen de que se satisfaga esta exigencia?. Solucin: Como se trata de una poblacin infinita, ya que se refiere a la produccin total de la empresa tenemos: = 16 n = 12 x 3 = 36 = 100 X = = 100 X = 96 = / n = 16 / 36 = 2,666 = 2,666

Ahora tipificando la variable de acuerdo a lo visto en estadstica I, tenemos Z=X-X = 96 100 / 2,666 -4 / 2,666 Z = - 1, 50

A este valor de la variable tipificada Z vemos que le corresponde segn la tabla un rea de probabilidad 0,4332, lo que significa que existe una probabilidad del 43,32% de que las 3 docenas de artculos servidos al cliente tengan un peso medio de 96 gramos.

EJEMPLO 2 Tenemos un registro de 121 pequeas granjas, que producen un promedio de 100 huevos diarios, con una desviacin estndar de 24 huevos. Si tomamos varias muestras de 16 granjas. Que probabilidad habr de que produzcan 90 huevos diarios, o menos?. Solucin: Como se trata de una poblacin finita, ya que se refiere a una poblacin exacta de 121 granjas pequeas. Tenemos: N = 121 X = = 100 = 24 n = 16 X = 90 o menos = / n . N - n / N - 1 = 24 / 16 . 121 - 16 / 121 - 1

= 24 / 4 . 105 / 120

= 6. 0,875

= 6. (0,9354)

= 5,6124

Ahora tipificando la variable de acuerdo a lo visto en estadstica I, tenemos Z=X-X = 90 100 / 5,6124 -10 / 5,6124 Z = - 1, 78

A este valor de la variable tipificada Z vemos que le corresponde segn la tabla un rea de probabilidad 0,4625, lo que significa que existe una probabilidad del 46,25% de que produzca 90 huevos diarios o menos.

3.- Distribucin Mustrales para Medias Para tratar este tema lo abordaremos en forma ilustrada. Se considerar una poblacin en estudio constituida por 4 elementos (n = 4): 0,3,6,9. De sta se seleccionarn todas las muestras aleatorias posibles de tamao 2 ( n =2). 3.1.- Poblacin Infinita Usando un muestreo con reemplazo se simular una poblacin infinita con los 4 elementos dados. E n este caso se obtendrn 42 = 16 muestras aleatorias diferentes de tamao 2 ( n = 2). Estas muestras aleatorias con sus respectivas medias, se muestran a continuacin. Esto constituye la poblacin de todas las medias posibles cuando n = 2 CONJUNTO DE TODAS LAS MUESTRAS ALEATORIAS DISTINTAS DE TAMAO 2, CON SUS RESPECTIVA MEDIA, SELECCIONADA DE LA POBLACIN (0,3,6,9)
Muestra (0,0) (0,3) (0,6) (0,9) (3,0) (3,3) (3,6) (3,9) (6,0) (6,3) (6,6) (6,9) (9,0) (9,3) (9,6) (9,9) 0 1,5 3 4,5 1,5 3 4,5 6 3 4,5 6 7,5 4,5 6 7,5 9

PROBABILIDADES ASOCIADAS CON CADA UNO DE LOS VALORES DE X DISTRIBUCIN MUESTRAL DE X CON MUESTRAS ALEATORIAS DE TAMAO 2, SELECCIONADAS CON REEMPLAZO

0,0 1,5 3,0 4,5 6,0 7,5 9,0

P( X ) 1 / 16 = 0,0625 2 / 16 = 0,1250 3 / 16 = 0,1875 4 / 16 = 0,2500 3 / 16 = 0,1250 2 / 16 = 0,1250 1 / 16 = 0,0625

Ahora se calcular la media ( X = ) y la varianza ( x2) de la poblacin de medias muestrales; tambin se calcular la media ( ) y la varianza ( 2) de la poblacin (0,3,6,9) 1) Media de la distribucin muestral de X , recordemos que X = = 0 + 3 + 6 + 9 / 4 = 4,5 2) Media de la poblacin () (0,3,6,9): = 0 + 3 + 6 + 9 / 4 = 4,5 3) Varianza de la poblacin (0,3,6,9):
X 0 3 6 9 TOTAL
2

(X - X )2 / n
(X - X )2 20,25 2,25 2,25 20,25 45

X- X -4,5 .1,5 1,5 4,0

(X - X )2 / n

= 45 / 4

= 11,25

4) Varianza de la distribucin muestral de X :

2 x

/n

2 x

= 11,25 / 2

2 x

= 5,625

3.2.- Poblacin finita: En la prctica, la mayora de las muestras aleatorias son seleccionadas de muestras grandes( o infinitas). Sin embargo, la idea puede ser ilustrada convenientemente con una poblacin pequea ( o finita). Considerar la poblacin en estudio dada anteriormente, de la cual seleccionarn muestras aleatorias de tamao 2 despues de que cada unidad experimental ( o elemento) es seleccionado, ste no es reemplazado; esto es, los elementos que constituirn la muestra aleatoria se seleccionan usando un muestreo sin reemplazo. El nmero total de muestras aleatorias distintas de tamao 2; seleccionada sin reemplazo, de una poblacin en estudio de tamao 4 es 4C 2 = 6 Despus de seleccionadas dichas muestras, se procede de la misma forma que en el caso anterior. En el siguiente cuadro se presentan todas las muestras aleatorias seleccionadas con su respectiva media. CONJUNTO DE TODAS LAS MUESTRAS ALEATORIAS DISTINTAS DE TAMAO 2, CON SU RESPECTIVA MEDIA, SELECCIONADAS SIN REEMPLAZO DE LA POBLACIN (0,3,6,9)
Muestra (0,3) (0,6) (0,9) (3,6) (3,9) (6,9)

X
1,5 3 4,5 4,5 6 7,5

A continuacin se presenta la distribucin muestral de X y la distribucin de probabilidades de X , respectivamente DISTRIBUCIN MUESTRAL DE X CON MUESTRAS ALEATORIAS DE TAMAO 2, SELECCIONADAS SIN REEMPLAZO

X
1,5 3,0 4,5 6,0 7,5

P( X ) 1 / 6 = 0,1667 1 / 6 = 0,1667 2 / 6 = 0,3333 1 / 6 = 0,1667 1 / 6 = 0,1667

Realizando los clculos de los parmetros, pertinentes a este caso, se tiene:

1) Media de la distribucin muestral de X , X = 1,5 + 3,0 + 4,5 + 6,0 + 7,5 = 4,5 recordemos que X = 2) Media de la poblacin () (0,3,6,9): = 0 + 3 + 6 + 9 / 4 = 4,5 3) Varianza de la poblacin (0,3,6,9):
X 0 3 6 9 TOTAL
2

(X - X )2 / n
(X - X )2 20,25 2,25 2,25 20,25 45

X- X -4,5 .1,5 1,5 4,0

(X - X )2 / n

= 45 / 4

= 11,25 = 11,25 = 3,3541

4) Varianza de la distribucin muestral de X :

2 x

= 3,75

/ n . N - n / N - 1

= 3,3541 / 2 . 4 - 2 / 4 - 1

= 3,3541 / 1,4142 . 2 / 3

= 2,3717. (0,8165)

x x x 2 2

= 1,9365 = (1,9365)2 = 3,75

4.- Estimaciones Puntuales para Medias Es importante establecer la diferencia entre un estimador y una estimacin Estimador: Un estimador es un procedimiento expresado a manera de regla o de frmula por medio del cual se obtiene un valor denominado estimacin. Por ejemplo: La media X X = xi / n ; X es un estimador. (la formula)

X = 4,5 esto es un estimacin(el resultado)

Hay 2 tipos de estimaciones que considerar:


 La estimacin Puntual  La estimacin por Intervalo

ESTIMACIN PUNTUAL: El procedimiento en la estimacin puntual consiste en seleccionar una muestra aleatoria de n observaciones x1 , x2 , x3 ,xn de una poblacin en estudio; luego se utiliza algn mtodo preconcebido para llegar a un nmero, como (sombrero), a partir de estas observaciones y que se acepta como estimador de . Obsrvese que la estimacin es un punto en la escala de nmeros reales; de ah el nombre de estimacin puntual. 4.1.- CARACTERSTICAS DE UN BUEN ESTIMADOR PUNTUAL Un buen estimador puntual, como lo dicta el sentido comn, es el que esta cerca del parmetro que se estima. La calidad del estimador debe ser evaluada a travs de las siguientes caractersticas: a) INSESGABILIDAD: Se dice que (sombrero), es un estimador isesgado del parmetro cuando el valor medio de las indefinidas estimaciones obtenidas con (sombrero), es un el estimador, es igual al de dicho parmetro b) CONSISTENCIA O CONVERGENCIA: Se dice que estimador consistente del parmetro para n tendiendo al infinito c) EFICIENCIA: Sean eficiente que varianza
1(sombrero)

si al aumentar el tamao de la muestra

aleatoria(n), converge en probabilidad al parmetro que estima. Esta definida y


2(sombrero)

estimadores isesgados o
1(sombrero)

por lo menos consistente del parmetro


2(sombrero), 2(sombrero).

. Se dice que

es ms

si la varianza de

1(sombrero)

es menor que la

Es evidente que entre ms pequea sea la varianza si l

mejor ser la estimacin. d) SUFICIENCIA: (sombrero) es un estimador suficiente del parmetro solo basta para estimarlo. Es decir, si agota toda la informacin que existe en la muestra aleatoria en orden a estimar

5.- Estimaciones por Intervalos para Medias Se utilizar la siguiente frmula: X -Z / n X - Z / n

X = Media de la muestra Z = Distribucin normal Z, se obtiene segn nivel de confianza dado en el problema
x

/ n Error de la muestra

= desviacin tpica o desviacin estndar n= Tamao de la muestra OBSERVACIN 1: Si n30 se usa la distribucin normal Z y si n < 30 se usa la t de students. Los valores de Z son dados de acuerdo al nivel de confianza dado en el enunciado del problema, los cuales se dan en la siguiente tabla:

NIVEL DE CONFIANZA (%) 99,74 99,00 98,00 97,50 96,00 95,45 95,00 90,00 80,00 68,27 50,00

COEFICIENTE DE CONFIANZA (Z) 3,00 2,58 2,33 2,24 2,05 2,00 1,96 1,645 1,28 1,00 0,6745

OBSERVACIN 2: Si n < 30 se usa la t de students, y se utiliza la siguiente formula:

s / n X -t (n 1)

X -t s / n (n 1)

X = Media de la muestra t = Distribucin t de students (n 1) 1= Nivel de confianza

S = Desviacin estandar

OBSERVACIN 3: Cuando la poblacin es finita y x no se distribuye normalmente. Generalmente si n / N 0,05 se utiliza la formulas anteriores pero si n / N 0,05 se hacen los siguientes cambios X -Z (o s) / n.N - n / N - 1 X - Z (o s) / n.N - n / N - 1

EJEMPLO 1: Se ha calculado que la media de las puntuaciones de una muestra aleatoria de 36 estudiantes es de 2,6. Se sabe que la poblacin se distribuye normal con una desviacin tpica igual a 0,3. Encuentra los intervalos de confianza al 95% y al 99% para la media de todo el grupo de estudiantes.

SOLUCIN DATOS: X = 2,6 n = 36 = 0,3 Z Para la parte a con el 95% se entra a la tabla y se obtiene un Z = 1,96 Para la parte b con el 99% se entra a la tabla y se obtiene un Z = 2,58 a) con un nivel de confianza del 95% b) con un nivel de confianza del 99% a) con un nivel de confianza del 95% X -Z ( / n) X - Z ( / n)

2,6 - 1,96 0,3 / 36 2,6 + 1,96 . 0,3 / 36 2,5020 2,6980

b) con un nivel de confianza del 99% X -Z / n X - Z / n

2,6 - 2,58 0,3 / 36 2,6 + 2,58 . 0,3 / 36 2,4710 2,7290 EJEMPLO 2 Los contenidos de acido sulfrico en 7 recipientes similares presentan un promedio de: 9,8; 10,2; 10,4; 9,8; 10,0; 10,2; y 9,6 litros, con una desviacin estndar de 0,283. Encuentre un intervalo de confianza al 95% para la media de todos los recipientes, suponiendo una distribucin aproximadamente normal.

SOLUCIN DATOS X = 9,8 + 10,2 + 10,4 + 9,8 + 10,0 + 10,2 + 9,6 / 7 = 10 n=7 S = 0,283 Nivel de Confianza = 95% Se utiliza la t de students, ya que n 30 en este caso n = 7 t Para entrar a la tabla t de students se necesita 1 1= 95% = 1- 0,95 = 0,05 = Nivel de confianza / 2 = 0,025 y

tambin necesitamos los grado de libertad o sea n 1 = 7 1 = 6 Con 0,025 y n = 6 entramos a la tabla t de students y obtenemos t = Distribucin t de students (n 1) t 6 s / n X -t (n 1) X -t s / n (n 1) = 2,447

10 - (2,447) 0,283 / 7 10 + (2,447) 0,283 / 7 9,7383 10,2617 EJEMPLO 3 Un consejero, que trabaja con el departamento de correccionales de un estado, desea hacer una estimacin del puntaje promedio obtenido en una prueba de aptitud entre 5.800 personas admitidas en instituciones correccionales estatales durante un determinado ao. Una muestra aleatoria simple de 300 admisiones arroja una media de 65 y una desviacin tpica de 15. Suponga que basta un nivel de confianza del 95%

SOLUCIN DATOS N = 5.800 n = 300 X = 65 S = 15 n / N 0,05 no se utiliza esta frmula. n / N 0,05 si se utiliza esta frmula. 300 / 5.800 = 0,052 0,05, como n / N 0,05 si se utiliza esta frmula.

X -Z

(o s) / n.N - n / N - 1 X - Z

(o s) / n.N - n / N - 1

65 - (1,96)(15) /300.5.800 - 300 / 5.800-1 65+(1,96)(15)/300.5.800 - 300 / 5.800-1

(1,697)

(0,974)

65 (1,697)(0,974) 65 + (1,697)(0,974

1,653 65 1,653 65 + 1,653 63,347 66,653

MATERIAL DEL SEGUNDO CORTE 1.- Estimaciones Puntuales poblacionales)(1 - 2) para diferencia de Medias(2 medias

Si se tienen dos poblaciones con medias 1 y 2, y varianzas

2 1

2 2

respectivamente, entonces un estimador puntual de la diferencia entre 1 y 2, esta dado por el estadstico X1 y X2, por lo tanto, para obtener una estimacin puntual 1 - 2, se seleccionarn 2 muestras aleatoria una de cada poblacin, de tamao n1 y n2 y se calcula la diferencia de las medias de las muestras: X1 y X2. Aqu solo se estudiar la condicin en la cual las 2 muestras aleatorias son independientes

2.- Estimaciones por Intervalos para Medias EJEMPLO 1 ( 1 y 2 , LA DESVIACIN TIPICA SON CONOCIDAS) CON n1 y n2 30 o n1 y n2 <30. SE UTILIZA LA SIGUIENTE FRMULA: ( X1 - X2) - Z(
2 1

/ n1 +

/ n2) 1 - 2 ( X1 - X2) + Z(

/ n1 +

/ n2 )

EJEMPLO 1 50 mujeres y 75 hombres presentaron un examen de qumica, las mujeres obtienen una calificacin promedio de 76, mientras que los hombres obtienn una calificacin promedio de 82. Encuentre el intervalo de confianza al 96% para diferencias 1 - 2, donde 1 es la puntuacin media de los hombres y 2 es la puntuacin media de todas las mujeres que presentaron. Las poblaciones en estudio(notas de mujeres y hombres) se distribuyen normalmente con desviacin tpica igual a 6 y a 8

SOLUCIN DATOS n1 = 75 HOMBRES n2 = 50 MUJERES X1 = 82 X2 = 76


1 2

=8 =6

2 1

= (8)2 = 64 = (6)2 = 36

2 2

NS = 96% Vamos a la tabla y obtenemos un z = 2,05

( 82 - 76) (2,05)(64 /75 +36 /50) 1 - 2 ( 82 - 76) + (2,05)(64 /75 +36 /50 ) 6 - (2,05)(1,25) 1 - 2 6 + (2,05)(1,25) 6 2,57 1 - 2 6 + 2,57 3,43 1 - 2 8,57 En este caso siempre se cumple que 1 - 2 > 0, ya que ambos limites son positivos. Esto es por 1 - 2 > 0 1 > 2

EJEMPLO 2 ( 1 y 2 , LA DESVIACIN TIPICA SON DESCONOCIDAS) CON n1 y n2 30. EN ESTE CASO SE CONOCE LA DESVIACIN ESTNDAR S1 Y S2 SE UTILIZA LA SIGUIENTE FRMULA:

( X1 - X2) - Z( S12 / n1 + S22 / n2) 1 - 2 ( X1 - X2) + Z( S12 / n1 + S22 / n2 ) EJEMPLO 2 Una industria est formada por 2 departamentos que elaboran productos idnticos. De cada departamento se selecciona una muestra aleatoria de horas de produccin y se obtienen los siguientes datos: El departamento 1 con 64 horas con un promedio de 100 unidades y con una desviacin estndar de 16 horas y el departamento 2 con 49 horas con un promedio de 90 unidades y con una desviacin estndar de 14 horas. Encuentre un intervalo de confianza al 97,5%, para la verdadera diferencia entre los promedios de los 2 departamentos?. SOLUCIN DATOS n1 = 64 HORAS n2 = 49 HORAS X1 = 100 UNIDADES X2 = 90 S1 = 16 S2 = 14 UNIDADES S12 = (16)2 = 256 S22 = (14)2 = 196 ENTRAMOS EN LA TABLA Y Z = 2,24

NS = 97,5%

( X1 - X2) - Z( S12 / n1 + S22 / n2) 1 - 2 ( X1 - X2) + Z( S12 / n1 + S22 / n2 )

(100-90)(2,24)(256 /64 + 196 /49) 1 - 2 (100-90)+(2,24)(256/64+196 /49 10 - (2,24)(2,83) 1 - 2 10 + (2,24)(2,83) 10 6,34 1 - 2 10 + 6,34 3,66 1 - 2 16,34 1 - 2 0 1 > 2

EJEMPLO 3 ( 1 y 2 , LA DESVIACIN TIPICA SON DESCONOCIDAS) CON n1 y n2 <30. EN ESTE CASO SE CONOCE LA DESVIACIN ESTNDAR S1 Y S2 En este caso se pueden presentar 2 alternativas 1)
1 2

Esta

alternativa

suele

denominarse

supuesto

de

HOMOCEDASTICIDAD 2)
2 1

2 2

Esta

alternativa

no

es

materia

de

este

curso(HETEROCEDSTICIDAD)

SE UTILIZA LA SIGUIENTE FRMULA:

2 2 (X1 -X2)t ( Sp (1/ n1 + 1/n2) ( Sp (1/ n1 + 1/n2) 1 - 2 ( X1 - X2) + t (n1+n2 2) (n1+n2 2)

Sp2 = (n1 1)S12 + (n2 1)S22 / n1+n2 2 EJEMPLO 3 En varios procesos qumicos se comparan dos catalizadores para medir su efecto en la reaccin resultante. Se prepara una muestra aleatoria de 12 experimentos utilizando el catalizador 1 y una muestra aleatoria de 10 experimentos empleando el catalizador 2. Los 12 experimentos efectuados con el catalizador 1 dieron un promedio que alcanzo 85 con una desviacin estndar de la muestra igual a 4, mientras que el promedio de la segunda fue de 81, con una desviacin estndar muestral de 5. Encuentre el intervalo de confianza al 90% para la diferencia entre las medias poblacionales, suponiendo que estas tengan distribuciones aproximadamente normales con varianzas iguales.

SOLUCIN DATOS
2 1

n1 = 12 n2 = 10 X1 = 85 X2 = 81 S1 = 4 S2 = 5 NS = 90% SE ENTRA A LA TABLA t de Students, ya que n1,n2 < 30 Busquemos primero el valor de la t de students, necesitamos  que t   y  = 1 0,90 = 0,10 lo que significa (12+10 2) = 20 con estos valores entre a la

tabla t de students y obtengo 1,725

2 2 (X1 -X2)t ( Sp (1/ n1 + 1/n2) ( Sp (1/ n1 + 1/n2) 1 - 2 ( X1 - X2) + t (n1+n2 2) (n1+n2 2)

Sp2 = (n1 1)S12 + (n2 1)S22 / n1+n2 2 Sp2 = (12 1)(4)2 + (10 1)(5)2 / 12+10 2 Sp2 = (11)(16) + (9)(25) / 20 Sp2 = 176 + 225 / 20 Sp2 = 20,05

(85-81)(1,725)(20,05(1/12+1/10) 1-2 (85 -81)+(1,725)(20,05 (1/ 12+1/10) 4(1,725)(1,917) 1-2 4(1,725)(1,917) 43,307 1-2 4+ 3,307 0,693 1-2 7,307 Para este caso se cumple que 1 - 2 0 1 > 2

3.- Pruebas de Hipotesis para medias 1) Hiptesis estadstica: a) Definicin de Hiptesis Estadstica: Es un enunciado provisional referente a uno o ms parmetros de una poblacin o grupos de poblaciones. b) Tipos de Hiptesis Estadisticas: 1. Hiptesis nula (H0): Consiste en una proposicin de no diferencias entre las cuestiones que se estn investigando. La Hiptesis nula es la que se quiere verificar o someter a prueba. Cuando resulte rechazada se supone que se aceptan otras hiptesis alternas propuestas. 2. Hiptesis alternativa (Ha): Siempre seala lo contrario de la hiptesis nula. c) Nivel de significacin: El que realiza la investigacin debe establecer a priori (con anterioridad) un nivel de significacin o probabilidad respecto de la cual se va a poner a prueba la hipotesis. Los niveles de significacin son linderos entre aceptar, o no, la hipotesis nula. VALORES CRITICOS DE Z0 CORRESPONDIENTES A LOS NIVELES DE SIGNIFICACIN NIVEL DE SIGNIFICACIN 10% 5% 1% 0,5% 0,2% -1,28 -1,645 -2,33 -2,58 -2,88 VALOR CRITICO DE Z0 UNILATERAL 1,28 1,645 2,33 2,58 2,88 BILATERAL 1,645 1,96 2,58 2,81 3,08

2.- TIPOS DE ERRORES: a) Error tipo I: (o riesgo de primera especie ): El error tipo I es aquel que se comete al rechazar la hiptesis nula (H0) a nivel de la muestra, siendo verdadera a nivel de la poblacin. Dicho de otra forma, cuando una hiptesis, que habamos descartado, creyndola falsa, resulte verdadera.

b) Error tipo II (o riesgo de segunda especie ): El error tipo II ocurre cuando a nivel de la muestra se acepta la hiptesis nula(H0), siendo esta falsa a nivel de la poblacin. Dicho de otra manera cuando una hipotesis, aceptada como buena, resulte que es falsa. c) Contrastes: 1) Bilateral H0 : Ha : H0 : Ha : H0 : Ha :
1 1

2 2

2) Unilateral
1 1 1 1 2 2 2 2

1) Bilateral H0 : Ha :
1 1

2 2

Zona de rechazo de H0

Zona de Aceptacin De H0 Zona de rechazo de H0

Zc

zt

zt

zc

2) Unilateral H0 : Ha :
1 1 2 2

Zona de Aceptacin De H0 Zona de rechazo de H0

zt

zc

2) Unilateral H0 : Ha :
1 1 2 2

Zona de rechazo de H0

Zona de Aceptacin De H0

Zc

zt

PARTE PRACTICA EJEMPLO 1: Un modelo de test de inteligencia con una puntuacin promedio de 87 puntos y desviacin estndar de 8 puntos, ha sido suministrada durante varios aos. Un grupo de 36 estudiantes tomados al azar, son sometidos al test obteniendo una media de 90 puntos. Se desea saber con un nivel de riesgo del 5% si el promedio de inteligencia a aumentado. SOLUCIN 1) Planteamiento de las hipotesis H0 : Ha :
1 1

2) Calculo del error tpico de la muestra



/ /

= 8/

36 =

8/ 6 = 1,33 Z = 2,26

3) Calculo de Zc

Zc = X

= 90 87 / 1,33 =

4) Se busca en la tabla el valor critico de Zt con un nivel de riesgo del 5% y contraste unilateral, obtenemos Z = 1,645

Zona de Aceptacin De H0 Zona de rechazo de H0

1,645

2,26

5) Conclusin: Se rechaza la hipotesis nula (H0), o sea que se acepta Ha, lo que significa que la media aritmtica de inteligencia de los estudiantes de ese nivel ha aumentado. EJEMPLO 2: Vamos a suponer que en un hato, los becerros de la raza pardo suizo suelen pesar al nacer 80 kg en promedio, siendo alimentadas las madres con pangolas nicamente. Luego de haber sido sometido este mismo ganado a una sobrealimentacin de concentrado, durante cierto tiempo, se toman varias muestras del mismo de 9 vacas preadas, estas escogidas al azar y de peso talla y salud normal: encontrndose que sus becerritos pesan ahora al nacer 84kg en promedio, con una aproximacin de + o 6kg. Se desea averiguar si este aumento de peso es debido a la sobrealimentacin prenatal de las vacas, o azares del muestreo. En otras palabras Se desea averiguar si el peso de las vacas aumento o disminuy con un nivel de significacin del 10%? SOLUCIN DATOS  80kg n = 9 vacas X = 84kg 6kg NS = 10%

1) Planteamiento de las hipotesis H0 : 1 = Ha : 1 2) Calculo del error tpico de la muestra 


x

= /

/
x

= 6/

9=

6/ 3 = 2,00 30)

3) Calculo de tc (se utiliza t de student ya que n t=X

= 84 80 / 2 = 4 / 2 = t = 2,00 t = 1,397

4) Se busca en la tabla el valor critico de t con n 1 = 9 1 = 8 con un nivel de riesgo del 10%

Zona de Aceptacin De H0 1,397 2,00 Zona de rechazo de H0

5) Conclusin: Se rechaza la hipotesis nula (H0), o sea que se acepta Ha, lo que significa que hubo un aumento de peso y se debi a la sobrealimentacin prenatal de las vacas

TABLA T DE STUDENT

EJEMPLO 3 La experiencia a demostrado que el tiempo promedio de reaccin, ha determinado estimulo, en sujetos normales que estn dentro de ciertos lmites de edad es de 65 mseg, con una desviacin estndar de 15 mseg. Un equipo de Psiclogos cree que si los individuos reciben cierto tipo de entrenamiento, entonces muestran en promedio, un tiempo de respuesta ms corto. Para aclarar esto, se tom una muestra aleatoria de 20 personas y se obtuvo una media igual a 55,5. Se supone que esta poblacin est normalmete distribuida. Realice la prueba correspondiente usando un nivel de significacin del 1%. SOLUCIN 1) Planteamiento de las hipotesis H0 : 1 = 65 H a : 1

EJEMPLO 4 Un fabricante de equipos deportivos a desarrollado un nuevo hilo sinttico para pescar, del cual afirma que tiene un coeficiente de ruptura de 8 kg, con una desviacin estndar de 0,5 kg. Probar la hipotesis de 8kg encontra de la alternativa 8kg. Si se prueba una muestra aleatoria de 50 kilos y se encuentra que tiene un coeficiente medio de 7,8 kg. Usar un nivel de significacin del 0,01. SOLUCIN 1) Planteamiento de las hipotesis H0 : 1 = 8 H a : 1

4.- Pruebas de Hipotesis para diferencia de medias Para determinar el valor de Z para probar la diferencia entre 2 medias, segn se conozca o no los valores de para las 2 poblaciones es:

ZC = ( X1 - X2 ) ZC = ( X1 - X2 ) -

( 1 - 2)0 /

x1 x2

( 1 - 2)0 / Sx1 x2

OBSERVACIN: La hipotesis nula que se prueba usualmente es que las 2 muestras se han obtenido de poblaciones con medias iguales. En este caso podemos hacer ( 1 - 2)0 = 0. Entonces las frmulas anteriores se simplifican as:

ZC = ( X1 - X2 ) =
2 1

x1 x2

x1 x2

/ n1 +

2 2

/ n2

ZC = ( X1 - X2 ) / Sx1 x2 Sx1 x2 = S12 / n1 + S22 / n2

EJEMPLO 1 ( 1 y 2 , LA DESVIACIN TIPICA SON CONOCIDAS) CON n1 y n2 30 o n1 y n2 <30. EJEMPLO 1: Se sospecha que la produccin horaria media de las mujeres es superior a la de los hombres. Sea X1 la produccin por hora de una empleada y sea X2 la de un empleado. Supngase que se toman dos muestras aleatorias independientes de tamao n1 = n2 = 36. Supngase que X1 y X2 tengan la misma varianza
2 1 = 2 2 =

32. Asi mismo que las dos muestras aleatorias den x1= 65 y x2= 58.

Se puede concluir que, a un nivel de significancia del 5% tal diferencia, entre las medias, no es significativa? SOLUCIN DATOS n1 = n2 = 36
2 1 = 2 2 = 32

X1= 65 X2= 58  1) Planteamiento de las hipotesis H0 : 1 - 2 = 0 Ha: 1 - 2 > 0 2) Calculo del error tpico de la muestra


x1 x2 x1 x2

x1 x2

2 1

/ n1 +

2 2

/ n2

= 32 / 36 + 32 / 36 = 16 /9

x1 x2

= 1,778

x1 x2

= 1,333

3) Calculo de Zc ZC = ( X1 - X2 ) ZC = ( 65 - 58 ) ZC = ZC = 7 / 1,333 5,251 /


x1 x2

/ 1,333

4) Se busca en la tabla el valor critico de Zt con un nivel de riesgo del 5% y contraste unilateral, obtenemos Z = 1,645

Zona de Aceptacin De H0 Zona de rechazo de H0

1,645

5,251

5) Conclusin: Se rechaza la hipotesis nula (H0), o sea que se acepta Ha, lo que significa que la diferencia entre las medias es significativa.

EJEMPLO 2 ( 1 y 2 , LA DESVIACIN TIPICA SON DESCONOCIDAS) CON n1 y n2 30. EN ESTE CASO SE CONOCE LA DESVIACIN ESTNDAR S1 Y S2 EJEMPLO 2 Se probaron dos mtodos de enseanza en dos muestras aleatorias de 200 estudiantes cada una. Al final del periodo se aplicaron pruebas y se obtuvieron los resultados que se muestran a continuacin:

n Muestra 1 Muestra 2 200 200

X1 82 79

S2 81 100

Con un nivel de significacin del 1% pruebe si existe diferencia significativa entre las 2 medias poblacionales. SOLUCIN 1) Planteamiento de las hipotesis H0 : 1 - 2 = 0 Ha: 1 - 2 0 2) Calculo del error tpico de la muestra


x1 x2 x1 x2 x1 x2

x1 x2

= S12 / n1 + S22 / n2

= 81 / 200 + 100 / 200 = 181 /200 = 0,905


x1 x2

= 0,951

3) Calculo de Zc ZC = ( X1 - X2 ) ZC = ( 82 - 79 ) ZC = 3 / 0,951 /
x1 x2

/ 0,951

ZC =

3,155

4) Se busca en la tabla el valor critico de Zt con un nivel de riesgo del 1% y contraste unilateral, obtenemos Z = 2,58

Zona de rechazo de H0

Zona de Aceptacin De H0 Zona de rechazo de H0

3,155

2,58

2,58

3,155

5) Conclusin: Se rechaza la hipotesis nula (H0), o sea que se acepta Ha, lo que significa que EXISTE diferencia significativa entre las medias.

EJEMPLO 3 ( 1 y 2 , LA DESVIACIN TIPICA SON DESCONOCIDAS) CON n1 y n2 <30. EN ESTE CASO SE CONOCE LA DESVIACIN ESTNDAR S1 Y S2 En este caso se pueden presentar 2 alternativas 1)
1 2

Esta

alternativa

suele

denominarse

supuesto

de

HOMOCEDASTICIDAD 2)
2 1

2 2

Esta

alternativa

no

es

materia

de

este

curso(HETEROCEDSTICIDAD). No se estudiar tampoco en este caso. EJEMPLO 3: Se realizo un experimento para comparar la resistencia abrasiva de dos diferentes materiales laminados. Se probaron 12 piezas del material 1 exponiendo cada pieza a una maquina medidora de dicha resistencia. Anlogamente, se probaron 10 piezas de material 2. La muestra aleatoria del material 1 dio un promedio de 85 unidades de resistencia con una desviacin estndar de 4, en tanto que la muestra aleatoria del material 2 dio un promedio de 81 con una desviacin estndar de 5. Puede concluirse con un nivel de significancia de 0,05 la resistencia abrasiva del material 1 supera a la del material 2 en ms de 2 unidades? Suponga que las poblaciones son normales con varianza iguales. SOLUCIN DATOS n1 = 12 n2 = 10 S1 = 4 S2 = 5 X1= 85

X2= 81  1) Planteamiento de las hipotesis H0 : 1 - 2 = 2 Ha: 1 - 2 > 2 2) Calculo del error tpico de la muestra



x1 x2

= Sp2 ( 1 / n1 + 1 / n2)

Sp2 = (n1 1)S12 + (n2 1)S22 / n1+n2 2 Sp2 = (12 1)(4)2 + (10 1)(5)2 / 12+10 2 Sp2 = (11)(16) + (9)(25) / 20 Sp2 = 176 + 225 / 20 Sp2 = 401 / 20 Sp2 = 20,05

     

x1 x2

= Sp2 ( 1 / n1 + 1 / n2) = 20,05 (1 /12 +1 / 10) = 20,05 (11 /60) = 20,05 (0,183) = 3,669 = 1,915

x1 x2

x1 x2

x1 x2

x1 x2

x1 x2

3) Calculo de tc (Se usa la t students ya que n1 y n2 < 30 ) H0 : 1 - 2 = 2 tC = ( X1 - X2 ) - ( 1 - 2 ) / tC = ( 85 - 81 ) - 2 / 1,915 tC = 2 / 1,915

x1 x2

tC =

1,044

v = n1+n2 2 v = 12+10 2 v = 20 (grados de libertad)

4) Se busca en la tabla el valor critico de tt con un nivel de riesgo del 5% y contraste unilateral, obtenemos t0,05,20 = 1,725

Zona de Aceptacin De H0 Zona de rechazo de H0

1,044

1,725

5) Conclusin: Se acepta la hipotesis nula (H0), lo que significa que la prueba no es significativa. Lo que significa que la resistencia abrasiva del material 1, es igual a la del material 2. (1 = 2 = 2).

9.- Prueba de hiptesis para proporciones 10.- Prueba de hiptesis para diferencia de proporciones

MATERIAL DEL TERCER CORTE 1.- Diseos Experimentales 2.- Diseos Experimentales totalmente aleatorizado 3.- ANOVA INTRODUCCIN AL DISEO DE EXPERIMENTOS Introduccin Los modelos de diseo de experimentos son modelos estadsticos clsicos cuyo objetivo es averiguar si unos determinados factores influyen en una variable de inters y, si existe influencia de algn factor, cuantificar dicha influencia. Unos ejemplos donde habra que utilizar estos modelos son los siguientes: 1. En el rendimiento de una determinada mquina se desea estudiar la calidad de la mquina y la pericia de su chofer. 2. Se quiere estudiar la influencia de un tipo de pila elctrica y de la marca, en la duracin de las mismas.. 3. Una compaa de software est interesada en estudiar un nuevo programa. Experimento Es una situacin controlada en la cual se aplica un estmulo y se mide una respuesta que se espera sea efecto del estmulo aplicado. ESTADSTICA INFERENCIAL O INFERENCIA ESTADSTICA Comprende los mtodos y procedimientos para deducir propiedades (hacer inferencia) de una poblacin a travs de una muestra. La bondad de estas deducciones se mide en trminos probabilsticos es decir toda inferencia est acompaada de su probabilidad de acierto. La estadstica inferencial comprende:  La teora de muestras  La estimacin de parmetros  El contraste de hiptesis  El diseo experimental  La inferencia Bayesiana UNIDADES EXPERIMENTALES Es el elemento o conjunto de elementos sobre los cuales se aplican de manera independiente los tratamientos y se evala la variable respuesta. DISEO EXPERIMENTAL Es un esquema que indica la forma en el o los factores en estudio son asignados a las unidades experimentales.

VARIABLE RESPUESTA Son caractersticas de la realidad que se ven determinadas o que dependen del valor que asuman otros fenmenos. Es la manera de medir el efecto de tratamiento sobre las unidades experimentales. TRATAMIENTO Es un conjunto de condiciones experimentales definidas por el investigador. Son el conjunto de circunstancias creadas por el experimento en respuesta a la hiptesis de investigacin y son el control de la misma. PRINCIPIO DE EXPERIMENTACIN Viene dado por la reproduccin, aleatorizacin y control local. La aleatorizacin es importante porque reduce el error permitiendo explicar los trminos estadsticos. REPRODUCCIN O REPETICIN Proporciona una estimacin del error experimental siendo tal estimacin confiable a medida que aumenta el nmero de repeticiones permitiendo estimaciones mas precisas del tratamiento en estudio. ALEATORIZACIN Consiste en la asignacin al azar de los tratamientos en estudio a las unidades experimentales con el propsito de asegurar que un determinado tratamiento no presente sesgo. Por otro lado la aleatorizacin hace vlido los procesos de inferencia y las pruebas estadsticas. CONTROL LOCAL Consiste en tomar medidas dentro del diseo experimental. (bloqueo) PASOS O ETAPAS DEL DISEO EXPERIMENTAL Identificar o seleccionar los tratamientos a comparar Seleccionar las unidades experimentales con las que se va a trabajar. Identificar la variable respuesta Seleccionar el modelo experimental a aplicar. Aplicar el tratamiento a las unidades experimentales y medir la variable respuesta. 6. Decidir pruebas a priori y a posteriori que se van a aplicar. 7. Obtener conclusiones y recomendaciones. 1. 2. 3. 4. 5.

8. ERROR EXPERIMENTAL Son las diferencias que existen en los resultados de la variable respuesta correspondientes a las unidades experimentales a las cuales se les aplica el mismo tratamiento. FUENTES DEL ERROR EXPERIMENTAL 1. 2. 3. 4. 5. Falta de homogeneidad en las unidades experimentales. Diferencias en la aplicacin de los tratamientos. Diferencias en las medidas de la variable respuesta. Error en la seleccin del modelo experimental. Error aleatorio(variable no controlada dentro del experimento) MODELO DE EFECTO FIJO Se aplica en situaciones en la que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales es solo afectado por la media, permaneciendo la variable respuesta con una distribucin normal. El tratamiento es seleccionado solo por el investigador.

MODELO DE EFECTO ALEATORIO Se usa para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental, el ejemplo ms simple es el de estimar la media desconocida de una poblacin compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medicin. Los tratamientos no los selecciona el investigador solo compara los tratamientos aplicados a una muestra. ANLISIS DE VARIANZA En estadstica anlisis de varianza es una coleccin de modelos estadsticos y sus procedimientos asociados. El anlisis de varianza sirve para comparar si los valores de un conjunto de datos numricos son significativamente distintos a los valores de otro o ms conjunto de datos. El procedimiento para comparar estos valores est basado en la varianza global observada en los grupos de datos numricos a comparar; tpicamente el anlisis de varianza se utiliza para asociar una probabilidad a la conclusin de que la media de un grupo de datos es distinta a la de otros datos.

(ANOVA)

ANALISIS DE LA VARIANZA (ANOVA) CON UN FACTOR 1.- Naturaleza y propsito: En esta unidad sern examinadas varias poblaciones (mas de dos): seleccionando una muestra aleatoria de cada una de dichas poblaciones. En su forma mas simple el Anlisis de la Varianza (en lo sucesivo ser indicado con la palabra ANOVA) es usado para realizar este tipo de mtodos, para probar las diferencias significativas entre las medias de un numero diferente de poblaciones (tres o mas). La varianza total exhibida por un conjunto de observaciones, medidas por la suma de cuadrados de las desviaciones respecto de la media, puede ser separados en componentes asociados con fuentes definidas de variacin empleadas como criterio de clasificacin para las observaciones. Existen tres tipos de modelos de ANOVA: 1.- Modelo I o Modelo de efectos fijos (con matriz balanceada y no balanceada) 2.- Modelo II o Modelo de efectos aleatorios. 3.- Modelo Mixto. En esta unidad solo se estudiar el Modelo I

MODELO I CON MATRIZ BALANCEADA 2.- FORMULAS PARA UN ANOVA CON UN FACTOR 1.- Suma de cuadrados total corregido:   

C= y2 / tn

 2.- Suma de cuadrado entre tratamiento:  /n

3.- Suma de cuadrados del error: SCE = SCTC - SCTR SCE =   /n 3.- Cuadrado medio o varianza estimada Cada suma de cuadrados tiene asociado un numero de grados de libertad (GL). Extensin a diversos problemas de estadstica, de un concepto general: numero de elementos independientes necesarios para definir el estado de un sistema o de un conjunto de elementos. Por ejemplo, si x1, x2, .. xn son n valores de una variable compatible con una hipotesis.

X=

Dichos valores constituyen un conjunto de n 1 grado de libertad. En el procedimiento de ANOVA, la suma de cuadrados entre tratamientos y la suma de cuadrados del error (o dentro de tratamiento) son usadas para estimar la varianza poblacional. Se divide cada suma de cuadrados entre sus correspoindientes grados de libertad, con el fin de3 obtener las estimaciones de la varianza. Las varianzas estimadas son llamadas cuadrados medios ,que simblicamente la indicaremos como CM. As se obtienen: Cuadro Medio entre Tratamiento (CMTR) CMTR = SCTR GLTR

Donde GLTR = t 1 (numero de tratamiento menos uno) Cuadrado Medio del Error (o error cuadrtico medio) (CME) CME = SCE = S2 GLE

Donde GLE = tn - t y S2 es la varianza ponderada estimada, la cual es isesgada. Los grados de libertad son aditivos, es decir GLTC = GLTR + GLE O SEA F= ( tn - 1) = ( t - 1) + ( tn - t) Los cuadrados medios o la varianza estimada, no son aditivas. CMTR CME El valor obtenido con la expresin anterior se denotar, como FC (F calculado), luego en la tabla de distribucin F se busca el valor critico F
R , GLE) GLTR : que se identifican en la tabla como grados de libertad del numerador GLE : que se identifican en la tabla como grados de libertad del denominador Con el cruce en la tabla F de estas referencias, se obtiene el valor critico correspondiente. La conclusin se obtiene comparando FC con el valor critico F Si FC F
R , GLE), entonces se rechaza la hipotesis nula(H0) y se
R , GLE).

acepta la hipotesis alternativa(Ha), es decir existen diferencias significativas

Si

FC

R , GLE), entonces se acepta la hipotesis nula(H0), es decir la

prueba es estadsticamente no significativa RESUMEN DE FORMULAS PARA EL ANOVA CON UN FACTOR


FUENTES DE VARIACIN FV ENTRE TRATAMIENTO TR DENTRO DE TRATAMIENTO E TOTAL CORREJIDO TC   tn - 1 SCTC - SCTR tn - t SCE / tn - t /n t-1 SCTR / t - 1 CMTR CME SUMA DE CUADRADOS SC GRADOS DE LIBERTAD GL CUADRADOS MEDIOS CM VALOR CRITICO DE FC

PARTE PRACTICA: EJEMPLO 1: Supngase que una industria determinada ha comprado tres mquinas nuevas de marcas diferentes, y desea determinar si una de ellas es mas rpida que las otras al producir cierto articulo. Se observan los resultados de 10 horas de produccin, aleatoriamente, de cada mquina, y se presentan los resultados en la parte inferior Qu conclusin se puede extraer, usando un nivel de significacin del 5%?

MAQUINAS 1 10 8 7 6 6 5 5 4 4 2 2 12 10 8 7 6 5 5 4 4 3 3 10 8 7 7 6 6 5 4 4 2

SOLUCIN MAQUINAS 1 10 8 7 6 6 5 5 4 4 2 X1 = 57 10.826 X12 = 371 X22 = 484 X32 = 395 X123 2 = 1250 X123 = 30 (todas las n son iguales) 2 12 10 8 7 6 5 5 4 4 3 X2 = 64 3 10 8 7 7 6 6 5 4 4 2 X3 = 59 X123 = 180 yi2 = 572 + 642 + 592 = TOTAL

n1 = 10
PASOS:

n2 = 10

n3 = 10

1.- Determinacin de la hipotesis estadstica: H0 : Todas las medias son iguales Ha : No todas las medias son iguales 2.- Estadstico de prueba: CMTR FC = CMT CMER CME 3.- Regla de desicin Rechazar H0 sii FC

R , CME),

4.- Calculo: Calcular la suma de cuadrados

C= y2 / tn = 1802 / 30 = 32.400 / 30 = 1.080 SCTC = 1.250 1.080 = 170 SCTC = 1/n yi2 - c SCTR = 1 / 10 (10.826 1.080) = 2,6 SCE = SCTC - SCTR SCE = 170 2,6 = 167,4 Se colocan los resultados de la suma de cuadrados en la tabla anova, y luego se completan los valores que faltan en sta.
FV TR E TC SC 2,6 167,4 170 GL 3maq 1 = 2 30 3maq = 27 30 1= 29 CM 2,6 / 2 = 1,3 167,4 / 27 = 6,2 FC 1,3 / 6,2 =0,210

5.- Determinacin del F critico (buscar en la tabla de distribucin F)


F R , CME), = F 27), = 3,35 Fc = 0,210 6.- Toma de decisin: Se observa Fc F 27), 0,210 3,35 Se acepta H0 lo que significa que todas las medias son iguales.

EJEMPLO 2 MODELO I CON MATRIZ NO BALANCEADA EJEMPLO 2: Se han aplicado 3 mtodos de enseanza a tres grupos de alumnos de cierta materia. La puntuaciones obtenidas por dichos alumnos en una prueba final, viene dada en la tabla que se presenta a continuacin. Se puede admitir que los tres grupos de alumnos obtienen el mismo promedio de puntuaciones?. Use un nivel de significacin del 1%. MTODO A 6 7 5 6 5 8 4 7 B 10 9 9 10 10 6 C 3 4 8 3 7 6 3 6 4 7 6 3

SOLUCIN MTODO A 6 7 5 6 5 8 4 7 B 10 9 9 10 10 6 C 3 4 8 3 7 6 3 6 4 7 6 X1 = 48 X12 = 300 X2 = 54 X22 = 498 X3 = 60 X32 = 338 X123 = 162 X123 2 = 1136 X123 = 26 (todas las n son TOTAL

n1 = 8
distintas) PASOS:

n2 = 6

n3 = 12

1.- Determinacin de la hipotesis estadstica: H0 : Todas las medias son iguales Ha : Existe por lo menos 2 medias diferentes 2.- Estadstico de prueba: CMTR FC = CMT CMER CME 3.- Regla de desicin Rechazar H0 sii FC F

R , CME),

4.- Calculo: Calcular la suma de cuadrados

C= y2 / tn = 1622 / 26 = 26.244 / 26 = 1.009,385 SCTC = 1.136 1.009,385 = 126,615 SCTR = (482 / 8 + 542 / 6 + 602 / 12) 1.009,385 = 1.074,00 1.009,385 = 64,615 SCE = SCTC - SCTR SCE = 126,615 64,615 = 62 Se colocan los resultados de la suma de cuadrados en la tabla anova, y luego se completan los valores que faltan en sta.
FV TR E TC SC 64,615 62 126,615 GL 3met. 1 = 2 26 3maq = 23 26 1= 25 CM 64,615 / 2 = 32,308 62 / 23 = 2,696 FC 32,308/ 2,696 =11,984

5.- Determinacin del F critico (buscar en la tabla de distribucin F)


F R , CME), = F 23), = 5,6637 F = 5,6637 FC = 11,984

6.- Toma de decisin: Se observa FC F 23), 11,984  5,6637 Se Rechaza H0, o sea se acepta Ha, lo que significa que existen por lo menos dos medias diferentes. La prueba es significativa.

ANOVA
UNIDAD III ANALISIS DE LA VARIANZA (ANOVA) CON UN FACTOR 1.- Naturaleza y propsito: En esta unidad sern examinadas varias poblaciones (mas de dos): seleccionando una muestra aleatoria de cada una de dichas poblaciones. En su forma mas simple el anlisis de la varianza (en lo sucesivo ser indicado con la palabra ANOVA) es usado para realizar este tipo de mtodos, para probar las diferencias significativas entre las medias de un numero diferente de poblaciones (tres o mas). La varianza total exhibida por un conjunto de observaciones, medidas por la suma de cuadrados de las desviaciones respecto de la media, puede ser separados en componentes asociados con fuentes definidas de variacin empleadas como criterio de clasificacin para las observaciones. Existen tres tipos de modelos de ANOVA: 1.- Modelo I o Modelo de efectos fijos (con matriz balanceada y no balanceada) 2.- Modelo II o Modelo de efectos aleatorios. 3.- Modelo Mixto. En esta unidad solo se estudiar el Modelo I

MODELO I CON MATRIZ BALANCEADA 2.- FORMULAS PARA UN ANOVA CON UN FACTOR 1.- Suma de cuadrados total corregido:   

C= y2 / tn

 2.- Suma de cuadrado entre tratamiento:  /n

3.- Suma de cuadrados del error: SCE = SCTC - SCTR SCE =   /n 3.- Cuadrado medio o varianza estimada Cada suma de cuadrados tiene asociado un numero de grados de libertad (GL). Extensin a diversos problemas de estadstica, de un concepto general: numero de elementos independientes necesarios para definir el estado de un sistema o de un conjunto de elementos. Por ejemplo, si x1, x2, .. xn son n valores de una variable compatible con una hipotesis.

X=

Dichos valores constituyen un conjunto de n 1 grado de libertad. En el procedimiento de ANOVA, la suma de cuadrados entre tratamientos y la suma de cuadrados del error (o dentro de tratamiento) son usadas para estimar la varianza poblacional. Se divide cada suma de cuadrados entre sus correspoindientes grados de libertad, con el fin de3 obtener las estimaciones de la varianza. Las varianzas estimadas son llamadas cuadrados medios ,que simblicamente la indicaremos como CM. As se obtienen: Cuadro Medio entre Tratamiento (CMTR) CMTR = SCTR GLTR

Donde GLTR = t 1 (numero de tratamiento menos uno) Cuadrado Medio del Error (o error cuadrtico medio) (CME) CME = SCE = S2 GLE

Donde GLE = tn - t y S2 es la varianza ponderada estimada, la cual es isesgada. Los grados de libertad son aditivos, es decir GLTC = GLTR + GLE O SEA F= ( tn - 1) = ( t - 1) + ( tn - t) Los cuadrados medios o la varianza estimada, no son aditivas. CMTR CME El valor obtenido con la expresin anterior se denotar, como FC (F calculado), luego en la tabla de distribucin F se busca el valor critico F
R , GLE) GLTR : que se identifican en la tabla como grados de libertad del numerador GLE : que se identifican en la tabla como grados de libertad del denominador Con el cruce en la tabla F de estas referencias, se obtiene el valor critico correspondiente. La conclusin se obtiene comparando FC con el valor critico F Si FC F
R , GLE), entonces se rechaza la hipotesis nula(H0) y se
R , GLE).

acepta la hipotesis alternativa(Ha), es decir existen diferencias significativas

Si

FC

R , GLE), entonces se acepta la hipotesis nula(H0), es decir la

prueba es estadsticamente no significativa RESUMEN DE FORMULAS PARA EL ANOVA CON UN FACTOR


FUENTES DE VARIACIN FV ENTRE TRATAMIENTO TR DENTRO DE TRATAMIENTO E TOTAL CORREJIDO TC   tn - 1 SCTC - SCTR tn - t SCE / tn - t /n t-1 SCTR / t - 1 CMTR CME SUMA DE CUADRADOS SC GRADOS DE LIBERTAD GL CUADRADOS MEDIOS CM VALOR CRITICO DE FC

PARTE PRACTICA: EJEMPLO 1: Supngase que una industria determinada ha comprado tres mquinas nuevas de marcas diferentes, y desea determinar si una de ellas es mas rpida que las otras al producir cierto articulo. Se observan los resultados de 10 horas de produccin, aleatoriamente, de cada mquina, y se presentan los resultados en la parte inferior Qu conclusin se puede extraer, usando un nivel de significacin del 5%?

MAQUINAS 1 10 8 7 6 6 5 5 4 4 2 2 12 10 8 7 6 5 5 4 4 3 3 10 8 7 7 6 6 5 4 4 2

SOLUCIN MAQUINAS 1 10 8 7 6 6 5 5 4 4 2 X1 = 57 10.826 X12 = 371 X22 = 484 X32 = 395 X123 2 = 1250 X123 = 30 (todas las n son iguales) 2 12 10 8 7 6 5 5 4 4 3 X2 = 64 3 10 8 7 7 6 6 5 4 4 2 X3 = 59 X123 = 180 yi2 = 572 + 642 + 592 = TOTAL

n1 = 10
PASOS:

n2 = 10

n3 = 10

1.- Determinacin de la hipotesis estadstica: H0 : Todas las medias son iguales Ha : No todas las medias son iguales 2.- Estadstico de prueba: CMTR FC = CMT CMER CME 3.- Regla de desicin Rechazar H0 sii FC

R , CME),

4.- Calculo: Calcular la suma de cuadrados

C= y2 / tn = 1802 / 30 = 32.400 / 30 = 1.080 SCTC = 1.250 1.080 = 170 SCTC = 1/n yi2 - c SCTR = 1 / 10 (10.826 1.080) = 2,6 SCE = SCTC - SCTR SCE = 170 2,6 = 167,4 Se colocan los resultados de la suma de cuadrados en la tabla anova, y luego se completan los valores que faltan en sta.
FV TR E TC SC 2,6 167,4 170 GL 3maq 1 = 2 30 3maq = 27 30 1= 29 CM 2,6 / 2 = 1,3 167,4 / 27 = 6,2 FC 1,3 / 6,2 =0,210

5.- Determinacin del F critico (buscar en la tabla de distribucin F)


F R , CME), = F 27), = 3,35 Fc = 0,210 6.- Toma de decisin: Se observa Fc F 27), 0,210 3,35 Se acepta H0 lo que significa que todas las medias son iguales.

EJEMPLO 2 MODELO I CON MATRIZ NO BALANCEADA EJEMPLO 2: Se han aplicado 3 mtodos de enseanza a tres grupos de alumnos de cierta materia. La puntuaciones obtenidas por dichos alumnos en una prueba final, viene dada en la tabla que se presenta a continuacin. Se puede admitir que los tres grupos de alumnos obtienen el mismo promedio de puntuaciones?. Use un nivel de significacin del 1%. MTODO A 6 7 5 6 5 8 4 7 B 10 9 9 10 10 6 C 3 4 8 3 7 6 3 6 4 7 6 3

SOLUCIN MTODO A 6 7 5 6 5 8 4 7 B 10 9 9 10 10 6 C 3 4 8 3 7 6 3 6 4 7 6 X1 = 48 X12 = 300 X2 = 54 X22 = 498 X3 = 60 X32 = 338 X123 = 162 X123 2 = 1136 X123 = 26 (todas las n son TOTAL

n1 = 8
distintas) PASOS:

n2 = 6

n3 = 12

1.- Determinacin de la hipotesis estadstica: H0 : Todas las medias son iguales Ha : Existe por lo menos 2 medias diferentes 2.- Estadstico de prueba: CMTR FC = CMT CMER CME 3.- Regla de desicin Rechazar H0 sii FC F

R , CME),

4.- Calculo: Calcular la suma de cuadrados

C= y2 / tn = 1622 / 26 = 26.244 / 26 = 1.009,385 SCTC = 1.136 1.009,385 = 126,615 SCTR = (482 / 8 + 542 / 6 + 602 / 12) 1.009,385 = 1.074,00 1.009,385 = 64,615 SCE = SCTC - SCTR SCE = 126,615 64,615 = 62 Se colocan los resultados de la suma de cuadrados en la tabla anova, y luego se completan los valores que faltan en sta.
FV TR E TC SC 64,615 62 126,615 GL 3met. 1 = 2 26 3maq = 23 26 1= 25 CM 64,615 / 2 = 32,308 62 / 23 = 2,696 FC 32,308/ 2,696 =11,984

5.- Determinacin del F critico (buscar en la tabla de distribucin F)


F R , CME), = F 23), = 5,6637 F = 5,6637 FC = 11,984

6.- Toma de decisin: Se observa FC F 23), 11,984  5,6637 Se Rechaza H0, o sea se acepta Ha, lo que significa que existen por lo menos dos medias diferentes. La prueba es significativa.

También podría gustarte