Está en la página 1de 6

UNIDAD IV: PRUEBAS DE HIPOTESIS CON DOS MUESTRAS Y VARIAS MUESTRAS DE DATOS NUMERICOS.

4.1 INTRODUCCIN. Prueba de hiptesis En esta unidad nos concentraremos en la prueba de hiptesis, otro aspecto de la inferencia estadstica que al igual que la estimacin del intervalo de confianza, se basa en la informacin de la muestra. Se desarrolla una metodologa paso a paso que le permita hacer inferencias sobre un parmetro poblacional mediante el anlisis diferencial entre los resultados observados (estadstico de la muestra)y los resultados de la muestra esperados si la hiptesis subyacente es realmente cierta. En el problema de estimacin se trata de elegir el valor de un parmetro de la poblacin, mientras que en las pruebas de hiptesis se trata de decidir entre aceptar o rechazar un valor especificado (por ejemplo, si el nivel de centramiento de un proceso es o no lo es).Prueba de hiptesis: Estadsticamente una prueba de hiptesis es cualquier afirmacin acerca de una poblacin y/o sus parmetros 4.2 DISTRIBUCIN NORMAL Y T-STUDENT D. NORMAL.- Esta distribucin es frecuentemente utilizada en las aplicaciones estadsticas. Su propio nombre indica su extendida utilizacin, justificada por la frecuencia o normalidad con la que ciertos fenmenos tienden a parecerse en su comportamiento a esta distribucin. Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica tiene forma de campana. En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que sus polgonos de frecuencias se aproximan a una curva en "forma de campana". En resumen, la importancia de la distribucin normal se debe principalmente a que hay muchas variables asociadas a fenmenos naturales que siguen el modelo de la normal. * Caracteres morfolgicos de individuos (personas, animales, plantas,) de una especie, p. ejm. Tallas, pesos, envergaduras, dimetros, permetros

* Caracteres fisiolgicos, por ejemplo; efecto de una misma dosis de un frmaco, o de una misma cantidad de abono. * Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen. * Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de adaptacin a un medio * Errores cometidos al medir ciertas magnitudes. * Valores estadsticos maestrales, por ejemplo: la media. * Otras distribuciones como la binomial o la de Poisson son aproximaciones normales Y en general cualquier caracterstica que se obtenga como suma de muchos factores. D t-student.- Necesitaba una distribucin que pudiera usar cuando el tamao de la muestra fuera pequeo y la varianza desconocida y tena que ser estimada a partir de los datos. Las distribuciones t se usan para tener en cuenta la incertidumbre aadida que resulta por esta estimacin. Fisher comprendi la importancia de los trabajos de Gosset para muestras pequeas. Si el tamao de la muestra es n entonces decimos que la distribucin t tiene n-1 grados de libertad. Hay una distribucin t diferente para cada tamao de la muestra. Estas distribuciones son una familia de distribuciones de probabilidad continuas. Las curvas de densidad son simtricas y con forma de campana como la distribucin normal estndar. Sus medias son 0 y sus varianzas son mayores que 1 (tienen colas ms pesadas). Las colas de las distribuciones t disminuyen ms lentamente que las colas de la distribucin normal. Si los grados de libertad son mayores ms prxima a 1 es la varianza y la funcin de densidad es ms parecida a la densidad normal.

Cuando n es mayor que 30, la diferencia entre la normal y la distribucin t de Student no suele ser muy importante. En la imagen podemos ver varios ejemplos de funciones de distribucin acumulada.

4.3 PRUEBAS DE SIGNIFICANCIA Las pruebas de significancia estadstica proporciona una estimacin de la frecuencia con que podran ocurrir por azar los resultados experimentales. Los resultados de una prueba de este tipo se plantean como una prueba de probabilidad, indicando las posibilidades de que la diferencia observada se haya debido al azar. En psicologa se considera de gran importancia cualquier resultado experimental que ocurriera por azar cinco veces de cada 100. 4.4 COMPARACIN DE DOS MUESTRAS INDEPENDIENTES: PRUEBA T PARA LAS DIFERENCIA ENTRE DOS MEDIAS. t=x1x21 n1 + 1n2 donde =n1s12+ n2s22n1+ n2-2 El I. Q. (cociente de inteligencia) de 16 estudiantes de una zona de una ciudad dio una media de 107 con una desviacin tpica de 10, mientras que el L Q. de 14 estudiantes de otra zona de la ciudad dio una media de 112 con desviacin tpica de 8. Hay diferencia significativa entre el I. Q. de los dos grupos al nivel de significacin del (o) 0.01, y (b) 0.05? Si se denota por 1 y 2 las medias poblacionales del I.Q. de los estudiantes de las dos zonas, se tiene que decidir entre las hiptesis Ho: 1 = 2 no hay diferencia esencial entre los grupos H1: 1 2 no hay diferencia esencial entre los grupos Bajo la hiptesis Ho. Entonces: =16(10)2+ 14(8)216+ 14 -2 = 9.44 y t=112 - 1079.441 16 + 114 = 1.45 Con un ensayo bilateral al nivel de significacin del 0.01, se rechazar la hiptesis Ho si T se encuentra fuera del recorrido -t.995 a t.995 que para n1 y n2 2= 16 + 74 2= 28 grados de libertad es el recorrido -2.76 a 2.76.

As pues, no se puede rechazar Ho al nivel de significacin del 0.01. Con un ensayo bilateral al nivel de significacin del 0.05, se rechazar la hiptesis Ho si T se encuentra fuera del recorrido -t.975 a t.975 que para n1 y n2 2= 16 + 74 2= 28 grados de libertad es el recorrido -2.05 a 2.05. As pues, no se puede rechazar 116 al nivel de significacin del 0.05. Se deduce que no hay diferencia significativa entre el I. Q. de los dos grupos.

4.5 PRUEBA DE FISHER PARA VARIANZAS Y DE IGUALDAD DE LAS VARIANZAS DE DOS POBLACIONES NORMALES Un instructor tiene dos clases, A y B. en una asignatura especfica. La clase A tiene l6 estudiantes en tanto que la clase B tiene 25 estudiantes. En el mismo examen, aunque no hubo diferencia significativa en medias de las calificaciones, la clase A tuvo una desviacin tpica de 9 en tanto que la clase B tuvo una desviacin tpica de12. Podemos concluir al nivel de significacin del (a) 0.01, (b) 0.05 que la variabilidad de la clase B es mayor que la de la clase A? (a) Tenemos, empleando subndices 1 y 2 para las clases A y B respectivamente, s1=9, s2= 12 de modo Que: s12 = n1n1-1 = 1615(9)2= 86.4 s22 = n2n2-1 = 2524(12)2= 150

Hay que decidir entre las dos hiptesis Ho = 1=2, y cualquier variabilidad observada se debe al azar Ha= 1>2,y la variabilidad de la clase A es mayor que la de la B

La decisin debe por tanto basarse en un ensayo unilateral de la distribucin F. El nmero de grados de libertad para las clases son respectivamente 1= 16 -1= 15,2= 25-1= 24. Alnivel 0.01 para 1 = 15 = 2= 24 tenemos del Apndice F, F.99= 2.89. Entonces, para h. muestras en cuestin, F=s12s22= 15086.4=1.74

Entonces, ya que F < F.99 no podemos rechazar Ho al nivel 0.01. (b) Ya que F.95= 2.11 para 15, 24 grados de libertad (vase Apndice F), vemos que F < F.95 Por tantotampoco podemos rechazar HO al nivel 0.05.

4.6

COMPARACIONES

DE

DOS

MUESTRAS

PAREADAS

Una de las hiptesis sobre las que habitualmente se fundamentan las pruebas estadsticas de comparacin es que las observaciones pertenecientes a cada una de las muestras son independientes entre s, no guardan relacin; siendo precisamente ese uno de los objetivos de la aleatorizacin (eleccin aleatoria de los sujetos o unidades de observacin). Sin embargo, la falta de independencia entre las observaciones de los grupos puede ser una caracterstica del diseo del estudio para buscar fundamentalmente una mayor eficiencia del contraste estadstico al disminuir la variabilidad. En otras ocasiones con este tipo de diseo pareado lo que se busca es dar una mayor validez a las inferencias obtenidas, controlando o eliminando la influencia de variables extraas cuyo efecto ya es conocido o sospechado, y no se desea que intervenga en el estudio actual pudiendo enmascarar el efecto del tratamiento o de la variable de inters. Las muestras apareadas se obtienen usualmente como distintas observaciones realizadas sobre los mismos individuos. Un ejemplo de observaciones pareadas consiste en considerar a un conjunto de n personas a las que se le aplica un tratamiento mdico y se mide por ejemplo el nivel de insulina en la sangre antes (X) y despus del mismo (Y). En este ejemplo no es posible considerar aX eY como variables independientes ya que va a existir una dependencia clara entre las dos variables.

4.7 MODELO TOTALMENTE ALEATORIO: ANLISIS DE VARIANZA DE UN FACTOR Hay varias formas en las cuales puede disearse un experimento ANOVA. Quizs el ms comn es el diseo completamente aleatorizado a una va. El trmino proviene del hecho que varios sujetos o unidades experimentales se asignan aleatoriamente a diferentes niveles de un solo factor. Por ejemplo: varios empleados (unidades experimentales) pueden seleccionarse aleatoriamente para participar en diversos tipos (niveles diferentes)de un programa de capacitacin(el factor). El anlisis de varianza se basa en una comparacin de la cantidad de

variacin en cada uno de los tratamientos. Si de un tratamiento al otro la variacin es significativamente alta, puede concluirse que los tratamientos tienen efectos diferentes en las poblaciones. a. Esta variacin entre el nmero total de las 14 observaciones. Esto se llama variacin total. b. Existe variacin entre los diferentes tratamientos (muestras). Esto se llama variacin entre muestras. c. Existe variacin dentro de un tratamiento dado (muestra). Esto se denomina variacin dentro de la muestra

También podría gustarte