Está en la página 1de 34

ANLISIS

DE

DATOS

Luis Estrada Alva

PRUEBA DE HIPTESIS Las hiptesis son afirmaciones o conjeturas respecto al problema planteado. Tales afirmaciones pueden ser verdaderas o falsas, por lo que se requiere de una comprobacin en base a un conjunto de datos muestrales para determinar si los resultados afirman o contradicen tal suposicin con cierta probabilidad pre establecida. El procedimiento a seguir en una prueba de hiptesis es: a) Formular las hiptesis estadsticas.- Se refiere a la formulacin de la hiptesis nula ( Ho), y de la alternativa ( H1) (Ha) Ho : No existe diferencia significativa (efecto nulo) H1 : Si existe diferencia significativa (efecto no nulo). b) Fijar el nivel de significacin ( ).- Probabilidad de rechazar la hiptesis nula ( Ho) cuando realmente es cierta. c) Funcin pivotal o funcin de prueba (estadstica de prueba).- Es la frmula asociada a cada tipo de hiptesis en prueba y nos permite obtener el valor experimental. d) Valor tabular.- Es un valor obtenido de tablas estadsticas de acuerdo a la distribucin de la estadstica de prueba. Generalmente se usa la prueba t, z, 2, F. e) Decisin .- Rechazar Ho si el valor experimental es mayor al valor tabular ( p < ), (valor sugerido de es de 0.05).

1.-PRUEBA DE HIPTESIS PARA LA MEDIA DE UNA SOLA POBLACIN

a)

Formulacin de Hiptesis. Ho : H1 : = 0 0

: Puntaje promedio poblacional 0: Puntaje promedio hipottico b) Nivel de significacin o probabilidad de equivocarse = 0,05 c) Estadstica de prueba

x 0 DE n

x : Media muestral con una muestra de tamao n

DE: Desviacin estndar muestral d) Valor tabular o valor de p

t tab = t(n-1
e) Decisin Ho si t> Rechazar

; 1- 2

t tab = t(n-1

; 1- 2

; ( p < 0.05 o p < 0.01)

No rechazar Ho si Ejemplo :

t<

t tab = t(n-1

; 1- 2

; ( p > 0.05)

Un empresario est interesado en demostrar que el consumo promedio de caloras de sus trabajadores es de 2500 kcal/da. Para realizar tal averiguacin se seleccion una muestra aleatoria de 20 de trabajadores y se encontr: x: 2180, 2440, 2580,2630 ,2550, 2560 ,2450,2660 ,2750 ,2470 ,2440 ,2650, 2350, 2550, 2660, 2450, 2380, 2620, 2550, 2460 Existe evidencia suficiente para afirmar que el consumo promedio es de 2500 kcal/da?
x =2519

dichos

DE=132.14

n=20

a) Formulacin de Ho y Ha. Ho: Ha: = 2500 2500

b) = 0.05 c) Estadstica de prueba


t = x 2500 DE n
-

t (19)

2519 2500 132.144 20

= 0.643 ,

e) Decisin Como t=0.643 < t (19) =2.09 (p=0.528) p> 0.05 No se rechaza la hiptesis nula, por tanto no existe evidencia suficiente para poder afirmar que el consumo promedio difiere de 2500.

2.-PRUEBA DE HIPTESIS PARA LA DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES INDEPENDIENTES a) Formulacin de Hiptesis. Ho: 1 1 = 2 2

H1 :

(dos colas o bilateral)

1 : Puntaje promedio del grupo 1 2 : Puntaje promedio del grupo 2 b) Nivel de significacin o probabilidad de equivocarse = 0,05 c) Estadstica de prueba

x x
1

1 (DE) 2 + n1

1 n2

donde :
( DE ) =
2

(n

- 1)S1 + (n 2 - 1 )S2 n 1 + n2 - 2

d) e)

Valor tabular o valor de p Decisin: Rechazar la hiptesis nula si el valor calculado supera al valor tabular t con n1+n2-2 grados de libertad, es decir: Rechazar Ho si p < 0.05 p > 0.05 o p < 0.01

No rechazar Ho si

Ejemplo 1 Treinta empleados de una gran empresa fueron distribuidos en dos

grupos iguales a dos diferentes programas de capacitacin. El grupo I fue capacitado con el Mtodo A, que consiste en adiestrarlos directamente en la maquinaria y el grupo II con el Mtodo B, con la atencin personal de un instructor. Los puntajes obtenidos despus de la capacitacin fueron: Mtodo A 78 6 15 Mtodo B 70 4 15

Media ( x ) Desviaci estndar (S) n

Proporcionan estos datos evidencia suficiente que el mtodo A es diferente que el mtodo B?. Solucin a) Formulacin de Hiptesis. Ho : H1 : c) 1 1 = 2 2

Nivel de significacin : = 0,05

c)

Estadstica de prueba

t0

78 - 70
1 (26) + 15 1 15
= 4,30

( DE ) 2 =

(15 - 1)6 2 + (15 - 1) 4 2 = 26 15 +15 - 2

d) Valor tabular

t tab = t (n1 + n2- 2 ; 0.975) = t ( 28 ; 0.975 )


e) Decisin t = 4,30 > t tab = 2.05

= 2.05

Se rechaza Ho.

Por tanto existe diferencia estadsticamente significativa entre los dos mtodos de capacitacin.

Ejemplo 2

Se midieron los niveles nutritivos de dos variedades de cierta fruta comestible cultivadas en una misma regin. Los resultados fueron A: 6.9 ;6.2 ; 9.2 ; 9.2 ;6.2 ;8.9 ; 9.2 ; 8.7; 7.8 ; 5.7 ; 10.0 B:11.0 ;7.8 ; 9.1 ; 9.9 ;11.1;12.3; 8.8; 8.9; 10.0; 9.8 ; 10.1; 9.9; 11.5
Existe evidencia suficiente para afirmar que el nivel nutritivo promedio es diferente? Variedad A 8.0000 1.5046 11 Variedad B 10.0154 1.2287 13

Media ( x ) Desviaci estndar (S) n a) Formulacin de Hiptesis. Ho : H1 : 1 1 = 2 2

b) Nivel de significacin : = 0,05

c)

Estadstica de prueba
t0 =

8.00 - 10.0154
1 1 (1.8526 + 11 13

= -3.61

( DE ) 2 =

(11 - 1)1.5046 2 + (13 - 1)1.2287 2 = 1.8526 11 +13 - 2

d) Valor tabular

t tab = t (n + n - 2 ; 0.975) = t ( 22 ; 0.975 )


1 2

= 2.07

e)

Decisin |t| = 3.61 > t tab = 2.07 (p=0.002)

Se rechaza Ho. (p<0.01) Por tanto existe diferencia estadsticamente significativa en los niveles nutritivos de las dos variedades

3.-PRUEBA DE HIPTESIS PARA LA DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES CORRELACIONADAS o APAREADAS Debe usarse cuando se desea comparar dos tratamientos y las unidades en estudio son heterogneas pero es factible conformar parejas homogneas o gemelas, Ejm. Cuando se desea comparar : Dos tipos de cueros de zapatos en diferentes individuos. Dos tipos de fungicidas en diferentes individuos. Dos marcas de termmetros en diferentes ambientes. Dos instrumentos para medir corrosin en diferentes superficies. Efectividad de una dieta para bajar de peso (antes y despus de la aplicacin de la dieta ). Dos tipos de alimentacin en cerdos de diferentes camadas. Dos variedades de maz en diferentes localidades.

Prueba de hiptesis : a) Hiptesis estadsticas Ho: 1 = 2 H1: 1 2


b) Nivel de significacin

= 0.05 b) Prueba

tc

d n = Sd
n di i =1

d i = X1i X 2 i

d =
2 = Sd
varianza d i Valor tabular : ttab = t(n-1 c)
; 1- /2)

n 2 (d i d) i =1

n -1

Decisin Rechazar Ho si t > ttab ( p < 0.05 ) o ( p > 0.05 ) (p < 0.01)

No rechazar Ho si t < ttab . Ejemplo:

Se llev a cabo un experimento para probar el efecto de dos medicamentos distintos sobre el tiempo de coagulacin de la sangre (en minutos). Se extrajeron muestras de sangre de 10 personas y se dividieron igualmente en dos partes que se asignaron al azar a uno de los dos medicamentos. Los resultados fueron los siguientes:

Persona 1 2 3 4 5 6 7 8 9 10

X1 1.5 1.4 1.8 1.3 2.0 1.1 1.5 1.5 1.2 1.5

X2 1.6 1.4 1.6 1.2 2.1 1.0 1.6 1.5 1.0 1.6

Dif. -0.1 0.0 0.2 0.1 -0.1 0.1 -0.1 0.0 0.2 -0.1

Proporciona evidencia de diferencia entre el efecto de ambos medicamentos sobre el tiempo de coagulacin de la sangre. Use =0.05? Solucin a) Hiptesis H0 : 1 = 2 H1 : 1 2 b) c) = 0,05 Prueba

H0

: d = 0 H1 : d 0

t =

d 0,020 = = 0.514 S 0,12293/ 10 d

d)

Valor tabular

t = t (9; d)

0.975)

= 2,26

p = 0.619

Decisin No se puede rechazar H0 puesto que t=0.514 menor a t= 2.26 , ( p > 0.05) donde : d
d

= X 1 - X2 = 0,02 = 0,12293 = 10

S n

No existe diferencia estadsticamente significativa entre el efecto de los dos medicamentos en el tiempo de coagulacin de la sangre.

4.- PRUEBA DE HIPTESIS DE COMPARACIN DE

MEDIAS EN t

POBLACIONES INDEPENDIENTES: ANLISIS DE VARIANZA

a)

Hiptesis

H0 : H1

1 = 2 = 3 = . . . = t : Al menos 1 promedio es diferente

b) Nivel de significacin c) Funcin de prueba

CMT F = CME
d) e) Valor tabular : Decisin Rechazar H0 si F > Ftab
La tabla de anlisis de varianza se muestra a continuacin: Tabla ANVA Fuente Variacin Tratamientos Error Experim. Total Gl t1 nt=v n-1 SC CM CMT CME F CMT/CME F(t 1 , v)

F tab = F(t 1,

v)

Txx

Exx Wxx

T = xx
E xx

2 X i . t
xx -

=W

X2 .. N
T xx

2 W = Xij xx
SC/gl Ejemplo :

X2 .. N

CMT =

Un investigador est interesado optimizar el porcentaje de un complemento alimenticio en la ganancia de protenas. Sospecha que al aumentar el porcentaje del complemento alimenticio aumenta la ganancia de protenas. Se ensay el experimento con 5 porcentajes diferentes usando conejos con caractersticas similares, conformndose 5 grupos. Los resultados se presentan en la siguiente tabla:

% Complemento 5 7 7 15 11 9 Xi. Solucin a) Hiptesis H0 H1 : 5 = 10 = 15 = 20 = 25 49 10 12 17 12 18 18 77 15 14 18 18 19 19 88 20 19 25 22 19 23 108 25 7 10 11 15 11 54 376

: Al menos 1 tratamiento es diferente

b) = 0,05 c) Prueba

CMT F = = 14,76 CME


d) Valor tabular F tab = F(4 , 20 ; = F(4 , 20 ; e) Decisin Se rechaza H0 puesto que F > Ftab ( p < 0,01) Existe evidencia suficiente para asegurar que al menos 1 tratamiento produce efectos diferentes. ANVA Fuente Variacin Tratamientos Error Experim. Total
Txx =
0,05)

= 2,87 = 4,43

0,01)

gl 4 20 24
-

SC 475,76 161,20 636,96


376 2 25
2

CM 118,94 8,06

F 14,76

Ft -1 , v F0,05 = 2,87 * F0,01 = 4,43 **

492 + 77 2 + ... + 54 2 5

= 475.76

W = 7 2 + 7 2 + . . . + 112 xx

376 25

= 636.96

E xx = 636,93 - 475,76

161,20

PRUEBAS DE SIGNIFICACIN

Cuando se rechaza la hiptesis nula, el anlisis de varianza no permite hacer directamente la comparacin de promedios entre parejas de tratamientos, hacindose necesario las pruebas de significacin postANVA. Entre las pruebas ms usadas tenemos:

- Prueba DLS - Prueba Duncan - Prueba Tukey

- Prueba SNK - Prueba Scheff - Prueba Dunnett.

5.-PRUEBA DE HIPTESIS PARA LA PROPORCIN DE UNA SOLA POBLACIN a) Formulacin de Hiptesis. Ho : H1 : P = P0

P P0

(prueba a dos colas)

P : Proporcin poblacional P0 : Proporcin hipottica b) Nivel de significacin o probabilidad de equivocarse = 0,05 c) Estadstica de prueba

z =

p P0 P0 Q0 n

p: Proporcin muestral
Q0 = 1- P0

d)

Valor tabular

z tab = z(
Para

1- 2

= 0,05

z tab =1.96

e) Decisin Rechazar Ho si IzI>

z tab

y se denota como

p < 0.05 o p < 0.01

No rechazar Ho si IzI < Ejemplo 1:

z tab

y se denota como

p > 0.05

Se dice que existe un equilibrio biolgico en lo que se refiere al sexo del recin nacido;Es decir que la proporcin de los hombres es igual a la proporcin de mujeres. Se toma una muestra aleatoria de 460 recin nacidos encontrndose un total de 236 RN de sexo masculino. Existe evidencia suficiente para afirmar que existe dicho equilibrio en esa poblacin? p= 236/460 = 0.513 a) Formulacin de Hiptesis Ho : Ha : P = 0.50 P 0.50

b) = 0.05 d) Estadstica de prueba


z = 0.513 0.50 0 .5 * 0 .5 460

e)

= 0.558

e) Decisin Como z=0.56 < Z=1.96 p> 0.05 (p=0.288)

No se rechaza la hiptesis nula, por tanto existe evidencia suficiente para poder afirmar que existe el equilibrio entre la frecuencia de mujeres al nacer hombres y

6.-

PRUEBA

DE

HIPTESIS

PARA

LA

DIFERENCIA

ENTRE

LAS

PROPORCIONES DE DOS POBLACIONES INDEPENDIENTES a) Formulacin de Hiptesis. Ho : H1 : b) c) P1 P1 = P2 P2

Nivel de significacin : = 0,05 Estadstica de prueba

Z=

p1 - p 2
1 pq + n1 1 n2

Normal ( 0 , 1)

p =

n1 p1 + n 2 p 2 n1 + n 2

q=1-p

d)

Valor tabular

Z tab = Z1 -
2

e)

Decisin Rechazar No rechazar Ho Ho si si Z > Z tab Z Z tab

NOTA.- Esta prueba puede desarrollarse de manera alternativa con la prueba chi-cuadrado de Pearson ( Ejemplo Se realiz un experimento para medir la efectividad de dos vacunas (A Y B) en pollos contra un virus. Se conformaron dos grupos equivalentes de manera aleatoria, se les administr la vacuna respectiva ,para luego inocularles el virus ,encontrndose posteriormente que fueron protegidos 156 de 200 pollos de la vacuna A y 190 de 200 pollos de la vacuna B. Se puede concluir al nivel de significacin del 5% que la efectividad es diferente?

2 ).

Solucin a) Formulacin de Hiptesis. Ho : H1 : P1 = P2

P 1 P2

P1: Proporcin de proteccin con vacuna A P2: Proporcin de proteccin con vacuna B

b)

= 0,05

c) Estadstica de prueba
Z =

0,78 - 0,95
1 1 (0,865)(0,135) + 200 200
156 + 190 200 + 200

= 4.97

p =

q = 1-p

= 0,865

d)

Valor de

Z tab = Z1 -
2

=1.96

( p = 0.000)

e) Decisin Como p<0.05, se rechaza la hiptesis nula, por tanto las vacunas tienen diferente efectividad

7. PRUEBA DE HIPTESIS PARA COMPARAR DOS O MS PROPORCIONES .Quiz el uso ms frecuente de la distribucin ji-cuadrado es probar la hiptesis nula de que dos criterios de clasificacin, cuando se aplican al mismo conjunto de individuos, son independientes. Se dice que dos criterios de clasificacin son independientes si la distribucin de uno no se ve afectada por la distribucin del otro.

Para realizar el anlisis de los datos o frecuencias conjuntas ( n ij = oij ) los datos deben disponerse en una tabla de contingencia, de acuerdo a dos criterios. Criterio 2 1 2 r n. j 1 n11 n21 nr1 n.1 Criterio 1 2 ... n12 ... n22 ... nr2 n. 2 ... ... c n1c n2c nrc n.c TOTAL ni. n1. n2. nr. n

El procedimiento de la prueba es el siguiente : a) Hiptesis Ho : H1 : b) c) Ambos criterios de clasificacin son independientes Ambos criterios de clasificacin no son independientes

Nivel de significacin : Funcin pivotal o frmula:

2 =
E ij = n i. x n . j n i.

(Oij
E ij

- E ij ) 2

Oij : Frecuencia observada Eij : Frecuencia esperada d) Valor tabular


2 tab = (2r 1)(c 1) ; 1-

e)

Decisin

Rechazar

Ho

si

>

2 tab

No rechazar Ho si Ejemplo

2 tab

Suponga que un grupo de investigadores, estudiando la relacin entre el tipo sanguneo y la severidad de la Hipertensin inducida por el embarazo en una poblacin, reuni datos de 1500 gestantes, que se presentan en la siguiente tabla de contingencia :
GRUPO SANGUINEO GRADO DE AFECCION Ninguno Moderado Severo TOTAL

A 543 44 28 615

B 211 22 9 242

AB 90 8 7 105

O 476 31 31 538

TOTAL 1320 105 75 1500

Oij Eij a) Ho :

543 541,13

44 43,05

28 30,75

211 212,96

... ...

31 26,90

1500 1500

El grupo sanguneo no condiciona la hipertensin

H1 El grupo sanguneo s condiciona la hipertensin b) c) = 0,05 Funcin de prueba


(543 - 541,20) 2 (44 - 43,05) 2 (31 - 26,90) 2 + +. . . + 541,20 43,05 26,90

2 =

= 5,12

d) Valor tabular

2 tab = 22x3 ; 0,95 = 62; 0,95 = 12,59


d) Decisin

= 5,12 <

2 tab = 12,59

No se rechaza Ho. Por tanto ambos criterios son independientes.-El tipo sanguneo no condiciona o predispone el grado de afeccin de hipertensin.