Está en la página 1de 38

ESTADSTICA II (Segundo Bimestre)

ESCUELA: PSICOLOGA
NOMBRES Dr. Gonzalo Morales

FECHA: ABRIL AGOSTO 2009

1
Prueba t de student para una
muestra
Distribucin t de Student

W.S. Gosset (principios del siglo XX).

N 30 y s no se conoce.

Adems, al utilizar la distribucin t, suponemos


que la poblacin es normal o aproximadamente
normal.
Propiedades de la distribucin t
Propiedades de la distribucin t

Es simtrica.
Ms plana que la normal. Hay una
distribucin t diferente para cada tamao
posible de muestra.
Una distribucin t es menor en la media y
mayor en las colas que una distribucin
normal.
Distribucin t de Student
-Es unimodal, con media en 0
-Es una familia de curvas, en funcin de los
llamados grados de libertad. Es decir, hay una
distribucin t de Student con 1 gl, una
distribucin t de Student con 2 gl, etc.
-A medida que aumentan los grados de
libertad, la distribucin tiende ms y ms a una
distribucin normal estandarizada.
Grados de libertad
Es el nmero de valores que podemos elegir libre-
mente en una muestra, y que nos permiten encontrar el
valor de un parmetro.
Por ejemplo, supongamos una muestra de dos datos
cuyo promedio es 18. Es decir: (a+b)/2 = 18
Si a toma un valor de 10, entonces b ya no es libre de
tomar cualquier valor, debe ser 26 para que (a+b)/2=18.
Entonces, tenemos n-1 grados de libertad, si n es el
tamao de la muestra.
Similarmente, una muestra de 23 datos nos dara 22
grados de libertad.
Tabla de la distribucin t de Student
La tabla t es ms compacta y muestra reas y valores de t
slo para algunos porcentajes (ver pgina 538 del texto
bsico).
La tabla de la distribucin t, no se concentra en la
probabilidad de que el parmetro de la poblacin que se
est estimando se encuentre dentro del intervalo de
confianza. En lugar de ello, mide la probabilidad de
que este parmetro NO est dentro de nuestro intervalo de
confianza (mide la probabilidad de que est fuera).
En la tabla t debemos especificar los grados de libertad que
se manejan.
Nivel de Significacin para la prueba de una cola Nivel de Significacin para la prueba de una cola
0,10 0,05 0,025 0,01 0,005 0,0005 0,10 0,05 0,025 0,01 0,005 0,0005
df df
Nivel de Significacin para la prueba de dos colas Nivel de Significacin para la prueba de dos colas
0,20 0,10 0,05 0,02 0,01 0,001 0,20 0,10 0,05 0,02 0,01 0,001
1 3,078 6,314 12,706 31,821 63,657 636,619 18 1,330 1,734 2,101 2,552 2,878 3,922
2 1,886 2,920 4,303 6,965 9,925 31,599 19 1,328 1,729 2,093 2,539 2,861 3,883
3 1,638 2,353 3,182 4,541 5,841 12,924 20 1,325 1,725 2,086 2,528 2,845 3,850
4 1,533 2,132 2,776 3,747 4,604 8,610 21 1,323 1,721 2,080 2,518 2,831 3,819
5 1,476 2,015 2,571 3,365 4,032 6,869 22 1,321 1,717 2,074 2,508 2,819 3,792
6 1,440 1,943 2,447 3,143 3,707 5,959 23 1,319 1,714 2,069 2,500 2,807 3,768
7 1,415 1,895 2,365 2,998 3,499 5,408 24 1,318 1,711 2,064 2,492 2,797 3,745
8 1,397 1,860 2,306 2,896 3,355 5,041 25 1,316 1,708 2,060 2,485 2,787 3,725
9 1,383 1,833 2,262 2,821 3,250 4,781 26 1,315 1,706 2,056 2,479 2,779 3,707
10 1,372 1,812 2,228 2,764 3,169 4,587 27 1,314 1,703 2,052 2,473 2,771 3,690
11 1,363 1,796 2,201 2,718 3,106 4,437 28 1,313 1,701 2,048 2,467 2,763 3,674
12 1,356 1,782 2,179 2,681 3,055 4,318 29 1,311 1,699 2,045 2,462 2,756 3,659
13 1,350 1,771 2,160 2,650 3,012 4,221 30 1,310 1,697 2,042 2,457 2,750 3,646
14 1,345 1,761 2,145 2,624 2,977 4,140 40 1,303 1,684 2,021 2,423 2,704 3,551
15 1,341 1,753 2,131 2,602 2,947 4,073 60 1,296 1,671 2,000 2,390 2,660 3,460
16 1,337 1,746 2,120 2,583 2,921 4,015 120 1,289 1,658 1,980 2,358 2,617 3,373
17 1,333 1,740 2,110 2,567 2,898 3,965 1,282 1,645 1,960 2,326 2,576 3,291
Si de una poblacin Normal con media y
desviacin estndar s se extrae una muestra de
tamao n, entonces el estadstico:

x
t
s
n
se distribuye como una t de Student con n-1
grados de libertad.
Ejemplo
Los tiempos de sobrevivencia (en aos) de 12
personas que se han sometido a un transplante de
corazn son los siguientes:
3.1 .9 2.8 4.3 .6 1.4 5.8 9.9 6.3
10.4 0 11.5
Hallar un intervalo de confianza del 99 por ciento
para el promedio de vida
de todas las personas que se han sometido a un
transplante de corazn.
Solucin
3.1 0.9 2.8 4.3 0.6 1.4 5.8 9.9 6.3 10.4 0 11.5 65.1
X 5.4
12 12
(3.1 5.4)2 (0.9 5.4)2 (2.8 5.4)2 (4.3 5.4)2 (0.6 5.4)2 (1.4 5.4)2 (5.8 5.4)2 (9.9 5.4)2 (6.3 5.4)2 (10.4 5.4)2 (0 5.4)2 (11.5 5.4)2
s
12 1
(2.3) 2 (4.5) 2 (2.6) 2 (1.1) 2 (4.8) 2 (4) 2 (0.4) 2 (4.5) 2 (0.9) 2 (5) 2 (5.4) 2 (6.1) 2
s
12 1

5.29 20.25 6.76 1.21 23.04 16 0.16 20.25 0.81 25 20.16 37.21 185.14
s 16.83 4.1
12 1 11

t0.99,11=3,106; 12 3.46
El intervalo de confianza ser: (5.4-3.106x4.1/3.46; 5.4+3.106x4.1/3.46)

(5.4-3.7;5.4+3.7)=(1.7;9.1)
Prueba de hipotesis (varianza desconocida)
Caso I Caso II Caso III
Ho : =0 Ho : = 0 Ho :=
Ha : <0 Ha : 0 Ha : >0

x o
Prueba Estadstica t
s
n
Si tcal < -t entonces Si |tcal |>t/2 entonces Si tcal >t entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Usando los datos del Ejemplo anterior, un cardiocirujano afirma
que el tiempo de vida promedio de las personas sometidas a
transplante de corazn es mayor que 4 aos. A qu conclusin
se llegar despus de hacer la prueba de hiptesis?
Solucin:
La hiptesis nula es H0: = 4 (el tiempo de vida promedio de
todas las personas que se han sometido a transplante de corazn
es de 4 aos) y la hiptesis alterna es Ha: > 4 (el tiempo de vida
promedio es mayor que 4 aos).

X 5.4 4 1.4
t 1.19
s / n 4.1 / 12 1.18
Es menor que 3.106 por lo tanto no se rechaza la hiptesis nula y
se concluye de que no hay evidencia de que el tiempo promedio
de vida despus del transplante haya aumentado de 4 aos.
Notar que el extremo inferior del intervalo de confianza de un solo
lado al 99% es 1.575 mucho menor que 4.
Prueba t de Student para grupos
correlacionados e independientes
Comparando medias de dos poblaciones
usando muestras pareadas
En este caso se trata de comparar dos mtodos o tratamientos,
pero se quiere que las unidades experimentales donde se
aplican los tratamientos sean las mismas, lo ms parecidas
posibles, para evitar influencia de otros factores en la
comparacin
Sea Xi el valor del tratamiento I y Yi el valor del tratamiento
II en el i-simo sujeto. Consideremos di = Xi - Yi la diferencia
de los tratamientos en el i-simo sujeto.
Las inferencias que se hacen son acerca del promedio
poblacional d de las di. Si d = 0, entonces significa que no hay
diferencia entre los dos tratamientos.
Intervalo de Confianza

Un intervalo de confianza del 100(1-)% para la


diferencia poblacional d
dada una muestra de tamao n es de la forma
( d - t(n-1,/2) sd/ n , d + t(n-1,/2) sd/ n )
donde d , es la media de las diferencias muestrales di
y i
( d d ) 2
es la desviacin estndar.
sd i
n 1
Pruebas de Hiptesis

Caso I Caso II Caso III


Ho : d = 0 Ho : d = 0 Ho : d =0
Ha : d < 0 Ha : d 0 Ha : d >0
Prueba Estadstica:
d
t= se distribuye con una t de Student con n-1 gl.
sd
n
Decisin:
Si t<-t entonces Si | t |>t/2 entonces Si Tcal >t entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo
Un mdico desea investigar si una droga tiene el efecto de
bajar la presin sangunea en los usuarios. El mdico eligi al
azar 15 pacientes mujeres y les tom la presin, luego les
recet la medicina por un perodo de 6 meses, y al final del
mismo nuevamente les tom la presin. Los resultados son
como siguen:
Sujetos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Antes 70 80 72 76 76 76 72 78 82 64 74 92 74 68 84
Desp. 68 72 62 70 58 66 68 52 64 72 74 60 74 72 74
Solucin

Solucin:
Sea d que representa la media poblacional de
las diferencias. Luego:
Ho: d = 0 (La droga no tiene ningn efecto)
Ha: d > 0 (La droga tiene efecto, la presin
antes de usar la droga era mayor
que despus de usarla).
Ejemplo (Cont.)
Las diferencias son: -2, -8, -10, -6, -18, -10, -4, -26, -18, 8, 0, -32, 0, 4,
-10.
El promedio de las diferencias es -8.8
La desviacin estndar de las diferencias es 10,98
La desviacin estndar de las medias muestrales es 2.83
8.8 0
t 3.109
2.83
El valor crtico de t con 14 grados de libertad (n-1) y =0.05 es 2.145,
el valor calculado es superior, por lo tanto se rechaza la hiptesis
nula y se acepta la alterna, el medicamento es efectivo para reducir
la presin arterial
Anlisis de Varianza
EJERCICIO
En captulos anteriores usted aprendi a hacer
inferencias acerca de una o dos medias, ahora
aprenderemos a hacer lo mismo respecto de tres o
ms medias, supongamos para ello a tres grupos
tomados al azar de 6 bachilleres graduados en
diferentes colegios que se presentan a una prueba de
admisin en la Universidad X, los bachilleres del
colegio A han obtenido las notas: 20, 20, 18, 13, 19 y
18; los bachilleres del colegio B tienen: 18, 15, 12,
09, 14 y 16, por ltimo, los bachilleres del colegio C
tienen como resultado: 13, 15, 20, 18, 20 y 16.
Queremos, en base a esos datos saber cul es el
colegio cuyos bachilleres obtienen mejores resultados
en los exmenes de ingreso a la universidad.
Una primera aproximacin para saberlo es obtener la
media de cada colegio, fcilmente podemos ver que
los estudiantes del colegio A tienen una media de 18,

xA = (20+20+18+13+19+18)/6=18

los del colegio B tienen una media de 14

xB = (18+15+12+09+14+16)/6=14
y los del colegio C un promedio de 17
xC = (13+15+20+18+20+16)/6=17.
La varianza entre las medias es:
=[(18-16,33)2+(17-16,33)2+(14-16,33)2]/(3-1) [1]
=4.33
La varianza dentro de los grupos es:
=[(20-18)2+(20-18)2+(18-18)2+(13-18)2+(19-18)2+(18-
18)2+(18-14)2+(15-14)2+(12-14)2+(9-14)2+(14-14)2+(16-
14)2+(13-17)2+(15-17)2+(20-17)2+(18-17)2+(20-
17)2+(16-17)2]/[(6-1)+(6-1)+(6-1)] [2]
=(4+4+0+25+1+0+16+1+4+25+0+4+16+4+9+1+9+1)/15
=124/15=8.27
[1] Ntese que sumamos los cuadrados de la
diferencia entre la media de cada colegio y la media
global y el total lo dividimos para el numero de
colegios menos 1, ya que slo tenemos dos grados de
libertad debido a que la tercera media queda
determinada por la media general.
[2] Sumamos los cuadrados de las diferencias con la
media de cada colegio y dividimos el total de esta
suma para el total de grados de libertad, de cada
grupo.
La suma de las varianzas dentro de los grupos es 8,27
y la varianza de las medias es 4.33, para comparar
estos valores dividimos el producto de 6 por la
varianza entre las medias para la varianza dentro de
los grupos y obtenemos F=3,15
A esta cantidad la llamaremos coeficiente F en honor
de Sir Ronald Fisher quien elabor una tabla, que nos
da la probabilidad de que la hiptesis nula sea
verdadera, para utilizarla debemos observar los
grados de libertad del numerador, que seran el
nmero de colegios menos uno (2), y los grados de
libertad del denominador (3 colegios por 6-1
bachilleres de cada colegio, o sea 15).
En la tabla buscamos en el extremo superior
grados de libertad en el numerador, bajo la
columna 2 y tratamos de encontrar la
interseccin con la fila donde dice grados de
libertad del denominador, en este caso la fila con
el numero 15.
El valor que hemos encontrado en la tabla, 3.68,
es superior al valor que hemos calculado, 3,15 lo
que nos indica que la probabilidad de que Ho sea
verdadera es superior a 0.05 (5%).
Pruebas no paramtricas 2
Distribucin ji-cuadrado 2

-Nunca adopta valores menores de 0


-Es asimtrica positiva
-Es en realidad una familia de curvas, en funcin de los
llamados grados de libertad. Es decir, hay una
distribucin chi-cuadrado con 1 gl, una distribucin chi-
cuadrado con 2 gl, etc. (Nota: Los grados de libertad
son siempre nmeros positivos.)
-A medida que aumentan los grados de libertad, la distribucin se
hace ms y ms simtrica.
Usos de la Ji-Cuadrado

a) Para hacer inferencias acerca de la varianza


poblacional. Es decir, para calcular Intervalos de
Confianza y Prueba de hiptesis para la varianza
poblacional.
b) Para hacer pruebas de Bondad de Ajuste. O sea,
para probar si un conjunto de datos sigue una
distribucin pre-determinada.
c) Para hacer anlisis de tablas de contingencia.
Por ejemplo, se divide un grupo de estudiantes en
buenos y malos alumnos y se constat si tenan
inters en problemas polticos, con nivel de
significacin del 1% Se puede decir de los resultados
que se muestran en la tabla a continuacin si el
inters por la poltica es independiente del hecho de
ser o no buen estudiante?
Sin inters poltico Con inters Poltico

Buen estudiante 100 20

Mal estudiante 20 60
Sin inters Con inters
poltico Poltico

Buen 100 20 120


estudiante

Mal 20 60 80
estudiante

120 80 200
Sin inters Con inters
poltico Poltico

Buen 100 (72) 20 (48) 120


estudiante
Mal 20 (48) 60 (32) 80
estudiante
120 80 200
De acuerdo al cuadro anterior
(100-72)2/72+(20-48)2/48+(20-48)2/48+(60-
32)2/32=7,84+39,2+39,2+13,07=99,31
Al consultar el valor crtico correspondiente
de 2 encontramos
20,95,(2-1)(2-1)=20,95,1=3,84
Como el valor encontrado supera al valor
crtico rechazamos la hiptesis nula
(independencia entre las variables) y
aceptamos la alterna, el inters poltico y el
rendimiento acadmico no son
independientes.
CONSULTAS,
COMENTARIOS Y
SUGERENCIAS A
gfmorales@utpl.edu.ec
38

También podría gustarte