Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2018B
PROFESOR: Centeno Jerónimo.
ALUMNOS: Ceniceros Sevilla Jaylene Guadalupe.
Ortega Ruedas Aurelio.
EST_GP003_TAREA?_AURELIO_RUEDAS_ORTEGA
Tema?
Prueba con el estadístico “t”
La distribución t es un conjunto de curvas estructurada por un grupo de datos de
unas muestras en particular. La contribución de esta prueba, específicamente, es
para comparar dos muestras de tamaño ≤ 30. La primera presunción es formular
la hipótesis nula y la hipótesis alterna, que establece que no hay diferencias en la
media de las dos muestras independientes y que de existir esta diferencia, sólo se
debe al azar. Si la t calculada que se origina de las dos muestras es desmesurada
(valor de p que se encuentra en las tablas respectivas), entonces se rechazaría la
hipótesis nula (error tipo I).
Es importante mencionar que este valor depende del valor de significancia
establecido con anterioridad de lo que se quiere probar, para la diferencia entre las
medias de las dos muestras. Este valor de significancia es la probabilidad de
rechazar erróneamente la hipótesis nula.
NATURALEZA DE LA t-STUDENT
La t de Student, inicialmente se diseñó para examinar las diferencias entre dos
muestras independientes y pequeñas que tengan distribución normal y
homogeneidad en sus varianzas (en el artículo original, el autor no define qué es
una muestra grande y/o pequeña). Gosset hace hincapié en la normalidad de las
dos muestras como crucial en el desarrollo de la prueba.
METODOLOGÍA DE LA t-STUDENT 1.
1-. Probar que cada una de las muestras tiene una distribución normal;
2-. Obtener para cada una de las muestras: a) el tamaño de las muestras
(n1 y n2), b) sus respectivas medias (m1 y m2), c) sus varianzas (v1 y v2);
3-. Probar que las varianzas sean homogéneas;
4-. En caso de homogeneidad en esas varianzas:
a) establecer la diferencia entre las medias: m1-m2,
b) calcular la varianza común de las dos muestras. vc = ((n1-1)v1 + (n2-
1)v2)/(n1 + n2 - 2) Es decir, la varianza común (vc) es igual a un promedio
pesado de las varianzas de las dos muestras en donde los pesos para ese
promedio son iguales al tamaño, menos uno (n-1) para cada una de las
muestras,
c) con esa varianza común, se calcula el error estándar de la diferencia de
las medias ESM= √ ((vc) (n1 + n2)/(n1n2));
5. Finalmente, la t-Student es igual al cociente de la diferencia de medias
entre el ESM anterior;
6. De acuerdo con nuestra hipótesis nula y alterna se debe demostrar que
existe diferencia entre las medias de las muestras, se consulta una tabla de
t-Student con grado de libertad igual a n1 + n2-2 y se calcula el valor de P.
PRUEBA CON EL ESTADISTICO F
Los valores del cuerpo central de la tabla representan las puntuaciones obtenidas
por el sujeto "i" en el grupo "j". Por ejemplo, X32=14 simboliza que el sujeto
número tres del grupo 2 ha obtenido una puntuación igual a 14.
Las puntuaciones de cada grupo son una muestra de la población de pacientes a
los que se administra cada tratamiento (los del grupo 1, de la población a la que se
administra el tratamiento 1, los del grupo 2, de la población a la que se administra
el tratamiento 2, etc.). Las Medias de las poblaciones se simbolizan m1, m2, m3,
etc. Queremos saber si estas Medias son semejantes o diferentes a la finalización
del tratamiento, porque eso significaría que los tratamientos afectan de manera
diferente a los pacientes. La Hipótesis Nula es:
donde MCE y MCI son las Medias Cuadráticas "entre" e "intra" respectivamente.
El fundamento del estadístico de contraste es:
a) El efecto del tratamiento en cada grupo es medido por la Media de las medidas
de depresión de cada grupo.
b) Si todos los tratamientos tuvieran el mismo efecto, esperaríamos que las
Medias de los grupos fueran semejantes:
En cambio, cuanto más diferentes sean los efectos de los tratamientos, más
diferentes esperamos que sean las Medias.
c) La Media Cuadrática "entre" mide la variación explicada por las diferencias
entre las Medias de los grupos más la variación explicada por diferencias
individuales:
donde
donde
glI: grados de libertad "intra"= J(n-1).
La Media Cuadrática "intra" mide la variación explicada por diferencias individuales
porque solo depende de las diferencias dentro de cada grupo. En cambio, las
diferencias entre grupos no explican la variación "intra".
e) El estadístico F pone en relación la variación "entre" respeto de la variación
"intra":
cuanto mayor es la variación "entre" en relación a la variación "intra", mayor es el
valor de F.
f) Para generalizar a la población se opera con los valores esperados de la Medias
Cuadráticas:
tomaría el valor 0 (porque las diferencias dentro del paréntesis siempre serían 0).
En consecuencia, el estadístico F sería una razón de dos estimadores de la misma
Varianza y seguiría la distribución F con J-1 y J(n-1) grados de libertad.
h) Si la Hipótesis Nula fuera falsa, es a decir, si hubiera diferencias entre las
Medias poblacionales, la expresión
tomaría un valor superior a 0. En consecuencia, el estadístico F NO sería una
razón de dos estimadores de la misma Varianza y el cociente F NO seguiría la
distribución FJ-1,J(n-1).
i) En conclusión, si el estadístico F sigue la distribución FJ-1,J(n-1) pensaremos
que no hay evidencia suficiente por rechazar la Hipótesis Nula. En cambio, si el
estadístico F NO sigue la distribución FJ-1,J(n-1), pensaremos que es más
razonable rechazar la Hipótesis Nula.
PRUEBA DE 𝑋 2
La prueba de 𝑋 2 nos permite averiguar si la distribución empírica de una variable
categórica se ajusta utilizando o no a una determinada distribución teórica. Esta
prueba de bondad o ajuste se pone a prueba una fórmula para comparar las
frecuencias observadas o empíricas (frecuencias observadas: fo) con las
esperadas o teóricas de cada categoría en una muestra concreta (frecuencia
esperada: fe) con las frecuencias que cabría esperar en caso de que la variable
siguiera la distribución teórica propuesta en la hipótesis nula.
En caso de que las diferencias sean grandes entre la fo y fe el valor de la X
cuadrada (𝑋 2 ) será mayor y, en ese caso se rechaza la hipótesis nula. Es difícil
suponer que las diferencias entre las fo y fe son iguales o idénticas. En resumen,
si el valor de es𝑥 2 mayor de lo que el azar anticiparía, se puede descartar la
hipótesis nula.
Hipótesis nula
Enuncia que la medida, resultado o parámetro de la población es igual al valor
propuesto. Su signo es = (igual)
Hipótesis alternativa
En caso de rechazar la hipótesis nula, debido -- por ejemplo-- a que hay pruebas
o datos duros consistentes en contra, se adopta la hipótesis alternativa. Se tienen
tres opciones de hipótesis alternativa:
Primer caso: Que el resultado sea distinto 𝑋 2 : es diferente a
Segundo caso: Que el resultado sea mayor o igual a 𝑋 2 : es mayor o igual >
-
Tercer caso: Que el resultado sea menor o igual a 𝑋 2 : es menor o igual <
Supuestos a considerar:
1.- Se parte del supuesto de que hay independencia entre las muestras para
utilizar la prueba de. 𝑋 2
2.- Las muestras deben ser considerablemente grandes. Por ejemplo, trabajando
con encuestas nacionales.
TIPO DE VIVIENDA
RURAL URBANA SUB TOTAL
PAN 126 99
PREFERENCIA POLÍTICA
PRD 71 162
a b a + b
c d c + d
a+c b+d N
Casilla a
a + b a+b a=?
c
a+c N
Casilla b
a + b a+b b=?
d
b+d N
Casilla c
a c=?
c + d c+d
a+c n
Casilla d
b d=?
c + d c +d
b+d N
1ro. El primer paso es la obtención de la frecuencia esperada
TIPO DE VIVIENDA
RURAL URBANA SUB TOTAL
PAN Fo 126 Fo 99 _________-
Fe Fe
PREFERENCIA POLÍTICA
PRD Fo 71 Fo 162 _________
Fe Fe
𝑁(𝑎𝑑−𝑏𝑐)2
𝑋2 = (a + b) (c +d) (a +c) (b +d)
Gl = (r -1) (c - 1)
(2 - 1) (2- 1)
(1) (1)
Gl = 1