Está en la página 1de 12

ESTADISTICA Y PROCESOS ESTOCASTICOS

2018B
PROFESOR: Centeno Jerónimo.
ALUMNOS: Ceniceros Sevilla Jaylene Guadalupe.
Ortega Ruedas Aurelio.
EST_GP003_TAREA?_AURELIO_RUEDAS_ORTEGA

Tema?
Prueba con el estadístico “t”
La distribución t es un conjunto de curvas estructurada por un grupo de datos de
unas muestras en particular. La contribución de esta prueba, específicamente, es
para comparar dos muestras de tamaño ≤ 30. La primera presunción es formular
la hipótesis nula y la hipótesis alterna, que establece que no hay diferencias en la
media de las dos muestras independientes y que de existir esta diferencia, sólo se
debe al azar. Si la t calculada que se origina de las dos muestras es desmesurada
(valor de p que se encuentra en las tablas respectivas), entonces se rechazaría la
hipótesis nula (error tipo I).
Es importante mencionar que este valor depende del valor de significancia
establecido con anterioridad de lo que se quiere probar, para la diferencia entre las
medias de las dos muestras. Este valor de significancia es la probabilidad de
rechazar erróneamente la hipótesis nula.

NATURALEZA DE LA t-STUDENT
La t de Student, inicialmente se diseñó para examinar las diferencias entre dos
muestras independientes y pequeñas que tengan distribución normal y
homogeneidad en sus varianzas (en el artículo original, el autor no define qué es
una muestra grande y/o pequeña). Gosset hace hincapié en la normalidad de las
dos muestras como crucial en el desarrollo de la prueba.
METODOLOGÍA DE LA t-STUDENT 1.
 1-. Probar que cada una de las muestras tiene una distribución normal;
 2-. Obtener para cada una de las muestras: a) el tamaño de las muestras
(n1 y n2), b) sus respectivas medias (m1 y m2), c) sus varianzas (v1 y v2);
 3-. Probar que las varianzas sean homogéneas;
 4-. En caso de homogeneidad en esas varianzas:
a) establecer la diferencia entre las medias: m1-m2,
b) calcular la varianza común de las dos muestras. vc = ((n1-1)v1 + (n2-
1)v2)/(n1 + n2 - 2) Es decir, la varianza común (vc) es igual a un promedio
pesado de las varianzas de las dos muestras en donde los pesos para ese
promedio son iguales al tamaño, menos uno (n-1) para cada una de las
muestras,
c) con esa varianza común, se calcula el error estándar de la diferencia de
las medias ESM= √ ((vc) (n1 + n2)/(n1n2));
 5. Finalmente, la t-Student es igual al cociente de la diferencia de medias
entre el ESM anterior;
 6. De acuerdo con nuestra hipótesis nula y alterna se debe demostrar que
existe diferencia entre las medias de las muestras, se consulta una tabla de
t-Student con grado de libertad igual a n1 + n2-2 y se calcula el valor de P.
PRUEBA CON EL ESTADISTICO F

El análisis de Varianza contrasta la hipótesis de igualdad de las Medias de más de


dos grupos, y tiene su fundamento en la relación entre la variación explicada por
las diferencias entre grupos y la variación individual.
Consideremos la siguiente situación: Queremos comparar la efectividad de cuatro
tratamientos de la depresión, para lo que aplicamos los tratamientos a cuatro
grupos de pacientes seleccionados aleatoriamente. A finales del tratamiento
recogemos los datos, que son:

Los valores del cuerpo central de la tabla representan las puntuaciones obtenidas
por el sujeto "i" en el grupo "j". Por ejemplo, X32=14 simboliza que el sujeto
número tres del grupo 2 ha obtenido una puntuación igual a 14.
Las puntuaciones de cada grupo son una muestra de la población de pacientes a
los que se administra cada tratamiento (los del grupo 1, de la población a la que se
administra el tratamiento 1, los del grupo 2, de la población a la que se administra
el tratamiento 2, etc.). Las Medias de las poblaciones se simbolizan m1, m2, m3,
etc. Queremos saber si estas Medias son semejantes o diferentes a la finalización
del tratamiento, porque eso significaría que los tratamientos afectan de manera
diferente a los pacientes. La Hipótesis Nula es:

El estadístico de contraste es:

donde MCE y MCI son las Medias Cuadráticas "entre" e "intra" respectivamente.
El fundamento del estadístico de contraste es:
a) El efecto del tratamiento en cada grupo es medido por la Media de las medidas
de depresión de cada grupo.
b) Si todos los tratamientos tuvieran el mismo efecto, esperaríamos que las
Medias de los grupos fueran semejantes:

En cambio, cuanto más diferentes sean los efectos de los tratamientos, más
diferentes esperamos que sean las Medias.
c) La Media Cuadrática "entre" mide la variación explicada por las diferencias
entre las Medias de los grupos más la variación explicada por diferencias
individuales:

donde

si las Medias fueran semejantes, la Media Cuadrática "entre" sería igual a 0


(porque la Media de cada grupo sería igual a la Media total). Si las Medias fueran
diferentes, la Media Cuadrática "entre" será mayor cuanto más y mayores sean las
diferencias.
d) La variación individual es medida por la Media Cuadrática "intra":

donde
glI: grados de libertad "intra"= J(n-1).
La Media Cuadrática "intra" mide la variación explicada por diferencias individuales
porque solo depende de las diferencias dentro de cada grupo. En cambio, las
diferencias entre grupos no explican la variación "intra".
e) El estadístico F pone en relación la variación "entre" respeto de la variación
"intra":
cuanto mayor es la variación "entre" en relación a la variación "intra", mayor es el
valor de F.
f) Para generalizar a la población se opera con los valores esperados de la Medias
Cuadráticas:

el valor esperado de la Media Cuadrática "entre" es igual a la Varianza explicada


(ocasionada) por las diferencias individuales más una cantidad cuyo valor
depende de las diferencias entre los tratamientos (entre las muestras).

El valor esperado de la Media Cuadrática "intra" es igual a la Varianza explicada


por diferencias individuales.
g) Si la Hipótesis Nula fuera verdadera, es decir, si NO hubiera diferencias entre
las Medias poblacionales, el valor del término de la derecha en la expresión del
valor esperado de la Media Cuadrática "entre", que es:

tomaría el valor 0 (porque las diferencias dentro del paréntesis siempre serían 0).
En consecuencia, el estadístico F sería una razón de dos estimadores de la misma
Varianza y seguiría la distribución F con J-1 y J(n-1) grados de libertad.
h) Si la Hipótesis Nula fuera falsa, es a decir, si hubiera diferencias entre las
Medias poblacionales, la expresión
tomaría un valor superior a 0. En consecuencia, el estadístico F NO sería una
razón de dos estimadores de la misma Varianza y el cociente F NO seguiría la
distribución FJ-1,J(n-1).
i) En conclusión, si el estadístico F sigue la distribución FJ-1,J(n-1) pensaremos
que no hay evidencia suficiente por rechazar la Hipótesis Nula. En cambio, si el
estadístico F NO sigue la distribución FJ-1,J(n-1), pensaremos que es más
razonable rechazar la Hipótesis Nula.
PRUEBA DE 𝑋 2
La prueba de 𝑋 2 nos permite averiguar si la distribución empírica de una variable
categórica se ajusta utilizando o no a una determinada distribución teórica. Esta
prueba de bondad o ajuste se pone a prueba una fórmula para comparar las
frecuencias observadas o empíricas (frecuencias observadas: fo) con las
esperadas o teóricas de cada categoría en una muestra concreta (frecuencia
esperada: fe) con las frecuencias que cabría esperar en caso de que la variable
siguiera la distribución teórica propuesta en la hipótesis nula.
En caso de que las diferencias sean grandes entre la fo y fe el valor de la X
cuadrada (𝑋 2 ) será mayor y, en ese caso se rechaza la hipótesis nula. Es difícil
suponer que las diferencias entre las fo y fe son iguales o idénticas. En resumen,
si el valor de es𝑥 2 mayor de lo que el azar anticiparía, se puede descartar la
hipótesis nula.

Hipótesis nula
Enuncia que la medida, resultado o parámetro de la población es igual al valor
propuesto. Su signo es = (igual)

Hipótesis alternativa
En caso de rechazar la hipótesis nula, debido -- por ejemplo-- a que hay pruebas
o datos duros consistentes en contra, se adopta la hipótesis alternativa. Se tienen
tres opciones de hipótesis alternativa:
Primer caso: Que el resultado sea distinto 𝑋 2 : es diferente a
Segundo caso: Que el resultado sea mayor o igual a 𝑋 2 : es mayor o igual >
-
Tercer caso: Que el resultado sea menor o igual a 𝑋 2 : es menor o igual <

Supuestos a considerar:
1.- Se parte del supuesto de que hay independencia entre las muestras para
utilizar la prueba de. 𝑋 2
2.- Las muestras deben ser considerablemente grandes. Por ejemplo, trabajando
con encuestas nacionales.

3.- Trabajar con variables que se encuentren operacionalizadas como dicotómicas,


es decir, variables de 2 X 2.
Nivel de significación:
Para trabajar con mayor contundencia en demostrar una diferencia, se utiliza el
nivel de .001
Distribución del muestreo:
La distribución del muestreo se busca en la Tabla de Distribución de la 𝑋 2

Nota: Al revisar la Tabla de Distribución de la 𝑋 2 se puede comprobar que las


distribuciones difieren de acuerdo con los grados de libertad implicados.
Independientemente de la dirección de la relación entre una variable (Ej. TIPO DE
VIVIENDA) y otra (E. PREFERENCIAS POLÍTICAS).
Forma de obtener el cálculo de la estadística de la prueba de 𝑋 2
1ro. El primer paso es la obtención de la frecuencia esperada (Utilizar una hoja de
excel)

TIPO DE VIVIENDA
RURAL URBANA SUB TOTAL
PAN 126 99

PREFERENCIA POLÍTICA
PRD 71 162

SUB TOTAL TOTAL

a b a + b
c d c + d
a+c b+d N

Casilla a: Frecuencia esperada para la casilla a = (a+b) (a+c)


/ N

Casilla b: Frecuencia esperada para la casilla b = (b+a) (b+d)


/ N

Casilla c: Frecuencia esperada para la casilla c = (c+a) (c+d)


/ N

Casilla d: Frecuencia esperada para la casilla d = (d+c) (d+b)


/ N

Casilla a
a + b a+b a=?
c
a+c N

Casilla b
a + b a+b b=?
d
b+d N
Casilla c
a c=?
c + d c+d
a+c n

Casilla d
b d=?
c + d c +d
b+d N
1ro. El primer paso es la obtención de la frecuencia esperada

TIPO DE VIVIENDA
RURAL URBANA SUB TOTAL
PAN Fo 126 Fo 99 _________-
Fe Fe
PREFERENCIA POLÍTICA
PRD Fo 71 Fo 162 _________
Fe Fe

SUB TOTAL TOTAL

2do. Paso: Obtener la diferencia entre fo y fe

Nota: observar que al restar la diferencia entre fo y fe, y después de hacer la


suma, el producto restante es O.

3er. Paso: Para eliminar el problema de los signos negativos, se eleva al


cuadrado.

Nota: observar que al elevar al cuadrado el resultado es el mismo en todos los


casos
4to. Paso: Se divide cada resultado entre fe, la suma total es la 𝑋 2

Nota: en el ejemplo anterior la 𝑋 2 es 30.388


Cálculo de la 𝑋 2
Casilla fo Fe Fo - fe (fo- fe)2 (fo – fe)2 /
fe
A
B
C
D
Total

En una tabla de 2 X 2 se expresa la 𝑋 2 como simple función de las frecuencias de


las casillas y de los totales marginales.

𝑁(𝑎𝑑−𝑏𝑐)2
𝑋2 = (a + b) (c +d) (a +c) (b +d)

Nota: La 𝑋 2 requiere números grandes.

5to. Decisión: Si se trata de una tabla de 2 X 2 hay 1 grado de libertad al nivel de


.001

Cálculo de los Grados de Libertad:

Gl = (r -1) (c - 1)
(2 - 1) (2- 1)
(1) (1)
Gl = 1

Por tanto, revisando la Tabla de Distribución de la 𝑋 2 , le corresponde una 𝑋 2 de


10.827
Si los supuestos son correctos, tenderemos un valor de la 𝑋 2 igual o mayor que
ese una vez entre mil.
Es difícil que la fo y fe en una cantidad de 𝑋 2 mayor o igual > a 10.827 en caso
de que no hubiera ninguna relación entre las variables.
Como el valor de 𝑋 2 es igual a 20.308 la hipótesis nula se descarta en el nivel .001
Referencias:
http://www.medigraphic.com/pdfs/cardio/h-2015/h151i.pdf
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03c.html
https://www.uv.es/webgid/Inferencial/41_prueba_f.html
https://sites.google.com/site/sociologiayestadisticas/repaso-de-los-conceptos-de-
estadistica/estadistica-inferencial/prueba-de-chi-cuadrada

También podría gustarte