Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pruebas paramétricas
Prueba de independencia
1
ESTADÍSTICA INFERENCIAL POST PARCIAL
Consiste en hallar una ecuación lineal, que expresa la relación funcional entre una variable independiente o explicativa
X y otra variable dependiente o no explicativa Y, a partir de información muestral (n pares ordenados); a continuación,
se procede a sustentar la validez de dicha ecuación a nivel descriptivo e inferencial.
Metodología
La técnica que se usa para obtener los coeficientes estimados de la recta se basa en el método de mínimos cuadrados,
cuyo principio es de minimizar la suma de los cuadrados de los errores.
Coeficiente de correlación (r ¿
Se utiliza para medir la asociación que hay entre 2 variables cuantitativas. Su valor se encuentra entre -1 y 1, siendo el
signo que indica el tipo de asociación: directa o inversa. Cuanto más próximo se encuentre al 1 o -1 la asociación será
alta; cuanto más próximo este al 0, baja. 3
SC( X ,Y )
r=
√ SC ( X ) × SC(Y )
Coeficiente de determinación (R)
Nos indica que porcentaje de la variación de Y es explicado por la variable X. En el caso de la regresión lineal el
coeficiente de determinación es numéricamente igual al coeficiente de correlación al cuadrado. 4 5
SC ( Reg)
R=r 2= ×100 %
SCT
Prueba para el coeficiente de regresión β 1
Es una forma de determinar si la variable independiente X es significativa para el modelo, que en este caso será
equivalente a decir si el modelo es significativo.
H 0 : β 1=0La variable X no es una variable significativa. No hay regresión significativa.
1
SP ( X ,Y ) =∑ X i Y i−n μ x μ y
SC ( X ) =∑ X i −n¿
2 2
SC ( Y )=∑ Y i −n(μ y )
3 2 2
2
4
SC ( Reg )=b 1 × SC (X )
5
SCT =SC( Y )
2
ESTADÍSTICA INFERENCIAL POST PARCIAL
El punto crítico se halla con una distribución de T de Student con grados de libertad n−2 bilateral.
El estadístico de prueba se obtiene dividiendo la pendiente con la desviación estándar del coeficiente de regresión b 1.
b1
T cal=
Sb
1
Sb =
1
√ CME
SC ( X )
Supongamos que se sabe que X toma un valor particular X =x 0 , entonces podemos estimar un intervalo de confianza
para el promedio de la variable Y. 6 7
√
2
E=t (l=n−2; 1− α/2) × √CME × SY^ 1 ( x −X )
SY^ = + o
n SC( X )
IC ( μY / X = x ) =Y^ ∓ E
0
Elaboramos un intervalo de confianza de los coeficientes de regresión β 0 y β 1 a través de sus valores estimados.
√
2
1 X
IC ( β0 ) =b 0 ∓t (l=n−2 ;1−α/ 2) × √ CME × +
n SC (X )
1
IC ( β1 ) =b1 ∓t (l=n−2;1−α /2) × √ CME ×
SC ( X )
n n n
6
SCE=∑ Y i−b 0 ∑ Y i−b1 ∑ X i Y i ¿ ¿
2
i=1 i =1 i=1
7
CME=SCE /( n−2)
3
ESTADÍSTICA INFERENCIAL POST PARCIAL
Anteriormente, vimos como una sola variable explicativa podía estimar el valor de la variable dependiente. En este
apartado, veremos como podría potenciarse el modelo con más variables explicativas. A la variable que deseamos
estimar la denotamos por Y, y se llama variable dependiente. Por otra parte, a las variables que se usan para estimar las
denotamos por X 1 , X 2 , X 3 ,… , X k conocidas como variables dependientes.
El Coeficiente de Determinación nos indica que porcentaje de la variación en Y es explicado por las variables del
modelo X 1 , X 2 , X 3 ,… , X k. 8
2 SC ( Reg)
R=r = ×100 %
SCT
Prueba de significancia del modelo
Dado el modelo de regresión, cabe la pregunta acerca de su poder explicativo, es decir, si el modelo es significativo o
no lo es. Esto puede responderse realizando una prueba de hipótesis denominada La Prueba Global del modelo, pues
lo que pretende es determinar si el modelo como un todo es significativo o no lo es.
H 0 : β 1=β 2=β 3=…=0; el modelo no es significativo
El punto crítico se halla con una distribución de F de Fisher con grados de libertad (k ; n−k −1) unilateral a la
derecha. Para el estadístico de prueba utilizaremos una Tabla Anova. k toma valores de la cantidad de variables
independientes.
FV SC GL CM Fcal
Regresión SC( Reg) k SC( Reg)/k SCT −SC( Reg)/ n−1−k
Error SCT −SC( Reg) n−1−k SCT −SC( Reg)/n−1−k
Total SCT n−1
2
8
SC ( Reg )=b ´ X ´ Y −n(μ¿¿ y ) ¿
4
ESTADÍSTICA INFERENCIAL POST PARCIAL
hecho de que alguna variable sea considerada no significativa, implica que esta puede ser retirada del modelo, pues se
considera que su aporte no es valioso.
Supongamos que se sabe que X toma un valor particular X =x 0 , entonces podemos estimar un intervalo de confianza
para el promedio de la variable Y. 9 10
SY^ =√ CME[ x ´ 0 ( X ´ X ) x 0 ]
−1
E=t (l=n−k−1; 1−α /2 ) × S ^Y
IC ( μY / X = x ) =Y^ ∓ E
0
n n n
9
SCE=∑ Y i−b 0 ∑ Y i−b1 ∑ X i Y i ¿ ¿
2
i=1 i =1 i=1
10
CME=SCE /(n−2)
5