Está en la página 1de 3

Repaso de Regresión

Isaach Sagel
25 de octubre de 2023

1 Pasos de la regresión
La ecuación de regresión lineal se escribe como Y = a + bX, Y es el valor
de la variable dependiente (Y ), lo que se predice o explica, a o Alfa, una
constante; es igual al valor de Y cuando el valor de X = 0, b o Beta, el
coeficiente de X; la pendiente de la recta de regresión; cuánto cambia Y por
cada cambio de una unidad en X. La regresión lineal múltiple tiene como
objetivo encontrar una relación lineal entre variables en situaciones donde
hay varias variables independientes.

ŷ = a + b1 x1 + b2 x2
X es el valor de la variable Independiente (X), lo que predice o explica
el valor de Y .
Los siguiente es formular el plan de estimación de la regresión:
a. Plantee la hipótesis.
b. Plantee la hipótesis nula.
c. Reúna los datos.
d. Calcular la ecuación de regresión
e. Examinar pruebas de significancia estadı́stica y medidas de asociación.
f. Relacionar los hallazgos estadı́sticos con la hipótesis. Aceptar o rechazar
la hipótesis nula.
g. Rechazar, aceptar o revisar la hipótesis original. Hacer sugerencias para
el diseño de la investigación y aspectos de gestión del problema.

1
1.1 Herramientas del Análisis
a = ȳ − bx̄
P P
(xy) − xn y
P P
Sxy (xi − x̄)(yi − ȳ)
b= = P = P P 2
Sxx (xi − x̄)2 (x2 ) − ( nx)
P
x
x̄ =
n
P
y
ȳ =
n
P
(xi − x̄)(yi − ȳ)
r = pP P , Coef iciente de P earson
(xi − x̄)2 (yi − ȳ)2

Ahora tenemos una ecuación de regresión. Pero, ¿qué tan buena es la


ecuación para predecir valores de Y , para valores dados de X? Para esa
evaluación, se recurre a medidas de asociación y medidas de significación es-
tadı́stica que se utilizan con ecuaciones de regresión.

r2 : es una medida de asociación; representa el porcentaje de la varianza


en los valores de Y que se puede explicar conociendo el valor de X. r2 varı́a
desde un mı́nimo de 0,0 (ninguna de la varianza se explica) hasta un máximo
de +1,0.

2 Diseño de Hipótesis
Nuestras dos hipótesis tienen nombres especiales: la hipótesis nula represen-
tada por H0 y la hipótesis alternativa por Ha . Históricamente, la hipótesis
nula (inválida, vacı́a, que no significa nada) era lo que el investigador esper-
aba rechazar. Hoy en dı́a es una práctica común no asociar ningún significado
especial a cuál hipótesis es cuál.

La razón por la que el estadı́stico t (o cualquier estadı́stico de prueba) es útil


es que sabemos cómo se distribuye cuando la hipótesis nula es verdadera.
Despendiendo de la distribución, ejemplo, si es unimodal y simétrica, y tiene
una media calculada; su forma precisa depende de un concepto estadı́stico

2
llamado grados de libertad, que para una prueba t de una muestra es N − 1.
Dependiendo del número de grupos, los grados de libertad se multiplican
como columnnasI − 1 y filasJ − 1. El p − value es la probabilidad del inves-
tigador de equivocarse en la hipótesis.

También podría gustarte