Está en la página 1de 7

INTRODUCCION:

1)
Una de las aplicaciones mas importantes de la estadística implica la
predicción de algún valor futuro de y con base el conocimiento de un
conjunto de variables independientes relacionadas, x1, x2, . . . xk.
Los modelos que se emplean para relacionar una variable dependiente y
con las variables independientes x1, x2, . . . xk se denominan modelos de
regresión o modelos estadísticos lineales porque expresan el valor medio
de y para valores dados de x1, x2, . . . xk como una función lineal de un
conjunto de parámetros desconocidos.
Los conceptos de análisis de regresión se presentan empleando un
modelo de regresión muy sencillo, uno que relaciona y con una sola
variable x. Aprenderemos a ajustar este modelo a un conjunto de datos
mediante el método de los mínimos cuadrados.
90

80 y = 0,0043x + 46,64
R² = 0,7684
70

60

50

40

30

20

10

0
0 1000 2000 3000 4000 5000 6000 7000 8000

Dadas dos variables (Y, X) tomadas sobre el mismo elemento de la


población, el diagrama de dispersión es simplemente un gráfico de dos
dimensiones, donde en un eje (la abscisa) se sitúa una variable, y en el
otro eje (la ordenada) se sitúa la otra variable
Si las variables están correlacionadas, el gráfico mostraría algún nivel de
correlación (tendencia) entre las dos variables. Si no hay ninguna
correlación, el gráfico presentaría una figura sin forma, una nube de
puntos dispersos en el gráfico.
Supongamos que creemos que el valor de y tiende a aumentar de forma
lineal conforme x aumenta . Entonces, podríamos escoger un modelo
que relacione a y con x trazando una línea recta a través de los puntos de
la figura.
2)

Un tipo de modelo probabilístico, el modelo de regresión lineal simple,


supone que el valor medio de y para un valor dado de x se grafica como
una línea recta y que los puntos se desvían de esta línea de medias en
una cantidad aleatoria (positiva o negativa) igual a .
Si suponemos que los puntos se desvían por encima y por debajo de la
líneas de medias, siendo algunas desviaciones positivas, otras negativas,
y con E() = 0, entonces el valor medio de y es:

Asumiendo que el término de error presenta una distribución de probabilidad se


realizan entonces ciertos supuestos sobre dicha distribución

1. El valor esperado del término de error es igual a cero. E(ui) = 0, para


todo i = 1,...N. El término aleatorio tiene esperanza igual a cero para todas
las observaciones. Este supuesto implica que en promedio la relación
entre Y yvariable X es exactamente lineal, aunque las realizaciones
particulares de los ui'spueden ser distintas de cero.
En algunos casos, de acuerdo a la naturaleza de las variables y la
información disponible, puede suponerse una relación funcional entre
dos o más variables, que puede expresarse mediante una expresión
matemática. Considerando dos variables, si denominamos Y a la
variable que se supone dependiente, y X a la variable que se postula
independiente, resulta familiar utilizar el concepto de función: “Y es
función de X” indica que pueden predecirse los valores que tomará Y
de acuerdo a los valores asignados a X. Dicho de otra manera, se puede
conocer el comportamiento de Y a través de un modelo que relacione
la variación de Y con la variación de X.

También podría gustarte