Está en la página 1de 2

Regresin lineal

Expresndolo en forma simple, la regresin lineal es una tcnica que permite cuantificar
la relacin que puede ser observada cuando se grafica un diagrama de puntos
dispersos correspondientes a dos variables, cuya tendencia general es rectilnea (Figura
la); relacin que cabe compendiar mediante una ecuacin del mejor ajuste de la forma:

y = a + bx
(1)
En esta ecuacin, y representa los valores de la coordenada a lo largo del eje vertical
en el grfico (ordenada); en tanto que x indica la magnitud de la coordenada sobre el
eje horizontal (absisa). El valor de a (que puede ser negativo, positivo o igual a cero)
es llamado el intercepto; en tanto que el valor de b (el cual puede ser negativo o
positivo) se denomina la pendiente o coeficiente de regresin.
Correlacin

El anlisis de correlacin se encuentra estrechamente vinculado con el anlisis de


regresin y ambos pueden ser considerados de hecho como dos aspectos de un mismo
problema.

La correlacin entre dos variables es - otra vez puesto en los trminos ms simples - el
grado de asociacin entre las mismas. Este es expresado por un nico valor llamado
coeficiente de correlacin (r), el cual puede tener valores que ocilan entre -1 y +1.
Cuando r es negativo, ello significa que una variable (ya sea x o y) tiende a
decrecer cuando la otra aumenta (se trata entonces de una correlacin negativa,
correspondiente a un valor negativo de b en el anlisis de regresin). Cuando r es
positivo, en cambio, esto significa que una variable se incrementa al hacerse mayor la
otra (lo cual corresponde a un valor positivo de b en el anlisis de regresin).

Los valores de r pueden calcularse fcilmente en base a una serie de pares de datos
de x e y, utilizando la misma table y montos que se indican en el Paso 2 de la
seccin regresin de este captulo. De este modo r puede ser obtenido -
indirectamente - a partir de la relacin:
DIAGRAMAS DE DISPERSIN
La forma ms sencilla que tienen para predeterminar si existe o no correlacin entre
dos variables es construir un diagrama de dispersin.
Para construir un diagrama de dispersin tienes que utilizar un sistema de coordenadas
rectangulares, el cual aprendiste en los fascculos de Matemticas I, II y IV, lo
recuerdas?, bien. El sistema de coordenadas rectangulares, en el eje X (abscisas), es
donde se marca una escala adecuada para registrar los valores de una de las variables
y sobre el eje Y (ordenadas), se marca otra escala adecuada para representar o
registrar los valores de la otra variable. Los dos valores de las variables forman pares
ordenados (X, Y) dispersos en dicho sistema de coordenadas rectangulares. Esta
dispersin de los pares ordenados deben de sugerir una lnea recta, (de aqu el nombre
de correlacin lineal) como lo muestra el diagrama de dispersin del ejemplo anterior.

La regresin lineal simple


La regresin lineal simple utiliza una sola variable de regresin y el caso ms
sencillo es el modelo de lnea recta. Supngase que se tiene un conjunto de n
pares de observaciones (xi,yi), se busca encontrar una recta que describa de la
mejor manera cada uno de esos pares observados.
Coeficientes determinacion y correlacion
El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin
entre las variables. Este coeficiente se aplica cuando la relacin que puede existir entre
las variables es lineal (es decir, si representramos en un grfico los pares de valores
de las dos variables la nube de puntos se aproximara a una recta). No obstante, puede
que exista una relacin que no sea lineal, sino exponencial, parablica, etc.

el coeficiente de determinacin, denominado R y pronunciado R cuadrado, es un


estadstico usado en el contexto de un modelo estadstico cuyo principal propsito es
predecir futuros resultados o testear una hiptesis. El coeficiente determina la calidad
del modelo para replicar los resultados, y la proporcin de variacin de los resultados
que puede explicarse por el modelo. Hay varias definiciones diferentes para R que son
algunas veces equivalentes. Las ms comunes se refieren a la regresin lineal. En este
caso, el R es simplemente el cuadrado del coeficiente de correlacin de Pearson, lo
cual es slo cierto para la regresin lineal simple. Si existen varios resultados para una
nica variable, es decir, para una X existe una Y, Z... el coeficiente de determinacin
resulta del cuadrado del coeficiente de determinacin mltiple.

Distribuciones bidimensionales
Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par (xi, yi).
Si representamos cada par de valores como las coordenadas de un punto, el conjunto
de todos ellos se llama nube de puntos o diagrama de dispersin.
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible,
llamada recta de regresin.

Comparacion de Intervalos de Confianza para el Coeficiente de Correlacin


La construccion de intervalos de confianza para la estimacion de la correlacion
en la distribucion normal bivariable, digamos , es un problema importante en
el trabajo estadstico aplicado. Revisamos diferentes procedimientos para su
construccion y realizamos un estudio de simulacion para analizar el
comportamiento de los niveles de confianza reales y compararlos con los
teoricos.
. La estimacion del coeficiente de correlacion por medio de intervalos
es importante, y para ello se disponen de diversos metodos. El problema para el
analista es la carencia de reglas sobre cual formula es preferible. Para esto hemos
realizado un estudio de simulacion que nos permite analizar el comportamiento
de los niveles de confianza reales y compararlos con los teoricos de los diversos
intervalos disponibles.
Asumamos que (x1, y1),(x2, y2), . . . ,(xn, yn) es una muestra aleatoria de una
normal bivariable con vector de medias y matriz de varianzas y covarianzas
.

También podría gustarte