Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Expresndolo en forma simple, la regresin lineal es una tcnica que permite cuantificar
la relacin que puede ser observada cuando se grafica un diagrama de puntos
dispersos correspondientes a dos variables, cuya tendencia general es rectilnea (Figura
la); relacin que cabe compendiar mediante una ecuacin del mejor ajuste de la forma:
y = a + bx
(1)
En esta ecuacin, y representa los valores de la coordenada a lo largo del eje vertical
en el grfico (ordenada); en tanto que x indica la magnitud de la coordenada sobre el
eje horizontal (absisa). El valor de a (que puede ser negativo, positivo o igual a cero)
es llamado el intercepto; en tanto que el valor de b (el cual puede ser negativo o
positivo) se denomina la pendiente o coeficiente de regresin.
Correlacin
La correlacin entre dos variables es - otra vez puesto en los trminos ms simples - el
grado de asociacin entre las mismas. Este es expresado por un nico valor llamado
coeficiente de correlacin (r), el cual puede tener valores que ocilan entre -1 y +1.
Cuando r es negativo, ello significa que una variable (ya sea x o y) tiende a
decrecer cuando la otra aumenta (se trata entonces de una correlacin negativa,
correspondiente a un valor negativo de b en el anlisis de regresin). Cuando r es
positivo, en cambio, esto significa que una variable se incrementa al hacerse mayor la
otra (lo cual corresponde a un valor positivo de b en el anlisis de regresin).
Los valores de r pueden calcularse fcilmente en base a una serie de pares de datos
de x e y, utilizando la misma table y montos que se indican en el Paso 2 de la
seccin regresin de este captulo. De este modo r puede ser obtenido -
indirectamente - a partir de la relacin:
DIAGRAMAS DE DISPERSIN
La forma ms sencilla que tienen para predeterminar si existe o no correlacin entre
dos variables es construir un diagrama de dispersin.
Para construir un diagrama de dispersin tienes que utilizar un sistema de coordenadas
rectangulares, el cual aprendiste en los fascculos de Matemticas I, II y IV, lo
recuerdas?, bien. El sistema de coordenadas rectangulares, en el eje X (abscisas), es
donde se marca una escala adecuada para registrar los valores de una de las variables
y sobre el eje Y (ordenadas), se marca otra escala adecuada para representar o
registrar los valores de la otra variable. Los dos valores de las variables forman pares
ordenados (X, Y) dispersos en dicho sistema de coordenadas rectangulares. Esta
dispersin de los pares ordenados deben de sugerir una lnea recta, (de aqu el nombre
de correlacin lineal) como lo muestra el diagrama de dispersin del ejemplo anterior.
Distribuciones bidimensionales
Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par (xi, yi).
Si representamos cada par de valores como las coordenadas de un punto, el conjunto
de todos ellos se llama nube de puntos o diagrama de dispersin.
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible,
llamada recta de regresin.