Está en la página 1de 7

Regresión Lineal Simple

¿Qué entendemos por regresión lineal?


En aquellos casos en los que el coeficiente de regresión lineal sea “cercano” a +1 o a –1 tiene
sentido considerar la ecuación de la recta que “mejor se ajuste” a la nube de puntos (recta de
mínimos cuadrados). Uno de los principales usos de dicha recta será el de predecir o estimar los
valores de Y que obtendríamos para distintos valores de X. Estos conceptos quedarán representados
en lo que llamamos diagrama de dispersión:

Regresión lineal simple


REGRESIÓN LINEAL
Nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal
cuantificación es el coeficiente de correlación lineal de Pearson r, cuyo valor oscila entre –1 y +1.
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON:

EJEMPLO DE DIAGRAMA DE DISPERSIÓN


Regresión Lineal Simple
Mínimos cuadrados y la bondad de ajuste
El criterio de mínimos cuadrados consiste en hacer mínima la suma de las diferencias al
cuadrado entre los valores observados y los correspondientes valores ajustados.

CASO LINEAL

Los valores de a y b se obtienen minimizando la función de error cuadrático, H, dada por:

Regresión Lineal Simple


¿Qué abarca el análisis de bondad de ajuste?
Obtenidos los valores de los parámetros, y por tanto, la función de ajuste, se va a dar la medida del
grado de aproximación entre los valores observados y los ajustados.

La varianza de Y se puede expresar como:

Tenemos X e Y como dos variables aleatorias medidas sobre los mismos


individuos, sean (xi,yi) los pares de observaciones sobre dichos individuos.

1. Representamos el diagrama de dispersión, o nube de puntos. La nube revela una gran dispersión, y
podemos observar una cierta tendencia lineal al aumentar X e Y (tendencia que no es del todo exacta;
por ejemplo, si suponemos que X es la edad e Y es la talla, obviamente, la talla no sólo depende de la
edad, y también puede haber errores de medida). Por esa nube de puntos podemos hacer pasar infinitas
rectas. La recta de regresión debe tener carácter de línea media.
Ajustándose a la mayoría de los datos, es decir, que ésta pase lo más cerca posible de todos y cada
uno de los puntos.Llamaremos a la mejor de todas Y* = a + bX (Y* para distinguir los valores de la
tabla de los que se habrían producido con la recta si la relación fuese funcional).
2. La recta elegida debe distar poco de todos y cada uno de ellos, lo que significa que hemos de
adoptar un criterio particular: el criterio de los MÍNIMOS CUADRADOS. Este criterio significa
que la suma de los cuadrados de las distancias verticales de los puntos a la recta debe ser lo más
pequeña posible.

Dado que la recta de regresión deberá tener carácter de línea media, esa suma de distancias
deberá anularse. Por las mismas razones que entonces, para evaluar la dispersión, trabajaremos con
esas distancias, pero al cuadrado, de modo que la función que deberemos minimizar será
Regresión Lineal Simple
¿A qué nos referimos cuando hablamos de correlación lineal?
Se llama razón de correlación de Y sobre x a la proporción de la varianza marginal, representada
por la varianza de las medias condicionadas.
RAZÓN DE CORRELACIÓN DE Y CON RESPECTO A X

SIGNIFICADO
Teoría de la Probabilidad
¿En qué consiste la teoría de la probabilidad?
Es la parte de las matemáticas que se encarga del estudio de los ya
mencionados fenómenos o experimentos aleatorios.

ESPACIO MUESTRAL
Conjunto de todos los posibles resultados del experimento. Se le denota generalmente por Ω.
EXPERIMENTO
Todo aquel experimento que, cuando se repite bajo las mismas condiciones iniciales, presenta un
resultado obtenido que no siempre es el mismo. .
EVENTO
Cualquier subconjunto del espacio muestral.

PROBABILIDAD CLASICA

PROBABILIDAD FRECUENTISTA
PROBABILIDAD SUBJETIVA

Análisis Combinatorio
¿Cómo se comporta una muestra en diferentes situaciones?
Las diferentes situaciones siempre están sometidas al principio de multiplicación, válido para
cualquier sucesión finita de procedimientos.

PROBABILIDAD CONDICIONAL

Si A y B son dos sucesos tales que: P[A] = 0,4 P[B / A] = 0,25 P[B'] = 0,75

 a) ¿Son A y B independientes?
 b) Calcula P[A · B] y P[A · B]

a) Solución:P[B'] = 1 - P[B] = 0,75 ; P[B] = 0,25. Como P[B / A] = 0,25 y P[B] = 0,25, tenemos que P[B /
A] = P[B] ; A y B son independientes.
b) Como A y B son independientes: P[A ∩ B] = P[A] · P[B] = 0,4 · 0,25 = 0,1 Así: P[A ∪ B] )= P[A] +
P[B] - P[A ∩ B] = 0,4 + 0,25 - 0,1 = 0,55

PROBABILIDAD TOTAL

TEOREMA DE BAYES
EJEMPLO
Una fábrica de tornillos tiene dos máquinas, la M1, que es más antigua, y hace el 75% de todos los tornillos,
y la M2, más nueva pero pequeña, que hace el 25% de los tornillos. La M1 hace un 4% de tornillos
defectuosos, mientras que la M2 tan sólo hace un 2% de tornillos defectuosos. Si escogemos un tornillo al
azar, ¿qué probabilidad hay de que salga defectuoso? Resolvemos con un diagrama en árbol.

 Si sabemos que un tornillo es defectuoso, ¿qué probabilidad hay de que haya sido fabricado por la máquina M1? Nos
estamos preguntando por la probabilidad condicionada P(M1/D). Por un lado, por la definición de probabilidad
condicionada, tenemos que: P(M1/D)=P(M1∩D)P(D)
 Por otro lado, si representamos nuestro problema en un diagrama en árbol, vemos que podemos calcular P(M1∩D),
ya que es la probabilidad de la rama marcada: ser fabricado por M1 y también ser defectuoso. Si tenemos en cuenta,
además, el teorema de la probabilidad total: P(D) = P(M1) · P(D/M1) + P(M2) · P(D/M2) llegamos finalmente a
que P(M1/D) = P(M1) · P(D/M1)P(M1) · P(D/M1) + P(M2) · P(D/M2). En nuestro ejemplo, P(M1/D) = 0,75 ·
0,04 0,75 · 0,04 + 0,25 · 0,02 = 0,85

También podría gustarte