Está en la página 1de 11

ESTADÍSTICA INFERENCIAL I

CARRERA Ingenieria Industrial GRUPO 11 a 12

ELEMENTO DE COMPETENCIA 5: REGRESIÓN LINEAL SIMPLE.

El modelo de pronóstico de regresión lineal permite hallar el valor esperado de una variable
aleatoria a cuando b toma un valor específico. La aplicación de este método implica un supuesto
de linealidad cuando la demanda presenta un comportamiento creciente o decreciente, por tal
razón, se hace indispensable que previo a la selección de este método exista un análisis de
regresión que determine la intensidad de las relaciones entre las variables que componen el
modelo.

¿Cuándo utilizar un pronóstico de regresión lineal?

El pronóstico de regresión lineal simple es un modelo óptimo para patrones de demanda con
tendencia (creciente o decreciente), es decir, patrones que presenten una relación de linealidad
entre la demanda y el tiempo.

Existen medidas de la intensidad de la relación que presentan las variables que son
fundamentales para determinar en qué momento es conveniente utilizar regresión lineal.

 el análisis de la regresión es un proceso estadístico para estimar las relaciones entre


variables. Incluye muchas técnicas para el modelado y análisis de diversas variables, cuando
la atención se centra en la relación entre una variable dependiente y una o más variables
independientes (o predictoras).
 La correlación estadística constituye una técnica estadística que nos indica si dos variables
están relacionadas o no. Por ejemplo, considera que las variables son el ingreso familiar y el
gasto familiar. Se sabe que los aumentos de ingresos y gastos disminuyen juntos.
Si no se tiene linealidad se dice que tenemos un error de
especificación. En el caso de que sean varias variables
independientes, la opción
Analizar-RegresiónLineal-Gráficos-Generar todos los gráficos
parciales nos da los diagramas de dispersión parcial para
Linealidad cada variable independiente.

5.2

de la variable aleatoria “residuos” (especialmente importante


si los datos se han obtenidos siguiendo una secuencia
temporal). Independencia entre los residuos mediante el
estadístico de Durbin-Watson que toma valor 2 cuando los
residuos son completamente independientes (entre 1.5 y 2.5
Independencia se considera que existe independencia), DW2
autocorrelación negativa

o igualdad de varianzas de los residuos y los pronósticos.


Esta condición se estudia utilizando las variables:
ZPRED=pronósticos tipificados y ZRESID=residuos
tipificados mediante: • el estadístico de Levene (ver explorar)
• un gráfico de dispersión .Que se obtiene en
Homocedasticida
Analizar-Regresión-Lineal-Gráficos. El supuesto de
d homocedasticidad implica que la variación de los residuos
sea uniforme en todo el rango de valores de los pronósticos
(gráfico sin pautas de asociación).
5.3

Correlación positiva

Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay
una relación proporcional. Por ejemplo para un vendedor de carros, si él vende más carros
(variable 1), va a ganar más dinero (variable 2).

Correlación negativa

Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que si una
variable aumenta, la otra disminuye. Hay una relación inversa proporcional. Por ejemplo para la
construcción de un edificio, entre más trabajadores estén construyendo un edificio (variable 1),
menos tiempo se necesitará para tenerlo listo (variable 2)

Correlación nula

Si no encuentras un comportamiento entre las variables, existe una correlación nula.


Estos son pues, los tipos de correlación más visibles. Aunque si lo miramos desde una perspectiva
que evalua qué tan fuerte o débil es la correlación, encontramos otra clasificación.

5.4
Recta que mejor se ajusta (Método de mínimos cuadrados)
Una recta que mejor se ajusta es una línea recta que es la mejor aproximación del conjunto de
datos dado.
Es usada para estudiar la naturaleza de la relación entre dos variables.
Una recta que mejor se ajusta puede ser determinada aproximadamente usando el método visual
al dibujar una línea recta en una gráfica de dispersión para que tanto el número de puntos arriba
de la recta y debajo de la recta sean casi iguales (y la línea pasa a tráves de tantos puntos como
sea posible).
Una forma más precisa de encontrar la recta que mejor se ajusta es el método de mínimos
cuadrados .
Use los pasos siguientes para encontrar la ecuación de la recta que mejor se ajusta para un
conjunto de parejas ordenadas .
Paso 1: Calcule la media de los valores de x y la media de los valores de y .
Paso 2: Realice la suma de los cuadrados de los valores de x .
Paso 3: Realice la suma de cada valor de x multiplicado por su valor correspondiente y .
Paso 4: Calcule la pendiente de la recta usando la fórmula:

donde n es el número total de puntos de los datos.


Paso 5: Calcule la intercepción en y de la recta usando la fórmula:

donde son las medias de las coordenadas de x y y de los puntos de datos


respectivamente.
Paso 6: Use la pendiente y la intercepción en y para formar la ecuación de la recta.
Ejemplo:
Use el método de mínimos cuadrados para determinar la ecuación de la recta que mejor se ajusta
para los datos. Luego grafique la recta.

Solución:
Grafique los puntos en un plano coordenado .
Calcule las medias de los valores de x y los valores de y , la suma de los cuadrados de los valores
de x , y la suma de cada valor de x multiplicado por su valor correspondiente y .

Calcule la pendiente.

Calcule la intercepción en y .
Primero, calcule la media de los valores de x y la media de los valores de y .

Use la fórmula para calcular la intercepción en y .

Use la pendiente y la intercepción en y para formar la ecuación de la recta que mejor se ajusta.
La pendiente de la recta es -1.1 y la intercepción en y es 14.0.
Por lo tanto, la ecuación es y = -1.1 x + 14.0.
Dibuje la recta en la gráfica de dispersión.

5.5

En la estimación puntual, como su nombre lo indica, el valor de un parámetro poblacional se


calcula mediante un único valor que se deriva de dicha muestra, por tanto, no permite especificar
las diferentes variaciones de la estimación sobre otras posibles muestras. 5,6 Es por ello que no es
viable derivar una medida que permita determinar con qué grado de certidumbre el valor obtenido
en la muestra refleja o infiere el verdadero valor en la población. Para que un estimador puntual
sea considerado óptimo, buen estimador, debe cumplir cuatro propiedades:

1. Insesgado

2. Consistente

3. Eficiente

4. Suficiente

Por otra parte, mediante los contrastes de hipótesis, se busca verificar una hipótesis nula (H 0)
contra una alternativa (H1), ambas simples y que indican que una región crítica provoca un error de
tipo I con probabilidad 0,05 y un error de tipo II con probabilidad 0,1 mediante la interpretación
frecuentista de la probabilidad. Esto quiere decir, que si se repite dicho contraste más veces,
conducirán a rechazar incorrectamente H0 en el 5 % de los casos y aceptar incorrectamente en el
10 % de los casos a H1. Esto no implica que no se planteen hipótesis en las investigaciones que lo
requieran, sino que su análisis se realiza mediante los valores del intervalo de confianza (IC) y no
del valor de p como habitualmente se hace.7

A pesar de que estas dos variantes se han utilizado por mucho tiempo en la actualidad existe una
tendencia al uso de los IC, pues refieren el grado de confianza o probabilidad de que, al aplicar
repetidamente un procedimiento, el intervalo contenga el parámetro sujeto a análisis. Es decir,
expresa la proporción de intervalos que efectivamente incluyen el parámetro. Este es un
procedimiento que permite, mediante un análisis estadístico descriptivo o inferencial, determinar si
existen diferencias significativas entre muestras o poblaciones.

Formulario
5.6
El coeficiente de determinación es un número comprendido entre 0 y 1 que representa la
fracción de puntos (X,Y) que siguen la línea de ajuste por regresión de un conjunto de datos con
dos variables.

También se le conoce como bondad del ajuste y se le denota por R2. Para calcularlo se toma el
cociente entre la varianza de los datos Ŷi estimados por el modelo de regresión y la varianza de los
datos Yi correspondientes a cada Xi de los datos.

R2 = Sŷ / Sy

Figura 1. Coeficiente de correlación para cuatro pares de datos.

Si el 100% de los datos están sobre la línea de la función de regresión, entonces el coeficiente de
determinación será 1.
Por el contrario, si para un conjunto de datos y cierta función de ajuste el coeficiente R2 resultase
ser igual a 0.5, entonces puede decirse que el ajuste es satisfactorio o bueno en un 50%.

De manera similar, cuando el modelo de regresión arroja valores de R2 inferiores a 0.5, ello indica
que la función de ajuste elegida no se adapta satisfactoriamente a los datos, siendo por lo tanto
necesario buscar otra función de ajuste.

Y cuando la covarianza o el coeficiente de correlación tiende a cero, entonces las variables X e Y


de los datos no guardan relación alguna, y por tanto R2 también tenderá a cero.

5.7

También podría gustarte