Está en la página 1de 17

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Ciencias Contables y Financieras


Escuela Profesional de Contabilidad

TEMA: Regresión y Correlación Lineal Múltiple

CURSO: Estadística Inferencial

DOCENTE: José Mauricio Santa Cruz

INTEGRANTES: Cardoza Vilela Alexandra Lucía


Castro Miranda María Nayely
Merino Saavedra Luis David
Montero Pacherres Raysha Milena
Palacios Rodríguez Vanessa Dayanne
Yamunaqué Cordova Katty Liset

GRUPO: 07

CICLO: V

SEMESTRE: 2020 – 1

2020

PIURA- PERÚ
RELACIÓN ENTRE
ÍNDICE
INTRODUCCIÓN

Actualmente muchas empresas o entidades financieras buscan la rentabilidad en los


negocios, ya que es de suma importancia obtener utilidades y asimismo evolucionar a nivel
financiero. Es por ello que un factor imprescindible para lograr dicho propósito es la
evaluación pertinente de cada una de las áreas comprometidas con los procesos productivos
de los bienes y servicios que se ofrecen en el mercado.

En el presente trabajo se analizará la relación existente entre las ventas y utilidades de la


empresa LECHE GLORIA S.A., tales variables serán estudiadas aplicando el método
estadístico de la regresión lineal simple, el cual permitirá predecir el valor de las utilidades
en base a las ventas y así la gerencia pueda visualizar sus índices de producción en un
determinado periodo.

Para poder profundizar el método a emplear, hemos dividido el trabajo en dos capítulos; de
los cuales, el primero contendrá el marco teórico y el siguiente, el caso práctico que
ayudará a formular una conclusión objetiva y precisa de tema.
CAPÍTULO I
PLANTEAMIENTO DEL PROBLEMA Y OBJETIVOS
1.1. Formulación del problema

¿EXISTE RELACIÓN ENTRE

1.2. Objetivos
1.2.1. Objetivo general

 Explicar la relación que existe entre

1.2.2. Objetivos específico

 Apreciar el tipo de relación existente

.
 Medir el grado de confiabilidad de las estimaciones encontrando el error
estándar.
 Describir el grado en el que la utilidad (variable dependiente) está
linealmente relacionada con las ventas (variable independiente)
obtenidas en la empresa mediante el coeficiente de determinación
muestral y el coeficiente de correlación.
CAPÍTULO II
2. MARCO TEÓRICO
2.1. Bases teóricas sustanciales

2.1.1. Modelo de regresión múltiple

La relación funcional puede describirse por el siguiente modelo de regresión

γ 1=β 0 + β 1 Χ i+ β 2 Χ 2 i +…+ β ρ Χ ρi + ui I¿ 1,2 , …. n

Donde:

 I : Representa la I- ésima observación y el primer subíndice identifica la variable en


cuestión
 Los parámetros desconocidos β 0 , β 1 , β 2 , … , β ρ son los coeficientes de regresión
poblacional y son constantes. β i representa la pendiente de la relación lineal entre Y y Xi.
 ui : término de error
La estimación del modelo de regresión lineal múltiple poblacional, es la ecuación de regresión
lineal múltiple muestral, cuya expresión es:

^y =b0 +b1 x 1+b 2 x 2 +…+b p x p

Donde b0, b1, b2, …, bp son los coeficientes de la regresión muestral (estimadores de
β0 , β1 , β2 , … , β ρ .

Una muestra aleatoria de n observaciones: ( χ 1 i , χ 2i , … , χ ρi , γ i ¿ de Y y X1, X2,…, Xp


relacionadas por las n ecuaciones.

γ 1=β 0 + β 1 χ 11 + β2 χ 21+ …+ β ρ χ ρ 1+u 1


γ 2=β 0 + β 1 χ 12 + β 2 χ 22 +…+ β ρ χ ρ 2 +u2

γ n=β 0 + β 1 χ 1n + β 2 χ 2 n+ …+ β ρ χ ρn +u n

Matricialmente este sistema de n ecuaciones puede escribirse como el modelo poblacional:


Donde:
y = X + u

γ1 1x 11 … x p 1
❑❑
Y ¿γ2 1x 12 … x p 2
; x= ;  = ❑❑ ❑❑
⋮ 1 ⋮ …⋮ ¿❑
γ3 x1n x pn

2.1.2. Estimación de la ecuación de regresión poblacional

Viene dado por la ecuación de regresión muestral

Yi = b0+b1 x1i+b2 x2i+…+ bp xpi + ei

y i es el término residual
Donde ei = yi - ^
Vector que estima los parámetros poblacionales 

β0
β
=b= 1

βρ

Los parámetros 1 se estiman mediante los b1 del siguiente sistema (p+1) ecuaciones, obtenidos mediante
el método de los mínimos cuadrados:
n n n n

∑ yi =n b0 +b 1 ∑ x 1 i+ b2 ∑ x2 i +…+ b p ∑ x pi
i=1 i=1 i=1 i=1

n n n n n
2
∑ x 1 i y i =b0 ∑ x 1i +b 1 ∑ x 1i + b2 ∑ x1 i x2 i +…+ b p ∑ x1 i x pi
i=1 i=1 i=1 i=1 i=1

n n n n n
2
∑ x 2 i yi =b0 ∑ x 2i +b 1 ∑ x 1 i x 2 i +b2 i ∑ x 2i +…+ b p ∑ x2 i x pi
i=1 i=1 i=1 i=1 i=1

n n n n n

∑ x pi yi =b0 ∑ x pi+b 1 ∑ x 1 i x pi +b2 ∑ x 2i x pi+…+ b p ∑ x 2pi


i=1 i=1 i=1 i=1 i=1

Que matricialmente se pueden inscribir de la siguiente forma:

Donde: (X´X)b = X´y

∑ x1
i=1
n
X´y = ∑ x1 i y i
i=1
n

∑ x2 i x2 i
i=1
Y los coeficientes de regresión muestral b1 se obtienen mediante el vector

b = (X´X)-1 X´y

En la práctica se emplean programas computacionales para obtener los valores de los


coeficientes estimados.
En el modelo de la regresión múltiple, además se deben cumplir dos condiciones más para
obtener los estimadores por mínimos cuadrados, a saber:
- Ninguna de las variables independientes es combinación lineal exacta de las otras variables
independientes (no es posible expresar una de las columnas de X como una combinación
lineal de las restantes columnas de X. Si fuera así esta condición es llamada
multicolinealidad.
- El número de observaciones (n) deben exceder por lo menos en dos al número (p) de
variables Independientes, es decir se debe cumplir que n  p+2.
2.1.3. Varianza de los bj y covarianzas entre todos los posibles pares

Se resumen en una matriz llamada matriz de varianza – covarianza, expresado como:

- Los elementos sobre la diagonal representan la varianza de los b1


- Los demás elementos son las covarianzas
Una estimación insesgada de la varianza σ 2 es la varianza muestral: S2 = σ 2

2 SCE
S2 = σ =
n− p−1
n n
2 2
Donde: SCE= ∑ ei =∑ ( γ ¿ ¿ 1− γ^ 1 ) ¿ , que se obtiene utilizando la siguiente tabla:
i=1 i=1

Y γ^ ¿¿
250 … …
190 … …

⋮ ⋮
222
 …
2.1.4. Inferencia estadística acerca del modelo de regresión

Para realizar inferencias acerca del modelo de regresión lineal múltiple, se requiere que los
elementos del vector error μ están distribuidos normalmente.
Puesto que los términos error μi ⅈ=1,2 ,… , n tienen media 0 y varianza común σ 2μ y son
mutuamente independientes, los μison independientes e idénticamente distribuidos como
variables aleatorias normales.

- Intervalo de confianza para μ y ∕ x ; x 1 2 ;… ; xp


−1 −1
√ '
0
'

^y 0−t . S X ( X X ) ( X 0 ) <µ Y /(45,40,1) < ^y 0 +t . S X '0 ( X ' X ) ( X 0 )

Error estándar
de predicción

- Intervalo de confianza de predicción para y0


−1 −1
√ √
^y 0−t . S 1+ X '0 ( X ' X ) ( χ 0 ) < y 0< ^y 0+ t . S 1+ X '0 ( X ' X ) ( X 0 )

2.1.5. Inferencia de los coeficientes de regresión poblacional

Se debe determinar si los coeficientes de esa ecuación b i implican que los correspondientes
coeficientes de regresión poblacional β i son o no son distintos de cero.
El análisis de regresión debería empezar con una prueba de significación global de los coeficientes
de regresión poblacional mediante un análisis de varianza.

- Análisis de varianza
La hipótesis nula y alternativa de la prueba son:
H 0 : β1 =β2 =…= βk =0
Hipótesis nula
Hipótesis
H 1 : almenos uno de los β i es distinto de cero alternativa

- ANVA para aprobar H 0=β 1=β 2=…=β k =0


Fuente de Suma de Grado de
F calculada
Variacion Cuadrados Libertad Caudrados Medios
Regresion SCR p CMR= SCR/p ஼ொ
Error SCE n-p-1 CME= SCE/(n-p-1) F=
ொ
Total SCT n-1

n n n
2 2 2
Donde: ∑ ( y i− ý ) =∑ ( y i−^y i ) + ∑ ( ^y i− ý )
i i i

SCT = SCE + SCR

Dado α (nivel de significancia) , encontramos en la tabla F el valor de F (1−α , p ,n −p −1 ) y lo comparamos

CMR
F= , si se cumple:
CME
CMR
F= > F (1−α , p , n− p−1) rechazamos H 0
CME

Para seleccionar el modelo de regresión adecuado, se pueden utilizar los siguientes métodos:

- Un intervalo de ( 1−α ) 100% para β 1

^ ( bⅈ ) ¿ β ⅈ <¿ b ⅈ+t (1−α /2 ;n− p−1) √ V


b ⅈ−t ( 1−α / 2;n −p −1 ) √ V ^ ( bⅈ )

Si el intervalo contiene al cero se infiere que β i=0

- Prueba de hipótesis
H 0 :Bi =0
H 1 : Bi ≠ 0

b i−0
Si se cumple t= ¿ t 1−α ∕ 2 ( n− p−1) ( en la tabla) rechazamos H 0
√ v^ ( b ) i
2.1.6. Coeficiente de determinación múltiple R2

SCR SCE
R 2= =1−
SCT SCT

Nos indica que porción o porcentaje de la variación total de la respuesta y se explica mediante el
modelo ajustado.

2.1.7. Matriz de correlación

La matriz de correlación de p variables X1, X2, ..., Xp es:

Donde rij son coeficientes de correlación simple

Para probar la significancia de los coeficientes de correlación r ij

2.1.8. Coeficiente de correlación parcial

La correlación parcial se define como la correlación entre dos 2.1.9. Multi


variables si las demás variables no varían, es decir, el valor de las coline
demás variables es constante o fijo.[ CITATION Ign18 \l 10250 ] alida

- El coeficiente de correlación de primer orden de


y con X1 cuando X2 permanece constante, se
denota por ry1.2 y se define por:

d
- El

coeficiente de correlación de primer orden de y con X 2


cuando X1 permanece constante, se se define por:

Correlación Parcial de orden k-ésimo

Donde k= Número de variables constantes

2.1.10. MULTICOLINEALIDAD
CAPÍTULO III

3.1. METODOLOGÍA

3.1.1. Instrumento de investigación

3.2.Hipótesis

Existe relación entre las ventas realizadas y las utilidades obtenidas,

3.2.1. Variables

3.2.1.1. Variable independiente (x): Ventas realizadas expresadas en billones de soles


3.2.1.2. Variable dependiente (y): Utilidades obtenidas expresadas en billones de soles
CAPÍTULO IV

CASO PRÁCTICO
Planteamiento del ejercicio de aplicación
CONCLUSIONES
BIBLIOGRAFÍA