Está en la página 1de 14

Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública

Carrera Contaduría Pública Materia: Estadística I

UNIDAD CINCO

ANALISIS DE REGRESION Y CORRELACION


1.- ANALISIS DE REGRESION

El Análisis de Regresión se ocupa de establecer la forma de la relación entre las variables, es decir, se
estudia la relación funcional entre las variables 𝑌 = 𝑓(𝑥) 𝑜 𝑋 = 𝑓(𝑦) , de modo que podamos
predecir el valor de una con base en la otra.

Normalmente la variable base se llama variable independiente y la variable que se va a predecir se llama
variable dependiente.

En términos de estadística los conceptos de Regresión y Ajustes son sinónimos, lo cual implica estimar
valores en función de las variables.

1.1.- DIAGRAMA DE DISPERSION (NUBE DE PUNTOS)

Es la representación gráfica de puntos en un sistema de ejes de coordenadas, donde se puede visualizar


la tendencia que sigue estos puntos que pueden ser: Lineal, Parabólico, Exponencial y Potencial y lo
cual nos permite encontrar la curva de mejor ajuste.

Diagramas de Dispersión o Nube de Puntos de Regresiones:

LINEAL PARABOLICA

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

1.2.- REGRESION DE FUNCION LINEAL

Es una función lineal cuya forma general está dada por:

𝑌̂ = 𝑓(𝑥) = 𝑎 + 𝑏𝑥

El objetivo principal es determinar los valores de los parámetros a, b de la función lineal para los cual
se utiliza el método de los Mínimos Cuadrados ya que minimiza la distancia entre uno y otro dato y trata
que la recta pase por casi todos los puntos y para los puntos que no toma en cuenta, trata que la distancia
sea mínima.

METODO LIBRE

Para hallar la ecuación de Regresión Lineal por este método se sigue los siguientes pasos:

1) Se representa gráficamente los pares de puntos.


2) Se toma los puntos de la representación gráfica (preferentemente los más altos y los más bajos).
3) Se aplica la ecuación de la recta que pasa por dos puntos

𝑦2 − 𝑦1
(𝑦 − 𝑦1 ) = (𝑥 − 𝑥1 )
𝑥2 − 𝑥1

METODO SEMIPROMEDIO

Este método consiste en dividir a la distribución en dos partes luego sacar la media aritmética de cada
parte y aplicar la ecuación que pasa por dos puntos.

METODO DE LOS MINIMOS CUADRADOS

Es el mejor método para ajustar una función lineal ya que minimiza la distancia entre uno y otro dato y
trata que la recta pase por casi todos los puntos y los puntos que no toma en cuenta, trata que la distancia
sea mínima.

Para ajustar una función lineal por el método de los mínimos cuadrados se sigue los siguientes pasos.

 Determinar o calcular : XY , X2
 Determinar la sumatoria de: XY , X , Y , X2
 Encontrar a y b mediante la siguientes formulas
𝑛∑𝑋𝑌−(∑𝑋)(∑𝑌) ∑𝑌−𝑏∑𝑋
b= ; a=
𝑛∑𝑋 2 − (∑𝑋)2 𝑛

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

1.3.- REGRESION DE FUNCION PARABOLICA

Es una función cuadrática de segundo grado, cuya forma general está dada por:

𝑌̂ = 𝑓(𝑥) = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐

El objetivo principal es determinar los valores de los parámetros a, b, c, para lo cual se utilizan las
siguientes ecuaciones de transformaciones.

∑𝑦 = 𝑎∑𝑥 2 + 𝑏∑𝑥 + 𝑐𝑛
{ ∑𝑌𝑋 = 𝑎∑𝑥 3 + 𝑏∑𝑥 2 + 𝑐∑𝑥
∑𝑦𝑥 2 = 𝑎∑𝑥 4 + 𝑏∑𝑥 3 + 𝑐∑𝑥 2

Resolviendo el sistema de tres ecuaciones con tres incógnitas, encontramos a, b, c

1.4.- REGRESION DE FUNCION EXPONENCIAL

Es una función exponencial cuya forma general esta dado por:

𝑌̂ = 𝑓(𝑥) = 𝑎𝑏 𝑥

El objetivo principal es determinar los valores de los parámetros a, b, para lo cual se utilizan las
siguientes ecuaciones de transformaciones.

𝑍 = 𝑙𝑜𝑔𝑌 𝑎 = 10 𝐴 𝑏 = 10𝐵
𝑛∑𝑋𝑍−(∑𝑋)(∑𝑍) ∑𝑍−𝐵∑𝑋
B= ; A=
𝑛∑𝑋 2 − (∑𝑋)2 𝑛

Encontrando los valores de a, b, reemplazamos en la ecuación exponencial

1.5.- REGRESION DE FUNCION POTENCIAL

Es una función exponencial cuya forma general está dado por:

𝑌̂ = 𝑓(𝑥) = 𝑎𝑥 𝑏

El objetivo principal es determinar los valores de los parámetros a, b, para lo cual se utilizan las
siguientes ecuaciones de transformaciones.

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

𝑍 = 𝑙𝑜𝑔𝑦 ; 𝑊 = 𝑙𝑜𝑔𝑥 ; 𝑎 = 10 𝐴
𝑛∑𝑊𝑍−(∑𝑊)(∑𝑍) ∑𝑍−𝑏∑𝑊
b= ; A=
𝑛∑𝑊 2 − (∑𝑊)2 𝑛

Encontrando los valores de a, b, reemplazamos en la ecuación potencial

2.- ANALISIS DE CORRELACION

El Análisis de Correlación se ocupa de determinar el grado de la relación entre las variables, es decir
que se dirige sobre todo a medir la fuerza de una relación entre las variables, donde la fortaleza de la
relación se determina mediante la magnitud del efecto que cualquier cambio de una variable ejerce
sobre la otra.

2.1.- VARIANZA GENERAL


Se define la Varianza General como la suma entre la Varianza Explicada y la Varianza No Explicada.

Es decir que: 𝑉𝐺 = 𝑉𝐸 + 𝑉𝑁𝐸


O También: ∑( 𝑦𝑖 − 𝑦̅ )2 = ∑( 𝑦̂ − 𝑦̅ )2 + ∑( 𝑦𝑖 − 𝑦̂ )2

2.2.- COEFICIENTE DE CORRELACION


Es una medida cuantitativa que nos proporciona el grado de correlación entre las variables y está
definida por:

𝑉 ( 𝑌̂ − 𝑌̅ )2
r = √𝑉𝐸 = √( 𝑌 ̅ )2
𝐺 𝑖−𝑌

𝑛∑𝑋𝑌−(∑𝑋)(∑𝑌)
Otra forma: r = √[𝑛∑𝑋2 −(∑𝑋)2][𝑛∑𝑌2 −(∑𝑌)2]

2.3.- INTERPRETACION DEL COEFICIENTE DE CORRELACION

Si 𝑟 = 1 Entonces la correlación es perfecta

Si 0.90 ≤ 𝑟 < 1 Entonces la correlación es excelente

Si 0.80 ≤ 𝑟 < 0.90 Entonces la correlación es buena

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

2.4.- COEFICIENTE DE DETERMINACION


También se determina o se conoce como el grado de dependencia estadística de dos variables y está
definida por el coeficiente de correlación

𝑟 2 = ( 𝑟 )2

Donde: 𝑟 2 = 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑐𝑖𝑜𝑛


𝑟 = 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛

2.5.- INTERPRETACION DEL COEFICIENTE DE CORRELACION

Si 𝑟2 = 1 Entonces el ajuste es perfecta

Si 0.80 ≤ 𝑟 2 < 1 Entonces el ajuste es excelente

Si 0.50 ≤ 𝑟 2 < 0.80 Entonces el ajuste es bueno

2.6.- ERROR TIPICO DE LA ESTIMA


Se define como la sumatoria de los desvíos cuadráticos de los valores observados, calculados y es de
gran utilidad para determinar el margen de seguridad y está dado por:

∑( 𝑌𝑖 − 𝑌̂ )2
𝜎= √
𝑛

2.7.- MARGEN DE SEGURIDAD

Son dos rectas paralelas que se obtienen sumando y restando al valor mínimo y al valor máximo de 𝑌̂
estimada y el valor del error típico de la estima
Para hallar el margen de seguridad se sigue los siguientes pasos:
1) Calcular el error típico de la estima
2) Sumar y restar el error típico de la estima al valor menor y mayo de la Y estimada
3) Determinar los cuatro puntos
4) Representar los cuatro puntos en el gráfico del diagrama de dispersión para trazar las dos rectas
paralelas y determinar el número de observaciones que están dentro y fuera del margen de
seguridad y se esa manera obtener el margen de confianza y el margen de error, que está dado
por:

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

𝑁º 𝐷𝐸 𝑂𝐵𝑆𝐸𝑅𝑉𝐴𝐶𝐼𝑂𝑁𝐸𝑆 𝐷𝐸𝑁𝑇𝑅𝑂 𝐷𝐸𝐿 𝑀𝐴𝑅𝐺𝐸𝑁 𝐷𝐸 𝑆𝐸𝐺𝑈𝑅𝐼𝐷𝐴𝐷


𝑀𝑐 = 100
𝑛
𝑁º 𝐷𝐸 𝑂𝐵𝑆𝐸𝑅𝑉𝐴𝐶𝐼𝑂𝑁𝐸𝑆 𝐹𝑈𝐸𝑅𝐴 𝐷𝐸𝐿 𝑀𝐴𝑅𝐺𝐸𝑁 𝐷𝐸 𝑆𝐸𝐺𝑈𝑅𝐼𝐷𝐴𝐷
𝑀𝐸 = 100
𝑛

EJEMPLO 1).- Dada la relación de costo y cantidad para un producto:

CANTIDAD (X) 1 2 3 4 5
COSTO (Y) 2 4 7 8 10
Se pide:
a) Determine la ecuación de regresión lineal del costo en función de la cantidad: Por el método
libre, por el método semi-promedio y por el método de los mínimos cuadrados.
b) El coeficiente de determinación y su interpretación
c) Estimar el costo para una cantidad de 10 unidades
SOLUCION: ECUACION DE REGRESION LINEAL POR EL:
METODO LIBRE:
 Grafica de los puntos (diagrama de dispersión):
 𝑃1 (𝑥1 , 𝑦1 ) = (1 , 2) ; 𝑃2 (𝑥1 , 𝑦1 ) = (5 , 10)
 Ecuación de recta que pasa por dos puntos:
𝑦2 − 𝑦1
(𝑦 − 𝑦1 ) = (𝑥 − 𝑥1 )
𝑥2 − 𝑥1
10 − 2 8
(𝑦 − 2) = (𝑥 − 1) → (𝑦 − 2) = (𝑥 − 1)
5−1 4
(𝑦 − 2) = 2(𝑥 − 1) → ̂ = 𝟐𝒙
𝒚
METODO SEMI-PROMEDIO:
 Calculamos los semi-promedio:

1+2+3 6
𝑥1 =
̅̅̅̅ = =2 13
3 3 → 𝑃1 (̅̅̅ 𝑦1 ) = (2 , )
𝑥1 , ̅̅̅
2 + 4 + 7 13 3
{ 𝑦
̅̅̅̅ = =
1 3 3

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

3+4+ 5 12
𝑥2 =
̅̅̅̅ = =4 25
3 3 → 𝑃1 (̅̅̅ 𝑦2 ) = (4 , )
𝑥2 , ̅̅̅
7 + 8 + 10 25 3
{ 𝑦2 = =
̅̅̅̅
3 3
25 13 25 − 13 12
13 − 3 13 13
(𝑦 − ) = 3 (𝑥 − 2) → (𝑦 − ) = 3 (𝑥 − 2) → (𝑦 − ) = 3 (𝑥 − 2)
3 4−2 3 2 3 2
13 13 𝟏
(𝑦 − ) = 2(𝑥 − 2) → 𝑦 = 2𝑥 − 4 + → ̂ = 𝟐𝒙 +
𝒚
3 3 𝟑
METODO DE LOS MINIMOS CUADRADOS:

X Y XY X2 Y2
1 2 2 1 4
2 4 8 4 16
3 7 21 9 49
4 8 32 16 64
5 10 50 25 100
15 31 113 55 233

1. Determinar o calcular : XY , X2 en la columna 3 y 4


2. Determinar la sumatoria de: X , Y , XY , X2
3. Encontrar a y b reemplazando las sumatoria en las siguientes formulas
𝑛∑𝑋𝑌−(∑𝑋)(∑𝑌) 5(113) − (15)(31)
b= = = 𝟐
𝑛∑𝑋 2 − (∑𝑋)2 5(55) − (15)2

∑𝑌−𝑏∑𝑋 31 − 2(15)
𝑎 = = = 𝟎. 𝟐
𝑛 5

4. Reemplazar a y b en la función de regresión lineal

̂ = 𝑓 (𝑥 ) = 𝑎 + 𝑏𝑋 ⇒ 𝒀
𝒀 ̂ = 𝟎. 𝟐 + 𝟐𝑿

EL COEFICIENTE DE DETERMINACIÓN Y SU INTERPRETACIÓN


Para hallar el coeficiente de correlación y determinación se sigue los siguientes pasos:
1. Determinar o calcular : XY , X2 , Y2 en la columna 3 , 4 y 5
2. Determinar la sumatoria de: X , Y , XY , X2 , Y2
3. Reemplazar las sumatoria en la fórmula:
𝑛∑𝑋𝑌−(∑𝑋)(∑𝑌) 5(113)−(15)(31)
𝑟 = = = 0.99
√[𝑛∑𝑋 2 −(∑𝑋)2 ][𝑛∑𝑌 2 −(∑𝑌)2 ] √(5(55)−(15)2 )(5(233)−(31)2 )

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

Coeficiente de Correlación 𝒓 = 𝟎. 𝟗𝟗

Coeficiente de Determinación 𝒓𝟐 = ( 𝑟 )2 = (0.99)2 = 𝟎. 𝟗𝟖

INTERPRETACION: Como 0.80 ≤ 𝑟 2 < 1 Entonces el ajuste es excelente

ESTIMAR EL COSTO PARA UNA CANTIDAD DE 10 UNIDADES

𝐶𝑜𝑚𝑜 𝑥 = 10 ⇒ 𝒀̂ = 𝟎. 𝟐 + 𝟐(𝟏𝟎) = 𝟐𝟎. 𝟐

Es decir que para el costo de 10 unidades para un producto es de 20.2 unidades monetarias.

EJEMPLO 2).- Un fabricante de radios registra sus utilidades (Y) en $us en relación al precio (X) en
$us en la siguiente tabla.
Precio (X) $us 1 2 3 4 5
Utilidades (Y) $us 9 15 19 16 8

Se pide: Ajustar los datos a una función parabólica de segundo grado


SOLUCION.- Utilizando las ecuaciones de transformaciones tenemos:

X Y XY X2 YX2 X3 X4
1 9 9 1 9 1 1
2 15 30 4 60 8 16
3 19 57 9 171 27 81
4 16 64 16 256 64 256
5 8 40 25 200 125 625
15 67 200 55 696 225 979

∑𝑦 = 𝑎∑𝑥 2 + 𝑏∑𝑥 + 𝑐𝑛 67 = 55𝑎 + 15𝑏 + 5𝑐 (÷ 5)


{ ∑𝑌𝑋 = 𝑎∑𝑥 3 + 𝑏∑𝑥 2 + 𝑐∑𝑥 → { 200 = 225𝑎 + 55𝑏 + 15𝑐 (÷ 15)
∑𝑦𝑥 2 = 𝑎∑𝑥 4 + 𝑏∑𝑥 3 + 𝑐∑𝑥 2 696 = 979𝑎 + 225𝑏 + 55𝑐 (÷ 55)

13.40 = 11.00𝑎 + 3.00𝑏 + 𝑐 13.40 = 11.00𝑎 + 3.00𝑏 + 𝑐 13.33 = 15.0𝑎 + 3.67𝑏 + 𝑐


{ 13.33 = 15.00𝑎 + 3.67𝑏 + 𝑐 → −13.33 = −15.00𝑎 − 3.67𝑏 − 𝑐 → −12.65 = −17.80𝑎 − 4.09𝑏 − 𝑐
12.65 = 17.80𝑎 + 4.09𝑏 + 𝑐 0.07 = − 4𝑎 − 0.67𝑏 0.68 = − 2.8𝑎 − 0.42𝑏

0.07 = − 4𝑎 − 0.67𝑏 (2.8) 0.196 = −11.2𝑎 − 1.876𝑏


{ →{ → −0.196𝑏 = −2.524
(
0.68 = − 2.8𝑎 − 0.42𝑏 −4 ) −2.72 = 11.2𝑎 + 1.68𝑏

→ 𝒃 = 𝟏𝟐. 𝟖𝟖 → 0.07 = −4𝑎 − 0.67(12.88) →


𝒂 = −𝟐. 𝟏𝟕 → 𝑐 = 13.4 − 11(−2.17) − 3(12.88) → 𝒄 = −𝟏. 𝟑𝟕

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

Reemplazando los valores de a, b, c en la ecuación parabólica de segundo grado tenemos:

𝑌̂ = 𝑓(𝑥) = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 → ̂ = 𝒇(𝒙) = −𝟐. 𝟏𝟕𝒙𝟐 + 𝟏𝟐. 𝟖𝟖𝒙 − 𝟏. 𝟑𝟕


𝒀

EJEMPLO 3.- El número de bacterias por unidad de volumen presentes (Y), en un cultivo después de
(X) horas, viene dada en la tabla

X 0 1 2 3 4 5 6
Y 32 47 65 92 132 190 275
Se pide:
a) Diagrama de dispersión
b) Ajustar los datos a una función exponencial
c) Estimar el número de bacterias después de 7 horas de cultivo

SOLUCION.- DIAGRAMA DE DISPERSIÓN

AJUSTAR LOS DATOS A UNA FUNCIÓN


EXPONENCIAL 𝑌̂ = 𝑓(𝑥) = 𝑎𝑏 𝑥

𝑌̂ = 𝑎𝑏 𝑥 → 𝑙𝑜𝑔 (𝑌) = 𝑙𝑜𝑔(𝑎𝑏 𝑥 ) →

𝑙𝑜𝑔𝑌 = 𝑙𝑜𝑔𝑎 − 𝑥𝑙𝑜𝑔𝑏 → 𝑍 = 𝐴 + 𝐵𝑋

→ 𝑍 = 𝑙𝑜𝑔𝑌 ; 𝐴 = 𝑙𝑜𝑔𝑎 ; 𝐵 = 𝑙𝑜𝑔𝑏


𝑛∑𝑋𝑍−(∑𝑋)(∑𝑍) ∑𝑍−𝐵∑𝑋
B= A=
𝑛∑𝑋 2 − (∑𝑋)2 𝑛

𝑎 = 10 𝐴 𝑏 = 10𝐵
X Y Z=logY XZ X2
7(45.7015) − (21)(13.7926)
𝐵= = 𝟎. 𝟏𝟓 0 32 1.5051 0 0
7(91) − (21)2 1 47 1.6721 1.6721 1
2 65 1.8129 3.6258 4
13.7926 − (0.15)(21)
𝐴= = 𝟏. 𝟓𝟐 3 92 1.9638 5.8914 9
7 4 132 2.1206 8.4824 16
5 190 2.2788 11.3940 25
𝑏 = 10𝐵 = 100.15 = 𝟏. 𝟒𝟏 6 275 2.4393 14.6358 36
21 13.7926 45.7015 91
𝑎 = 10 𝐴 = 101.52 = 𝟑𝟑. 𝟏𝟏

𝑌̂ = 𝑓(𝑥) = 𝑎𝑏 𝑥 → ̂ = (𝟑𝟑. 𝟏𝟏)(𝟏. 𝟒𝟏)𝒙


𝒀

ESTIMAR EL NÚMERO DE BACTERIAS DESPUÉS DE 7 HORAS DE CULTIVO

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

𝐶𝑜𝑚𝑜 𝑥 = 7 ⇒ 𝒀̂ = (33.11)(1.41)7 = 𝟑𝟔𝟔. 𝟖𝟓

EJEMPLO 4.- Un Empresario registra sus inversiones (Y) en miles de $us en relación a la tasa de
interés (X) en forma porcentual en la siguiente tabla

Interés (%) 1 2 3 4 5
Inversiones ($us) 30 7 3 2 1
Se pide:
a) Ajustar los datos a una función potencial
b) Estimar las inversiones si la tasa de interés es del 10 %

SOLUCION.- AJUSTAR LOS DATOS A UNA FUNCIÓN POTENCIAL

X Y Z=log Y W=log X WZ W2
1 30 1.4771 0.0000 0.0000 0.0000
2 7 0.8451 0.3010 0.2544 0.0906
3 3 0.4771 0.4771 0.2276 0.2276
4 2 0.3010 0.6021 0.1812 0.3625
5 1 0.0000 0.6990 0.0000 0.4886
3.1003 2.0792 0.6632 1.1693

𝑌̂ = 𝑓(𝑥) = 𝑎𝑥 𝑏 → 𝑙𝑜𝑔 (𝑌) = 𝑙𝑜𝑔(𝑎𝑥 𝑏 ) → 𝑙𝑜𝑔𝑌 = 𝑙𝑜𝑔𝑎 + 𝑏𝑙𝑜𝑔𝑋 → 𝑍 = 𝐴 + 𝑏𝑊

𝑍 = 𝑙𝑜𝑔𝑌 ; 𝑊 = 𝑙𝑜𝑔𝑋 ; 𝐴 = 𝑙𝑜𝑔𝑎 → 𝑎 = 10 𝐴


𝑛∑𝑊𝑍 − (∑𝑊)(∑𝑍) 5(0.6632) − (2.0792)(3.1003)
𝒃= = = −𝟐. 𝟎𝟓
𝑛∑𝑊 2 − (∑𝑊)2 5(1.1693) − (2.0792)2

∑𝑍−𝑏∑𝑊 3.1003−(−2.05)(2.0792)
A= = = 1.47 → 𝒂 = 10 𝐴 = 101.47 = 𝟐𝟗. 𝟓𝟏
𝑛 5

𝑌̂ = 𝑓(𝑥) = 𝑎𝑥 𝑏 → 𝒀̂ = 𝟐𝟗. 𝟓𝟏𝒙−𝟐.𝟎𝟓

ESTIMAR LAS INVERSIONES SI LA TASA DE INTERÉS ES DEL 10 %

𝐶𝑜𝑚𝑜 𝑥 = 10 ⇒ 𝒀̂ = (29.51)(10)−2.05 = 𝟎. 𝟐𝟔

EJEMPLO 5.- Se tiene los siguientes datos de los costos y cantidad de un producto
Cantidad (x) 1 2 3 4 5
Costo (y) 8 14 26 35 40
Se pide:

a) Determinar diagrama de dispersión

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

b) Determinar la función de regresión lineal


c) Calcular el coeficiente de correlación y de determinación
d) Calcular el error típico de la estima.
e) Determine el margen de confianza y el margen de error.
f) Hallar el costo si la cantidad de un producto es de 10 unidades

SOLUCION:
DIAGRAMA DE DISPERSION
FUNCION DE REGRESION LINEAL
Para hallar la función de regresión lineal
se sigue los siguientes pasos:

 Realizar una tabla de 7 filas y 4 columnas y


colocar los datos del ejercicio en las dos
primeras columnas

X Y X2 XY Y2 𝑌̂ ( 𝑌𝑖 − 𝑌̂ )2 𝑌̂ − 𝜎 𝑌̂ + 𝜎

1 8 1 8 64 7.60 0.16 6.01 9.19


2 14 4 28 196 16.10 4.41 14.51 17.69
3 26 9 78 676 24.60 1.96 23.01 26.19
4 35 16 140 1225 33.10 3.61 31.51 34.69
5 40 25 200 1600 41.60 2.56 40.01 43.19
15 123 55 454 3761 12.70

 Determinar o calcular : X2 , XY en la columna 3 y 4


 Determinar la sumatoria de: X , Y , X2 , XY en la columna 1, 2, 3 y4
 Encontrar a y b reemplazando las sumatoria en las siguientes formulas
𝑛∑𝑋𝑌−(∑𝑋)(∑𝑌) 5(454)−(15)(123) 2270−1845 425
b= = = = = 8.50
𝑛∑𝑋 2 − (∑𝑋)2 5(55)−(15)2 275−225 50

∑𝑌−𝑏∑𝑋 123−8.5(15) 123−127.5


𝑎 = = = = −0.9
𝑛 5 5

 Reemplazar a y b en la función de regresión lineal

̂ = 𝑓 (𝑥 ) = 𝑎 + 𝑏𝑋 ⇒ 𝒀
𝒀 ̂ = −𝟎. 𝟗 + 𝟖. 𝟓𝟎𝑿

COEFICIENTE DE CORRELACION Y DETERMINACION


Para hallar él coeficiente de correlación y determinación se sigue los siguientes pasos:

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

4. Determinar o calcular : X2 , XY , Y2 en la columna 3 , 4 y 5


5. Determinar la sumatoria de: X , Y , X2 , XY , Y2 en la columna 1 , 2, 3 , 4 y 5
6. Reemplazar las sumatoria en la fórmula:
𝑛∑𝑋𝑌−(∑𝑋)(∑𝑌) 5(454)−(15)(123) 425
𝑟 = = = = 0.99
√[𝑛∑𝑋 2 −(∑𝑋)2 ][𝑛∑𝑌 2 −(∑𝑌)2 ] √(5(55)−(15)2 )(5(3761)−(123)2 ) √183800

Coeficiente de Correlación 𝒓 = 𝟎. 𝟗𝟗

Coeficiente de Determinación 𝒓𝟐 = ( 𝑟 )2 = (0.99)2 = 𝟎. 𝟗𝟖


ERROR TIPICO DE LA ESTIMA
Para hallar él error típico de la estima se sigue los siguientes pasos:

1. Hallar los valores de 𝑌̂ en la columna 6 con la formula:


𝑌̂ = 𝑓 (𝑥 ) = −0.9 + 8.50𝑋
𝑆𝑖 𝑋 = 1 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠: 𝑌̂ = 𝑓 (1) = −0.9 + 8.50(1) = 7.60
𝑆𝑖 𝑋 = 2 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠: 𝑌̂ = 𝑓 (2) = −0.9 + 8.50(2) = 16.10
𝑆𝑖 𝑋 = 3 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠: 𝑌̂ = 𝑓 (3) = −0.9 + 8.50(3) = 24.60
𝑆𝑖 𝑋 = 4 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠: 𝑌̂ = 𝑓 (4) = −0.9 + 8.50(4) = 33.10
𝑆𝑖 𝑋 = 5 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠: 𝑌̂ = 𝑓 (5) = −0.9 + 8.50(5) = 41.60
2. Hallar los valores en la columna 7 con la fórmula: ( 𝑌𝑖 − 𝑌̂ )2
3. Calcular la sumatoria de: ( 𝑌𝑖 − 𝑌̂ )2
4. Reemplazar valores en la fórmula:
∑( 𝑌𝑖 − 𝑌 )2 12.70
𝜎= √ =√ = 1.59 ⇒ 𝝈 = 𝟏. 𝟓𝟗
𝑛 5

MARGEN DE CONFIANZA Y MARGEN DE ERROR


Para hallar él error típico de la estima se sigue los siguientes pasos:

1. Hallar los valores en la columna 8 con la fórmula: 𝑌̂ − 𝜎 → 7.60 − 1.59 = 6.01 para todos
los valores de 𝑌̂
2. Hallar los valores en la columna 9 con la fórmula: 𝑌̂ + 𝜎 → 7.60 + 1.59 = 9.19 para
todos los valores de 𝑌̂
3. Contar los valores de 𝑌𝑖 que se encuentra dentro de cada intervalo de la columna 8 y la
columna 9 para calcular el margen de confianza y los que se encuentra fuera para calcular el
margen de error
2 3
𝑀𝑐 = ∗ 100 = 40% ; 𝑀𝐸 = ∗ 100 = 60%
5 5
COSTO SI LA CANTIDAD DEL PRODUCTO ES DE 10 UNIDADES
̂ = −𝟎. 𝟗 + 𝟖. 𝟓𝟎(𝟏𝟎) = 𝟖𝟒. 𝟏𝟎
𝐶𝑜𝑚𝑜 𝑥 = 10 ⇒ 𝒀

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

PRACTICO Nº 5 DE ESTADISTICA I

5.- ANÁLISIS DE REGRESIÓN Y CORRELACION

1).- Una muestra aleatoria de seis familias en relación al ingreso medio por hogar es la siguiente
Miembros p/familia (x) 1 2 3 4 5 6
Ingreso p/hogar (y) 94 152 218 248 268 281
a) Determine la ecuación de regresión lineal del ingreso en función del número de miembros por
familia: Por el método libre, por el método semi-promedio y por el método de los mínimos
cuadrados.
b) Estime el ingreso por hogar si el número de miembros por familia es de 8.
2).- El efecto de la temperatura (x) en la absorción (y) del anhídrido carbónico en agua está dada en la
siguiente tabla:
Temperatura ( ºC ) 10 15 20 30 35 40 50
Coeficiente Ab. Relativa 5 8 7,5 12 13 22 46
a) Mostrar el diagrama de dispersión y observar su tendencia.
b) Ajustar a los datos a la función exponencial: 𝑌 = 𝑎 𝑏 𝑥
c) Estimar “Y” cuando X = 25
3).- Ajustar los siguientes datos a una función parabólica de segundo grado:
Cantidad de abono química en kg (x) 1 2 3 4 5
Producción en toneladas (y) 3 5 7 6 3
a) Calcular el coeficiente de determinación e interpretar.
b) Que porcentaje de la variación total permanece no explicada.
c) Estimar la producción si se utiliza 3,5 kgs de abono.
4).- Los siguientes datos ajustar a un modelo de regresión
Tasa de interés (x) 9 6 4 3 2
Inversión neta (y) 2 3 5 6 10
Indicar cuál de los siguientes modelos es el mejor y porque?
𝑎) 𝑌 = 𝑎 + 𝑏𝑥 𝑐) 𝑌 = 𝑎 𝑥 𝑏
𝑥
𝑏) 𝑌 = 𝑎 𝑏 𝑑) 𝑌 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐
5).- Dada la relación de precio y cantidad:
X 9 8 6 5 3 1
Y 2 3 4 6 8 10
Se Pide:
a) Ajustar la curva de regresión a una función potencial.
b) Es confiable la función ¿en qué medida?
6).- Con el objeto de estudiar la relación entre las variables de consumo de energía eléctrica (x) y el
volumen de producción en empresas industriales (y), se toma una muestra de 20 empresas para las cuales
se computaron los siguientes valores:

∑𝑋 = 11,34 ∑𝑌 = 20,72 ∑𝑋 2 = 12,16


∑𝑌 2 = 84,96 ∑𝑋𝑌 = 22,13 𝑛 = 20
a) Calcule la ecuación de regresión de Y en X

Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.


Universidad Autónoma Gabriel Rene moreno Facultad Auditoria Financiera o Contaduría Pública
Carrera Contaduría Pública Materia: Estadística I

b) Calcule e interprete el coeficiente de correlación


c) Cual seria el volumen de producción de la empresas, si el consumo de la energía eléctrica fuera de
20 kws.
7).- Una encuesta sobre los vendedores de autos en la Importadora CIATO S.A. para determinar la
relación entre la cantidad de anuncios publicitados y la venta de autos, se resume en la siguiente tabla:
Vendedores Nº avisos publicitados Nº autos vendidos
A 59 111
B 36 86
C 38 78
D 29 61
E 22 50
a) Determinar la función de regresión lineal por el método de los mínimos cuadrados
b) Determinar el coeficiente de correlación y el coeficiente de determinación
c) Calcular el error típico de la estima
d) Hallar el margen de confianza y el margen de error
e) Calcular el Nº de autos vendidos si en el Nº de avisos publicitados es 40

8).- Se tiene los siguientes datos de los gastos (y) y los ingresos (x) en miles de Bs. De cinco familias.
Se pide:
Ingreso (x) 5 8 7 20 15
Gasto (y) 1 2 1 2 4
a) Determinar la función de regresión lineal
b) Calcular el coeficiente de correlación y de determinación
c) Calcular el error típico de la estima.
d) Determine el margen de confianza y el margen de error.
e) Hallar los gastos su los ingresos son 20 mil Bs.

9.- Con la información del INE de la evolución de la chirimoya en Santa Cruz expresada en toneladas
métricas entre los años 2013 al 2017. Se pide:

AÑO 2013 2014 2015 2016 2017


PRODUCCION 848 894 893 916 953
a) Determinar la función de regresión lineal
b) Calcular el coeficiente de correlación y de determinación
c) Calcular el error típico de la estima.
d) Determine el margen de confianza y el margen de error.
e) Estimar la producción de la chirimoya para el año 2020

10).- En el siguiente cuadro se muestran las ventas de una Empresa (en millones de Bs.) de los años
2015 - 2017. Se pide:
Año P V 0 I
2015 2 3 5 4
2016 2 4 6 4
2017 3 5 6 5
a) Calcular la función de regresión lineal
b) Predecir las ventas para el año 2020
Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.

También podría gustarte