Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD CINCO
El Análisis de Regresión se ocupa de establecer la forma de la relación entre las variables, es decir, se
estudia la relación funcional entre las variables 𝑌 = 𝑓(𝑥) 𝑜 𝑋 = 𝑓(𝑦) , de modo que podamos
predecir el valor de una con base en la otra.
Normalmente la variable base se llama variable independiente y la variable que se va a predecir se llama
variable dependiente.
En términos de estadística los conceptos de Regresión y Ajustes son sinónimos, lo cual implica estimar
valores en función de las variables.
LINEAL PARABOLICA
𝑌̂ = 𝑓(𝑥) = 𝑎 + 𝑏𝑥
El objetivo principal es determinar los valores de los parámetros a, b de la función lineal para los cual
se utiliza el método de los Mínimos Cuadrados ya que minimiza la distancia entre uno y otro dato y trata
que la recta pase por casi todos los puntos y para los puntos que no toma en cuenta, trata que la distancia
sea mínima.
METODO LIBRE
Para hallar la ecuación de Regresión Lineal por este método se sigue los siguientes pasos:
𝑦2 − 𝑦1
(𝑦 − 𝑦1 ) = (𝑥 − 𝑥1 )
𝑥2 − 𝑥1
METODO SEMIPROMEDIO
Este método consiste en dividir a la distribución en dos partes luego sacar la media aritmética de cada
parte y aplicar la ecuación que pasa por dos puntos.
Es el mejor método para ajustar una función lineal ya que minimiza la distancia entre uno y otro dato y
trata que la recta pase por casi todos los puntos y los puntos que no toma en cuenta, trata que la distancia
sea mínima.
Para ajustar una función lineal por el método de los mínimos cuadrados se sigue los siguientes pasos.
Determinar o calcular : XY , X2
Determinar la sumatoria de: XY , X , Y , X2
Encontrar a y b mediante la siguientes formulas
𝑛∑𝑋𝑌−(∑𝑋)(∑𝑌) ∑𝑌−𝑏∑𝑋
b= ; a=
𝑛∑𝑋 2 − (∑𝑋)2 𝑛
Es una función cuadrática de segundo grado, cuya forma general está dada por:
𝑌̂ = 𝑓(𝑥) = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐
El objetivo principal es determinar los valores de los parámetros a, b, c, para lo cual se utilizan las
siguientes ecuaciones de transformaciones.
∑𝑦 = 𝑎∑𝑥 2 + 𝑏∑𝑥 + 𝑐𝑛
{ ∑𝑌𝑋 = 𝑎∑𝑥 3 + 𝑏∑𝑥 2 + 𝑐∑𝑥
∑𝑦𝑥 2 = 𝑎∑𝑥 4 + 𝑏∑𝑥 3 + 𝑐∑𝑥 2
𝑌̂ = 𝑓(𝑥) = 𝑎𝑏 𝑥
El objetivo principal es determinar los valores de los parámetros a, b, para lo cual se utilizan las
siguientes ecuaciones de transformaciones.
𝑍 = 𝑙𝑜𝑔𝑌 𝑎 = 10 𝐴 𝑏 = 10𝐵
𝑛∑𝑋𝑍−(∑𝑋)(∑𝑍) ∑𝑍−𝐵∑𝑋
B= ; A=
𝑛∑𝑋 2 − (∑𝑋)2 𝑛
𝑌̂ = 𝑓(𝑥) = 𝑎𝑥 𝑏
El objetivo principal es determinar los valores de los parámetros a, b, para lo cual se utilizan las
siguientes ecuaciones de transformaciones.
𝑍 = 𝑙𝑜𝑔𝑦 ; 𝑊 = 𝑙𝑜𝑔𝑥 ; 𝑎 = 10 𝐴
𝑛∑𝑊𝑍−(∑𝑊)(∑𝑍) ∑𝑍−𝑏∑𝑊
b= ; A=
𝑛∑𝑊 2 − (∑𝑊)2 𝑛
El Análisis de Correlación se ocupa de determinar el grado de la relación entre las variables, es decir
que se dirige sobre todo a medir la fuerza de una relación entre las variables, donde la fortaleza de la
relación se determina mediante la magnitud del efecto que cualquier cambio de una variable ejerce
sobre la otra.
𝑉 ( 𝑌̂ − 𝑌̅ )2
r = √𝑉𝐸 = √( 𝑌 ̅ )2
𝐺 𝑖−𝑌
𝑛∑𝑋𝑌−(∑𝑋)(∑𝑌)
Otra forma: r = √[𝑛∑𝑋2 −(∑𝑋)2][𝑛∑𝑌2 −(∑𝑌)2]
𝑟 2 = ( 𝑟 )2
∑( 𝑌𝑖 − 𝑌̂ )2
𝜎= √
𝑛
Son dos rectas paralelas que se obtienen sumando y restando al valor mínimo y al valor máximo de 𝑌̂
estimada y el valor del error típico de la estima
Para hallar el margen de seguridad se sigue los siguientes pasos:
1) Calcular el error típico de la estima
2) Sumar y restar el error típico de la estima al valor menor y mayo de la Y estimada
3) Determinar los cuatro puntos
4) Representar los cuatro puntos en el gráfico del diagrama de dispersión para trazar las dos rectas
paralelas y determinar el número de observaciones que están dentro y fuera del margen de
seguridad y se esa manera obtener el margen de confianza y el margen de error, que está dado
por:
CANTIDAD (X) 1 2 3 4 5
COSTO (Y) 2 4 7 8 10
Se pide:
a) Determine la ecuación de regresión lineal del costo en función de la cantidad: Por el método
libre, por el método semi-promedio y por el método de los mínimos cuadrados.
b) El coeficiente de determinación y su interpretación
c) Estimar el costo para una cantidad de 10 unidades
SOLUCION: ECUACION DE REGRESION LINEAL POR EL:
METODO LIBRE:
Grafica de los puntos (diagrama de dispersión):
𝑃1 (𝑥1 , 𝑦1 ) = (1 , 2) ; 𝑃2 (𝑥1 , 𝑦1 ) = (5 , 10)
Ecuación de recta que pasa por dos puntos:
𝑦2 − 𝑦1
(𝑦 − 𝑦1 ) = (𝑥 − 𝑥1 )
𝑥2 − 𝑥1
10 − 2 8
(𝑦 − 2) = (𝑥 − 1) → (𝑦 − 2) = (𝑥 − 1)
5−1 4
(𝑦 − 2) = 2(𝑥 − 1) → ̂ = 𝟐𝒙
𝒚
METODO SEMI-PROMEDIO:
Calculamos los semi-promedio:
1+2+3 6
𝑥1 =
̅̅̅̅ = =2 13
3 3 → 𝑃1 (̅̅̅ 𝑦1 ) = (2 , )
𝑥1 , ̅̅̅
2 + 4 + 7 13 3
{ 𝑦
̅̅̅̅ = =
1 3 3
3+4+ 5 12
𝑥2 =
̅̅̅̅ = =4 25
3 3 → 𝑃1 (̅̅̅ 𝑦2 ) = (4 , )
𝑥2 , ̅̅̅
7 + 8 + 10 25 3
{ 𝑦2 = =
̅̅̅̅
3 3
25 13 25 − 13 12
13 − 3 13 13
(𝑦 − ) = 3 (𝑥 − 2) → (𝑦 − ) = 3 (𝑥 − 2) → (𝑦 − ) = 3 (𝑥 − 2)
3 4−2 3 2 3 2
13 13 𝟏
(𝑦 − ) = 2(𝑥 − 2) → 𝑦 = 2𝑥 − 4 + → ̂ = 𝟐𝒙 +
𝒚
3 3 𝟑
METODO DE LOS MINIMOS CUADRADOS:
X Y XY X2 Y2
1 2 2 1 4
2 4 8 4 16
3 7 21 9 49
4 8 32 16 64
5 10 50 25 100
15 31 113 55 233
∑𝑌−𝑏∑𝑋 31 − 2(15)
𝑎 = = = 𝟎. 𝟐
𝑛 5
̂ = 𝑓 (𝑥 ) = 𝑎 + 𝑏𝑋 ⇒ 𝒀
𝒀 ̂ = 𝟎. 𝟐 + 𝟐𝑿
Coeficiente de Correlación 𝒓 = 𝟎. 𝟗𝟗
Es decir que para el costo de 10 unidades para un producto es de 20.2 unidades monetarias.
EJEMPLO 2).- Un fabricante de radios registra sus utilidades (Y) en $us en relación al precio (X) en
$us en la siguiente tabla.
Precio (X) $us 1 2 3 4 5
Utilidades (Y) $us 9 15 19 16 8
X Y XY X2 YX2 X3 X4
1 9 9 1 9 1 1
2 15 30 4 60 8 16
3 19 57 9 171 27 81
4 16 64 16 256 64 256
5 8 40 25 200 125 625
15 67 200 55 696 225 979
EJEMPLO 3.- El número de bacterias por unidad de volumen presentes (Y), en un cultivo después de
(X) horas, viene dada en la tabla
X 0 1 2 3 4 5 6
Y 32 47 65 92 132 190 275
Se pide:
a) Diagrama de dispersión
b) Ajustar los datos a una función exponencial
c) Estimar el número de bacterias después de 7 horas de cultivo
𝑎 = 10 𝐴 𝑏 = 10𝐵
X Y Z=logY XZ X2
7(45.7015) − (21)(13.7926)
𝐵= = 𝟎. 𝟏𝟓 0 32 1.5051 0 0
7(91) − (21)2 1 47 1.6721 1.6721 1
2 65 1.8129 3.6258 4
13.7926 − (0.15)(21)
𝐴= = 𝟏. 𝟓𝟐 3 92 1.9638 5.8914 9
7 4 132 2.1206 8.4824 16
5 190 2.2788 11.3940 25
𝑏 = 10𝐵 = 100.15 = 𝟏. 𝟒𝟏 6 275 2.4393 14.6358 36
21 13.7926 45.7015 91
𝑎 = 10 𝐴 = 101.52 = 𝟑𝟑. 𝟏𝟏
EJEMPLO 4.- Un Empresario registra sus inversiones (Y) en miles de $us en relación a la tasa de
interés (X) en forma porcentual en la siguiente tabla
Interés (%) 1 2 3 4 5
Inversiones ($us) 30 7 3 2 1
Se pide:
a) Ajustar los datos a una función potencial
b) Estimar las inversiones si la tasa de interés es del 10 %
X Y Z=log Y W=log X WZ W2
1 30 1.4771 0.0000 0.0000 0.0000
2 7 0.8451 0.3010 0.2544 0.0906
3 3 0.4771 0.4771 0.2276 0.2276
4 2 0.3010 0.6021 0.1812 0.3625
5 1 0.0000 0.6990 0.0000 0.4886
3.1003 2.0792 0.6632 1.1693
∑𝑍−𝑏∑𝑊 3.1003−(−2.05)(2.0792)
A= = = 1.47 → 𝒂 = 10 𝐴 = 101.47 = 𝟐𝟗. 𝟓𝟏
𝑛 5
𝐶𝑜𝑚𝑜 𝑥 = 10 ⇒ 𝒀̂ = (29.51)(10)−2.05 = 𝟎. 𝟐𝟔
EJEMPLO 5.- Se tiene los siguientes datos de los costos y cantidad de un producto
Cantidad (x) 1 2 3 4 5
Costo (y) 8 14 26 35 40
Se pide:
SOLUCION:
DIAGRAMA DE DISPERSION
FUNCION DE REGRESION LINEAL
Para hallar la función de regresión lineal
se sigue los siguientes pasos:
X Y X2 XY Y2 𝑌̂ ( 𝑌𝑖 − 𝑌̂ )2 𝑌̂ − 𝜎 𝑌̂ + 𝜎
̂ = 𝑓 (𝑥 ) = 𝑎 + 𝑏𝑋 ⇒ 𝒀
𝒀 ̂ = −𝟎. 𝟗 + 𝟖. 𝟓𝟎𝑿
Coeficiente de Correlación 𝒓 = 𝟎. 𝟗𝟗
1. Hallar los valores en la columna 8 con la fórmula: 𝑌̂ − 𝜎 → 7.60 − 1.59 = 6.01 para todos
los valores de 𝑌̂
2. Hallar los valores en la columna 9 con la fórmula: 𝑌̂ + 𝜎 → 7.60 + 1.59 = 9.19 para
todos los valores de 𝑌̂
3. Contar los valores de 𝑌𝑖 que se encuentra dentro de cada intervalo de la columna 8 y la
columna 9 para calcular el margen de confianza y los que se encuentra fuera para calcular el
margen de error
2 3
𝑀𝑐 = ∗ 100 = 40% ; 𝑀𝐸 = ∗ 100 = 60%
5 5
COSTO SI LA CANTIDAD DEL PRODUCTO ES DE 10 UNIDADES
̂ = −𝟎. 𝟗 + 𝟖. 𝟓𝟎(𝟏𝟎) = 𝟖𝟒. 𝟏𝟎
𝐶𝑜𝑚𝑜 𝑥 = 10 ⇒ 𝒀
PRACTICO Nº 5 DE ESTADISTICA I
1).- Una muestra aleatoria de seis familias en relación al ingreso medio por hogar es la siguiente
Miembros p/familia (x) 1 2 3 4 5 6
Ingreso p/hogar (y) 94 152 218 248 268 281
a) Determine la ecuación de regresión lineal del ingreso en función del número de miembros por
familia: Por el método libre, por el método semi-promedio y por el método de los mínimos
cuadrados.
b) Estime el ingreso por hogar si el número de miembros por familia es de 8.
2).- El efecto de la temperatura (x) en la absorción (y) del anhídrido carbónico en agua está dada en la
siguiente tabla:
Temperatura ( ºC ) 10 15 20 30 35 40 50
Coeficiente Ab. Relativa 5 8 7,5 12 13 22 46
a) Mostrar el diagrama de dispersión y observar su tendencia.
b) Ajustar a los datos a la función exponencial: 𝑌 = 𝑎 𝑏 𝑥
c) Estimar “Y” cuando X = 25
3).- Ajustar los siguientes datos a una función parabólica de segundo grado:
Cantidad de abono química en kg (x) 1 2 3 4 5
Producción en toneladas (y) 3 5 7 6 3
a) Calcular el coeficiente de determinación e interpretar.
b) Que porcentaje de la variación total permanece no explicada.
c) Estimar la producción si se utiliza 3,5 kgs de abono.
4).- Los siguientes datos ajustar a un modelo de regresión
Tasa de interés (x) 9 6 4 3 2
Inversión neta (y) 2 3 5 6 10
Indicar cuál de los siguientes modelos es el mejor y porque?
𝑎) 𝑌 = 𝑎 + 𝑏𝑥 𝑐) 𝑌 = 𝑎 𝑥 𝑏
𝑥
𝑏) 𝑌 = 𝑎 𝑏 𝑑) 𝑌 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐
5).- Dada la relación de precio y cantidad:
X 9 8 6 5 3 1
Y 2 3 4 6 8 10
Se Pide:
a) Ajustar la curva de regresión a una función potencial.
b) Es confiable la función ¿en qué medida?
6).- Con el objeto de estudiar la relación entre las variables de consumo de energía eléctrica (x) y el
volumen de producción en empresas industriales (y), se toma una muestra de 20 empresas para las cuales
se computaron los siguientes valores:
8).- Se tiene los siguientes datos de los gastos (y) y los ingresos (x) en miles de Bs. De cinco familias.
Se pide:
Ingreso (x) 5 8 7 20 15
Gasto (y) 1 2 1 2 4
a) Determinar la función de regresión lineal
b) Calcular el coeficiente de correlación y de determinación
c) Calcular el error típico de la estima.
d) Determine el margen de confianza y el margen de error.
e) Hallar los gastos su los ingresos son 20 mil Bs.
9.- Con la información del INE de la evolución de la chirimoya en Santa Cruz expresada en toneladas
métricas entre los años 2013 al 2017. Se pide:
10).- En el siguiente cuadro se muestran las ventas de una Empresa (en millones de Bs.) de los años
2015 - 2017. Se pide:
Año P V 0 I
2015 2 3 5 4
2016 2 4 6 4
2017 3 5 6 5
a) Calcular la función de regresión lineal
b) Predecir las ventas para el año 2020
Docente: Ing. Oawaldo Koller L Ing.Victor Miranda H.