Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTIMACION DE
SEMANA 11
PARÁMETROS
RDGA 2
RDGA 3
INFERENCIA ESTADÍSTICA
La inferencia estadística o estadística inferencial se refiere a un
conjunto de métodos mediante los cuales podemos hacer
afirmaciones con respecto a una población completa a partir
únicamente de la observación de una parte de ella.
El objetivo de la Inferencia
Estadística es deducir características
de las poblaciones a partir de la
evidencia obtenida en las muestras.
RDGA 4
ESTIMACIÓN
La estimación de parámetros tiene por finalidad asignar valores a los
parámetros poblacionales a partir de medidas obtenidas en las muestras.
hay dos formas de estimar un parámetro poblacional:
Parámetro Estimador (obtenido a
Estimación puntual: Poblacional partir de una muestra)
Es un estadístico calculado a partir de Media: µ Media muestral X
información de la muestra para
Varianza: σ2 Varianza muestral S2
estimar el parámetro poblacional.
Proporción: P Proporción muestral p
𝑃 𝜃 − 𝑒 ≤ 𝜃 ≤ 𝜃 + 𝑒 = 1 − 𝛼 = γ
Los intervalos que determinaremos, tanto para la media como para
proporciones, tienen la forma general siguiente:
𝑃 𝜃መ − 𝑄 𝑉(𝜃መ ≤ 𝜃 ≤ 𝜃መ + 𝑄 𝑉(𝜃መ = 1 − 𝛼 = γ
• Normal 𝑆 𝑆
𝑋ത − 𝑇𝛼/2 ≤ 𝜇 ≤ 𝑋ത + 𝑇𝛼/2
• σ2 desconocida, 𝑛 𝑛
• “n” pequeño
Usando la distribución T con n – 1 GL
𝜎 𝜎
• σ2 Conocida, 𝑋ത − 𝑍𝛼/2 ≤ 𝜇 ≤ 𝑋ത + 𝑍𝛼/2
• “n grande” 𝑛 𝑛
Usando la distribución Normal N(0, 1)
𝑆 𝑆
• σ2 desconocida, 𝑋ത − 𝑍𝛼/2 ≤ 𝜇 ≤ 𝑋ത + 𝑍𝛼/2
𝑛 𝑛
• “n grande”
Usando la distribución Normal N(0, 1)
𝝈 𝝈𝟐
= 𝒁𝜶/𝟐
𝒆 = 𝑸 𝑽(𝜽 𝟐
⟹ 𝒏 = 𝒁𝜶/𝟐 𝟐
RDGA 𝒏 𝒆 7
Ejemplo 1:
Los siguientes datos son los pesos (en gramos) de 16 mangos que se
seleccionaron en una caja con la finalidad de verificar el peso promedio: 506,
508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. Si el
peso de cada mango es una variable normal con desviación típica de 5gr. σ
A) Obtener los intervalos de confianza al 90, 95, 99 % para la media del peso de
los mangos.
Datos
Variable X= peso en gramos N(µ, 25). n = 16, X = 503.76 y σ = 5
1 – α = γ = 0.90 𝒁𝛂/𝟐 = 1.645 (1-0.90) = 0.10 = α α/2 = 0.05
𝜎 𝜎
𝑋ത − 𝑍𝛼/2 ≤ 𝜇 ≤ 𝑋ത + 𝑍𝛼/2
𝑛 𝑛
5 5
503.76 − 1.645 ≤ 𝜇 ≤ 503.76 + 1.645 ⟹ 501.76 ≤ 𝛍 ≤ 505.82
16 16
1−α=γ 𝒁𝛂/𝟐 Intervalo
0.90 1.645 (501.76, 505.82)
0.95 1.96 (501.31, 506.21)
0.99 2.58 (500.54, 506.99)
RDGA 8
B) Determinar el tamaño muestral necesario para que la longitud del
intervalo (L = Lsup – Linf) sea menor que la unidad, con 1 − α = 0.95.
𝐿 1
መ
En este caso 𝑒 = = = 0. 5 ⟹ 𝑒 = 𝑄 𝑉(𝜃)
2 2
25 5 1.96×5 2
0. 5 = 1.96 × = 1.96 × ⟹ 𝑛= = 384.16 ≅ 385
𝑛 𝑛 0.5
El numero mínimo de mangos es 385 para estimar la media poblacional
con un error máximo de 0. 5
Ejemplo 2:
Con el fin de garantizar la salubridad de las botellas de agua de cierta marca
se ha llevado a cabo un análisis que cuenta el número de bacterias que se
encuentran en 9 unidades. Los recuentos han dado los siguientes resultados:
157, 186, 179, 163, 171, 154, 177, 165, 168. Aceptando normalidad en la
distribución del recuento bacteriano, elaborar:
A) Estimaciones para la media y la varianza.
B) El intervalo de confianza para la media a un nivel del 95%.
C) El intervalo de confianza para la varianza a un nivel del 95%.
RDGA 9
Solución:
A) Datos:
Variable X= número de bacterias Normal, varianza desconocida
Estimaciones de la media y la varianza:
σ𝑋 1520 σ 𝑋𝑖 −𝑋ത 2 878.888889
𝑋ത = 𝑖 = = 168.9 𝑆2 = = = 109.86111
𝑛 9 𝑛−1 8
El número promedio de bacterias en las botellas de agua es 168.9, con una
desviación estándar de 10.481.
B) Intervalo de confianza para el número promedio de bacterias en las botellas
de agua es:
1 – α =γ = 0.95 𝑻𝛂/𝟐(𝟖) = 2.31 α = 1-0.95 = 0.05 α/2 =0.025
S S
𝑋ത − T𝛼/2 ≤ 𝜇 ≤ 𝑋ത + T𝛼/2
𝑛 𝑛
10.481 10.481
168.9 − 2.31 × ≤ 𝜇 ≤ 168.9 + 2.31 × ⟹ 160.83 ≤ 𝛍 ≤ 176.97
9 9
𝑝1 1 − 𝑝1 𝑝2 1 − 𝑝2
𝑝1 − 𝑝2 − 𝑍𝛼 + ≤ 𝑃1 − 𝑃2
2 𝑛1 𝑛2
“n1, n2”
grandes 𝑝1 1 − 𝑝1 𝑝2 1 − 𝑝2
≤ 𝑝1 − 𝑝2 + 𝑍𝛼/2 +
𝑛1 𝑛2
RDGA 11
Ejemplo 3:
En una muestra de 105 parcelas sembradas con arroz seleccionados al azar
de una Región, se observa que en 27 de ellas hubo perdidas por escasez de
agua. Obtener un intervalo de confianza para la proporción de parcelas de la
región con pérdidas, a un nivel de confianza del 90 %.
Datos: Para determinar el intervalo necesitamos conocer la proporción en la
muestra, p, de parcelas con pérdidas:
Variable X= número de parcelas con pérdidas
𝑋 27
Estimaciones de la proporción de parcelas con pérdidas: 𝑝 = = = 0.257
𝑛 105
1 – α =γ = 0.90 𝑍𝛼/2 = 1.645
𝑝(1−𝑝) 𝑝(1−𝑝)
𝑝 − 𝑍𝛼/2 ≤ 𝑃 ≤ 𝑝 + 𝑍𝛼/2
𝑛 𝑛
0.1828 ≤ 𝑃 ≤ 0. 3272
El intervalo de 0.90 de confianza para la proporción de parcelas de la
región con pérdidas se encuentra entre 0.1828 y 0.3272
RDGA 12
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE LAS MEDIAS DE DOS POBLACIONES
• Normales
𝜎12 𝜎22 𝜎12 𝜎22
• Varianzas 𝑋ത1 − 𝑋ത2 − 𝑍𝛼 + ≤ 𝜇1 − 𝜇2 ≤ 𝑋ത1 − 𝑋ത2 + 𝑍𝛼/2 +
2 𝑛1 𝑛2 𝑛1 𝑛2
Conocidas
• Para todo n Usando la distribución Normal N(0, 1)
•Normales 1 1 1 1
•Varianzas 𝑋ത1 − 𝑋ത2 − 𝑇𝛼 𝑆 + ≤ 𝜇1 − 𝜇2 ≤ 𝑋ത1 − 𝑋ത2 + 𝑇𝛼 𝑆 +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
desconocidas
pero iguales
𝑛1 − 1 𝑆12 + 𝑛2 − 1 𝑆22
•Tamaños 𝑆=
muestrales 𝑛1 + 𝑛2 − 2
pequeños
Usando la distribución T con n1 +n2 – 2 GL.
RDGA 13
Ejemplo 3: Construya un intervalo de confianza del 94% para la diferencia real
entre las ventas diarias de leche de dos establos, una muestra de 40 registros
tomada al azar del 1er establo dio un promedio de 418 litros vendidos, y una
muestra de 50 registros del 2do establo dieron un promedio de 402 litros. Las
varianzas de las dos poblaciones son 676 y 484, respectivamente.
Solución: Tenemos que: 1 – α =γ = 0.94 𝑍𝛼/2 = 1.88 α = 0.06 α/2 =0.03
Establo 1: 𝑛1 = 40 𝑋ത1 = 418 𝜎12 = 676
Establo 2: 𝑛2 = 50 𝑋ത2 = 402 𝜎22 = 484
La diferencia real entre las ventas promedio diarias de leche de los dos
establos se encuentra entre 6.3075 y 25.6925 litros, la mayor venta diaria se
da en el 1er establo RDGA 14
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE LAS MEDIAS DE DOS POBLACIONES
24.82 14.92
443.3 − 451.4 − 2.10 × + ≤ 𝜇1 − 𝜇2
12 12
24.82 14.92
≤ 443.3 − 451.4 + 2.10 × +
12 12
− 25.6392 ≤ 𝜇1 − 𝜇2 ≤ 9.4392
(𝐧 − 𝟏)𝐒𝟐 (𝐧 − 𝟏)𝐒 𝟐
Media desconocida ≤ 𝟐 ≤
𝐗 𝟐𝛂/𝟐 𝐗 𝟐𝟏−𝛂/𝟐
Usando La Distribución Chi cuadrado χ𝟐(𝐧−𝟏)
𝐒𝟏𝟐 𝐒𝟏𝟐
Poblaciones 𝐒𝟐𝟐 𝛔𝟐𝟏 𝐒𝟐𝟐
normales, medias ≤ 𝟐≤
desconocidas 𝐅 𝐧𝟏−𝟏 ; 𝐧𝟐−𝟏 𝛂 𝛔𝟐 𝐅𝐧 𝛂
𝟏 −𝟏 ; 𝐧𝟐 −𝟏 𝟏−𝟐
𝟐
Distribución 𝑭(𝒏𝟏−𝟏 ; 𝒏𝟐 −𝟏 )
Usando LaRDGA 18
Ejemplo 5: Un instituto de investigaciones siembra, en cinco parcelas diferentes,
dos tipos de maíz híbrido para consumo de ganado. Las producciones en
quintales métricos por hectárea son:
NOTA: si el “1” esta incluido en el intervalo entonces las varianzas son iguales
RDGA 19
Continuación ejemplo 5:
F1-α/2 Fα/2
𝟐
𝐒𝟏 𝟐
𝐒𝟏
𝟐
𝐒𝟐 𝛔𝟐𝟏 𝟐
𝐒𝟐
fórmula ≤ ≤
𝐅 𝐧 −𝟏 ; 𝐧 −𝟏 𝛂 𝛔𝟐𝟐 𝐅 𝛂
𝟏 𝟐 𝐧𝟏 −𝟏 ; 𝐧𝟐 −𝟏 𝟏−𝟐
𝟐
El “1” esta incluido en el intervalo entonces las varianzas son iguales con una
confianza de 0.90 o 90 %
Este resultado servirá para resolver la parte (B) del problema
RDGA 20
Practicamos el uso de la tabla de la distribución F
F(7, 8)
F1-α/2 Fα/2
0.268 3.5
𝟏 𝟏
𝑭 𝟕,𝟖 𝟏−𝜶/𝟐 = = = 𝟎. 𝟐𝟔𝟖
𝑭 𝟖,𝟕 𝜶/𝟐 𝟑. 𝟕𝟑
RDGA 21
Continuación ejemplo 5:
B) Nos situamos ante un intervalo de confianza para la diferencia de
medias poblacionales (μ1 – μ2) con varianzas poblacionales desconocidas
pero iguales, con muestras pequeñas n1 + n2 < 30
Los datos:
RDGA 22
Continuación ejemplo 5:
RDGA 23
Datos:
Variable X= número de bacterias Normal, varianza desconocida
Estimaciones de la media y la varianza:
σ𝑋 1520 σ 𝑋𝑖 −𝑋ത 2 878.888889
𝑋ത = 𝑛 𝑖 = 9 = 168.9 𝑆 2 = = = 109.86111
𝑛−1 8
𝑪𝒐𝒏 𝟖 𝑮. 𝑳. 𝐗 𝟐𝛂/𝟐 = 17.535 𝐗 𝟐𝟏−𝛂/𝟐 = 2.18
(𝐧 − 𝟏)𝐒 𝟐 (𝐧 − 𝟏)𝐒 𝟐
≤ ≤
𝟐
𝐗 𝟐𝛂/𝟐 𝐗 𝟐𝟏−𝛂/𝟐
50.1219 ≤ 𝟐 ≤ 403.16
H o: H1:
2
Una hipótesis
Una hipótesis estadística (H) es
una proposición acerca de una
característica de la población de
estudio.
26
Rosa Gutiérrez de Alarcón
• Las siguientes son algunos ejemplos de hipótesis:
o El rendimiento promedio de maíz por parcela es menor o igual de 80 Kg
Ho: µ ≤ 80 H1: µ > 80
o H1: µ < 67 (la edad media poblacional de los trabajadores es menor que 67)
Ho: µ ≥ 67
o Ho: σ2 = 4 (la variancia poblacional es igual a 4) H1: σ2 ≠ 4
σ2 < 4
σ2 > 4
• La que se acepta si las pruebas no indican
lo contrario.
H0: Hipótesis nula • Rechazarla por error tiene graves
consecuencias. Los datos pueden refutarla
• Es inocente
27
Rosa Gutiérrez de Alarcón
Tipos de hipótesis: En la prueba de hipótesis se comienza
proponiendo una hipótesis tentativa acerca de un parámetro poblacional
• A la hipótesis tentativa se le denomina hipótesis nula (H0)
• Debe formularse una hipótesis opuesta a la hipótesis nula Ho llamada
hipótesis alternativa y se representa por (H1)
H0 verdadera Ho falsa
Ha falsa Ha verdadera
Aceptar H0 Conclusión Correcta Error tipo II (β)
29
Rosa Gutiérrez de Alarcón
PRUEBA DE HIPOTESIS PARA LA MEDIA Ho: 𝝁 = 𝝁𝒐
Estadísticas de prueba:
A) σ2 Conocida y población con distribución normal o muestras
ത 𝑜
𝑋−𝜇
grandes n ≥ 30: 𝑍𝑜 = 𝜎 ⟶ 𝑁(0,1)
ൗ 𝑛
B) σ2 desconocida, población con distribución normal y muestras pequeñas
n < 30:
ത 𝑜
Nota: En las regions de rechazo solo cambia la
𝑋−𝜇
𝑇𝑜 = 𝑆 → 𝑇(𝑛−1) distribución normal (Z) por la T de Student (T)
ൗ 𝑛
𝛂 𝛂 𝛂/𝟐 𝛂/𝟐
− 𝒁α 0 0 𝒁α − 𝒁𝜶 𝒁𝜶
RRHo RRHO
𝟐 𝟐
RRHo RRHo 30
Rosa Gutiérrez de Alarcón
A) PRUEBA DE HIPOTESIS PARA µ
(σ2 Conocida o n ≥ 30)
El peso promedio de 36 hígados decomisados dio una media muestral
deX = 7600 gramos. Suponga además que estos pesos tienen distribución
normal con desviación estándar = 300. Con un nivel de significancia de
0.05. ¿Se puede concluir que el peso promedio del hígado decomisado es
mayor que el peso promedio estipulado en 7500 gramos?
Solución
Datos: Población normal, n =36 X = 7600 kilos. = 300
1. Parámetro de interés: Media poblacional = µ
2. Establecer la hipótesis Ho: µ ≤ 7500 (µo)
H1: µ > 7500
3. Nivel de significancia. α = 0.05
4. Establecer la estadística de prueba ത
𝑋−𝜇
𝑍𝑜 = 𝜎
𝑜
→ N(0, 1)
ൗ 𝑛
31
Rosa Gutiérrez de Alarcón
Continuación
5. Determinar RRHo y RAHo Hallamos el valor
crítico en la tabla de la normal, para α = 0.05:
Zα = 1.645
6. Calculamos Zo
7600−7500 0 𝑍𝑡 = 1.645
𝑍𝑜 = 300 =2 RAHo RRHo
ൗ 36
7517.75 ≤ 𝜇 ≤ 7682.25
Como puede verse la proporción de adultos que se hace una revisión dental dos
veces al año esta entre 0.4544 y 0.4656
Rosa Gutiérrez de Alarcón 36
UNIDAD III: INTRODUCCIÓN A LA
INFERENCIA ESTADÍSTICA
PRUEBAS DE
SEMANA 13
HIPÓTESIS (II)
H o: H1:
2
2
B2) 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 𝑆2
1 𝑆2
𝑛1
+ 𝑛2
𝑋ത1 −𝑋ത1 −𝛿𝑜 2
𝑇𝑜 = ⟶ 𝑇𝑣 Donde: 𝐺. 𝐿(𝑣) = 2 2
2 𝑆2
1 𝑆2
1
𝑆2
1 + 𝑆2 𝑛1 𝑛1
𝑛1 𝑛2
𝑛1−1
+ 𝑛2−1
39
Rosa Gutiérrez de Alarcón
Región de rechazo para diferentes alternativas
Pruebas unilaterales Prueba bilateral
𝛂 𝛂 𝛂/𝟐 𝛂/𝟐
− 𝒁α 0 0 𝒁α − 𝒁𝜶 𝒁𝜶
RRHo RRHO 𝟐 𝟐
RRHo RRHo
40
Rosa Gutiérrez de Alarcón
PRUEBA DE HIPOTESIS PARA 𝝁𝟏 − 𝝁𝟐
(𝜎12 = 𝜎22 desconocidas)
1 1 1 1
17.53 − 15.5 − 2.042 × 9.4349 + ≤ 𝜇1 − 𝜇2 ≤ 17.53 − 15.5 + 2.042 × 9.4349 +
13 19 13 19
Solución
Datos: n1 = 13 X1 = 13 Kg. S1 = 0.7
n2 = 16 X2 = 11 Kg. S2 = 0.3
Para realizar esta prueba primero debe verificarse si las varianzas son iguales o
diferentes
43
Rosa Gutiérrez de Alarcón
𝝈𝟐𝟏
PRUEBA PARA Ho: 𝝈𝟐𝟏 = 𝝈𝟐𝟐 o Ho: =1
𝝈𝟐𝟐
𝑆12
Estadísticas de prueba: 𝐹𝑜 = ⟶ 𝐹(𝑛1 −1 ; 𝑛2 −1 )
𝑆22
44
Rosa Gutiérrez de Alarcón
Prueba para la igualdad de varianzas
Datos: n1 = 13 𝑆12 = 0.49
S1 = 0.7 n2 = 16 S2 = 0.3 𝑆22 = 0.09
𝜎12
1. Parámetro de interés : 2 3. Nivel de significancia α = 0.05
𝜎2
2. Establecer las hipótesis 4. Estadística de prueba:
𝜎12 𝑆12
Ho: 𝜎12 = 𝜎22 o Ho: 2 = 1 𝐹𝑜 =
𝑆22
⟶ 𝐹(𝑛1−1 ; 𝑛2−1 )
𝜎2
𝜎12
Ha: 𝜎12 > 𝜎22 Ha: 2 > 1
𝜎2
5. Región crítica o de rechazo
𝐹 12 ;15 0.05 = 2.48
6. Calculamos 𝐹𝑜
0.49
𝐹𝑜 = = 5.444 2.48
0.09
7. Decisión: 𝐹𝑜 = 5.444 > 𝐹𝑡 = 2.48, 𝐹𝑜 está en la región de rechazo
Se rechaza Ho: 𝜎12 = 𝜎22 , es decir las varianzas son diferentes la varianza del
1er grupo es mayor que la del 2do.
45
Rosa Gutiérrez de Alarcón
PRUEBA DE HIPOTESIS PARA 𝝁𝟏 − 𝝁𝟐 (𝜎12 ≠ 𝜎22 descononocidas)
Solución
Datos: n1 = 13 X1 = 13 Kg. S1 = 0.7 n2 = 16 X2 = 11 Kg. S2 = 0.3 𝜎12 ≠ 𝜎22
1. Parámetro de interés : 𝝁𝟏 − 𝝁𝟐
2. Establecer las hipótesis
Ho: µ1 = µ2 o Ho: µ1 - µ2 = 0
Ha: µ1 > µ2 Ha: µ1 - µ2 > 0
3. Nivel de significancia α = 0.05
𝑋ത −𝑋ത −𝛿
4. Establecer la estadística de prueba 𝑇𝑜 = 1 1 1 1 𝑜 ⟶ 𝑇𝑣
𝑆 𝑛 +𝑛
1 2
𝑆2 𝑆2 2
1+ 2 0.49 0.09 2
𝑛1 𝑛2
13
+ 16 0.03769+0.00563 2
𝐺. 𝐿 𝑣 = 2 2 = 0.49 2 0.09 2
= 0.037692 0.005632
= 15.57 ≅ 15
𝑆2
1 𝑆2
1 + 15
13 + 16 12
𝑛1 𝑛1
+ 12 15
𝑛1−1 𝑛2−1
1.5564 ≤ 𝜇1 − 𝜇2 ≤ 2.4426
𝛂 𝛂 𝛂/𝟐 𝛂/𝟐
− 𝒁α 0 0 Zα − 𝒁𝜶 𝒁𝜶
RRHo RRHo
𝟐 𝟐
RRHo RRHo
48
Rosa Gutiérrez de Alarcón
Ejemplo
Se sospecha que añadiendo al tratamiento habitual para la eliminación de plagas en
plantas de palta un medicamento A, se consigue mayor número de plantas
recuperadas. Tomamos dos grupos de plantas de palta invadidas de cierta plaga de
100 cada uno. A un grupo se le suministra el medicamento A y se recuperan 60 y al
otro no se le suministra, recuperándose 55 plantas. ¿Es efectivo el tratamiento A en la
eliminación de plagas en las plantas de palta? Use un nivel de significancia de 0.05.
Solución:
Datos:
X: N° de plantas de palta que se recuperan
n1 = 100 X1 = 60 p1 = 0.6 (reciben el tratamiento A)
n2 = 100 X2 = 55 p2 = 0.55 (no reciben el tratamiento A)
1. Parámetro de interés : 𝑷𝟏 − 𝑷𝟐
2. Establecer las hipótesis
• Ho: P1 = P2 o Ho: P1 - P2 = 0
• Ha: P1 > P2 Ha: P1 - P2 > 0
3. Nivel de significancia α = 0.05
49
Rosa Gutiérrez de Alarcón
Continuación
4. Estadística de prueba
𝑃1 −𝑃2 𝑛1 𝑃1 + 𝑛2 𝑃2
𝑍𝑜 = ⟶ 𝑁(0, 1) Donde: 𝑃 =
1
𝑃 (1−𝑃) 𝑛 +𝑛
1 𝑛1 + 𝑛2
1 2
𝛂
5. Región de rechazo
CORRELACION Y
REGRESIÓN LINEAL SEMANA 14
SIMPLE
15.5
El análisis del diagrama
Rendimiento académico
15.0
de dispersión indica que
la tendencia es una línea 14.5
recta, es la que mejor se 14.0
ajusta a los datos,
entonces debemos 13.5
estimar la ecuación de 13.0
una recta.
12.5
12.0
11.5
2 3 4 5 6 7 8 9 10
Horas de estudio
Rosa Gutiérrez de Alarcón 60
REGRESIÓN LINEAL SIMPLE
El modelo de regresión lineal representa un marco metodológico, que
permite analizar la relación entre dos variables, asumiendo una hipótesis de
causalidad, esta hipótesis se representa por medio una función
metamatemática Y = f(X)
Es razonable pensar que una observación muestral de la variable Y puede ser
expresada como una combinación lineal de las observaciones de X
incluyendo un componente denominado término de error ( ):
𝒀𝒊 = 𝜷𝒐 + 𝜷𝟏 𝑿𝒊 + 𝜺𝒊 𝒊 = 𝟏, 𝟐, . . . , 𝒏
Donde:
Y: Variable dependiente, endógena, explicada, de respuesta...
X: Variable independiente, exógena, explicativa, de control, regresora...
0 y 1: Parámetros poblacionales
1: Es la cantidad de cambio que se produce en Y por cada unidad de
cambio de X.
Rosa Gutiérrez de Alarcón 61
La diferencia entre el valor observado de la variable y la recta estimada
se denomina error (𝜀𝑖 ), que representa los factores que influyen en Y
además de X. el objetivo es estimar los parámetros 0 y 1 de tal
manera que se minimice 𝜺𝒊
Rosa Gutiérrez de Alarcón 62
Método de los mínimos cuadrados
1) El modelo lineal : 𝒀𝒊 = 𝜷𝒐 + 𝜷𝟏 𝑿𝒊 + 𝜺𝒊 𝒊 = 𝟏, 𝟐, . . . , 𝒏
𝑛
𝜕𝑄 𝜕 σ𝑛1 𝒀𝒊 − 𝜷𝒐 − 𝜷𝟏 𝑿𝒊 2
= = −2 𝒀𝒊 − 𝜷𝒐 − 𝜷𝟏 𝑿𝒊 𝑋𝑖 = 0
𝜕𝛽1 𝜕𝛽1
1
y = 1.5106x - 0.0162
0.8 R² = 0.966
0.6
0.4
0.2
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
𝑅2 = 𝑟 2 = (0.9828 )2 = 0.966