Estadística Inferencial Aplicada

UNIVERSIDAD DE EL SALVADOR
FACULTAD MULTIDISCIPLINARIA ORIENTAL
DEPARTAMENTO DE CIENCIAS NATURALES Y MATEMÁTICA

SECCIÓN DE MATEMÁTICA
ASIGNATURA: ESTADÍSTICA II
CICLO LECTIVO: II-2017
DOCENTE: LCDA. MEIBY SULEMA RIVERA VÁSQUEZ.
TAREA:
“TAREA SOBRE REGRESIÓN Y CORRELACIÓN”.
PRESENTADO POR:
AMAYA AMAYA, LUIS MIGUEL.
ARGUETA AYALA, SILVIA ELIZABETH.
BENAVIDES CASTRO, JACQUELINNE VANESSA.
HERNÁNDEZ GARAY, SAÚL ANTONIO.
MARTÍNEZ GUTIÉRREZ, JOSÉ RIGOBERTO.
CIUDAD UNIVERSITARIA DE ORIENTE, NOVIEMBRE DEL 2017

ÍNDICE
Contenido Pág.
PARTE I: INVESTIGACIÓN BIBLIOGRÁFICA ................................................................................................. 1

1. ANÁLISIS DE REGRESIÓN .................................................................................................................... 1
a. Desarrollo del modelo: Mínimos Cuadrados Ordinarios .................................................... 1
b. Supuestos del modelo..................................................................................................................... 2
c. Error Estándar de estimación ........................................................................................................ 3
d. Pruebas Inferenciales ....................................................................................................................... 4
2. ANÁLISIS DE CORRELACIÓN ............................................................................................................. 6
a) Coeficiente de correlación: ............................................................................................................ 6
b) Coeficiente de determinación ...................................................................................................... 7
c) Prueba de hipótesis para correlación. ....................................................................................... 8
PARTE II: SOLUCIÓN DE EJERCICIOS. ........................................................................................................... 9
PARTE I: INVESTIGACIÓN BIBLIOGRÁFICA
1. ANÁLISIS DE REGRESIÓN
a. Desarrollo del modelo: Mínimos Cuadrados Ordinarios
Procedimiento.
De acuerdo con Hanke y Wichern (2006) el procedimiento consiste en minimizar la
suma de los cuadrados de las distancias verticales entre los valores de los datos y los
de la regresión estimada, es decir, minimizar la suma de los residuos al cuadrado,
teniendo como residuo la diferencia entre los datos observados y los valores del
modelo (línea).
Dado un conjunto de n parejas (xi, yi) de datos, se debe de encontrar la ecuación de
la recta y=ax + b que pasa lo más cerca posible de los puntos experimentales (de
forma que éstos estén repartidos uniformemente alrededor de la recta).
El método del ajuste por mínimos cuadrados o regresión lineal permite obtener la
pendiente a de la recta y la ordenada b en el origen, correspondientes a la recta

y= ax+b que mejor se ajusta a los n datos (xi, yi), es decir, permite establecer una
relación funcional entre dos variables; donde x es la variable independiente e y es la

variable dependiente. En otras palabras y depende de x, en donde y y x son dos
variables cualesquiera.
En el modelo de regresión simple es una función de sólo una variable independiente,
razón por la cual se le denomina Regresión Bivariada porque sólo de la siguiente

forma hay dos variables, una dependiente y otra independiente y se representa:
Y= 1(x) Se dice que “Y está relacionada a X o que está regresando por X”
La variable dependiente es la variable que se desea explicar, predecir. También se le

llama REGRESANDO o VARIABLE DE RESPUESTA. La variable independiente x se le
1
denomina VARIABLE EXPLICATIVA o REGRESOR y se le utiliza para explicar la variable
dependiente.
La fórmula de la recta toma la siguiente ecuación:
Y=a + bx +E
Dónde:
a: Es el valor de la ordenada donde la línea de regresión se intercepta con el eje
Y: En otras palabras, el origen de la recta.
b: Es el coeficiente de regresión de los datos (pendiente de la línea).
E: Es el error o residuo entre las observaciones y el modelo.
Al minimizar los residuales cuadrados:
• La suma de los residuales del modelo de mínimos cuadrados ordinarios será
igual a cero.
• Por ende, la media muestral de los residuales será cero también.

• La covarianza muestral entre las variables explicativas y los residuales será
cero.
• La línea de regresión de MCO siempre cruzará la media de la muestra, ie, la
media de x y la media de y.
b. Supuestos del modelo
Supuesto 1: El término del error e es una variable aleatoria distribuida normalmente.

Supuesto 2: Varianzas iguales de los valores Y.
Supuesto 3: Los términos de error son independientes uno del otro.
Supuesto 4: El supuesto de no linealidad.
2
1. El modelo es lineal en los parámetros (los betas).
2. Las variables explicativas toma valores fijos en muestreo repetitivo.
3. Los términos de error son independientes. La esperanza del error es nula es de decir, no
hay auto correlaciones en los errores, es decir que la esperanza de las covarianzas entre
los errores es nula para todo.
4. Homocedasticidad: que significa que la varianza de los errores es constante.
Var(u) =σ2Inxn
5. El modelo está correctamente especificado.
6. No hay relación lineal perfecta entre las variables explicativas.
7. El número de observaciones es mayor que los parámetros estimados.
8. Los errores “e” siguen distribución normal. (0, σ). Es decir, media cero y varianza
constante.
9. Las Variables explicativas “X” son exógenas.
10. Variabilidad de los errores en la regresión lineal:
• Variabilidad total: Sumatoria de los cuadrados totales.
• Variabilidad explicada: Sumatoria de los cuadrados de errores
• Variabilidad no explicada: Sumatoria de los cuadrados de la regresión
c. Error Estándar de estimación
El error estándar es una medida que indica qué tan preciso es el pronóstico de y con
base en x o, por el contrario, cuán inexacta podría ser la predicción.
El error estándar de la estimación se refiere a que no todos los puntos coinciden o

están en la línea de regresión, de lo contrario, la predicción sería perfecta y eso, es
imposible.
El error estándar de estimación se calcula mediante la siguiente fórmula:
𝑆𝑒 = √𝐶𝑀𝐸
Donde:
𝑆𝐶𝐸
𝐶𝑀𝐸 =
𝑛−2
(𝑆𝐶𝑥𝑦)2
𝑆𝐶𝐸 = 𝑆𝐶𝑦 −
𝑆𝐶𝑥
3
d. Pruebas Inferenciales
i) Prueba de hipótesis
Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar
una afirmación acerca de una población dependiendo de la evidencia proporcionada
por una muestra de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se

probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o
"no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder

concluir que es verdadero de acuerdo con la evidencia proporcionada por los datos
de la muestra.
Con base en los datos de muestra, la prueba determina si se puede rechazar la

hipótesis nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor
que el nivel de significancia (denotado como α o alfa), entonces puede rechazar la

hipótesis nula.
Un error común de percepción es que las pruebas estadísticas de hipótesis están
diseñadas para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar
una prueba de hipótesis, establecemos la hipótesis nula como lo que queremos
desaprobar. Puesto que establecemos el nivel de significancia para que sea pequeño
antes del análisis (por lo general, un valor de 0.05 funciona adecuadamente), cuando
rechazamos la hipótesis nula, tenemos prueba estadística de que la alternativa es

verdadera. En cambio, si no podemos rechazar la hipótesis nula, no tenemos prueba
estadística de que la hipótesis nula sea verdadera. Esto se debe a que no

establecimos la probabilidad de aceptar equivocadamente la hipótesis nula para que
fuera pequeña.
4
ii) Intervalos de confianza
Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la

muestra, que posiblemente incluya el valor de un parámetro de población
desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras

de una población en particular produzcan intervalos de confianza idénticos. Sin
embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje de
los intervalos de confianza resultantes incluiría el parámetro de población

desconocido.
Margen de error
Cuando usted utiliza estadísticos para estimar un valor, es importante recordar que,
sin importar lo bien que esté diseñado su estudio, su estimación está sujeta a error
de muestreo aleatorio. El margen de error cuantifica este error e indica la precisión

de la estimación. Usted probablemente ya entiende el margen de error, porque está
relacionado con los resultados de las encuestas. Por ejemplo, una encuesta política
podría indicar que el nivel de popularidad de un candidato es de 55% con un margen
de error de 5%. Esto significa que el nivel de popularidad real es +/- 5% y, por lo
tanto, se ubica entre 50% y 60%.
Para un intervalo de confianza bilateral, el margen de error es la distancia desde el
estadístico estimado hasta cada el valor del intervalo de confianza. Cuando un

intervalo de confianza es simétrico, el margen de error es la mitad del ancho del
intervalo de confianza. Por ejemplo, la longitud media estimada de un árbol de levas

es 600 mm y el intervalo de confianza oscila entre 599 y 601. El margen de error es
1.
Mientras mayor sea el margen de error, más ancho será el intervalo y menos seguro
podrá estar usted del valor de la estimación de punto.
5
2. ANÁLISIS DE CORRELACIÓN
a) Coeficiente de correlación:
Si entre dos variables cuantitativas existe una relación lineal, el análisis de correlación
lineal simple se usa para determinar la dirección y la magnitud de dicha relación. La
dirección de la relación se refiere a si ésta es positiva o negativa. La magnitud de la

relación o grado de relación entre las variables se refiere a la fuerza de la relación
que existe entre las variables. Se trata de expresar cuantitativamente el grado de

relación que existe entre las variables en estudio.
Coeficiente de Correlación: expresa de manera cuantitativa el grado y la dirección
de la relación entre dos variables.
Coeficiente de correlación r de Pearson (rxy): Se usa cuando los datos están
medidos en una escala de intervalo o de razón. Cuando se estudia la relación entre

dos variables en escala de intervalo (o de razón), es usual comenzar con un diagrama
de dispersión. Este procedimiento proporciona una representación visual de la

relación entre las variables. El siguiente paso suele ser calcular el coeficiente de
correlación, que brinda una medida cuantitativa de la fuerza de la relación entre dos
variables.
El coeficiente de correlación, creado por Karl Pearson alrededor de 1900, describe la

fuerza de la relación entre dos conjuntos de variables en escala de intervalo o de
razón. Se designa con la letra r, y con frecuencia se le conoce como r de Pearson y
coeficiente de correlación producto-momento. Puede adoptar cualquier valor de -

1.00 a 1.00, inclusive. Un coeficiente de correlación de -1.00 o bien de 1.00 indica
una correlación perfecta. Por ejemplo, un coeficiente de correlación para el caso

anterior calculado a 1.00 indicaría que el número de llamadas de ventas y la cantidad
de copiadoras que vende cada representante están perfectamente relacionados en
un sentido lineal positivo. Un valor calculado de -1.00 revela que las llamadas de
6
ventas y el número de copiadoras vendidas están perfectamente relacionados en un
sentido lineal inverso.

En la gráfica siguiente se muestra cómo aparecería el diagrama de dispersión si la
relación entre los dos conjuntos de datos fuera lineal y perfecta.
Las características del coeficiente de correlación se resumen a continuación.
CARACTERÍSTICAS DEL COEFICIENTE DE CORRELACIÓN

1. El coeficiente de correlación de la muestra se identifica con la letra minúscula r.
2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables en escala
de intervalo o en escala de razón.
3. Varía de -1 hasta 1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las variables.
5. Un valor cercano a 1 indica una asociación directa o positiva entre las variables.
6. Un valor cercano a 1 indica una asociación inversa o negativa entre las variables.
b) Coeficiente de determinación
La bondad de la predicción depende de la relación entre las variables. Si dos variables

no covarían, no podremos hacer predicciones válidas, y si la intensidad de la
covariación es moderada, las predicciones no serán demasiado buenas. En

consecuencia, hay que disponer de alguna medida de la capacidad de la ecuación
7
de Regresión para obtener predicciones buenas (en el sentido de que sean lo menos
erróneas posible).
Esta medida es el Coeficiente de Determinación, que es el cuadrado del coeficiente
de correlación de Spearman, y da la proporción de variación de la variable Y que es

explicada por la variable X (variable predictora o explicativa). Si la proporción es igual
a 0, significa que la variable predictora no tiene nula capacidad predictiva de la

variable a predecir (Y). Cuanto mayor sea la proporción, mejor será la predicción. Si
llegara a ser igual a 1 la variable predictora explicaría toda la variación de Y, y las

predicciones no tendrían error.
Para determinarlo no es más que el cuadrado del coeficiente de correlación que es
este:
c) Prueba de hipótesis para correlación.
Gran parte del trabajo realizado para probar las inferencias sobre el coeficiente de
regresion puede aplicarse el coeficiente de correlacion. El proposito y los

fundamentos son muy similares. Puede ser que la correlacion a nivel poblacional sea
cero y que una muestra engañosa hizo que se asumiera equivocadamente una
relación. Por consiguiente se debe probar la hipotesis.
Ho: p=0
Ha: p ≠ 0
En donde p es el coeficiente de correlación a nivel poblacional. De nuevo se utiliza

la prueba t.
8
𝑟−𝑝
𝑡=
𝑆𝑟
En donde Sr es el error estándar del coeficiente de correlación y puede hallarse así:
1−𝑟ˆ2
𝑆𝑟 = √
𝑛−2
PARTE II: SOLUCIÓN DE EJERCICIOS.

Un economista del Departamento de Recursos Humanos de Florida State está preparando
un estudio sobre el comportamiento del consumidor. El recolecto los datos que aparecen
en miles de dólares para determinar si existe una relación entre el ingreso del consumidor y
los niveles del consumo.
Consumidor 1 2 3 4 5 6 7 8 9 10 11 12
Ingreso 24.3 12.5 31.2 28.0 35.1 10.5 23.2 10.0 8.5 15.9 14.7 15
Consumo 16.2 8.5 15 17 24.2 11.2 15 7.1 3.5 11.5 10.7 9.2
Consumidor Consumo(Y) XY X^2 Y^2

Ingreso(X)
1 24.3 16.2 393.66 590.49 262.44
2 12.5 8.5 106.25 156.25 72.25
3 31.2 15 468 973.44 225
4 28 17 476 784 289
5 35.1 24.2 849.42 1232.01 585.64
6 10.5 11.2 117.6 110.25 125.44
7 23.2 15 348 538.24 225
8 10 7.1 71 100 50.41
9 8.5 3.5 29.75 72.25 12.25
10 15.9 11.5 182.85 252.81 132.25
11 14.7 10.7 157.29 216.09 114.49
12 15 9.2 138 225 84.64
Sumatorias 228.9 149.1 3337.82 5250.83 2178.81
Promedios 19.075 12.425
9
a) Haga un diagrama de dispersión para los datos.
Diagrama de Dispersión
30
25
Consumo (Y)
20
15
10
0
0 5 10 15 20 25 30 35 40
Ingreso (X)
b) Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la

relación entre el consumo y el ingreso? ¿Qué proporción de cada dólar adicional
que se gana se invierte en consumo?
Tenemos los promedios de X e Y que los obtuvimos de la tabla anterior
̿ = 𝟏𝟗. 𝟎𝟕𝟓
𝐗
̿ = 𝟏𝟐. 𝟒𝟐𝟓
𝐘
Ahora determinamos la suma de cuadrados para x
(∑ 𝑋)2
𝑆𝐶𝑥 = ∑ 𝑋 2 −
𝑛
(288.9)2
𝑆𝐶𝑥 = 5250.83 −
12
𝑺𝑪𝒙 = 𝟖𝟖𝟒. 𝟓𝟔𝟐𝟓
Ahora determinamos la suma de cuadrados para y
(∑ 𝑌)2
𝑆𝐶𝑦 = ∑ 𝑌 2 −
𝑛
(149.1)2
𝑆𝐶𝑦 = 2178.81 −
12
𝑺𝑪𝒚 = 𝟑𝟐𝟔. 𝟐𝟒𝟐𝟓
Ahora determinamos la suma de productos cruzados.
(∑ 𝑋)(∑ 𝑌)
𝑆𝐶𝑥𝑦 = ∑ 𝑋𝑌 −
𝑛
10
(228.9)(149.1)
𝑆𝐶𝑥𝑦 = 3337.82 −
12
𝑺𝑪𝒙𝒚 = 𝟒𝟗𝟑. 𝟕𝟑𝟕𝟓
Calculamos el coeficiente de regresión.

𝑆𝐶𝑥𝑦
𝑎=
𝑆𝐶𝑥
493.7375
𝑎=
884.5625
𝒂 = 𝟎. 𝟓𝟓𝟖𝟏𝟕𝟏𝟒𝟏𝟐
Calculamos el intercepto que es el valor de Y cuando X es igual a 0

̅ − 𝑎X
𝑏0 = Y ̅
𝑏0 = 12.425 − (0.558171412)19.075
𝒃𝟎 = 𝟏. 𝟕𝟕𝟕𝟖𝟖𝟎𝟑𝟏𝟔
Para lo que este sería el modelo de regresión.

̂ = 𝟏. 𝟕𝟕𝟕𝟖𝟖𝟎𝟑𝟏𝟔 + 𝟎. 𝟓𝟓𝟖𝟏𝟕𝟏𝟒𝟏𝟐𝐗
𝐘
Lo que significa la proporción por cada dólar de ingreso que tenga. El coeficiente de
regresión significa que, por cada incremento de una unidad en X, Y aumentara en
$0.558171412.
c) Que consumo pronosticaría el modelo para alguien que gana $27,500
Y = 𝑏0 + 𝑏1 𝑥
̂ = 1.777880316 + 0.558171412X
Y
̂ = 1.777880316 + 0.558171412(27,500)
Y
̂ =15,351.49171 sería el consumo para alguien que gana $27,500.

𝐘
11
d) ¿Cuál es el error estándar de estimación para el departamento de Recursos
Humanos de Florida State? ¿Cómo interpretaría los resultados? Utilice una
gráfica.
Para calcular el error estándar de estimación primero tenemos que conocer la suma de
cuadrados de error.
(𝑆𝐶𝑥𝑦)2
𝑆𝐶𝐸 = 𝑆𝐶𝑦 −
𝑆𝐶𝑥
(493.7375)2
𝑆𝐶𝐸 = 326.2425 −
884,5625
243776.7189
𝑆𝐶𝐸 = 326.2425 −
884.5625
𝑆𝐶𝐸 = 326.2425 − 275.5901577
𝑺𝑪𝑬 = 𝟓𝟎. 𝟔𝟓𝟐𝟑𝟒𝟐𝟐𝟔
Luego determinamos el cuadrado medio error.

𝑆𝐶𝐸
𝐶𝑀𝐸 =
𝑛−2
50.65234226
𝐶𝑀𝐸 =
12 − 2
𝑪𝑴𝑬 = 𝟓. 𝟎𝟔𝟓𝟐𝟑𝟒𝟐𝟐𝟔
Y así calcular el error estándar de estimación.
𝑆𝑒 = √𝐶𝑀𝐸
𝑆𝑒 = √5.065234226
Error Estándar = 𝑺𝒆 = 𝟐. 𝟐𝟓𝟎𝟔𝟎𝟕𝟓𝟐𝟒
Por lo que entre más dispersos estén los datos más grandes será el valor del error estándar
de estimación, en este caso vemos que los datos no están en la misma recta por lo que
asumimos que hay una dispersión y es por eso nuestro valor del error estándar que se aleja
de cero.
12
Consumo(Y) Linear (Consumo(Y)) Ƴ= 1.777880316+0558171412X
30
25
20
CONSUMO (Y)
15
10
0
0 5 10 15 20 25 30 35 40
INGRESO (X)
e) Calcule e interprete el coeficiente de correlación y el coeficiente de

determinación para el Departamento de Recursos Humanos de Florida State.
𝑆𝐶𝑥𝑦
𝑟=
√(𝑆𝐶𝑥)(𝑆𝐶𝑦)
493.7375
𝑟=
√(884.5625)(326.2425)
𝑟 = 0.919097497
Al obtener un coeficiente positivo y que este cerca de decimos que existe una
relación directamente proporcional en relación del ingreso con el consumo.
Coeficiente de determinación no es más que el cuadrado del coeficiente de
correlación.
𝑟˄2 = (0.919097497)˄2
r˄2 =0.844740209
Esto establece que el 84.47% del cambio en el consumo se explica mediante un

cambio en el ingreso.
13
f) ¿La relación entre el ingreso y el consumo es significativa? Pruebe la
hipótesis a un nivel de significancia del 1%. Asegúrese de mostrar los
diferentes pasos. Compárela con su prueba para .
Para β1
𝐻0 : β = 0
𝐻𝐴 : β ≠ 0
𝑏−𝛽
𝑡=
𝑆𝑏
0.5581 − 0
𝑡=
0.075672019
𝒕 = 𝟕. 𝟑𝟕𝟓𝟐𝟒𝟗𝟐𝟑𝟐
𝑆𝑒
𝑆𝑏 =
√𝑆𝐶𝑥
2.250607524
𝑆𝑏 =
√884.5625
𝑺𝒃 = 𝟎. 𝟎𝟕𝟓𝟔𝟕𝟐𝟎𝟓
Hallamos t con un valor 𝛼 = 0.01 n-2 grados de libertad

𝑡(0,01,10) = ±3.169
Regla de decisión:
No rechazar Ho si −3.169 ≤ 𝑡 ≤ 3.169
Rechazar Ho si −3.169 ≥ 𝑡 ≥ 3.169
Debido a que 𝑡 = 7.376189878 no se encuentra en el intervalo de -3.169 a 3.169

rechazamos la hipótesis nula y determinamos con un 99% de seguridad de que existe
una relación significativa entre consumo e ingreso.
14
Para P
𝐻0 :  = 0
𝐻𝐴 :  ≠ 0
𝑟−𝑝
𝑡=
𝑆𝑟
0.919097497 − 0
𝑡=
0.124603286
𝒕 = 𝟕. 𝟑𝟕𝟔𝟏𝟖𝟗𝟖𝟕𝟖
1 − 0.844740209
𝑆𝑟 = √
12 − 2
0.155259791
𝑆𝑟 = √
10
𝑆𝑟 = √0.015525979
𝑺𝒓 = 𝟎. 𝟏𝟐𝟒𝟔𝟎𝟑𝟐𝟖𝟔
Hallamos t con un valor 𝛼 = 0.01 n-2 grados de libertad

𝑡(0,01,10) = ±3.169
Regla de decisión:
No rechazar Ho si −3.169 ≤ 𝑡 ≤ 3.169
Rechazar Ho si −3.169 ≥ 𝑡 ≥ 3.169
Debido a que 𝑡 = 7.376189878 rechazamos la hipótesis nula y determinamos que

existe una relación significativa.
g) Si el economista identifica un consumidor con un ingreso de $14,500 ¿Cuál es

la estimación puntual de su consumo? ¿Cuál es el estimado por intervalo del
99% de su consumo?
1 (𝑋𝑖 − 𝑋̅)2
𝑆𝑦 = 𝑆𝑒√ +
𝑛 𝑆𝐶𝑥
𝑋𝑖 = 14,500/1000
𝑋𝑖 = 14.50
15
1 (14.5 − 19.075)2
𝑆𝑦 = 2.250607524√ +
12 884.5265
1 (−4.575)2
𝑆𝑦 = 2.250607524√ +
12 884.5265
1 20.930625
𝑆𝑦 = 2.250607524√ +
12 884.5265
1
𝑆𝑦 = 2.250607524√ + 0.023663084
12
𝑆𝑦 = 2.250607524√0.106996417
𝑆𝑦 = 2.250607524(0.327103067)
𝑺𝒚 = 𝟎. 𝟕𝟑𝟔𝟏𝟖𝟎𝟔𝟐𝟑
̂ = 1.777880316 + 0.558171412X
b) Y
̂ = 1.777880316 + 0.558171412(14.5)
Y
̂ = 𝟗. 𝟖𝟕𝟏𝟑𝟔𝟓𝟕𝟗
𝐘
𝐼. 𝐶 𝑝𝑎𝑟𝑎 𝑌𝑥 = 𝑌⏞1 ± 𝑡. 𝑆𝑦
𝐼. 𝐶 𝑝𝑎𝑟𝑎 𝑌𝑥 = 9.87136579 ± 3.169 ∗ 0.736180623

𝐼. 𝐶 𝑝𝑎𝑟𝑎 𝑌𝑥 = 9.87136579 ± 2.332956394
𝟕. 𝟓𝟑 ≤ 𝒀𝒙 ≤ 𝟏𝟐. 𝟐𝟎
El economista del Depto. De RR. HH. Puede estar un 99% seguro de que la media del
consumo de muchas personas con ingresos de $14,500 estaría entre $7,538 y $12,204.
16

Estadística Inferencial Aplicada

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística Inferencial Aplicada

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE EL SALVADOR

FACULTAD MULTIDISCIPLINARIA ORIENTAL

DEPARTAMENTO DE CIENCIAS NATURALES Y MATEMÁTICA

CICLO LECTIVO: II-2017

DOCENTE: LCDA. MEIBY SULEMA RIVERA VÁSQUEZ.

CIUDAD UNIVERSITARIA DE ORIENTE, NOVIEMBRE DEL 2017

PARTE I: INVESTIGACIÓN BIBLIOGRÁFICA ................................................................................................. 1

De acuerdo con Hanke y Wichern (2006) el procedimiento consiste en minimizar la

Dado un conjunto de n parejas (xi, yi) de datos, se debe de encontrar la ecuación de

pendiente a de la recta y la ordenada b en el origen, correspondientes a la recta

relación funcional entre dos variables; donde x es la variable independiente e y es la

En el modelo de regresión simple es una función de sólo una variable independiente,

razón por la cual se le denomina Regresión Bivariada porque sólo de la siguiente

Y= 1(x) Se dice que “Y está relacionada a X o que está regresando por X”

La variable dependiente es la variable que se desea explicar, predecir. También se le

La fórmula de la recta toma la siguiente ecuación:

a: Es el valor de la ordenada donde la línea de regresión se intercepta con el eje

Y: En otras palabras, el origen de la recta.

b: Es el coeficiente de regresión de los datos (pendiente de la línea).

E: Es el error o residuo entre las observaciones y el modelo.

Al minimizar los residuales cuadrados:

• La suma de los residuales del modelo de mínimos cuadrados ordinarios será

• Por ende, la media muestral de los residuales será cero también.

b. Supuestos del modelo

Supuesto 1: El término del error e es una variable aleatoria distribuida normalmente.

c. Error Estándar de estimación

base en x o, por el contrario, cuán inexacta podría ser la predicción.

El error estándar de la estimación se refiere a que no todos los puntos coinciden o

El error estándar de estimación se calcula mediante la siguiente fórmula:

por una muestra de datos.

hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se

"no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder

Con base en los datos de muestra, la prueba determina si se puede rechazar la

que el nivel de significancia (denotado como α o alfa), entonces puede rechazar la

Un error común de percepción es que las pruebas estadísticas de hipótesis están

rechazamos la hipótesis nula, tenemos prueba estadística de que la alternativa es

estadística de que la hipótesis nula sea verdadera. Esto se debe a que no

Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la

desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras

embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje de

los intervalos de confianza resultantes incluiría el parámetro de población

de muestreo aleatorio. El margen de error cuantifica este error e indica la precisión

Para un intervalo de confianza bilateral, el margen de error es la distancia desde el

estadístico estimado hasta cada el valor del intervalo de confianza. Cuando un

intervalo de confianza. Por ejemplo, la longitud media estimada de un árbol de levas

dirección de la relación se refiere a si ésta es positiva o negativa. La magnitud de la

que existe entre las variables. Se trata de expresar cuantitativamente el grado de

Coeficiente de Correlación: expresa de manera cuantitativa el grado y la dirección

de la relación entre dos variables.

Coeficiente de correlación r de Pearson (rxy): Se usa cuando los datos están

medidos en una escala de intervalo o de razón. Cuando se estudia la relación entre

de dispersión. Este procedimiento proporciona una representación visual de la

El coeficiente de correlación, creado por Karl Pearson alrededor de 1900, describe la

coeficiente de correlación producto-momento. Puede adoptar cualquier valor de -

una correlación perfecta. Por ejemplo, un coeficiente de correlación para el caso

sentido lineal inverso.

relación entre los dos conjuntos de datos fuera lineal y perfecta.

Las características del coeficiente de correlación se resumen a continuación.

CARACTERÍSTICAS DEL COEFICIENTE DE CORRELACIÓN

La bondad de la predicción depende de la relación entre las variables. Si dos variables

covariación es moderada, las predicciones no serán demasiado buenas. En

Esta medida es el Coeficiente de Determinación, que es el cuadrado del coeficiente

de correlación de Spearman, y da la proporción de variación de la variable Y que es