Está en la página 1de 27

UNIVERSIDAD DE CUE

REGRESION LINEAL SIMPLE

DOCENTE: ING. EDGAR BECERRA.

ASIGNATURA: ESTADISTICA IV.

INTEGRANTES:
- ALEXANDRA FERNANDEZ.
- DAMIAN GUACHICHULLCA.
- CRISTINA GUAMAN.
- FERNANDA MENDEZ.
- LEODANY ZARUMA.

CURSO: AE-04-02.
SEMESTRE:
SEPTIEMBRE 2016/ FEBRERO 2017.

P a g e 0 | 27
Tabla de Contenidos

INTRODUCCIÓN...................................................................................................................2
OBJETIVO GENERAL..........................................................................................................3
OBJETIVOS ESPECIFICOS.......................................................................................................3
ALCANCE...............................................................................................................................4
CONTENIDO Y ANALISIS...................................................................................................5
PRESENTACIÓN DE LA INFORMACIÓN:....................................................................5
DATOS....................................................................................................................................5
CALCULOS REALIZADOS MEDIANTE SOFTWARE...................................................16
PRUEBA DE IMPORTANCIA DEL COEFICIENTE DE CORRELACION (r)...............17
PRUEBA DE LA SIGNIFICANCIA DE LA PENDIENTE.................................................19
GRAFICO DEL DIAGRAMA DE DISPERSION Y LA RECTA DE REGRESION........21
INTERVALOS DE CONFIANZA Y DE PREDICCION....................................................21
RELACION ENTRE EL COEFICIENTE DE CORRELACION, EL COEFICIENTE DE DETERMINACION Y
EL ERROR ESTANDAR DE ESTIMACION...................................................................................22
TABLA ANOVA DE REGRESION.....................................................................................22
CONCLUSIONES................................................................................................................23
BIBLIOGRAFIA....................................................................................................................25

1
INTRODUCCIÓN

En el presente trabajo se aplicara todos los conceptos teóricos discutidos en


clase respecto a regresión lineal, el cual engloba conceptos de: principios de
mínimos cuadrados, el trazo de una recta de regresión, pruebas de
significancia de la pendiente, cálculos de coeficientes (correlación y
determinación) entre otros, para ello se planteara y resolverá un ejercicio para
el cual nos hemos ayudado de una base de datos, y mediante la misma poder
explicar cuál es la relación que existe entre ingresos per cápita que definimos
como variable dependiente (Y) y el nivel de instrucción que definimos como
variable independiente (X). Como último punto acotamos que mediante la
realización de este trabajo aplicaremos los conceptos aprendidos en clase a la
práctica diaria.

2
OBJETIVO GENERAL

 Poner en práctica los conocimientos teóricos adquiridos en estadística


utilizando herramientas informáticas como IBM ESTADISTIC SPSS o
Excel aplicando ejercicios de carácter económico.

OBJETIVOS ESPECIFICOS

 Planteamiento y desarrollo de un problema de regresión lineal simple en


base a temas actuales.
 Conocer la relación que existe el nivel de instrucción de las personas y
los ingresos per cápita que estas perciben.
 Analizar e interpretar los resultados generales del ejercicio.

3
ALCANCE

El presente trabajo tiene por objeto en primer lugar poder aplicar los
conocimientos teóricos de regresión lineal simple y más adelante regresión
múltiple que han sido adquiridos en clase para ello nos ayudaremos de una
base de datos; la misma que resume la encuesta nacional de empleo,
desempleo y subempleo que existe en el país de esta hemos tomado dos
variables: Nivel de Instrucción, como variable independiente e Ingresos per
cápita, como variable dependiente. Para proceder con el estudio del
comportamiento de estas variables nos hemos planteado hipótesis las mismas
que nos servirán para hacer pruebas sujetas a verificación con el objetivo de:

 Comprobar si entre ellas existe o no una correlación; en el caso de que


existe determinar qué tipo de relación tendrán: directa o inversa; además
de si esta correlación es débil, moderada o fuerte.
 También pretendemos explicar la proporción del cambio aproximado que
sufre el ingreso per cápita que percibe una persona según sea su nivel
de instrucción.
 A más de esto aplicaremos la prueba de la pendiente para determinar
cuan significativa es esta y verificar si las variables que estudiamos son
estimadores confiables.
 Además, también agregaremos a nuestro el cálculo de intervalos de
confianza y predicción; los mismos que servirán de apoyo para sostener
los argumentos que planteamos en las pruebas de hipótesis que
realizaremos.

Finalmente, luego de haber efectuado las pruebas respectivas procederemos a


la toma de decisiones y a la interpretación de los resultados arrojados por
dichas pruebas. Todo esto con la finalidad de definir claramente si el estudio
que hemos realizado comprueba la existencia de una relación entre el nivel de
instrucción y los ingresos per cápita que es lo que inicialmente nos habíamos
planteado.

4
CONTENIDO Y ANALISIS

PRESENTACIÓN DE LA INFORMACIÓN:
A continuación, se detalla los datos observados, los cuales hemos obtenido del
Instituto Nacional de Estadísticas y Censos (INEC). Dicha información es una
base de datos sobre la Encuesta Nacional de Empleo, Desempleo y
Subempleo de la cual hemos tomado las siguientes variables: el Nivel de
Instrucción (X) y los Ingresos per cápita (Y).

DATOS

Ingres
Nivel de os per 18 5 73
Encuesta instrucc cápita 19 5 73
dos ión (X) (y) 20 6 22
1 4 113 21 4 22
2 9 113 22 1 22
3 7 113 23 4 22
4 4 115 24 6 225
5 6 115 25 9 225
6 6 166 26 5 225
7 6 166 27 5 225
8 7 166 28 5 200
9 5 166 29 4 60
10 4 54 30 6 60
11 4 54 31 5 60
12 5 54 32 1 60
13 5 54 33 4 170
14 4 30 34 4 187
15 1 73 35 4 187
16 4 73 36 4 187
17 5 73 37 4 127

5
38 4 127 69 4 64
39 6 75 70 4 64
40 6 75 71 4 64
41 5 75 72 4 64
Encuesta 73 4 64
dos N.I (X) I.C (Y) 74 5 64
42 4 29 75 1 64
43 1 29 76 9 440
44 6 80 77 5 440
45 4 126 78 5 440
46 4 126 79 6 30
47 4 126 80 9 30
48 4 44 81 7 30
49 6 44 82 5 30
50 5 44 83 5 30
51 5 44 84 6 124
52 4 44 Encuesta
53 4 37 dos X Y
54 7 37 85 6 124
55 5 37 86 9 328
56 4 75 87 5 328
57 4 75 88 5 328
58 4 75 89 5 328
59 4 75 90 1 786
60 4 75 91 6 786
61 5 75 92 5 786
62 5 75 93 5 786
63 6 133 94 5 64
64 6 133 95 5 64
65 5 133 96 5 64
66 6 260 97 5 64
67 9 260 98 4 155
68 4 64 99 4 155

6
100 6 108 131 9 248
101 1 108 132 5 248
102 5 108 133 4 100
103 9 108 134 7 100
104 5 108 135 5 100
105 6 108 136 1 40
106 6 170 137 4 90
107 6 170 138 5 90
108 5 170 139 4 259
109 5 170 140 4 259
110 5 170 141 6 259
111 4 309 142 4 174
112 4 309 143 6 174
113 6 600 144 9 174
114 4 11 145 7 174
115 4 11 146 5 174
116 5 11 147 9 116
117 5 11 148 9 116
118 5 11 149 5 116
119 5 11 150 4 110
120 5 11 151 4 110
121 5 11 152 5 110
122 1 30 153 4 110
123 9 226 154 4 72
124 5 226 155 4 72
125 5 226 156 5 72
126 4 164 157 5 72
127 4 164 158 5 72
128 4 164 159 4 24
Encuesta 160 7 24
dos X Y 161 7 24
129 5 164 162 7 24
130 5 164 163 5 24

7
164 5 24 195 5 98
165 5 24 196 5 98
166 1 15 197 4 214
167 1 15 198 4 214
168 6 131 199 6 214
169 9 131 200 9 214
170 9 131 201 9 214
171 6 168 202 1 214
172 4 168 203 4 139
Encuesta 204 9 139
dos X Y 205 5 139
173 6 168 206 4 139
174 5 168 207 5 139
175 4 115 208 4 154
176 4 115 209 4 154
177 6 115 210 6 154
178 5 115 211 5 154
179 4 143 212 4 15
180 4 143 213 4 15
181 9 143 214 4 15
182 9 143 215 5 15
183 6 211 216 5 15
184 4 211 Encuesta
185 7 211 dos X Y
186 5 211 217 5 15
187 4 673 218 6 203
188 4 96 219 6 203
189 4 96 220 5 203
190 9 96 221 6 83
191 6 96 222 7 83
192 7 96 223 7 83
193 6 98 224 4 775
194 6 98 225 4 775

8
226 6 60 259 4 105
227 6 60 260 4 105
228 4 64 Encuesta
229 4 64 dos X Y
230 5 64 261 5 105
231 5 64 262 5 105
232 4 96 263 5 105
233 4 96 264 9 253
234 6 96 265 8 253
235 4 20 266 5 253
236 4 20 267 4 261
237 4 94 268 6 261
238 4 94 269 9 261
239 6 94 270 9 261
240 7 94 271 6 99
241 5 94 272 9 99
242 4 35 273 6 99
243 1 40 274 5 99
244 9 352 275 4 37
245 9 352 276 4 37
246 5 352 277 6 37
247 5 352 278 6 37
248 4 278 279 5 37
249 7 278 280 5 37
250 4 440 281 5 37
251 6 440 282 5 37
252 4 440 283 4 37
253 9 213 284 4 80
254 6 213 285 1 80
255 5 213 286 4 48
256 5 213 287 4 48
257 6 87 288 5 48
258 4 87 289 5 48

9
290 5 48 321 6 162
291 5 48 322 9 162
292 5 48 323 6 162
293 1 48 324 5 162
294 4 137 325 6 75
295 2 137 326 4 75
296 9 137 327 5 75
297 9 137 328 5 75
298 9 137 329 5 75
299 7 137 330 4 169
300 4 83 331 4 169
301 7 83 332 4 169
302 5 83 333 6 169
303 1 55 334 6 169
304 1 55 335 4 75
Encuesta 336 5 75
dos X Y 337 4 5
305 4 55 338 4 5
306 4 55 339 6 68
307 4 55 340 6 68
308 5 55 341 5 68
309 4 122 342 6 217
310 1 122 343 6 217
311 6 122 344 5 217
312 6 122 345 4 333
313 6 122 346 4 333
314 4 122 347 5 333
315 1 84 348 9 80
316 6 84 349 6 80
317 6 84 350 6 170
318 5 84 351 9 170
319 5 84 352 5 170
320 6 162 353 6 170

10
354 6 170 387 4 198
355 5 170 388 6 90
356 5 170 389 6 90
357 6 143 390 5 90
358 6 143 391 5 90
359 7 143 392 4 200
360 5 143 393 4 200
361 4 425 394 8 191
362 6 425 395 6 191
363 6 59 396 9 191
364 6 59 397 9 191
365 1 59 398 9 191
366 4 165 399 4 72
367 6 165 400 4 72
368 6 165 401 4 72
369 9 141 402 4 72
370 6 141 403 5 72
371 5 141 404 6 72
372 5 141 405 6 72
373 1 141 406 5 72
374 4 705 407 5 72
375 7 705 408 1 92
376 5 705 409 4 92
377 5 705 410 4 92
378 9 275 411 4 92
379 6 275 412 6 92
380 6 275 413 1 92
381 5 275 414 6 204
382 4 40 415 6 204
383 4 49 416 6 204
384 4 49 417 6 204
385 9 49 418 9 204
386 4 198 419 7 204

11
420 4 60 451 6 240
421 4 60 452 9 240
422 9 60 453 6 200
423 9 60 454 6 200
424 6 60 455 5 200
425 7 60 456 5 200
426 5 60 457 9 395
427 6 105 458 9 395
428 6 105 459 5 395
429 4 105 460 6 250
430 1 62 461 6 250
431 4 62 462 5 250
432 4 62 463 6 114
433 7 62 464 6 114
434 5 62 465 5 114
435 6 186 466 7 114
436 9 186 467 5 114
437 5 186 468 6 155
438 5 186 469 9 155
Encuesta 470 6 183
dos X Y 471 6 183
439 5 186 472 5 183
440 9 1861 473 5 183
441 9 1861 474 6 119
442 5 1861 475 6 119
443 5 1861 476 5 119
444 5 1861 477 5 119
445 1 1861 478 5 119
446 6 120 479 9 342
447 6 120 480 9 342
448 5 120 481 5 342
449 5 120 482 9 1020
450 6 240 Encuesta X Y

12
dos
483 6 1020 516 9 210
484 9 1020 517 5 210
485 7 1020 518 4 210
486 9 580 519 9 169
487 7 580 520 6 169
488 5 580 521 5 169
489 5 580 522 5 169
490 4 242 523 6 102
491 4 242 524 6 102
492 9 242 525 9 102
493 9 431 526 4 93
494 9 431 Encuesta
495 9 431 dos X Y
496 5 431 527 6 93
497 5 431 528 7 93
498 9 380 529 5 93
499 6 380 530 5 93
500 6 380 531 5 93
501 5 380 532 4 88
502 9 225 533 4 88
503 9 225 534 9 88
504 6 225 535 7 88
505 5 225 536 4 175
506 9 220 537 4 175
507 6 220 538 9 264
508 9 220 539 6 264
509 5 220 540 9 264
510 4 1317 541 9 264
511 6 1317 542 4 50
512 5 1317 543 4 50
513 9 210 544 7 50
514 6 210 545 5 50
515 9 210 546 5 50

13
547 4 118 578 4 129
548 4 118 579 5 129
549 9 118 580 9 660
550 9 118 581 6 300
551 6 36 582 5 300
552 4 36 583 4 300
553 6 36 584 4 120
554 6 36 585 4 120
555 5 36 586 9 120
556 9 217 587 4 120
557 9 217 588 5 120
558 4 72 589 1 120
559 5 72 590 4 54
560 4 150 591 6 54
561 4 150 592 1 54
562 6 82 593 4 47
563 6 82 594 4 47
564 7 133 595 9 47
565 6 133 596 5 47
566 5 133 597 5 47
567 4 41 598 5 47
568 4 41 599 9 165
569 5 41 600 5 165
570 4 37 601 4 100
Encuesta 602 1 100
dos X Y 603 4 100
571 5 37 604 9 413
572 5 37 605 9 413
573 4 75 606 5 413
574 4 75 607 9 85
575 6 75 608 6 85
576 1 75 609 9 85
577 4 129 610 5 85

14
611 6 310
612 9 310
613 5 310
614 5 310
615 6 90
616 6 90
617 6 90
618 6 90
619 6 90
620 5 90

15
Nivel de instrucción Valoración
Ninguno 1
Centro de alfabetización 2
Jardín de infantes 3
Primaria 4
Educación Básica 5
Secundaria 6
Educación media 7
Superior no universitario 8
Superior Universitario 9

CALCULOS REALIZADOS MEDIANTE SOFTWARE

Coeficiente de Correlación R 0,149942949


Error de X Sx 1,868215439
Error de Y Sy 236,2176426
Error estándar de estimación Ryx 233,9247223
Coeficiente de Determinación R^2 0,022482888
Sumatoria X al cuadrado ∑X^2 20308
Observaciones N 620
Media Ẋ 5,409677419
Media Cuadrada Ẋ^2 29,26460978
Error est. Est. de la pendiente Sb 5,02867213
∑(X-Ẋ) 2163,94194

16
PRUEBA DE IMPORTANCIA DEL COEFICIENTE DE CORRELACION (r)

1. Plantear las hipótesis nula y alternativa.

H 0 : p=0

H1: p ≠ 0

2. Nivel de significancia

Para este ejercicio se estableció una significancia de:

α=0.05

3. Calcular el estadístico de prueba

Primero se debe calcular el coeficiente de correlación.

∑( x−x )( y− y )
r=
(n−1) S x S y

Para obtener dicho resultado hemos utilizado Excel el cual fue:

r =0,149942949

El estadístico de prueba es T de Student:

r ( √ n−2)
t=
√ 1−r 2
gl = n - 2

Mediante el software se obtuvo el siguiente resultado:

0.149942949( √ 620−2)
t=
√ 1−(0.149942949)2
t = 3,770145442.

4. Regla de decisión

17
gl = n-2 α = 0.05
gl = 620-2
gl= 618

Debido a que la distribución de la tabla “t” proporciona un número


máximo de muestra n = 200, se toma el tcritico mayor que es:
t crítico=1.960

Por lo tanto, la regla de decisión es:

Se aceptaría la hipótesis nula si: [-1,960< t > 1.960]

Región de Rechazo; H1.


α = 0.05
H1; α = 0.05
Ho Ho

-1.960 3.770145442
+ 1.960

5. Toma de decisión.

Se rechaza la hipótesis nula, es decir las variables “Nivel de instrucción e


Ingresos per cápita” si guardan una correlación; la misma que es directa y
débil.

6. Interpretación:

2
r = 0,224828888  2.25% es decir que, por cada cambio en la variable
independiente, la variable dependiente cambiara en 2.25%.

Considerando las variables planteadas decimos que a mayor nivel de


instrucción que tenga una persona, su ingreso será 2.25% más alto.

18
19
PRUEBA DE LA SIGNIFICANCIA DE LA PENDIENTE
Para realizar esta prueba partimos de nuestra ecuación de regresión resultante:

1. Planteamiento de las hipótesis.


H 0 : β=0
H1: β ≠ 0

2. Nivel de significancia
α=0.05

3. Calcular el estadístico de prueba

Todos los resultados han sido obtenidos mediante software:

S y .. x = 66,17064.
S y .. x =
√ Σ(Y −Ŷ )2
n−2

S y.. x
Sb =
√ Σ x 2−n x 2
Sb = 5.02867213.

b−0
t=
Sb

18.959−0
t=
5.02867213

t = 3.770180181

4. Regla de decisión

gl = n-2 α = 0.05

20
gl = 620-2
gl= 618

t crítico=1.960

Se aceptaría la hipótesis nula si: [ -1.960 < t > 1.960]

Región de rechazo H1;


H1 ; α = 0.05 Ho Ho α = 0.05

-1.960 3.770180181
+1.960

5. Toma de decisión.

Se rechaza la hipótesis nula, concluimos que la pendiente de la recta no es


igual a cero, la relación es significativa.

6. Interpretación

Concluimos que la variable independiente que estamos utilizando para nuestro


estudio es útil para obtener una buena estimación acerca de los ingresos per
cápita que recibe una persona.

21
GRAFICO DEL DIAGRAMA DE DISPERSION Y LA RECTA DE REGRESION

Diagrama de dispersión
2000
1800
1600
1400
Ingresos per capita

1200
1000
800
600
400
200
f(x) = 18.9588251428844 x + 77.8727426947835
0 R² = 0.0224828878452202
0 1 2 3 4 5 6 7 8 9 10
Nivel de instrucción

INTERVALOS DE CONFIANZA Y DE PREDICCION


2
1 (x−x )
 Intervalo de confianza= Y^ ± S y .. x +
n ∑ ( x−x)2

Intervalo de confianza (si es que la persona tiene un nivel de educación media)

Y^

2
1 (X−X )
+¿ t ( Sy . x ) + ¿
n ∑ ( X−X )2
−¿ ¿

210,586

2
1 (7−5,4096774223)
+ ¿ (233,9247223 ) + ¿
620 2163,94194
−¿ ¿

210,586−¿ + ¿ [ 233,9247223∗0,052741462] ¿
¿

210,586−¿ + ¿ (12,33753202 )¿
¿

Intervalo de confianza=[ 198,2484668 ; 222,923532 ]

Interpretación: con el 95% de confianza concluimos que, si las personas


tuvieran un nivel de instrucción medio, percibirían ingresos per cápita
aproximados desde $ 198.25 hasta $222.92.

22

2
^ 1 (x−x )
 Intervalo de predicción= Y ± S y .. x 1+ +
n ∑ (x−x)2

210,586

2
1 (7−5,4096774223)
+ ¿ (233,9247223 ) 1+ + ¿
620 2163,94194
−¿ ¿

210,586−¿ + ¿ [ 233,9247223∗1,001389865 ] ¿
¿

210,586−¿ + ¿ (234,2498461 )¿
¿

I ntervalo de predicción= [ 0 ; 444,8358461 ]

Interpretación: en este caso concluiríamos que una persona cuyo nivel de


instrucción sea: educación media probablemente percibirá ingresos per cápita
de $444.84.

RELACION ENTRE EL COEFICIENTE DE CORRELACION, EL COEFICIENTE DE


DETERMINACION Y EL ERROR ESTANDAR DE ESTIMACION

FUENTE SS GL MS
REGRESION SSR 1 SSR/GL
ERROR SSE n-2 SSE/GL
TOTAL SST n-1

TABLA ANOVA DE REGRESION


ANÁLISIS DE
VARIANZA
Promedio
Grados de Suma de de los
libertad cuadrados cuadrados
777800,907
Regresión 1 777800,9074 4
Residuos 618 33817439,38 54720,7757
Total 619 34595240,29

23
CONCLUSIONES

Al finalizar este estudio obtuvimos las siguientes conclusiones:

1. Con respecto al objetivo general: podemos afirmar que los


conocimientos que hemos adquirido en clases acerca de regresión lineal
han sido posibles aplicarlos a la práctica diaria mediante el uso de
programas informáticos en nuestro caso mayormente hemos utilizado
EXCEL, además del planteamiento y resolución de este ejercicio que
relacionaba el: Nivel de instrucción y los Ingresos per cápita.
2. Respecto de los objetivos específicos:

a.- Concluimos que existe una correlación entre las variables: Nivel de
instrucción e Ingresos per cápita, aplicando la prueba de importancia del
coeficiente de correlación cuyo resultado obtenido fue: una relación directa-
débil puesto que su valor fue de: 0.149942949.

b.- Obtuvimos que para cada cambio que experimente la variable


independiente, la variable dependiente cambiará en 2,25%, es decir a mayor
nivel de instrucción, los ingresos incrementarán en 2,25%.

c.- Respecto del intervalo de confianza de 95% se dedujo que en promedio las
personas que tengan un nivel de instrucción equivalente a educación media
obtendrán un salario cuyos valores oscilarán entre: $198, 25 y $222,92.

d.- El resultado del intervalo de predicción fue que para una persona con un
nivel de instrucción: educación media, percibirá unos ingresos per cápita
equivalentes a $444,84.

3. Finalmente explicamos que para las dos pruebas de hipótesis


planteadas se rechaza la hipótesis nula; ya que, en el primer caso para
el coeficiente de correlación se comprobó que, si existe relación, es una
correlación muy pequeña estos resultados fueron así debido a que los
ingresos per cápita que recibe una persona no depende únicamente del
nivel de instrucción sino se debe aplicar un análisis más a fondo
considerando otras variables que pueden ser: años de trabajo, el puesto

24
que tiene, lugar de procedencia, etc., el mismo que se presentara en el
caso de regresión múltiple.

4. Para el caso de la prueba de significancia del pendiente también se


rechazó la hipótesis nula mostrando que la pendiente es diferente de
cero, por tanto, es significativa; lo que nos llevó a concluir que la variable
independiente que utilizamos era un buen estimador de la variable
dependiente.

5. Como último punto expresamos que hemos demostrado mediante este


pequeño estudio que es posible aplicar nuestros conocimientos teóricos
en la práctica diaria; este trabajo ha sido muy interesante y de gran
ayuda para reforzar dichos conocimientos, añadiendo que también nos
servirá para la aplicación en nuestra vida como profesionales.

25
BIBLIOGRAFIA

INEC. (22 de Junio de 2007). Instituto Nacional de Estadisticas y Censos.


Obtenido de Ecuador en Cifras:
http://www.ecuadorencifras.gob.ec/banco-de-informacion/

Lind, D., Marchal, W., & Wathen, S. (2007). Regresion Lineal Simple. En D.
Lind, W. Marchal, & S. Wathen, Estadistica Aplicada a los Negocios y
Economia (págs. 465-495). Mexico: Mc Graw Hill.

26

También podría gustarte