Presentado por:
Estadística Descriptiva
Programa De Psicología
Noviembre de 2018
INTRODUCCIÓN
La investigación estadística es una actividad que apela a diversas técnicas con el propósito
de llegar a la esencia de la realidad. La regresión lineal simple y la regresión lineal múltiple
son técnicas de análisis de las variables de una investigación estadística, por lo general se
utiliza con mayor frecuencia en las ciencias económicas, también es cierto que en muchos
casos se requiere conocer más que el comportamiento de una sola variable para entender
una investigación cualquiera. Entonces, al recolectar, presentar y caracterizar un conjunto
de datos, la estadística descriptiva muestra apropiadamente las diversas características
existentes dentro del caso que se presente permitiendo estudiar simultáneamente los valores
de dos variables estadísticas.
JUSTIFICACIÓN
El estudio de datos representa analizar gran cantidad de información, la cual debe ser
previamente organizada y ver en detalle los resultados que se esperan obtener. De allí la
estadística nos brinda herramientas y programas con los cuales podemos desarrollar dicha
labor, para interpretar y mostrar a quien requiera la información detallada, con todos los
valores recolectados en el estudio, sin dejar por fuera ningún factor o dato de importancia.
OBJETIVOS
Objetivos Generales
Objetivos Específicos
1. Interpretar correctamente los datos de cada tabla propuestos en cada uno de los
ejercicios.
R= coeficiente de correlación
100
95
80
0 5 10 15 20 25
PORCENTAJE DE HIDROCARBUROS
Diagrama de dispersión
y = 14,947x + 74,283
R² = 0,8774
d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?
R/ Si la pureza es de 91,3 el porcentaje de hidrocarburo es de 1,13
y= pureza.
x= hidrocarburo
y= 91,3
91,3= 14,947x+74,283
91,3-74,283=14,947x
17,02/14,947=x
x= 1,13
3.2 El número de libras de vapor (y) consumidas mensualmente por una planta
Química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se
registraron los siguientes valores de temperatura y consumo anual:
Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. ¿Es confiable?
y = 9,2087x - 6,3184
R² = 0,9999
R= coeficiente de correlación
x= 70 °F
y= 9,2087(70) + 6,3184
y= 644,609 + 6,3184
y= 650,9.
Tendencia negativa, existe una relación inversa entre % de sobrepeso y el umbral de reflejo
de flexión a medida que aumenta el % de sobrepeso, disminuye el Umbral de reflejo de
flexión, la correlación entre las dos variables es mínima con un 0,33%, también es posible
Diagrama de dispersión
Tipo de asociación de las variables Inversa
Modelo matemático y = -0,0629x + 11,642
R2 R² = 0,1115
R 0,33
Confiabilidad No es confiable
% de explicación 11.15%
Grado de relación Relación mínima
Afirmar que este modelo no es recomendable puesto que posee un grado de confiabilidad
muy bajo por tener un R²= 11,15%.
CORRELACION ENTRE OBESIDAD Y
RESPUESTA AL DOLOR RESPUESTA AL DOLOR
16
14
f(x) = 1.53 x − 5.28
12 R² = 0.93
10
8
6
4
2
0
0 2 4 6 8 10 12 14
PORCENTAJE DE SOBREPESO
Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. ¿Es confiable?
y = -0,0629x + 11,642
R² = 0,1115
R=coeficiente de correlación
ESTATURA ESTATURA
Peso (kg) Peso (kg) Y
(M) (M) X
dependiente dependiente
independiente independiente
X*Y X2 Y2
0,65 12,50 0,65 12,50 8,125 0,4225 156,25
1,74 60,00 1,74 60,00 104,4 3,0276 3600
1,58 72,50 1,58 72,50 114,55 2,4964 5256,25
1,59 58,00 1,59 58,00 92,22 2,5281 3364
1 16,50 1 16,50 16,5 1 272,25
1,65 57,60 1,65 57,60 95,04 2,7225 3317,76
1,7 78,60 1,7 78,60 133,62 2,89 6177,96
0,73 5,20 0,73 5,20 3,796 0,5329 27,04
1,62 53,80 1,62 53,80 87,156 2,6244 2894,44
1,53 45,80 1,53 45,80 70,074 2,3409 2097,64
1,65 60,20 1,65 60,20 99,33 2,7225 3624,04
1,18 19,70 1,18 19,70 23,246 1,3924 388,09
1,69 62,70 1,69 62,70 105,963 2,8561 3931,29
1,58 78,60 1,58 78,60 124,188 2,4964 6177,96
1,53 52,70 1,53 52,70 80,631 2,3409 2777,29
0,85 8,90 0,85 8,90 7,565 0,7225 79,21
1,64 70,00 1,64 70,00 114,8 2,6896 4900
1,75 80,90 1,75 80,90 141,575 3,0625 6544,81
1,6 78,90 1,6 78,90 126,24 2,56 6225,21
1,03 15,90 1,03 15,90 16,377 1,0609 252,81
1,55 56,00 1,55 56,00 86,8 2,4025 3136
1,58 52,90 1,58 52,90 83,582 2,4964 2798,41
1,78 78,50 1,78 78,50 139,73 3,1684 6162,25
1,66 85,80 1,66 85,80 142,428 2,7556 7361,64
1,7 65,20 1,7 65,20 110,84 2,89 4251,04
1,79 60,00 1,79 60,00 107,4 3,2041 3600
1,72 67,20 1,72 67,20 115,584 2,9584 4515,84
1,68 85,00 1,68 85,00 142,8 2,8224 7225
1,03 24,50 1,03 24,50 25,235 1,0609 600,25
1,63 65,40 1,63 65,40 106,602 2,6569 4277,16
1,73 60,60 1,73 60,60 104,838 2,9929 3672,36
1,68 85,00 1,68 85,00 142,8 2,8224 7225
1,58 57,30 1,58 57,30 90,534 2,4964 3283,29
1,65 67,90 1,65 67,90 112,035 2,7225 4610,41
0,45 2,60 0,45 2,60 1,17 0,2025 6,76
1,78 75,30 1,78 75,30 134,034 3,1684 5670,09
1,5 45,20 1,5 45,20 67,8 2,25 2043,04
1,64 50,20 1,64 50,20 82,328 2,6896 2520,04
1,16 23,00 1,16 23,00 26,68 1,3456 529
1,52 45,00 1,52 45,00 68,4 2,3104 2025
1,58 65,70 1,58 65,70 103,806 2,4964 4316,49
0,98 16,70 0,98 16,70 16,366 0,9604 278,89
1,65 60,50 1,65 60,50 99,825 2,7225 3660,25
1,59 57,80 1,59 57,80 91,902 2,5281 3340,84
1,61 60,30 1,61 60,30 97,083 2,5921 3636,09
1,79 78,50 1,79 78,50 140,515 3,2041 6162,25
0,96 15,30 0,96 15,30 14,688 0,9216 234,09
1,67 65,20 1,67 65,20 108,884 2,7889 4251,04
1,7 65,60 1,7 65,60 111,52 2,89 4303,36
1,68 78,40 1,68 78,40 131,712 2,8224 6146,56
1,62 57,90 1,62 57,90 93,798 2,6244 3352,41
0,53 3,40 0,53 3,40 1,802 0,2809 11,56
1,59 58,30 1,59 58,30 92,697 2,5281 3398,89
1,56 56,80 1,56 56,80 88,608 2,4336 3226,24
1,65 60,00 1,65 60,00 99 2,7225 3600
1,68 72,00 1,68 72,00 120,96 2,8224 5184
1,56 58,60 1,56 58,60 91,416 2,4336 3433,96
0,96 14,20 0,96 14,20 13,632 0,9216 201,64
1,67 65,70 1,67 65,70 109,719 2,7889 4316,49
1,61 60,80 1,61 60,80 97,888 2,5921 3696,64
0,57 3,10 0,57 3,10 1,767 0,3249 9,61
1,8 85,00 1,8 85,00 153 3,24 7225
1,56 60,80 1,56 60,80 94,848 2,4336 3696,64
1,62 55,90 1,62 55,90 90,558 2,6244 3124,81
1,67 70,00 1,67 70,00 116,9 2,7889 4900
1,8 73,80 1,8 73,80 132,84 3,24 5446,44
1,75 78,50 1,75 78,50 137,375 3,0625 6162,25
1,65 67,20 1,65 67,20 110,88 2,7225 4515,84
1,72 67,20 1,72 67,20 115,584 2,9584 4515,84
1,59 58,80 1,59 58,80 93,492 2,5281 3457,44
1,63 62,30 1,63 62,30 101,549 2,6569 3881,29
1,65 70,20 1,65 70,20 115,83 2,7225 4928,04
1,52 54,90 1,52 54,90 83,448 2,3104 3014,01
1,72 78,10 1,72 78,10 134,332 2,9584 6099,61
1,63 62,90 1,63 62,90 102,527 2,6569 3956,41
1,86 65,00 1,86 65,00 120,9 3,4596 4225
1,63 62,90 1,63 62,90 102,527 2,6569 3956,41
1,75 72,90 1,75 72,90 127,575 3,0625 5314,41
1,57 61,60 1,57 61,60 96,712 2,4649 3794,56
0,76 9,70 0,76 9,70 7,372 0,5776 94,09
1,78 64,30 1,78 64,30 114,454 3,1684 4134,49
1,62 58,90 1,62 58,90 95,418 2,6244 3469,21
1,06 18,30 1,06 18,30 19,398 1,1236 334,89
1,68 56,90 1,68 56,90 95,592 2,8224 3237,61
0,57 3,10 0,57 3,10 1,767 0,3249 9,61
1,51 45,80 1,51 45,80 69,158 2,2801 2097,64
1,76 68,90 1,76 68,90 121,264 3,0976 4747,21
0,86 11,90 0,86 11,90 10,234 0,7396 141,61
1,62 65,90 1,62 65,90 106,758 2,6244 4342,81
1,71 78,00 1,71 78,00 133,38 2,9241 6084
1,1 16,90 1,1 16,90 18,59 1,21 285,61
1,86 85,80 1,86 85,80 159,588 3,4596 7361,64
1,71 67,20 1,71 67,20 114,912 2,9241 4515,84
1,59 63,20 1,59 63,20 100,488 2,5281 3994,24
0,82 9,40 0,82 9,40 7,708 0,6724 88,36
1,76 72,90 1,76 72,90 128,304 3,0976 5314,41
0,47 3,90 0,47 3,90 1,833 0,2209 15,21
1,62 63,80 1,62 63,80 103,356 2,6244 4070,44
1,4 30,50 1,4 30,50 42,7 1,96 930,25
1,51 52,60 1,51 52,60 79,426 2,2801 2766,76
1,81 85,90 1,81 85,90 155,479 3,2761 7378,81
1,66 67,90 1,66 67,90 112,714 2,7556 4610,41
1,6 58,20 1,6 58,20 93,12 2,56 3387,24
1,63 55,00 1,63 55,00 89,65 2,6569 3025
1,58 60,50 1,58 60,50 95,59 2,4964 3660,25
1,67 87,50 1,67 87,50 146,125 2,7889 7656,25
1,72 55,20 1,72 55,20 94,944 2,9584 3047,04
1,65 70,00 1,65 70,00 115,5 2,7225 4900
1,56 45,90 1,56 45,90 71,604 2,4336 2106,81
1,63 54,00 1,63 54,00 88,02 2,6569 2916
1,67 60,80 1,67 60,80 101,536 2,7889 3696,64
1,64 65,80 1,64 65,80 107,912 2,6896 4329,64
1,61 70,80 1,61 70,80 113,988 2,5921 5012,64
1,68 78,60 1,68 78,60 132,048 2,8224 6177,96
1,8 87,20 1,8 87,20 156,96 3,24 7603,84
1,72 79,50 1,72 79,50 136,74 2,9584 6320,25
1,75 72,90 1,75 72,90 127,575 3,0625 5314,41
1,67 67,50 1,67 67,50 112,725 2,7889 4556,25
1,55 58,20 1,55 58,20 90,21 2,4025 3387,24
1,72 64,30 1,72 64,30 110,596 2,9584 4134,49
11000,21
181,52 6718,00 7 287,7456 437809,28
SUMATORIA
S X Y X*Y X2 Y1
50.00
40.00
30.00
20.00
10.00
0.00
0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
ESTATURA
calcular R2 Y r r
numerador 100574,68
1 parte del denominador 1579,9616
2 parte del denominador 7405589,6
1170054719
resultado total del denominador 3
raiz cuadrada del denominador 108169,0676
coeficiente de correlacion r 0,929791503
coeficiente de determinacion R 0,864512239
calculo de a
numerador 100574,68
denominador 1579,9616
resultado de a 63,65640785
calculo de b
numerador -4836,91115
denominador (valor de n) 120
resultado b -40,3075929
ECUACION DE REGRECION O MODELO MATEMATICO
Y=ax + b
y= 63,65640785*X-40,3075929
Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. Es confiable?
Modelo Matemático Y =
63,65640785*X-40,3075929
R2=0,864512239
R2=0,864512239 *100
R2=86,4512239 %
El coeficiente de determinación es de 86,45%, esto quiere decir que coeficiente
de determinación es confiable.
2. Determine el grado de relación de las dos variables.
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL
X
(% de Y
Hidrocarburos) (Pureza)
0,99 90,01
1,02 89,05
1,15 91,43 a. Realice el diagrama de dispersión y
1,29 93,74 determine el tipo de asociación entre las
1,46 96,73 variables.
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54 Posee tendencia positiva y relación directa
1,15 92,52 entre el % de hidrocarburo y la pureza puesto
0,98 90,56 que a medida que él % aumenta la pureza
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
también aumenta es decir que la pureza si depende del % de hidrocarburo. La ecuación
matemática es confiable en un 87,74%.
y = 14,947x + 74,283
R² = 0,8774
R= coeficiente de correlación
y= pureza.
x= hidrocarburo?.
y= 91,3
91,3= 14,947x+74,283
91,3-74,283=14,947x
17,02/14,947=x
x= 1,13
y = 9,2087x - 6,3184
R² = 0,9999
R= coeficiente de correlación
y= consumo de vapor?
x= temperatura en °F
x= 70 °F
y= 9,2087(70) + 6,3184
y= 644,609 + 6,3184
y= 650,9.
x (porcentaje
de sobrepeso)
UMBRAL DE REFLEJO DE REFELXIÓ
o b e s id a d y re s p u e s ta in d iv id u a l a l d o lo r
20
15
10
f(x) = − 0.06 x + 11.64
y (umbral
R² = 0.11 de reflejo
5
de flexión
0
10 nociceptiva)
20 30 40 50 60 70 80 90 100
% DE SOBREPESO
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
Afirmar que este modelo no es recomendable puesto que posee un grado de confiabilidad
muy bajo por tener un R²= 11,15%.
b- Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. Es confiable?
y = -0,0629x + 11,642
R² = 0,1115
R=coeficiente de correlación
X= 40 % Sobrepeso
y= (-0,0629) (40)+ 11,642
y= -2,516 + 11,642
y= 9.126
Solución taller.
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0 10 20 30 40 50 60 70 80 90 100
Edad (Años)
El tipo de asociación entre las variables es positiva, debido a que la nube de punto se
desplaza desde la parte inferior izquierda a la parte superior derecha.
R² = 0,3417, es un valor R² alejado de 1, lo cual hace que sea poco confiable. Además solo
el 34% de la variación observada en Y puede ser explicada por X, es un porcentaje de
explicación moderado.
Con base a los datos anteriores se puede notar que la fuerza de la asociación entre las dos
variables edad y estatura no es muy fuerte, ya que tiene un valor de 0,585, además el R² nos
habla de que muy poquita variación observada en la estatura puede ser explicada solo por la
edad, así que deben haber otra variables que estén influyendo sobre la edad y puedan
explicar mejor estas relaciones. Sumado a lo anterior el modelo para predecir valores en Y
es poco confiable.
R² = 0.88
90
85
80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
% de hidrocarburos
El tipo de asociación entre las variables es positiva, debido a que la nube de puntos se
desplaza desde la parte inferior izquierda a la parte superior derecha. En este caso a simple
vista se podría decir que la correlación parece ser muy fuerte, el cálculo del coeficiente de
correlación lo confirmara.
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?
y = 14,947x + 74,283
R² = 0,8774
y=14,947 x +74,283
14,947 x= y−74,283
y−74,283
x=
14,947
91,3−74,283
x= ≈ 1.14
14,947
800
600 f(x) = 9.21 x − 6.32
400 R² = 1
200
0
10 20 30 40 50 60 70 80
Temperatura
La asociación entre las dos variables es lineal y es positiva, ya que se puede observar que
mientras una variable crece la otra también crece.
Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?
El modelo que permite predecir un valor de Y para un valor especifico de X es, y = 9,2087x
– 6,3184 es un modelo bastante confiable de debido a que el R² = 0,9999 está cercano a 1.
Con un R² = 0,9999 el porcentaje de explicación del modelo es del 99,99%, esto significa
que el 99,99% de la variación observada en el consumo de vapor puede ser explicada por la
temperatura. Casi toda la variación es explicada por la variable X.
y=9,2087 x−6,3184
y=9,2087 ( 70 )−6,3184=638.2906
20
15
10
f(x) = − 0.06 x + 11.64
5 R² = 0.11
0
10 20 30 40 50 60 70 80 90 100
Porcentaje de sobrepeso
En este caso no hay asociación entre las variables, ya no existen un patrón discernible sobre
los puntos del gráfico.
Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?
y = -0,0629x + 11,642, es el modelo que podría predecir el efecto de una variable sobre
otra, sin embargo es de notar que el R² = 0,1115 es muy cercano a 0. Por lo tanto es un
modelo poco confiable, esto es de esperar debido a que se puede notar que no existe algún
patrón de asociación entre las variables.
El coeficiente de relación tiene un valor de r= -0,334, se puede observar que está muy
cercano a cero, por lo tanto la fuerza de la relación entre estas dos variables es muy baja.
¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de
sobrepeso, de 40?
y=−0,0629 x +11,642
y=−0,0629 ( 40 ) +11,642=9.126
El umbral de reflejo de flexión nociceptiva es de 9.126, sin embargo este es un valor que
debe ser tomado con prudencia debido a que hay poca confiabilidad en el modelo
matemático, además de que hay poca correlación entre estas dos variables.
Variable X: Edad.
Variable Y: Grados de alcohol.
Diagrama de dispersión:
accidentes de transito
2.0
1.8
1.6 f(x) = − 0.06 x + 2.79
grados de alcohol
1.4 R² = 0.92
1.2
1.0
0.8
0.6
0.4
0.2
0.0
15 20 25 30 35 40 45 50
edad
A medida que aumenta la edad los grados de alcohol disminuyen eso quiere decir que los
mayores grados de alcohol fueron encontrados en los jóvenes, el modelo matemático es
confiable con un coeficiente de determinación de 91,8 %. Para obtener el porcentaje de
correlación fue necesario sacar la raíz cuadrada de 0,918 obteniendo como resultado 0,95 y
multiplicado por 100% da como resultado una correlación lineal simple.
En conclusión, no dimos cuenta que a menor edad mayor grados de alcohol se encuentran
presentes.
Y+x1
2.0
1.8
1.6
1.4
Grados de alcohol
1.2
f(x) = 0.05 x − 3.09
1.0 R² = 0.12
0.8
0.6
0.4
0.2
0.0
68 70 72 74 76 78 80 82 84
Velocidad
Y+x2
20
18
16
14
Número de heridos
12
10
8
6
4 f(x) = 0.03 x + 0.4
2 R² = 0.04
0
20 40 60 80 100 120 140 160
Velocidad
Diagrama
1
0.8
0.6
0.4
0.2
0
0 10 20 30 40 50 60 70 80 90 100
edad
y=−6.816+0.5114 x1 +7.85 x 2
Entonces
−90044112.1
a= =−6.816
13210674.47
6835380.139
B 1= =0,5114
13210674.47
103704239.4
B 2= =7.85
13210674.47
Correlación
2 a ∑ y + B1 ∑ x1 y +B 2 ∑ x 2 y−n ý 2
R=
∑ y 2 −n ý 2
−6.816 ( 4083 )+ 0.5114 ( 267090.5 ) +7.85 ( 6713.23 )−120 ( 34.045 )2 22535.1342
R 2= 2
= =0,365
203031−120 ( 34.045 ) 63943.557
Resumen
Estadísticas de la
regresión
Coeficiente de
correlación 0.61366
múltiple 1799
Coeficiente de
determinación 0.37658
R^2 0803
0.36592
R^2 ajustado 4065
18.4820
Error típico 2816
Observaciones 120
Análisis de
Varianza
Grados Suma
de de Promedio Valor
liberta cuadrad de los crítico
d os cuadrados F de F
35.33
24141.4 12070.7186 7341 9.8773
Regresión 2 373 6 4 4E-13
39965.4 341.585364
Residuos 117 877 8
64106.9
Total 119 25
Se puede considerar que las variables que se han elegido, tiene una relación mínima con el
problema en cuanto a peso y estatura, pues se puede considerar que el servicio de salud no
debe ser un proceso subjetivo y físico, sino que debe ser un servicio que se deriva según las
necesidades de las personas. Hay que precisar que los datos no tienen correlación, y en
relación con el problema, es subjetivo a que se dé una precisión con el problema, dado que
la atención en salud se puede establecer, según la necesidad, y el seguro, mas no por la
edad, peso y estatura; dado que el Coeficiente de correlación múltiple es de 0.613661799.
Conclusiones
Se pudo evidenciar que para manejar cualquier tipo de variables se necesita realizar un
diagrama de dispersión y aplicar conceptos, fórmulas de relación y correlación que permita
el despeje de las ecuaciones y datos para obtener un resultado. Los ejemplos nos muestran
que son acordes a un tipo de forma lineal y la correlación es confiable para los tipos de
datos.
Bibliografía