Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudiantes
Presentado a
ORLANDO TORO
Estadística descriptiva
Corozal, Sucre
1
INTRODUCCIÓN
2
JUSTIFICACIÓN
3
OBJETIVOS:
Objetivos específicos:
•Usar la herramienta Excel, como un método más para valorar esas relaciones.
4
DEFINICIÓN DE CONCEPTOS
Diagrama de dispersión:
Por lo cual, el diagrama de dispersión es una gráfica del tipo X-Y, donde cada
elemento de la muestra es representado mediante un par de valores (XI,Yi) y el
punto correspondiente en el plano cartesiano X-Y, su objetivo es analizar la
forma en que las variables se relacionan. (Gutierrez, 2.002).
Debido a esto, los diagramas de dispersión son una herramienta para ver su
relación, tras el cálculo del coeficiente de relación, el cual puede ser de tres
tipos: correlación positiva, negativa y nula(sin correlación).1
5
positiva entre dos variables X y Y, quiere decir que las variables son directas, la
correlación negativa, demuestran una relación lineal inversa
Los valores cercanos a uno de este coeficiente expresan un mejor ajuste de los
datos al modelo.
Coeficiente de correlación
En primer lugar, se debe de detallar que es necesaria contar con una medida
que analice las covarianzas conjuntas, siendo esta el coeficiente correlación,
teniendo el resultado de este indicador, se procede a interpretarlo:
6
que es más positiva su relación, y si se alcanza el valor de 1 se habla de una
correlación positiva perfecta (con pendiente positiva).
Diagrama de dispersión:
7
proporcional, además de que se define que la relación entre ellos es una
correlación lineal positiva.
Y= 9,2087(70)+6,3184
Y= 644,609+6,3184
Y= 650,9.
8
Cuando la temperatura es igual a 70° el consumo de vapor será 650,9%
%Hidrocarburo- Pureza.
Variable Y: Pureza.
Variable X: %Hidrocarburo
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables
%HIDROCARBURO VS PUREZA
102
100
98 y = 14.947x + 74.283
R² = 0.8774
96
94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
9
Como se observa en el anterior diagrama de dispersión, los puntos siguen un
patrón definido, lo que indica que existe una relación entre las dos variables,
además, corresponde a una correlación lineal positiva, ya que cuando X (% de
hidrocarburos) aumenta, también lo hace la variable Y(Pureza). Adicionalmente,
se analiza el coeficiente de correlación, el cual arroja un 0,94; esto evidencia
que tienen una fuerte correlación positiva.
%SOBRE PESO-UMBRAL
11
coeficiente de determinación muestre un porcentaje bajo como lo es de
11,15%.
12
Cuando el porcentaje del sobre peso es de 40, el umbral de reflejo es de
5,4116
13
TIEMPO ESPERA PARA TRIAGE ( MINUTOS) vs
EDAD
400 y = 0.5698x + 159.47
R² = 0.0266
350
300
250
200
150
100
50
0
0 20 40 60 80 100
14
d. Determine el porcentaje de explicación del modelo y el grado de relación
de las dos variables.
15
ESTUDIANTE: JAVIER EDUARDO TERÁN LUNA
Código: 18881400
Peso-Altura
16
X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20
Altura
Nº Peso (Kg)
(cm)
1 61 150
2 63 143
3 60 146
4 74 160
5 58 143
6 63 145
7 64 149
8 74 158
9 74 150
10 66 150
11 63 153
12 61 151
13 64 151
14 69 147
15 64 142
17
16 77 164
17 76 162
18 80 163
19 79 152
20 68 144
18
180
160
140
120
Axis Title
100 Series1
80 Series2
60 Linear (Series1)
40 Linear (Series2)
20
0
0 5 10 15 20 25
Axis Title
170
165
160
Axis Title
155
Series1
150 Linear (Series1)
145
140
0 20 40 60 80 100
Axis Title
En los gráficos anteriores, se puede observar como los datos siguen un patrón
muy definido. Donde se aprecia que cuando la edad es alta, también el peso lo
es, es decir, presentan una relación directamente proporcional, además de que
se define que la relación entre ellos es una correlación lineal positiva.
19
Como se observa en el anterior diagrama de dispersión, los puntos siguen un
patrón definido, lo que indica que existe una relación entre las dos variables,
además, corresponde a una correlación lineal positiva, ya que cuando X (peso)
aumenta, también lo hace la variable Y(Edad). Adicionalmente, se analiza el
coeficiente de correlación, el cual arroja un 0,488; esto evidencia que tienen
una fuerte correlación positiva.
Peso Altura
Nº (Kg) x (cm) Y X2 X.Y
1 61 150 3721 9150
2 63 143 3969 9009
3 60 146 3600 8760
4 74 160 5476 11840
5 58 143 3364 8294
6 63 145 3969 9135
7 64 149 4096 9536
8 74 158 5476 11692
9 74 150 5476 11100
10 66 150 4356 9900
11 63 153 3969 9639
12 61 151 3721 9211
13 64 151 4096 9664
14 69 147 4761 10143
15 64 142 4096 9088
16 77 164 5929 12628
17 76 162 5776 12312
20
18 80 163 6400 13040
19 79 152 6241 12008
20 68 144 4624 9792
Total= 210 1358 3023 93116 205941
Y=
AX+B
A= 20(205941)- (1358)(3023) /
20(93116)-(1358)2
A= 4.118.820- 4.105.234 /
1.862.320- 1.844.164
A= 13.586 /
18.156
A = -
4.570
21
B= Y- (A)(X) / N
B= 3023 - (-4570)(1358) /
20
B = 3023 +
6.202.060 / 20
B = 6.205.083 /
20
B = 310.254.15
Y = AX +
B
Y = -4.570 +
310.254.15
Y = -4259.74585
Coeficiente de correlación
22
61 150 6.9 -1.15 47.61 1..3225 5.75
63 143 -4.9 -8.15 24.01 66..4225 3.25
60 146 -7.9 -5.15 62.41 26..5225 -2.75
74 160 6.1 8.85 37.21 78..3225 53.985
58 143 -9.9 -8.15 98.01 66..4225 -1.75
63 145 -4.9 -6.15 24.01 37..8225 1.25
64 149 -3.9 -2.15 15.21 4..6225 -1.75
74 158 6.1 6.85 37.21 46..9225 41.785
74 150 6.1 -1.15 37.21 1..3225 0.05
66 150 -1.9 -1.15 3.61 1..3225 -0.75
63 153 -4.9 1.85 24.01 3..4225 -9.065
61 151 -6.9 -0.15 47.61 0..0225 -6.75
64 151 -3.9 -0.15 15.21 0..0225 -3.75
69 147 1.1 -4.15 1.21 17..2225 -3.05
64 142 -3.9 -9.15 15.21 83..7225 5.25
77 164 9.1 12.85 82.81 165..1225 116.935
76 162 8.1 10.85 65.61 117..7225 87.885
80 163 12.1 11.85 146.41 140..4225 143.385
79 152 11.1 0.85 123.21 0..7225 9.435
68 144 0.1 -7.15 0.01 51..1225 -7.05
1358 3023 907.8 911 444.333
Media X = 67.9
Media Y = 151.15
23
- media Y)2
R= 444.333/ (30.129719)(30.182776)
R =444.333 / 909.398
R = 0.488
24
Total 1358 100% 3023 100%
Como se observa en el anterior diagrama de dispersión, los puntos siguen un
patrón definido, lo que indica que existe una relación entre las dos variables,
además, corresponde a una correlación lineal positiva, ya que cuando X (peso)
aumenta, también lo hace la variable Y(Edad). Adicionalmente, se analiza el
coeficiente de correlación, el cual arroja un 0,488; también un porcentaje de
explicación del modelo correspondiente a 5%, esto evidencia que tienen una
fuerte correlación positiva.
25
ESTUDIANTE JUAN CARLÓS FARAK
Código: 1103216292
26
y = 14.947x + 74.283
27
b) Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es Confiable?
Y= a + b
Se halla a y b
28
14 66 198
16 61 153
12 61 151
13 67 151
14 60 147
15 63 146
16 78 163
17 71 161
18 85 158
19 75 150
20 69 142
29
ESTUDIANTE:SUSANA ATENCIO SIERRA
CODIGO: 1103115885
Gráfico de dispersión
30
Estatura vs Peso
100.00
60.00
Peso (kg)
40.00
20.00
0.00
0.25 0.45 0.65 0.85 1.05 1.25 1.45 1.65 1.85 2.05
-20.00
Estatura (m)
Modelo matemático
n 120
Coeficiente de correlación
r 0,929791503
R^2 0,864512239
Análisis
Según los anteriores resultados se puede concluir que existe relación entre las
variables Estatura (mt) y Peso (kg) de forma positiva, aunque no es
estrictamente lineal, pero la relación positiva es confirmada por el valor del
31
coeficiente de correlación con un valor de 0,92, un valor cercano a 1
(correlación fuerte), adicionalmente Se puede decir que el modelo lineal
planteado explica el 87% de la información, según el valor R2, lo que lo haría
relativamente confiable. Sin embargo, no necesariamente esta sea de tipo lineal
dado que según el diagrama de puntos se puede observar una especie de
curva por lo que una tendencia lineal no necesariamente explica la relación.
Gráfico de dispersión: Se observa una relación fuerte positiva y con forma lineal
32
Consumo de sal vs Tensión
130
Nivel de tension y = 6.1062x + 88.128
120 R² = 0.987
110
100
90
0 1 2 3 4 5 6
Consumo de sal
𝑦 = 88,12832 + 6,1061
∗𝑥
n 6
β1 6,10619469
β0 88,1283186
r 0,99348087
R^2 0,98700424
𝑦 = 88,12832 + 6,1061 ∗ 𝑥
𝑐𝑜𝑛 𝑥 = 5,6
𝑦 = 88,12832 + 6,1061
∗ 5,6
33
Tensión Y= 122,323009
Gráfico de dispersión: En este caso si se observa una fuerte relación entre las
variables de días de proceso y tiempo medio de fabricación. El grafico de
dispersión muestra una tendencia lineal como la regresión que mejor explicaría
el comportamiento las variables. Así mismo se tiene una relación NEGATIVA
35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
Dias de proceso
34
Modelo matemático: la ecuación calculada describe un comportamiento donde
EL TIEMPO MEDIO disminuye en -0,3566 minutos por cada día de proceso. El
modelo explica la información en un 80% aproximadamente según el R2
n 7
β1 -0,35661381
β0 42,5691634
r -0,89233777
R^2 0,7962667
y = 10,47
35
90 12,5 1125 8100 156,25
45 8 360 2025 64
50 19 950 2500 361
TOTAL 631 87,5 5253,5 46745 994,75
n 10
β1 -0,0386425
β0 11,1883416
36
Coeficiente de correlación: Relación leve negativa y apenas un 4,5% de la
información explicada por el modelo.
r -0,21250106
R^2 0,0451567
y = 9,88
37
Estudiante: NILSON ANTONIO VASQUEZ
X (% Y
de Hidro carburos) (Pureza)
0.99 90.01
1.02 89.05
1.15 91.43
1.29 93.74
1.46 96.73
1.36 94.45
0.87 87.59
1.23 91.77
1.55 99.42
1.4 93.65
1.19 93.54
1.15 92.52
0.98 90.56
1.01 89.54
1.11 89.85
1.2 90.39
1.26 93.25
1.32 93.41
1.43 94.98
0.95 87.33
X Y X^2 Y^2 xy
-0.206 -2.1505 0.042436 4.62465025 0.443003
-0.176 -3.1105 0.030976 9.67521025 0.547448
-0.046 -0.7305 0.002116 0.53363025 0.033603
0.094 1.5795 0.008836 2.49482025 0.148473
0.264 4.5695 0.069696 20.8803303 1.206348
0.164 2.2895 0.026896 5.24181025 0.375478
-0.326 -4.5705 0.106276 20.8894703 1.489983
0.034 -0.3905 0.001156 0.15249025 -0.013277
38
0.354 7.2595 0.125316 52.7003403 2.569863
0.204 1.4895 0.041616 2.21861025 0.303858
-0.006 1.3795 3.6E-05 1.90302025 -0.008277
-0.046 0.3595 0.002116 0.12924025 -0.016537
-0.216 -1.6005 0.046656 2.56160025 0.345708
-0.186 -2.6205 0.034596 6.86702025 0.487413
-0.086 -2.3105 0.007396 5.33841025 0.198703
0.004 -1.7705 1.6E-05 3.13467025 -0.007082
0.064 1.0895 0.004096 1.18701025 0.069728
0.124 1.2495 0.015376 1.56125025 0.154938
0.234 2.8195 0.054756 7.94958025 0.659763
-0.246 -4.8305 0.060516 23.3337303 1.188303
-3.66374E-15 4.2633E-14 0.68088 173.376895 10.17744
b) Y=14,947x+74,287
MEDIA.
39
1.196 92.1605
MEDIA X MEDIA Y
3.98235294 349.687647
R R^2
0.16956874 0.02875356
17% 3%
a. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. ¿Es
confiable?
b. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.
c. ¿Cuál podria ser la proyección de ventas para el año 2018 si se espera que el PIB nacional sea del 3,1?
A Y=1,1509X+345,1
B 3%
C 348.66779
x 12 23 35 42 53 65 70
41
y 45 30 27 25 23 21 20
x -30.9 -19.9 -7.9 -0.9 10.1 22.1 27.1
y 17.714286 2.7142857 -0.285714 -2.285714 -4.285714 -6.285714 -7.285714
x^2 952.16327 394.30612 61.734694 0.7346939 102.87755 490.30612 736.73469 2
y^2 313.79592 7.3673469 0.0816327 5.2244898 18.367347 39.510204 53.081633 4
xy -546.6122 -53.89796 2.244898 1.9591837 -43.46939 -139.1837 -197.7551 -
MEDIA X MEDIA Y
42.9 27.2857143
R R^2
-0.8923378 0.7962667
-89% 80%
42
B Y=-0,3566X+42,569
C 80%
D 10.475
xy
0.443003
0.547448
0.033603
0.148473
1.206348
0.375478
1.489983
-0.013277
2.569863
0.303858
-0.008277
-0.016537
0.345708
0.487413
0.198703
-0.007082
0.069728
0.154938
0.659763
1.188303
10.17744
43
94% Relacion entre las dos variables
88% explicacion del modelo ( C )
b) Y=14,947x+74,287 Si es confiable
45
matemático y su construcción, tras una interpretación de los resultados como el
coeficiente de correlación, R², los diagramas de dispersión, entre otros.
REFERENCIAS BIBLIOGRÁFICAS
46
u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c82
19
3. Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple.
Mexico City: Cengage Learning. (pp-675–686). Recuperado
dehttp://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&
u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce
41
47