Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mest1 U1 Ea Rooh PDF
Mest1 U1 Ea Rooh PDF
Carrera:
LICENCIATURA EN MATEMÁTICAS
Materia:
Estadística I.
U1-EA:
Evidencia de Aprendizaje.
Grupo:
MT-MEST1-2001-B2-001
Matrícula:
ES18210414044
Maestro:
1.- Investiga:
a) ¿Qué tipo de variables manejan las medidas de asociación?
Las medidas de asociación calculan la asociación entre una o mas variables estadísticas, como
ser el coeficiente de correlación. (UNADM, 2020)
b) ¿Cuáles son las medidas de asociación más usados en los estudios estadísticos?
d) ¿Qué representa la existencia de algún tipo de asociación entre dos o más variables?
Pueden existir diferentes tipos de asociación entre 2 variables. Estas pueden ser de tipo lineal,
exponencial , logarítmica y de otro tipo. Por lo general se usa la correlación lineal.
Un estudio que interesa a los negocios minoristas es si existe una relación entre los productos
que lleva un cliente y si es así entre que productos hay esta relación. Es así como en una tienda
comercial muy conocida se encontró que existe una relación entre los panales desechables y la
compra de cerveza. Por este motivo se puso los 2 productos muy cerca, para que el cliente tenga
mas facilidad. El tipo de asociación aquí era lineal positivo.
Por lo general se realiza primero un análisis de correlación entre variables y si este coeficiente
esta cerca de 1 o -1 , significa que hay una relación entre las 2 variables. A continuación lo que
sigue es hacer una regresión lineal para determinar que recta representa mejor al conjunto de
datos. Para de esta manera poder hacer interpolaciones y extrapolaciones .
2.- Define:
La covarianza nos indica el grado de dispersión que existen de las 2 variables conjuntas, respecto
a sus medias aritméticas. (Meyer, 1992)
𝑪𝒐𝒗(𝒙, 𝒚) = 𝑺𝒙𝒚
Propiedades
Cov(x,x)=Var(x)
Cov(x,y)=Cov(y,x)
Cov(x,y)=𝐸(xy)−𝐸(x)𝐸(y)
Cov(x+𝑎,y+𝑏)=Cov(x,y)
Cov(𝑎x,𝑏y)=𝑎𝑏Cov(x,y)
Var(x±y)=Var(x)+Var(y)±2Cov(x,y)
El valor de la covarianza nos informa de la existencia o no, de dependencia lineal entre las
variables. Si no hay relación lineal entre las 2 variables, la covarianza será igual a: (Crespo, 2013)
b) Escribe las diferentes fórmulas para el cálculo de la covarianza, y la razón, por la cual,
se usan en casos diferentes de forma particular.
∑(𝒙𝒊 − 𝒙
̅). ∑(𝒚𝒊 − 𝒚
̅)
𝑪𝒐𝒗(𝒙, 𝒚) = 𝑺𝒙𝒚 =
𝒏
Página 4 de 27
∑ 𝒙𝒊 𝒚𝒊
𝑺𝒙𝒚 = ̅𝒚
−𝒙 ̅
𝒏
Las 2 medidas miden si hay alguna relación entre variables. La covarianza puede tomar valores
negativos o positivos arbitrarios y la correlación toma valores entre -1 y 1.
Se define como :
𝒏 ∑ 𝒙 𝒊 𝒚𝒊 − ∑ 𝒙 𝒊 ∑ 𝒚𝒊
𝒓𝒙𝒚 =
√𝒏 ∑ 𝒙𝒊 𝟐 − (∑ 𝒙𝒊 )𝟐 √𝒏 ∑ 𝒚𝒊 𝟐 − (∑ 𝒚𝒊 )𝟐
1. Si 𝒓𝒙𝒚 = 𝟎 entonces no hay correlación. Las rectas de regresión son paralelas a los ejes.
2. Si 𝒓𝒙𝒚 > 𝟎 entonces hay correlación positiva. La recta de regresión tiene pendiente
positiva.
3. Si 𝒓𝒙𝒚 < 𝟎 entonces hay correlación negativa. La recta de regresión tiene pendiente
negativa.
4. Si 𝒓 = 𝟏 𝒐 𝒓 = −𝟏 entonces los puntos están contenidos en la recta de regresión.
𝑽𝒂𝒓𝒊𝒂𝒄𝒊𝒐𝒏 𝒆𝒙𝒑𝒍𝒊𝒄𝒂𝒅𝒂
𝒓𝟐 =
𝑽𝒂𝒓𝒊𝒂𝒄𝒊𝒐𝒏 𝒕𝒐𝒕𝒂𝒍
Expresa cuantitativamente que tan relacionadas están las variables o que tan estrecha es su
relación.
i) Escribe las ventajas y desventajas del uso e interpretación del Coeficiente de correlación
de Pearson.
Existe muchas ventajas y desventajas que se pueden encontrar con el uso e interpretación del
coeficiente de correlación de Pearson, algunas son:
Ventajas.-
1. El valor es independiente de cualquier unidad que se utiliza para medir las variables.
2. Si la muestra es grande es mas probable la exactitud de la estimación.
Desventajas.-
Recuerda usar el software o aplicación de tu gusto para construir y mostrar tablas, graficas, tanto
para para tus comprobar tus resultados como para organizar tu información.
Problema 1:
Calcular el valor r y la recta que más ajusta de regresión lineal, para la siguiente tabla.
x y
n Caloría IMC
(hombre)
Hombre
1 2550.37 20.382
2 2384.713 20.851
3 3105.46 30.86
4 2571.1 21.211
5 2909.49 35.261
6 2392.54 19.541
7 2834.67 28.699
8 2669.72 22.038
9 2125.83 19.902
10 1935.18 16.805
Página 7 de 27
11 2525.29 23.804
12 2310.03 27.461
13 2761.64 23.661
14 2123.89 18.339
15 1718.03 23.916
16 3034.19 24.73
17 2027.03 20.312
18 2066.77 16.824
19 2640.46 17.268
20 3062.87 26.483
21 2317.49 25.842
22 3221.05 21.766
𝒏 ∑𝟐𝟐 𝟐𝟐 𝟐𝟐
𝒊=𝟏 𝒙𝒊 𝒚𝒊 − ∑𝒊=𝟏 𝒙𝒊 ∑𝒊=𝟏 𝒚𝒊
𝒓𝒙𝒚 =
√𝒏 ∑𝟐𝟐 𝟐 𝟐𝟐
𝒊=𝟏 𝒙𝒊 − (∑𝒊=𝟏 𝒙𝒊 )
𝟐 √𝒏 ∑𝟐𝟐 𝒚 𝟐 − (∑𝟐𝟐 𝒚 )𝟐
𝒊=𝟏 𝒊 𝒊=𝟏 𝒊
𝒓𝒙𝒚 = 𝟎. 𝟓𝟐𝟓
Regresión Lineal.-
𝒀 = 𝒂 + 𝒃𝑿
𝒏 ∑ 𝒙𝒚 − ∑ 𝒙 ∑ 𝒚 ∑𝒚 − 𝒃∑𝒙
𝒃= , 𝒂=
𝒏 ∑ 𝒙𝟐 − (∑ 𝒙)𝟐 𝒏
𝒀 = 𝟕. 𝟗𝟖𝟗𝟖 + 𝟎. 𝟎𝟎𝟔𝟎𝑿
Problema 2: Calcular el valor r y la recta que más ajusta de regresión lineal, para la
siguiente tabla.
5 72
6 73
8 75
10 79
15 80
14 88
17 89
28 96
28 115
29 122
30 134
31 150
35 180
39 188
40 192
𝒏 ∑𝟏𝟓 𝟏𝟓 𝟏𝟓
𝒊=𝟏 𝒙𝒊 𝒚𝒊 − ∑𝒊=𝟏 𝒙𝒊 ∑𝒊=𝟏 𝒚𝒊
𝒓𝒙𝒚 =
√𝒏 ∑𝟏𝟓 𝟐 𝟏𝟓
𝒊=𝟏 𝒙𝒊 − (∑𝒊=𝟏 𝒙𝒊 )
𝟐 √𝒏 ∑𝟏𝟓 𝒚 𝟐 − (∑𝟏𝟓 𝒚 )𝟐
𝒊=𝟏 𝒊 𝒊=𝟏 𝒊
𝒓𝒙𝒚 = 𝟎. 𝟗𝟐𝟒
Recta de regresión:
𝒀 = 𝒂 + 𝒃𝑿
𝒏 ∑ 𝒙𝒚 − ∑ 𝒙 ∑ 𝒚 ∑𝒚 − 𝒃∑𝒙
𝒃= , 𝒂=
𝒏 ∑ 𝒙𝟐 − (∑ 𝒙)𝟐 𝒏
La grafica es:
El coeficiente de correlación cerca de 1 nos indica que existe un fuerte correlación entre el salario
de una persona y el Costo de un automovil. Esta correlación es positiva es decir la recta de
regresión es creciente, como se puede ver en la anterior grafica.
Problema 3:
Página 15 de 27
Calcular el valor r, R2 y la recta que más ajusta de regresión lineal, para los siguientes estudios.
Un estudio ambiental que mide a diario, durante 20 días consecutivos, una zona con mayor
contaminación del aire de una ciudad muestra las mediciones en partes por millón de Monóxido
de Carbono y de Dióxido de Azufre.
• El segundo, si el día de la lectura, tiene correlación con la medición de partes por millón
de Monóxido de Carbono (CO)
Página 16 de 27
1 0.11477 0.00115
2 0.44383 0.00888
3 0.10513 0.00315
4 0.10406 0.00416
5 0.10690 0.00534
6 0.24312 0.01459
7 0.24059 0.01684
8 0.10376 0.00830
9 0.32995 0.02970
10 0.17274 0.01727
11 0.77350 0.08508
12 0.07920 0.00950
13 0.60470 0.07861
14 0.78546 0.10996
15 0.06606 0.00991
16 0.47835 0.07654
17 0.66915 0.11376
18 0.22399 0.04032
19 0.11300 0.02147
20 0.00289 0.00058
𝒓𝒙𝒚 = 𝟎. 𝟗𝟏𝟒
𝒀 = 𝒂 + 𝒃𝑿
𝒃 = 𝟎. 𝟏𝟑𝟖𝟐
∑𝒚 − 𝒃∑𝒙
𝒂= = −𝟎. 𝟎𝟎𝟕𝟎
𝒏
Entonces existe una correlación fuerte entre ppm CO y ppm SO2 cercana a 1, lo que quiere decir
la recta de regresión es creciente, como se ve en la grafica anterior.
Para estudiar la correlación entre el día que se hace el estudio y el CO tenemos la siguiente
tabla en Excel:
Página 19 de 27
𝒓𝒙𝒚 = 𝟎. 𝟏𝟕𝟗
𝒀 = 𝒂 + 𝒃𝑿
𝒃 = 𝟎. 𝟎𝟎𝟕𝟓
∑𝒚 − 𝒃∑𝒙
𝒂= = 𝟎. 𝟐𝟎𝟖𝟖
𝒏
𝒀 = 𝟎. 𝟐𝟎𝟖𝟖 + 𝟎. 𝟎𝟎𝟕𝟓𝑿
En este caso, el coeficiente de correlación esta mas cerca a cero , por lo tanto es no existe una
relación entre el día y la emisión de CO.
Problema 4: Calcular el valor r, R2 y la recta que más ajusta de regresión lineal, para el
siguiente estudio.
La tabla muestra la cantidad en miligramos por decalitro, con los pesos promedios de las
cosechas de lechugas
Página 21 de 27
Mg de Peso promedio en
Kg de lechugas
Nutrientes cultivadas.
0.57 349.67
0.48 370.43
0.89 553.08
0.22 181.57
0.16 82.36
0.22 139.01
0.31 235.30
0.56 361.48
0.52 455.09
0.15 86.06
0.27 160.65
0.19 114.02
0.21 150.70
0.89 536.77
0.58 410.80
0.88 688.21
0.28 209.16
0.26 149.94
0.50 485.35
0.24 178.22
Página 22 de 27
𝒓𝒙𝒚 = 𝟎. 𝟗𝟓𝟓
𝒀 = 𝒂 + 𝒃𝑿
𝒃 = 𝟔𝟗𝟎. 𝟐𝟎𝟖𝟒
∑𝒚 − 𝒃∑𝒙
𝒂= = 𝟓. 𝟔𝟗𝟔𝟐
𝒏
𝒀 = 𝟓. 𝟔𝟗 + 𝟔𝟗𝟎. 𝟐𝟏𝑿
La verificación es :
Página 23 de 27
Se desea conocer:
𝒀 = 𝟒𝟖, 𝟑𝟐𝟎. 𝟑𝟗 𝑲𝒈
b) Si se desean obtener 400 kg promedio de lechugas, ¿cuántos mg del nutriente se tienen que
administrar al sistema?
𝟒𝟎𝟎 − 𝟓. 𝟗
= 𝑿
𝟔𝟗𝟎. 𝟐𝟏
𝑿 = 𝟎. 𝟓𝟕𝟏𝟐 𝒎𝒈 𝒅𝒆 𝒏𝒖𝒕𝒓𝒊𝒆𝒏𝒕𝒆
Página 24 de 27
𝒀 = 𝟓. 𝟔𝟗 + 𝟔𝟗𝟎. 𝟐𝟏 ∗ 𝟏. 𝟎𝟎 𝒎𝒈
𝒀 = 𝟔𝟗𝟓. 𝟗 𝑲𝒈
Primero se puede concluir que existe una fuerte correlación entre los nutrientes y el peso en
kilogramos promedio de las lechugas (0.955) y la ecuación de la recta de regresión con la que se
puede interpolar y extrapolar es :
𝒀 = 𝟓. 𝟔𝟗 + 𝟔𝟗𝟎. 𝟐𝟏𝑿
Los coeficientes de recta de regression en SPSS se resalta en verde en los datos anteriores .
Bibliografía
Crespo, R. (2013). Formulas y apuntes de Estadística aplicada. Madrid España: Cisolog.
Meyer, P. (1992). Probabilidad y Aplicaciones Estadísticas. Delaware U.S.A.: Fondo Educativo Interamericano.