Está en la página 1de 12

ESTADÍSTICA

Gerardo Sepúlveda Ávila


Marzo, 2023
Propiedades Medidas Estadísticas
𝑌 =𝑎$𝑋±𝑏
Y: Nueva variable (modificada)
X: Variable original
a: Porcentaje de la variable original (inicialmente 100%)
b: Valor de variable que se agrega o quita de la original

𝑵𝒖𝒆𝒗𝒂 𝑽𝒂𝒓𝒊𝒂𝒃𝒍𝒆 Muestral Poblacional


𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑌X = 𝑎 $ 𝑋X ± 𝑏
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑆! = 𝑎 $ 𝑆" 𝜎! = 𝑎 $ 𝜎"
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑆!# = 𝑎# $ 𝑆"# 𝜎!# = 𝑎# $ 𝜎"#
Medidas Estadísticas Conjuntas
• Media Aritmética Conjunta
∑$
!"# "! %!!
𝑋𝑌 = datos sin tabular
&
∑!"# ∑$
$
%"# "! %!% %&!%
𝑋𝑌 = datos tabulados
&

• Covarianza (Poblacional)
∑&'()(𝑋' −𝑋)X $ (𝑌* − 𝑌)X
𝐶𝑜𝑣(𝑥, 𝑦) =
𝑛
∑&'() 𝑋' $ 𝑌' − 𝑛 $ 𝑋X $ 𝑌X
𝐶𝑜𝑣(𝑥, 𝑦) =
𝑛
vCovarianza Muestral igual a Covarianza Poblacional pero dividido en (n - 1)
Medidas Estadísticas Conjuntas
• Coeficiente de Correlación Lineal de Karl Pearson
Sean X e Y dos variables de razón, entonces:

𝐶𝑜𝑣D,F
𝜌D,F = 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝜎D $ 𝜎F
𝐶𝑜𝑣D,F
𝑟D,F = 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑆D $ 𝑆F

Se utiliza para conocer el grado y sentido de la


asociación lineal entre X e Y
Y Y

X X

ρ o el r sirven para determinar si la distribución de las variables x e y se ajustan a una recta


-1 ≤ r ≤ 1
r = 0 -> No existe Asociación Lineal (A.L.)
r > 0 -> Existe A.L. Directa
Sentido o Tipo
r < 0 -> Existe A.L. Inversa
r ≈ 0 -> A.L. es Débil
Grado o Magnitud
r ≈ 1 o r ≈ -1 -> A.L. es Fuerte

Inversa No Existe Directa


-1 -0,5 0 0,5 1
Fuerte Débil Débil Fuerte
Ejercicios
1. Un estudio reciente realizado en Santiago midió la cantidad de contaminantes (ppm) y
el porcentaje de gases tóxicos. A continuación, se entrega una muestra aleatoria de 120
unidades de tomas de aire en suspensión:

Cantidad de contaminantes (ppm) Frecuencia Porcentaje de gases tóxicos


0 - 100 20 $"#%& #%&

100 - 200 60 ! 𝑥! = 39,3 ! 𝑥!% = 16,41


200 - 400 25 !"# !"#

400 - 500 15

1.1 Si se han suspendido algunas industrias que emiten contaminantes. De tal forma que
se reduce el porcentaje de gases tóxicos en un 8% y además se reduce la cantidad de
contaminantes en una 6% y 24 ppm. Compare homogeneidad entre la cantidad de
contaminantes y el porcentaje de gases tóxicos después de suspendidas las industrias.
1.2 Construya un gráfico para mostrar la distribución de la cantidad de contaminantes.
1.3 Qué porcentaje de las unidades muestreadas contienen contaminantes que fluctúan
entre 125 y 422 ppm.
1.4 Entre que valores fluctúa el 10% de los mayores niveles de contaminantes emitidos.
1. 𝑆𝑒𝑎 𝑋: 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑛𝑡𝑒𝑠 𝑝𝑝𝑚 𝑆" 𝑵𝒖𝒆𝒗𝒂 𝑽𝒂𝒓𝒊𝒂𝒃𝒍𝒆 Muestral Poblacional

𝑌: 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝐺𝑎𝑠𝑒𝑠 𝑇ó𝑥𝑖𝑐𝑜𝑠 𝐶𝑉" = 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑌2 = 𝑎 6 𝑋2 ± 𝑏


𝑥̅
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑆! = 𝑎 6 𝑆" 𝜎! = 𝑎 6 𝜎"
# # # # # #
1.1. 𝐶𝑜𝑚𝑝𝑎𝑟𝑎𝑟 ℎ𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 𝐶𝑉 𝑑𝑒𝑠𝑝𝑢é𝑠 𝑑𝑒𝑙 𝑐𝑎𝑚𝑏𝑖𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑆! = 𝑎 6 𝑆" 𝜎! = 𝑎 6 𝜎"

*Se modifican X e Y
𝑆𝑒𝑎
𝑋 ! : 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑛𝑡𝑒𝑠 𝑑𝑒𝑠𝑝𝑢é𝑠 𝑑𝑒 𝑠𝑢𝑠𝑝𝑒𝑛𝑑𝑖𝑑𝑎𝑠 𝑙𝑎𝑠 𝑖𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑎𝑠 𝑝𝑝𝑚 𝑜 𝑁𝑢𝑒𝑣𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑛𝑡𝑒𝑠
𝑥 ! = 𝑎 p 𝑥 ± 𝑏 = 0,94 p 𝑥 − 24
𝑌 ! : 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝐺𝑎𝑠𝑒𝑠 𝑇ó𝑥𝑖𝑐𝑜𝑠 𝑑𝑒𝑠𝑝𝑢é𝑠 𝑑𝑒 𝑠𝑢𝑠𝑝𝑒𝑛𝑑𝑖𝑑𝑎𝑠 𝑙𝑎𝑠 𝑖𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑎𝑠 𝑜 𝑁𝑢𝑒𝑣𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑔𝑎𝑠𝑒𝑠 𝑡ó𝑥𝑖𝑐𝑜𝑠
𝑦 ! = 𝑎 p 𝑦 ± 𝑏 = 0,92 p 𝑦
Xi X ni
50 0 - 100 20 𝑆"´ 𝑎 p 𝑆$ 0,94 p 𝑆" 0,94 p 122,5424 115,1899
𝑥̅ = 202,0833
150 100 - 200 60 → 𝐶𝑉"´ = = = = = = 0,6941
𝑆' = 122,5424 u
𝑥´ 𝑎 p 𝑥̅ ± 𝑏 0,94 p 𝑥̅ − 24 0,94 p 202,0833 − 24 165,9583
300 200 - 400 25
450 400 - 500 15
#%&
39,3 𝑆&´ 𝑎 p 𝑆& 0,92 p 𝑆& 𝑆& 0,1725
! 𝑦! = 39,3 𝑦7 = = 0,3275 𝑪𝑽𝒚´ = = = = = 𝑪𝑽𝒚 = = 0,5267
120 u
𝑦´ 𝑎 p 𝑦z ± 𝑏 0,92 p 𝑦z 𝑦z 0,3275
!"#
#%& → Si Y = a ! X , cuando b=0
16,41 − 120 : 0,3275 %
! 𝑦!% = 16,41 𝑆( = = 0,1725
CVx = CVy
!"# 119

R: La distribución del porcentaje de gases tóxicos después de suspendidas las


∑*'() 𝑥' } 𝑥'+ − 𝑛 𝑥̅ +
𝑥̅ = industrias (Y´) es más homogénea que la distribución de la cantidad de
𝑛 𝑆" = contaminantes después de suspendidas las industrias (X’), porque CVy’ < CVx’
𝑛−1
1. 𝑆𝑒𝑎 𝑋: 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑛𝑡𝑒𝑠 𝑝𝑝𝑚
𝑌: 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝐺𝑎𝑠𝑒𝑠 𝑇ó𝑥𝑖𝑐𝑜𝑠

1.2. 𝐺𝑟𝑎𝑓𝑖𝑐𝑎𝑟 𝑋: Histograma de Frecuencias Corregidas Frecuencia corregida


nicor o niaju
Ci X ni b nicor nicor Área = ni
100 0 - 100 20 1 20 A= base x altura
100 100 - 200 60 1 60 ni = b x nicor
200 200 - 400 25 2 12,5 60
100 400 - 500 15 1 15
V
Rangos
20
60
15
ni = 20
12,5 15
25

0 100 200 400 500 X


Formula de Percentil: se utiliza en variables continuas y tabuladas

Pp = Valor de variable en el porcentaje p (percentil)


p = Porcentaje a la izquierda del percentil (%)
X’j-1 = Límite inferior del intervalo
Cj = Amplitud del intervalo
n = Tamaño de muestra
Nj-1 = Frecuencia absoluta Acumulada intervalo anterior
nj = Frecuencia absoluta del intervalo
1. 𝑆𝑒𝑎 𝑋: 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑛𝑡𝑒𝑠 𝑝𝑝𝑚
𝑌: 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝐺𝑎𝑠𝑒𝑠 𝑇ó𝑥𝑖𝑐𝑜𝑠

1.3. 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑋 𝑒𝑛𝑡𝑟𝑒 125 𝑦 422


Ci X ni Ni Xmenor=0 Pp1=125 ppm Pp2=422 ppm Xmayor=500
100 0 - 100 20 20
100 100 - 200 60 80
200 200 - 400 25 105 0% 100%
p1 p=¿?=p2 - p1
100 400 - 500 15 120
n 120
p2
𝒑𝟏 p 𝟏𝟐𝟎
− 𝟐𝟎
𝟏𝟐𝟓 = 𝟏𝟎𝟎 + 𝟏𝟎𝟎 p 𝟏𝟎𝟎 → 𝒑𝟏 = 𝟐𝟗, 𝟏𝟕%
𝟔𝟎

𝒑𝟐 p 𝟏𝟐𝟎
− 𝟏𝟎𝟓
𝟒𝟐𝟐 = 𝟒𝟎𝟎 + 𝟏𝟎𝟎 p 𝟏𝟎𝟎 → 𝒑𝟐 = 𝟗𝟎, 𝟐𝟓%
𝟏𝟓

𝑝 = 𝒑𝟐 − 𝒑𝟏 = 𝟗𝟎, 𝟐𝟓 – 𝟐𝟗, 𝟏𝟕 = 61,08%

R: El 61,08% de las unidades muestreadas contienen


contaminantes que fluctúan entre 125 y 422 ppm
1. 𝑆𝑒𝑎 𝑋: 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐶𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑛𝑡𝑒𝑠 𝑝𝑝𝑚
𝑌: 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝐺𝑎𝑠𝑒𝑠 𝑇ó𝑥𝑖𝑐𝑜𝑠

1.4. 𝑅𝑎𝑛𝑔𝑜 𝑑𝑒𝑙 10% 𝑚𝑎𝑦𝑜𝑟 𝑑𝑒 𝑋


Ci X ni Ni Xmenor=0 𝑃. = 𝑃/0 Xmayor=500
100 0 - 100 20 20
100 100 - 200 60 80
200 200 - 400 25 105 0% 100%
90% 10%
100 400 - 500 15 120
n 120
R: [P90 ; 500]
𝑝 p 𝑛 90 p 120
Posición = = = 108
100 100

108 − 105
𝑃/0 = 400 + 100 p = 420 𝑝𝑝𝑚
15

R: El 10% de los mayores niveles de contaminantes emitidos


fluctúa entre 420 y 500 ppm.
Ejercicios
2. El gerente de una empresa supone que hay una relación lineal inversa entre el ausentismo laboral (Y) y la edad (X) de
los trabajadores. El gerente selecciona una muestra de 10 trabajadores con los siguientes resultados:

Edad (años) (x) 27 61 37 23 46 58 29 36 64 40


Días de ausentismo (y) 15 6 10 18 9 7 14 11 5 8

Analice el supuesto que ha formulado el gerente de la empresa. Justifique su respuesta con la medida descriptiva que
corresponda e indique cuál es la magnitud de esta relación.
𝑆𝑒𝑎 𝑥: 𝐸𝑑𝑎𝑑; 𝑦: 𝐴𝑢𝑠𝑒𝑛𝑡𝑖𝑠𝑚𝑜 𝑙𝑎𝑏𝑜𝑟𝑎𝑙
∑$!"# 𝑋! : 𝑌! 3817
X Y 𝑋𝑌 = = = 381,7
→ 𝑟",& = −0,9325 𝑛 10
27 15
61 6 R: El supuesto del Gerente esta en lo 𝐶𝑜𝑣',(
𝑟',( =
37 10 correcto, existe una relación lineal Inversa 𝑆' : 𝑆(
23 18 entre X e Y (r < 0), y es una relación de
46 9 grado o magnitud Fuerte (r ≈ - 1). 𝐶𝑜𝑣',(
−0,9325 =
58 7 14,6701 : 4,2177
29 14 Si la Edad (x) aumenta, los días de ausentismo (y) disminuyen 𝐶𝑜𝑣',( = −0,9325 : 14,6701 : 4,2177
36 11 Si la Edad (x) disminuye, los días de ausentismo (y) aumentan
64 5 𝐶𝑜𝑣',( = −57,6976
40 8

También podría gustarte