Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Organización,
presentación y
descripción de datos
M . C . N A N C Y TO R I Z R O B L E S
2020 -2021
II SEMESTRE
Aplicar la estadística
descriptiva para la
organización, presentación
gráfica y cálculo de cantidades
Objetivo representativas de un grupo
de datos.
Contenido
1. Introducción
2. Organización y presentación de datos
3. Medidas de localización
4. Medidas de dispersión
5. Selección de medidas descriptivas
¿Qué es la Estadística?
¿A qué la aplico?
¿Cuándo la aplico?
¿Qué me interesa?
¿Qué es la Estadística?
✓ Como rama de las matemáticas, y utilizando el cálculo de
probabilidades, la estadística estudia los fenómenos o experimentos
aleatorios intentando deducir leyes sobre los mismos y aplicando
dichas leyes para la predicción y toma de decisiones.
✓ Estudio que reúne, clasifica y recuenta todos los hechos que tienen
una determinada característica en común, para poder llegar a
conclusiones a partir de los datos numéricos extraídos.
Fuentes de información
“confiables”
Atendiendo a su procedencia o generación, las llamadas fuentes de
información se clasifican en:
Muestra de Aliens
Conceptos básicos
Dato: Manifestación de un fenómeno de forma cualitativa o numérica.
➢Cuantitativas o numéricas: sus valores son numéricos (tiene sentido hacer operaciones algebraicas
con ellos)
➢ Discretas: Si toma valores enteros
➢ Número de hijos, Número de libros leidos, Num. de “cumpleaños”
➢ Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
➢ Altura, Salario bruto anual, Gasto farmaceútico, edad (años, meses, horas…)
1. Mi primer salario:
Ejercicio 1
3. Número de grupos en el
Clasificar las Departamento de Ingeniería
siguientes variables Agroindustrial:
✓ Tamaño de la población: N
✓ Valores de la variable o modalidades: xi
✓ Número de modalidades: k
✓ Recorrido o campo de variación: {x1, ... , xk }
✓ Supuesto: x1 < x2 < ... < xk
Ejercicio 2
https://docs.google.com/for
ms/d/e/1FAIpQLSe9yGPP4-
AHYL1jNLT7iq0alLRwiO23L4
UX5UL1AnX777R80Q/viewf
orm?usp=sf_link
Ejercicio 3
https://docs.google.com/for
ms/d/e/1FAIpQLScg7dRh7b
D9vzZ0TebVdQ54VlAURGOD
u2sIw9QEx3OmYoRQKQ/vie
wform?usp=sf_link
➢ Rango de los
datos (Mínimo –
Máximo).
➢ Intervalos más
frecuentes.
➢ Simetría o
Asimetría.
Polígonos de frecuencias
16
14
Frecuencia Absoluta
12
10
Polígonos de 4
Frecuencia 2
0
-Esta representación se 1,465 1,497 1,529 1,561 1,593 1,625 1,657 1,689
variable. 7000
6.948
5.943
6000
frecuencia. 4000
3.829
3000
981
➢ Si tiene dos o más valores con la misma frecuencia máxima decimos que la
distribución es bimoda, trimodal, multimodal, etc.
➢ Son tan importantes como las medidas de tendencia central y así como éstas
son valores puntuales en una distribución, las medidas de dispersión son
intervalos, distancias o un número de unidades en la escala de medición.
Frecuencia Absoluta
Frecuencia Absoluta
17 17 7 7 7 7
16 16 6 6
1 2 2 1 3 1 1 3
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
Grupo 1 Grupo 2 Grupo 3
¿Qué se observa en las imágenes?
Rango
❖ El Rango, Recorrido o Amplitud de un conjunto de mediciones, es la
diferencia entre el valor máximo y el mínimo.
Ejercicio
¿Cual es el rango de las edades de hombres y mujeres del grupo?
¿Quiénes presentan mayor variación?
Desviación Estándar
❖ Es la medida de dispersión más ampliamente usada. Es la más estable ya que
depende de todos los valores de la distribución.
❖ Se expresa en la misma unidad de medida que la media y los datos.
❖ A medida que aumenta la desviación estándar >>> mayor diversidad habrá
entre las observaciones de una muestra
Población Muestra
σ𝑵
𝒊=𝟏 𝒙𝒊 − 𝝁
𝟐 σ𝒏𝒊=𝟏 𝒙𝒊 − 𝒙
ഥ 𝟐
𝝈= 𝑺=
𝑵 𝒏−𝟏
❖ Donde
❖ 𝑵 tamaño de la población
❖ 𝒏 tamaño de la muestra
❖ 𝒊 = 𝟏, 𝟐, … 𝑵 ó 𝒏 número de datos
Varianza
➢ Es una medida que se usa en pruebas de hipótesis estadísticas, p. ej.
ANOVA.
➢ La varianza es la desviación estándar elevada al cuadrado.
Población Muestra
𝑵 𝟐 σ𝒏 𝟐
σ𝒊=𝟏 𝒙𝒊 − 𝝁
ഥ
𝒊=𝟏 𝒙𝒊 − 𝒙
𝟐
𝝈 = 𝑺𝟐 =
𝑵 𝒏−𝟏
𝑆
❑ ¿Cuál de los dos productos tiene mayor dispersión de datos? 𝐶𝑉 = ത
𝑋
𝑆𝐴 280 ℎ𝑜𝑟𝑎𝑠
𝐶𝑉𝐴 = = = 0.1873 = 18.73%
𝑋ത𝐴 1495 ℎ𝑜𝑟𝑎𝑠
𝑆𝐵 310 ℎ𝑜𝑟𝑎𝑠
𝐶𝑉𝐵 = = = 0.1653 = 16.53%
𝑋ത𝐵 1875 ℎ𝑜𝑟𝑎𝑠
❑ Tiene más dispersión de datos el producto A.
Selección de medidas
descriptivas
Al elegir una medida de tendencia central se debe tomar en
cuenta:
Población Muestra
𝑪𝒐𝒗(𝑿, 𝒀) 𝑪𝒐𝒗(𝑿, 𝒀)
𝝆𝑿𝒀 = 𝒓𝑿𝒀 =
𝝈𝑿 𝝈𝒚 𝑺𝑿 𝑺𝒚
Edad (x) 56 42 72 36 63 47 55 49 38 42 68 60
Presión
147 125 160 118 149 128 150 145 115 140 152 155
sanguínea (y)
a) Determinar la covarianza entre las dos variables.
σ𝑵
𝒊=𝟏(𝒙𝒊 −𝝁𝒙 )(𝒚𝒊 −𝝁𝒚 )
𝑪𝒐𝒗𝒙𝒚 =
𝑵
b) Determinar el coeficiente de correlación entre las dos variables.
𝑪𝒐𝒗(𝑿,𝒀)
𝝆𝑿𝒀 =
𝝈𝑿 𝝈𝒚
Ejercicio
Edad (x) 56 42 72 36 63 47 55 49 38 42 68 60
Presión
147 125 160 118 149 128 150 145 115 140 152 155
sanguínea (y)
a) Determinar la covarianza entre las dos variables.
σ𝑵𝒊=𝟏(𝒙𝒊 − 𝝁𝒙 )(𝒚𝒊 − 𝝁𝒚 )
𝑪𝒐𝒗𝒙𝒚 =
𝑵
𝒙𝟏 − 𝝁𝒙 𝒚𝟏 − 𝝁𝒚 + 𝒙𝟐 − 𝝁𝒙 𝒚𝟐 − 𝝁𝒚 + ⋯ + 𝒙𝟏𝟐 − 𝝁𝒙 𝒚𝟏𝟐 − 𝝁𝒚
=
𝑵
1. Primero… determinar la media de 𝒙 y 𝒚.
σ𝑵
𝒊=𝟏 𝒙𝒊 𝟓𝟔+𝟒𝟐+⋯+𝟔𝟎
𝝁𝒙 = = = 𝟓𝟐. 𝟑𝟑
𝑵 𝟏𝟐
σ𝑵
𝒊=𝟏 𝒚𝒊 𝟏𝟒𝟕+𝟏𝟐𝟓+⋯+𝟏𝟓𝟓
𝝁𝒚 = 𝑵
= 𝟏𝟐
= 𝟏𝟒𝟎. 𝟑𝟑
Ejercicio
X Y ഥ 𝒚𝒊 − 𝒚
𝒙𝒊 − 𝒙 ഥ (𝒙𝒊 − 𝒙 ഥ) a) Determinar la covarianza entre las dos
ഥ)(𝒚𝒊 − 𝒚
variables.
56 147 3.67 6.67 24.44
σ𝑵𝒊=𝟏(𝒙𝒊 − 𝝁𝒙 )(𝒚𝒊 − 𝝁𝒚 )
42 125 -10.33 -15.33 158.44 𝑪𝒐𝒗𝒙𝒚 =
72 160 19.67 19.67 386.78 𝑵
36 118 -16.33 -22.33 364.78 2. Determinar la diferencia de cada
63 149 10.67 8.67 92.44 observación con respecto a la media y la
47 128 -5.33 -12.33 65.78 multiplicación de las diferencias para 𝑥 y 𝑦.
55 150 2.67 9.67 25.78 3. Sumar.
49 145 -3.33 4.67 -15.56
38 115 -14.33 -25.33 363.11 4. Calcular la covarianza
42 140 -10.33 -0.33 3.44 σ𝑵
𝒊=𝟏(𝒙𝒊 −𝝁𝒙 )(𝒚𝒊 −𝝁𝒚 ) 𝟏𝟕𝟔𝟒.𝟔𝟕
68 152 15.67 11.67 182.78 𝑪𝒐𝒗𝒙𝒚 = 𝑵
= 𝟏𝟐
=
60 155 7.67 14.67 112.44 𝟏𝟒𝟕. 𝟎𝟔
Σ 1,764.67
Ejercicio
b) Determinar el coeficiente de correlación
ഥ
𝒙𝒊 − 𝒙 𝟐 ഥ
𝒚𝒊 − 𝒚 𝟐
X Y entre las dos variables.
56 147 13.44 44.44 𝑪𝒐𝒗(𝑿, 𝒀)
𝝆𝑿𝒀 =
42 125 106.78 235.11 𝝈𝑿 𝝈𝒚
72 160 386.78 386.78
1. Determinar las desviaciones estándar de X y
36 118 266.78 498.78
Y.
63 149 113.78 75.11
47 128 28.44 152.11 σ𝑵
𝒊=𝟏 𝒙𝒊 −𝝁𝒙
𝟐
170
160
Presión sanguínea (y)
150
140
130
120
110
35 40 45 50 55 60 65 70 75
Edad (x)