Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.1 Introducción
¿Qué es estadística?
Ciencia que estudia los métodos para la recolección, organización, análisis e interpretación
de datos.
9
Nivel de satisfacción
8
7
Número de estudiantes
6
Alto
15%
5
Medio
4
40%
3
2
Bajo
1 45%
0
Administración I. Civil I. Eléctrica I. Química Matemática
Carrera
1 2 0 4 7 5 3 5 4 3
4 7 6 7 4 3 2 1 3 2
3 2 1 4 3 0 0 0 1 4
1. Distribución de frecuencias.
2. Tablas cruzadas o de contingencia.
3. Tablas cruzadas porcentuales.
4. Tablas marginales porcentuales.
Tablas estadísticas para datos agrupados
Nombre Código Carrera Semestre Género Estado civil Edad Estatura(m) Peso(kg) IMC(kg/m2) Nivel de satisfacción
2, 4, 6, 7, 10, 13.
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏 𝒇𝟏 𝒙𝟏 + 𝒇𝟐 𝒙𝟐 + 𝒇𝟑 𝒙𝟑 + ⋯ + 𝒇𝒎 𝒙𝒎 𝒚𝟏 𝒇𝟏 + 𝒚𝟐 𝒇𝟐 + 𝒚𝟑 𝒇𝟑 + ⋯ + 𝒚𝒎 𝒇𝒎
𝝁=𝒙= 𝝁=𝒙= 𝝁=𝒙=
𝒏 𝒏 𝒏
𝒏 𝒎
𝒊=𝟏 𝒙𝒊 𝒎
𝒊=𝟏 𝒚𝒊 𝒇𝒊
𝝁=𝒙= 𝒊=𝟏 𝒇𝒊 𝒙𝒊 𝝁=𝒙=
𝒏 𝝁=𝒙= 𝒏
𝒏
Las 𝒇𝒊 representan las frecuencias absolutas. Las 𝒚𝒊 representan las marcas de clase.
Propiedades de la media
𝑥1 𝑛1 + 𝑥2 𝑛2
𝑥= ,
𝑛1 + 𝑛2
donde, 𝑛1 , 𝑛2 son los tamaños de las submuestras y 𝑥1 , 𝑥2 sus medias aritméticas.
Media como centro de masa o punto de
equilibrio
5+1+2+5+8+0+3+2+2+1
𝑥= = 2.9
10
Diagrama de puntos
0 4 [46,54) 50 3
1 5 [54,62) 58 8
[62,70) 66 11
2 2
[70,78) 74 7
3 9
[78,86) 82 9
4 7
[86,94] 90 2
Total 27
Total 40
Promedio = 25 Promedio = 25
Rango = 49 Rango = 2
La alta variabilidad en los datos indica La poca variabilidad en los datos indica
que el promedio encontrado es POCO que el promedio encontrado es MUY
representativo. representativo.
1.3.2 Medidas de dispersión o variabilidad
Considere las mediciones 5, 7, 1, 2, 4. ¿Cómo analizar su variación?, ¿respecto a qué medir la dispersión?
La varianza será relativamente grande para datos muy variables y relativamente pequeña
para datos menos variables.
Ejemplo: Calcular la varianza de los datos 5, 7, 1, 2, 4.
En datos agrupados, la fórmula para la varianza es
𝑛 2
𝑖=1 𝑓𝑖 𝑥𝑖 − 𝜇
𝜎2 =
𝑁
Propiedades de la varianza
1. 𝑠 2 ≥ 0.
2. La varianza de una constante es 0. V[k] = 0.
3. La varianza de una variable más una constante, es igual a la varianza de la
variable. V[x + k] = V[x].
4. La varianza de una constante por una variable, es igual al cuadrado de la
constante por la varianza de la variable. V[k x] = 𝑘 2 V[x].
Desviación típica o estándar (s − 𝜎)
𝑛 2
𝑖=1 𝑥𝑗 − 𝜇
𝜎 =
𝑁
𝑛 2
𝑖=1 𝑓𝑖 𝑥𝑖 − 𝜇
𝜎=
𝑁
68 % 95 % 99.7 %
Puntuaciones típicas
𝑥𝑖 − 𝑥
𝑧𝑖 =
𝑠
|𝑥𝑖 − 𝑀𝑒 | 𝑦𝑖 − 𝑀𝑒 𝑛𝑖
𝐷𝑒 = 𝐷𝑒 =
𝑛 𝑛
Datos no agrupados Datos agrupados
Otras medidas de variación
Ejemplo: Con los datos 16, 10, 4, 8, 12, 10, 8, 20, 4, 13, 12, 22, 26, 20, 16, hallar:
• Primer y tercer cuartil
• Cuarto y sexto decil
• Percentil 30 y 90
Interpolación de cuartiles, deciles y percentiles
Parte decimal
Si la posición de 𝑄𝑖 = 𝑍, 𝑑 entonces:
Parte entera
12 10 25 𝑥𝑗−1 + 𝑥𝑗
Caso 1: Si 𝑁𝑗−1 = 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 =
16 18 43 2
Caso 2: Si 𝑁𝑗−1 < 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗
20 10 53
24 6 59
28 20 79
32 8 87
36 3 90
Total 90
1.3.3 Medidas de Posición
[10,14) 12 10 25 Caso 1: Si 𝑁𝑗−1 = 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗−1 (𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒)
𝑖𝑛
−𝑁𝑗−1
[14,18) 16 18 43 {4,10,100}
Caso 2: Si 𝑁𝑗−1 < 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗−1 + 𝑐
𝑛𝑗
[18,22) 20 10 53
[22,26) 24 6 59
[26,30) 28 20 79
[30,34) 32 8 87
[34,38] 36 3 90
Total 90
Medidas de posición y valores atípicos
𝑥𝑘 < 𝑄1 − 1.5(𝑄3 − 𝑄1 )
𝑥𝑘 > 𝑄3 + 1.5(𝑄3 − 𝑄1 )
Rango Intercuartil (RIC)
4 4
𝑥𝑖 − 𝑥 𝑓𝑖 𝑥𝑖 − 𝑥
𝐴𝑝 = 𝐴𝑝 =
𝑛𝑠 4 𝑛𝑠 4
Datos no agrupados Datos agrupados
𝐴𝑝 > 3 𝐴𝑝 = 3 𝐴𝑝 < 3