Está en la página 1de 53

CAPÍTULO 1:ESTADÍSTICA DESCRIPTIVA

1.1 Introducción

¿Qué es estadística?
Ciencia que estudia los métodos para la recolección, organización, análisis e interpretación
de datos.

¿Para qué sirve la estadística?


Para obtener conclusiones válidas sobre un conjunto de datos a fin de tomar decisiones
acertadas.

¿Qué etapas tiene un estudio estadístico?


1. Recolección de datos.
2. Organización y representación de datos.
3. Análisis de la información.
4. Obtención de conclusiones y toma de decisiones.
Clasificación de la Estadística

Estadística descriptiva Estadística inferencial


La estadística descriptiva está El objetivo de la estadística
formada por procedimientos inferencial es hacer inferencias (es
empleados para resumir y describir las decir, sacar conclusiones, hacer
características importantes de un predicciones, tomar decisiones)
conjunto de mediciones. acerca de las características de una
• Gráficas de barras. población a partir de información
contenida en una muestra.
• Gráficas de pastel.
• Representatividad de una muestra.
• Gráficas de líneas.
• Muestreo
• Tablas de frecuencias.
• Medidas de variabilidad, de
• Prueba de hipótesis
tendencia, de posición, etc. • Intervalos de confianza.
Base de datos
Nombre Código Carrera Semestre Género Estado civil Edad Estatura(m) Peso(kg) IMC(kg/m2) Nivel de satisfacción

1 Alejandro 1816 I. Química 4 M Soltero 17 1,67 58,5 21,0 Bajo


2 Angela 1531 I. Química 5 F Unión Libre 16 1,8 92,6 28,6 Alto
3 Antonio 1284 I. Eléctrica 8 M Divorciado 26 1,59 51,5 20,4 Medio
4 Camilo 1695 Administración 6 M Divorciado 22 1,7 83,2 28,8 Bajo
5 Carmen 1291 Matemática 10 F Divorciado 27 1,74 69,9 23,1 Bajo
6 Daniela 1658 Administración 8 F Casado 20 1,73 55,1 18,4 Medio
7 David 1674 I. Química 2 M Soltero 16 1,74 71,6 23,7 Medio
8 Elena 1932 I. Civil 9 F Casado 22 1,51 81,1 35,6 Bajo
9 Eliana 1330 I. Civil 4 F Unión Libre 25 1,71 63,5 21,7 Bajo
10 Esteban 1723 I. Química 2 M Soltero 23 1,55 74,3 30,9 Medio
11 Estefania 1674 I. Civil 8 F Divorciado 18 1,71 53,9 18,4 Bajo
12 Felipe 1931 I. Eléctrica 7 M Casado 24 1,62 64,6 24,6 Bajo
13 Guillermo 1516 Matemática 9 M Casado 19 1,69 100,5 35,2 Medio
14 Javier 1056 I. Civil 7 M Unión Libre 28 1,64 69,8 26,0 Alto
15 Jeronimo 1968 I. Eléctrica 8 M Casado 21 1,53 98,4 42,0 Bajo
16 Jorge 1675 I. Química 2 M Unión Libre 18 1,67 52,4 18,8 Bajo
17 Jose 1657 I. Química 9 M Soltero 24 1,65 96,8 35,6 Medio
18 Karen 1517 I. Química 9 F Divorciado 16 1,51 55,0 24,1 Medio
19 Marcela 1573 I. Eléctrica 9 F Casado 23 1,67 83,3 29,9 Alto
20 Mariana 1968 I. Química 2 F Divorciado 22 1,54 99,3 41,9 Medio
Gráficos estadísticos

9
Nivel de satisfacción
8

7
Número de estudiantes

6
Alto
15%
5
Medio
4
40%
3

2
Bajo
1 45%

0
Administración I. Civil I. Eléctrica I. Química Matemática

Carrera

Diagrama de barras Diagrama circular


Conceptos básicos de estadística

• Población: Conjunto de elementos que se someten a un estudio estadístico.


• Individuo: Cada elemento que hace parte de la población.
• Muestra: Conjunto representativo de la población.
• Variable: Características o cualidades que poseen los individuos de una población.
• Variable cualitativa: Cualidades que NO se representan numéricamente.
• Nominal: Cualidades NO numéricas que NO admiten orden.
• Ordinal: Cualidades NO numéricas que SI admiten orden.
• Variable cuantitativa: Cualidades que SI se representan numéricamente.
• Discreta: Cualidades numéricas con valores enteros.
• Continua: Cualidades numéricas que admiten valores entre dos enteros.
Ejemplo

Considere el siguiente conjunto de datos

Plantear una situación en la cual se identifique:


• Población
• Muestra
• Tipo de variable
• Objeto de investigación (qué se estudia)
• Finalidad de la investigación (para qué)
• Recolección de datos
• Organización y representación de datos
Ejemplo

Considere el siguiente conjunto de datos


SITUACIÓN:
En el nuevo centro comercial
Mall Plaza de la ciudad de
Manizales, se consultó la edad a
todas las personas que entraban
entre las 12:00 h y 12:30 h. Los
datos registrados corresponden
a las edades de los clientes.
Plantear una situación en la cual se identifique:
• Población: Habitantes de Manizales
• Muestra: Personas que asisten al centro comercial en el tiempo indicado
• Tipo de variable: Cuantitativa discreta
• Objeto de investigación (qué se estudia): Edades de los clientes
• Finalidad de la investigación: Realizar actividades apropiadas para la población que visita el CC en ese tiempo
• Recolección de datos: Encuestas
• Organización y representación de datos: Tablas de frecuencias y diagramas de barras
Ejercicio

Considere los siguientes datos:

1 2 0 4 7 5 3 5 4 3
4 7 6 7 4 3 2 1 3 2
3 2 1 4 3 0 0 0 1 4

Plantear una situación en el contexto de su carrera en la cual se identifique:


• Población
• Muestra
• Tipo de variable
• Objeto de investigación (qué se estudia)
• Finalidad de la investigación (para qué se hace la investigación)
• Recolección de datos
• Organización y representación de datos
1.2 Tablas estadísticas para datos no agrupados

1. Distribución de frecuencias.
2. Tablas cruzadas o de contingencia.
3. Tablas cruzadas porcentuales.
4. Tablas marginales porcentuales.
Tablas estadísticas para datos agrupados
Nombre Código Carrera Semestre Género Estado civil Edad Estatura(m) Peso(kg) IMC(kg/m2) Nivel de satisfacción

1 Alejandro 1816 I. Química 4 M Soltero 17 1,67 58,5 21,0 Bajo


2 Angela 1531 I. Química 5 F Unión Libre 16 1,8 92,6 28,6 Alto
3 Antonio 1284 I. Eléctrica 8 M Divorciado 26 1,59 51,5 20,4 Medio
4 Camilo 1695 Administración 6 M Divorciado 22 1,7 83,2 28,8 Bajo
5 Carmen 1291 Matemática 10 F Divorciado 27 1,74 69,9 23,1 Bajo
6 Daniela 1658 Administración 8 F Casado 20 1,73 55,1 18,4 Medio
7 David 1674 I. Química 2 M Soltero 16 1,74 71,6 23,7 Medio
8 Elena 1932 I. Civil 9 F Casado 22 1,51 81,1 35,6 Bajo
9 Eliana 1330 I. Civil 4 F Unión Libre 25 1,71 63,5 21,7 Bajo
10 Esteban 1723 I. Química 2 M Soltero 23 1,55 74,3 30,9 Medio
11 Estefania 1674 I. Civil 8 F Divorciado 18 1,71 53,9 18,4 Bajo
12 Felipe 1931 I. Eléctrica 7 M Casado 24 1,62 64,6 24,6 Bajo
13 Guillermo 1516 Matemática 9 M Casado 19 1,69 100,5 35,2 Medio
14 Javier 1056 I. Civil 7 M Unión Libre 28 1,64 69,8 26,0 Alto
15 Jeronimo 1968 I. Eléctrica 8 M Casado 21 1,53 98,4 42,0 Bajo
16 Jorge 1675 I. Química 2 M Unión Libre 18 1,67 52,4 18,8 Bajo
17 Jose 1657 I. Química 9 M Soltero 24 1,65 96,8 35,6 Medio
18 Karen 1517 I. Química 9 F Divorciado 16 1,51 55,0 24,1 Medio
19 Marcela 1573 I. Eléctrica 9 F Casado 23 1,67 83,3 29,9 Alto
20 Mariana 1968 I. Química 2 F Divorciado 22 1,54 99,3 41,9 Medio
Pasos para elaborar una tabla de frecuencias
para datos agrupados
1. Calcular el rango o recorrido de los datos mediante la fórmula
𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛

2. Seleccionar el número de intervalos o clases, m (5 ≤ 𝑚 ≤ 16), mediante la fórmula


𝑚 = 1 + 3.3 log 𝑛 (Fórmula de Sturges)

Si m es un número decimal se acostumbra aproximar al entero más cercano (aunque no es obligación).

3. Calcular la amplitud C de cada intervalo mediante la fórmula


𝑅𝑎𝑛𝑔𝑜
𝐶=
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠

IMPORTANTE: Si C es un número decimal, SIEMPRE debe aproximarse a la parte entera superior.


1.3 Descripción de datos con medidas
numéricas

Definición: Las mediciones descriptivas numéricas asociadas con una


población se llaman parámetros; las calculadas a partir de una
muestra reciben el nombre de estimadores (estadísticas o
estadígrafos). Medidas de tendencia central Medidas de dispersión
• Media aritmética • Rango
• Mediana • Varianza
1. Medidas de tendencia central • Moda • Desviación típica o estándar
• Media geométrica • Desviación media
2. Medidas de dispersión
• Media armónica • Desviación mediana
3. Medidas de posición • Media cuadrática • Coeficiente de variación
• Media cúbica • Coeficiente de desviación media
4. Medidas de forma
Medidas de posición Medidas de forma
• Cuartiles • Asimetría
• Deciles • Apuntamiento
• Percentiles
1.3.1 Medidas de tendencia central
Las medidas de tendencia central se utilizan para describir un conjunto de datos a partir de un solo valor.

MEDIA, MEDIA ARITMÉTICA O PROMEDIO


Datos no agrupados Datos agrupados de variable discreta Datos agrupados de variable continua
Calcular el promedio de los datos Calcular el promedio de los datos Calcular el promedio de los datos

2, 4, 6, 7, 10, 13.

𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏 𝒇𝟏 𝒙𝟏 + 𝒇𝟐 𝒙𝟐 + 𝒇𝟑 𝒙𝟑 + ⋯ + 𝒇𝒎 𝒙𝒎 𝒚𝟏 𝒇𝟏 + 𝒚𝟐 𝒇𝟐 + 𝒚𝟑 𝒇𝟑 + ⋯ + 𝒚𝒎 𝒇𝒎
𝝁=𝒙= 𝝁=𝒙= 𝝁=𝒙=
𝒏 𝒏 𝒏
𝒏 𝒎
𝒊=𝟏 𝒙𝒊 𝒎
𝒊=𝟏 𝒚𝒊 𝒇𝒊
𝝁=𝒙= 𝒊=𝟏 𝒇𝒊 𝒙𝒊 𝝁=𝒙=
𝒏 𝝁=𝒙= 𝒏
𝒏
Las 𝒇𝒊 representan las frecuencias absolutas. Las 𝒚𝒊 representan las marcas de clase.
Propiedades de la media

1. La media de un variable aumentada (o disminuida) en una constante, es igual a la


media de la variable más (menos) la constante. M[x + k] = M[x] + k.
2. La media de una variable multiplicada por un factor k, es igual a la media de la
variable escalada en el mismo factor k. M[k x] = k M[x].
3. La media aritmética de una constante k es la misma constante k. M[ k ] = k.
4. El promedio de la suma de dos variables, es igual a la suma de los promedios de
cada variable. M[x + y] = M[x] + M[y].
5. La media de una muestra es igual a la media ponderada de sus submuestras. Esto es:

𝑥1 𝑛1 + 𝑥2 𝑛2
𝑥= ,
𝑛1 + 𝑛2
donde, 𝑛1 , 𝑛2 son los tamaños de las submuestras y 𝑥1 , 𝑥2 sus medias aritméticas.
Media como centro de masa o punto de
equilibrio

Se preguntó a 10 estudiantes por la cantidad de libros leídos el año pasado y


se obtuvieron los resultados mostrados en la tabla. Calcule el promedio de
libros leídos e interprete este resultado como el punto de equilibrio.

5+1+2+5+8+0+3+2+2+1
𝑥= = 2.9
10

Diagrama de puntos

Media como centro de masa


Media Ponderada

En ocasiones se asocia a los valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 unos pesos 𝑤1 , 𝑤2 , … , 𝑤𝑛


dependientes de la relevancia asignada a cada número. En tal caso
𝒏
𝒊=𝟏 𝒘𝒊 𝒙𝒊 𝒘𝟏 𝒙𝟏 + 𝒘𝟐 𝒙𝟐 + 𝒘𝟑 𝒙𝟑 + ⋯ + 𝒘𝒏 𝒙𝒏
𝝁=𝒙= 𝒏 =
𝒊=𝟏 𝒘𝒊 𝒘𝟏 + 𝒘𝟐 … + 𝒘𝒏

se llama media aritmética ponderada.

Ejemplo: Si el examen final de un curso vale el triple de un examen parcial, y un


estudiante obtuvo 85 en la evaluación final y 70 y 90 en los dos parciales, cuál es la
calificación media.
Mediana (Me)

La mediana de n observaciones 𝑥1 , 𝑥2 , … , 𝑥𝑛 puede definirse como el


valor “más céntrico”, una vez que los datos se ordenan según su
tamaño, es decir, de forma ascendente o descendente.

CÁLCULO DE LA MEDIANA EN DATOS NO AGRUPADOS

Ordenados los n datos por su tamaño:


• Si n es impar, Me corresponde al valor del centro.
• Si n es par, Me corresponde al promedio de los dos valores
centrales.
Mediana (Me)

CÁLCULO DE LA MEDIANA EN DATOS AGRUPADOS


Variable discreta 𝑥𝑗 son datos y n es el número total de datos.
𝑥𝑗−1 + 𝑥𝑗 𝑛 𝑛
Caso 1: 𝑀𝑒 = 𝑠𝑖 𝑁𝑗−1 = Caso 2: 𝑀𝑒 = 𝑥𝑗 𝑠𝑖 𝑁𝑗−1 <
2 2 2
𝒙𝒋 𝒏𝒋 𝑵𝒋 𝒙𝒋 𝒏𝒋 𝑵𝒋
0 4 4 0 4 4
1 5 9 1 5 9
2 6 15 2 7 16
3 7 22 3 8 24
4 8 30 4 6 30
Total 30 Total 30
Mediana (Me)

CÁLCULO DE LA MEDIANA EN DATOS AGRUPADOS


Variable continua 𝑥𝑗−2 y 𝑥𝑗−1 son los límites inferior y superior de cada intervalo respectivamente.
𝑛
𝑛 − 𝑁𝑗−1 𝑛
Caso 1: 𝑀𝑒 = 𝑥𝑗−1 𝑠𝑖 𝑁𝑗−1 = Caso 2: 𝑀𝑒 = 𝑥𝑗−1 + 𝑐 2
𝑠𝑖 𝑁𝑗−1 <
2 𝑛𝑗 2
Marca de Marca de
𝒙𝒋−𝟐 − 𝒙𝒋−𝟏 𝒏𝒋 𝑵𝒋 𝒙𝒋−𝟐 − 𝒙𝒋−𝟏 𝒏𝒋 𝑵𝒋
clase (𝒚𝒋 ) clase (𝒚𝒋 )
[46,54) 50 3 3 [46,54) 50 3 3
[54,62) 58 8 11 [54,62) 58 8 11
[62,70) 66 9 20 [62,70) 66 11 22
[70,78) 74 10 30 [70,78) 74 7 29
[78,86) 82 8 38 [78,86) 82 9 38
[86,94] 90 2 40 [86,94] 90 2 40
Total 40 Total 40
Moda, modo o valor modal (Md)

La moda de n observaciones 𝑥1 , 𝑥2 , … , 𝑥𝑛 es el valor de la variable que


más se repite. Si una distribución posee dos modas, se llama bimodal;
si posee más de dos modas se llama multimodal o plurimodal.
Notar que esta medida es la única que se puede emplear para
atributos, es decir, para variables cualitativa.
DATOS NO AGRUPADOS
Ejemplo 1: Calcular la media, mediana y moda de los datos 5, 10, 8, 5,
10, 18, 5, 12, 5, 12.
Ejemplo 2: Calcular la media, mediana y moda de los datos 13, 4, 8, 9,
10, 12, 16, 6, 11.
Moda, modo o valor modal (Md)

DATOS AGRUPADOS CON VARIABLE DISCRETA O CONTINUA


Variable discreta Variable continua
𝒙𝒋 𝒏𝒋 𝒙𝒋−𝟏 − 𝒙𝒋 Marca de clase (𝒚𝒋 ) 𝒏𝒋

0 4 [46,54) 50 3

1 5 [54,62) 58 8
[62,70) 66 11
2 2
[70,78) 74 7
3 9
[78,86) 82 9
4 7
[86,94] 90 2
Total 27
Total 40

En datos agrupados, tanto en variable discreta como en variable continua, la


moda corresponde al dato con mayor frecuencia absoluta.
Relación entre media, mediana y moda

Si 𝑥 = 𝑀𝑒 = 𝑀𝑑 , la distribución se llama simétrica.


Si 𝑥 > 𝑀𝑒 > 𝑀𝑑 , la distribución se llama asimétrica positiva (asimetría a derecha).
Si 𝑥 < 𝑀𝑒 < 𝑀𝑑 , la distribución se llama asimétrica negativa (asimetría a izquierda).
Relación entre media, mediana y moda
Otras medidas de tendencia central

1. Media geométrica (𝑴𝑮 - 𝑴𝟎 ): Dados n valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 positivos, su media


geométrica se define como la raíz n- ésima del producto de tales valores.

𝑛 En datos agrupados la fórmula es


𝑛
𝑛
𝑀𝐺 = 𝑥1 . 𝑥2 . … . 𝑥𝑛 = 𝑥𝑖 𝑀𝐺 =
𝑛 𝑛
𝑥𝑖 𝑖
𝑖=1

2. Media armónica (𝑴𝑯 - 𝑴−𝟏 ): La media armónica de los valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 , es


el recíproco de la media aritmética de los recíprocos de tales valores.

𝑛 En datos agrupados la fórmula es


𝑀𝐻 = 𝑛
1 𝑀𝐻 =
𝑛𝑖
𝑥𝑖 𝑥𝑖
Otras medidas de tendencia central

3. Media cuadrática (𝑴𝟐 ): La media cuadrática de los valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 , es la


raíz cuadrada de la media aritmética de los cuadrados de tales valores.

𝑥𝑖2 𝑥12 + 𝑥22 + ⋯ + 𝑥𝑛2


𝑀2 = =
𝑛 𝑛
4. Media cúbica (𝑴𝟑 ): La media cúbica de los valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 , es la raíz cúbica
de la media aritmética de los cubos de tales valores.

En datos agrupados la fórmula es


3 𝑥𝑖3 3 𝑥13 + 𝑥23 + ⋯ + 𝑥𝑛3
𝑀3 = = 𝑘 𝑦𝑖𝑘 𝑛𝑖
𝑛 𝑛 𝑀𝑘 = , 𝑑𝑜𝑛𝑑𝑒 𝑘 = 2 ó 3
𝑛
1.3.2 Medidas de dispersión o variabilidad

Las distribuciones presentan la misma mediana pero diferente variabilidad.


1.3.2 Medidas de dispersión o variabilidad

1, 24 y 50 años 24, 25 y 26 años

Promedio = 25 Promedio = 25

Rango = 49 Rango = 2

La alta variabilidad en los datos indica La poca variabilidad en los datos indica
que el promedio encontrado es POCO que el promedio encontrado es MUY
representativo. representativo.
1.3.2 Medidas de dispersión o variabilidad

Las distribuciones presentan el mismo rango pero diferente variabilidad.


¿Hay una medida de variabilidad que sea más sensible que el rango?
1.3.2 Medidas de dispersión o variabilidad

Considere las mediciones 5, 7, 1, 2, 4. ¿Cómo analizar su variación?, ¿respecto a qué medir la dispersión?

Si las distancias 𝑥𝑖 − 𝑥 son


Punto de equilibrio grandes, los datos se dicen
dispersos o variables.
2 2
Varianza (𝑠 − 𝜎 )

La varianza será relativamente grande para datos muy variables y relativamente pequeña
para datos menos variables.
Ejemplo: Calcular la varianza de los datos 5, 7, 1, 2, 4.
En datos agrupados, la fórmula para la varianza es
𝑛 2
𝑖=1 𝑓𝑖 𝑥𝑖 − 𝜇
𝜎2 =
𝑁
Propiedades de la varianza

1. 𝑠 2 ≥ 0.
2. La varianza de una constante es 0. V[k] = 0.
3. La varianza de una variable más una constante, es igual a la varianza de la
variable. V[x + k] = V[x].
4. La varianza de una constante por una variable, es igual al cuadrado de la
constante por la varianza de la variable. V[k x] = 𝑘 2 V[x].
Desviación típica o estándar (s − 𝜎)

Escriba aquí la ecuación.

𝑛 2
𝑖=1 𝑥𝑗 − 𝜇
𝜎 =
𝑁

En datos agrupados, la fórmula para la desviación estándar es

𝑛 2
𝑖=1 𝑓𝑖 𝑥𝑖 − 𝜇
𝜎=
𝑁

NOTA: La desviación estándar se mide en las mismas unidades de la variable original.


Dispersión y distribución normal

En una distribución normal se puede determinar el porcentaje de los valores que


está dentro de cualquier rango específico. Concretamente:
Ejemplo

La estatura de todos los adultos masculinos que residen en el estado de


Pennsylvania siguen aproximadamente una distribución normal. Si la estatura
media es de 69 pulgadas y la desviación estándar es de 2.5 pulgadas, responda:
¿Entre qué alturas se encuentra aproximadamente el 68%, el 95% y el 99.7% de los
adultos masculinos?

68 % 95 % 99.7 %
Puntuaciones típicas

Se realizó una prueba para medir el nivel de memorización de un


colectivo de personas. Sara, una de las participantes, obtuvo una
puntuación de 25.
1. ¿Podemos concluir que Sara tiene buena o mala memoria? No
2. ¿Si la puntuación media del grupo fue de 20, qué se puede
concluir de la memoria de Sara? El puntaje de Sara supera por 5 a la media
3. ¿Qué tan superior es el puntaje de Sara respecto a la media, es
decir, es muy superior o poco superior?
Si la desviación estándar es pequeña, es decir, si pocas puntuaciones se apartan de la
media, entonces una distancia de 5 unidades representa un puntaje muy superior. En
caso contrario, si la desviación es grande, es decir, si muchas puntuaciones se alejan de
la media, entonces una distancia de 5 será poco superior.
Puntuaciones típicas

Definición (Puntuaciones Típicas)


Se utilizan para comparar las puntuaciones en distintas distribuciones. Se
definen como la razón entre la distancia de una observación respecto a la
media y la desviación típica. Su fórmula es

𝑥𝑖 − 𝑥
𝑧𝑖 =
𝑠

Las puntuaciones típicas se pueden interpretar como la distancia que hay


entre un elemento y la media, considerando la desviación típica como la
unidad de medida.
Las observaciones con puntajes z mayores a 3 en valor absoluto se presentan
menos del 1% de las veces y son consideradas valores atípicos.
Puntuaciones típicas

Ejemplo 1: Un grupo de estudiantes realizó dos exámenes, uno de


Estadística y otro de Matemáticas Básicas. Las calificaciones medias
fueron 4.5 y 5.5, con desviaciones 0.5 y 1, respectivamente.
Si Elías obtuvo 5 en el examen de Estadística y 6 en el de Matemáticas
Básicas:
• ¿En qué asignatura tuvo mejor rendimiento? Matemáticas básicas
• ¿En qué asignatura, respecto a sus compañeros, tiene mejor
posición? Estadística
Puntuaciones típicas

Ejemplo 2: Una persona A mide 1.75 m y reside en una ciudad donde


la estatura media es de 1.60 m y la desviación típica es de 20 cm. Otra
persona B mide 1.80 m y vive en una ciudad donde la estatura media
es de 1.70 m y la desviación típica es de 15 cm. ¿Cuál de las dos será
más alta respecto a sus conciudadanos?

Rta: La persona A es más alta respecto a sus conciudadanos que la persona B.


Otras medidas de variación

1. Desviación media (Da):


|𝑥𝑖 − 𝑥| 𝑦𝑖 − 𝑥 𝑛𝑖
𝐷𝑎 = 𝐷𝑎 =
𝑛 𝑛
Datos no agrupados Datos agrupados

2. Desviación mediana (De):

|𝑥𝑖 − 𝑀𝑒 | 𝑦𝑖 − 𝑀𝑒 𝑛𝑖
𝐷𝑒 = 𝐷𝑒 =
𝑛 𝑛
Datos no agrupados Datos agrupados
Otras medidas de variación

3. Coeficiente de variación (CV): También conocido como variación relativa, permite


comparar las dispersiones de dos o más distribuciones cuando tienen o no las mismas
unidades. 𝑠
𝐶𝑉 = × (100)
𝑥

Ejemplo: Comparar las dispersiones de la variable peso de dos grupos de personas


cuyos pesos son 75, 80, 66, 102, 91 kg, y 80, 78, 85, 91, 77 kg.

Ejemplo: ¿Qué opinión merece la media de una distribución si se sabe que 𝑥 = 4 y


𝑠 2 = 25?
4. Coeficiente de desviación media (CDa):
𝐷𝑎
𝐶𝐷𝑎 = × (100)
𝑥
1.3.3 Medidas de Posición
1.3.3 Medidas de Posición

Son valores de la variable que dividen a la muestra en partes de igual porcentaje.

Número de divisiones Nombre Porcentaje


4 Cuartiles 25%
10 Deciles 10%
100 Percentiles 1%
1.3.3 Medidas de Posición

Cálculo de cuartiles, deciles y percentiles en datos no agrupados


Organizados los datos por magnitud, se usan las fórmulas

𝑖(𝑛+1) 𝑖(𝑛+1) 𝑖(𝑛+1)


𝑄𝑖 : 𝐷𝑖 : 𝑃𝑖 : ,
4 10 100

donde n es el tamaño de la muestra, para hallar la POSICIÓN de los cuartiles, deciles y


percentiles respectivamente.
Nota: Si las formulas dan valores decimales, se requiere interpolar*.

Ejemplo: Con los datos 16, 10, 4, 8, 12, 10, 8, 20, 4, 13, 12, 22, 26, 20, 16, hallar:
• Primer y tercer cuartil
• Cuarto y sexto decil
• Percentil 30 y 90
Interpolación de cuartiles, deciles y percentiles
Parte decimal

Si la posición de 𝑄𝑖 = 𝑍, 𝑑 entonces:
Parte entera

1. Identificar los datos de las posiciones Z , Z + 1.


2. Calcular la diferencia 𝑥𝑍+1 - 𝑥𝑍 ≔ 𝑟.
3. El cuartil será 𝑄𝑖 = 𝑥𝑍 + 𝑟𝑑.

Nota: El procedimiento de interpolación es igual si se buscan deciles


o percentiles.
1.3.3 Medidas de Posición

Cálculo de cuartiles, deciles y percentiles en datos agrupados


Organizados los datos por magnitud, se usan las fórmulas
𝑖(𝑛) 𝑖(𝑛) 𝑖(𝑛)
𝑄𝑖 : 𝐷𝑖 : 𝑃𝑖 : ,
4 10 100
para hallar la POSICIÓN de los cuartiles, deciles y percentiles respectivamente.
𝑥𝑗−1 + 𝑥𝑗
Caso 1: Si 𝑁𝑗−1 = 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 2 Variable discreta
Caso 2: Si 𝑁𝑗−1 < 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗

Caso 1: Si 𝑁𝑗−1 = 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗−1 (𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒)


𝑖𝑛
{4,10,100}
−𝑁𝑗−1 Variable continua
Caso 2: Si 𝑁𝑗−1 < 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗−1 + 𝑐 𝑛𝑗
1.3.3 Medidas de Posición

Ejemplo: Encuentre 𝑄3 , 𝐷6 𝑦 𝑃80 en los siguientes datos.


𝒙𝒊 𝒏𝒊 𝑵𝒊
4 3 3 𝑖(𝑛) 𝑖(𝑛) 𝑖(𝑛)
𝑄𝑖 : 𝐷𝑖 : 𝑃𝑖 : ,
8 12 15 4 10 100

12 10 25 𝑥𝑗−1 + 𝑥𝑗
Caso 1: Si 𝑁𝑗−1 = 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 =
16 18 43 2
Caso 2: Si 𝑁𝑗−1 < 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗
20 10 53
24 6 59
28 20 79
32 8 87
36 3 90
Total 90
1.3.3 Medidas de Posición

Ejemplo: Encuentre 𝑄3 , 𝐷6 𝑦 𝑃80 en los siguientes datos.


𝒙𝒋−𝟏 − 𝒙𝒊 𝒚𝒊 𝒏𝒊 𝑵𝒊

[2,6) 4 3 3 𝑖(𝑛) 𝑖(𝑛) 𝑖(𝑛)


𝑄𝑖 : 𝐷𝑖 : 𝑃𝑖 : ,
[6,10) 4 10 100
8 12 15

[10,14) 12 10 25 Caso 1: Si 𝑁𝑗−1 = 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗−1 (𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒)
𝑖𝑛
−𝑁𝑗−1
[14,18) 16 18 43 {4,10,100}
Caso 2: Si 𝑁𝑗−1 < 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 {𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 }, entonces 𝑄𝑖 , 𝐷𝑖 , 𝑃𝑖 = 𝑥𝑗−1 + 𝑐
𝑛𝑗
[18,22) 20 10 53

[22,26) 24 6 59

[26,30) 28 20 79

[30,34) 32 8 87

[34,38] 36 3 90

Total 90
Medidas de posición y valores atípicos

Un valor atípico es una observación que se aleja del resto de datos.


Una regla para determinar si una observación 𝑥𝑘 es atípica es:

𝑥𝑘 < 𝑄1 − 1.5(𝑄3 − 𝑄1 )
𝑥𝑘 > 𝑄3 + 1.5(𝑄3 − 𝑄1 )
Rango Intercuartil (RIC)

Boxplot (Diagrama de caja o de bigotes)


Boxplot
1.3.4 Medidas de forma

4.1 Medidas de asimetría o deformación: Se utilizan para medir el grado de asimetría.


𝑀1 − 𝑀𝑑 3(𝑀1 − 𝑀𝑒 ) 𝑄3 + 𝑄1 − 2𝑄2
𝐴𝑠 = 𝐴𝑠 = 𝐴𝑠 =
𝑠 𝑠 𝑄3 + 𝑄1
𝑨𝒔 Distribución
𝑨𝒔 = 0 Simétrica
𝑨𝒔 > 𝟎 Asimétrica positiva
𝑨𝒔 < 𝟎 Asimétrica negativa
1.3.4 Medidas de forma

4.2 Medidas de apuntamiento o curtosis: La curtosis mide el grado de agudeza o


achatamiento de una distribución con relación a la distribución normal, es decir, mide
cuán puntiaguda es una distribución.

4 4
𝑥𝑖 − 𝑥 𝑓𝑖 𝑥𝑖 − 𝑥
𝐴𝑝 = 𝐴𝑝 =
𝑛𝑠 4 𝑛𝑠 4
Datos no agrupados Datos agrupados

𝐴𝑝 > 3 𝐴𝑝 = 3 𝐴𝑝 < 3

También podría gustarte