Está en la página 1de 38

Análisis de datos en tablas

de frecuencias no
agrupadas
Estadística Básica
Docente: Ing. Zulmary Astrid Carrillo Mora
Medidas Estadisticas
Las medidas estadísticas o parámetros
estadísticos son valores representativos de una
colección de datos y que resumen en unos
pocos valores la información del total de datos.

Estas medidas son valores numéricos


calculados a partir de la muestra y que nos
resume la información contenida en ella.
Tipos de Medidas
1. Medidas de Tendencia central o de
centralización
Las medidas de tendencia central son empleadas para resumir a los conjuntos
de datos que serán sometidos a un estudio estadístico.

Se les llama medidas de tendencia central porque generalmente la acumulación


más alta de datos se encuentra en los valores intermedios.
Media Aritmética
Ejemplo: Se tiene la muestra de edades en año de principiantes de una
universidad: 18, 18, 18, 18, 19, 19, 19, 20, 20, 21. La media aritmética es:

Para calcular la media de un conjunto de datos es más cómodo utilizar la


llamada media aritmética ponderada. Se utiliza cuando se tienen varias
observaciones con un mismo valor, esto es cuando se han organizado en una
tabla de frecuencias.
Ejemplo: Se tiene la muestra de edades en año de principiantes de una
universidad: 18, 18, 18, 18, 19, 19, 19, 20, 20, 21. La media aritmética de estos
datos la podemos calcular mediante la media aritmética ponderada.
Dato 18 19 20 21
Frecuencia 4 3 2 1

Desventaja de la media: La media tiene una serie desventaja: se ve afectada


por los valores extremos del final de una distribución. Como depende del valor
de cada medida, los valores extremos pueden llevarla a representar
defectuosamente los datos.
Mediana y Moda
Mediana: Es el puntaje medio ordenado.

Para determinar la mediana de n datos, hay que realizar los siguientes pasos:

• Ordene los datos de menor a mayor


• El valor de la mediana dependerá del hecho de que n sea par o impar:
- Si n es impar, entonces la mediana será el dato en el centro, es decir, la
mediana es el dato que se encuentra en el lugar
- Si n es par, la mediana es el promedio de los datos que se encuentran en los
lugares
Para determinar la mediana de n datos en las tablas de frecuencia para datos no
agrupados, realizamos lo siguiente:

• Siempre voy a empezar por obtener el valor de (n/2). Esta medida se busca
en la columna de frecuencia absoluta acumulada (Ni).
Ejemplos: Hallar la mediana para los siguientes ejemplos:
• Conjunto de números 3,4,4,5,6,8,8,8 y 10
• Conjunto de números 5,5,7,9,11,12,15 y 18
• Tabla de frecuencia, datos no agrupados
Variable (x) ni Ni
3 9 9
4 11 20
5 13 33
Total 33

• Tabla de frecuencia, datos no agrupados


Variable (x) ni Ni
3 10 10
4 11 21
5 13 34
Total 34
Moda: Es el valor con mayor frecuencia absoluta.

Ejemplos: Hallar la moda para los siguientes ejemplos:


• Conjunto de números 3,4,4,5,6,8,8,8 y 10
• Tabla de frecuencia, datos no agrupados

Variable (x) ni Ni

3 10 10
4 11 21
5 13 34
Total 34
2. Medidas de Dispersión
Las medidas de Dispersión, también llamadas medidas de variabilidad,
muestran la variabilidad de una distribución, indicando por medio de un
número si las diferentes puntuaciones de una variable están muy
alejadas de la media. Cuanto mayor sea ese valor, mayor será la
variabilidad, y cuanto menor sea, más homogénea será a la media. Así
se sabe si todos los casos son parecidos o varían mucho entre ellos.
Varianza
Es una medida de dispersión que representa la variabilidad de una
serie de datos respecto a su media.
Fórmulas:

• Tabla de frecuencia, datos no agrupados

Ejemplo:
• Calcular la varianza de los datos 3,5,7,2,9 y 11
• Tabla de frecuencia, datos no agrupados

Variable (x) ni Ni

3 10 10
4 11 21
5 13 34
Total 34
Desviación Típica o Desviación Estándar
Es una medida de dispersión de los datos alrededor de su media o mediana.
Consiste en averiguar en cuanto difiere en promedio cada observación, del
promedio general del grupo de datos.

Ejemplo:
• Calcular la desviación típica de los datos 3,5,7,2,9 y 11
• Tabla de frecuencia, datos no agrupados
Variable (x) ni Ni

3 10 10
4 11 21
5 13 34
Total 34
Coeficiente de Variación
Es una medida de dispersión que
hace referencia a la relación entre el
tamaño de la media y la variabilidad
de los datos. Este valor siempre debe
ser positivo.
Ejemplo:
• Calcular el coeficiente de variación de los datos 3,5,7,2,9 y 11
• Tabla de frecuencia, datos no agrupados
Variable (x) ni Ni

3 10 10
4 11 21
5 13 34
Total 34
3. Medidas de Ubicación
Las medidas de Ubicación o Posición son valores de una distribución de datos que
la dividen en partes iguales. Resulta ser muy útil para precisar ciertas situaciones
en las que se busca describir la ubicación en un conjunto de datos.

Las medidas de ubicación son tres: Cuartiles, Deciles y Percentiles


Cuartiles (Q)

Dividen en cuatro partes las observaciones. El primer cuartil Q1 es un valor que


deja por debajo de él 25% y por encima 75% de las observaciones,
El Q2 es la mediana (50%) y Q3 deja por debajo 75% y por encima 25% de las
observaciones.
Fórmula para hallar Cuartiles

Tablas de Frecuencia Datos no Agrupados


Deciles (D)

Son indicadores que dividen el grupo de datos en 10 partes porcentualmente


iguales, en cada decil se encuentra el 10% de los datos.
Fórmula para hallar Deciles

Tablas de Frecuencia Datos no Agrupados


Percentiles (P)

Son las medidas más utilizadas para propósitos de ubicación o clasificación de


personas cuando se atienden características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados
en cien partes porcentualmente iguales.
Fórmula para hallar Percentiles

Tablas de Frecuencia Datos no Agrupados


Ejemplo:
• Los datos que se relacionan a continuación son un grupo de presiones
arteriales sistólicas medidas en mm de Hg correspondientes a un grupo
de pacientes:
120,160,150,110,170,130,125,140,125,145
Hallar cuartil tres, decil dos y percentil cincuenta.

• Tabla de frecuencia, datos no agrupados


Variable (x) ni Ni

3 10 10
4 11 21
5 13 34
Total 34

Hallar cuartil dos, decil seis y percentil treinta y tres.


4. Medidas de Forma
Las medidas de forma son aquellas que nos muestran si una distribución de
frecuencia tiene características especiales como simetría, asimetría, nivel de
concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo
particular de distribución.

Las medidas de forma son necesarias para determinar el comportamiento de los


datos y así, poder adaptar herramientas para el análisis probabilístico.

Son indicadores estadísticos que permiten identificar si una distribución de


frecuencia presenta uniformidad.

Las medidas de forma son dos: Asimetría y Curtosis.


ASIMETRIA
La asimetría es una medida de forma de una distribución que permite identificar y
describir la manera como los datos tienden a reunirse de acuerdo con la frecuencia
con que se hallen dentro de una distribución.

1. Tipos de Asimetría
• Asimetría negativa: la cola de la distribución se alarga para valores inferiores a
la media. Se da cuando el valor de la media aritmética es menor que la mediana
y este valor de la mediana es menor que la moda.
• Simétrica: hay el mismo número de elementos a izquierda y derecha de
la media. En este caso, coinciden la media aritmética, la mediana y la moda. La
distribución se adapta a la forma de la campana de Gauss, o distribución normal.

• Asimetría positiva: la cola de la distribución se alarga (a la derecha) para valores


superiores a la media. Se da cuando el valor de la media aritmética es mayor que
la mediana y este valor de la mediana es mayor que la moda.
2. Medidas de Asimetría

Coeficiente de Pearson

Se trata de un índice adimensional (no tiene unidades de medida) que se aplica


a distribuciones unimodales. Cuando la distribución es simétrica, la media
aritmética y la moda coinciden, por lo que el numerador se anula y el valor de
A s = 0.
El coeficiente de Pearson varía entre -3
y 3

• Si As < 0 La distribución será


Asimetría Negativa
• Si As = 0 La distribución será
Simétrica
• Si As > 0 La distribución será
Asimetría Positiva
CURTOSIS
La curtosis o kurtosis es un parámetro estadístico que sirve para caracterizar la
distribución de probabilidad de una variable aleatoria, indicando el grado de
concentración de los valores alrededor de la medida central. Esto también se
conoce como “grado de pico”.

1. Tipos de Curtosis

Existe una gran concentración de


datos
Existe una concentración
normal

Existe una baja concentración


de datos
2. Medidas de Curtosis

Medida de Fisher

Este coeficiente se aplica a distribuciones unimodales simétricas o


moderadamente asimétricas, para medir la curtosis o apuntamiento de la
distribución.
La medida de Fisher maneja los siguientes rangos:

• Si a < 3 La distribución es Platicúrtica


• Si a = 3 La distribución es Mesocúrtica
• Si a > 3 La distribución es Leptocúrtica
Ejemplo:
La dirección general de tráfico está interesada en estudiar la educación
vial en los jóvenes. Para ello selecciona una muestra aleatoria de sujetos
que acaban de obtener el carnet de conducir (grupo 1) y otra con sujetos
que lo tienen hace 5 años (grupo 2) y registra el n° de veces que han
perdido puntos en el último año. Los resultados se muestran a
continuación:

Calcule los índices de asimetría y curtosis para cada grupo.

También podría gustarte