Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva Univariada
Estadística Descriptiva Univariada
Francisco González
Introducción
¿Qué es la estadística?
Estadística descriptiva:
Se refiere a la recopilación y descripción de un grupo de
datos.
Población:
Es el conjunto total de individuos, elementos u objetos, que
cuentan con la o las características comunes de interés,
para la realización del estudio.
Muestra:
Subconjunto representativo de la población.
Conceptos importantes
Variable estadística
Variables cualitativas:
Se les conoce también como atributos, e indican una
propiedad o cualidad de la característica que se está
estudiando. Estas variables tienen como característica que
no pueden ser medidas, se expresan con conceptos o
palabras, pero nunca con números.
Nominales:
Cuando la medición de las cualidades no presenta un orden
jerárquico.
Ejemplos: estado civil, profesión, género.
Ordinales:
Cuando la medición de las cualidades presentan un orden
jerárquico descendente o ascendente.
Ejemplos: nivel de satisfacción de los clientes, nivel de estudios.
Clasificación de las variables
Variables cuantitativas:
Son características susceptibles de ser medidas, es decir,
se les puede asignar una cantidad. Estas variables,
generalmente se definen comenzando por “número de…”
Discreta:
Cuando la variable toma sus valores en número enteros.
Ejemplos: número de hijos, número de protestos.
Continua:
Cuando la variable toma sus valores en un rango de los
números reales.
Ejemplos: ingreso familiar, estatura.
Distribución de frecuencias
Variables de estudio:
Es de relevancia definir la variable que se quiere tabular
considerando los posibles valores que pueda tomar, en el
caso de datos no agrupados la utilizada es la variable
cuantitativa discreta.
Distribución de frecuencias
Frecuencia absoluta:
Es el número de repeticiones de cualquier suceso, se
denomina como f𝑖 , y se debe contestar ¿cuántas
observaciones hay en cada clase?
Frecuencia relativa:
Es el valor de la frecuencia relativa de cada clase dividida
por el número de observaciones totales, correspondiente al
n, se denomina como ℎ𝑖 , y se debe contestar ¿qué
proporción de observaciones hay en la clase?
Distribución de frecuencias
fi Fi hi Hi hi% Hi%
(fi/n)
Distribución de frecuencias con datos
agrupados en intervalos
La distribución de frecuencias agrupadas o tabla con datos agrupados
se emplea si las variables toman un número grande de valores o la
variable es continua.
Ej: (4+6) / 2 = 5
Distribución de frecuencias con datos
agrupados en intervalos
• Cantidad de intervalos:
Histograma
Polígono de frecuencias:
Ojiva
10 + 18 + 20 + 26 + 30 + 26 + 20 + 18
𝑥ҧ= = 21
8
Medidas de tendencia central
[300,350[ 4
[350,400[ 5
[400,450[ 7
[450,500[ 3
[500,550[ 9
[550,600[ 2
[600,650] 4
Medidas de tendencia central
Variable (xi) Frecuencia absoluta Marca de clase
(fi) (mi)
[300,350[ 4 325
[350,400[ 5 375
[400,450[ 7 425
[450,500[ 3 475
[500,550[ 9 525
[550,600[ 2 575
[600,650] 4 625
2 3
3 2
5 3
7 1
9 2
10 1
2 3
3 2
5 3
7 1
9 3
10 1
Datos Frecuenci
a
2 3
3 3
5 3
7 3
9 3
10 3
No existe
moda
Medidas de tendencia central
Ejemplo 5:
1–2–3–4–5
Datos Frecuencia
1 1
2 1
3 1
4 1
5 1
No existe
moda
Medidas de tendencia central
Medidas de tendencia central
Medidas de tendencia central
Ejercicio:
Los siguientes datos corresponden a los sueldos en miles de pesos
que reciben un grupo de empleados de la empresa de peluquerías
“Contigo Aprendo”
Variable Frecuencia Marca de
Determinen e interpreten la moda.
(xi) absoluta clase
(fi) (mi)
[300,350[ 4 325
[350,400[ 5 375
[400,450[ 7 425
[450,500[ 3 475
[500,550[ 9 525
El sueldo más recurrente o frecuente del
grupo de trabajadores es de $523.077.-
[550,600[ 2 575
[600,650] 4 625
Medidas de tendencia central
Mediana (Me):
Es el valor central de la muestra o población que divide al
conjunto de datos ordenados (de menor a mayor) en dos
partes iguales, separándolos en el 50% menor y el 50%
mayor.
1) Datos sin agrupar en tablas: Ordenar los datos de
menor a mayor y luego buscar la posición central.
Medidas de tendencia central
Ejemplo:
El 50% menor de los datos se encuentra hasta 26, mientras que el 50%
mayor de los datos se encuentra desde el 26.
Medidas de tendencia central
Ejemplo:
El 50% menor de los datos se encuentra hasta 27, mientras que el 50%
mayor de los datos se encuentra desde el 27.
Medidas de tendencia central
2) Los datos están agrupados en tablas sin intervalos:
Se debe calcular el Fi, luego el “n” se divide en 2 y se ubica el primer valor del Fi que
lo contenga (que sea mayor o igual), finalmente la variable que le corresponde es la
mediana.
Medidas de tendencia central
3) Los datos están agrupados en tablas con intervalos:
valor del Fi que lo contenga (que sea mayor o igual), finalmente una vez
el “i*n” se divide en 100 y se ubica el primer valor del F i que lo contenga (que sea mayor
𝑖∗𝑛
−𝐹
100 (𝑖−1)
𝑃𝑖 = 𝐿𝑖 + ∗𝐴
𝑓𝑖
Medidas de posición
Ejemplo: Determine el percentil 35
Como el 17 es el que contiene a la posición 16, la mediana va a estar en el intervalo [6, 8[;
(intervalo mediano o clase mediana)
Medidas de posición
Ejercicio:
Medidas de dispersión
aritmética, determinando las distancias promedias que existen entre cada dato y la
media.
Si las distancias promedias son lejanas a cero, el grupo va a ser más heterogéneo,
mientras que si las distancias son más cercanas a cero, el grupo será más
homogéneo.
Determina las distancias promedias cuadradas entre cada dato y la media. La unidad de
medida está en unidades cuadradas.
Medidas de dispersión
Medidas de dispersión
Desviación estándar:
Determina las distancias promedias entre cada dato y la media. La unidad de medida es la misma
que la variable de estudio.
Medidas de dispersión
Coeficiente de variación:
Entrega el porcentaje de variación del conjunto de datos respecto a la media aritmética.
Medidas de dispersión
Ejemplo:
[2,4[ 4 3
[4,6[ 6 5
[6,8[ 7 7
[8,10[ 2 9
[10,12[ 1 11
[12,14[ 8 13
[14,16] 4 15
Suma n=32
Medidas de dispersión
Medidas de dispersión
Medidas de dispersión
Medidas de dispersión
Medidas de dispersión
Ejercicio: