Está en la página 1de 24

Universidad Agraria del Ecuador

Facultad de Ciencias Agrarias


Ingeniería Ambiental
Estadística I

Unidad 2:
Estadística Descriptiva

Econ. Gloria Chávez, M.Sc.


gachavez@uagraria.edu.ec
4SA / 4SB
ESTADÍSTICA DESCRIPTIVA
Es la técnica matemática que obtiene, organiza, presenta y describe un
conjunto de datos con el propósito de facilitar su uso generalmente con el
apoyo de tablas, medidas numéricas o gráficas.
Pasando de datos a información:
1. Ordenar los datos…
2. Tabular los datos ordenados…
3. Graficar los datos ordenados…
4. Calcular a partir de la muestra medidas de interés para tomar decisiones…
TABULACIÓN DE DATOS
Consiste en presentar los datos estadísticos en forma de tablas o cuadros.
Cuando se dispone de gran número de datos, es útil el distribuirlos en clases o
categorías y determinar el número de individuos pertenecientes a cada clase.
Frecuencia absoluta (𝒇): Es el número de veces que aparece cada observación o
categoría (resultado del recuento). La frecuencia total de todas las
observaciones se representa por 𝑁.
Frecuencia absoluta acumulada: Se obtiene sumando la frecuencia de cada
observación o categoría a las frecuencias ya acumuladas anteriormente.
TABULACIÓN DE DATOS
Frecuencia relativa: Proporción que se obtiene dividiendo la frecuencia de cada
𝑓
observación o categoría entre el total de datos: 𝑓𝑟 =
𝑁
Frecuencia relativa acumulada: Se obtiene sumando la frecuencia relativa de
cada observación o categoría a las frecuencias relativas ya acumuladas
anteriormente.
Los límites de las clases son los valores inferior y superior de cada clase: límite
inferior y límite superior.
El punto medio o marca de clase representa a la clase cuando se hacen
operaciones matemáticas. Es la media de los límites.
TABULACIÓN DE DATOS
Marca de clase Frecuencia Frecuencia Frecuencia Frecuencia relativa
N° Clase
(𝒎𝒊 ) Absoluta (𝒇𝒊 ) Acumulada relativa acumulada
1 [𝐿1 , 𝐿2 ) (𝐿1 + 𝐿2 )/2 𝑓1 𝐹1 = 𝑓1 𝑓1 /N 𝐹1 /N
2 [𝐿2 , 𝐿3 ) (𝐿2 + 𝐿3 )/2 𝑓2 𝐹2 = 𝑓1 + 𝑓2 𝑓2 /N 𝐹2 /N
3 [𝐿3 , 𝐿4 ) (𝐿3 + 𝐿4 )/2 𝑓3 𝐹3 = 𝑓1 + 𝑓2 + 𝑓3 𝑓3 /N 𝐹3 /N
… … … … … … …
(𝐿𝑘 + 𝐿𝑘+1 )
k [𝐿𝑘 , 𝐿𝑘+1 ) 𝑓𝑘 𝐹𝑘 = N 𝑓𝑘 /N 𝐹𝑘 /N= 1
2

La cantidad de clases que se recomienda establecer varía entre 6 y 10. Para


determinar el ancho de clase se debe dividir el rango entre la cantidad de
clases (k).
TABULACIÓN DE DATOS
EJEMPLO: Solución:
A 40 estudiantes se les pidió que estimen el
número de horas que habrían dedicado a
1) Calcular Rango: 𝑥𝑚á𝑥 − 𝑥𝑚𝑖𝑛 = 65 − 30 = 35
estudiar la semana pasada (tanto en clase como 2) Asumiendo que se quiere formar 6 intervalos de
fuera de ella), obteniéndose los siguientes clase, entonces el ancho de cada intervalo es:
resultados: 35
= 5,83 y redondeando sería 6.
6
36 30 47 60 32 35 40 50
Clases 𝒎𝒊 𝒇𝒊 F 𝒇𝒓 Fr
54 35 45 52 48 58 60 38 30 – 35 32,5 8 8 0,2 0,2
32 35 56 48 30 55 49 39 36 – 41 38,5 6 14 0,15 0,35
58 50 65 35 56 47 37 56 42 – 47 44,5 5 19 0,125 0,475
48 – 53 50,5 7 26 0,175 0,65
58 50 47 58 55 39 58 45 54 – 59 56,5 11 37 0,275 0,925
60 – 65 62,5 3 40 0,075 1
Total 40 1
ESTADÍSTICOS PARA DATOS AGRUPADOS
𝒌
𝒇𝒊 𝒎𝒊 Clases 𝒎𝒊 𝒇𝒊 𝒇𝒊 𝒎𝒊 ഥ
𝒎𝒊 − 𝒙 ഥ
𝒎𝒊 − 𝒙 𝟐 ഥ
𝒇𝒊 𝒎𝒊 − 𝒙 𝟐
Media Muestral: ഥ=෍
𝒙
𝒏
𝒊 30 – 35 32,5 8 260 -14,4 207,36 1658,88
𝒌
36 – 41 38,5 6 231 -8,4 70,56 423,36
ഥ 𝟐
𝟐
𝒇𝒊 𝒎𝒊 − 𝒙 42 – 47 44,5 5 222,5 -2,4 5,76 28,8
Varianza Muestral: 𝑺 =෍
𝒏−𝟏 48 – 53 50,5 7 353,5 3,6 12,96 90,72
𝒊=𝟏
54 – 59 56,5 11 621,5 9,6 92,16 1013,76
60 – 65 62,5 3 187,5 15,6 243,36 730,08
Desviación Muestral: 𝑺= 𝑺𝟐 Total 1876 3946

𝟏𝟖𝟕𝟔 3946
ഥ=
𝒙 = 𝟒𝟔, 𝟗 𝑺𝟐 = = 𝟏𝟎𝟏, 𝟏𝟕 𝑺= 𝟏𝟎𝟏, 𝟏𝟕 = 𝟏𝟎, 𝟎𝟔
𝟒𝟎 𝟑𝟗
ESTADÍSTICOS PARA DATOS AGRUPADOS
Veintiocho solicitantes interesados en trabajar para un programa de construcción de viviendas de
interés social, rindieron un examen diseñado para medir su aptitud para las obras civiles. Los
resultados fueron los siguientes:
79 97 86 76 93 87 98 68 84 88 81 91 86 87
70 94 77 92 66 85 63 68 98 88 46 72 59 79
Construya con los datos anteriores la tabla de frecuencias absolutas y relativas, y acumuladas,
agrupándolos considerando 6 intervalos de clase (k). También calcular la media, varianza y
desviación.
TABULACIÓN/PRESENTACIÓN DE
RESULTADOS

Tamaño de cangrejo capturado por Sector


Zona Observ. Prom. Desv. CV Min Máx
Sector 1 1200 8,1284 0,3428 4,22% 7,5 9
Sector 2 1197 8,1389 0,3479 4,27% 7,5 9,1
Ambos sectores 2397 8,1305 0,3453 4,25% 7,5 9,1
HISTOGRAMA
Representación gráfica de una variable en forma de barras, donde la superficie
de cada barra es proporcional a la frecuencia de los valores representados, ya
sea en forma diferencial o acumulada (variables cuantitativas).
POLÍGONO DE FRECUENCIAS
Se crea a partir de un histograma de frecuencia. Estos histogramas emplean
columnas verticales para reflejar frecuencias, mientras que el polígono de
frecuencia es realizado uniendo los puntos de mayor altura de estas columnas.
OJIVA (Polígono de Frecuencias Acumuladas)
Es una gráfica de distribución de frecuencias acumuladas. Se trazan los límites
superiores contra las frecuencias acumuladas.
GRÁFICOS DE DISPERSIÓN
Se realiza para visualizar la relación entre dos variables, dependiendo de la
forma que toma la “nube” de datos.

Fuerte correlación lineal Fuerte correlación lineal


Correlación curvilínea, Ninguna correlación lineal
positiva, r cerca de 1 negativa, r cerca de -1
r cerca de 0 aparente, r cerca de 0
GRÁFICOS DE SERIES DE TIEMPO
GRÁFICO CIRCULAR (PASTEL)
Se utiliza para resaltar la
proporción (porcentaje)
en que aparece una
característica o atributo
respecto del total.
DIAGRAMA DE BARRAS
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la
barra la cual es proporcional a la frecuencia simple de la categoría que
representa (variables cualitativas).
DIAGRAMA DE CAJA
Un diagrama de caja, también conocido
como diagrama de caja y bigotes, es un
gráfico que está basado en cuartiles y
mediante el cual se visualiza la distribución
de un conjunto de datos. Está compuesto
por un rectángulo (la «caja») y dos brazos
(los «bigotes»).
Es un gráfico que suministra información
sobre los valores mínimo y máximo, los
cuartiles Q1, Q2 o mediana y Q3, y sobre la
existencia de valores atípicos y la simetría
de la distribución. Primero es necesario
encontrar la mediana para luego encontrar
los 2 cuartiles restantes.
ANÁLISIS DE
DATOS, TABLAS
Y GRÁFICOS
Como se muestra en el gráfico, el 41% de los encuestados afirmaron que la
falta de mantenimiento preventivo es el principal factor que ocasiona la
contaminación del aire proveniente del parque automotor; 24% que se debe
a la falta de conciencia para cuidar el aire; 19% a los vehículos viejos; y, el
16% mencionó que los factores son todos los anteriores.
ACTIVIDAD EN CLASES
¿Qué puede destacar de lo
resumido en la tabla y gráfico?

Redacte algunos párrafos y


agregue más cálculos (por
ejemplo porcentajes) para
respaldar su análisis.