Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Descriptiva
Estadistica Descriptiva
Estadı́stica Descriptiva
Matemáticas Aplicadas 4o ESO
IES O Couto
curso 2019-2020
Introducción
Conceptos generales
Población y Muestra.
Variable Estadı́stica.
Variable Estadı́stica Cualitativa.
Variable Estadı́stica Cuantitativa: Variables Discretas y variables Continuas.
Tablas de frecuencias: Frecuencias absolutas y relativas, ordinarias y
acumuladas.
Parámetros estadı́sticos.
Medidas de centralización: Media, Moda y Mediana.
Medidas de dispersión: Rango, Varianza, Desviación Tı́pica.
Medidas de posicionamiento: Cuartiles, Rango intercuartı́lico.
Coeficiente de variación.
Representaciones gráficas.
Ejemplo 1
En una clase se desea estudiar cómo se distribuye el color de ojos, obteniendo
que 10 de ellos tienen los ojos marrones, 6 azules, y 4 verdes.
Xi fi hi
6
azul 6 20
4
verde 4 20
10
marrón 10 20
TOTAL 20 1
Cuando la variable es cualitativa, las formas más habituales para representar los
datos gráficamente son los diagramas de barras y los de sectores circulares.
Diagrama de barras: En un eje horizontal se sitúan los distintos valores de
la variable estadı́stica. A cada uno de esos valores le corresponderá un
rectángulo de altura proporcional a la frecuencia.
Diagrama de sectores circulares: En un cı́rculo, cada valor de la variable se
corresponde con un sector circular, cuyo ángulo central será proporcional a
la frecuencia de la variable.
Ejemplo 2
Supongamos que se desea estudiar el número de hijos que tienen las mujeres
entre veinte y cuarenta años de una localidad. Seleccionamos una muestra de
60 mujeres, y estos son los datos obtenidos:
0, 1, 0, 2, 4, 1, 0, 4, 2, 1, 0, 3, 1, 4, 3
1, 1, 3, 2, 2, 3, 1, 0, 1, 2 1, 2, 1, 3, 0,
0, 2, 1, 1, 3 1, 0, 0, 2, 1, 1, 0, 3, 0, 2,
1, 1, 1, 2, 1, 0, 1, 0, 3, 1, 2, 0, 0, 1, 0
Tabla de Frecuencias
Tabla de Frecuencias
Mediana:
En este caso hay 60 datos.
Supongamos que tenemos las 60 respuestas ordenadas de menor a mayor
x1 , x2 , x3 , . . . , x60 . La respuesta que dividiese a la muestra en dos partes
iguales serı́a la que ocupase la posición 300 5, por eso se toma como
mediana el promedio de las respuestas que están en posición 30 y 31.
Consultando la columna de las Fi , vemos que x30 = 1, y x31 = 1, ası́ que
Me = 1.
Si hubiesen sido 61 datos, la mediana serı́a el valor de x31 .
Moda: Mo = 1.
n
P
Xi2 fi
2
En la práctica, s 2 se obtiene con la expresión s 2 = i=1 n − X . Para facilitar
el cálculo se añaden dos columnas más a la tabla de frecuencias.
Xi fi Fi hi Hi X i · fi Xi2 Xi2 · fi
16 16
0 16 16 60 60
0 0 0
22 38
1 22 38 60 60
22 1 22
11 49
2 11 49 60 60
22 4 44
8 57
3 8 57 60 60
24 9 72
3 60
4 3 60 60 60
12 16 48
TOTAL 60 – 1 – 80 – 186
Diagrama de barras
Una gráfica de este tipo consiste en una caja rectangular, donde los lados
más largos muestran el recorrido intercuartı́lico. Este rectángulo está
dividido por un segmento vertical que indica dónde se posiciona la
mediana y por lo tanto su relación con los cuartiles primero y tercero.
La caja se ubica a escala sobre un segmento que tiene como extremos los
valores mı́nimo y máximo de la variable.
Las lineas que sobresalen de la caja se llaman bigotes. Tienen tienen un
lı́mite de prolongación de 10 5 veces el rango intercuartı́lico, de modo que
cualquier dato que no se encuentre dentro de este rango es marcado e
identificado individualmente.
Ejemplo 3
Supongamos que queremos estudiar cómo se distribuye la edad entre los 20
trabajadores de una empresa. Realizamos una encuesta, y nos encontramos con
que estas son las edades:
20, 23, 24, 24, 24, 34, 36, 36, 37, 39,
25, 29, 31, 31, 33, 39, 40, 40, 41, 45
Ejemplo 4
Supongamos que tomamos una muestra de 100 hombres adultos de una
población para estudiar cómo se distribuye la estatura.
En este caso la variable es continua. Es evidente, que lo más fácil serı́a dividir
el rango de los posibles valores en intervalos, por ejemplo de 10 cm de longitud:
[10 50, 10 60), [10 60, 10 70), [10 70, 10 80), [10 80, 10 90), [10 90, 20 00),[20 00, 20 10].
Luego bastarı́a registrar el número de observaciones pertenecientes a cada
intervalo.
Medidas de centralización
Media:
Pn
X i · fi 1800 60
X = i=1
= = 10 81
100 100
Moda: Se calcula gráficamente, utilizando el histograma de frecuencias
ordinarias.
Se llama clase o intervalo modal a aquel con mayor frecuencia.
Mediana: Se calcula gráficamente, utilizando el polı́gono de frecuencias
acumuladas.
Medidas de dispersión
Rango: 20 10 − 10 50 = 00 60 m
Varianza:
Pn
Xi2 · fi 2 3270 23
s2 = i=1
−X = − 10 812 = 00 01
100 100
Desviación
√ tı́pica:
√
s = s 2 = 00 01 = 00 1
Medidas de posicionamiento