Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. QUÉ ES LA ESTADÍSTICA
La palabra “Estadística” procede de la palabra “Estado”, pues fueros los Estados los primeros
que la aplicaron para averiguar los recursos del país y después tomar las decisiones convenientes,
como por ejemplo, averiguar como se distribuía la población y la riqueza por las provincias del
Imperio romano.
La Estadística es una rama de las Matemáticas que estudia:
Por lo tanto la Estadística tiene dos ramas: La Estadística descriptiva y la Estadística Inferencial ó
Inductiva.
Si la Población estadística es grande, se elige una parte de forma que represente a toda la
Población. A esta parte se le llama “Muestra”.
2
Se llaman " Caracteres estadísticos" a las propiedades que se estudian en los elementos de
una muestra ó población. Ejemplo de caracteres son: la edad, si es niño ó niña, la talla, el peso, el nº
de hermanos…
" Modalidades de un carácter" son los distintos valores que puede tomar un carácter. Deben
ser “incompatibles”(=no pueden darse dos modalidades al mismo tiempo) y “exhaustivas”(=ha de
presentarse una en cada elemento de la población)
Por ejemplo, la edad puede valer: 14 años, 15, 16,…
La nacionalidad puede ser: española, francesa, italiana, …
Los caracteres pueden ser: cualitativos ó cuantitativos. En los cualitativos sus modalidades
no pueden medirse: ser niño ó niña, nacionalidad, color del pelo…
En los cuantitativos sus modalidades si pueden medirse: edad, talla, peso, nº de hermanos…
Ejemplos de caracteres:
Una " Variable estadística " está formada por los distintos valores de las diferentes
modalidades de un carácter cuantitativo. Pueden ser " discretas " ó " continuas ".
Las variables estadísticas discretas son aquellas que sólo pueden tomar valores aislados. Por
ejemplo el número de hermanos.
Las variables estadísticas continuas son aquellas que pueden tomar cualquier valor
comprendido entre dos valores extremos puede tomar valores con decimales ( En general, son
continuas la longitud, masa, tiempo y las magnitudes derivadas de estas: velocidad, densidad...).
Por ejemplo la talla y el peso.
3
Cuando las modalidades son cuantitativas y se presentan se agrupadas en intervalos, el
intervalo [a,b) no significa que todos los valores de este intervalo sean modalidades. En este caso se
llama “Clase” a cada uno de los intervalos, “Amplitud de la clase” a la diferencia entre el extremo
superior y el extremo inferior y “ Marca de clase” al valor central.
3. TABLAS ESTADÍSTICAS
Para formarlas, primero hay que realizar un “recuento”. En la primera columna de las tablas
aparecen las Modalidades y en la segunda los números de veces que se repite cada modalidad
(“frecuencia absoluta”) . Por lo tanto, en una tabla, aparece cómo SE DISTRIBUYE LA
POBLACIÓN ENTRE LAS MODALIDADES del carácter considerado.
2º) Diagrama de sectores: Sobre un círculo de radio arbitrario, se dibujan sectores circulares cuyo
ángulo central sea proporcional a la frecuencia absoluta de cada modalidad. Por lo tanto, el área de
cada sector circular es proporcional a la frecuencia absoluta de la modalidad que corresponda a
este sector. Se suele situar sobre cada sector, el % de su modalidad. En los diagramas de sectores, se
pone de manifiesto la relación entre cada modalidad y el total.
3º) Pictogramas: Son dibujos (sacos, personas, casas, coches,...) que representan al carácter
estudiado y cuyo tamaño ( longitud, área ó volumen) ó número de figuras ( ej.: número de saquitos)
es proporcional a la frecuencia absoluta de cada modalidad. Ej.: Distribución de las viviendas
construidas en un año en las comunidades autónomas:
4º) Cartogramas: Sobre mapas geográficos, se colorean las diferentes modalidades( provincias ó
comunidades autónomas...) con un color tanto más oscuro cuanto mayor sea la frecuencia
absoluta.Ej.: Distribución de la producción de trigo en un año por las diferentes comunidades
autónomas.
Agrupamos estos valores en la siguiente tabla de frecuencias. En esta tabla aparece cómo se
distribuyen las familias según el número de personas activas:
MODALIDADES fi (fr)i en %
O
VARIABLE ESTADIST. xi
1 5 25%
2 9 45%
3 5 25%
4 1 5%
Sale igual gráfica para ambas frecuencias porque se ha elegidola adecuadamente la escala de fi y la
de (fr)i en % (la escala del 1 es igual a la del 5%)
2º) Polígono de frecuencias absolutas y polígono de frecuencias relativas: Resulta al unir los
extremos superiores de las barras anteriores. Sólo sirve para saber si la frecuencia sube ó baja pues
la variable no está definida para los valores intermedios (visto en 3º ESO).
1º) Histograma: Está formado por rectángulos situados uno a continuación del otro, cuyas bases
son los intervalos y cuyas alturas ( en el caso en el que los intervalos tengan distinta amplitud) son
fi
las densidades de frecuencias di = . Por lo tanto, el área de cada rectángulo es
amplitud
proporcional a la frecuencia absoluta del intervalo correspondiente. Ejemplo: 100 personas se
distribuyen según la altura como indica la tabla siguiente:
5
Altura en cm xi fi di
[150-160) 10 10/10=1
[160-165) 40 40/5=8
[165-170) 25 25/5=5
[170-175) 10 10/5=2
[175-180) 10 10/5=2
[180-190) 5 5/10=0,5
di
2º) Polígono de frecuencias: Se obtiene al unir los puntos medios de los lados superiores de los
rectángulos del Histograma.
4ª) Pirámide de población: Relaciona tres variables: sexo, edad y población. Representa cómo se
distribuye la población de un territorio según sexo y edad en un año dado. Ejemplo:
1º) El número total de intervalos es conveniente que sea de 5 a 10 , es decir, no menos de 5 ni mas
de 10. Para calcular este número podemos aplicar la regla siguiente:
2º) Para hallar la amplitud de cada intervalo, se divide la diferencia entre el mayor valor y el
menor valor de la serie entre Parte entera de ( n ) no se divide entre Parte entera de ( n ) +1
3º) Para fijar las marcas de clase, podríamos (= no es obligatorio) tomar como primera marca el
extremo inferior de la serie, si este extremo fuese un número entero, y si no fuese entero, el entero
más próximo. Lo ideal es que no coincida lo extremos de clase con ningún valor.
Valor de la escala (valor del segmento más pequeño dibujado) en el eje Y = Se divide la amplitud
total entre 20. Este valor se aproxima a un número que puede ser:
1 seguido de cero
2 seguido de cero
25 seguido de cero ( en este caso, se pondría una raya larga cada 4 intervalos)
5 seguido de cero
Recortar horizontalmente la gráfica de barras. Si se hace esto, desaparecen los valores relativos ó
comparaciones entre dos barras.
Que la escala en el eje Y sea muy pequeña. Si se hace esto, parecería como si los aumentos o
disminuciones en el eje Y fuesen muy pequeños. Este error se evita indicando en el eje Y el valor
numérico del segmento más pequeño.