Está en la página 1de 3

Guión del Módulo 1 de Estadı́stica.

1. I NTRODUCCI ÓN A LA ESTAD ÍSTICA DESCRIPTIVA

La estadı́stica descriptiva es una parte de las matemáticas que estudia fenómenos mediante la recogida de datos, la
organización de estos en tablas y su interpretación mediante gráficos o con el cálculo de valores o parámetros numéricos
que resumen la información obtenida de los datos recolectados.
Al realizar un estudio estadı́stico, la población constituye el conjunto donde realizamos el estudio, a cada uno de
los elementos de este conjunto lo denominaremos individuo. Por otra parte, llamaremos muestra al subconjunto de la
población donde recopilamos los datos, y caracteres estadı́sticos a los aspectos que consideramos de cada uno de los
individuos de la muestra.
Podemos dividir los caracteres estadı́sticos en:
1. Caracteres cualitativos, que son aquellos que no toman valores numéricos, como el color del pelo, nivel de estu-
dios,...
2. Caracteres cuantitativos, toman valores numéricos. A estos caracteres estadı́sticos los llamaremos variables es-
tadı́sticas. Estas también pueden clasificarse como:
a) Variables estadı́sticas discretas, que son aquellas que toman un número finito o numerable de valores, como la
edad, número de hijos, ...
b) Variables estadı́sticas continuas, que son aquellas que pueden tomar cualquier valor real en un intervalo, como
la estatura, indicadores sanguı́neos,...
En ocasiones, el objetivo es obtener a partir de los datos de la muestras, conclusiones sobre toda la población. Esto cor-
responderı́a a la estadı́stica inferencial. Aquı́ nos restringiremos a la estadı́stica descriptiva, cuyo objetivo es únicamente
obtener información sobre la muestra, por lo que no distinguiremos entre población y muestra.
Finalmente, en estadı́stica descriptiva trabajaremos con variables estadı́sticas unidimensionales, esto es, aquellas que
proporcionan un único dato para cada individuo, y multidimensionales, con múltiples datos sobre cada individuo. En las
unidimensionales, el objetivo es tratar de forma aislada a la variable estadı́stica, mientras que en las multidimensionales,
que están formadas por varias variables estadı́sticas unidimensionales, además de información aislada de cada una, tam-
bién buscaremos información sobre la relación entre ellas. Nosotros trabajaremos con variables bidimensionales, que se
forman a partir de dos variables estadı́sticas unidimensionales
Nos centraremos desde este momento y en las próximos módulos, en las variables estadı́stica unidimensionales, poste-
riormente trataremos las bidimensionales.
Una vez hemos recogido los datos correspondientes a una variable estadı́stica unidimensional, nuestra primera tarea
será la creación de una tabla que recopile toda la información. Veremos dos tipos de tablas:
1. Tabla de datos simples.
2. Tabla de datos agrupados en intervalos.

2. TABLAS ESTAD ÍSTICAS DE DATOS SIMPLES

Las tablas estadı́sticas de datos simples recopilan el número de veces que se repite cada uno de los datos. Ası́, escribire-
mos en una primera columna los distintos datos xi de la variable estadı́stica, al lado una segunda columna escribiremos
para cada uno de los distintos datos, su frecuencia absoluta fi , que corresponde al número de veces que se repite dicho
P P
dato. Al final de esta columna escribiremos la suma de estas frecuencias absolutas fi ( se llama sumatorio, en este
P
caso fi significa la suma de todas las fi ), que coincidirá con el número de datos N .
Además, también podemos añadir una nueva columna con las frecuencias absolutas acumuladas Fi . La frecuencia
absoluta acumulada Fi del dato xi es igual a la suma de su frecuencia absoluta más la frecuencia absoluta de todos los
datos menores que él. Obviamente, se tiene que la frecuencia absoluta acumulada del último dato es igual al número de
datos N .
Por último, podemos también incluir una nueva columna con las frecuencias relativas hi . La frecuencia relativa hi del
fi
dato xi es igual a su frecuencia absoluta partido del número de datos, esto es, hi = . Este valor es el tanto por 1 que
N
corresponde a las veces que se aparece el dato xi con respecto al conjunto total de datos. Es obvio que la suma de todas las
frecuencias relativas será igual a 1.

3. TABLAS ESTAD ÍSTICAS DE DATOS AGRUPADOS EN INTERVALOS

Cuando trabajamos con una variable estadı́stica, ya sea continua o discreta, cuyos datos tienen frecuencias absolutas
muy pequeñas o datos muy dispersos, puede resultar conveniente agrupar los datos en intervalos y trabajar con estos. Ası́,
habları́amos de frecuencias absolutas de intervalos. Con ello, perderı́amos precisión, ya que identificamos un dato con el
intervalo donde pertenece, pero sin embargo, ganarı́amos una mejor comprensión de la información que nos suministran
los datos.
Trabajaremos con intervalos cerrados por la izquierda y abiertos por la derecha [a, b[= [a, b), que serı́an los números
reales incluidos entre a y b, donde a pertenecerı́a al intervalo pero b no.
A los intervalos resultantes los podemos ahora identificar con un nuevo valor numérico, lo que se conoce como la
a+b
marca de clase xi , que no es más que el punto medio del intervalo. El punto medio de un intervalo [a, b[ es , aunque
2
podemos obtenerlo a simple vista.
En este caso, también podemos crear una tabla que recopile la información sobre los intervalos, donde en la primer
columna incluirı́amos estos, en la segunda columna la marca de clase de cada uno de los intervalos, en la tercera columna
la frecuencias absolutas de cada intervalo, esto es, el número de datos que pertenecen a dicho intervalo, y de forma análoga,
nuevas columnas para las frecuencias absolutas acumuladas y las frecuencias relativas.

4. G R ÁFICOS ESTAD ÍSTICOS

A la hora de entender mejor una variable estadı́stica, las representaciones gráficas de los datos pueden resultar muy útil.
Para ello representaremos tanto las frecuencias absolutas como las frecuencias absolutas acumuladas, y distinguiremos
entre “Tablas de datos simples”, aquı́ introduciremos los diagramas de barras, y “Datos agrupados en intervalos”, donde
trabajaremos con histogramas y diagramas de sectores.
Para construir el diagrama de barras de una tabla de datos simples, dibujaremos unos ejes coordenados, donde en el eje
horizontal representaremos los datos, y en el vertical las frecuencias absolutas o frecuencias absolutas acumuladas, según
corresponda. A cada dato de xi le haremos corresponder su frecuencia, dibujando el punto resultante junto con el segmento
vertical que une el eje con dicho punto. Si unimos los puntos resultantes, obtendremos el polı́gono de frecuencias.
Pasando ya a datos agrupados en intervalos, para construir el histograma procederemos de forma parecida con unos
ejes coordenados, en el eje horizontal representaremos los extremos de los intervalos, en el eje vertical las frecuencias, y a
cada intervalo le asignamos una altura, que correspondeı́a a su frecuencia absoluta fi o frecuencia absoluta acumulada Fi ,
según corresponda. Ahora simplemente asignaremos a cada intervalo un rectángulo con base dicho intervalo y la altura
que le ha correspondido. Si consideramos ahora la marca de clase de cada uno de los intervalos, uniendo los puntos con
coordenadas las marcas de clase y las alturas que correspondan al intervalo correspondiente, obtendremos el polı́gono de
frecuencias asociado.
En cuanto al diagrama de sectores, consideramos un cı́rculo y a cada uno de los intervalos le haremos corresponder la
parte proporcional a su frecuencia absoluta fi respecto al número de datos N . Podemos calcular el ángulo correspondiente
en grados sexagesimales multiplicando su frecuencia relativa hi por 360.

También podría gustarte