Está en la página 1de 4

Práctica 2

ESTADÍSTICA DESCRIPTIVA: REPRESENTACIONES GRÁFICAS

Objetivos
1. Resumir, ordenar y analizar conjuntos de datos
2. Calcular diversas características de una variable estadística univariante
3. Representar gráficamente la distribución de frecuencias
4. Realizar análisis exploratorio de datos.

Introducción al Análisis Descriptivo

El primer paso en el análisis de datos, una vez introducidos los mismos, es realizar un análisis descriptivo.
Este análisis inicial proporciona una idea de la forma que tiene la distribución de las observaciones y
permite obtener estadísticos de tendencia central (media, mediana y moda), de dispersión (varianza,
desviación típica, rango), de forma (asimetría, curtosis), de posición (percentiles), así como gráficos de
barras, de sectores e histograma.

El SPSS proporciona varias herramientas para realizar esta descripción, todas ellas bajo el
menú Analizar y, dentro de él, la opción Estadísticos descriptivos. Estos procedimientos
son: Frecuencias…, Descriptivos… y Explorar….

Procedimiento “Frecuencias…”
El procedimiento Frecuencias… proporciona representaciones estadísticas y gráficas que son útiles para
la descripción de distintos tipos de variables. Permite obtener una descripción de la variable a partir de las
tablas de frecuencias, histogramas, gráficos de barras, percentiles, índices de tendencia central e índices de
dispersión.
Para acceder a este procedimiento se selecciona en el Menú principal Analizar/ Estadísticos descriptivos/
Frecuencias…

En el Cuadro de diálogo de Frecuencias, se introducen la variable o variables (categóricas o


cuantitativas) que se quieren analizar.
En esta ventana se presentan cuatro botones de comandos: Estadísticos… (para obtener
estadísticos descriptivos para las variables cuantitativas), Gráficos… (para hacer gráficos de
barras, gráficos de sectores e histogramas), Formato… (para elegir el orden en el que se
muestran los resultados) y Boostrap… (para realzar muestreo boostrap). Además, se muestra la
opción Mostrar tablas de frecuencias, que por defecto aparece seleccionada.
Pulsando en Estadísticos… se obtiene el siguiente Cuadro de diálogo, donde se muestra un
conjunto de medidas descriptivas agrupadas en: Valores percentiles, Tendencia central,
Dispersión y Distribución.

En esta ventana se marcan los estadísticos descriptivos que se quieran estudiar y se


pulsa Continuar.
Nota: SPSS calcula por defecto la cuasivarianza, y cuasidesviación típica muestrales.
Pinchando en Gráficos… se obtiene el siguiente Cuadro de diálogo, en el que se puede elegir
el Tipo de gráfico y los Valores del gráfico.
Ejercicios Propuestos
Ejercicio Propuesto 1
Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del agua para
consumo, en términos de colonias de bacterias tróficas, en un acuífero próximo a la ciudad. Se
consideran dos zonas diferentes del acuífero y se obtienen los siguientes resultados (número de
colonias por 1000 mm de agua):
zona 1: 194 199 191 202 215 214 197 204 199 202 230 193 194 209
zona 2: 158 161 143 174 220 156 156 156 198 161 188 139 147 116
Se pide:
Un estudio comparativo de la calidad del agua en ambas zonas utilizando medidas estadísticas y
gráficos. Para ello realizar los siguientes apartados:
1. Estudiar media, varianza, moda, mediana, máximo y mínimo de ambas zonas.
2. Representar gráficamente los datos con un histograma para cada variable.
3. Representar gráficamente los datos con un diagrama de caja simple (donde los datos del gráfico son
resúmenes para distintas variables).
4. Solución:
5. 1. Calcular media, varianza, moda, mediana, máximo y mínimo de ambas
zonas.

6.
7. Los valores de la media, mediana y moda, para el nº de colonias de la zona
2 son inferiores a los obtenidos para el nº de colonias de la zona 1, de lo que
se deduce que la calidad del agua en la zona 2 es claramente superior.
Con respecto a los valores obtenidos para la varianza en ambas variables,
podemos ver que la variabilidad es superior para el nº de colonias de la zona
2.
8. Para saber en que zona hay mayor dispersión se debe de calcular
el Coeficiente de Variación de Pearson, CV, (Cociente entre la desviación
típica y la media) que representa el número de veces que la desviación
típica contiene a la media, por tanto, cuanto mayor sea el coeficiente de
variación de Pearson significa que mayor número de veces contiene la
desviación típica a la media y por tanto la media aritmética es menos
representativa.
9. CV(zona1) = 10.77 / 203.07 = 0.053
10. CV(zona2) = 26.07 / 162.36 = 0.161
11. Los resultados nos muestran que hay mayor dispersión en la zona 2 ya
que el coeficiente de variación es mayor que el de la zona 1

También podría gustarte