Está en la página 1de 4

TEMA 5 - REDUCCIÓN DE DATOS.

MEDIDAS DESCRIPTIVAS BÁSICAS Y


REPRESENTACIONES GRÁFICAS

5.1. Introducción. De la organización a la descripción de datos

Se parte de la estadística descriptiva para hacerse una primera idea del comportamiento de cada
una de las variables contenidas en nuestra matriz de datos. Siendo la palabra más importante:
variabilidad, es decir, el estudio de la dispersión de las puntuaciones, contribuyendo a explicar la
magnitud y naturaleza de las mismas.

Cuando se utiliza la estadística como método para contrastar hipótesis se tratarán de encontrar
posibles variables asociadas a la variabilidad de los datos.

Podemos distinguir dos grupos de medidas o índices numéricos que deben estar presentes en
todo estudio descriptivo: medidas de tendencia central y medidas de dispersión o variabilidad.
Por otro lado, las representaciones grá cas son un buen complemento y ayudan a comprender.

Primero se estudia la tendencia central del grupo, es decir, hacia qué puntuación tiende el grupo,
siendo el índice más conocido la media aritmética, y como medidas de variabilidad tendríamos la
desviación típica.

5.2. Medidas de tendencia central: media, mediana y moda. Usos e interpretaciones

Tendencia central: indica hacia qué valor tiende el grupo, cuál es el valor que mejor lo representa.

Media: promedio, se calcula sumando todas las puntuaciones y dividiendo dicha suma por el
número total de puntuaciones. Símbolo: X~. Mientras que Xi representa cada una de las
puntuaciones obtenidas por los sujetos al aplicarles el instrumento de medida (puntuación
directa).

• Interpretación: es sencillo en escalas conocidas, por ejemplo una nota académica (0-10), pero
no siempre es tan fácil, y será conveniente conocer la puntuación máxima y mínima de la
escala de medida de la variable.

Moda: es el valor con frecuencia absoluta más alta, la puntuación que más se repite. La moda no
es la frecuencia, es la puntuación.

Cuando tenemos dos puntuaciones con la misma frecuencia diremos que la distribución es
bimodal y también podemos tener plurimodales en el caso de que más de dos puntuaciones
tienen la misma frecuencia.

Mediana: aquel valor que deja por encima y por debajo el 50% de los sujetos de la muestra, el
valor central de la distribución. Se dice que coincide con el percentil 50.

Para calcular podemos observar la distribución y comprobar que puntuación ocupa la posición
central.

La medida más precisa de tendencia central es la media ya que tiene en cuenta todas las
puntuaciones para su cálculo, pero solo puede usarse con niveles de medida de las variables de
intervalo o razón. La media se ve arrastrada por los valores extremos y eso no sucede con la
moda y la mediana.

5.3. Medidas de variabilidad

Las medidas de tendencia central por si solas no nos completan los resultados, porque
necesitamos conocer si hay o no hay dispersión de las puntuaciones en torno a la media.

5.3.1. La desviación media

Es una medida que indica la media de las desviaciones de las puntuaciones directas respecto de
la media, es decir, si la desviación típica es alta signi ca que las puntuaciones se desvían, están
fi
fi
alejadas de la media del grupo, mientras que si es pequeña signi ca que las puntuaciones del
grupo están próximas a la media.

Fórmula:

D.M. = (Valor absoluto de la suma de las diferencias entre cada puntuación directa y la media)/
Número total de sujetos

D.M. =
∑ | (Xi − X m ed i a) | ÷ N

5.3.2. La desviación típica

Se representa como ´´s´´. Y otro índice sería la varianza ´´s2´´, conceptualmente se expresa igual
que la desviación típica.

Fórmula:

s = raíz cuadrada de (suma de las diferencias entre cada puntuación directa y la media) entre el
número total de sujetos

∑ ∑
s= (Xi − Xm edia) ÷ N s2 = (Xi − Xm edia)2 ÷ N

El numerador expresa las distancias de cada puntuación directa a la media. Dichas distancias se
elevan al cuadrado para evitar que el valor siempre fuera 0.

Interpretación:

Lo usual es el uso de la desviación típica, y no siempre es fácil de interpretar. En muchas


ocasiones se usa para comparar la dispersión entre grupos distintos.

Hasta ahora nos estábamos re riendo a la desviación típica sesgada, que se usa al trabajar con
muestras. También se usa la desviación típica insesgada, que nos es más que la estimación de la
desviación típica de la población a la que pertenece la muestra.

Fórmula:


s= (Xi − Xm edia) ÷ (N − 1)

5.3.3. La amplitud o recorrido

Fórmula:

A = Ximayor - Ximenos + 1

Se usa para organizar los datos de la distribución en intervalos y realizar grá cos. Se usa como
medida de dispersión única solamente cuando no es posible calcular otra o como complemento
de la moda.

5.3.4. La desviación semi-intercuatílica

Se representa con ´´Q´´ es una medida que indica la dispersión en el 50% central de la
distribución. Es adecuada cucando el nivel de medida es ordinal o cuando hay puntuaciones
extremas que pueden distorsionar en exceso la desviación típica.

Fórmula:

fi
fi
fi
Q = (Q3 - Q1)/2

Interpretación:

Indica la variabilidad de las puntuaciones en el 50% central de la distribución.

5.3.5. El coe ciente de variación

Se representa como ´´V´´, nos permite comparar la variabilidad entre variables que tienen distinta
amplitud. Se expresa en términos de porcentaje.

V = (s / Xmedia) x100

5.4. Media y desviación típica para variables dicotómicas

Son variables que solo pueden tomar dos valores. Normalmente se representa sus respuestas
con 0 y 1, siendo cero las respuestas noes o incorrectas y unos para los síes o correctas.

p + q = 1

Son muy usadas cuando utilizamos pruebas objetivas y test de rendimiento en los que la
respuesta a las preguntas es acierto/error. La media nos dirá la proporción de sujetos que ha
contestado correctamente a la pregunta, se denomina índice de di cultad del ítem.

Varianza = s2 = pxq Desviación típica = raíz cuadra de (pxq)

con lo cual sabremos que la desviación típica variará entre 0 (ausencia de variabilidad) y 0,5
(máxima variabilidad).

5.5. Asimetría y apuntamiento: relación con la curva normal

Son dos características relativas a la forma grá ca de la distribución.

El modelo de comparación es la curva normal que carece de asimetría, ya que es simétrica, su


apuntamiento también es cero.

Grado de asimetría:

- Asimetría positiva: la mayoría de los sujetos tiende a concentrarse en la parte baja de las
puntuaciones. En la representación de izquierda a derecha: moda, mediana, media.

- Asimetría negativa: los sujetos tienden a agruparse en torno a las puntuaciones altas.

El hablar de asimetría positiva o negativa se debe simplemente al signo del cálculo del índice.
Una de las formas de calcularlo:

As = (Xmedia - Moda) / s

El apuntamiento o la curtosis indica el grado en el que la distribución es más o menos picuda, es


decir, el grado en el que la distribución resulta más abierta o dispersa respecto a la media, y por
tanto, más chata o aplanada (platicúrtica) o por el contrario, más apuntada y por eso más
estrecha o con las puntuaciones más centradas en torno a la media (leptocúrtica).

5.6. Representaciones grá cas

5.6.1.Grá co de sectores

También llamado ciclograma o grá co de tarta, se usa para representar variables con nivel de
medida nominal. Tiene forma circular y está dividido en porciones.

fi
fi
fi
fi
fi
fi
5.6.2. Grá co de barras

Se usa para describir las distintas categorías. Es un grá co comparativo, es decir, compara los
porcentajes de las diferentes variables. Suele emplearse para variables con nivel de medida
ordinal, aunque también es frecuente en nominal y para realizar comparaciones de variables
clasi catorias o categóricas.

5.6.3. Histograma

Es parecido al grá co de barras, pe se utiliza para variables cuantitativas continuas con nivel de
medida de intervalo o de razón. Las barras están juntas.

Lo que hace es agrupar las puntuaciones en intervalos, de modo que cada intervalo contiene un
número determinado de puntuaciones, que se denomina valor del intervalos que se representa
por ´´í´.

Cuanto menor es el número de intervalos más suave es la grá ca, y se calculará por tanteo.
Formas que suelen usarse para la agrupación en intervalo.

- Estimar por tanteo.

- Iniciar el primer intervalo con la puntuación que incluya la puntuación directa más baja y que se
múltiplo del valor del intervalo.

- Situar la marca de clase (punto central del intervalo) en el eje de abscisas en el centro de cada
barra.

5.6.4. Grá co de caja

También conocido como caja y patillas o caja y bigotes, permite hacerse una idea rápida de la
distribución de las puntuaciones en la zona central y en los extremos. También nos informa
grá camente sobre el grado de asimetría y presenta los valores atípicos.

Es muy útil para comparar visualmente grupos medidos en distintas variables.

5.6.5. Grá co de tallo y hojas

Combina la representación numérica y grá ca. Es una especie de histograma horizontal cuyas
barras están construidas con los números correspondientes a las puntuaciones.
fi
fi
fi
fi
fi
fi
fi
fi
fi

También podría gustarte