Está en la página 1de 14

Estadística descriptiva

• Pasos para el análisis de datos:

1. Ordenar los datos

2. Validar los datos (Explorarlos →repetidos, perdidos, valores atípicos). (Valores atípicos, los que no se parecen
en nada a las puntaciones del resto de la población, los valores perdidos por ejemplo algún participante no
contestó algún ítem)

3. Describir los datos

• *No confundir los términos


• Variable de la matriz de datos: son las columnas o ítems en una tabla de datos
• Variable de investigación: las que forman parte de la hipótesis o pregunta de
• investigación

El análisis de datos depende de 3 factores:

A. El nivel de medición de las variables


B. Cómo se hayan formulado las hipótesis
C. El interés del investigador

Niveles de Medición

• Nominal
• Ordinal
• Intervalo
• Razón

Antes de realizar los análisis estadísticos que prueban nuestras hipótesis, es necesario DESCRIBIR los datos.

Medidas de tendencia central


1. DISTRIBUCIÓN DE FRECUENCIAS
Conjunto de puntuaciones ordenadas en sus respectivas categorías (valores).

• Generalmente se presentan en un tablas:

“TABLA DE FRECUENCIAS”
2. MEDIDAS DE TENDENCIA CENTRAL

• Los estadísticos de tendencia central proporcionan una estimación de la puntuación “típica, común”
encontrada en una distribución de puntuaciones en bruto.

• Nos indican los valores medios o centrales de la distribución

Moda, Mediana, Media

¿Cuál usar? Depende del nivel de medición.

En conjunto tienen muchas ventajas, por separado, pueden hacernos caer en errores de interpretación.

2.1 Moda (Mo)


• Es la categoría o puntuación que ocurre con mayor frecuencia

• “La más popular”

Puede haber dos.

Se utiliza en cualquier nivel de puntuación

Pasos para obtenerla:

1. Ordenar los datos en una distribución de frecuencias


2. Identificar el valor que se repite más veces (con mayor frecuencia o número de casos)

Ojo la moda es la puntuación y no la frecuencia.

Inconvenientes de reportar la moda de forma aislada:

• Tiene poco alcance informativo: no permite inferir nada más respecto a los valores

• Es insensible al tamaño de la muestra y a los valores de las puntuaciones en una distribución

Distribuciones diferentes, misma moda Mo = 4 personas


2.2 Mediana (Me)
Valor que divide la distribución por la mitad. La mitad cae por debajo, la otra mitad por arriba

• En una distribución ordenada es el valor central


• Se utiliza en los niveles de medición ordinal o por intervalo/razón
• Ventaja: Es útil cuando hay valores extremos pues no es sensible a éstos:
Inconvenientes de reportar la mediana de forma aislada:

• No ser sensible a valores extremos también puede ser una desventaja


• Se pueden tener distribuciones diferentes con la misma mediana
• Es sensible a cualquier cambio en el tamaño de la muestra, cualquier dato agregado puede cambiarla

Ejemplo: Vocabulario de infantes de 36 meses

n= 11

• A)195, 259, 316, 368, 384, 416, 443, 483, 486, 496, 506

n= 12

Me = 416

• B) 195, 259, 316, 368, 384, 416, 443, 483, 486, 496, 506, 508

Me = 429.5

• Inconveniente con la media: Es sensible a valores extremos


• Solo se consideran datos válidos y no los datos perdidos
Inconvenientes al reportar la media:

• Al reportarla cuando hay valores extremos (atípicos) éstos pueden


• inflarla o desinflarla
• Con los estadísticos se busca reportar parámetros de una población.
• Una media sesgada sería engañosa
• Esto es aún más relevante en muestras pequeñas
• En muestras más grandes, los valores extremos afectan menos
• Lo mejor es eliminar valores extremos y reportar una media ajustada
• Conceptualmente, el valor de la media nos dice cuáles serían las puntuaciones de una muestra si cada sujeto
tuviera la misma puntuación.

Medidas de variabilidad

• Las medidas de tendencia central son valores en una distribución


• Las medidas de variabilidad son intervalos que designan distancias a un número de unidades en la escala de
medición

• Medidas de variabilidad:
Rango

Desviación

Estándar

Varianza

• Es la distancia entre la puntuación mínima y Máxima

También puede reportarse solo el dato mayor y el dato menor.

Cuanto más grande sea en rango mayor será la dispersión de los datos en la distribución.

Pasos para calcular el rango:

1. Ordenar los valores de menor a mayor

2. Calcular XM-Xm

3.2 Desviación Estándar o Típica


• Promedio de desviación de las puntuaciones con respecto a la media
• Se expresa en las unidades de medición
• Se interpreta en relación a la media
• Cuanto más grande sea la DE mayor será la dispersión de los datos
s: Desviación estándar de la muestra

Sigma: Desviación estándar de la población

PASOS PARA CALCULAR DE:

1. Ordenar los valores de menor a mayor


2. Calcular la media (porque está relacionada con ésta)
3. Calcular la desviación de cada puntuación respecto a la media

𝑥 – (la media)

Puntuación de desviación: Qué tanto se aleja cada puntuación de la media y en qué dirección
• 5. Dividir la suma de cuadrados entre n-1
¿Es posible obtener DE mayores a la media?

• Sí, pero eso significa que hay valores extremos


• Indica que la distribución está sesgada hacia algún lado
• Si la DE no es de la mitad de la media o menos, también es posible que exista un sesgo

A las medidas de tendencia central y de variabilidad vale la pena analizarlas en conjunto. Son más fáciles de
entender cuando se presentan en forma gráfica.

En una curva de distribución normal, cada lado de la curva se divide en tres pasos. Cada paso es una desviación
estándar.
Estimación de las puntaciones de la población.
Examen:
Cuando hay un sesgo en los datos se utiliza la mediana.
La ventaja es que con las puntuaciones z si se pueden hacer análisis estadísticos para comparar con otros
puntajes.

También podría gustarte