Está en la página 1de 13

Fundamentos de

Análisis de Datos José Hernando Ávila-Toscano, Ph.D.

Estadística
descriptiva
©José Hernando Ávila-Toscano, 2020
Este material es un producto de apoyo académico protegido por derechos
de autor. Su reproducción, copia o difusión total/parcial solo puede
realizarse con autorización expresa del autor
ANÁLISIS ESTADÍSTICO

• Estadística Descriptiva Recolecta y analiza una serie de datos con el fin de describir sus
características empleando un conjunto de medidas de resumen, gráficos y
tablas.
• Estadística Inferencial A partir de los datos recolectados con una muestra que reúne características
puntuales, permite hacer deducciones o inferir conclusiones y tendencias
ANÁLISIS ESTADÍSTICO DESCRIPTIVO
Estudios descriptivos
El uso de los estadísticos se ajusta a la escala de ¿QUÉ MEDIDAS SE USAN?
medición de las variables
• Tendencia central (media, mediana, moda)
Variables cuantitativas o numéricas • Posición (no central) (cuartil, percentil)
• Con escala de Intervalo o Razón • Dispersión (rango, varianza, desviación típica)
• Asimetría y curtosis

Variables cualitativas o categóricas • Frecuencias y porcentajes


• Con escala nominal y ordinal

• Gráficos
Gráficos y tablas se ajustan a cada
• Tablas
tipo de variable • Tablas de frecuencia
• Tablas de contingencia (comparación descriptiva)
ESTADÍSTICA DESCRIPTIVA: VARIABLES NUMÉRICAS

• Medidas de tendencia central •


Estudios descriptivos
Localizan el punto central de un conjunto ordenado de datos

• Media: “centro” numérico de los


• {2, 5, 5, 6, 8, 8, 9, 11}. Hay 8 números. Se suman y luego se divide
datos, es decir, valor promedio de
un conjunto de datos. entre 8. La media es 6.75

• {2, 5, 8, 11, 16, 21, 30}. Hay 7 números ordenados ascendentemente.


• Mediana: número medio en un
El número medio (el cuarto en la lista) es 11.
conjunto de datos ordenados. Si hay
un número par de datos, la • {3, 5, 8, 10, 24, 36, 79, 255} Hay 8 números y en el medio un par (10,
mediana es el promedio de los dos. 24). Se calcula el promedio de los dos así: (10 + 24)/2 = 34/2 = 17. La
mediana es 17.

• Moda: número que aparece más a • {2, 3, 5, 5, 7, 9, 9, 9, 10, 12}. La moda es 9 (aparece tres veces)
menudo en un conjunto de datos. • {2, 5, 5, 6, 8, 8, 9, 11}. Hay dos modas, 5 y 8.

Fuente: Varsity Tutors- hotmath


ESTADÍSTICA DESCRIPTIVA: VARIABLES NUMÉRICAS
Estudios descriptivos
• Medidas de Posición (no central) • Dividen el conjunto de datos en valores iguales sin que necesariamente
sean centrales.

• Cuartil: Tres elementos que dividen el conjunto •El cuartil 1 (Q1) es el percentil 25 (P25).
de datos en cuatro partes iguales. •El cuartil 2 (Q2) es la mediana y el percentil 50 (P50).
•El cuartil 3 (Q3) es el percentil 75 (P75).

• Percentil: 99 puntos que dividen un conjunto de


datos en 100 partes iguales
ESTADÍSTICA DESCRIPTIVA: VARIABLES NUMÉRICAS
Estudios descriptivos
• Medidas de Dispersión • Dividen el conjunto de datos en valores iguales sin que necesariamente sean
centrales.
• Rango: también llamado recorrido, diferencia entre
valores extremos (máximo y mínimo) de un • Rango = (Máx) – (Mín)
conjunto de datos.

• Rango intercuartílico: diferencia entre Q1 y Q3 • IRQ = Q3 - Q1

• Desviación típica: promedio de la desviación de los


datos respecto a la media. Es la raíz cuadrada de la
varianza.

• Varianza: es el cuadrado de la desviación típica


ESTADÍSTICA DESCRIPTIVO: VARIABLES NUMÉRICAS
Estudios descriptivos
Medidas que, sin recurrir a representación gráfica, ofrecen información sobre la distribución de una variable

• Asimetría: indica si existe el mismo número

https://bit.ly/3bA8dUB
de elementos a la derecha y a la izquierda de
la media.
- Simétrica: valores iguales a 0.
- Asimétrica a la derecha: valores positivos.
- Asimétrica a la izquierda: valores negativos.

• Curtosis: indica la cantidad de datos cercanos a la media.


- Mesocúrtica: coeficiente es nulo, distribución normal.

https://bit.ly/3bA8dUB
- Leptocúrtica: coeficiente es positivo, curva puntiaguda. Mayor
concentración de los datos en torno a la media.
- Platicúrtica: coeficiente es negativo, la curva achatada. Menor
concentración de datos en torno a la media.
ESTADÍSTICA DESCRIPTIVA: VARIABLES CATEGÓRICAS
Estudios descriptivos
• Frecuencias • Facilitan comparar la aparición de un elemento (X1) en un conjunto de elementos (X1, X2 …Xn)

• Frecuencia absoluta (ni): número de veces que un


valor está dentro de un conjunto de datos. La suma
de todas las ni es igual a N

• Frecuencia absoluta acumulada (Ni): suma de


las frecuencias absolutas

• Frecuencia relativa (fi): frecuencia absoluta dividida


entre el total de elementos (N). La suma de todas
las fi es igual a 1.
Ejemplo de una tabla de frecuencias con datos no agrupados
https://bit.ly/2SZNt1Q
• Frecuencia absoluta acumulada (Fi): suma de
las frecuencias relativas de los elementos
menores o iguales a él.
ESTADÍSTICA DESCRIPTIVA: VARIABLES NUMÉRICAS

• Estudios descriptivos
Tabla de frecuencias con datos agrupados: se emplean con variables continuas que toman gran número de valores
• Hallar el rango(R): R = Xmax– Xmin
• Hallar el número de intervalos (K). No se especifica: regla de Sturgues: K = 1 + 3,322.log(n) ; siendo n el número de datos.
• Determinar la amplitud de clase (A): A = R/K
• Hallar límite inferior y superior de cada clase, así como las marcas de clase.
• Seguir el orden de la tabla de ejemplo.

Ejemplo de una tabla de frecuencias con datos agrupados


https://bit.ly/2SZNt1Q
GRÁFICOS CON VARIABLES CATEGÓRICAS

Estudios descriptivos
• Errores en la construcción de gráficos estadísticos (Batanero & Godino, 2002, p. 727).

• Elección incorrecta del tipo de gráfico en relación con la variable estadística que se está estudiando y la
información que se quiere presentar de la misma y del conjunto de datos.

• La elección de las escalas de representación es poco adecuada en comparación con la cantidad de datos que
se presentan.

• Omisión de las escalas de representación en ambos o alguno de los ejes.

• No especificar el origen de coordenadas ya sea para las frecuencias o para los valores que toma la variable
estadística.

• Ausencia de suficientes divisiones en las escalas de los ejes, que permitan dar claridad a la información que se
representa.

• Mezclar en un mismo gráfico datos que no son comparables.


GRÁFICOS CON VARIABLES CATEGÓRICAS

Estudios descriptivos

https://bit.ly/3bA8dUB
• Diagrama de barras: representa datos cualitativos a partir
de la frecuencia absoluta, relativa o porcentual.

• Polígono de frecuencias: se configura como un diagrama de


barras, pero expresa la unión de las barras en su extremo
empleando segmentos.

https://bit.ly/3bA8dUB
https://bit.ly/3cvv0ls

• Gráfico circular: coloquialmente llamado “torta” o “ponqué”,


representa frecuencias, porcentajes y proporciones de forma
circular y no con barras.
GRÁFICOS CON VARIABLES NUMÉRICAS

Estudios descriptivos
• Gráfico de líneas: datos representados por puntos unidos

https://bit.ly/2T5eocO
por segmentos. Útiles para ver cómo se comporta una
variable con el paso del tiempo.

• Histograma de frecuencias: es una gráfica de datos agrupados


por intervalos; facilita conocer (visualmente) la distribución de
una variable. También se emplea con datos ordinales siempre
que su número sea alto.

Rodríguez et al., 2015


10.14483/udistrital.jour.RC.2015.21.a6

• Gráfico de caja y bigote: permite conocer los cuartiles, valores


extremos y datos atípicos.
https://bit.ly/3bA8dUB
GRÁFICOS CON VARIABLES NUMÉRICAS


Estudios descriptivos
Diagramas de dispersión: expresan las relaciones (o independencia) entre dos conjuntos asociados de
datos, es decir, analizan la relación entre dos variables definiendo qué tanto se afectan mutuamente o qué
tan independientes son una de la otra.

Correlación negativa Correlación positiva

By Jsmura (Own work) [CC BY-SA 4.0], via Wikimedia Commons

También podría gustarte