Está en la página 1de 7

ESTADÍSTICA DESCRIPTIVA

¿Qué es la estadística?

ESTADÍSTICA.- Es el arte de realizar inferencias y sacar conclusiones a partir de datos


imperfectos.

Los datos son generalmente imperfectos en el sentido que aun cuando posean información útil
no nos cuentan la historia completa. Es necesario contar con métodos que nos permitan
extraer información a partir de los datos observados para comprender mejor las situaciones
que los mismos representan.

Estadística descriptiva

La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza


un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una
escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las
diversas características de ese conjunto.

Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama
variable estadística.

Las variables pueden ser dos tipos

 Variables cualitativas o categóricas: no se pueden medir numéricamente (por ejemplo:


nacionalidad, color de la piel, sexo).
 Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos
anuales).

Las variables cuantitativas se pueden clasificar en discretas y continuas:

• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de
hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).

• Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc.

MEDIDAS DE TENDENCIA CENTRAL

Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna
medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la
cantidad de datos en partes iguales. Las más usuales son la media, la mediana, media
armónica, media geométrica. Pueden ser de dos tipos: de tendencia central o de tipismo.

Medidas de Dispersión: se llaman medidas de dispersión aquellas que permiten retratar la


distancia de los valores de la variable a un cierto valor central, o que permiten identificar la
concentración de los datos en un cierto sector del recorrido de la variable. Se trata de
coeficientes para variables cuantitativas. Las más usuales son el desvío estándar y la varianza.
LA MEDIA

La media o media aritmética, usualmente llamada promedio, se obtiene sumando todos los
valores de los datos y divide el resultado entre la cantidad de datos. Si los datos proceden de
una muestra la media se representa con una x testada (x) y si provienen de la población se
representan con la letra griega miu (µ).

Media aritmética para datos no agrupados muéstrales.

Media aritmética para datos no agrupados poblacionales

Media aritmética para datos agrupados

Donde

X: promedio muestral (estadístico).

µ: promedio poblacional (parámetro).

∑: signo de sumatoria.

N = número de datos de la población.

n: número de datos de la muestra.

Fi: frecuencia absoluta.

Xc: Marca de clase o punto medio.

LA MEDIANA

La mediana de un conjunto de datos es un valor del mismo tal que el número de datos
menores que él es igual al número de datos mayores que él.

La mediana de un conjunto finito es aquel valor que divide al conjunto en dos partes iguales,
de forma que el número de valores mayor o igual a la mediana es igual al número de valores
menores o igual a estos. Su aplicación se ve limitada ya que solo considérale orden jerárquico
de los datos y no alguna propiedad propia de los datos, como es en el caso de la media.
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de
menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo
para variables cuantitativas.

Li-1 es el límite inferior de la clase donde se encuentra la mediana.

N / 2 es la semisuma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

fi es la frecuencia absoluta del intervalo mediano.

ti es la amplitud de los intervalos.

LA MODA

La moda, es aquel dato, aquel valor de la variable que más se repite; es decir, aquel valor de la
variable (que puede no ser un único valor) con una frecuencia mayor.

Esta medida se puede aparecer tanto para datos cualitativos como cuantitativos. Se dice que
cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas
bimodal, cuando la muestra contiene más de un dato repetido se dice que es multimodal y un
último caso es cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra
es amodal.

Li es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.

fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.
MEDIA ARMÓNICA

La media armónica es la recíproca de la media aritmética. Los elementos del conjunto deben
ser necesariamente no nulos. Esta media es poco sensible a los valores grandes y los
infravalora respecto a la media aritmética, pero muy sensible a los valores próximos a cero, ya
que los recíprocos 1/Xi son muy altos, por lo que les da más peso que en las medias aritmética
y geométrica. Si algún valor fuese cero, la media armónica quedaría indeterminada.

La media armónica (H) de un conjunto de elementos no nulos (X1, X2,…,XN) es el recíproco de


la suma de los recíprocos (donde 1/Xi es el recíproco de Xi)) multiplicado por el número de
elementos del conjunto (N).

MEDIA GEOMÉTRICA

La media geométrica de un conjunto de n datos es el resultado de multiplicarlos entre si y


aplicar la -enésima raíz.

Si en la media aritmética sumábamos los valores para luego dividirlos, ahora debemos
multiplicarlos para luego aplicar la n-ésima raíz pertinente. Es decir

O aplicando la ecuación logarítmica

MEDIDAS DE DISPERSIÓN

Miden la variabilidad de un conjunto de datos. Las medidas más utilizadas son: Rango,
Varianza, Desviación estándar, Coeficiente de variación.

RANGO

Es la diferencia entre el valor más grande y el más pequeño del conjunto de datos.

Rango para datos no agrupados.

Rango = Valor máximo - Valor mínimo


R = 64 – 12 = 52

Rango para datos agrupados:

R = límite superior de la última clase - límite inferior de la primera clase

R = 10.5 – 5.2 = 5.3

VARIANZA

Es la medida que cuantifica la variabilidad de los datos respecto al valor de la media.

La varianza para la muestra se representa mediante una s al cuadrado:

DESVIACIÓN ESTÁNDAR

Es la raíz cuadrada positiva de la varianza. Mide la variabilidad de los datos en las unidades en
que se midieron originalmente. Los símbolos son: s, si es una muestra y; σ si es una población.

s = √ s2

s = √ 145

s = 12.04

La desviación estándar para datos agrupados. s = √(∑(fi * Xc2 ) – (∑(fiXc)2 ) / n) / n – 1

COEFICIENTE DE VARIABILIDAD

Medida de variabilidad relativa: Se usa para comparar la variabilidad entre dos o más muestras
medidas en las mismas unidades o no. Los datos que se expresan en porcentaje en la cual se
compara la desviación estándar con el respectivo valor del promedio de los datos:

UBICACIÓN O POSICIÓN

ASIMETRÍA O SESGO

Evalúa el grado de distorsión o inclinación que adopta la distribución de los datos respecto a su
valor promedio tomado como centro de gravedad. El coeficiente de asimetría de Pearson es:
CURTOSIS

La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada o achatada
está una curva o distribución.

Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a
mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.

Amplitud cuartílica.

AC = tercer cuartil – primer cuartil

Desviación cuartílica.

DC = (tercer cuartil - primer cuartil) / 2

https://www.emagister.com/uploads_courses/Comunidad_Emagister_66885_66885.pdf
file:///C:/Users/Usuario/Downloads/Clase_V_Medidas_de_tendencia_central.pdf

file:///C:/Users/Usuario/Downloads/modulo%20descriptiva.pdf

file:///C:/Users/Usuario/Downloads/34.%20Estadistica%20Descriptiva.pdf