Está en la página 1de 45

Unidad No 1: Estadística descriptiva

Unidad No 1: Estadística descriptiva

Universidad Nacional de Cuyo

2019
Unidad No 1: Estadística descriptiva

Presentación de Datos
Descripción de un conjunto de datos: Métodos Grácos
Datos Cualitativos
Datos Cuantitativos
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central
Media Aritmética
Mediana
Moda
Medidas de dispersión
Rango
Varianza
Desviación estándar
Coeciente de variación
Puntaje Z
Medidas de posición no centradas
Cuartiles
Deciles
Percentiles
Unidad No 1: Estadística descriptiva
Presentación de Datos

Ejemplo
En un estudio realizado por el Instituto del hierro y el acero de
Estados Unidos durante el año 1992, se analizó las cantidades (en
miles de toneladas) de importaciones de acero, en distintos países:

Figura: Principales fuentes de importaciones de acero en Estados Unidos


durante 1992
Unidad No 1: Estadística descriptiva
Presentación de Datos

Frecuencia simple absoluta fi :


representa el número de individuos quepresentan cada modalidad xi .

Frecuencia simple relativa fri :


nos permite valorar la representatividad de cada categoría respecto
al total de los datos. Se calcula: fi /n.

Frecuencia simple relativa porcentual fri %:


representa en porcentajes las frecuencias simples relativas. Se
calcula: fri ∗ 100 %.
Unidad No 1: Estadística descriptiva
Presentación de Datos

Ejemplo
Las siguientes son las alturas, en centímetros, de sesenta alumnos
universitarios

Datos no agrupados
Se presentar los datos crudos, pueden estar ordenados o no
Unidad No 1: Estadística descriptiva
Presentación de Datos

Datos agrupados
Se presentan los datos bajo una estructura

Figura: Estatura de sesenta estudiantes universitarios de Mendoza en


2004
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Gráco de Barras

Figura: Principales fuentes de importaciones de acero en Estados Unidos


durante 1992
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Gráco de Pareto

Los datos de ordenan de mayor a menor

Figura: Principales fuentes de importaciones de acero en Estados Unidos


durante 1992
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Tabla de distribución de frecuencias

Datos Discretos
Representan conteos(Números Naturales): Cantidad de camiones

Datos Continuos
Representan mediciones(Números Reales): Altura de los estudiantes
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Tamaño de muestra n:
es la cantidad de elementos en una serie estadística

Máximo (xmx ):
se llama máximo de una variable estadística al mayor valor que
toma la variable en toda la serie estadística.

Mínimo (xmn ):
se llama mínimo de una variable estadística al menor valor que
toma la variable en toda la serie estadística.

Recorrido (R):
es la diferencia entre el máximo y el mínimo en una serie estadística

Clase:
se llama clase a cada uno de los intervalos en que podemos dividir
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Límite superior de la clase (Ls ):


es el máximo valor del intervalo.

Límite inferior de la clase (Li ):


es el mínimo valor del intervalo.

Marca de clase (xi ):


es el punto medio de cada clase y es el promedio entre los extremos
del intervalo.

Cantidad de intervalos (k):


se obtiene a partir de la fórmula de Sturges, que está dada por:
1 + 3, 3√∗ logn. Para tamaños de muestra pequeños también es útil
utilizar n (raíz cuadrada de n), aunque la fórmula de Sturges es
válida para todos los casos.
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Longitud de intervalos (l):


es la diferencia entre el límite superior y el límite

Ejemplo
Las siguientes son las alturas, en centímetros, de sesenta alumnos
universitarios
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Histograma
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Polígono de frecuencia

Se unen los puntos medios


Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Histograma y Polígono de frecuencia

Se unen los puntos medios


Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos Grácos

Ojiva

Llamamos ojiva al polígono de frecuencias acumuladas


Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central

Datos no agrupados

Media Aritmética
Como la media aritmética de las observaciones x1 , x2 , ..., xn es el
promedio aritmético de éstas, se denota por:
Para datos no agrupados
Pn
i=1 xi
x̄ = (1)
n
Donde i representa las obervaciones
En el ejemplo de las estaturas

149 + ... + 166 + ... + 184


Pn
i=1 xi
x̄ = = = 166, 55
n 60
Interpretación: La estatura promedio de los estudiantes es de
166,55 cm
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central

Mediana
como su nombre lo indica, el valor medio o valor central de un
conjunto de observaciones.
Si n es par:
x 2n + x 2n +1
Mediana = (2)
2
Si n es impar:

Mediana = x n+1 (3)


2
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central

Para el ejemplo de las alturas:

x 60 + x 30 +1
2 2 x30 + x31 167 + 168
Mediana = = = = 167, 5
2 2 2
Interpretación: El 50 % de los estudiantes universitarios observados
miden 167,50 cm o menos y el otro 50 % miden 167,50 cm o más.
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central

Moda
La moda, modo o valor modal de un conjunto de observaciones es
el valor de las observaciones que ocurre con mayor frecuencia en el
conjunto.

Moda = 160
Interpretación: La estatura de los estudiantes universitarios
observados que se presenta con mayor frecuencia es 160 cm.
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central

Datos agrupados

Media Aritmética
P
i fi ∗ xi fi
(4)
X X
x̄ = = xi ∗ = xi ∗ fri
n n
i i

Donde i representa las clases


Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central

151, 5 ∗ 4 + ... + 181, 5 ∗ 4


P
i fi ∗ xi
x̄ = = = 167, 17
n 60
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central

Mediana
0, 5 − Fr ,anteriora50 %
Mediana = Linf ,anteriora50 % + I ∗ ( ) (5)
fr ,50 %
Para el caso de las alturas:
0, 5 − 0, 4164
Mediana = 164 + 5 ∗ ( )) = 167, 58
0, 1166
Interpretación: El 50 % de los estudiantes universitarios observados
miden 167,57 cm o menos y el otro 50 % miden 167,57 cm o más.
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de tendencia central

Moda

fr ,Moda − fr ,Moda−1
Moda = Linf ,Moda + I ∗ ( )
fr ,Moda − fr ,Moda−1 + fr ,Moda − fr ,Moda+1
(6)
Para el caso de las alturas:
0, 30 − 0, 05
Moda = 159 + 5 ∗ ( )
(0, 30 − 0, 05) + (0, 30 − 0, 1166)

0, 25
= 159 + 5 ∗ ( ) = 150 + 5 ∗ 0, 5768 = 161, 88
0, 25 + 0, 1834
Interpretación: La estatura de los estudiantes universitarios
observados que se presenta con mayor frecuencia es 161,88 cm.
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de dispersión

Rango
El rango indica la variabilidad existente entre las observaciones de
un conjunto de datos, sin embargo, debe usarse con precaución, ya
que su valor es función únicamente de dos valores extremos
pertenecientes al conjunto.

Rango = xmx − xmin (7)


Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de dispersión

Varianza
La varianza de las observaciones x1, x2, ..., xn es el promedio del
cuadrado de las distancias entre cada observación y la media
aritmética del conjunto de observaciones.

− x̄)2
Pn
2 i=1 (xi
s = (8)
n−1
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de dispersión

Desviación estándar
La raíz cuadrada de la varianza se denomina desviación estándar o
desvío típico.

sP
n
i=1 (xi − x̄)2
s= (9)
n−1
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de dispersión

Coeciente de variación
El coeciente de variación es el cociente entre la desviación
estándar y la media aritmética.

s
CV = (10)

Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de dispersión

Datos No agrupados

Rango

R = xmx − xmn = 184 − 149 = 35


Varianza
(140 − 166, 55)2 + (150 − 166, 55)2 + ...
s2 = = 66, 18
60 − 1
Desviación estándar

66, 18 = 8, 14
p
s=
Interpretación: Las estaturas se desvían, en promedio, respecto a la
media aritmética, en 8,14 cm.
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de dispersión

Coeciente de variación
s 8, 14
CV = = = 0, 0489
x̄ 166, 55
Interpretación: La desviación estándar representa un 4,89
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de dispersión

Datos agrupados

Varianza
− x̄)2 ∗ fi
Pn
2 i=1 (xi
s = (11)
n−1
Donde i representa a la clase i

(151, 5 − 167, 17)2 ∗ 4 + ... + (181, 5 − 167, 17)2 ∗ 4


s2 = = 63, 11
60 − 1
Interpretación: El promedio de los cuadrados de las desviaciones de
las estaturas respecto a la media aritmética es de 63,11.
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de dispersión

Desviación estándar

63, 11 = 7, 94
p
s=
Interpretación: Las estaturas se desvían, en promedio, respecto a la
media aritmética, en 7,94 cm.
Coeciente de variación
s 7, 94
CV = = = 0, 0475
x̄ 167, 17
Interpretación: La desviación estándar representa un 4,75 % de la
media aritmética.
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Puntaje Z

Puntaje Z
es la transformación de una observación que describe mejor el lugar
que esa observación ocupa en la distribución. Especícamente, una
puntuación Z indica a qué cantidad de desviaciones estándar por
encima o por debajo de la media se encuentra dicha observación.

x − x̄
z=
s
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Puntaje Z
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas

Cuartiles
Al dividir los datos en cuatro partes iguales, quedan denidos los
cuartiles: Q1 , Q2 , Q3 .

k ∗ (n + 1)
Qk = (12)
4
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas

Deciles
Al dividir los datos en diez partes iguales, quedan denidos los
deciles: D1 , D2 , ..., D9 .

k ∗ (n + 1)
Dk = (13)
10
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas

Percentiles
Al dividir los datos en cien partes iguales, quedan denidos los
percentiles: P1 , P2 , ..., P99 .

k ∗ (n + 1)
Pk = (14)
100
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas

Datos no agrupados

Cuartil Q1
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas

Datos no agrupados

Decil D8
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas

Decil Percentil P43


Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas

Datos agrupados

¾Qué diferencia hay con la forma de calcular la Mediana de la


ecuación (5)?
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas
Unidad No 1: Estadística descriptiva
Descripción de un conjunto de datos: Métodos numéricos
Medidas de posición no centradas

Cuartil Q3

También podría gustarte