Está en la página 1de 88

TEMA 1:

INTRODUCCIÓN
A LA ESTADÍSTICA
DESCRIPTIVA

MARIOLA ESTUDILLO MARTÍNEZ


DPTO. ESTADÍSTICA E INVESTIGACIÓN OPERATIVA
CONCEPTOS FUNDAMENTALES
•RAMAS DE LA ESTADÍSTICA
Dentro de la Estadística podemos distinguir distintas partes:
 Estadística Descriptiva: se ocupa de la descripción de un
conjunto de datos, es decir, consiste en extraer
información presente en los datos de un estudio.
 Inferencia Estadística: conjunto de técnicas que nos
permite obtener conclusiones generales para toda una
población, a partir del estudio de una muestra
representativa de dicha población.
 Cálculo de probabilidades: conjunto de técnicas que nos
permite establecer el concepto de probabilidad y los
modelos más frecuentes de presentación de ésta. Es una
herramienta en la que se apoya la Inferencia para su
formulación y desarrollo.
CONCEPTOS FUNDAMENTALES
•CLASES DE FENÓMENOS
En la observación de la realidad encontramos dos tipos de
fenómenos:

 Causales o determinísticos: aquéllos que presentan los


mismos resultados si se realizan en idénticas condiciones
(fenómenos físicos, químicos,…). EJEMPLO: tiempo de
caída en el lanzamiento de un dado desde una misma altura.

 Aleatorios, estadísticos o de azar: aquellos fenómenos


en los que no se puede predecir el resultado aunque sean
conocidas las condiciones de realización. EJEMPLO:
resultado que se obtiene en el lanzamiento del dado.

NOTA: la Estadística se ocupa del estudio de los fenómenos


aleatorios.
CONCEPTOS FUNDAMENTALES
•CONCEPTOS BÁSICOS
 Estadística Descriptiva: método de descripción de un
conjunto de datos, que consiste en dar una descripción
numérica, en ordenar y simplificar la información de los
datos observados. Para ello se organizarán los datos en
tablas (tablas de frecuencias) y se extraerá la información
mediante la obtención de representaciones gráficas y el
cálculo de medidas numéricas.

 Población: conjunto de elementos o individuos objeto del


estudio. Debe estar perfectamente determinada sin ningún
tipo de ambigüedad, de manera que se pueda discernir si
un elemento pertenece o no la misma.
CONCEPTOS FUNDAMENTALES
•CONCEPTOS BÁSICOS
 Individuo: cada elemento de la población.

 Tamaño de la población: número de elementos o


individuos que forman la población. Se designa por N.

 Muestra: subconjunto representativo de la población, de


forma que las conclusiones obtenidas a partir de su
estudio, puedan generalizarse a toda la población. El
número de elementos que la forman se denota por n.
 Carácter: característica o cualidad que deseamos
observar sobre los elementos de la población y que han de
tener todos y cada uno de ellos. EJEMPLOS: sexo, edad,
altura, nivel de estudios, sueldo,…
CONCEPTOS FUNDAMENTALES
•CONCEPTOS BÁSICOS
 Modalidad: cada uno de los estados que puede presentar
un carácter. Deben ser incompatibles y exhaustivos, es
decir, cada individuo debe presentar una y sólo una de
esas modalidades.

EJEMPLOS
- Sexo: hombre, mujer.
- Edad: <18, 19, 20, 21, >21
- Nivel de estudios: primarios, secundarios, superiores.
- Sueldo: <1000, [1000,1500), [1500,2000), >2000
CONCEPTOS FUNDAMENTALES
•CONCEPTOS BÁSICOS
 Carácter cualitativo: aquél cuyas modalidades no son
medibles. No se pueden representar numéricamente sino
que son cualidades.

 Carácter cuantitativo: aquél cuyas modalidades son


medibles o numerables, es decir, se les puede asignar un
número con significado matemático.

EJEMPLOS
-Carácter cualitativo:
-Carácter cuantitativo:
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•DEFINICIÓN Y CLASIFICACIÓN
 Variable estadística: es un símbolo matemático que
representa un carácter. Es decir, es el conjunto de
posibles valores que se pueden obtener al hacer la
medición de un carácter en un estudio estadístico.

 Clasificación:

- Variables cuantitativas: discretas y continuas.


- Variables cualitativas: escala nominal y escala ordinal.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•DEFINICIÓN Y CLASIFICACIÓN
 Variables cuantitativas: representan caracteres cuantitativos,
es decir, su valor tiene significado matemático.
 V.c.discretas: si toman valores aislados. Es decir, el
conjunto de valores de la variable es finito o infinito
numerable.
EJEMPLOS:

 V.c.continuas: si toman los infinitos valores dentro de un


intervalo de valores.
EJEMPLOS:
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•DEFINICIÓN Y CLASIFICACIÓN
 Variables cualitativas: representan caracteres cualitativos,
es decir, su valor no tiene significado matemático.
 Escala nominal: cuando la información se puede
clasificar en categorías no numéricas, mutuamente
excluyentes y entre las que no se puede establecer
ninguna relación de orden.
EJEMPLOS:
 Escala ordinal: tiene las mismas características que la
anterior, pero en este caso sí se puede establecer un
orden.
EJEMPLOS:
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•DEFINICIÓN Y CLASIFICACIÓN
 EJERCICIO

Clasificar las siguientes variables estadísticas: temperatura


mínima diaria, código postal, nota numérica de un examen,
nota cualitativa de un examen, número de ingresos en
prisión, número de camiseta de un deportista.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
 Definición
Una tabla de frecuencias es una tabla en la que se resume y
se organiza la información de los datos a través del
recuento de ocurrencias de los valores de las variables. En
general, se habla de distribución de frecuencias
unidimensional ya que sólo se estudia un carácter en los
elementos de la población.

 Tipos de frecuencias
Consideremos una población estadística de n individuos, en
la que se desea estudiar una variable estadística X que
presenta las modalidades x1, x2,…,xk.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
a) Frecuencia absoluta:

La frecuencia absoluta de una modalidad xi de X es el


número de individuos que presenta dicha modalidad. Se
denota por ni.
Se verifica que:
k


i
1
ni n
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
b) Frecuencia relativa:

La frecuencia relativa de una modalidad xi de X es la


proporción de individuos que presenta dicha modalidad. Se
denota por fi.
Se verifica que:
k
ni
fi 
n
i  1,..., k 
i
fi
1
1
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
c) Frecuencia absoluta acumulada:

La frecuencia absoluta acumulada de una modalidad xi de X


es el número de individuos que presentan una modalidad
igual o inferior a ella. Se denota por Ni.
Se verifica que:
i
Ni  
j
nj
1
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
d) Frecuencia relativa acumulada:

La frecuencia relativa acumulada de una modalidad xi de X


es la proporción de individuos que presentan una modalidad
igual o inferior a ella. Se denota por Fi.
Se verifica que:

Ni i
Fi 
n
 
j
1
fj
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
 Tablas de frecuencias según el tipo de variable
a) Variables cualitativas:

xi ni fi

x1 n1 f1=n1/n
x2 n2 f2=n2/n
.. .. ..
. . .
xk nk fk=nk/n

n 1
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
EJEMPLO
Supongamos que en una población de 100 personas
observamos el color de ojos y obtenemos los siguientes datos:
10 con ojos verdes, 35 azules y 55 marrones. Construir la
tabla de frecuencias.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
b) Variables cuantitativas discretas:
Las modalidades se ordenan de menor a mayor.

xi ni fi Ni Fi

x1 n1 f1=n1/n N1=n1 F1=f1


x2 n2 f2=n2/n N2=n1+n2 F2=f1+f2
.. .. .. .. ..
. . . . .
xk nk fk=nk/n Nk =n1+n2+…+nk =n Fk=f1+f2+…+fk=1

n 1
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
EJEMPLO
En cierto edificio, el número de personas por vivienda resultó
ser el siguiente: 4, 2, 2, 5, 3, 3, 4, 6, 3, 2. Organizad los
datos en una tabla de frecuencias y contestad a las
siguientes preguntas:
1. Número de viviendas con menos de 4 personas.
2. Número de viviendas con más de 4 personas.
3. Proporción de viviendas con menos de 5 personas.
4. Proporción de viviendas en las que vivan entre 3 y 5
personas.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
c) Variables cuantitativas continuas:
Las modalidades se agrupan en clases o intervalos.

Ii ai xi ni fi Ni Fi

[e0,e1] a1=e1-e0 x1=(e0+e1)/2 n1 f1 N1 F1


(e1,e2] a2=e2-e1 x2 =(e1+e2)/2 n2 f2 N2 F2
.. .. .. .. .. .. ..
. . . . . . .
(ek-1,ek] ak=ek-ek-1 xk =(ek-1+ek)/2 nk fk Nk =n Fk=1

n 1
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
- ai es la amplitud del intervalo Ii.
- xi es la marca de clase del intervalo Ii, punto medio de Ii.
Construcción de intervalos
R= rango de la variable=max{xi}-min{xi}
- ai conocida - ai desconocida
R nº intervalos  nº observaciones
n º intervalos 
ai R
ai 
n º intervalos
- Si n es grande: n º intervalos  1  3.22 log n
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
EJEMPLO
Las alturas de 20 personas (en cm) son las siguientes: 174,
185, 166, 176, 145, 166, 191, 175, 158, 156, 156, 187, 162,
172, 197, 181, 151, 161, 183, 172. Construir la tabla de
frecuencias con intervalos de amplitud 10.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•TABLAS DE FRECUENCIAS
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS

 Definición

Las representaciones gráficas se utilizan para realizar una


síntesis aproximada o apreciación visual de la información.
La norma que se debe seguir es que “la zona que identifica a
cada valor sea proporcional a su frecuencia”. Nunca deben
sustituir al estudio analítico que es el que nos permite
obtener conclusiones definitivas sobre el fenómeno en
estudio. Por tanto, son una forma complementaria de
describir los datos.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS
a) Variables cualitativas:
 Diagrama de sectores

Consiste en un círculo en el que se representan sectores o


porciones con áreas proporcionales a las frecuencias de
cada clase.
El sector correspondiente a cada clase se calcula como

ni
i  360  360fi
n
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS
EJEMPLO

En el ejemplo anterior en el que se estudia el color de los


ojos, obtener un diagrama de sectores.

10 Diagrama de Sectores de Color de ojos


Verdes :  1  360  36º
100 10,00%
Frecuencia
verdes
35 azules
Azules :  2  360  126º marrones
100
55,00% 35,00%
55
Marrones :  3  360  198º
100
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS

 Diagrama de barras

Cada modalidad se representa mediante un rectángulo. Los


rectángulos tienen base constante y altura proporcional a
su frecuencia.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS
EJEMPLO
En el ejemplo anterior en el que se estudia el color de los
ojos, obtener un diagrama de barras.

Diagrama de Barras de Color de ojos


60
50
40
30
20
10
0
verdes azules marrones
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS
a) Variables cuantitativas discretas:
 Diagrama de sectores

Se construyen de igual forma que en el caso anterior.


 Diagrama de barras
Cada modalidad se representa mediante una línea
vertical cuya altura es proporcional a la frecuencia.
 Polígono de frecuencias
Es la línea poligonal que se obtiene al unir los
extremos de las barras.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS
EJEMPLO
En el ejemplo anterior en el que se estudia el número de
personas por vivienda, obtener las 3 representaciones gráficas.

Diagrama de Barras
D. Sectores del nº personas por vivienda
3
10,00%

10,00% 30,00% 2

Frecuencia
2 1
3
20,00% 4
5 0
6 0 1 2 3 4 5 6 7
30,00% nº personas
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS
a) Variables cuantitativas continuas:
 Diagrama de sectores

Se construyen de igual forma que en el caso anterior.


 Histograma
Es un diagrama de rectángulos adosados cuya base
coincide con la clase o intervalo correspondiente y cuya
altura se calcula como hi=ni/ai (densidad de frecuencia). Si
todos los intervalos tienen la misma amplitud, entonces la
altura es ni.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS
 Polígono de frecuencias
Es la línea poligonal que se obtiene al unir los puntos medios
de los extremos superiores de los rectángulos y completamos
con los ficticios anterior y posterior.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS
EJEMPLO
Dada la siguiente tabla de frecuencias de una variable
continua, obtener sus representaciones gráficas.

Ii ai xi ni Fi hi
[0,10) 10 5 10 0.1 1
[10,20) 10 15 35 0.45 3.5
[20,40) 20 30 40 0.85 2
[40,50] 10 45 15 1 1.5
100
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•REPRESENTACIONES GRÁFICAS

Histograma
4

hi 2

0
0 10 20 30 40 50 60
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
 Definición

Estas medidas proporcionan un valor o valores centrales


representativos de las observaciones. Se expresan en las
mismas unidades que la variable.

 Tipos
Las medidas de centralización o tendencia central son:
media, mediana y moda.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
 MEDIA

Es el resultado de dividir la suma de todas las


observaciones entre el número total de observaciones.

1 k k
x 
n

i
1
ni xi  
i
fi xi
1

- Si la variable es discreta se aplica directamente esta


definición.
- Si la variable es continua, los xi corresponden a las marcas
de clase.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO

Estamos estudiando la variable X=“número de personas por


vivienda en un edificio”. Obtener el valor de la media.

xi ni
2 6
3 15
4 10
5 9
40
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO
Dada la variable X=“edad en años de un grupo de 50
personas”. Obtener el valor de la media.

Ii ni
[0,5) 5
[5,10) 10
[10,15) 16
[15,20) 6
[20,25] 13
50
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN

 MEDIANA

Es una medida de tendencia central que expresa el centro


de los datos como el punto que separa las observaciones,
ordenadas de menor a mayor, en dos grupos con el mismo
número de elementos. Es decir, es el valor central de las
observaciones que deja por debajo y por encima de sí el
50% de las observaciones.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
Forma de cálculo:
1. Datos no agrupados:

a) Se ordenan los datos de menor a mayor: x(1),x(2),…,x(n).


b) Si n es impar, la mediana es el valor central de las
observaciones:
Me  x  n  1 
 
 2 

Si n es par, la mediana es la media de los dos


valores centrales.
x n   x n 
   1 
Me  2 2 

2
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO

Dada la variable X=“número de veces que usan la tarjeta de


crédito a la semana un grupo de 15 personas”, obtener el valor
de la mediana.

6, 3, 6, 6, 6, 4, 1, 3, 4, 4, 4, 3, 6, 6, 6
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO

Consideremos la variable del ejemplo anterior, pero ahora con


los siguientes datos:

6, 3, 6, 6, 6, 4, 1, 3, 4, 4, 4, 3, 6, 6, 6, 6
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
2. Datos agrupados en tablas:

a) Variables discretas:
Obtenemos las frecuencias absolutas acumuladas y
buscamos el valor cuya frecuencia absoluta acumulada
iguale o supere a n/2 de tal forma que:
n
Si Ni   Me  xi
2
n xi  xi  1
Si Ni   Me 
2 2
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
b) Variables continuas:
- Obtenemos el intervalo mediano actuando como en el
caso discreto.
- Hallamos el valor exacto de la mediana aplicando la
siguiente expresión:
n 1
 Ni 1  Fi 1
Me  ei 1  2 ai ó Me  ei 1  2 ai
ni fi
NOTA: nosotros obtendremos el intervalo mediano y no
aplicaremos la fórmula para obtener el valor exacto.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO

Consideremos el ejemplo anterior con n=15 datos pero con los


valores agrupados en una tabla de frecuencias. Obtener el
valor de la mediana.

xi ni
1 1
3 3
4 4
6 7
15
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO

Consideremos el ejemplo anterior con n=16 pero con los datos


agrupados en una tabla de frecuencias. Obtener el valor de la
mediana.

xi ni
1 1
3 3
4 4
6 8
16
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO
Dada la variable X=“edad en años de un grupo de 50
personas”. Obtener el valor de la mediana.

Ii ni Ni
[0,5) 5 5
[5,10) 10 15
[10,15) 16 31
[15,20) 6 37
[20,25] 13 50
50
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
 MODA

Es el valor de la variable con mayor frecuencia, es decir, el


que más se repite.
La moda no tiene por qué ser única, pueden existir dos o
más modas.

Forma de cálculo:
1. Variables discretas:

Es el valor de la variable con mayor frecuencia ni.


VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO

Estamos estudiando la variable X=“número de personas por


vivienda en un edificio”. Obtener el valor de la moda.

xi ni
2 6
3 15
4 10
5 9
40
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
2. Variables continuas:
- Obtenemos el intervalo modal que es aquel con mayor ni si
todos los intervalos tienen la misma amplitud o aquel con
mayor hi (densidad de frecuencia) si tienen distinta amplitud.
- Hallamos el valor exacto de la moda aplicando la
siguiente expresión:
Amplitudes iguales : Amplitudes distintas :
ni  ni 1 hi  hi 1 ni
Mo  ei 1  ai Mo  ei 1  a hi 
ni  ni 1  ni  ni 1 hi  hi 1  hi  hi 1 i ai

NOTA: nosotros obtendremos el intervalo modal y no


aplicaremos la fórmula para obtener el valor exacto.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO
Dada la variable X=“edad en años de un grupo de 50
personas”. Obtener el valor de la moda.

Ii ni
[0,5) 5
[5,10) 10
[10,15) 16
[15,20) 6
[20,25] 13
50
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
EJEMPLO
Dada la variable X=“edad en años de un grupo de 47
personas”. Obtener el valor de la moda.

Ii ni
[0,5) 5
[5,15) 26
[15,20) 6
[20,25] 10
47
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
 Comparación entre las medidas centrales

La relación existente entre las tres medidas de


centralización es la siguiente:
x  Mo  3x  Me 
Media
a) Es sensible a valores extremos.
b) No es una medida representativa en distribuciones asimétricas.
c) En caso de v. discretas puede no ser un valor de las
observaciones.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE CENTRALIZACIÓN
Mediana
a) No le afectan los valores extremos.

b) Difícil de usar en Inferencia por complejidad en propiedades.

Moda
a) Fácil de calcular.
b) Puede no ser única.
c) No le afectan los valores extremos.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
 Definición

Los cuantiles son una medida de posición que permiten el


cálculo del valor de la variable que ocupa una cierta posición
relativa respecto del conjunto total de los valores
observados.
En general, el cuantil de orden k es el valor de la variable
que deja por debajo de él el k% de las observaciones.
 Tipos
Los tipos de cuantiles son: cuartiles, deciles y percentiles.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
 CUARTILES
Los cuartiles son los valores de la variable que dividen a la
población en 4 partes iguales.
- Primer cuartil, Q1: cuantil de orden ¼. Es el valor de la variable
que deja por debajo de sí el 25% de las observaciones.
- Segundo cuartil, Q2: cuantil de orden ½. Es el valor de la
variable que deja por debajo de sí el 50% de las observaciones.
Coincide, por tanto, con la mediana.
- Tercer cuartil, Q3: cuantil de orden ¾. Es el valor de la variable
que deja por debajo de sí el 75% de las observaciones.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES

Forma de cálculo

Se calculan de igual forma que la mediana pero sustituyendo


el valor n/2 por nk/4, es decir, por n/4 en el caso de Q1,
n/2 en el caso de Q2=Me y 3n/4 en el caso de Q3.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
 DECILES
Los deciles son los valores de la variable que dividen a la
población en 10 partes iguales. Son 9 y se denotan por D1,
D2,…D9. Por ejemplo:
- Primer decil, D1: es el valor de la variable que deja por
debajo de sí el 10% de las observaciones.
- Quinto decil, D5: es el valor de la variable que deja por
debajo de sí el 50% de las observaciones. Coincide, por
tanto, con la mediana.
- Noveno decil, D9: es el valor de la variable que deja por
debajo de sí el 90% de las observaciones.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES

Forma de cálculo

Se calculan de igual forma que la mediana pero sustituyendo


el valor n/2 por nk/10, es decir, por n/10 en el caso de D1,
2n/10 en el caso de D2, 3n/10 en el caso de D3,…,9n/10 en el
caso de D9.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
 PERCENTILES
Los percentiles son los valores de la variable que dividen a
la población en 100 partes iguales. Son 99 y se denotan por
P1, P2,…P99. Por ejemplo:
- Primer percentil, P1: es el valor de la variable que deja por
debajo de sí el 1% de las observaciones.
- Percentil 50, P50: es el valor de la variable que deja por
debajo de sí el 50% de las observaciones. Coincide, por
tanto, con la mediana.
- Percentil 99, P99: es el valor de la variable que deja por
debajo de sí el 99% de las observaciones.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES

Forma de cálculo

Se calculan de igual forma que la mediana pero sustituyendo


el valor n/2 por nk/100, es decir, por n/100 en el caso de P1,
2n/100 en el caso de P2, 30n/100 en el caso de P30,
…,99n/100 en el caso de P99.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
EJEMPLO

Consideremos la siguiente distribución de frecuencias.


Obtener Q1, Q3, D9, P50 y P82.

-Q1, primer cuartil:


xi ni Ni
2 6 6
3 14 20
4 11 31
5 9 40
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
EJEMPLO

-Q3, tercer cuartil:


xi ni Ni
2 6 6
3 14 20
4 11 31
5 9 40
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
EJEMPLO

-D9, noveno decil:


xi ni Ni
2 6 6
3 14 20
4 11 31
5 9 40
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
EJEMPLO
-P50, percentil 50:
xi ni Ni
2 6 6
3 14 20
4 11 31
5 9 40
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
EJEMPLO
-P82, percentil 82:
xi ni Ni
2 6 6
3 14 20
4 11 31
5 9 40
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
EJEMPLO
Consideremos la siguiente distribución de frecuencias.
Obtener Q3, D2 y P62.
-Q3, tercer cuartil:
Ii ni Ni
[0,5) 5 5
[5,10) 10 15
[10,15) 17 32
[15,20) 5 37
[20,25] 13 50
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
EJEMPLO
-D2, segundo decil:
Ii ni Ni
[0,5) 5 5
[5,10) 10 15
[10,15) 17 32
[15,20) 5 37
[20,25] 13 50
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE POSICIÓN: CUANTILES
EJEMPLO

-P62, percentil 62:


Ii ni Ni
[0,5) 5 5
[5,10) 10 15
[10,15) 17 32
[15,20) 5 37
[20,25] 13 50
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE DISPERSIÓN
 Definición
La dispersión es la mayor o menor separación de los valores
respecto a una característica de tendencia central. Dicha
característica es más representativa cuanto más agrupados en
torno a ella estén los valores y tanto menos representativa
cuanto más dispersos estén los datos respecto a ella. La
descripción de una variable no debe hacerse sólo en términos
de las características de posición, sino que hay que
acompañarla siempre de una medida de dispersión.

 Tipos
Las medidas de dispersión pueden ser absolutas o relativas.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE DISPERSIÓN
 ABSOLUTAS

a) Rango o recorrido
Es la diferencia entre el valor máximo y el mínimo.
R = max{xi}-min{xi}

b) Recorrido intercuartílico
Es la diferencia entre Q3 y Q1, es decir, informa del
intervalo que contiene el 50% central de las observaciones.
RIQ = Q3-Q1
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE DISPERSIÓN
c) Varianza
Es la media de los cuadrados de las desviaciones de cada
observación respecto a la media.
1 k
1 k
Sn 
2

n i
ni (xi
1
x) 
2

n i
ni xi
1
2
x 2
 0

Si la varianza es grande, la media será una medida poco


representativa de las observaciones. Cuanto menor sea,
más representativa será la media.
Se expresa en las unidades de la variable pero al
cuadrado.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE DISPERSIÓN
d) Desviación típica
Es la raíz cuadrada positiva de la varianza.

Sn   Sn2  0
Cuanto mayor sea la desviación típica, más dispersos
estarán los datos y menos representativa será la media de
los datos. Cuanto menor sea, más agrupados estarán los
datos en torno a la media y más representativa será ésta.

Se expresa en las mismas unidades de la variable, por lo


que no tiene el inconveniente de la varianza.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE DISPERSIÓN
 RELATIVAS
Son medidas sin dimensión, es decir, sin unidades. Por ello,
se utilizan para comparar la representatividad de la media
en distintos conjuntos de datos.
S
Coeficiente de variación: CV ( X )  n
x
Interpretación:
-Permite determinar si la media de un conjunto de datos es o
no representativa, es decir, si los datos son o no dispersos.
Se considera que los datos están muy dispersos respecto a su
media si el coeficiente de variación supera el 75% (expresado
en %).
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE DISPERSIÓN
 RELATIVAS

-Permite comparar dos o más variables para ver cuál es más


homogénea, qué media es más representativa o en cuál los
datos son menos dispersos.

-Aquella variable con un coeficiente de variación menor es más


homogénea, tiene la media más representativa y los datos son
menos dispersos.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE DISPERSIÓN
EJEMPLO
Dados los siguientes datos, obtener a partir de ellos la
varianza, la desviación típica y el coeficiente de variación.
k k
n  50  ni xi  685
i 1
 i i  11512.5
n x
i 1
2
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE DISPERSIÓN
EJEMPLO
La nota media en matemáticas en una clase es 6.5 con una
desviación típica de 1.5 y la de matemáticas en otra clase
distinta es 7.8 con una desviación típica de 2.4. ¿Qué media es
más representativa?
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE FORMA
 MEDIDAS DE ASIMETRÍA
- Se dice que la distribución de los datos es simétrica cuando
los datos están repartidos de igual forma a uno y otro lado de
la media. En este caso: ẋ = Me = Mo.
- Se dice que la distribución de los datos es asimétrica a la
derecha si las frecuencias descienden más lentamente por la
derecha que por la izquierda. Y es asimétrica a la izquierda si
las frecuencias descienden más lentamente por la izquierda que
por la derecha.
- Los tipos de medidas de asimetría son: coeficiente de
asimetría de Fisher y coeficiente de asimetría de Pearson.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE FORMA
a) Coeficiente de asimetría de Fisher

1 k

 n (x
n i i i
 x )3
1  1
Sn3

- Si 1 < 0, la distribución es asimétrica a la izquierda o negativa.

- Si 1 = 0, la distribución es simétrica.
- Si 1 > 0, la distribución es asimétrica a la derecha o positiva.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE FORMA

15 15
15
12 12
12

9 9 9

6 6 6

3 3 3

0 0 0
0 2 4 6 8 0 2 4 6 8 10 0 2 4 6 8 10

distribución distribución distribución


asimétrica izquierda simétrica asimétrica derecha
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE FORMA
 MEDIDAS DE CURTOSIS O APUNTAMIENTO

- Determinan la forma de la distribución en relación con su


grado de aplastamiento.

- Comparan la forma de la distribución de unos datos


observados con la distribución normal.

- La medida más utilizada es el coeficiente de curtosis de


Fisher.
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE FORMA
a) Coeficiente de curtosis de Fisher

1 k

n
 i i
n ( x  x ) 4

2  i 1
3
Sn
4

- Si 2 < 0, distribución menos apuntada que la normal (platicúrtica).

- Si 2 = 0, distribución igual de apuntada que la normal (mesocúrtica).

- Si 2 > 0, distribución más apuntada que la normal (leptocúrtica).


VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE FORMA

-5 -3 -1 1 3 5 -5 -3 -1 1 3 5 -5 -3 -1 1 3 5

platicúrtica mesocúrtica leptocúrtica


VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE FORMA
EJEMPLO
Estudiar la forma de la distribución.

xi ni
2 6
3 15
4 10
5 9
40
VARIABLES ESTADÍSTICAS
UNIDIMENSIONALES
•MEDIDAS DE FORMA
TEMA 1:
INTRODUCCIÓN
A LA ESTADÍSTICA
DESCRIPTIVA

MARIOLA ESTUDILLO MARTÍNEZ


DPTO. ESTADÍSTICA E INVESTIGACIÓN OPERATIVA

También podría gustarte