Está en la página 1de 50

ESTADÍSTICA

UNIDAD 2: DISTRIBUCIÓN Y MEDIDAS DE


POSICIÓN

1 Unidad 2 - Estadística - FHyCS


 Incluye la tabulación, representación y
“descripción” de conjuntos de datos.
 A partir de ellos se puede organizar,
simplificar y “resumir” información básica.
 Transforma “datos en bruto” en
“información”
Gráficos

2 Unidad 2 - Estadística - FHyCS


Frecuencias absoluta y rel.
Porcentajes y acumuladas
Medidas de Distribución
Cuartiles Medidas de Posición u
Percentiles Orden
Media
Mediana Medidas de Tendencia
Moda central
Asimetría Medidas de Forma
Curtosis
Rango - Rango Intercuartílico Medidas de Dispersión
Varianza
Desviación Estándar
Coeficiente variación
3 Unidad 2 - Estadística - FHyCS
Calificación Nº de pruebas Frecuencia Porcentaje 8

(valor) (x1) (Frecuencia) Relativa

Número de exámenes
7
2 2 0.07 6.9% 6
3 4 0.14 13.8% 5
4 5 0.17 17.2% 4
5 7 0.24 24.1%
3
6 5 0.17 17.2%
2
7 4 0.14 13.8%
1
8 2 0.07 6.9%
0
29 1 100.0% 2 3 4 5 6 7 8

Calificaciones obtenidas

Tabla con frecuencias absolutas, relativas y porcentajes.


4 Unidad 2 - Estadística - FHyCS
 Permiten tener una idea rápida de cómo están
distribuidos los datos
 Buscan determinar un valor “común” o valor “central”
alrededor del cual está la mayoría de ellos
16

14

12
Número de exámenes

10

0
2 3 4 5 6 7 8
Calificaciones obtenidas

5 Unidad 2 - Estadística - FHyCS


 Se basan en dividir los datos en porciones (cuartos, décimos)
se busca eliminar del análisis los datos extremos, o analizar
los datos por tramos
 Valores que toma la variable en lugares específicos Ej:
percentil 20

Percentiles P10 P20 P30 P40 P50 P60 P70 P80 P90 P100

Curtiles C1 =Q1 C2= Me C3= Q3

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Datos ordenados según su valor
6 Unidad 2 - Estadística - FHyCS
 Junto con la centralidad y la dispersión, conviene ver
otras medidas que tienen que ver con la forma de la
distribución y nos da una información complementaria

Kurtosis Asimetría

7 Unidad 2 - Estadística - FHyCS


 Además de conocer el punto central de un conjunto de
datos también interesa conocer su dispersión, es decir
cuán lejos tienden a estar los datos del centro

45
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

8 Unidad 2 - Estadística - FHyCS


Variable: Sexo
Frecuencia Frecuencia Relativa
Sexo
Dominio: absoluta + Porcentaje
Hombre 4 4/10 = 0,4 = 40%
 H = Hombre
Mujer 6 6/10 = 0,6 = 60%
 M = Mujer
Total 10 = tamaño 0,4 + 0,6 = 1 ó 100%
Muestra: muestral

 MHHM M HMMM H
 equivale a HHHH MMMMMM

9 Unidad 2 - Estadística - FHyCS


 Se aplica a variables cualitativas o
cuantitativas.
 Se forman clases o categorías que se
listan en la primera columna de la tabla (cada
uno de los valores registrados de la variable).
 La segunda columna es el registro de
cuántos individuos o unidades de análisis
toman el valor de la categoría o están incluidas
en la clase: FRECUENCIAS ABSOLUTAS.

10 Unidad 2 - Estadística - FHyCS


 Llamamos tabla o distribución de frecuencias a
una tabla donde se resumen los datos de una
variable
 Es una manera “sencilla” de agrupar mucha
información en unos pocos datos comprensibles
 Contenido básico: ¿qué valores toma la variable, y
qué proporción de los sujetos tiene cada valor?
 Lo hacemos de manera diferente para variables
discretas y continuas
11 Unidad 2 - Estadística - FHyCS
Recordatorio variables discretas son:
 Todas las cualitativas (región, ciudad, partido al
que vota, sentimiento religioso, ve o no ve la
tele...)
 Todas las de escala ordinal: opinión sobre algo
(muy buena, buena, regular, mala, muy mala)
 Algunas variables cuantitativas: las que tienen
pocos valores (número de personas en el hogar,
número de hijos, etc ...)
12 Unidad 2 - Estadística - FHyCS
 FRECUENCIA ABSOLUTA fi :

La frecuencia absoluta de la clase i es el


número de unidades que se clasifican
dentro de esa clase.
La suma de los fi para todas las clases es
igual a n.

13 Unidad 2 - Estadística - FHyCS


La FRECUENCIA RELATIVA (ri)
La frecuencia relativa de la clase i, se
obtiene dividiendo la frecuencia absoluta
sobre el número total de observaciones
(n).
ri = fi / n
La sumatoria de las frecuencias relativas
de todas las clases es igual a 1.

14 Unidad 2 - Estadística - FHyCS


PORCENTAJE
Si a la frecuencia relativa de la clase i se la
multiplica por cien, se obtienen los
porcentajes del número total de
observaciones (n) que pertenecen a cada
clase.
ri * 100 = %
La sumatoria de los porcentajes de todas
las clases es igual a 100.

15 Unidad 2 - Estadística - FHyCS


 Ejemplo 1: con una variable cualitativa (escala
nominal: sexo, archivo Excel: Ejemplo edad.xls
– hoja2)
Frecuencia Frecuencia
Sexo Porcentaje
absoluta (fi) Relativa (ri)

Femenino 13 0,325 32,5 %


Masculino 27 0,675 67,5 %
Total 40 (n) 1 100 %
 Frecuencias relativas suman 1

16 Unidad 2 - Estadística - FHyCS


 Ejemplo 2 con una variable de escala ordinal:
Frecuencia Frecuencia
Día Porcentaje
absoluta Relativa
Domingo 15 0,375 37,5 %
Lunes 2 0,05 5%
Martes 2 0,05 5%
Miércoles 5 0,125 12,5 %
Jueves 1 0,025 2,5 %
Viernes 3 0,075 7,5 %
Sábado 12 0,3 30 %
Total general 40 1 100 %

17 Unidad 2 - Estadística - FHyCS


 Ejemplo 3 con una variable cuantitativa discreta

Frecuencias Frecuencias Acumuladas



Hijos Absolutas Relativas Relativa Absolutas Relativas Porcentaje
fi ri porcentual FI RI %
0 60 0,20 20% 60 0,20 20,0%
1 50 0,17 17% 110 0,37 36,7%
2 80 0,27 27% 190 0,63 63,3%
3 50 0,17 17% 240 0,80 80,0%
4 30 0,10 10% 270 0,90 90,0%
5 15 0,05 5% 285 0,95 95,0%
6
 Puede 8
incluir 0,03
las 3%
frecuencias 293 0,98
acumuladas 97,7%
7 7 0,02 2% 300 1,00 100,0%
Total 300 1 101 %
18 Unidad 2 - Estadística - FHyCS
 Frecuencias relativas acumuladas permiten calcular:
 Frecuencia relativa valores menores que x (en el ejemplo el
63,3% tienen menos de 3 hijos corresponde a 190 obreras)
 Frecuencia relativa valores mayores que x (1-Fi) (en el
ejemplo el 20% tiene más de 3 hijos = 1- 0,80 equivale a una
frecuencia absoluta de 60 obreras)
 Frecuencia relativa entre dos valores (Fi-Fj) ( en nuestro
ejemplo el 15% tiene 4 o 5 hijos: 95% – 80% : 15% que
corresponde a 45 obreras)

19 Unidad 2 - Estadística - FHyCS


Variables continuas: variables cuantitativas (escala de
intervalo), con muchos valores
 No podemos hacer distribución de frecuencias como
antes: demasiados valores distintos
 Ejemplo: variable EDAD en archivo “Ejemplo Viales”
 Cada registro tiene un valor diferente. (enorme)
 ¿Cómo hacer?: Agrupar los datos por intervalos
 Cada clase no es ya un valor sino un intervalo de
valores

20 Unidad 2 - Estadística - FHyCS


21 Unidad 2 - Estadística - FHyCS
 Tabla con intervalos de clase Ejemplo 4
Frecuencias Frecuencias Acumuladas
Edad
Absolutas Relativas Absolutas Relativas Porcentaje
1-11 8 0,20 8 0,20 20,0%
12-22 13 0,33 21 0,53 52,5%
23-33 14 0,35 35 0,88 87,5%
34-44 2 0,05 37 0,93 92,5%
45-55 1 0,03 38 0,95 95,0%
56-66 2 0,05 40 1,00 100,0%
40 1
 Frecuencias relativas y frecuencias acumuladas (absolutas
y relativas): igual que con variables discretas

22 Unidad 2 - Estadística - FHyCS


 Si la variable es cuantitativa, las categorías se forman
dividiendo en INTERVALOS DE CLASE:
 tienen límite inferior y superior,
 son contiguos y mutuamente excluyentes ??.
 El número de clases (K) es optativo, existe una regla
práctica de carácter orientativo:
 Si n < 100 (Fórmula k = 1+ 3,3 log n ) - (F. de Sturges)
 Si n > 100 k = n

23 Unidad 2 - Estadística - FHyCS


K  número de clases ?
K  n  40  6,32  6
log(n) 1
K 1 K 1  x log(n) K 1  3,3 log (n)
log(2) 0.30
 Calculados de las dos
K 1  3,3 x 1,60  6,28  6 maneras los intervalos de
clase del ejemplo edad
deben ser: “6”
24 Unidad 2 - Estadística - FHyCS
 Recorrido de la variable o Rango:

Re  xmax  xmin  62 - 1  61
 Amplitud del intervalo:

Re 61
a   10,1
 Marca de clase: i
n de intervalos 6

Li Ls 11  1
ci    6
2 2
25 Unidad 2 - Estadística - FHyCS
 Marca de clase (ci) al punto medio del intervalo, es
decir, al promedio aritmético entre el límite inferior y
superior: Es el valor que tomamos como representativo.
Marca Frecuencias
Edad de Clase
Li Ls 11  1
ci    6 ci Absolutas Relativas
2 2 1-11 6 8 0,20
12-22 17 13 0,33
L i Ls 12  22 23-33 28 14 0,35
ci    17
2 2 34-44 39 2 0,05
45-55 50 1 0,03
56-66 61 2 0,05
40 1,01
26
Unidad 2 - Estadística - FHyCS
 Se tienen los exámenes de 29 alumnos de Estadística
con los siguientes valores:
4, 5, 7, 5, 2, 6, 4, 5, 3, 6, 4, 7, 3, 5, 4, 4, 6, 5, 3, 8, 2,
7, 5, 3, 6, 5, 8, 7, 6

 Nota: éstos números desordenados son muy difícil de


interpretar
 Paso 1: Ordenar mis datos:
2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6,
6, 6, 7, 7, 7, 7, 8, 8
27 Unidad 2 - Estadística - FHyCS
 Paso 2: se debe confeccionar una “Tabla de
Frecuencias”
Observar los valores !!!
Calificación Nº de pruebas 8

(valor) (x1) (Frecuencia) (f1)

Número de exámenes
7

6
2 2 5
3 4 4

4 5 3

5 7 2

6 5 1

7 4 0
2 3 4 5 6 7 8

8 2 Calificaciones obtenidas

 Paso 3: Elaborar una tabla con frecuencias absolutas,


relativas y acumuladas y con porcentajes

28 Unidad 2 - Estadística - FHyCS


Preguntas ??

29 Unidad 2 - Estadística - FHyCS


MEDIDAS DE POSICIÓN U ORDEN

30 Unidad 2 - Estadística - FHyCS


Frecuencias absoluta y rel.
Porcentajes
Medidas de Distribución
Cuartiles Medidas de Posición u
Percentiles Orden
Media
Mediana Medidas de Tendencia
Moda central
Asimetría Medidas de Forma
Curtosis
Rango - Rango Intercuartílico Medidas de Dispersión
Varianza
Desviación Estándar
Coeficiente variación
Unidad 2 - Estadística - FHyCS
31
Medidas de Posición o de orden

Percentiles P10 P20 P30 P40 P50 P60 P70 P80 P90 P100

Cuartiles C1 =Q1 C2= Me C3= Q3

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Datos ordenados según su valor

32 Unidad 2 - Estadística - FHyCS


 Se tienen los exámenes de 29 alumnos de Estadística
con los siguientes valores:
4, 5, 7, 5, 2, 6, 4, 5, 3, 6, 4, 7, 3, 5, 4, 4, 6, 5, 3, 8, 2, 7, 5, 3, 6, 5,
8, 7, 6

 Nota: éstos números desordenados son muy difícil de


interpretar
 Paso 1: Ordenar mis datos:
2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6,
7, 7, 7, 7, 8, 8
33 Unidad 2 - Estadística - FHyCS
 Paso 2: se debe confeccionar una “Tabla de Frecuencias”
(cuando son muchas categorías es útil agrupar los datos en
“intervalos de clase” - Regla empírica: entre 6 y 15 intervalos)

Calificación Nº de pruebas Observar los valores !!!


8
(valor) (x1) (Frecuencia) ( f1)

Número de exámenes
7
2 2 6

3 4 5

4 5 4

5 7 3

2
6 5 1
7 4 0
2 3 4 5 6 7 8
8 2 Calificaciones obtenidas

 Paso 3: Aplicar las técnicas de tratamiento de datos


cuantitativos
34 Unidad 2 - Estadística - FHyCS
 Los cuartiles dividen en cuatro partes iguales
las observaciones.
 El primer cuartil Q1 es un valor que deja por
debajo de él 25% y por encima 75% de las
observaciones.
 El Q2 es la mediana (50%)
 Q3 deja por debajo 75% y por encima 25% de
las observaciones

35 Unidad 2 - Estadística - FHyCS


CUARTILES

75% 25%
25% 75%

25% 25% 25% 25%


Mínimo Cuartil 1 Mediana Cuartil 3 Máximo
Q1 Cuartil 2 Q3
Q2

36 Unidad 2 - Estadística - FHyCS


n = 29

n 1 ( n  1) x 3
Posición Q1  Posición Q3 
4 4
En nuestro ejemplo:
n  1 29  1 30 (29  1) x3 90
Pos. Q1     7,5 Pos. Q3    22,5
4 4 4 4 4
Posición Q1
nº 7,5

2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6,
7, 7, 7, 8, 8
Posición Q3
nº 22,5
Resultados: Q1 = 4 y Q3 = 6
37 Unidad 2 - Estadística - FHyCS
 Es la distancia entre cuartiles
 RIC = Q3 - Q1
 Es una medida de dispersión de datos
 En el ejemplo anterior:

RIC= 6-4=2
RIC= 2

Mínimo = 2 Q1= 4 Me = 5 Q3= 6 Máximo= 8


Interpretación: el 50% de los datos se encuentran entre 4 y 6

38 Unidad 2 - Estadística - FHyCS


 Un percentil o punto percentil es el valor
sobre la escala de medición, debajo del cual
se encuentra un porcentaje dado de los datos
incluidos en la distribución.
 Son medidas de posición relativas.
 Los percentiles dividen en cien partes iguales
las observaciones.
 El P60 es el valor sobre la escala debajo del
cual está el 60% de los datos de la
distribución.

39 Unidad 2 - Estadística - FHyCS


 Un percentil divide en dos partes las observaciones.
Por ejemplo, el percentil 25, P25, es el valor que deja
por debajo un 25% y por encima un 75% de las
observaciones

25% 75%
Mínimo Percentil 25 Máximo
P25
En nuestro ejemplo, la nota mínima en parciales para regularizar
es 4, el Percentil 25 (P25 = Q1) me divide las evaluaciones en dos
grupos: 25% no aprobados (por debajo de 4) y 75% aprobados

40 Unidad 2 - Estadística - FHyCS


K .n 35.29 K .n
Posición P 35    10,15  10 Posición Pk 
100
100 100
La posición 10 Nº de Nº acumulado
La ocupa la Calificación pruebas de pruebas %
(valor) (x1) (Frecuencia) (Frecuencia) acumulado
Calificación 4, (f1) (F1)
o sea que el 35% 2 2 2 6,9%
3 4 6 20,7%
de los alumnos
4 5 11 37,9%
tienen una 5 7 18 62,1%
6 5 23 79,3%
calificación igual o
7 4 27 93,1%
menor de 4. 8 2 29 100,0%

41 Unidad 2 - Estadística - FHyCS


 Buscamos la clase K .n
, K  1,2,...99
donde se encuentra: 100
 Cálculos:
K.n
- Fj - 1
 Lj es el límite inferior del intervalo PK Lj  100 .aj
donde se encuentra el percentil. fj
 n es la suma de las frecuencias absolutas.

 Fj-1 es la frecuencia acumulada anterior a la clase del percentil.

 fj es la frecuencia absoluta de la clase

 aj es la amplitud de la clase.

42 Unidad 2 - Estadística - FHyCS


 El 60% de los lesionados entre que edades se
encuentran? (Ejemplo – Tabla 4)

 Debo calcular el P60

43 Unidad 2 - Estadística - FHyCS


 Tabla con intervalos de clase Ejemplo Edad:

Frecuencias Frecuencias Acumuladas


Edad Absoluta Porcentaje
s Relativas Absolutas Relativas
1-11 8 0,20 8 0,20 20,0%
12-22 13 0,33 21 0,53 52,5%
23-33 14 0,35 35 0,88 87,5%
34-44 2 0,05 37 0,93 92,5%
 En que intervalo está?
45-55 1 0,03 38 0,95 95,0%
56-66 2 0,05 40 1,00 100,0%
40 1
K .n 60.40
, K  24
100 100 Unidad 2 - Estadística - FHyCS
44
K.n 60.40
- Fj - 1 - 21
P 60  Lj  100 .aj  23  100 .11  26,3  26
fj 14
 Lj es el límite inferior de la clase donde se encuentra el
percentil = 23
 n es la suma de las frecuencias absolutas = 40
 Fj-1 es la frecuencia acumulada anterior a la clase del
percentil = 21
 fj es la frecuencia absoluta de la clase = 14

 aj es la amplitud de la clase = 11
 El 60% de los lesionados están entre 1 y 26 años de edad.
45 Unidad 2 - Estadística - FHyCS
 Las lesiones viales ocurridas entre 1 y 25
años de edad que porcentaje representan?
(Datos Ejemplo Viales)
 La pregunta es opuesta a la anterior. Conozco
la edad y quiero conocer el %
 Debo calcular el Rango Percentil para edad
= 25

46 Unidad 2 - Estadística - FHyCS


fj
Fj - 1  ( ).( x  Lj )
aj
Rango Percentil  .100
n
 Lj es el límite inferior de la clase donde se encuentra el rango
percentil solicitado.
 n es la suma de las frecuencias absolutas.

 Fj-1 es la frecuencia acumulada anterior a la clase del rango.

 fj es la frecuencia absoluta de la clase

 aj es la amplitud de la clase.

 X es el valor de la variable que quiero ubicar


47 Unidad 2 - Estadística - FHyCS
14
21  ( ).( 25  23)
Rango Percentil  11 .100  58,9%  59%
40
 Lj es el límite inferior de la clase donde se encuentra el rango percentil
solicitado = 23
 n es la suma de las frecuencias absolutas = 40
 Fj-1 es la frecuencia acumulada anterior a la clase del percentil = 21
 fj es la frecuencia absoluta de la clase = 14
 aj es la amplitud de la clase = 11
 x = 35
 Las lesiones viales entre 1 y 25 años de edad representan el 59% de
los eventos. Unidad 2 - Estadística - FHyCS
48
49 Unidad 2 - Estadística - FHyCS
Preguntas ??

50 Unidad 2 - Estadística - FHyCS

También podría gustarte