Está en la página 1de 49

MEDIDAS DE

TENDENCIA
CENTRAL
DATOS NO AGRUPADOS
MEDIA

Representa mediante un solo valor global y


generalizado, la tendencia central para un
conjunto de datos, a partir de la operación de
todos y cada uno de los elementos que lo
componen. Se le define también como Promedio.

 
=
MEDIANA
 Representael dato centrado para un conjunto
ordenado de forma ascendente o descendente,
donde a cada extremo quedan distribuidos la
misma cantidad de datos.

Para n par: se toman los dos datos ubicados


exactamente en el centro y se les aplica la media.

Para n impar: la mediana corresponde


exactamente al dato ubicado en la mitad del
conjunto ordenado.
MODA

Representa el valor de mayor frecuencia absoluta


dentro del conjunto de datos. Puede existir mas de
un valor modal en cualquier tipo de muestra. En el
caso de datos no agrupados se obtiene por simple
observación. Se denota como Mo.
EJEMPLOS

17 19 15 20 21 20 15
13 14 24 25 17 22 14

1,88 1,99 2,05 2,01 2,05 2,07 1,92

1,93 1,94 2,04 2,05 1,97 2,11

Rock Reggae Dance Pop Rock Jazz Pop


Blues Dance Rock Folk Reggae Blues Rock
Tecno Rock Jazz Dance Pop Folk Blues
MEDIDAS DE
TENDENCIA
CENTRAL
DATOS AGRUPADOS
MEDIA

  Para datos agrupados por clases


=
 Para datos agrupados por intervalos
=
MEDIANA

 
MEDIANA
  Para datos agrupados por intervalos

 : limite inferior en el cual se encuentra el valor


n/2.
: valor de frecuencia absoluta acumulada anterior
a donde se encuentra n/2.
: frecuencia absoluta del intervalo para n/2.
: valor de la amplitud
MODA

 
MODA
  Para datos agrupados por intervalos

 :
limite inferior en el cual se encuentra el ni
modal.

: valor de la amplitud
APLICACION

Los siguientes datos corresponden al tiempo de


reacción en minutos de un conjunto de partículas, al
ser expuestas a un determinado gas. Se requiere
calcular las medidas de centramiento del tiempo de
reacción.

0,7 0,5 0,8 0,5 0,7


0,5 0,7 0,4 0,7 0,4
0,8 0,7 0,5 0,7 0,4
0,7 0,4 0,6 0,5 0,7
0,8 0,5 0,4 0,7 0,8
0,5 0,6 0,8 0,4 0,7
APLICACION

Un fabricante de calzado va a realizar una exportación


que comprende el embarque de 40 cajas. La
exportadora le presenta una tabla clasificatoria con 10
tarifas de costos de transporte, que están regidas por
el peso de las cargas. El fabricante observa una tarifa
que se ajusta a su rentabilidad pero esta debe cumplir
que todas las medidas de centramiento sean menores a
74kg. Podrá el fabricante realizar la exportación con
la tarifa correspondiente?
DATOS

Los pesos de las cajas son los siguientes:

64 81 70 73 80
67 66 71 83 68
81 65 62 70 85
65 77 75 77 62
71 63 81 68 82
78 64 65 69 65
70 74 67 83 64
78 68 82 80 68
FRECUENCIAS

Intervalos ni Ni
Li - Ls
62 65 10 10
66 69 8 18
70 73 6 24
74 77 4 28
78 81 7 35
82 85 5 40
APLICACION

Los siguientes datos corresponden al comportamiento


de valorización diario de una determinada inversión
durante un mes. Se requiere analizar sus medidas de
centramiento para una futura proyección.
23,15 25,04 26,87 24,14 25,72
25,52 23,67 24,01 26,45 27,08
24,31 23,59 25,17 26,73 25,38
25,32 27,1 26,49 25,66 25,41
23,85 24,79 25,94 26,05 24,32
24,89 26,18 27,13 25 26,47
25,01
MEDIDAS DE
VARIACION O
DISPERSION

DATOS NO AGRUPADOS
VARIANZA

Se define matemáticamente como el promedio de


las diferencias al cuadrado con respecto a la media
de un conjunto de datos. Siempre será un valor
positivo, o igual a cero en caso de que los datos
sean iguales. La varianza es un valor
adimensional, es decir corresponde a un valor
netamente numérico que no puede ser expresado
en unidades de medición. Sirve como base de
cálculo para la Desviación Estándar.
 
=
DESVIACION
ESTANDAR

Representa la distancia promedio que poseen los


datos con respecto a su centramiento,
específicamente se hace referencia a la media. La
Desviación Estándar arroja un valor que es
medido en las unidades propias del conjunto de
datos, este valor se sitúa de igual manera a ambos
lados de la media.

 
=
COEFICIENTE DE
VARIACION

Representa la variación general de los datos entre


sí, expresada de manera porcentual. Se considera
como criterio de análisis que Coeficientes de
Variación a partir de 20% equivalen a una
variación considerable y a muestras heterogéneas.

 
Cv=
EJEMPLOS

17 19 15 20 21 20 15
13 14 24 25 17 22 14

1,88 1,99 2,05 2,01 2,05 2,07 1,92

1,93 1,94 2,04 2,05 1,97 2,11


MEDIDAS DE
VARIACION O
DISPERSION
DATOS AGRUPADOS
VARIANZA

 
=
DESVIACION
ESTANDAR

 
=
COEFICIENTE DE
VARIACION

 
Cv=
APLICACION

Los siguientes datos corresponden a la cantidad de


características defectuosas detectadas en un
control de calidad aplicado a una muestra de
productos, los cuales se seleccionaron 3
semanalmente durante el mes de junio de 2018.
Luego se siguió realizando el mismo control
durante los cuatro primeros meses de 2019. Se
desea establecer si existe alguna diferencia en el
porcentaje de variabilidad, entre los dos conjuntos
de datos obtenidos.
DATOS
2018 2019
JUN ENE FEB MAR ABR
3 3 1 1 0
1 4 4 5 2
6 6 5 3 1
4 1 5 0 2
3 2 1 6 0
4 4 1 5 6
6 4 1 1 2
5 6 5 2 4
2 0 2 2 2
4 5 6 0 5
0 4 4 5 0
1 1 3 5 0
FRECUENCIAS

Clases ni Ni
0 7 7
1 9 16
2 8 24
3 3 27
4 7 34
5 9 43
6 5 48
MEDIDAS DE
UBICACION O
POSICION

DATOS NO AGRUPADOS
CUARTILES
Son tres valores de la variable, que dividen el
conjunto de datos en cuatro partes iguales. Se
definen como Q1, Q2 y Q3, y cada uno representa
una posición equivalente al 25%, 50% y 75% de
los datos respectivamente.

 Para n par Q = (k.n)/4


 Para n impar Q = (k(n+1))/4

Donde k es el número del cuartil a calcular, es


decir tendrá valores de 1, 2 ó 3.
EJEMPLOS
• Calcular los cuartiles para el siguiente conjunto
de datos: 7; 4; 11; 6; 9; 14; 5; 10; 7; 6; 17; 12;
8; 4; 15; 13; 17; 8.

• Calcular los cuartiles para el conjunto anterior


agregándole un dato igual a 16.
DECILES
Son 9 valores de la variable, que dividen el
conjunto de datos en diez partes iguales. Se
definen como D1, D2, D3, D4………..D9, y cada
uno representa una posición equivalente al 10%,
20%, 30%, 40% …….90% de los datos
respectivamente.

 Para n par D = (k.n)/10


 Para n impar D = (k(n+1))/10

Donde k es el número del decil a calcular, es decir


tendrá valores de 1, 2, 3…..9
EJEMPLOS
• Calcular D5 y D9, para el siguiente conjunto de
datos: 7; 4; 11; 6; 9; 14; 5; 10; 7; 6; 17; 12; 8;
4; 15; 13; 17; 8.

• Calcular el D5 para el conjunto anterior


agregándole un dato igual a 16.
PERCENTILES
Son 99 valores puntuales de la variable, que
dividen el conjunto de datos en 100 partes iguales.
Se definen como P1, P2, P3, P4………..P99, y
cada uno representa una posición equivalente al
1%, 2%, 3%, 4% ….….99% de los datos
respectivamente.

 Para n par P = (k.n)/100


 Para n impar P = (k(n+1))/100

Donde k es el número del percentil a calcular, es


decir tendrá valores de 1, 2, 3.…99
EJEMPLOS
• Calcular P43 y P85, para el siguiente conjunto
de datos: 7; 4; 11; 6; 9; 14; 5; 10; 7; 6; 17; 12;
8; 4; 15; 13; 17; 8.

• Calcular el P50 para el conjunto anterior


agregándole un dato igual a 16.
MEDIDAS DE
UBICACION
O POSICION
DATOS AGRUPADOS
CUARTILES
 

Q=
 
: limite inferior en el cual se encuentra el valor .
: valor de frecuencia absoluta acumulada anterior
a donde se encuentra .
: frecuencia absoluta del intervalo para .
: valor de la amplitud
DECILES
 

D=
 
: limite inferior en el cual se encuentra el valor .
: valor de frecuencia absoluta acumulada anterior
a donde se encuentra .
: frecuencia absoluta del intervalo para .
: valor de la amplitud
PERCENTILES
 

P=
 
: limite inferior en el cual se encuentra el valor .
: valor de frecuencia absoluta acumulada anterior
a donde se encuentra .
: frecuencia absoluta del intervalo para .
: valor de la amplitud
DIAGRAMA DE
CAJA
Es un tipo de gráfico que permite interpretar los
datos para variables cuantitativas, a partir de la
observación de los cuartiles, la mediana y los
valores atípicos.
Una gráfica de este tipo consiste en una caja
rectangular, donde los lados muestran un recorrido
intercuartílico y de allí se desprenden unos brazos
o bigotes que poseen un límite de prolongación, el
cual determina que todo dato que no se encuentre
dentro de este rango es marcado e identificado
individualmente como atípico.
CONSTRUCCION
1. Se traza una línea recta a escala, que inicia con el
valor menor y finaliza en el máximo valor.

2. Se identifican en la recta los valores de los tres


cuartiles.
3. Se conforma una caja rectangular entre los
cuartiles, y se traza una línea vertical que parte esta
área justo en el cuartil 2.
4. Se calcula el rango intercuartílico (RIQ) y los
límites de los brazos (LIQ – LSQ)
RIQ = Q3 – Q1
LSQ = Q3 + 1,5(RIQ) LIQ = Q1 – 1,5(RIQ)
APLICACION

En un estudio relacionado sobre el virus del Zika


en comunidades indígenas, se toma como variable
de estudio la edad de los afectados a fin de
determinar la edad promedio de estos en la
comunidad. Para ello se tienen los datos
registrados de 40 personas que contrajeron el
virus. Se requiere analizar la muestra antes de
concluir la edad promedio, observando si existen
datos que puedan considerarse atípicos.
DATOS

50 49 59 56 62
44 67 48 58 60
10 8 48 6 59
63 62 38 59 8
58 39 64 60 55
7 9 52 53 64
58 37 48 40 60
61 44 42 8 54
FRECUENCIAS

Li Ls ni Ni
6 15 7 7
16 25 0 7
26 35 0 7
36 45 7 14
46 55 9 23
56 65 16 39
66 75 1 40
APLICACION
Se realiza un estudio sobre los niveles de
histamina en individuos con alergias, causadas por
contaminación de partículas aéreas. (mg/ml)

13,42 9,77 12,63 7,48 14,80 12,49


8,23 14,81 13,50 10,83 10,92 7,52
11,14 12,54 10,15 9,71 10,43 10,35
10,37 7,92 8,47 13,26 12,65 9,21
10,95 11,39 13,68 9,33 11,34
9,52 10,30 12,75 11,80 8,17
APLICACION

Se requiere observar en que nivel se encuentran:

a. El 35% de los individuos.

b. El 50% de los individuos.

c. El 90% de los individuos.

d. El 75% de los individuos.

e. El diagrama de caja correspondiente.


FRECUENCIAS

Li Ls ni Ni
7,48 8,67 6 6
8,68 9,87 5 11
9,88 11,07 8 19
11,08 12,27 4 23
12,28 13,47 7 30
13,48 14,67 2 32
14,68 15,87 2 34

También podría gustarte