Está en la página 1de 33

Apuntes de Estadística

✓Medidas de Tendencia Central


✓Medidas de Posición

Profesora: Montserrat Soto Fullá


Medidas de Tendencia Central

Las medidas de tendencia central son


aquellas que representan el centro de
la distribución de los datos.

Profesora: Montserrat Soto Fullá


➢ Algunas de las medidas mas utilizadas
son:
✓Media Aritmética
✓Media Ponderada
✓Media Geométrica
✓Mediana
✓Moda

Profesora: Montserrat Soto Fullá


Media Aritmética
La media aritmética también llamada
promedio, o media, se utiliza en datos
cuantitativos.

Esta medida resulta muy efectiva


cuando la distribución de los datos
es simétrica.

Profesora: Montserrat Soto Fullá


Formula para la Media
➢ Datos Sin Tabular o sin agrupar:
n

 xi
x= i =1

➢ Datos Tabulados o agrupados:


k

n x i i
x= i =1
n

Donde k es el numero de intervalos


Profesora: Montserrat Soto Fullá
➢ Datos sin tabular
Los siguientes datos corresponden a las
edades de 7 alumnos de la carrera.

23 25 21 22 26 20 23
n

 xi
23 + 25 + 21 + 22 + 26 + 20 + 23
x= i =1
= = 22.86
n 7

La edad promedio de los alumnos de la carrera es de


22.9 años aproximadamente.

Profesora: Montserrat Soto Fullá


Ejemplos
➢ Datos Tabulados
En la tabla se encuentra el numero de hijos por familia de 10
empleados de una textil.
Numero de % de Numero % de familia
Numero de
Hijos por familias acumulado acumulado
familias
familia de familia
xi ni fi % Ni Fi %
0 2 20 2 20
1 1 10 3 30
2 4 40 7 70
3 3 30 10 100

n x (2 * 0) + (1*1) + (4 * 2) + (3 * 3)
= = 1.8
i i
x= i =1
n 10

El número promedio de hijos es de 1.8 por familia .


Profesora: Montserrat Soto Fullá
➢ Datos Tabulados
La siguiente tabla muestra el tiempo en minutos que los
alumnos se demoran en contestar un prueba.
Marca
Tiempo Frecuencias

Xi
de
(min.) Clases mi n N i f i % Fi %
i
10 – 20 15 5 5 50 50

20 – 30 25 2 7 20 70

30 – 40 35 3 10 30 100

xn i i
(15 * 5) + (25 * 2) + (35 * 3)
x= i =1
= = 23
n 10

El tiempo promedio que demoran los alumnos


en contestar una prueba es de 23 minutos

Profesora: Montserrat Soto Fullá


Media Ponderada
Se denomina media ponderada de un conjunto de
números al resultado de multiplicar cada uno
desde los números por un valor particular para
cada uno de ellos, llamado su peso y obteniendo a
continuación la media aritmética del conjunto
formado por los productos anteriores.

Se utiliza la media ponderada cuando no todos


los elementos componentes de los que se
pretende obtener la media tienen la misma
importancia.

Profesora: Montserrat Soto Fullá


donde x corresponde al dato y w
representa el peso asignado a cada dato

Profesora: Montserrat Soto Fullá


Ejemplo
Cierto alumno desea saber la nota con la cual aprueba
el curso si su promedio fue de 4.5 y en el examen saco
un 5.2. Se sabe que la ponderación asociada es 70%
para las notas del semestre y 30% para el examen.

(4.5 * 70) + (5.2 * 30)


x =
100
= 4.71

El alumno aprueba el curso con un promedio de 4.7.

Profesora: Montserrat Soto Fullá


Mediana
La mediana o valor mediano, es el valor de la variable
que separa el conjunto de los datos en dos partes
iguales ordenados de menor a mayor.

Es la medida de tendencia central mas adecuada


cuando la distribución de los datos es asimétrica.

La mediana representara el 50% del total de datos


de la muestra.

La mediana coincide con el percentil 50, cuartil 2 y


quinto decil (los cuales se verán mas adelante)

Profesora: Montserrat Soto Fullá


➢ Datos sin tabular

Primero deben ordenarse los datos de menor a


mayor, luego aplicar la expresión que aparece a
continuación, dependiendo si el tamaño de la
muestra es par o impar. El resultado será el
lugar donde se encuentra el valor que separa la
distribución.
 X  n+1  ; n impar
  2 

Xn + Xn  ; n par
  2   +1 
2 

 2
Profesora: Montserrat Soto Fullá
➢Datos sin tabular

Los siguientes datos son las edades de 7alumnos


de la carrera.

23 25 21 22 26 20 23
Se orden los datos de menor a mayor

20 21 22 23 23 25 26

1 2 3 4 5 6 7

Buscamos el lugar para datos impares, n=7


X  n +1  X  7+1 
 
 2 
=  
 2 
= X (4 )
Profesora: Montserrat Soto Fullá
➢Datos sin tabular

Los siguientes datos son las edades de 8 alumnos


de la carrera.

23 25 21 22 26 20 27 30

Ordenamos de menor a mayor


20 21 22 23 25 26 27 30
1 2 3 4 5 6 7 8

Xn + Xn X8 + X8


 

 +1   

 +1  X ( 4 ) + X (5 ) 23 + 25
2  2 
= 2  2 
=
= = 24
2 2 2 2

Profesora: Montserrat Soto Fullá


Formula para la Mediana
➢ Datos Tabulados:
n 
 − N j −1 
Md = LIR +  2 * A
 nj 
 
 

LIR : :Limite real inferior del intervalo donde se encontró el 50%


de la distribución
N j −1 :Frecuencia acumulada del intervalo anterior de donde se
encontró el 50% de la distribución
n j :Frecuencia absoluta del intervalo donde se encontró el 50%
de la distribución
n :Total de la muestra
A :Amplitud del intervalo donde se encontró el 50% de la
distribución
Profesora: Montserrat Soto Fullá
Ejemplo

La siguiente tabla muestra el tiempo en minutos que los alumnos se


demoran en contestar un prueba.

En la columna de las Tiempo


Marca Frecuencias
frecuencias relativa Xii ni N i f i % Fi %
de
(min.) Clases m

acumulada, se ubica el 10 – 20 15 3 3 30 30
intervalo donde se 20 – 30 25 5 8 50 80
acumula el 50% de la 30 – 40 35 2 10 20 100
información (en este caso
en el 2º intervalo),
entonces se aplica la
expresión de la siguiente  n   10 
 − N j −1   − 3
manera: Md = LIR +  2  * A  Md = 20 +  2  *10 = 24
 n j   5 
   

El 50% de los alumnos se demora a lo más 24 minutos en


contestar la prueba.
Profesora: Montserrat Soto Fullá
Moda

La moda se utiliza con mayor frecuencia para


los datos cualitativos.

En un conjunto de datos, puede existir una o


más moda, o sea multimodal. También puede
darse el caso que no exista moda.

Profesora: Montserrat Soto Fullá


➢ Datos sin tabular o no agrupados

Es el valor mas frecuente o que más se


repite

Ejemplo

Los siguientes son los pesos de 9 niños entre 8 y 10 años

40.2 38.1 35.8 31.5 45.1 44.8 35.8 31.5 35.8

El peso que más frecuente dentro de la muestra de 9


niños es 35.8 kilos
➢ Datos tabulados

 d1 
Moda= LI R + 
 d + d  * A
 1 2
LIR : :Limite real inferior del intervalo donde se encontró la
mayor frecuencia de observaciones (intervalo modal)
d1 :diferencia entre la frecuencia absoluta del intervalo
premodal y modal
d 2 :diferencia entre las frecuencias absolutas del
intervalo posmodal y modal
A :Amplitud del intervalo donde se encontró el 50% de la
distribución
Ejemplo

La siguiente tabla muestra el tiempo en minutos que los alumnos se demoran


en contestar un prueba.
En la columna de las
frecuencias absolutas, Tiempo
Marca
de
Frecuencias

se ubica el intervalo (min.) Clases mi ni N i f i % Fi %


donde que tiene la 10 – 20 15 3 3 30 30

frecuencia mas alta, 20 – 30 25 5 8 50 80


entonces se aplica la 30 – 40 35 2 10 20 100
expresión de la siguiente
manera:

 d1   5−3   2 
LI R +   * A  20 +   *10 = 20 +   *10 = 24
 d1 + d 2   (5 − 3) + (5 − 2)   2 + 3

Los alumnos demoraron en su mayoría 24 minutos en contestar la


prueba.

Profesora: Montserrat Soto Fullá


Otra forma de registrar la moda para datos agrupados
es señalar la marca de clase del intervalo que registra la
mayor frecuencia absoluta

En el ejemplo: Mo=25 minutos


Propiedades del Promedio
➢ El promedio de una distribución donde todos
los datos son constantes, es la constante.
➢ Si se suma o resta una constante a cada dato
de una distribución, el nuevo promedio es el
promedio antiguo mas o menos la constante.
➢ Si se multiplica una constante a cada dato de
una distribución, el nuevo promedio es el
promedio antiguo por la constante.
Si la distribución de los datos es
simétrica, la media, mediana y moda el
resultado es el mismo.
Medidas de Posición
Las medidas de posición dividen un conjunto de
datos o muestra en grupos con el mismo
numero de elementos o individuos.

Se deben ordenar los datos de menor a mayor.

Algunas medidas de posición son:


percentiles, cuartiles, deciles, quintiles
Todas estas medidas son representados por
porcentajes acumulados

Profesora: Montserrat Soto Fullá


➢ Percentiles (Pj):
Dividen la distribución o conjunto de datos en
100 partes iguales. Se puede hablar de P1 a P100,
representándose como porcentajes.

➢ Cuartiles (Qj):
Dividen la distribución en 4 partes iguales.

Q1=25% Q2=50% Q3=75% Q4=100%


➢ Deciles (Dj):
Divide el conjunto de datos en 10 partes
iguales

➢ Quintiles (qj):
Divide el conjunto de datos en 5 partes iguales
Relación con los porcentajes acumulados

Quintil 1 q1 20%
Decil 1 D1 10%
Quintil 2 q2 40% Decil 2 D2 20%
Quintil 3 q3 60% Decil 3 D3 30%
Decil 4 D4 40%
Quintil 4 q4 80%
Decil 5 D5 50%
Quintil 5 q5 100% Decil 6 D6 60%
Decil 7 D7 70%
Decil 8 D8 80%
Cuartil 1 Q1 25%
Decil 9 D9 90%
Cuartil 2 Q2 50% Decil 10 D10 100%
Cuartil 3 Q3 75%
Cuartil 4 Q4 100%
➢ Notar que

P50=Q2=D5=Mediana
➢ Datos no tabulados
Pj = X j *n
( )
100

Ejemplo
Encuentre el percentil 40 de los siguientes datos
29 30 34 31 33 34 38
Se deben ordenar previamente los datos:
29 30 31 33 34 34 38

X  7*40  = X 2,8 = X 3 = 31
 
 100 
Esto quiere decir que existe un 40% de la distribución
que no supera el valor 31
➢Datos Tabulados

 n* p 
 − N j −1 
Pp % = LIR +  100 * A


nj 

 

LIR : :Limite real inferior del intervalo donde se encontró el p%


acumulado de la distribución
N j −1 :Frecuencia acumulada del intervalo anterior de donde se
encontró el p% acumulado de la distribución
n j :Frecuencia absoluta del intervalo donde se encontró el p%
acumulado de la distribución
n :Total de la muestra
A :Amplitud del intervalo donde se encontró el p% acumulado
de la distribución
Ejemplo

La siguiente tabla muestra el tiempo en minutos que los alumnos se


demoran en contestar un prueba, encuentre el percentil 48.

En la columna de las Tiempo


Marca Frecuencias
frecuencias relativa
de
(min.) Clases m ni
i N i f i % Fi %
acumulada, se ubica el 10 – 20 15 3 3 30 30
intervalo donde se 20 – 30 25 5 8 50 80
acumula el 48% de la 30 – 40 35 2 10 20 100
información (en este caso
en el 2º intervalo),
entonces se aplica la
expresión de la siguiente
manera:  n* p

  10 * 48 
− 3
 N j −1  
Pp % = LIR +  100  * A  Pp % = 20 +  100  *10 = 23.6
 nj   5 
   
El 48% de los alumnos se demora a lo más 23.6 minutos en
contestar la prueba.
Profesora: Montserrat Soto Fullá

También podría gustarte