Está en la página 1de 41

Estadísticos

Definición: Valores que resumen el


comportamiento (distribución) de
una variable, o la relación
(asociación) entre dos o mas
variables.
Estadísticos que resumen el
comportamiento de una variable:
Medidas de Posición (Media,
Mediana, Moda), Medidas de
dispersión (Desvío Estandar,
Medidas de Posición – LA
MODA

La moda, es
aquel valor de la
variable que
más se repite.
Medidas de Posición – LA
MODA
• La moda puede ser única, si la
frecuencia mayor es única.
• Puede haber mas de una, en caso de
que la frecuencia mayor se repita.
• Puede no existir, en caso de que no
halla valores repetidos (esto último
en datos acumulados no es
verificable).
Medidas de Posición – LA
MODA
Miremos los siguientes conjuntos
b)2 5 7 9 9 9 11 11 Tiene
moda 9
c)3 8 10 12 15 16 19 No
tiene moda
d)2 4 4 4 4 5 5 7 7 7 7 9 Tiene
2 modas

Los conjuntos que tienen una moda se


LA MODA en datos
acumulados
Distribución de POLIGONO DE
Frecuencias FRECUENCIAS

Categorías (en FA
años)
1 18
2 32
3 12
4 10
5 9
81
En un polígono de frecuencia
•La Categoría que presenta la la moda corresponde al punto
moda se llama Categoría Modal. más alto.
Variables Continuas – LA
MODA
Intervalos Marca Frecuencias
s de Absolutas
clase
(58-62] 60 5 En variables
(62-66] 64 18 continuas
(66-70] 68 42 habitualmente
(70-74] 72 27 hablamos de
(74-78] 76 8 Intervalo Modal.
100

 ni − ni −1  Moda = 66 +  42 − 18 
Moda = li −1 +  ai  ( 42 − 18) + ( 42 − 27 )  4 = 68,46
 ( ni − ni −1 ) + ( ni − ni +1 )   
Medidas de Posición – LA
MEDIA
La Media X̄ (promedio): El valor que hubiera
tomado cada individuos si el total de los puntajes
se hubiera distribuido equitativamente entre
todos los individuos.
Consiste en sumar los valores de los individuos y
dividirlos entre la cantidad de individuos.
x̄ = x₁ + x₂+…………xn → DATOS
SIN AGRUPAR
Los valores observados en cada individuo son
los valoresNque toman los individuos en la
variable x₁ + x₂+…………+xn y el número
de observaciones, ó número de individuos es N.
Propiedades de la Media (1)
• La suma de las distancias a la
media = 0

∑( x − x ) = 0
N
i

i =1

x̄ de 5; 10, 15 = 5-10 = -5
5+10+15 = 10 10-10 = 0
3 15-10 = 5
-5 + 0 + 5 =
0
Propiedades de la Media (2)
• La media de una suma de variables = la
suma de las medias de cada variable.

x (5,10,15) / x̄ = 5; 10; 15 = 10 x̄ + ȳ + z̄ =
y (8,16,24)/ ȳ = 8; 16; 24 = 16 10+16+25=51
z (14,28,33)/z̄ = 14; 28; 33 = 25

Media de (x+y+z) =
(5+8+14)+(10+16+28)+(15+24+33)
3

Media de x+y+z = 27+54+72 = 153 = 51


3 3
Propiedades de la Media (3)
Si un conjunto de observaciones x₁, x₂……
…xn tienen desviaciones respecto de un
número A dadas por:

d1 = x1− A, d 2 = x2 − A,..., d N = xN − A
Entonces tenemos que: la media del conjunto es
igual a
A + el promedio de la sumatoria de las
N
distancias al punto.
∑ di
x =A +i =
1

N
Propiedad 3
N
2 4
11
7 A= 9
∑d i
x =A + i =1
N
Suma de distancias -3
2-9= -7 Siendo:
4-9=-5 -7-5- A=9
2+22 = -12
4 x̄=6 7
A=9 11 Promedio distancias a
7-9=-2 -12
/4=-3
9 = -3
11-9=2
Promedios 0 x̄ = 9- La media desconocida
-3
3 =6 x̄ = 9 – 3= 6
Propiedad 3
• A cualquier punto de la
variable, se le suma el
promedio de las distancias
a ese punto y nos da la
Media de la variable.
N

∑ di
x =A +i =
1
N
•En valores absolutos,
Demostración prácticala distancia
(propiedadentre
3)
dos puntos de una variable = La
distancia entre el promedio de las
distancias a cada uno de los 2 puntos.
Propiedades de la Media (4)
• Dado un conjunto de observaciones con media ,
si a cada uno de esos valores se le realiza la
misma operación matemática por el mismo valor
constante:
(x₁◊k), (x₂◊k),…………………….(xn◊k)
siendo ◊ una operación matemática básica (suma,
resta, multiplicación o división) la media del
nuevo conjunto de valores es igual a: x̄◊k
x̄ de 5; 10, 15 = 10 / operación básica suma y k=7
x₁̄ de 12; 17, 22 = 17
x̄ = 10 + k = 10 +7
Media para Datos
Acumulados
x̄ = (c1*n1)+(c2 * n2)+(c3 * n3)+ .....+(cn-1 *
nn-1)+(cn *nn)
N
Siendo c las Marca de Clase y n las
Frecuencias Absolutas

Para el cálculo de la Media (x̄) utilizamos en


variables continuas, la marca de clase y en las
variables discretas, tomamos el valor de la
variable por la marca de clase (MC). Con esta
indicación, usamos la misma formula tanto
para variables discretas como para variables
continuas.
Media para Datos
Acumulados
x̄ = (c1*n1)+(c2 * n2)+(c3 * n3)+ .....+(cn-1 *
nn-1)+(cn *nn)
N
Siendo c las Marca de Clase y n las
Frecuencias Absolutas

En variables continuas asumimos que los


individuos se distribuyen equitativamente al
interior de cada intervalo, en torno a la marca
de clase. Asumimos que es un buen promedio
al interior del intervalo, lo que es probable
estadísticamente.
Media para Frecuencia
Absoluta
Sueldos MC FA FR FAA FRA
(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,26
(6000
(9000
a 9000]
a 7500 11 0,15 30 0,41
(12000
12000]a 10500 20 0,27 50 0,68
(15000
15000]a 13500 15 0,20 65 0,88
(18000
18000]a 16500 6 0,08 71 0,96
(21000
21000]a 19500 3 0,04 74 0,10
(24000
24000]a 22500 0 0,00 74 0,10
27000] 25500 1 0,01 75 1
75 1,00

Media para Frecuencia Absoluta:


x̄ = (1500*8)+(4500*11)+(7500*11)+………
(25500*1)=hacer en clase
75
Media para Frecuencia
Relativa
Sueldos MC FA FR FAA FRA
(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,26
(6000 a 9000] 7500 11 0,15 30 0,41
(9000 a 12000] 10500 20 0,27 50 0,68
(12000 a 15000] 13500 15 0,20 65 0,88
(15000 a 18000] 16500 6 0,08 71 0,96
(18000 a 21000] 19500 3 0,04 74 0,10
(21000 a 24000] 22500 0 0,00 74 0,10
(24000 a 27000] 25500 1 0,01 75 1
75 1,00

Media para Frecuencia Relativa:


x̄ = (0,11*1500)+(0,15*4500)+(0,15*7500)+………
(0,01+25500)= Hacer en clase
Las FR ya están divididas por el N, por lo tanto es
sumatoria de la MC*FR en cada intervalo.
Resolución
Media para Media para
Frecuencia Absoluta Frecuencia Relativa
x̄=∑(MC*FA)/ x̄=∑(MC*F
Sueldos MC FA N MC FR MC*FR A)
(0 a 3000] 1500 8 1500 0,11 165
(3000 a
6000] 4500 11 4500 0,15 675
(6000 a
7500 11 5500 0,15 825
9000] 1050
(9000 a
0 20 8500 0,27 2295
12000] 1350
(12000 a
0 15 11500 0,2 2300
15000] 1650
(15000 a
0 6 14500 0,08 1160
18000] 1950
(18000 a
0 3 17500 0,04 700
21000] 2250
(21000 a
0 0 20500 0 0
24000] 2550
(24000 a
27000] 0 1 22500 0,01 225

75 9860   1 8345 9860


Medidas de Posición – LA
MEDIANA
Valor que toma la variable para aquel
individuo que ocupa el centro de la
distribución, una vez que los datos están
ordenados de menor a mayor. Valor del
individuo que se encuentra en el centro
de la distribución.
IMPORTANTE: encontrar la mediana implica primero
encontrar la posición del individuo en el centro de la
distribución y luego el valor que toma ese individuo en
la variable.
Medidas de Posición – LA
MEDIANA
1 2 2 3 3 4 5 5 5 6 7 7 8 9 10 11
12Formula
13 para
Mediana = 5,5

Impar:
Par:
x N  + x N
medx = xN +1  med x =
 
 2  2 

 +1 
 
 2  2
Recordemos que la cifra entre paréntesis es la posición del individuo.
X por su parte es el valor que toma la variable para el individuo que esta en esa
posición.
Medidas de Posición – LA
MEDIANA
Datos sin agrupar
Datos sin
impar
agrupar par
3 4 5 6 7 •4 5 6 7
Med = X₃ = 5 8
Med = X₃+X₄
IMPORTANTE: encontrar la mediana implica primero= 5,5encontrar
la posición del individuo en el centro de la distribución y luego el
valor que toma ese individuo en la variable. 2
Mediana para Datos
Acumulados
Frecuencia Absoluta
FAA intervalo
anterior a la
mediana
Med = N/2 – Ni-1 ai +li-1
Limite inferior del
ni Intervalo donde
FA Intervalo
esta la mediana
donde esta
la Mediana
Amplitud del intervalo
Calculo de la Mediana (FA)
FR
Sueldos MC FA FAA FRA
(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,25
(6000 a 9000] 7500 11 0,15 30 0,40
(9000 a 12000] 10500 20 0,27 50 0,67
(12000 a 15000] 13500 15 0,20 65 0,87
(15000 a 18000] 16500 6 0,08 71 0,95
(18000 a 21000] 19500 3 0,04 74 0,99
(21000 a 24000] 22500 0 0,00 74 0,99
(24000 a 27000] 25500 1 0,01 75 1
75 1,00

Med = N/2 – Ni-1 ai Med = 37,5 – 30


+li-1 3000+9000= 10125
ni 20
Calculo de la Mediana (FA)

Med = N/2 – Ni-1 ai


+li-1
ni
Med = 37,5 – 30
3000+9000= 10125
20
Mediana para Datos
pongo F (FR)
Acumulados
Frecuencia Relativa: donde dice N (FA)

FAA intervalo anterior a


la mediana

Med = 1/2-Fi-1 aLimite


i +li-1inferior
FA del Intervalo
Intervalo fi donde esta la
donde esta mediana
la Mediana Amplitud del
intervalo
Calculo de la Mediana (FR)
FR
Sueldos MC FA FAA FRA
(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,25
(6000 a 9000] 7500 11 0,15 30 0,40
(9000 a 12000] 10500 20 0,27 50 0,67
(12000 a 15000] 13500 15 0,20 65 0,87
(15000 a 18000] 16500 6 0,08 71 0,95
(18000 a 21000] 19500 3 0,04 74 0,99
(21000 a 24000] 22500 0 0,00 74 0,99
(24000 a 27000] 25500 1 0,01 75 1
75 1,00

Med = 0,50 – Fi-1 ai +li- Med = 0,50 – 0,40 3000+9000=


1 10111
fi 0,27
Robustez; Media,
Mediana
• Si tomamos un conjunto de datos cualquiera
a los cuales calculamos media, mediana y
moda y agregamos un dato extremo. Al
volver a calcular la media, la mediana y la
moda, veremos que la media puede variar
notablemente, mientras que la mediana y la
moda permanecen similares. Esta no
variación de la mediana y la moda reciben el
nombre de robustez. Las medidas basadas
en el orden –como la mediana- gozan de
ésta, en tanto que las medidas basadas en
la suma –como la media- se ven más
afectadas por las observaciones extremas y
Media, Mediana y Moda
• Si todas las observaciones estuvieran concentradas en un
solo valor de la variable, media, mediana coincidirían en el
mismo. Si las observaciones se fueran distribuyendo en
forma simétrica, a la izquierda y a la derecha de ese valor
central, media, mediana y modo seguirían coincidiendo.
Supongamos ahora que las observaciones de la parte
izquierda se alejan del valor central más que las
observaciones de la parte derecha, generando una
distribución asimétrica hacia la izquierda; en este caso
como la media es la suma de los valores de las
observaciones dividido por la cantidad total de
observaciones, su valor se correrá a la izquierda también y
por el mismo motivo, la media será menor que la mediana.
En una distribución asimétrica a la derecha, la media, es
mayor que la mediana.
Concentración de los
individuos
• Según el tipo de Asimetría que tenga
la variable sabemos en donde se
concentran los individuos que
estamos investigando.
• Si la gráfica es simétrica los
individuos se concentran en el centro
de la variable.
• Si tiene asimetría negativa, los
valores concentran a la izquierda de
la gráfica.
• Si la asimetría es positiva, los valores
Gráficos para cuantitativas
continuas
Asimetría positiva a la Asimetría negativa a la
derecha izquierda
Medidas de Posición –
Cuartiles
De la misma forma que
la Mediana divide la
distribución en 2 partes
al ubicar al individuo
central. Los Cuartiles
dividen la distribución en
4 partes.
Medidas de Posición –
Cuartiles
• 1er cuartil: Valor del individuo que
esta sobre el 25% de la distribución.
• 2º cuartil: coincide con la mediana.
• 3er cuartil: Valor del individuo que
esta sobre el 75% de la distribución.
• 4º Cuartil: Ultimo individuo de la
distribución.
Medidas de Posición –
Cuartiles
1 2 2 3 3 4 5 5 5 7 6 7 8 9 10 11
12 13 Mediana = 6

Formula para 1er. Cuartil sin agrupar


Impar: Par:
x N  + x N
Q1 =x N +1   

 +1 
  Q1 =  4   4 
 4  2

Recordemos que Q1 es la posición del individuo que ocupa el 25% de


la variable. (ubicar primer cuartil en el ejemplo)
Medidas de Posición –
Cuartiles
Formula para 3er. Cuartil sin agrupar

• Impar • Par

x N  + x N
Q3 = x N + 1   3
4 
 3

 4  +1
 3 Q3 =
 4  2
Si el número da con coma se ajusta hacia arriba. Ya que es el
individuo sobre el cual quedan el 75% de las observaciones.
Recordemos que con la formula (N….) ubicamos la posición del
individuo en la distribución.
Cuartiles – Datos Agrupados
Frecuencia Frecuencia
Absoluta Relativa

Primer N 
 − N i −1   0,25 − Fi−1 
Cuartil Q1 =  4 ai + li −1 Q1 =   ai + li − 1


ni 
  fi 
 

N 
 3 − N i −1 
Tercer Q3 =  4  ai + li −1  0,75 − Fi−1 


ni 

Q3 =   ai + li − 1
Cuartil    fi 
Medidas de Posición –
Quintiles, Déciles,
Percentiles.

• Quintiles: Divide la frecuencia en


5 partes iguales.
• Déciles: Divide la frecuencia en
10 partes.
• Percentiles: Divide la frecuencia
en 100 partes iguales.
Formula General
Frecuencia Absoluta
Proporción del
FAA intervalo
Individuo buscado anterior al
individuo
Amplitud del
intervalo
I FA
= p(N) – Ni-1 ai +l i-1
Intervalo Limite inferior del
donde ni Intervalo donde
esta el esta el individuo
individuo
Frecuencia Relativa:
I = p(1)-Fi-1 ai
+li-1
fi
En un N de 1240 buscar la
ubicación de los siguientes
individuos.
• Decil₃

• Cuartil₁

• Quintil₄

• Percentil34
En un N de 1240 Buscar

• Decil₃ …………………. 3/10(1240)=

• Cuartil₁…………………1/4(1240)=

• Quintil₄…………………4/5(1240)=

• Percentil34……………………...35/100
(1240)=
Estadísticos: Medidas de
Estadístic
Posición
o
Proporció Variable según su nivel de medición
n nominales ordinales Razón
Porcentaje nominales ordinales Razón
Ratio nominales ordinales Razón
Moda nominales
nominales ordinales Intervales Razón
Mediana ₁ ordinales Intervales Razón
Media₂     Intervales Razón

₁Mediana:-En las variables nominales suele ser poco


útil ya que su valor cambia con el orden que se le
de a las categorías.