Está en la página 1de 64

Bienvenidos al curso de

ESTADÍSTICA
ANÁLISIS ESTADÍSTICO
DESCRIPTIVO:

Es el que permite describir el


comportamiento empírico de las
variables, mediante el cálculo de
algunas medidas capaces de
resumir la información que
contienen los datos, la
construcción de cuadros y
gráficos especiales.
Al inicio de cualquier investigación, hay que proceder a la
recopilación de los datos.
Al conjunto de datos dispuestos tal como se presentan, se
lo denomina Datos no Agrupados.

Si la cantidad de ellos es grande, veinte o más, y no


están agrupados, es muy difícil poner en evidencia la
regularidad estadística

Hay que ordenarlos agrupándolos en clases de


equivalencia para que puedan ser estudiados
convenientemente.
Al conjunto de datos organizados, clasificados y
distribuidos se los denomina Datos Agrupados en una
Distribución de Frecuencias.

Las DISTRIBUCIONES DE FRECUENCIAS se presentan en forma


tabular y/o gráfica de modo tal que permitan una organización
adecuada de los datos para proceder al análisis y a la posterior
obtención de medidas capaces de brindar la información requerida.
VARIABLES CUALITATIVAS

Se llama FRECUENCIA ABSOLUTA SIMPLE PARA VARIABLE


CUALITATIVA, f, a la cantidad de unidades experimentales que
pertenecen a una determinada categoría.

Se llama FRECUENCIA RELATIVA SIMPLE, fr , al cociente entre la


frecuencia absoluta simple y la cantidad de observaciones.

Las frecuencias relativas, multiplicadas por 100, expresan el


porcentaje de casos, sobre el total, que hay en cada categoría.
EJEMPLO

Fueron encuestados 800 alumnos de la UNLZ y se les


consultó acerca de su lugar de residencia. De acuerdo
a dicha encuesta se encontró que 230 alumnos
manifestaron que viven en Lomas de Zamora; 193
alumnos viven en Almirante Brown; 105 en Esteban
Echeverría; 87 en La Matanza; 50 residen en Lanús y
el resto de los alumnos encuestados viven en otros
partidos.
Se pide: organizar los resultados en una distribución
de frecuencia y hacer una presentación tabular.

UNIDAD 1- ESTADISTICA DESCRIPTIVA-ESTADISTICA VIRTUAL ECOLZ


230 alumnos viven en Lomas de Zamora;
193 alumnos viven en Almirante Brown;
105 en Esteban Echeverría;
87 en La Matanza;
50 en Lanús y
el resto de los alumnos encuestados viven en otros partidos

La variable en estudio es el lugar de residencia de los alumnos

Residencia
FACULTAD (Localidad) fi
f ri
fr p%
k%
Esteban Echeverría 105 0,13 13%
Almirante Brown 193 0,24 24%
Lomas de Zamora 230 0,29 29%
La Matanza 87 0,11 11%
Lanús 50 0,06 6%
Otras Partidos 135 0,17 17%
TOTAL 800 1,00 100%
VARIABLES CUANTITATIVAS CONTINUAS
Distribución de frecuencias para variables cuantitativas continuas.
Los pasos que se deben seguir sobre los de datos para su presentación son:

•Determinación de los valores máximo xM y mínimo xm.


•Calculo de la amplitud total del recorrido de la variable continua: A = xM - xm
•Presentación de los datos en forma de distribución de frecuencias, para ello hay que
clasificar las observaciones en un número relativamente chico de grupos llamados intervalos
de clase, o clases.
•Determinación del número de clases: h = ent(1+ log n / log 2).
No es aconsejable que h sea más grande porque se pierde la regularidad en la distribución
de frecuencias, tampoco es aconsejable quesea muy pequeño porque se perdería
demasiada información al estar tan resumida. Si no se cuenta como mínimo con 20 valores
observados no debería realizarse el agrupamiento en intervalos de clase.

•Límites de clase. Toda clase tiene un límite inferior Li y otro superior Ls. Se trata de
intervalos semiabiertos a derecha: [Li ; Ls).
•Amplitud de clase. Es la diferencia entre los límites clase: a =Ls - Li
•Punto medio del intervalo de clase o marca de clase: Es la semisuma de los límites de
clase: xi =( Li + Ls)/2.
son medidas capaces de extractar la
esencia de los datos para caracterizar
y describir las variables en estudio.
MEDIDAS QUE RESUMEN
INFORMACIÓN

son medidas capaces de extractar la


esencia de los datos para caracterizar
y describir las variables en estudio.

MEDIDAS DE MEDIDAS DE MEDIDAS MEDIDAS DE


TENDENCIA VARIABILIDAD DE FORMA CONCENTRACIÓN
CENTRAL (POSICION)
ANALISIS DE DATOS AGRUPADOS

Ejemplo para datos continuos

Calculo de las medidas de tendencia central

Intervalo fi Fi MC
[ 150; 155) 2 2 152,5
[ 155; 160) 6 8 157,5
[ 160; 165) 10 18 162,5
[ 165; 170) 15 33 167,5
[ 170; 175) 25 58 172,5
[ 175; 180) 8 66 177,5
[ 180; 185) 5 71 182,5
[ 185; 190) 4 75 187,5
Total 75
ANALISIS DE DATOS AGRUPADOS

Ejemplo para datos continuos

Media aritmética simple:


σ 𝑥𝑖 ∗ 𝑓𝑖 σ 𝑀𝐶 ∗ 𝑓𝑖
𝑥ҧ = =
𝑛 𝑛
Mediana
𝑛
− 𝐹𝑖 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝑀𝑒𝑑 = 𝐿𝑖 + 2 ∗𝑤
𝑓𝑖
Moda
𝑛
− 𝐹𝑖−1
𝑀𝑒𝑑 = 𝐿𝑖 + 2 ∗𝑤
𝑓𝑖
Donde

d1=fi –fi anterior


ANALISIS DE DATOS AGRUPADOS

Media aritmética simple:

Intervalo fi Fi MC suma MC*fi


[ 150; 155) 2 2 152,5 305
[ 155; 160) 6 8 157,5 945
[ 160; 165) 10 18 162,5 1625
[ 165; 170) 15 33 167,5 2512,5
[ 170; 175) 25 58 172,5 4312,5
[ 175; 180) 8 66 177,5 1420
[ 180; 185) 5 71 182,5 912,5
[ 185; 190) 4 75 187,5 750
suma 12782,5

Media 170,4
ANALISIS DE DATOS AGRUPADOS

Mediana:
Intervalo fi Fi MC suma MC*fi
[ 150; 155) 2 2 152,5 305 𝑛
− 𝐹𝑖−1
𝑀𝑒𝑑 = 𝐿𝑖 + 2
[ 155; 160) 6 8 157,5 945
[ 160; 165) 10 18 162,5 1625 ∗𝑤
[ 165; 170) 15 33 167,5 2512,5
𝑓𝑖
[ 170; 175) 25 58 172,5 4312,5
[ 175; 180) 8 66 177,5 1420
37,5 − 33
[ 180; 185) 5 71 182,5 912,5 𝑀𝑒𝑑 = 170 + ∗5
[ 185; 190) 4 75 187,5 750 25
suma 12782,5
75/2
37,5
𝑀𝑒𝑑 = 170,9
acumula
ANALISIS DE DATOS AGRUPADOS

Moda:
Intervalo fi Fi MC suma MC*fi
[ 150; 155) 2 2 152,5 305 𝑑1
[ 155; 160) 6 8 157,5 945 𝑀𝑜𝑑 = 𝐿𝑖 + ∗𝑤
[ 160; 165) 10 18 162,5 1625 𝑑1 + 𝑑2
[ 165; 170) 15 33 167,5 2512,5
[ 170; 175) 25 58 172,5 4312,5
[ 175; 180) 8 66 177,5 1420 (25 − 15)
[ 180; 185) 5 71 182,5 912,5 𝑀𝑜𝑑 = 170 + ∗5
[ 185; 190) 4 75 187,5 750 25 − 15 + (25 − 8)
suma 12782,5
75/2
37,5
𝑀𝑜𝑑 = 171,85
acumula
PROPIEDADES DE LA MEDIA ARITMÉTICA
Sean X e Y variables; a,b,c  R constantes

Si Y = c entonces Y = c

Si Y = X + a entonces Y = X + a

Si Y = bX entonces Y = b X

Si Y = bX + a entonces Y = bX + a
MEDIA GEOMÉTRICA

Para datos sin agrupar:

Xg = n  xi  xi  0

Para datos agrupados:

Xg = n
 xi fi
 xi  0
DESVENTAJAS DE LA MEDIA GEOMÉTRICA:

1. los valores de la variable deben ser NO NULOS y , en algunos


casos necesariamente POSITIVOS.

2. Su cálculo es muy laborioso.


Se la utiliza cuando es necesario promediar variables cuyos
valores forman una serie y se originan como cocientes entre otras
dos variables, como por ejemplo las tasas de crecimiento
periódicas:
yi
xi =  yi  0
yi −1
y1 y2 y3 yn
x1 = ; x2 = ; x3 = ; ... ; xn =  yi  0
y0 y1 y2 yn −1
MEDIA ARITMETICA VERSUS MEDIA GEOMETRICA
PIB a precios constantes
Periodo Variación
de 1993 (en miles)
2003 256.023 8,8%
2004 279.141 9,0% En el largo plazo, pequeñas
2005 304.764 9,2% diferencias se convierten en
2006 330.565 8,5% grandes diferencias.
2007 359.170 8,7%
2008 383.444 6,8% Recordar de Matemática
2009 386.704 0,9% Financiera la Teoría del
2010 422.130 9,2% Interés Compuesto.
2011 459.571 8,9%

Media aritmética 7,8%


Media geométrica 6,6%
MEDIA ARITMETICA VERSUS MEDIA GEOMETRICA
Diferencias entre el PIB per capita usando media aritmetica y
media geometrica
180000

160000

140000
Pais A Pais B
120000

100000

80000

60000

40000

20000

0
7

70
1
4

10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67

73
76
79
82
85
88
91
94
97
100
MEDIA ARMÓNICA
Para datos sin agrupar:

n
Xa =  xi  0
1
x
i

Para datos agrupados:

n
Xa =  xi  0
fi
 xi
Varianza:
Para datos no agrupados: Para datos agrupados:

σ 𝒙𝒊 − 𝒙
ഥ 𝟐 𝟐
𝑽 𝒙 = σ 𝒙𝒊 − 𝒙
ഥ ∗ 𝒇𝒊
𝒏 𝑽 𝒙 =
𝒏
fórmula de trabajo:

σ 𝒙𝒊 𝟐 σ 𝒙𝒊 𝟐 ∗ 𝒇𝒊
𝑽 𝒙 = ഥ𝟐
−𝒙 𝑽 𝒙 = ഥ𝟐
−𝒙
𝒏 𝒏

Mayor es la VARIANZA, mayor es la variabilidad que presenta la


variable, y consecuentemente, menor es la representatividad
de la MEDIA ARITMÉTICA.
PROPIEDADES DE LA VARIANZA
σ 𝑥𝑖 − 𝑥lj 2 ∗ 𝑓𝑖
𝑉(𝑥) = ≥0
La varianza es un número real no negativo: 𝑛

Sean X e Y variables; a,b,c  R constantes

Si 𝑌 = 𝑐 entonces 𝑉(𝑌) = 0

Si 𝑌 = 𝑋 + 𝑎 entonces 𝑉(𝑌) = 𝑉(𝑋)

Si 𝑌 = 𝑏𝑋 entonces 𝑉(𝑌) = 𝑏2𝑉(𝑋)

Si 𝑌 = 𝑏𝑋 + 𝑎 entonces 𝑉(𝑌) = 𝑏2𝑉(𝑋)


MEDIDAS DE CONCENTRACIÓN (POSICION)
• Son aquellas medidas con las cuales se puede
establecer el porcentaje de datos que está
concentrado dentro de un determinado
intervalo .
• Algunos libros los llaman FRACTILES, de forma
general. Se clasifican en:
• CUARTILES (dividir 4 partes)

• QUINTILES (dividir 5 partes)

• DECILES (dividir 10 partes)

• PERCENTILES (dividir 100 partes)


Medidas de Posición o Concentración
Cuartiles (Ck) para datos discretos

• Los cuartiles dividen a un conjunto de datos en cuatro partes iguales:


• El primer cuartil (C1) separa al 25% de los valores más chicos del 75% restante mas
grandes.
• El segundo cuartil (C2) es también la mediana: el 50% de sus valores son menores que
la mediana y 50% son mayores.
• El tercer cuartil (C3) separa al 25% de los valores más altos del 75% de los valores más
bajos. Es lo mismo decir que supera al 75% y es superado al 25%.
• Con datos discretos no agrupados:

𝑛+1 𝑛+1 𝑛+1


𝐂𝑘 = 𝑘 𝐂1 = 1 ∗ 𝐂2 = 2
4 4 4
Medidas de Posición o Concentración
Cuartiles

Ejemplo 1
El gobierno quiere otorgar un subsidio al 25% de la población mas pobre. ¿Cuál es el
ingreso que debería establecer para separar al 25% mas pobre del 75% mas rico?

0----------------$$----------------------------------------------------$$
25% C1 75%
Recibe subsidio No recibe subsidio
Ejemplo 2
Ante el problema del covid-19, el gobierno esta pensando establecer un impuesto a los
sectores mas acomodados, de manera que el 25% mas rico, pague ese impuesto. ¿Cuál es
el limite para tributar? En este caso, necesito conocer el cuartil 3.
No paga el impuesto Paga el impuesto
0--------------------------------------------------$$---------------------$$
75% C3 25%
Medidas de Posición o Concentración
Quintiles (Qk)

• Los quintiles dividen a un conjunto de datos (“distribución”) en cinco partes iguales:


• El primer quintil (Q1) separa al 20% de los valores más chicos del 80% restante mas
grandes.
• El segundo quintil (Q2) separa al 40% de los valores más chicos del 60% restante mas
grandes.
• El tercer quintil (Q3) separa al 60% de los valores más bajos del 40% de los valores más
altos.
• El cuarto quintil (Q4) separa al 80% de los valores más bajos del 20% de los valores más
altos. Es lo mismo decir que supera al 80% y es superado por el 20%.
𝑛+1 𝑛+1 𝑛+1
𝑄𝑘 = 𝑘 𝑄1 = 1 ∗ 𝑄2 = 2
5 5 5
Medidas de Posición o Concentración
Quintiles
Medidas de Posición o Concentración
Quintiles
Medidas de Posición o concentración
Quintiles
Medidas de Posición o Concentración
Quintiles

Transición demográfica en Argentina

1. El hogar promedio tiene 3 miembros.


2. En el quintil 1 (se ubica el 20% mas
pobre) tiene 4,5 miembros y casi dos
menores de 14 años.
3. El quintil 5 (concentra al 20% mas rico)
tiene 2 miembros y menos de 1 menor
de 14 años.
4. En el quintil 1 la cantidad de mayores de
65 es menor con respecto al quintil 5.
Medidas de Posición o Concentración
Deciles

• Los deciles dividen a un conjunto de datos (“distribución”) en diez partes iguales:


• El decil 1 separa al 10% de los valores más chicos del 90% restante mas grandes.
• El decil 3 separa al 30% de los valores más chicos del 70% restante mas grandes.
• …………
• El decil 7 separa al 70% de los valores más chicos del 30% de los valores más altos.
• El decil 9 separa al 90% de los valores más bajos del 10% de los valores más altos. Es lo
mismo decir que supera al 90% de los valores y es superado por el 10%.

𝑛+1 𝑛+1 𝑛+1


𝐃𝑘 = 𝑘 𝐃1 = 1 ∗ 𝐃𝟗 = 𝟗
𝟏𝟎 𝟏𝟎 𝟏𝟎
Medidas de Posición o Concentración
Deciles:
Medidas de Posición o Concentración
Deciles

El problema de la distribución del ingreso: el aumento de las brechas entre ricos y pobres
Medidas de Posición o concentración
El índice de concentración mas famoso: El Coeficiente de Gini

σ𝑁−1
𝑖=1 𝑃𝑖 − 𝑌𝑖
𝐺=
σ𝑁−1
𝑖=2 𝑃𝑖
Medidas de Posición o Concentración
Percentiles

• Los percentiles dividen a un conjunto de datos (“distribución”) en cien partes iguales.


• El percentil 1 separa al 1% de los valores más chicos del 99% restante mas grandes.
• El percentil 37 separa al 37% de los valores más chicos del 63% restante mas grandes.
• …………
• El percentil 78 separa al 78% de los valores más chicos del 22% de los valores más altos.
• El decil 99 separa al 99% de los valores más bajos del 1% de los valores más altos. Es lo
mismo decir que supera al 90% de los valores y es superado por el 10%.

𝑛+1 𝑛+1 𝑛+1


𝐏𝑘 = 𝑘 𝐏1 = 1 ∗ 𝐏𝟗𝟗 = 𝟗𝟗
𝟏𝟎𝟎 𝟏𝟎𝟎 𝟏𝟎𝟎
Medidas de Posición o Concentración
Percentiles
Medidas de Posición o Concentración
Percentiles
Argentina ¿Dónde esta ubicada en la distribución del ingreso mundial?
Percentil del PIB per cápita en dólares a PPP
Muestra: 140 países
45
39
40 37 38 38 39 39 37
39 39
35 36 36 35 35 35 35 36 36 36
34 35 35 34
34 33 34 34 34 33 34 34
35 32 32 33 33 32
29 31
30

25

20

15

10

0
1986

1994
1980
1981
1982
1983
1984
1985

1987
1988
1989
1990
1991
1992
1993

1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
MEDIDAS DE CONCENTRACIÓN
(POSICION)
Son aquellas medidas con las cuales se
puede establecer el porcentaje de datos
que está concentrado dentro de un
determinado intervalo

RANGO u ORDEN PERCENTILAR:


Es la frecuencia relativa porcentual que se acumula desde el mínimo valor del
recorrido, hasta un valor dado de la variable.

PERCENTIL DE ORDEN K:
Es aquel valor de la variable hasta donde se acumula, a lo sumo, el k% de los datos.
Es el valor de la variable no superado por el k% de los datos.
Cinco maneras de expresar el mismo concepto:

PERCENTIL DE ORDEN k es el valor de la variable hasta donde se


acumula el k% de los datos.
PERCENTIL DE ORDEN k es el valor de la variable no superado por
el k% de los datos.
PERCENTIL DE ORDEN k es el valor de la variable superado por el
(100-k) % de los datos.
PERCENTIL DE ORDEN k es el valor máximo del k% de los datos de
menor cuantía.
PERCENTIL DE ORDEN k es el valor mínimo del (100-k)% de los
datos de mayor cuantía.
Estimar FRACTILES CON DATOS CONTINUOS

Cuartiles:
𝑛
𝑘∗ − 𝐹𝑖−1
𝐷𝑘 = 𝐿𝑖 + 4 .𝑤
𝑓𝑖

Deciles:
𝑛
𝑘 ∗ 10 − 𝐹𝑖−1
𝑥𝑘 = 𝐿𝑖 + .𝑤
𝑓𝑖

Percentiles:
𝑛
𝑘∗ − 𝐹𝑖−1
𝑥𝑘 = 𝐿𝑖 + 100 .𝑤
𝑓𝑖
Variables continuas: el percentil de orden k se calcula aplicando la siguiente
fórmula al renglón de la distribución de frecuencias que corresponde al primer
valor de frecuencia acumulada que supera al ORDEN ABSOLUTO DEL PERCENTIL:
n.k
OAP = La clase percentilar
100
es la primera cuyo
n.k valor de F supera el
− Fk −1 OAP

xk = Lik + 100 .a
fk
donde Lik es el límite inferior del intervalo percentilar
Fk −1 es la frecuencia acumulada del intervalo anterior
f k es la frecuencia absoluta simple del intervalo percentilar
a es la amplitud de los intervalos
DEMOGRAFIA
Para realizar un trabajo de investigación acerca de las
condiciones de salud de las mujeres, se entrevistó a 20
mujeres con hijos, registrándose, entre otras características, la
cantidad de hijos que tiene cada una. Los resultados son los
siguientes: 3; 4; 1; 3; 4; 5; 1; 3; 4; 3; Cantidad
3; 3; 4; 2; 2; 1; 5; 2; 3; 2 Cantidad
de
de hijos
La variable en estudio es: cantidad de hijos por mujeres
x
mujer f
1 3
1. ¿Cuál es la cantidad de hijos no 2 4
superada por el 25% de las mujeres 3 7
encuestadas? 4 4
5 2
2. ¿Cuál es la cantidad de hijos superada
20
por el 30% de las mujeres encuestadas?
DEMOGRAFIA ¿Cuál es la cantidad de hijos no superada por el
25% de las mujeres encuestadas?
Cantidad de O.A.P.= kn/100 = 25.20/100=5
hijos f F
x Como el primer valor de la frecuencia acumulada que
supera al O.A.P es 7, entonces F(2)=7>5 el percentil
1 3 3
buscado es 2 hijos
2 4 7
3 7 14 El 25% de las mujeres encuestadas tiene a lo sumo
4 4 18 2 hijos.
5 2 20
20 ¿Cuál es la cantidad de hijos superada por el 30% de
las mujeres encuestadas?
La cantidad superada por el 30% es la cantidad no superada por el 70%: O.A.P.= kn/100 =
70.20/100= 14
Como F(3)=14=14 el percentil buscado es (3+4)/2= 3 hijos
El 30% de las mujeres encuestadas tiene 3 hijos
CASO EMPRESARIAL
Se tomaron las facturas de 50 ventas realizadas en un día determinado.
Los montos correspondientes, en pesos, son
106,1; 116,9; 114,4; 110,4; 128,9; 116,1; 101,2; 103,4; 111,3; 118,3;
108,4; 110,0; 124,1; 112,2; 107,8; 114,8; 106,7; 105,8; 113,9; 117,4;
122,4; 115,2; 119,8; 111,4; 110,8; 102,9; 106,5; 114,6; 113,8; 112,1;
113,2; 109,3; 117,2; 103,6; 111,7; 115,6; 115,3; 110,9; 101,8; 110,2;
113,3; 119,3; 123,9; 121,8; 127,4; 116,4; 101,8; 107,4; 118,1 112,6

Monto de Cantidad de Calcular:


ventas ventas F
x f El monto de venta no superado por el
100 – 105 6 6 25% de los datos.
105 – 110 8 14
110 – 115 18 32 El monto de venta superado por el 30%
115 – 120 12 44 de los datos.
120 – 125 4 48
125 – 130 2 50 El monto de venta máximo del 45% de
50 los datos menores.
CASO EMPRESARIAL
El monto de venta no superado por el 25% de los datos.

k=25
Monto de Cantidad de OAP = n.k/100 = 50.25/100 = 12,5
ventas ventas F
x f $109,06
100 – 105 6 6
105 – 110 8 14 El monto no superado por el 25% de
110 – 115 18 32 los datos es $ 109,06.
115 – 120 12 44
120 – 125 4 48
n.k
125 – 130 2
50
50 − Fk −1
xk = Lik + 100 .a
fk
---------------------P25--------------------------------------------------------
no supera supera el 75% restante
El 25%
CASO EMPRESARIAL
El monto de venta superado por el 30% de los datos.

Monto de Cantidad de
ventas ventas F
x f k=70
OAP = n.k/100 = 50.70/100 = 35
100 – 105 6 6
105 – 110 8 14
110 – 115 18 $116,25
32
115 – 120 12 44 El monto superado por el 30% de
120 – 125 4 48 los datos es $ 116,25.
125 – 130 2 50
50

n.k
--------------------------------------P70-------------- − Fk −1
no supera supera xk = Lik + 100 .a
fk
CASO EMPRESARIAL
El monto de venta máximo del 45% de los datos menores.

Monto de Cantidad de k=45


ventas ventas F OAP = n.k/100 = 50.45/100 = 22,5
x f
100 – 105 6 6 $112,36
105 – 110 8 14
110 – 115 18 32
115 – 120 12 44 El monto máximo del 45% de los
120 – 125 4 48 datos menores es $ 112,36.
125 – 130 2 50
50
n.k
− Fk −1
---------------------P45--------------------------------------------------------
no supera supera xk = Lik + 100 .a
fk
MOMENTOS EMPÍRICOS
Son operadores matemáticos que se obtienen a partir de
los valores observados de la variable.

MOMENTO EMPÍRICO ABSOLUTO de orden k

mk ( x ) =
 i fi
x k

σ 𝑥𝑖1 ∗ 𝑓𝑖
𝑚1 𝑥 =
=x EL MOMENTO ABSOLUTO DE ORDEN 1
𝑛
ES LA MEDIA ARITMETICA
σ 𝑥𝑖2 ∗ 𝑓𝑖
𝑚2 𝑥 =
𝑛
MOMENTO EMPÍRICO CENTRADO de orden k

σ 𝑥𝑖 − 𝑥lj 𝑘
∗ 𝑓𝑖
𝑚𝑐𝑘 𝑥 =
𝑛

σ 𝑥𝑖 − 𝑥lj 2
∗ 𝑓𝑖
𝑚𝑐2 𝑥 =
𝑛 = S 2 ( x) = V ( x)

EL MOMENTO CENTRADO DE ORDEN 2


ES LA VARIANZA
EJEMPLO DE CIERRE DE MEDIDAS DE POSICION
O CONCENTRACION
DISTRIBUCION DEL INGRESO MUNDIAL

¿Qué país está en el percentil 1? ¿Qué país en el percentil 100? ¿Qué país esta en la
mediana, P50?

Población: 192 países para los cuales existen datos (N)


Variable: PIB per cápita en dólares a PPP
Año: 2019

El país mas rico del mundo es Qatar con un ingreso por habitante de US$116.014
mientras que el país mas pobre es Burindi con US$635.
Egipto esta en la mediana del ingreso mundial con US$12.243.
EJEMPLO DE CIERRE DE MEDIDAS DE POSICION
O CONCENTRACION
DISTRIBUCION DEL INGRESO MUNDIAL

LA TRAMPA DEL INGRESO MEDIO

• Se considera que aquellos países que se ubican entre el percentil 1 y 20 (donde el percentil
1 indica al país mas rico del mundo) son los países desarrollados.
• A valor de 2019, el limite que separa al 20% mas rico del 80% mas pobre es de US$34.154
y ese puesto lo ubica Israel.
• Es decir, ordenando a los países “al revés” (del mayor al menor), se puede analizar la
trampa del ingreso medio que utiliza el concepto estadístico de percentiles.
• Desde la posguerra solo 13 países han superado esta “trampa”, entre ellos se encuentran
los países que han realizado el MILAGRO DE ASIA ORIENTAL (Corea de Sur, Malasia,
Singapur, Hong Kong, etc.).
• Argentina esta “presa” desde comienzos del siglo XX.
Medidas de Forma
Son aquellas que permiten estudiar, la forma que
presenta la distribución de frecuencias de los valores
observados, con el fin de visualizar el modelo
matemático que mejor se ajusta para describir el
comportamiento de una variable.
ASIMETRÍA Si la distribución de frecuencias fuera simétrica se cumpliría
que f(x-s ) = f(x+s)  s R

CURTOSIS O APUNTAMIENTO es la relación entre la Amplitud Total y


la Máxima Frecuencia que presenta una distribución de
frecuencias.
SESGO POSITIVO DISTRIBUCIÓN SIMÉTRICA SESGO NEGATIVO

SESGADA A DERECHA SESGADA A IZQUIERDA

Media > mediana >moda Mediana= mediana=moda Moda > mediana > media
Coeficiente de Asimetría de Pearson

𝑥ҧ − 𝑚𝑜𝑑𝑎
𝐴𝑃 =
𝑆

As = 0 Entonces la distribución es simétrica.

As > 0 Entonces la distribución es asimétrica hacia la derecha o


tiene sesgo positivo.

As < 0 Entonces la distribución es asimétrica hacia la izquierda o


tiene sesgo negativo.
Coeficiente de Asimetría de Fisher
𝑚𝑐3 𝑥
𝐴𝑠(𝑥) =
𝑆3 𝑥

σ 𝑥𝑖 − 𝑥lj 3 ∗ 𝑓𝑖
donde 𝑚𝑐3 𝑥 = es el momento centrado de orden 3
𝑛

Si As(X) = 0 Distribución SIMÉTRICA


Si As(X) > 0 ASIMETRÍA POSITIVA (SESGADA A DERECHA)
Si As(X) < 0 ASIMETRÍA NEGATIVA (SESGADA A IZQUIERDA)

As ( x)  0, 05  Distribución Simétrica
As ( x)  0, 05  Distribución Asimétrica
LA DISTRIBUCION DESIGUAL DEL INGRESO

UN ANALISIS MEDIANTE MEDIDAS DE FORMA

Una modelo que permite modelar la


distribución del ingreso es la
distribución log-Normal, tema que
se analizará mas adelante.

Si el ingreso (PIB) es Log-Normal,


entonces el Log del ingreso (Log PIB)
es normal.
LA DISTRIBUCION DESIGUAL DEL INGRESO

La baja del salario mínimo en México empeoro la distribución

IMPACTO DE UNA REDUCCION EN EL


SALARIO MINIMO EN MEXICO

GRAN PARTE DEL AUMENTO DE LA


DESIGUALDAD DE INGRESO SE DEBIO
A LA CAIDA DEL SALARIO MINIMO A
COMIENZOS DE LOS 90S
Coeficiente de Curtosis de Fisher
mc 4 ( x )
K ( x) = -3
S 4
( x)

 (x − x ) fi
4

mc 4 ( x ) =
i
donde es el momento centrado de orden 4
n
El Coeficiente de CURTOSIS de la función Normal estandarizada es cero.

Si K(X) = 0 => Distribución MESOCÚRTICA

Si K(X) > 0 => Distribución LEPTOCÚRTICA

Si K(X) < 0 => Distribución PLATICÚRTICA


K(X) > 0

K(X) = 0

K(X) < 0
CASO EMPRESARIAL
Se tomaron las facturas de 50 ventas realizadas en un día determinado.
Los montos correspondientes, en pesos, son
106,1; 116,9; 114,4; 110,4; 128,9; 116,1; 101,2; 103,4; 111,3; 118,3;
108,4; 110,0; 124,1; 112,2; 107,8; 114,8; 106,7; 105,8; 113,9; 117,4;
122,4; 115,2; 119,8; 111,4; 110,8; 102,9; 106,5; 114,6; 113,8; 112,1;
113,2; 109,3; 117,2; 103,6; 111,7; 115,6; 115,3; 110,9; 101,8; 110,2;
113,3; 119,3; 123,9; 121,8; 127,4; 116,4; 101,8; 107,4; 118,1 112,6

Monto de Cantidad de Calcular e interpretar los coeficientes de


ventas ventas F asimetría y de curtosis.
x f
100 – 105 6 6
105 – 110 8 14
110 – 115 18 32
115 – 120 12 44
120 – 125 4 48
125 – 130 2 50
50
CASO EMPRESARIAL 𝑆(𝑥) = 𝑉(𝑥) = $6,2161

MC f (𝑥 − 𝑥)ҧ (𝑥 − 𝑥)ҧ 3 (𝑥 − 𝑥)ҧ 3 𝑓 (𝑥 − 𝑥)ҧ 4 (𝑥 − 𝑥)ҧ 4 𝑓


102.5 6 -10.6 -1191.016 -7146.096 12624.7696 75748.6176
107.5 8 -5.6 -175.616 -1404.928 983.4496 7867.5968
112.5 18 -0.6 -0.216 -3.888 0.1296 2.3328
117.5 12 4.4 85.184 1022.208 374.8096 4497.7152
122.5 4 9.4 830.584 3322.336 7807.4896 31229.9584
127.5 2 14.4 2985.984 5971.968 42998.1696 85996.3392
total 2534.904 1761.6 64788.8176 205342.56
total/n 50.69808 35.232 1295.776352 4106.8512
𝑚𝑐3(𝑥) 35,232
𝐴𝑠 𝑥 = 3 = = 0,146683 > 0 ASIMETRÍA POSITIVA
𝑆 (𝑥) 240,19 (SESGADA A DERECHA)
𝑚𝑐4(𝑥) 4106,8512
𝐾 𝑥 = 4 −3 = − 3 = −0,24934 < 0 Distribución
𝑆 (𝑥) 1493,041811
PLATICÚRTICA

También podría gustarte