Está en la página 1de 41

Estadística Social Básica

Módulo IV.

Dr. Tabaré Fernández


Octubre, 2017

1
Estadística Social Básica - 2017 Dr. Tabaré Fernández
Módulo IV: temas

A. Tablas de frecuencias para variables métricas. Datos agrupados.


B. Medidas de posición
C. Medidas de dispersion
D. Gráficas
E. Forma de la distribución: medidas de sesgo y apuntamiento. distribución
normal
F. Relación bivariada entre variables métricas: la correlación. Matriz de
correlaciones. El caso particular de una correlación entre una variable
métrica y una dicotómica.

Dr. Tabaré Fernández - Estadística Social Básica 2


Módulo IV.

TEMA B.
MEDIDAS DE POSICIÓN
Estadística Social Básica - 2017 Dr. Tabaré Fernández 3
Posición (o tendencia)

 Estos estadísticos resumen la distribución resaltando un


valor central, auquel que predomina, lo más reiterado en la
observación, lo típico.

 A pesar de parecer una cuestión trivial, la idea de describir


una distribución a partir de resumir la tendencia en lo
observado implicó un cambio muy fuerte en el plano de las
ideas ocurrido entre el siglo XVIII y el siglo XIX

Estadística Social Básica - 2017 Dr. Tabaré Fernández 4


Medidas de posición

 Posición central:
 Media
 Aritmética
 Geométrica
 Armónica
 Mediana
 Moda
 Posicion no central
 Cuartiles, quintiles, deciles, percentiles y otros cuantiles.
Estadística Social Básica - 2017 Dr. Tabaré Fernández 5
TEMA B: Medidas de posición

1. LA MEDIA O PROMEDIO

Estadística Social Básica - 2017 Dr. Tabaré Fernández 6


Noción general y tipos

 Es un estadístico construido para identificar cuál es el valor


que representaría el centro de gravedad de la distribución,
considerando todos los valores de la variable y las
frecuencias con que se han observado estos valores

 Tipos de media:
 Aritmética
 Geométrica
 Armónica

Estadística Social Básica - 2017 Dr. Tabaré Fernández 7


Media aritmética simple: simple o
ponderada


Simple: ̅=

∑ ∗
Ponderada : ̅=

Estadística Social Básica - 2017 Dr. Tabaré Fernández 8


Media aritmética: consideraciones
epistémicas
 La media aritmética, así como cualquier otro estadístico, por
definición, NO ES UN DATO

 ni tiene el valor de ser un dato (registro) en el sentido que aquí se le ha


dado a esta noción
 Esto más allá de que pueda su valor coincidir con uno de los valores
registrados en una matriz de datos
 Es una función de los datos

Estadística Social Básica - 2017 Dr. Tabaré Fernández 9


Media aritmética: una consecuencia de su
definición matemática
 La media aritmética tiene como “defecto” estar influenciada
por valores extremos (muy pequeños y muy grandes)
 Esto puede aumentar la media aunque “no sea representativa”

 Ejemplo: ingreso percapita de los hogares ENDIS


 Promedio simple: 9335 $
 Si quitamos las 115 hogares que declararon ingresos por sobre 200mil pesos, el
promedio baja a 8123 $

Estadística Social Básica - 2017 Dr. Tabaré Fernández 10


i= X en el grupo 1 i= X en el grupo 2
i=1 1 i=1 1
i=2 3 i=2 2
Dos grupos con el

i=3 i=3
mismo promedio

3 3
i=4 5 i=4 3
i=5 5 i=5 3
i=6 7 i=6 8
i=7 7 i=7 9
i=8 8 i=8 9
simple

i=9 9 i=9 9
i=10 9 i=10 10
i=11 11 i=11 11

Estadística Social Básica - 2017 Dr. Tabaré Fernández 11


Gráfico comparando los 2 grupos

12

10

0
1 2 3 4 5 6 7 8 9 10 11

grupo 1 grupo 2

Estadística Social Básica - 2017 Dr. Tabaré Fernández 12


Media geométrica (G)

 es la es la raíz n-énsima del producto de


todos los números
 Es menos sensibles a valores extremos =
 No existe cuando uno de los valores de x
=0
 Solo es relevante la media geométrica si
todos los números son positivos. Si hubiera
un número negativo (o una cantidad impar
de ellos) entonces la media geométrica
sería o bien negativa, o bien inexistente en =
los números reales.
Estadística Social Básica - 2017 Dr. Tabaré Fernández 13
Media armónica (H)

 Es igual al recíproco, o inverso, de la


media aritmética de los recíprocos de
dichos valores
 La media armónica resulta poco
influida por la existencia de =
determinados valores mucho más ∑
grandes que el conjunto de los otros
 Es sensible a valores pequeños más
chicos que el conjunto
 La media armónica no está definida en
el caso de que exista algún valor nulo.
Estadística Social Básica - 2017 Dr. Tabaré Fernández 14
Comparación entre medias

< <

Estadística Social Básica - 2017 Dr. Tabaré Fernández 15


Comparación de las medias

grupo 1 grupo 2

media aritmética 6.2 6.2

media geométrica 5.2 4.8

media armónica 3.9 3.5

Estadística Social Básica - 2017 Dr. Tabaré Fernández 16


Comparación entre las medias del ingreso
per cápita ENDIS

. ameans ingpc3 [fw=ponderador]

Variable Type Obs Mean

ingpc3 Arithmetic 167613 9335.881


Geometric 167528 7170.442
Harmonic 167528 5548.191

Estadística Social Básica - 2017 Dr. Tabaré Fernández 17


Tarea:

 Estudiar propiedades de la media aritmética y computo de la


media para datos agrupados en el Libro, capítulo V.

Estadística Social Básica - 2017 Dr. Tabaré Fernández 18


TEMA B: Medidas de posición.

2. MEDIANA

Estadística Social Básica - 2017 Dr. Tabaré Fernández 19


Noción general

 La mediana es un estadístico que nos informa sobre el valor de la


variable ubicado en el medio de una distribución.

 Mientras la media se refiere al concepto de centro de gravedad


de la distribución, la mediana se basa en la idea de valor
central.

 La mediana es un estadístico de posición central pero que es


sensible a la concentración de valores más pequeños en la
distribución.
Estadística Social Básica - 2017 Dr. Tabaré Fernández 20
Previo

Para calcular la mediana será imprescindible, que


previamente, sean ordenadas las observaciones según
los valores de la variable X de interés .

En la matriz de datos, la columna X tendrá en el primer


renglón (i=1) el valor más pequeño observado y en el
último renglón (i=N) el valor más alto observado

Estadística Social Básica - 2017 Dr. Tabaré Fernández 21


Ubicación del “valor del medio”

La noción “valor del medio de la distribución” se hace


operativa de dos formas distintas, según N sea impar o
par.
Si N es impar:
 El valor del medio es aquel observado en el renglón donde =

 Si N es par:
 El valor medio es aquel calculado según: =

Estadística Social Básica - 2017 Dr. Tabaré Fernández 22


i= X en el grupo 1 i= X en el grupo 2
N impar i=1 1 i=1 1
i=2 3 i=2 2

 N=11 en ambos grupos i=3 3 i=3 3


i=4 5 i=4 3
i=5 5 i=5 3
 = =6 i=6 7 i=6 8
i=7 7 i=7 9
i=8 8 i=8 9
 Valor del medio: i=9 9 i=9 9
 Grupo 1: 7
i=10 9 i=10 10
i=11 11 i=11 11
 Mediana del grupo 2: 8

Media 6.182 6.182


Mediana 7 8
Estadística Social Básica - 2017 Dr. Tabaré Fernández 23
i= X en el grupo 1 i= X en el grupo 2
N ahora PAR i=1 1 i=1 1
i=2 3 i=2 2

 N=10 en ambos grupos i=3 3 i=3 3


i=4 5 i=4 3
 = i=5 5 i=5 3

 Grupo 1: i=6 7 i=6 8

 =5
i=7 7 i=7 9

i=8 8 i=8 9
 ⁄
i=9 9 i=9 9
 Mediana= (5+7)/2=6 i=10 9 i=10 10
 Grupo 2:
 ⁄ =3
 7 Media 5.7 5.7

Mediana 6 5.5
 Mediana= (3+8)/2=5.5
Estadística Social Básica - 2017 Dr. Tabaré Fernández 24
Mediana del ingreso ENDIS

 El commando más
apropiado es
 tabstat

 tabstat ingpc3 [fw=pondera], format


(%9.1f) s(mean median)

 Recordemos incluir el ponderador y


entre las opciones

Estadística Social Básica - 2017 Dr. Tabaré Fernández 25


Media y mediana en ENDIS 2013

. tabstat ingpc3 [fw=pondera], format (%9.1f) s(mean median)

variable mean p50

ingpc3 9335.9 7132.0

Estadística Social Básica - 2017 Dr. Tabaré Fernández 26


3. LA MODA O MODO DE LA
DISTRIBUCIÓN
Estadística Social Básica - 2017 Dr. Tabaré Fernández 27
Noción

 La moda es un estadístico muy simple:


 Reporta el valor observado en la distribución que se repite más

 Una distribución puede tener estrictamente varios modos


 “empate”: dos o más valores tuvieron la misma cantidad de casos

 Si una distribución tiene:


 Una moda: se denomina “unimodal”
 Si tiene 2 modos: se denomina bimodal
 Si tiene 3 modos: se denomina trimodal o multimodal

Estadística Social Básica - 2017 Dr. Tabaré Fernández 28


Utilidad

 Es muy relativa utilidad como resumen, . tab njobmix if njobmix>-98


dependiendo de la distribución observada
NUMERO DE
EMPLEOS
 Puede resultar util si la distribución tiene HABIDOS Freq. Percent Cum.
pocos valores y uno de ellos tiene 1 396 16.77 16.77
particularmente muchos casos 2 688 29.14 45.91
3 669 28.34 74.25
4 430 18.21 92.46
 Aun cuando la distribución puede tener otro 5 126 5.34 97.80
valor con un numero de casos alto y bastante 6 41 1.74 99.53
similar 7 5 0.21 99.75
8 2 0.08 99.83
9 1 0.04 99.87
10 1 0.04 99.92
 Ejemplo: PISAL 2003-2012 12 2 0.08 100.00
 Número total de empleos habidos hasta los 25
Total 2,361 100.00
años

Estadística Social Básica - 2017 Dr. Tabaré Fernández 29


. tab age_ent

age_entrev Freq. Percent Cum.

13 1 0.03 0.03
15 6 0.20 0.23

Utilidad (2) 16
17
18
19
21
48
83
109
0.70
1.59
2.76
3.62
0.93
2.52
5.28
8.90
20 121 4.02 12.92
21 118 3.92 16.84
22 134 4.45 21.29
23 119 3.95 25.24
24 134 4.45 29.69
25 101 3.35 33.05

 Es de poca utilidad si 26
27
28
29
129
150
139
145
4.28
4.98
4.62
4.82
37.33
42.31
46.93
51.74

 la distribución tiene varios valores 30


31
143
137
4.75
4.55
56.49
61.04
32 165 5.48 66.52
“aglutinadores”(v.g. con pocos 33
34
140
123
4.65
4.09
71.17
75.26
35 121 4.02 79.28
casos) 36
37
125
97
4.15
3.22
83.43
86.65
38 81 2.69 89.34
 O hay otro valor “aglutinador” con 39
40
75
80
2.49
2.66
91.83
94.49

casi los mismos casos 41


42
43
43
33
29
1.43
1.10
0.96
95.91
97.01
97.97
44 10 0.33 98.31
 o la cantidad de valores es muy alta. 45
46
3
6
0.10
0.20
98.41
98.61
47 4 0.13 98.74
48 4 0.13 98.87
50 3 0.10 98.97
51 4 0.13 99.10
52 4 0.13 99.24

 ENDIS, 2013:
53 1 0.03 99.27
54 2 0.07 99.34
55 1 0.03 99.37
56 1 0.03 99.40
 “edad del entrevistado respect al 57
58
2
2
0.07
0.07
99.47
99.54

cuidado del niño” 59


60
1
3
0.03
0.10
99.57
99.67
61 2 0.07 99.73
66 1 0.03 99.77
67 1 0.03 99.80
68 2 0.07 99.87
69 1 0.03 99.90

Estadística Social Básica - 2017 Dr. Tabaré Fernández


71
77
1
1
0.03
0.03
99.93
99.97 30
78 1 0.03 100.00

Total 3,011 100.00


Medidas de posición (III)

4. CUANTILES

Estadística Social Básica - 2017 Dr. Tabaré Fernández 31


Noción general

 Contamos con varias medidas o estadísticos que informan sobre


posición o tendencia, pero que no son “centrales”

 Los llamamos genéricamente cuantiles:


 Cuartiles
 Quintiles
 Deciles
 Percentiles

 Usaremos la letra “p” para nombrar genéricamente a un cuantil cualquiera.


Estadística Social Básica - 2017 Dr. Tabaré Fernández 32
Tipos

 Los cuantiles suelen usarse por grupos que dividen la distribución


en partes iguales, entendidas estas como intervalos de valores de
variables que comprenden la misma proporción de valores. Los
más usados:

 los cuartiles dividen la distribución en 4 partes.


 los quintles dividen la distribución en 5 partes.
 los deciles en 10 partes.
 los percentiles en 100 partes.

Estadística Social Básica - 2017 Dr. Tabaré Fernández 33


Precausión

 Toda identificación de cuantiles implica que se han ordenado


los casos, colocando en el primer renglón la unidad que tiene
el menor valor observado de x y en el último renglón el mayor
valor observado de x.

Estadística Social Básica - 2017 Dr. Tabaré Fernández 34


Definición general

 El cuantil de orden (p) de una distribución


 es el valor de la variable (x)
 que marca un corte
 de modo que una proporción p de valores de la población es
menor o igual que (xp).

Estadística Social Básica - 2017 Dr. Tabaré Fernández 35


Recordemos que:

 Sea C el símbolo para cuarquil, “Q” el símbolo de Quintil y


“D”el simbolo de decil, siendo P el símbolo para percentil
 = =
 =
 =
 =
 =
 =
 =
Estadística Social Básica - 2017 Dr. Tabaré Fernández 36
Notación: cautela

 El subíndice representa ahora un caso, y no ya más un valor.

 el súbíndice “i“ representará el i-ésimo caso

Estadística Social Básica - 2017 Dr. Tabaré Fernández 37


Por ejemplo, cuartiles

 Mismos procedimientos que la mediana, distinguiendo par e


impar
Ordeno las N observaciones en la variable de acuerdo a
los valores de la variable x
Si N es impar:
 El valor del primer cuartil es aquel observado en el renglón donde
 =
 El valor del tercer cuartil es aquel observado donde

 =
Estadística Social Básica - 2017
∗3 Dr. Tabaré Fernández 38
Ejemplo (2)

 Si N es par:

 Lo más apropiado es computer la mediana (p50) según el


procedimiento estándar
+
P50 = Me =
2
 Luego conviene divider la distribución en dos mitades y operar cada una de
las partes con el mismo criterio aplicado cuando N es impar.

 Busco el valor de x, cuando = 39


Estadística Social Básica - 2017 `
Dr. Tabaré Fernández
Ejemplo Npar
i= X en el grupo 1 i= X en el grupo 2
i=1 1 i=1 1
 Mediana=C2=p50 i=2 3 i=2 2
i=3 3 i=3 3
i=4 5 i=4 3
 Primer cuartil i=5 5 i=5 3
 Grupo 1: 3 i=6 7 i=6 8

 Grupo 2: 3 i=7 7 i=7 9


i=8 8 i=8 9
i=9 9 i=9 9
 Tercer cuartil: i=10 9 i=10 10
 Grupo 1: 7
 Grupo 2: 9
Media 5.7 5.7
Estadística Social Básica - 2017 40
Dr. Tabaré Fernández
Mediana 6 5.5
Próxima clase

MEDIDAS DE DISPERSIÓN

Estadística Social Básica - 2017 Dr. Tabaré Fernández 41

También podría gustarte