Está en la página 1de 38

Estadística Social Básica

Módulo IV.

Dr. Tabaré Fernández


Octubre, 2017

1
Estadística Social Básica - 2017 Dr. Tabaré Fernández
Módulo IV: temas

A. Tablas de frecuencias para variables métricas. Datos agrupados.


B. Medidas de posición o tendencia central
C. Medidas de dispersion
D. Gráficas
E. Forma de la distribución: medidas de sesgo y apuntamiento. distribución
normal
F. Relación bivariada entre variables métricas: la correlación. Matriz de
correlaciones. El caso particular de una correlación entre una variable
métrica y una dicotómica.

Dr. Tabaré Fernández - Estadística Social Básica 2


UBICANDO EL TEMA

Estadística Social Básica - 2017 Dr. Tabaré Fernández 3


Recordemos *

 Ramas de la estadística :
 Básica
 Inferencial

 Dentro de la estadística básica, dos ramas


 De atributos
 Métricas

 Recordar la distinción entre variables métricas y no métricas


 ¿Qué propiedades de los números reales se utilizan?

Dr. Tabaré Fernández - Estadística Social Básica 4


Para aquellas variables que son métricas

 Tipos de variables métricas


 Intervales
 De razón

 Ejemplos:
 Edad (en años)
 Horas de trabajo a la semana en su empleo principal
 Años de educación formal aprobados en total por el entrevistado
 Tamaño del establecimiento agropecuario (en hectáreas)
 Horas de trabajo dedicadas a la limpieza (aseo) del hogar desde lunes a viernes la semana pasada
 Número de alumnos matriculados el primer día de comienzo del curso en este centro educativo
 Número de mujeres controladas en su embarazo por la policlínica durante el año 2012

 Recordar la clase especial de las variables dicotómicas

Dr. Tabaré Fernández - Estadística Social Básica 5


Instrumentos para el resumen univariado

 La Estadística Básica procede con las variables métricas de modo


análogo que con las variables no-métricas
 Tablas de frecuencia
 Gráficas

 Y añade instrumentos estadísticos nuevos, de los cuales trabajaremos


3 tipos:
 Medidas de Tendencia o de Posición
 Medidas de Dispersión
 Medidas de Forma (sesgo y apuntamiento)

 Veremos al final del modulo instrumentos para el análisis de relaciones


Dr. Tabaré Fernández - Estadística Social Básica 6
TEMA A
TABLAS DE FRECUENCIA PARA VARIABLES MÉTRICAS.
DATOS AGRUPADOS: INTERVALOS Y MARCAS DE CLASE

Estadística Social Básica - 2017 Dr. Tabaré Fernández 7


Instrumento: la tabla de frecuencia

 Recordamos qué y cómo es una tabla:

 Tabla y matriz
 Qué hay en los renglones de la tabla?
 Qué hay en las columnas?

 ¿Cuál es el problema práctico de usar una tabla de frecuencias con


variables métricas?

 En consecuencia, desde un punto de vista práctico tendremos que


diferenciar el caso de una variable con pocos valores distintos, de
aquél en que el número de éstos es grande

Dr. Tabaré Fernández - Estadística Social Básica 8


Casos a distinguir cuando se usa una tabla:

 La variable es métrica, tiene pocas categorías y se ha tabulado todas


las categorías (Caso 1)
 La variable es originalmente métrica, tiene pocas categorías en las
PERO se ha procedido a registrar algunos valores reagrupándolos,
generando con esto una censura en los datos (Casos 2)
 La variable es originalmente métrica, PERO en los valores originales
registrados en la matriz de datos han sido previamente
RECODIFICADOS y presentados en “tramos” o “intervalos” (una
nueva variable, Caso 3).
 La variable PUEDE ser métrica, PERO ha sido medida en forma
agrupada (caso 4).

Dr. Tabaré Fernández - Estadística Social Básica 9


Caso 1: tabla de variable métrica con pocos
valores.
 Para qué puede ser util la table de frecuencias en este caso?
 Contar el número de veces que se repite un valor particular (frecuencia
absoluta)

 Calcular cuanto representa esá frecuencia absoluta sobre el total de


casos (frecuencias relativas: proporciones o porcentajes)

 Sumar el número de casos que acumula hasta cada valor determinado


(frecuencia absoluta acumulada).

 Calcular el peso acumulado de casos que tiene cada valor determinado


de la variable, o menos (frecuencia relativa acumulada).-

Dr. Tabaré Fernández - Estadística Social Básica 10


Objetivos a los que puede servir este
instrumento
 Exploratorio:
 “mirar” la distribución de una variable, observando valores y frecuencias. Por ejemplo:
el “data cleanning” que se hace luego de digitar los datos de una encuesta.

 Caracterizar el recorrido completo de una variable para constatar el


peso que tiene algún valor sobre el cual hay hipótesis particulares que
ha hecho la teoría.
 Por ejemplo, la tasa de remplazo en demografía, o el salario mínimo nacional (SMN).

 Ver el peso que tienen los valores extremos de la variable en la


distribución completa.
 Se llama n “outliers”

Dr. Tabaré Fernández - Estadística Social Básica 11


TOT HIJOS
NACIDOS

Mujeres con 14 y más años


VIVOS Freq. Percent Cum.

0 15,140 28.52 28.52


1 9,889 18.63 47.15
2 13,117 24.71 71.87
3 7,358 13.86 85.73
4 3,401 6.41 92.14
Hijos nacidos vivos.

5 1,775 3.34 95.48


6 910 1.71 97.19
7 575 1.08 98.28
8 329 0.62 98.90
9 212 0.40 99.30
10 137 0.26 99.56
11 89 0.17 99.72
12 69 0.13 99.85
13 29 0.05 99.91
ECH 2015

14 25 0.05 99.95
15 8 0.02 99.97
16 9 0.02 99.99
17 2 0.00 99.99
19 1 0.00 99.99
21 1 0.00 99.99
22 3 0.01 100.00

Total 53,079 100.00 12


Dr. Tabaré Fernández - Estadística Social Básica
Tablas de frecuencias: una variable con
pocos valores
Frecuencias Frecuencias
Valores de Frecuencias Frecuencias
Absolutas Relativas
variable Absolutas relativas
Acumuladas Acumuladas

x=1 n1 h1 N1 H1
x=2 n2 h2 N2 H2
x=3 n3 h3 N3 H3

… … … … …
x=m nm hm Nm=n Hm=1
Total N 1
Dr. Tabaré Fernández - Estadística Social Básica 13
Recordamos propiedades de la tabla

x =m

∑n
x =1
x =i =N
x =m
0 ≤ H x =i ≤ 1
∑H
x =1
x =i =1 H x =1 = H x =0 + hx =1

Dr. Tabaré Fernández - Estadística Social Básica 14


Caso 2: variables métricas con una o dos
categorías censuradas para la tabla

 La variable a tabular es métrica originalmente


 Y además fue registrada en el cuestionario y digitada en la matriz de
datos como variable métrica con todos los valores que podia tomar

 PARA HACER LA TABLA, se resolvió agrupar


 Por ejemplo, para los más bajos o los más altos.
 Se llama cencura de la distribución en el momento de la presentación

 Veamos el ejemplo y resolvamos qué pasó con el nivel de


medición de la variable tabulada
Dr. Tabaré Fernández - Estadística Social Básica 15
Caso 2: variables métricas con una o
dos categorías censuradas para la
tabla

Dr. Tabaré Fernández - Estadística Social Básica 16


Caso 3: tabla de variables métricas con
muchos valores, recodificada
 Ejemplo, edad de los encuestados en la ECH

 El instrumento de la tabla de frecuencia puede ser aún de utilidad pero


con anterioridad es necesario realizar tareas previas:

 La variable original medida tiene muchos valores


 RECODIFICO la variable original en una NUEVA variable en la cual se han
agrupado valores en categorías

 Estas categorías se denominan “intervalos de clase”.

 Cada intervalo tiene valores “límite” (inferior/superior) que los separan.


 Cada intervalo además tiene un valor central denominado “marca”
Dr. Tabaré Fernández - Estadística Social Básica 17
Caso 3. Tabla de frecuencia con variable
recodificada

Dr. Tabaré Fernández - Estadística Social Básica 18


Caso 4.

 Se trata de un caso especial, discutido en la bibliografía, aunque de uso


frecuente.

 Un concepto métrico, por ejemplo, el ingreso, ha sido medido (registrado) a


través de un formulario, en forma de intervalos predefinidos.

 La variable que está en la matriz de datos NO es de tipo métrica, sino que está medida en
escalaEEEEEE (¿ Por qué?)

 Sobre esta base, y suponiendo que la variable observada (integresos en


intervalos) es una adecuada medida de la variable latent (ingresos), se aplican
instrumentos propios de la estadística descriptive.

Dr. Tabaré Fernández - Estadística Social Básica 19


Caso 4.

Ingresos Totales
por Trabajo Freq. Percent

no tue ingresos 173 7.80


hasta 2200 72 3.24
entre 2201 y 4400 76 3.42
entre 4401 y 6000 138 6.22
entre 6001 y 7000 139 6.26
entre 7001 y 9000 300 13.52
entre 9301 y 11500 302 13.61
entre 11501 y 16000 425 19.15
entre 16000 y 20000 294 13.25
entre 20000 y 30000 226 10.18
entre 30000 y 50000 62 2.79
mas de 50000 12 0.54

Total 2,219 100.00

Dr. Tabaré Fernández - Estadística Social Básica 20


INTERVALOS DE CLASE EN UNA
VARIABLE MÉTRICA
Estadística Social Básica - 2017 Dr. Tabaré Fernández 21
Intervalos en una variable métrica

 Es un caso muy especial

 La variable se ha medido a nivel métrico


 La variable está en la matriz de datos medida con este nivel
de medición

 Para el resumen se ha decidido agrupar sus valores, v.g.


recodificarla y formar “intervalos”
Estadística Social Básica - 2017 Dr. Tabaré Fernández 22
Intervalo

 Los intervalos son grupos de valores de una variable métrica que se entiende similares
conceptualmente y que, a través de la recodificación, pasarán a formar una misma categoría en
la nueva variable recodificada.

 La clasificación nueva de valores debe ser exhaustiva y excluyente, igual que en cualquier otra
variable

 Los intervalos se construyen definiendo varios “puntos de corte” en la variable métrica original.
 Por ejemplo, “desde tal valor hasta tal valor”

 En cada intervalo, el valor más bajo se denomina límite inferior y el más alto, límite superior.

 Cada intervalo además tiene un valor central denominado “marca de clase”

Dr. Tabaré Fernández - Estadística Social Básica 23


Tópicos en una tabla de frecuencia con
intervalos
 El tamaño del intervalo
 De igual tamaño
 De distinto tamaño

 Elegir el último (primer) inteverlo

 Determinar el criterio de clasificación de los valores en los


intervalos
 Abiertos / cerrados

 La marca de clase
 Qué es, cómo se calcula y qué papel juega

Dr. Tabaré Fernández - Estadística Social Básica 24


Intervalo y clasificación de valores

 Determinar a qué intervalo pertenece un valor de la variable métrica no


es un asunto trivial.
 Implica una operación de transformación sobre los datos, una recodificación
 Todos los valores deben resultar clasificados en uno y sólo uno de los intervalos
creados por la recodificación

 Algunas variables métricas son además continuas, por lo que por


definición, hay infinitos valores de la variable entre dos números
cualesquiera que se tomen (Concepto de continuidad de matemática)

 Junto con los puntos de corte y los intervalos suele indicarse cómo
clasificar los valores.

Dr. Tabaré Fernández - Estadística Social Básica 25


Cerrado

 Un intervalo está cerrado a la izquierda cuando el número


indicado como límite inferior está incluido en ese intervalo.
 En la tabla anterior, quienes tienen 10 años son lasificados en el intervalo
de 10 a 20 años.

 Un intervalo está cerrado a la derecha, cuando el número


indicado como límite superior está incluido en ese intervalo.
 De acuerdo a la forma de definir los intervalos, una persona que tiene 19
años y medio está clasificada en el intervalo de 10 a 20 años

Dr. Tabaré Fernández - Estadística Social Básica 26


Abierto

 Un intervalo es abierto cuando el valor indicado como límite


(superior o inferior) no está incluido en el intervalo.

 Se incluirán todos los valores, excepto los límites (concepto


de asintótico en Matemática)
Dr. Tabaré Fernández - Estadística Social Básica 27
Cerrados por izquierda y abiertos por
derecha
 En una tabla cualquiera se combinan ambos criterios de
clasificación
 A través de esta combinación debe llegarse al criterio de clasificar en forma
exhaustive y excluyente a todos los valores de la variable

 Es una combinación muy frecuente para una variable métrica que


tiene un valor teórico mínimo conceptualmente significativo.
 Ejemplos, la edad y el ingreso

 Veamos el ejemplo.
Dr. Tabaré Fernández - Estadística Social Básica 28
Ejemplo

Dr. Tabaré Fernández - Estadística Social Básica 29


Intervalo abierto / cerrado

Dr. Tabaré Fernández - Estadística Social Básica 30


Comunicación

 A los efectos de que la comunicación de los intervalos sea


elocuente y directa, suele hacerse una tabla donde el límite
superior de un intervalo no es igual al límite inferior del siguiente.

 En términos convencionales, suele indicarse a través de:


 Paréntesis curvo la apertura
 Paréntesis recto la clausura

Dr. Tabaré Fernández - Estadística Social Básica 31


Ejemplo con interval de distinta amplitud

 Los intervalos pueden ser de la misma amplitud o de distinta


amplitud

 Serán de la misma amplitud o rango de valores cuando se determine que


la recodificación de la variable métrica original se haga con un único
patrón.
 Por ejemplo, la edad de 15 en 15 como fue la tabla anterior

 Serán de distinta amplitud si se aplica un criterio teórico de agrupamiento,


por ejemplo las edades observadas se han agrupado siguiendo edades
típicas de los ciclos del sistema educativo formal.Es el caso de la tabla
que sigue:

Dr. Tabaré Fernández - Estadística Social Básica 32


Edad en tramos. ECH 2011
Intervalo Marca n (i) N (i) h (i) H (i)
2y
1 119594 119,594 3.55 3.55
menos
3 a 5años 4 131232 250826 3.9 7.45
6 a 10 8 250938 501764 7.45 14.9
11 a 13
12 156787 658551 4.65 19.55
años
14 a 16 15 169801 828352 5.04 24.59
17/19 18 154163 982515 4.58 29.17
20 a 24 22 247057 1229572 7.33 36.5
25 a 29 27 235447 1465019 6.99 43.49
30 a 64 47 1434455 2899474 42.58 86.07
65 y más 65 469186 3368660 13.93 100
Dr. Tabaré Fernández - Estadística Social Básica 33
Total 3368660 100
Marca de clase

 Noción:
 Es el valor central, equidistante, entre los límites del intervalo.

 Cálculo:

 Utilidad:
 Representa todos los valores del intervalo en gráficas y en cálculos de estadísticos
 NO ES UN PROMEDIO

Dr. Tabaré Fernández - Estadística Social Básica 34


Ejemplo de creación de intervalos

 Variable horas de trabajo en la base de personas ECH 2014,


frontera

 Abrimos la base y miramos esta variable.

 Los valores de la variable van desde 1 hora trabajada hasta


98 horas.

Dr. Tabaré Fernández - Estadística Social Básica 35


Ejemplo de creación de intervalos

 Hay muy pocos casos entre 1 y 10 horas; y entre 90 y 98


horas.

 Los valores 20, 30, 40, 48 y 60 son los que tienen mayor
cantidad de casos.
Dr. Tabaré Fernández - Estadística Social Básica 36
Ejemplo de creación de intervalos

 Criterio teórico y puntos de corte con base en el formato de


jornadas laborales más frecuentemente vistas en los
contratos

 Cerrados por izquierda, “[“ y abiertos por derecha “)”


 cuarta jornada: hasta 15 horas semanales
 media jornada: entre 15 y 25 horas semanales
 jornada completa: entre 25 y 48 horas semanales
 jornada máxima OIT: entre 48 y 65 horas semanales
 jornada de auto explotacion: más de 65 horas semanales
Dr. Tabaré Fernández - Estadística Social Básica 37
Síntesis:

 Criterios alternativos para definir intervalos y puntos de corte

 Por tamaños (criterio empírico)


o De igual amplitud
o De distinto amplitud
 Con referencia a nociones teóricas o normativas

 Cerrado / abierto

 La marca de clase
Dr. Tabaré Fernández - Estadística Social Básica 38

También podría gustarte