Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DESCRIPTIVA
TABLAS DE FRECUENCIAS.
Asigna a cada categoría el número de elementos que pertenecen a
ella.
Permite visualizar la distribución de frecuencias de la variable.
GRAFICOS.
Es la representación gráfica de los resúmenes de datos presentados
en tablas.
PARAMETROS / ESTADISTICOS.
Medidas que representan o caracterizan a la variable, siendo de
tendencia central, posición, dispersión, forma o construidos (índices,
tasas o variables complejas).
Ejemplo
Pablo Salgado EMAIL: cursos-estadistica@centroredes.org.ar
10
TABLAS
Estadígrafos Años
Años Frecuencia Porcentaje % acum.
Media 12,88
Formas de
0 2 0,1 0,1
Mediana 12,00
3 5 0,3 0,5
Moda 12
4 5 0,3 0,8
15 73 4,8 77,9
16 194 12,8 90,7
17 43 2,8 93,6
Parámetros
18 45 3,0 96,6
19 22 1,5 98,0
Estadísticos
20 30 2,0 100,0
Total 1510 100,0 Tablas
Gráficos
11
TABLAS
Estadígrafos Años
Años Frecuencia Porcentaje % acum
Media 12,88
Mediana
0 2 0,1 0,1
Mediana 12,00
3 5 0,3 0,5
Moda 12
4 5 0,3 0,8
10 9,00
5 6 0,4 1,2
20 11,00
6 12 0,8 2,0
25 12,00
7 25 1,7 3,6 30 12,00
8 68 4,5 8,1 40 12,00
9 56 3,7 11,9 Percentiles 50 12,00
10 73 4,8 16,7 60 13,00
15 73 4,8 77,9
16 194 12,8 90,7
17 43 2,8 93,6
Parámetros
Estadísticos
18 45 3,0 96,6
19 22 1,5 98,0
20 30 2,0 100,0
Total 1510 100,0 Tablas
Gráficos
12
TABLAS
Estadígrafos Años
Años Frecuencia Porcentaje % acum
Percentil 75
Media 12,88
0 2 0,1 0,1
Mediana 12,00
3 5 0,3 0,5
Moda 12
4 5 0,3 0,8
10 9,00
5 6 0,4 1,2
20 11,00
6 12 0,8 2,0
25 12,00
7 25 1,7 3,6 30 12,00
8 68 4,5 8,1 40 12,00
9 56 3,7 11,9 Percentiles 50 12,00
10 73 4,8 16,7 60 13,00
15 73 4,8 77,9
16 194 12,8 90,7
17 43 2,8 93,6 Parámetros
18 45 3,0 96,6
Estadísticos
19 22 1,5 98,0
20 30 2,0 100,0
Total 1510 100,0
Tablas
Gráficos
13
TABLAS
Estadígrafos Años
Años Frecuencia Porcentaje % acum
Percentil 20
Media 12,88
0 2 0,1 0,1
Mediana 12,00
3 5 0,3 0,5
Moda 12
4 5 0,3 0,8
10 9,00
5 6 0,4 1,2
20 11,00
6 12 0,8 2,0
25 12,00
7 25 1,7 3,6
30 12,00
8 68 4,5 8,1 40 12,00
9 56 3,7 11,9 Percentiles 50 12,00
10 73 4,8 16,7 60 13,00
11 85 5,6 22,3 70 14,00
15 73 4,8 77,9
16 194 12,8 90,7
17 43 2,8 93,6
Parámetros
Estadísticos
18 45 3,0 96,6
19 22 1,5 98,0
20 30 2,0 100,0
Total 1510 100,0 Tablas
Gráficos
14
Distribución de Frecuencias
Cuando se trabaja con un conjunto grande de datos, la
forma de organizarlos y resumirlos es construyendo
Tablas de Frecuencias de las variables de interes.
Esto nos permitirá observar como se distribuyen los
datos a lo largo del recorrido de la variable.
Podremos observar donde están más concentrados, si
hay datos extremos, si hay simetría en la distribución
etc.
TIPOS DE FRECUENCIAS
15
Frecuencias Absolutas
Frecuencias Relativas
Frecuencias Porcentuales
Frecuencias Absolutas Acumuladas
Frecuencias Relativas Acumuladas
Frecuencias Porcentuales Acumuladas
Qué hacemos 18
19
52
10
3,8
0,7
98,6
99,3
en 20
21
6
1
0,4
0,1
99,8
99,9
Agrupar con
este caso? 22
Total
2
1364
0,1
100,0
100,0
algún criterio
25
Porcentaje
Frecuencia Porcentaje
acumulado
0 a 4 años 272 19,9 19,9
5 a 9 años 400 29,3 49,3
10 a 14 años 404 29,6 78,9
Frecuencia % % acumulado
Hasta $25.000 143 30,2 30,2 Hasta $25.000 143 30,2 30,2
$25.000 -$ 50.000 260 54,9 85,0 $25.000 -$ 50.000 260 54,9 85,0
Ver archivo: base niños flores.xls (Excel) o base niños flores.sav (SPSS)
34
Encuesta Educativa en Bajo Flores
Lugar de nacimiento de los niños
VARIABLE 2
Frecuencia Porcentaje
Sexo
Total
Masculino Femenino
Sexo
Total
Masculino Femenino
Nivel Educativo
por Concurrencia a la escuela
Va a la escuela
Total
No Si
0 a 3 años 158 35 193
Grupo de
4 a 5 años 28 128 156
edad según
6 a 12 años 10 551 561
Nivel 13 a 18 años 48 387 435
educativo más de 18 años 3 16 19
Eje y
Or
de p
na
da
Eje x
Abscisa
47
Utilidades
1. Tener una primera impresión de los datos antes de comenzar el análisis
(explorar).
2. Elección de tests estadísticos a realizar.
3. Poder del “Test de la ojeada”.
4. Mostrar los valores que asumen los datos.
5. Detectar patrones.
6. Comparar distintas muestras, o comparar en el tiempo.
7. Evaluar la distribución de los datos.
Gráficos de Sectores
N= 585
50
Gráfico de Sectores o Circular (EPH Corrientes)
Vivienda en villa
1,1%
Esto no conviene!!
Sin fines habitación
,1%
Vivienda en lugar de
,2%
Inquilinato
,1%
Departamento
34,2%
Casa
64,3%
51
Departamento
34,2%
Casa
64,3%
52
7,4%
Vivienda en lugar de
14,8%
Sin fines habitacion
7,4%
Otros
1,5%
Vivienda en villa
70,4%
Que asco de
gráfico!!
55
Está rereremal!!!
Índice de necesidad de tratamiento de caries en niños
de 5 a 7 años
N=321
Es un desastre
Índice de necesidad de tratamiento de caries en niños
57
de 5 a 7 años
Esta bien?
Índice de necesidad de tratamiento de caries en niños
58
de 5 a 7 años
O mejor asi?
59
Índice de necesidad de tratamiento de caries en niños
de 5 a 7 años
Diagrama de Barras
Mejor para atributos no numéricos.
Datos Nominales.
Datos Ordinales (eje no arbitrario).
Altura proporcional al número de casos.
Barras del mismo ancho.
Distancias entre barras iguales.
Se puede utilizar frecuencias absolutas, relativas y
porcentuales.
Gráfico de Barras
Verticales
8.000.000
7.366.850
6.669.500
7.000.000
6.000.000
5.000.000
4.153.400
4.000.000
3.119.750
3.000.000
2.000.000
1.000.000
0
Maíz Girasol Trigo Soja
34,2%
35,0%
31,0%
30,0%
25,0%
19,3%
20,0%
14,5%
15,0%
10,0%
5,0%
0,0%
Maíz Girasol Trigo Soja
100
13
95,4
12
14
90 88,2
15 2 86,0
84,0
11 82,8
1
6 5 3 80
10
73,8
7
4
9 70
8
60
Zona A (norte)
Zona B (este) 50
Zona D (oeste)
Zona E (centro)
Fuente: Dirección General de Estadística y Censos (Ministerio de Hacienda GCBA). EAH 2009.
Gráfico de Barras
Verticales
2.500
2.161
2.000 1.898
Pesos
1.500 1.383
1.189
1.000
500
0
Total Hasta primario Primario completo/ Secundario completo/ Superior completo y
incompleto secundario incompleto superior incompleto más
Fuente: Dirección General de Estadística y Censos (Ministerio de Hacienda GCBA). EAH 2008.
Distribución porcentual del nivel de instrucción alcanzado 72
N= 585
73
Distribución porcentual del indice de masa corporal
Base de datos de adultos sanos
N= 585
Porcentaje de pacientes con exceso de peso que 74
n=1254
Gráfico de Barras Verticales
variables cuantitativas 16
discretas. 14
Porcentaje
10
0
1 2 3 4 5 6 7 8 9 10 11 12 14 16
40
30
Porcentaje
20
10
0
1 2 3 4 5 6 7 8 11
Gráfico de Barras
Horizontales
80
Patagonia 37,3%
Cuyo 31,1%
Centro 30,0%
NOA 27,8%
Brecha 1,5
Total País 27,5%
Rango: 12,8%
NEA 26,9%
CABA 24,8%
PBA 24,5%
Santa Fe 12,3%
Córdoba 10,9%
Corrientes 7,8%
La Pampa 6,9%
Chaco 4,1%
Formosa 2,9%
Estimación estadística obtenida de las oficinas locales del SENASA año 2002.
Distribuciones Bivariadas
12.000.000
10.000.000
8.000.000
1996/97
6.000.000
2001/02
4.000.000
2.000.000
0
Maíz Girasol Trigo Soja
50,0%
45,0%
40,0%
35,0%
30,0%
1996/97
25,0%
2001/02
20,0%
15,0%
10,0%
5,0%
0,0%
Maíz Girasol Trigo Soja
N= 585
89
Distribución porcentual del indice de masa corporal por sexo
Base de datos de adultos sanos
N= 585
90
Porcentaje de pacientes atendidos con exceso de peso por Especialidad Médica
95%
Nutrición
5%
Más de 40%
63% Hasta el 40%
Cirugía
37%
77%
Cardiología
23% n=1254
49%
Tocoginecología
51%
17%
Pediatría
83%
52%
Otros
48%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Distribuciones
Bivariadas
70
60
50
40
30
20 Va a la escuela
10 Si
0 No
0 a 3 años 6 a 12 años mas de 18 años
4 a 5 años 13 a 18 años
90% 18,10%
80%
70%
40%
30%
20%
10%
0%
0 a 3 años 4 a 5 años 6 a 12 años 13 a 18 años mas de 18
años
No concurre Concurre
94
Evolución de la soja durante el quinquenio 1996/97 – 2001/02
respecto a otras producciones extensivas.
100%
90%
50% 2001/02
1996/97
40%
30%
20%
10%
0%
Maíz Girasol Trigo Soja
95
90%
80%
70%
67,30%
60%
94,10%
50%
40%
30%
20%
32,70%
10%
5,90%
0%
Técnica cepillado Uso de Hilo dental
Adecuada Inadecuada Usa No usa
96
A= R/L
6. Luego construir las clases y contar las
frecuencias y armar una tabla de frecuencias.
101
Frecuencia
43.5 45 16 0.08 8 53 0.265 26.5
46.5 48 28 0.14 14 81 0.405 40.5 15
49.5 51 27 0.135 13.5 108 0.54 54
52.5 54 15 0.075 7.5 123 0.615 61.5
10
55.5 57 23 0.115 11.5 146 0.73 73
58.5 60 16 0.08 8 162 0.81 81
61.5 63 14 0.07 7 176 0.88 88 5
64.5 66 10 0.05 5 186 0.93 93
67.5 69 10 0.05 5 196 0.98 98 0
70.5 72 2 0.01 1 198 0.99 99 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75
73.5 75 2 0.01 1 200 1 100 Clase
TOTAL 200 1 100
103
Frecuencia
30
35000
30000
25000
20000
15000
10000
5000
0
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500
250 750 1250 1750 2250 2750 3250 3750 4250 4750 5250
Minimental Test
Olvido Benigno Sujetos sanos
25 50
20 40
15 30
Frecuencia
Frecuencia
10 20
5 10
0 0
26 27 28 29 30 28 29
n=1254
111
Distribución de edades de los encuestados
n=1254
Gráficos bivariados:
Pirámide de Población
114
Valores adyacentes
Percentilo 75 Percentilo 75
Percentilo 25 Percentilo 25
Valor atípicos
Valores Extremos
Grupo A Grupo B
116
Box-Plots (Construcción)
• Ordenar los datos y obtener Max, Min, Q1, Q2 y Q3
• Dibujar un rectángulo con Q1 y Q3.
• Dibujar la mediana (Q2)
• Calcular los límites inferior y superior:
• Li = Q1 - 1,5 (Q3 - Q1)
• Ls= Q3 + 1,5 (Q3 - Q1)
• Considerar como atípicos los valores exteriores al intervalo
• Dibujar una línea desde los extremos del rectángulo hasta los valores
límites.
• Identificar los datos fuera del intervalo como atípicos
117
n=1254
118
Diagrama de Cajas:
Variable: perímetro de cintura
n= 585
119
Índice de necesidad de tratamiento de caries en niños
de 5 a 7 años por escuela
120
Barras de errores
Variables Continuas.
Muy útiles para comparar y graficar diferencias entre
variables teniendo en cuenta el promedio y alguna medida de
dispersión (desvió estándar, error estándar o intervalo de
confianza).
Como condición las variables deben ser simétricas y
aproximarse a la distribución normal.
Comparar distribuciones en varios grupos.
121
9,8
95% IC Edad
Promedio
9,6
9,4
9,0
N= 716 648
Masculino Femenino
Sexo
122
123
Índice de necesidad de tratamiento de caries en niños
de 5 a 7 años por escuela
124
125
Tasa de mortalidad infantil anual (muertos por mil nacidos) con su Intervalo de
Confianza al 95%. Ciudad de Buenos Aires. Año 2010
21
19
17
15
13
11
5
Algunos consideraciones entre:
Diagramas de caja
Barra de errores
Percentiles
Distribución z score
132
133
Diagrama de cajas
134
Distribución Normal
Minimental Test
135
31
30
29
Minimental Test
28
27 38
19
26 1
25
N= 54 42
90000 90000
80000 80000
70000 70000
60000 60000
SALARIO
SALARIO
50000 50000
40000 40000
30000 30000
20000 20000
Mediana Mean
10000 25%-75% 10000
Hombre Mujer Mean±SE
Rango Hombre Mujer
Mean±SD
Género del empleado Género del empleado
137
138
Evolución de la Producción (en miles de Toneladas) y Superficie139
Implantada (en miles de Hectáreas) del cultivo de Soja en
Argentina.
Gráficos para bivariado
12 12,5
11,8
10,3 10,1
9,9
10 9,2
9,0
8,5 8,3
7,8 7,9 7,9
8 7,3
6,7
TMI DGEyC
143
Tasa de mortalidad infantil anual (muertos por mil nacidos). Ciudad de Buenos Aires.
Año 2010
20 Curva de regresión ajustada
18
16
14
TMI anual
12
10
4
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010
Año
TMI DGEyC
144
Peso = - 58 + 80 x Talla
R cuadrado = 0,263
145
IMC = 3,4 + 0,26 x PC
R cuadrado = 0,55