Está en la página 1de 20

Unidad 1: Estadística Descriptiva

1.6. CONSTRUCCIÓN DE TABLAS

En general una tabla es una estructura constituida por “celdas” dispuestas en “filas” y
“columnas”, que sirven para presentar información de forma clara y ordenada. En estadística se
usa la tabla para presentar, por ejemplo, la distribución de frecuencia, o las medidas resumen de
una o más variables, o los resultados del análisis inferencial.

♦ El primer paso en la construcción de una tabla es definir el objetivo de la tabla, es


decir, que información se quiere presentar.

♦ Un segundo paso es definir la disposición de la información, es decir, que


información se presentará en las filas y que información se presentará en las
columnas. Por ejemplo, si se quiere presentar la distribución de frecuencia de la
variable “cargo del personal permanente de una planta”, una forma común es poner
los distintos valores de las categorías de la variable en las filas y los distintos tipos de
frecuencias en las columnas. (Tabla 1.7)

Tabla 1.7: Distribución de frecuencia del personal de la planta según


cargo que ocupa
Cargo del Personal Frecuencia absoluta Frecuencia relativa
Obrero 474 37%
Jefe 405 32%
Gerente de Planta 277 22%
Gerente Regional 58 5%
Directorio 57 4%
Total 1271 100%

Si el propósito de la tabla es presentar la distribución de frecuencia de una o más


variables, se puede distinguir dos tipos de tablas:

(a) Con un solo criterio de clasificación, que se usan para mostrar la distribución de
frecuencia de una variable, en las cuales se presenta la frecuencia de las posibles
respuestas o valores de dicha variable, por ejemplo las Tablas 1,3, 6 y 7.

(b) Tablas con dos o más criterios de clasificación, que permiten mostrar la
distribución conjunta de dos variables, o bien, comparar la distribución de

19
Unidad 1: Estadística Descriptiva

frecuencia de una misma variable en dos o más grupos (Tabla 1.8), o mostrar
asociación o relación entre dos o más variables obtenidas en cada unidad de
observación (Tabla 1.9).

Tabla 1.8: Cargos del Personal de las Fábricas según sexo. (Datos hipotéticos).

Cargo del personal VARONES MUJERES TOTAL


Obrero 122 352 474
Jefe 103 302 405
Gerente de Planta 135 142 277
Gerente Regional 35 23 58
Directorio 27 30 57
Total 422 849 1271

Tabla 1.9: Nivel Económico según nivel de instrucción en


una localidad 1995. (Valores hipotéticos)

Nivel de Nivel económico


instrucción Alto Normal Total

Universitario 43 12 55

No universitario 15 32 47

Otros aspectos que deben considerarse para presentar la información disponible en tablas son:

♦ Colocar el título: El título debe responder a las preguntas “qué se presenta”, “como
se clasifican las unidades de observación”, “donde y cuando fueron obtenidos los
datos”. Hay casos especiales en donde no es necesario ajustarse estrictamente a todas
estas pautas o en el que deben agregarse otros elementos, por ejemplo cuando se
presentan varias tablas cuyos datos se han obtenido en el mismo lugar y en el mismo
período de tiempo. Esta información aparecerá en el texto del trabajo y no será
necesario repetirla en cada tabla. Entre otros elementos que se deben agregar a la
tabla tenemos Fuente de datos, la cual debe colocarse al pie de la tabla donde se
indique el origen de los datos, si ellos no son de fuente propia.

20
Unidad 1: Estadística Descriptiva

♦ Colocar los datos numéricos obtenidos del material en estudio y completarlos


con porcentajes si es necesario: Existen diferentes maneras de calcular los
porcentajes que dependen fundamentalmente de cuál es el propósito de presentar la
tabla, es decir, qué es lo que se quiere mostrar.

i. Si el propósito es mostrar la distribución conjunta de dos variables, se debería tomar


como base para calcular los porcentajes el total de individuos observados (1271 para la
Tabla 1.8), en dicho caso obtendríamos

Tabla 1.10: Cargos del personal de las fábricas según sexo. (Datos hipotéticos).

Cargos del Personal VARONES MUJERES TOTAL

Obrero 10% 28% 38%


Jefe 8% 24% 32%
Gerente de Planta 11% 11% 22%
Gerente Regional 3% 1% 4%
Directorio 2% 2% 4%
Total 34% 66% 100%(1271)

Así, la interpretación que debe darse por ejemplo al valor 28% de la Tabla 1.10 es la
siguiente: “el 28% del personal de esas Fábricas son mujeres y obreros” esto es
representa la frecuencia conjunta de las características mujer y obrero. El conjunto de
estas frecuencias recibe el nombre de distribución porcentual conjunta.

ii. Si el propósito es comparar la distribución de una variable en dos o más grupos los
porcentajes deberían calcularse usando el total de individuos en cada grupo (Tabla 1.11).

Tabla 1.11: Cargos del personal de las Fábricas según


sexo. (Datos hipotéticos).
Cargos del personal VARONES MUJERES
Obrero 29% 40%
Jefe 24% 36%
Gerente de Planta 33% 17%
Gerente Regional 8% 3%
Directorio 6% 4%
Total 100% (422) 100% (849)

21
Unidad 1: Estadística Descriptiva

iii. En ese caso la celda que corresponde a mujeres obreras tiene una frecuencia del 40% la
interpretación de este valor es que del total de mujeres el 40% son “Obreras”

iv. Cuando el propósito es mostrar que existe alguna relación entre las variables, por
ejemplo “Nivel de instrucción y Nivel de Ingreso”, lo que se debe preguntar es cuál de
estas variables cambiará por la influencia de la otra. En este caso uno podría pensar que
el Nivel de Ingresos puede cambiar según el Nivel de Instrucción, por lo que se debe
elegir como base de los porcentajes a los totales de cada categoría del nivel de
instrucción (55 universitario y 47 no universitarios). (Tabla 1.12)

Tabla 1.12: Nivel Económico según nivel de instrucción en


una localidad 1995. (Valores hipotéticos)

Nivel de Nivel Económico


instrucción Alto Medio Total

Universitario 78% 22% 100% (55)

No universitario 32% 68% 100% (47)

RESUMEN

Principios Básicos para la Presentación de Tablas

• Títulos y encabezamiento claros y completamente definidos.


• Incluir las unidades en que se expresan las variables de medición.
• Incluir suficiente información para permitir chequear la validez de los cálculos o
argumentos.
• Incluir fuente de datos en caso necesario.

22
Unidad 1: Estadística Descriptiva

1.7. REPRESENTACIONES GRÁFICAS

Aún con una adecuada presentación de los datos en una tabla, algunas veces el lector
tiene dificultades para la interpretación de la información, especialmente a aquel que no está
familiarizado con la información cuantitativa. La presentación de la misma información
mediante un gráfico, a menudo, provee de considerable ayuda. Hay muchas clases de gráficos,
pero el conocimiento de algunos tipos generales, será suficiente en una primera etapa del
aprendizaje sobre este tema.

La elección del tipo de gráfico depende fundamentalmente de qué es lo que se pretende


mostrar con el mismo y del tipo de variables que se quiera representar, como así también de las
preferencias personales.

1.7.1. GRÁFICO CIRCULAR

Este tipo de gráfico es adecuado para

representar la distribución de frecuencia de una variable cualitativa,


particularmente cuando la variable es dicotómica y cuando se quiere mostrar
gráficamente la frecuencia de presentación de un evento cualquiera

Sin embargo, él no resulta muy claro cuando la variable tiene demasiadas categorías o
cuando la variable es ordinal pues no refleja la información del orden entre las categorías, y no
es recomendable para comparar dos o más distribuciones de frecuencias.

La Figura 1.3 muestra un gráfico circular para la variable “Necesidades Básicas


Insatisfechas”.

23
Unidad 1: Estadística Descriptiva

24
Unidad 1: Estadística Descriptiva

4. Las frecuencias absolutas como las relativas expresadas en porcentajes.

40% 37%
35% 32%

30%
Frecuencia

25% 22%
20%

15%

10%
5% 4%
5%

0%
Obrero Jefe Gerente de Gerente Directorio
planta regional
Cargos

Figura 1.4: Cargo del Personal de las Fábricas al 23 de Mayo de 1973. (N=1271)

Directorio 4%

Gerente regional 5%
Cargos

Gerente de
22%
planta

Jefe 32%

Obrero 37%

0% 10% 20% 30% 40%


Frecuencias

Figura 1.5: Personal de las Fábricas al 23 de Mayo de 1973. (N=1271)

5. El orden en que se presentará las categorías de las variables cualitativas dependerá si


ella es ordinal o nominal. Si la variable es de tipo ordinal se respetará el orden natural
de las categorías, pero si la variable es nominal se recomienda ordenar las categorías
en orden de frecuencia.

25
Unidad 1: Estadística Descriptiva

6. El nombre de la categoría no debe escribirse en los extremos de la barra ni dentro de


ella pues esto dificultaría la comparación.

7. Sin importar la posición de las barras (vertical u horizontal), el eje de las frecuencias
debe comenzar en cero, las razones de esta recomendación se verán más adelante.

1.7.3. GRÁFICO DE BARRAS AGRUPADAS

Este tipo de gráfico se usa especialmente en los:

Para mostrar la distribución conjunta de dos variables cualitativas y en algunos


casos cuantitativas discretas o continuas cuando el número de valores o
intervalos de clases considerado es pequeño (Figura 1.6).

En el ejemplo cuyos datos se muestran en la Figura 1.6 se puede observar que hay igual
cantidad de Gerentes de Planta hombres que Gerentes de Planta mujeres y que lo mismo ocurre
para la categoría Directorio; no así para las otras categorías.

Observaciones:

1. La suma de todas las frecuencias absolutas debe ser igual al numero total de datos si se
representa las frecuencias absolutas, o al 100% si las frecuencias se presentan en
porcentajes.

2. También se puede usar este gráfico cuando se quiere representar la distribución de


frecuencia de una variable en diferentes grupos, por ejemplo la distribución de la variable
“Cargos” para diferentes Niveles de Instrucción.

26
Unidad 1: Estadística Descriptiva

30% 27%
24%
25%

Frecuencias
20%

15%
10% 11%11%
10% 8%

5% 2% 3% 2% 2%
0%
Obrero Jefe Gerente de Gerente Directorio
planta regional
Cargos

Varones Mujeres

Figura 1.6: Frecuencia de personal de las Fábricas por Cargo y Sexo al 23


de Mayo de 1973.(N=1271)

Actividad 1.3:

1. Con los datos de la Tabla 1.6, 1.8, 1.10 construir un gráfico de barras agrupadas.

1.7.4. GRÁFICO DE BARRAS PROPORCIONALES

Este tipo de gráfico se usa principalmente para

mostrar la relación o asociación entre dos variables cualitativas y en algunos


casos cuantitativas discretas o continuas cuando el número de valores o
intervalos de clases considerado es pequeño (Figura 1.7).

Por ejemplo, para mostrar la relación entre “Nivel de instrucción” y “ Nivel


Económico”. (Tabla 1.12).

27
Unidad 1: Estadística Descriptiva

100%
12
80%

Fre c ue nc ia s
32
60%

40% 43

20%
15

0%
U n ive rs ita rio N o U n ive rs ita rio
Nive l de Ins tr uc c ión

Alto M e dio

Figura 1.7: Nivel Económico según Nivel de instrucción en una localidad


1995. (Valores hipotéticos)

Se puede observar en el gráfico que la proporción o frecuencia de personas con nivel de


ingreso alto es mayor en el grupo con nivel de instrucción universitario que en el de nivel de
instrucción no universitario. Esto hace sospechar que el nivel de instrucción tiene influencia en
el nivel de ingresos.

Observaciones:

1. La variable que debe representarse en el eje horizontal (Nivel de Instrucción) es aquella


que puede eventualmente producir un efecto sobre la otra (Nivel de Ingresos).

2. Si el número de categorías de la variable respuesta (Nivel de ingresos) es mayor de tres


es más adecuado usar un gráfico de barras agrupadas.

1.7.5. HISTOGRAMA

El histograma es particularmente adecuado para

representar una distribución de frecuencias de una variable cuantitativa continua.

28
Unidad 1: Estadística Descriptiva

Este es un diagrama donde los intervalos de clase se representan en el eje horizontal y


sobre ellos se grafican rectángulos adyacentes con áreas iguales o proporcionales a las
frecuencias de los intervalos de clase. Así, el área total de los rectángulos resulta igual N
(número total de observaciones) en caso de usar las frecuencias absolutas, y resulta igual al
100% cuando se usa las frecuencias relativas expresadas en porcentajes. La altura de cada
rectángulo se logra dividiendo la frecuencia del intervalo de clase por la longitud o amplitud de
dicho intervalo. Cabe destacar que si todos los intervalos de clase tienen la misma longitud,
entonces la altura de los rectángulos resultaría iguales o proporcionales a las frecuencias
observadas.

La Figura 1.8 muestra un histograma para la distribución de las notas de la Tabla 1.5. La
escala vertical muestra la frecuencia absoluta, es decir, el número de observaciones en cada
intervalo. En el eje horizontal se representó el punto medio de cada intervalo de clase. Al igual
que el gráfico de barras, también se puede representar la frecuencia en porcentajes sobre la
escala vertical.

16
14
12
No. alumnos

10
8
6
4
2
0
2 2.5 3.0 3.5 4.0 4.5 5.0 5.5
. . . . . . . .

Nota obtenida

Figura 1.8: Histograma de la distribución de frecuencia de la


Nota obtenida.

29
Unidad 1: Estadística Descriptiva

1.7.6. POLÍGONOS DE FRECUENCIAS

Al igual que el histograma, sirve para

representar la distribución de frecuencia de una variable cuantitativa continua


(Figura 1.9), pero es particularmente útil para comparar distribuciones, de este
tipo de variables, para dos o más grupos (Figura 1.10).

Este gráfico consiste en reemplazar los rectángulos por un polígono que une los puntos
medios de sus bordes superiores de esta manera las áreas de los distintos rectángulos se ve
compensada aproximadamente.

Cuando los grupos a comparar son de tamaño diferente, las frecuencias absolutas
deberán convertirse en frecuencias relativas porcentuales.

16

14

12

10
Frecuencia

0
2 3 4 5 6
Notas obtenidas

Figura 1.9: Distribución de frecuencia de las Notas Obtenidas.

30
Unidad 1: Estadística Descriptiva

25%
v ar o n es ( N = 5 2 6 )
m uje re s ( N = 3 0 2 )
20%

15%

10%

5%

0%
0 .5 1 .5 2 .5 3 .5 4 .5 6 .5 7 .5 8 .5 9 .5 1 0 .5 1 1 .5 1 2 .5 1 3 .5 1 4 .5

E dad

Figura 1.10: Distribución de “Edad” en varones y mujeres.(Datos


hipotéticos)

1.7.7. GRÁFICOS LINEALES

En la mayoría de los casos, estos gráficos se utilizan cuando

se quiere mostrar las variaciones que experimenta una variable con el transcurso
del tiempo o la edad.

En la Figura 1.11 se representan datos sobre el número de lactantes (menores de un año)


muertos y madres muertas en el período 1948-1978.

31
Unidad 1: Estadística Descriptiva

40

No.de muertos por 1000 nacidos vivos


35 Madres
Lact ant es
30

25

20

15

10

0
1948 1954 1958 1963 1969 1975 1978
Años

Figura 1.11: Número de lactantes muertos y madres muertas por cada


1000 nacidos vivos entre 1948 y 1978

La escala vertical representa el número de muertes por cada 1000 recién nacidos vivos y
la escala horizontal, los años cronológicos. En realidad, la finalidad del gráfico es mostrar las
variaciones absolutas de la variable en estudio (tasa de mortalidad) a través del tiempo.

1.7.8. GRÁFICOS DE CORRELACIÓN O DIAGRAMAS DE DISPERSIÓN

Tiene como objetivo

mostrar la correlación (grado de asociación) entre dos variables cuantitativas.

Por ejemplo, para mostrar la correlación entre “Presión Arterial” y “Peso” usando los
datos de la Tabla 14 se construye el diagrama de dispersión (Figura 1.12).

32
Unidad 1: Estadística Descriptiva

Tabla 14: Valores de Peso y Presión Arterial diastólica (datos hipotéticos)


Presión Arterial Sistólica Presión Arterial Sistólica
Peso (Kg) Peso (Kg)
(mmHg) (mmHg)
59 107 51 92
60 120 45 90
46 87 46 110
80 136 57 123
66 111 50 110
66 140 44 103
50 97 48 96
68 117 72 133
67 126 52 102

150

140
Presión Arterial diastóli ca (mm Hg)

130

120

110

100

90

80
40 50 60 70 80

Peso (Kg)

Figura 1.12: Correlación entre Peso y Presión Arterial


Sistólica (datos hipotéticos).

33
Unidad 1: Estadística Descriptiva

1.7.9. PRINCIPIOS BÁSICOS PARA LA CONSTRUCCIÓN DE GRÁFICOS

La representación gráfica a menudo provee una considerable ayuda, pero para ello se
aconseja que se cumplan ciertos principios básicos.

1. Simplicidad. El objetivo de los gráficos es hacer lo más claro posible la información dada
por los datos, y la simplicidad debe ser invariablemente el principio fundamental. El escritor
debe recordar siempre que él está familiarizado con los datos, entonces lo que es obvio para
él puede no serlo para el lector.

2. Fidelidad: El segundo punto que se debe tener en cuenta en la "construcción" y "lectura" de


los gráficos es respecto a que ellos deben reflejar lo más fielmente posible la realidad de lo
que se pretende mostrar.

Una de las causas más frecuente que llevan a un gráfico a distorsionar la realidad es la
elección de las escalas ya que los mismos valores numéricos pueden mostrarse de manera
muy diferentes a la vista del lector según la escala que se considere, fundamentalmente
cuando uno de los ejes representa frecuencias. Las Figuras 1.13 y 1.14 son un ejemplo de
esto. Ambos gráficos muestran los mismos datos, la tendencia de las tasas de mortalidad en
mujeres con cáncer de mama en Inglaterra y Gales entre 1951 y 1981.

En la Figura 1.13, el incremento en la tasa de mortalidad parece ser excesivamente rápido,


mientras que la Figura 1.14 sugiere un suave crecimiento de los mismos datos. Esta
diferencia es, por supuesto, debido a diferencias en la escala vertical, y fundamentalmente al
hecho de que en la Figura 1.13 la escala vertical no comienza en cero.

Por lo tanto, en la lectura de los gráficos de frecuencias, las escalas deben ser
cuidadosamente observadas.

También, en la construcción de los gráficos, se debe evitar una indebida amplitud o


exagerada compresión de las escalas. En cada caso siempre debe decidir cuando un cero
verdadero debería ser útil y cuando no. Por ejemplo, en la Figura 1.13, considerar el cero
sobre la escala horizontal no tiene sentido. La regla básica sería que se debería usar siempre
un cero excepto cuando se ha tomado una decisión consciente de que hay ventaja en no
usarlo, y que el gráfico no distorsionara la información presentada (Figura 1.12).

34
Unidad 1: Estadística Descriptiva

490

470

Tas a de m or tal idad 450

430

410

390

370

350
1951 1958 1964 1970 1976 1981

P e r íodo

Figura 1.13: Tasa de mortalidad por millón de cáncer de mama en


mujeres de Inglaterra 1951-81. Ejemplo de gráfico con error.

500

450

400

350
Tas a de mortalidad

300

250

200

150

100

50

0
1951 1958 1964 1970 1976 1981

P er íodo

Figura 1.14: Tasa de mortalidad por millón de cáncer de mama


en mujeres de Inglaterra 1951-81.

35
Unidad 1: Estadística Descriptiva

3. Representa una ayuda: Los gráficos deben ser, salvo en casos especiales, considerados
como una ayuda subsidiaria para la comprensión y no como la evidencia de una conclusión.
Dicha evidencia debe ser claramente sacada desde los correspondientes datos y su análisis.

Hay algunas situaciones en que no resulta necesario poner los datos estadísticos en detalle,
un gráfico puede ser suficiente, pero se debe pensar cuidadosamente si esto es aconsejable
en cada caso.

4. Debe responder al objetivo deseado: Por ejemplo, el problema de la escala, ilustrada en los
Figura 1.13 y 1.14, es también un factor importante en la comparación de tendencias o
velocidades de cambio. Así, la Figura 1.15 muestra la tendencia de la tasa de mortalidad
infantil (la tasa de mortalidad dentro del primer año de vida) y la tasa de mortalidad de 1 a 4
años en Inglaterra y Gales entre 1946 y 1981.

40

35 1 a 4 años
Infant il
30
Tasa de Mortalidad

25

20

15

10

0
1946 1951 1956 1961 1966 1971 1976 1981
Años

Figura 1.15: Mortalidad Infantil por 1000 y tasa de muerte de niños de 1 a 4


años por 1000 en Inglaterra de 1946-81.

A menos que la escala vertical sea cuidadosamente considerada, la inferencia que


podría sacarse desde este gráfico sería que, sobre este período la tasa de mortalidad infantil
cae mucho más rápidamente que la tasa de mortalidad en de 1 a 4 años. Sin embargo si se
considera la información numérica, se encuentra que en 1946 la tasa de mortalidad infantil
era 35 de cada 1000, y en 1981 de 13 de cada 1000, lo que representa una mejora (cambio
36
Unidad 1: Estadística Descriptiva

relativo) de un 63%, mientras que la tasa de mortalidad de niños de 1 a 4 años es de 70%


(Tabla 1.15).

Tabla 1.15: Tasas de mortalidad infantil y de niños de 1 a 4 años,


para 1946 y 1981 y sus cambios relativos.
Tasa de Mortalidad 1946 1981 Cambio relativo

Infantil 35‰ 1.8‰ 63%

En niños de 1 a 4 años 13‰ 0.53 70%

Para cualquier situación como ésta, donde el incremento o decrecimiento relativo es


más importante que el incremento o decrecimiento absoluto, se debería usar un gráfico en
papel con escala semilogarítmica (logaritmo en el eje vertical). Las mismas curvas de la
Figura 1.16 se muestran de nuevo en la Figura1.17 considerando una escala
semilogarítmica. Aquí las dos líneas son prácticamente paralelas, mostrando que hay poca
diferencia de declinación en las dos tasas relativas.

100

1 a 4 años
Infant il
Tasa de Mortali dad

10

0.1
1946 1951 1956 1961 1966 1971 1976 1981
Años

Figura 1.16: La información de la Figura 1.15 repetida sobre escala


logarítmica en el eje vertical.

37
Unidad 1: Estadística Descriptiva

En resumen, el lector debe tener en cuenta que una representación gráfica es


esencialmente un cuadro. Debe dibujarse de modo que resulte agradable a la vista. No se debe
intercalar más detalles que los necesarios para su fácil comprensión y debe seleccionarse el tipo
de diagrama que se adapte a la naturaleza específica del material que se desea presentar. El
siguiente cuadro sinóptico muestra los gráficos comúnmente utilizados para representar los
diferentes tipos de datos.

RESUMEN

Relación entre dos variables

Objetivo Naturaleza de la variable Tipo de diagrama


Circular
Cualitativa
Distribución de frecuencia Barras simples
una sola variable Histograma
Continua
Polígono de frecuencia
Cualitativa Barras agrupadas
Distribución de frecuencia
dos variables Histograma
Continua
Polígono de frecuencia
Barras agrupadas
Cualitativa
Barras proporcionales
Relación entre dos variables
Gráficos lineales
Continua
Diagrama de dispersión

38

También podría gustarte