Está en la página 1de 31

ESTUDIOS ESTADISTICOS

Y
RESUMEN DE LA INFORMACION

MG. ALCAIDE, ALEJANDRO JOSE

2018

1
PROLOGO
Con esta publicación se propone brindar a los alumnos que cursan la materia Estadística de esta
facultad y personas interesadas, conceptos necesarios para hacer un estudio estadístico, resumir un
conjunto de datos univariables y sus correspondientes gráficos, como así también las formas más
usuales de los mismos y su interpretación y análisis. Además se incluye cómo sintetizar un conjunto de
datos bivariantes para facilitar su análisis e interpretación. No incluye el otro objetivo que es determinar
si existe asociación entre las variables y su grado.

Espero haber cumplido con los objetivos propuestos, y que el alumno tenga un material
disponga de un material de utilidad.

Mi agradecimiento a la CPN Mónica Inés Huerta Mendoza de Labastida y al Mg. Víctor Eduardo
Juliano por sus aportes para poder realizar este trabajo

El autor

2
ESTUDIOS ESTADISTICOS

El objetivo de la estadística es recopilar y analizar datos para luego transformarlos en información,


constituyendo Estudios Estadísticos. Las etapas de los mismos son:

1) Especificación del problema: En esta etapa se define qué deseo investigar, de dónde
obtengo los datos (población), qué datos relevantes necesito (variables) y cómo se
presentarán los mismos.

2) Búsqueda y recolección de los datos: Una vez elegida la población y las variables a relevar,
el próximo paso es la recolección de los datos. A partir de ese momento los datos (conjunto de
datos) me servirán como información. Esta recopilación puede hacerla el propio investigador a
través de una encuesta (fuente primaria) o usar datos ya recolectados (fuente secundaria).
Con ese conjunto de datos se construirá una tabla denominada Matriz de Datos

3) Presentación de la información en forma tabular o gráfica: En este paso, la información


recolectada en el punto anterior será resumida para una mejor comprensión, claridad y análisis
en tablas denominadas Distribuciones de Frecuencias y gráficos.

4) Análisis de la información y conclusiones: En esta etapa, se usarán técnicas y métodos de


análisis que se enseñarán en el transcurso del curso.

La etapa que desarrollaremos es la Presentación de la Información, para ello definiré algunos


conceptos.

Población: Conjunto de personas, objetos o cosas definidos en un determinado espacio y tiempo.

Elemento unitario: Es cada una de las personas, objetos o cosas de la población.

Esa población tiene ciertas características, en el caso de las personas, por ejemplo, sexo, edad,
color de ojos, estatura, nivel de educación, número de hijos etc. En el caso de objetos y cosas, color,
material con que fue construido etc.

A esa característica la denominaremos variable, es decir:

Variable: Es una característica de la población cuyo valor o categoría varía de un elemento


unitario a otro.

Las variables pueden expresarse numéricamente (cuantitativas), por ejemplo edad, altura, número
de hijos, etc, ó cualitativamente (en categorías), por ejemplo sexo, nivel de educación, estado civil, color
de ojos etc.

Las categorías de las variables cualitativas surgen del hecho de observar.

Podemos clasificar a las variables cualitativas en:

a) Dicotómicas/ clasificación múltiple: La primera sólo admite dos categorías,


por ejemplo posee auto. La segunda, admite más de dos categorías.

3
b) Nominal/ ordinal: En la primera no hace falta ordenarla, por ejemplo, sexo,
estado civil. En la segunda, es necesario qué esté ordenado de menor a mayor, por ejemplo, nivel de
educación.

c) Natural/ arbitraria: En la primera, las categorías no las pone el investigador, por


ejemplo, sexo, nivel de educación, estado civil. En la segunda, las categorías las pone el investigador,
por ejemplo, estado de salud, clasificaciones de los ingresos.

Podemos clasificar las variables cuantitativas en:

a) Cuantitativas discretas o discontinuas: Sus valores surgen del hecho de


contar o enumerar, entre dos valores consecutivos no existen valores intermedios.

b) Cuantitativas continuas: Sus valores surgen del hecho de medir, entre dos
valores consecutivos existen infinitos valores intermedios. Este tipo de variable es continua
independientemente del instrumento de medición

La información se puede obtener relevando la totalidad de la misma, es decir de toda la población,


estamos realizando un Censo. Si la información relevada es sólo una parte de la totalidad o un
subconjunto de la misma, estamos realizando una muestra.

Una vez relevada, la información personal pierde importancia para la Estadística y hay que tener
en cuenta que existe una ley de secreto estadístico que prohíbe divulgar información personal.

La Estadística, analiza la información en su conjunto, no a nivel de elemento unitario.

A continuación, se analizará, como se resume la información para cada tipo de variable en una
distribución de frecuencias y sus respectivos gráficos.

Para ello, se tomará la información obtenida de los alumnos de la comisión Nº 1 de una materia en
la Facultad de Ciencias Económicas de la UNT (FaCE UNT) en el año 2002 que llamaremos matriz de
datos.

Matriz de datos de los alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias


Económicas de la UNT (FaCE UNT) en el año 2002.

Tabla Nº 1
Total Nivel de
Nº Materias Nivel de Educación del Año de Perma-
Edad Aplazos exámenes Sexo educación de
orden Aprobadas padre Ingreso nencia
rendidos la madre

1 20 4 1 5 Femenino Secundario Superior 2000 3


2 20 8 2 10 Femenino Superior Secundario 2000 3
3 24 5 0 5 Femenino primario Secundario 2000 3
4 28 7 2 9 Femenino primario primario 2000 3
5 19 6 3 9 Femenino Superior Superior 2001 2
6 20 7 1 8 Femenino Secundario Superior 2001 2
7 19 4 1 5 Masculino Primario Incompleto Secundario 2001 2
8 30 10 0 10 Masculino Superior Superior 2001 2
9 23 11 6 17 Masculino primario Superior 1997 6
10 22 7 4 11 Masculino Secundario Secundario 1999 4
11 21 8 6 14 Masculino Secundario Secundario 1999 4
12 23 4 5 9 Masculino Secundario Secundario 1999 4
13 19 7 3 10 Femenino Secundario Secundario 2001 2
14 19 9 1 10 Masculino Secundario Superior 2001 2

4
15 21 4 6 10 Masculino Superior Superior 1999 4
Total Nivel de
Nº Materias Nivel de Educación del AÑO Perma-
Edad Aplazos exámenes Sexo educación de
orden Aprobadas padre INGRESO nencia
rendidos la madre

16 22 9 5 14 Femenino Superior primario 1999 4


17 20 5 2 7 Masculino Superior Superior 2000 3
18 21 7 5 12 Masculino primario primario 1999 4
19 20 13 1 14 Femenino Secundario Superior 2000 3
20 21 10 2 12 Masculino Secundario Superior 2000 3
21 21 4 0 4 Femenino primario primario 2000 3
22 20 5 3 8 Femenino Secundario Secundario 2000 3
23 20 7 3 10 Femenino Superior Superior 2000 3
24 21 6 1 7 Femenino Secundario Superior 2000 3
25 19 4 1 5 Femenino primario Secundario 2001 2
26 21 3 2 5 Femenino primario primario 2000 3
27 21 5 5 10 Masculino Secundario Superior 1999 4
28 21 8 5 13 Masculino Superior Superior 2000 3
29 22 3 1 4 Masculino Secundario Secundario 2001 2
30 23 5 1 6 Masculino Secundario primario 1998 5
31 24 11 8 19 Masculino Secundario Secundario 1996 7
32 19 4 3 7 Masculino primario Superior 2001 2
33 20 3 3 6 Masculino Secundario Secundario 2001 2
34 22 8 6 14 Masculino Secundario Secundario 1999 4
35 21 4 1 5 Masculino Secundario Secundario 1999 4
36 20 3 2 5 Femenino Superior Superior 2000 3
37 32 5 4 9 Masculino Superior Secundario 1987 16
38 19 4 2 6 Masculino Secundario Superior 2001 2
39 21 10 7 17 Masculino Superior Superior 1999 4
40 26 7 10 17 Masculino Secundario Secundario 1994 9
41 23 3 2 5 Femenino Secundario Secundario 1998 5
42 30 12 4 16 Masculino Secundario Superior 1994 9
43 20 7 5 12 Femenino Primario Incompleto primario 1999 4
44 21 3 1 4 Femenino primario Secundario 2001 2
45 23 5 5 10 Femenino primario primario 1997 6
46 24 14 13 27 Femenino Secundario primario 1996 7
47 19 6 3 9 Femenino primario primario 2001 2
48 19 4 1 5 Femenino Secundario Superior 2001 2
49 30 7 3 10 Masculino primario primario 1995 8
50 22 3 2 5 Femenino primario Secundario 1998 5
51 28 4 1 5 Femenino Superior Secundario 1990 13
52 22 6 5 11 Femenino primario Superior 1998 5
53 22 6 5 11 Femenino Primario Incompleto primario 1998 5
54 19 6 0 6 Masculino Superior Superior 2001 2
55 19 4 3 7 Masculino Secundario Superior 2001 2
56 22 4 5 9 Femenino primario primario 2000 3
57 20 4 1 5 Masculino Secundario Secundario 2000 3
58 19 3 2 5 Masculino Superior primario 2000 3
59 21 4 4 8 Femenino Secundario Secundario 2000 3
60 19 5 1 6 Femenino Secundario Superior 2001 2
61 19 6 1 7 Femenino Secundario Secundario 2001 2
62 19 7 1 8 Masculino Superior Superior 2001 2
63 20 7 1 8 Masculino Secundario Superior 2001 2
64 19 6 2 8 Masculino Superior Superior 2001 2
65 19 5 2 7 Masculino Secundario Secundario 2001 2

5
66 33 15 7 22 Femenino Secundario Secundario 1987 16
Total Nivel de
Nº Materias Nivel de Educación del AÑO Perma-
Edad Aplazos exámenes Sexo educación de
orden Aprobadas padre INGRESO nencia
rendidos la madre

67 19 4 2 6 Femenino Superior Superior 2001 2

Antes de empezar a ver cada tipo de variable, analizaremos de la matriz de datos cada tipo de
variable:
Edad: Variable cuantitativa continua, su unidad de medida es en años.
Nº de materias aprobadas: Variable cuantitativa discreta, su unidad de medida es cantidad de
materias aprobadas
Nº de aplazos: Variable cuantitativa discreta, su unidad de medida es cantidad de aplazos.
Sexo: es una variable cualitativa nominal, dicotómica y natural.
Nivel de educación del padre y Nivel de educación de la madre: variables cualitativas ordinal,
clasificación múltiple y natural.

Con la información de la matriz de datos vamos a construir una distribución de frecuencias que
es una técnica para resumir información y me permite ver la variación de la misma.

DISTRIBUCION DE FRECUENCIAS DE UNA VARIABLE

VARIABLES CUALITATIVAS

La primera variable cualitativa que tomaremos es el sexo, cuyas categorías son Masculino y
Femenino.

La distribución de frecuencias es una tabla que lleva Título, Fuente y Notas tanto al título como al
pie de tabla

Cuadro Nº 1
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas de la UNT
(FaCE UNT) en el año 2002, clasificados por Sexo
Nº de Alumnos Frecuencias
Sexo (X)
f(x) %
Masculino 34 50,75
Femenino 33 49,25
Total general (N) 67 100,00
Fuente: Tabla Nº 1

Las frecuencias relativas (Frecuencias %), se obtienen de dividir cada frecuencia en el total N y se
multiplica por 100.

La interpretación de las frecuencias absolutas es: 34 alumnos son varones en la comisión Nº 1 de


una materia en la FaCE en 2002 y 33 son mujeres en la misma comisión. Si tenemos que interpretar la
frecuencia relativa, decimos que de cada 100 alumnos de la comisión Nº 1 de una materia de la FaCE en
2002, aproximadamente 51 son varones o el 50,75% de los alumnos son varones.

Para construir la columna de Frecuencias - f(x) - se cuenta la cantidad de elementos unitarios que
corresponden a la categoría Masculino y cuántos al Femenino.

6
Gráfico Nº 1

Alumnos de la comisión Nº 1de una materia en la


Facultad de Ciencias Económicas de la UNT (FaCE
UNT) en el año 2002,según Sexo

30

20

10

0
Masculino Femenino
.
Fuente: Cuadro Nº 1

El gráfico anterior es el Gráfico de Barras. En el mismo se grafican las variables cualitativas, tanto
en valores absolutos, como relativos. Sus características son:

1) No es un eje de coordenadas cartesiano.

2) Cada categoría se grafica con un rectángulo, cuyo tamaño de la base es arbitrario, pero debe
mantenerse para todas las categorías y su altura es la frecuencia, sean absolutas o relativas

3) La distancia entre categorías es arbitraria, pero debe respetarse para todas ellas.

Gráfico Nº 2

ALUMNOS DE LA COMISIÓN Nº 1 DE UNA MATERIA EN LA


FACULTAD DE CIENCIAS ECONÓMICAS DE LA UNT (FACE UNT)
EN EL AÑO 2002,SEGÚN SEXO

Femenino Masculino

Fuente: Cuadro Nº 1

El anterior es un Gráfico Circular. Se utiliza para variables cualitativas en términos relativos.


También se puede hacer un gráfico de torta o anillo

7
Si al gráfico circular hay que hacerlo en forma manual debe considerarse que la circunferencia
tiene 360º

Masculino 360* x 0,5075= 183º

Femenino 360 x 0,4925= 177º

Si la cantidad de categorías es mucha, no conviene hacer un gráfico circular.

A continuación, se analiza la variable Nivel de educación del padre

Cuadro Nº 2
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas de la UNT
(FaCE UNT) en el año 2002, según Nivel de educación del padre

Nº de
Nivel de Educación Frecuencias
alumnos
del padre (X) %
f(X)
Primario Incompleto 3 4,48
Primario 15 22,39
Secundario 32 47,76
Superior 17 25,37
Total general 67 100,00
Fuente: Tabla Nº 1

Hay tres alumnos de la comisión 1 de una materia de la FaCE 2002, cuyo padre tiene nivel de
educación “Primario Incompleto”, 15 alumnos cuyo padre tiene Nivel de educación “Primario”. El 4,48%
de los alumnos tiene su padre con Nivel de educación “Primario incompleto”, el 22,39% de los alumnos
tienen padres con Nivel de educación “Primario.

Gráfico Nº 3

Alumnos de la comisión Nº 1 de una materia en la Facultad de


Ciencias Económicas de la UNT (FaCE UNT) en el año
2002,según Nivel de educación del padre
35

30

25

20

15

10

0
Primario Incompleto Primario Secundario Superior

Fuente: Cuadro Nº 2

8
Gráfico Nº 4

ALUMNOS DE LA COMISIÓN Nº 1 DE UNA MATERIA EN LA


FACULTAD DE CIENCIAS ECONÓMICAS DE LA UNT (FACE UNT)
EN EL AÑO 2002,SEGÚN NIVEL DE EDUCACIÓN DEL PADRE
Primario
Incompleto

Superior
Primario

Secundario

Fuente: Cuadro Nº 2

VARIABLES CUANTITATIVAS DISCRETAS

Recuérdese que las variables cuantitativas discretas se expresan en números, sus valores surgen
del hecho de contar y entre dos valores consecutivos no existen valores intermedios.

En este tipo de variable, si la cantidad de valores de la variable no son muchos, se construye la


distribución de frecuencias con los valores de la misma, ordenados de menor a mayor y tomando como
frecuencia la cantidad de elementos unitarios que tiene cada valor de la variable.

Tomemos la variable Número de aplazos, su distribución de frecuencias es la siguiente:

Cuadro Nº 3
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas de la UNT
(FaCE UNT) en el año 2002, según número de aplazos

Nº de
Nº APLAZOS Frecuencias
alumnos
(X) %
f(x)
0 4 5,97
1 18 26,87
2 13 19,40
3 9 13,43
4 4 5,97
5 10 14,93
6 4 5,97
7 2 2,99
8 1 1,49
10 1 1,49
13 1 1,49

9
Total general 67 100,00
Fuente: Tabla Nº 1

La frecuencia absoluta se interpreta así: hay 4 alumnos de una materia de la FaCE en 2002 que
no tienen aplazos, hay 18 alumnos con 1 aplazo.

El gráfico para una variable discreta sin intervalos de clase es el de Bastones o Puntos. El mismo
es un eje de coordenadas cartesianas, en donde en el eje de las abscisas se representan los valores de
la variable y en el eje de las ordenadas la cantidad de elementos unitarios que corresponden a cada
valor de la variable. La intersección entre esos dos valores se representa con un punto (gráfico de
puntos) y luego se traza desde ese punto una línea recta en forma paralela al eje de las ordenadas
(gráfico de bastones)

Gráfico Nº 5

Alumnos de la comisión Nº 1de una materia en la Facultad de


Ciencias Económicas de la UNT (FaCE UNT) en el año 2002,
según Nº de Aplazos
20
18
16
Nº se Alumnos

14
12
10
8
6
4
2
0
0 2 4 6 8 10 12 14
Nº de Aplazos

Fuente: Cuadro Nº 3

Para graficar la frecuencia relativa, sólo debe modificarse la escala en el eje de las
ordenadas.

Cuando los valores de la variable son muchos, conviene resumir en una distribución de
frecuencias con intervalos de clase.

Para determinar la cantidad de clases podemos recurrir a las siguientes fórmulas:

1) La fórmula de Sturges

2) √

3) Elegir la cantidad de clases, las mismas no pueden ser menos de 5 y no más de 15

Para calcular donde empieza y donde termina es necesario determinar el rango o recorrido, que es
la diferencia entre el valor máximo observado de la variable y el mínimo valor observado de la variable.

Las características de los intervalos de clases son:

10
1) Mutuamente excluyentes: Un valor observado de la variable pertenece a un solo intervalo.
2) Exhaustivos: incluye todos los valores observados de la variable
3) Adyacentes: El segundo intervalo es consecutivo del primero, el tercer intervalo es
consecutivo del segundo y así sucesivamente.

Los componentes de una distribución de frecuencias de variables cuantitativas con intervalos de


clase son:
a) Límite inferior (Li) y límite superior (Ls), puede haber intervalos a los que les falte alguno de los
limites

b) Amplitud (A): en el caso de variables discretas es ; en el caso de las

variables continuas es . Las amplitudes entre los distintos intervalos pueden ser iguales o
desiguales.

c) Punto medio ( ) :

Tomaremos la variable número de materias aprobadas:

Obteniéndose el siguiente cuadro:

N 67
Mínimo 3
Máximo 15
Rango 12
Cantidad de clases 7
Amplitud 2

El total de la población (N) es 67, el valor mínimo de la variable es 3 y el máximo es 15, con un

rango de 12 (15-3). Aplicando la regla de Sturges o

sea entre 7 u 8 intervalos. Al dividir 12 en 7, para obtener la amplitud del intervalo, obtengo 1,71 o sea la
amplitud es igual a 2.

Se obtiene la siguiente distribución de frecuencias:

Cuadro Nº 4
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas en el año 2002,
según Nº de materias aprobadas
Punto Medio Nº de alumnos Frecuencias
Clases
(x) f(x) %
2a 3 2,5 8 11,94
4a 5 4,5 25 37,31
6a7 6,5 19 28,36
8a9 8,5 6 8,96
10 a 11 10,5 5 7,46
12 a 13 12,5 2 2,99
14 a 15 14,5 2 2,99
Total (N) 67 100,00
Fuente: Tabla Nº 1

11
En este caso, la amplitud para el primer intervalo es , el punto medio

para el mismo es y así sucesivamente para los otros intervalos.

Hay 8 alumnos que tuvieron 2 ó 3 aplazos, es la interpretación de una frecuencia absoluta. El


11,94% de los alumnos tienen 2 o 3 aplazos, es la interpretación de la frecuencia relativa.

Para graficar una variable discreta con intervalos de clase, debo modificar las clases disminuyendo
media unidad (0,5) los limites inferiores y aumentando media unidad (0,5) los superiores

La distribución de frecuencias para graficar será la siguiente:

Cuadro Nº 5
Clases Nº de Alumnos f(x)
0 a - de 1,5 0
1,5 a - de 3,5 8
3,5 a - de 5,5 25
5,5 a - de 7,5 19
7,5 a - de 9,5 6
9,5 a - de 11,5 5
11,5 a - de 13,5 2
13,5 a - de 15,5 2
Total (N) 67
Fuente: Cuadro Nº 4
Gráfico Nº 6

Alumnos de la comisión Nº 1de una materia en la Facultad de Ciencias Económicas de


la UNT en el año 2002, según Nº de Materias Aprobadas

30
25
Nº de Alumnos

20
15
10
5
0
0 a - de 1,5 1,5 a - de 3,5 3,5 a - de 5,5 5,5 a - de 7,5 7,5 a - de 9,5 9,5 a - de 11,5 11,5 a - de 13,5 13,5 a - de 15,5
Nº de Materias Aprobadas

Fuente: Cuadro Nº 5

El gráfico anterior se denomina Histograma, se grafica en un eje de coordenadas cartesiano, cada


clase se grafica con un rectángulo, cuya base es la amplitud de clase y la altura, la frecuencia absoluta o
relativa. En este tipo de variables, no se hace polígono de frecuencias, que veremos para las variables
cuantitativas continuas, ya que en las variables cuantitativas discretas entre dos valores consecutivos no
existen valores intermedios (no hay una continuidad)

VARIABLES CUANTITATIVAS CONTINUAS

Los valores de las variables cuantitativas continuas surgen del hecho de medir, es decir entre dos
valores consecutivos existen infinitos valores intermedios.

12
En este tipo de variable, las distribuciones de frecuencias se construyen con intervalos de clase.
Para explicar su construcción y la gráfica de la misma tomaremos la variable Edad.

Cuadro Nº 6
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas
en el año 2002, según Edad

Punto medio Nº de Alumnos Frecuencias


Clases
(x) f(x) %
18 a menos de 20 19 18 26,87
20 a menos de 22 21 25 37,31
22 a menos de 24 23 13 19,40
24 a menos de 26 25 3 4,48
26 a menos de 28 27 1 1,49
28 a menos de 30 29 2 2,99
30 a menos de 32 31 3 4,48
32 a menos de 34 33 2 2,99
Total (N) 67 100,00
Fuente: Tabla Nº 1

Gráfico Nº 7

Alumnos de la comisión Nº 1de una materia en la Facultad de Ciencias Económicas de


la UNT (FaCE UNT) en el año 2002,según Edad
30

25

20
Alumnos

15

10

0
16 a 18 a 20 a 22 a 24 a 26 a 28 a 30 a 32 a 34 a
menos menos menos menos menos menos menos menos menos menos
18 de 20 de 22 de 24 de 26 de 28 de 30 de 32 de 34 de 36
Edad

Fuente: Cuadro Nº 6

Este tipo de variables se grafican con un histograma, que ya fue tratado y/o un polígono de
frecuencia, que consiste en trazar líneas rectas desde el punto medio a la altura de frecuencia de cada
clase a la próxima. Para que el área del histograma sea igual al área del polígono de frecuencia es
necesario crear una clase anterior a la primera clase y una posterior a la última, ambas con frecuencia
cero.

A continuación, se presenta el grafico del polígono de frecuencias sin el histograma.

13
Gráfico Nº 8

Alumnos de la comisión Nº 1 de una materia en la Facultad de


Ciencias Económicas de la UNT (FaCE UNT) en el año 2002,
según Edad

30
25
Nº de Alumnos

20
15
10
5
0
10 15 20 25 30 35 40
Edad

Fuente: Cuadro Nº 6

CASOS ESPECIALES

DISTRIBUCIONES DE FRECUENCIAS CON INTERVALOS DE CLASES DESIGUALES

Cuadro Nº7
Consorcistas de un edificio en San Miguel de Tucumán en
2017, según edad

Amplitud
de cada Punto medio Frecuencia
Clases f(x)/h=2
intervalo (X) f(x)
(h)
2 20 a menos de 22 21 6 6
4 22 a menos de 26 24 10 5
8 26 a menos de 34 30 30 7,5
4 34 a menos de 38 36 14 7
6 38 a menos de 44 41 8 2,67
Total (N) 68
Fuente: Datos Hipotéticos

Para graficar una distribución de frecuencias con intervalos de clase desiguales, sea esta continua
o discreta es necesario reformular la frecuencia, proporcionando cada frecuencia en función de la
amplitud del intervalo más chico, en este caso h=2. Para ello, se divide la amplitud de cada intervalo en
la amplitud más chica y la frecuencia de esa clase se divide en el cociente obtenido.

14
Así para el primer intervalo: , en este caso, el primer intervalo conserva la misma

frecuencia; en el segundo intervalo: , y la frecuencia quedará ; para el tercer intervalo :

, y la frecuencia es y así sucesivamente. Luego con la frecuencia reformulada se

grafica.

Gráfico Nº 9

Fuente: Tabla Nº7

DISTRIBUCIONES DE FRECUENCIAS CON INTERVALOS DE CLASES ABIERTOS


Se utiliza clases abiertas, sea al principio o al final de los intervalos para evitar que haya clases
con frecuencia cero. Cabe aclarar que la cantidad de elementos unitarios que incluye la clase abierta
(frecuencia) deben ser pocos.
Cuadro Nº 8
Empleados de una fábrica en San Miguel de Tucumán en 2017, según
años de Antigüedad en la fábrica
Punto medio Nº de empleados f(x)
Clases
(x) f(x) %
0 a menos de 3 1,5 8 14,04
3 a menos de 6 4,5 14 24,56
6 a menos de 9 7,5 20 35,09
9 a menos de 12 10,5 10 17,54
12 a menos de 15 13,5 3 5,26
15 y más 2 3,51
Total 57 100,00
Nota: En la clase abierta hay 2 empleados, uno que tiene 30 años de
antigüedad y otro de 35 años de antigüedad
Fuente: Datos Hipotéticos

Gráfico Nº 10

15
Empleados de una fábrica en San Miguel de Tucumán en 2017, según años de
Antigüedad en la fábrica
25

20
Nº de empleados

15

10

0
0 a menos de 3 3 a menos de 6 6 a menos de 9 9 a menos de 12 12 a menos de
15
Antigüedad

Nota: En la clase abierta de hay 2 empleados uno que tiene 30 años de antigüedad y otro de 35
años de antigüedad
Fuente: Cuadro Nº 8

En el gráfico anterior se observa que la clase abierta se expresa con una flecha a la altura de la
frecuencia de la misma y una nota tanto en el cuadro de la distribución de frecuencias, como en el
gráfico indicando los valores de la variable de los elementos unitarios incluidos en la clase abierta

DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS – Variables Discretas

Cuadro Nº 9

Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas de la UNT


(FaCE UNT) en el año 2002, según Número de aplazos

Nº de Frecuencias Frecuencias
Nº APLAZOS Frecuencias
alumnos acumulada Acumuladas
(X) %
f(x) F(X) Relativa
0 4 5,97 4 5,97
1 18 26,87 22 32,84
2 13 19,40 35 52,24
3 9 13,43 44 65,67
4 4 5,97 48 71,64
5 10 14,93 58 86,57
6 4 5,97 62 92,54
7 2 2,99 64 95,52
8 1 1,49 65 97,01
10 1 1,49 66 98,51
13 1 1,49 67 100,00
Total 67 100,00
Fuente: Tabla Nº 1

Las frecuencias acumuladas absoluta (F(X)) se obtiene de sumar las frecuencias absolutas de
cada valor con las frecuencias absolutas acumuladas anteriores, por ejemplo, para el valor 0, es 4
porque no tengo acumuladas anteriores, para el valor 1 es (4+18=22), para el valor 2 es (22+13= 35) y
así sucesivamente.

16
Las frecuencias acumuladas relativas surgen de dividir las frecuencias absolutas acumuladas en el

total (N) y multiplicarla por 100. Por ejemplo , , y así

sucesivamente.

Con las frecuencias acumuladass absoluta F(X) o con las relativas, se realiza el gráfico
escalonado

Por ejemplo podemos decir que 22 alumnos obtuvieron un aplazo ó menos, o el 32,84% de los
alumnos obtuvo un aplazo ó menos. 44 alumnos obtuvieron 3 aplazos ó menos, o el 65,67% de los
alumnos obtuvo 3 aplazos ó menos y así sucesivamente.

Gráfico Nº 11

Grafico escalonado de los Alumnos de la comisión Nº 1 de la Facultad


de Ciencias Economicas de la UNT, según Nº de Aplazos
80
70
60
50
Alumnos

40
30
20
10
0
0 2 4 6 8 10 12 14
Nº de Aplazos

Fuente: Cuadro Nº 9

El gráfico escalonado también se lo puede hacer tomando frecuencias relativas en el eje de las
ordenadas.

17
DISTRIBUCIONES DE FRECUENCIAS ACUMIULADAS – Variables Continuas

Cuadro Nº 10

Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas


en el año 2002, según Edad

Nº de Frecuencias Frecuencias
Punto medio Frecuencias
Clases Alumnos Acumuladas Acumuladas
(x) %
f(x) F(X) relativas
18 a menos de 20 19 18 26,87 18 26,87
20 a menos de 22 21 25 37,31 43 64,18
22 a menos de 24 23 13 19,40 56 83,58
24 a menos de 26 25 3 4,48 59 88,06
26 a menos de 28 27 1 1,49 60 89,55
28 a menos de 30 29 2 2,99 62 92,54
30 a menos de 32 31 3 4,48 65 97,02
32 a menos de 34 33 2 2,99 67 100,00
Total (N) 67 100,00
Fuente: Tabla Nº 1

La manera de obtener las frecuencias acumuladas (F(X)), tanto absolutas como relativas es
exactamente igual a la explicada para la variable discreta.

El grafico que se obtiene se denomina Ojiva, éste se construye tomando los puntos medios de las
clases en el eje de las abscisas y la frecuencia acumulada absoluta correspondiente a ese punto medio
en el eje de las ordenadas y luego uniendo los puntos con líneas rectas.

Gráfico Nº 12

Ojiva de los Alumnos de la comisión 1 de la Facultad de Ciencias


Economicas de la UNT, segun Edad
80
70
60
50
Alumnos

40
30
20
10
0
15 20 25 30 35 40
Edad

Fuente: Cuadro Nº 10

18
También se lo puede hacer con las frecuencias acumuladas relativas, tomando en el eje de las
ordenadas las mismas y en el eje de las abscisas los puntos medios.
Por ejemplo 59 alumnos tienen 18 a menos de 26 años o el 88,06% de los alumnos tienen entre 18 a
menos de 26 años

FORMAS USUALES DE LAS DISTRIBUCIONES DE FRECUENCIAS

Las distribuciones de frecuencias pueden tener distintas formas teóricas, pero se destacan cuatro
de ellas:

1) Simétrica: en ella las mayor cantidad de elementos unitarios (mayor parte de las frecuencias) se
encuentran en los valores centrales de la variable y se distribuye de igual manera a ambos lados
de los valores centrales.

2) Asimétrica de derecha: En ella, la mayor parte de los elementos unitarios (mayor parte de las
frecuencias) se encuentran en los menores valores de la variable y la menor parte de los
elementos unitarios (menor parte de las frecuencias), en los mayores valores de la variable

3) Asimétrica de izquierda: En ella, la menor parte de los elementos unitarios (menor parte de las
frecuencias) se encuentran en los menores valores de la variable y la mayor parte de los
elementos unitarios (mayor parte de las frecuencias), en los mayores valores de la variable

4) Jota invertida: Caso extremo de asimetría de derecha

Formas Teóricas Usuales de las Distribuciones de Frecuencias

Gráfico Nº 13:

f(xi)

xi
Simétrica

19
Gráfico Nº 14:

f(xi)

x
Asimétrica de Derecha

Gráfico Nº 15:

f(xi)

xi
Asimétrica de Izquierda
Gráfico Nº 16:

f(x)

Jota Invertida

20
Ejemplos:
Simétrica
Cuadro Nº 11
Empleados de una fábrica de San Miguel de Tucumán en 2017, según su Altura

Clases X f(x)
1,55 a menos de 1.60 1,575 0
1,60 a menos de 1,65 1,625 2
1,65a menos de 1,70 1,675 10
1,70 a menos de 1,75 1,725 20
1,75 a menos de 1,80 1,775 50
1,80 a menos de 1,85 1,825 20
1,85 a menos de 1,90 1,875 10
1,90 a menos de 1,95 1,925 2
1,95 a menos de 2,00 1,975 0
Total (N) 114
Fuente: Datos hipotéticos

Gráfico Nº 17:

Empleados de una fábrica de San Miguel de Tucumán en 2017, según su altura


60
50
Empleados

40
30
20
10
0
1,55 a 1,60 a 1,65a 1,70 a 1,75 a 1,80 a 1,85 a 1,90 a 1,95 a
menos de menos de menos de menos de menos de menos de menos de menos de menos de
1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 2,00
Altura

Fuente: Cuadro Nº 11

Gráfico Nº 18:

Empleados de una fábrica de San Miguel de Tucumán en 2017, según su altura


60

50

40
Empleados

30

20

10

0
1,5 1,7 1,9 2,1
Altura

Fuente: Cuadro Nº 11

21
Interpretación en el contexto: La mayor parte de los empleados de una fábrica de San Miguel de
Tucumán en 2017 tiene una altura entre 1,75 a menos de 1,80 y se distribuye de igual manera alrededor
de esos valores.

Asimétrica de Derecha
Cuadro Nº 12
Empleados de una fábrica de San Miguel de Tucumán en 2017, según su Edad

Clases X f(x)
18 a menos de 20 19 0
20 a menos de 22 21 10
22 a menos de 24 23 25
24 a menos de 26 25 35
26 a menos de 28 27 15
28 a menos de 30 29 8
30 a menos de 32 31 2
32 a menos de 34 33 0
Total (N) 95
Fuente: Datos Hipotéticos

Gráfico Nº 19

Empleados de una fabrica en San Miguel de Tucumán en 2017, según


Edad
40
35
30
Empleados

25
20
15
10
5
0
18 a 20 a 22 a 24 a 26 a 28 a 30 a 32 a
menos menos menos menos menos menos menos menos
de 20 de 22 de 24 de 26 de 28 de 30 de 32 de 34
Edad

Fuente: Cuadro Nº 12
Gráfico Nº 20:

Empleados de una fabrica en San Miguel de Tucumán en 2017, según


Edad
40
35
30
Empleados

25
20
15
10
5
0
15 20 25 30 35
Edad

Fuente: Cuadro Nº 12

22
Interpretación: La mayor parte de los empleados de una fábrica de San Miguel de Tucumán en
2017 tienen las menores edades y la menor parte de los empleados tienen las mayores edades.

Asimétrica de Izquierda
Cuadro Nº 13
Empleados de una fábrica de San Miguel de Tucumán en 2017, según antigüedad en la empresa

Clases X f(x)
18 a menos de 20 19 0
20 a menos de 22 21 10
22 a menos de 24 23 25
24 a menos de 26 25 35
26 a menos de 28 27 15
28 a menos de 30 29 8
30 a menos de 32 31 2
32 a menos de 34 33 0
Total (N) 95
Fuente: Datos Hipotéticos

Gráfico Nº 21:

Empleados de una fábrica de San Miguel de Tucumán en 2017, según


antigüedad en la empresa
50
45
40
35
Empleados

30
25
20
15
10
5
0
0 a menos 2 a menos 4 a menos 6 a menos 8 a menos 10 a 12 a 14 a
de 2 de 4 de 6 de 8 de 10 menos de menos de menos de
12 14 16
Antigüedad en la empresa

Fuente: Cuadro Nº 13
Gráfico Nº 22:

Empleados de una fábrica de San Miguel de Tucumán en 2017, según


antigüedad en la empresa
50
45
40
35
Empleados

30
25
20
15
10
5
0
0 2 4 6 8 10 12 14 16
Antigüedad en la empresa

Fuente: Cuadro Nº 13

23
Interpretación: La mayor parte de los empleados de una fábrica de San Miguel de Tucumán en
2017 tienen los mayores años de antigüedad en la empresa y la menor cantidad de empleados tienen los
menores años de antigüedad en la empresa.

24
DISTRIBUCIONES DE FRECUENCIAS DE DOS VARIABLES

Supongamos una población P en la cual se estudiarán dos variables, que se simbolizan .

Dato apareado: Es un par de valores, categorías o ambas, que surgen de medir, contar u observar
simultáneamente en cada elemento unitario de la población y se simboliza .

A este conjunto de datos lo vamos a resumir en una tabla, que se denomina distribución de
frecuencia de dos variables como la siguiente:

Y
… …
X
… …

… …

… …

… …

… …

….. ……….. ……….. ……….. … ……….. ……….. … ……….. ………..

… …

… …

….. ……….. ……….. ……….. … ……….. ……….. … ……….. ………..

… …

… …
.
… N
.

La primera columna corresponde a (r) filas de la variable X, representa a las categorías (variable
cualitativa), valores de variable (variable discreta) o puntos medios o clases (variables cuantitativas
continuas) y se denomina “columna de encabezamiento de las filas”.

La primera fila corresponde a (s) columnas de la variable Y, representa a las categorías (variable
cualitativa), valores de variable (variable discreta) o puntos medios o clases (variable cuantitativa
continuas) y se denomina “fila de encabezamiento de las columnas”.

El cuerpo de la tabla (GRIS CLARO), está compuesto por celdas, en donde cada una de ellas
representa las frecuencias conjuntas.

Las frecuencias conjuntas son la cantidad de elementos unitarios que corresponden


simultáneamente a una determinada categoría, valor de variable o clase de X y de Y, o su punto medio.

En la última columna, cada celda representa la cantidad de elementos unitarios de cada categoría,
valor de variable o clase de la variable X.

En la última fila, cada celda representa la cantidad de elementos unitarios de cada categoría, valor
de variable o clase de la variable Y.

25
N: Total de la población

Para realizar la tabla siguiente, debe ordenarse de menor a mayor los datos apareados de
acuerdo a la variable X y contar la cantidad de elementos unitarios que corresponden a cada categoría,
valor de variable o clase de esa variable ( frecuencia marginal de X) y luego establecer qué cantidad de
elementos unitarios de esa frecuencia marginal de X, corresponden a cada categoría, valor de variable o
clase de la variable Y . Para obtener la frecuencia marginal de Y se suman las frecuencias por columna.

Cuadro Nº 14

Alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias Económicas de la UNT


en 2002, según años de Permanencia y Número de Aplazos

Permanencia Aplazos (Y) Total


(X) 0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13 f(x)
1 a menos de 3 13 10 0 0 0 0 0 23
3 a menos de 5 7 9 9 4 0 0 0 29
5 a menos de 7 1 2 3 1 0 0 0 7
7 a menos de 9 0 1 0 0 1 0 1 3
9 a menos de 11 0 0 1 0 0 1 0 2
11 y mas 1 0 1 1 0 0 0 3
Total f(Y) 22 22 14 6 1 1 1 67
Fuente: Tabla Nº 1

Las frecuencias que están dentro del recuadro se denominan Frecuencias Conjuntas, las
frecuencias que están en la última columna se denominan Frecuencias Marginales de X y las frecuencias
que están en la última fila se denominan Frecuencias Marginales de Y.

Interpretaciones

Frecuencia marginal de X: 23 alumnos de la comisión Nº 1 de una materia de la Facultad de


Ciencias Económicas de la UNT tienen 1 a menos de 3 años de permanencia.

Frecuencia marginal de Y: 22 alumnos de la comisión Nº 1 de una materia de la Facultad de


Ciencias Económicas de la UNT tienen 0 y 1 aplazos.

Frecuencia conjunta: 13 alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias


Económicas de la UNT tienen una permanencia de 1 a menos de 3 años y 0 y 1 aplazos.

Distribuciones que se pueden obtener de una tabla de doble entrada

Las distribuciones que se pueden obtener de una tabla de doble entrada son las siguientes:

1) Distribución marginal de X: se construye con la primera columna (categorías, valores de


variable y clases de la variable X) y la última columna.

26
Cuadro Nº 15

Alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias Económicas


de la UNT en 2002, según años de permanencia

Permanencia Alumnos
(X) f(X)
1 a menos de 3 23
3 a menos de 5 29
5 a menos de 7 7
7 a menos de 9 3
9 a menos de 11 2
11 y más 3
Total 67
Fuente: Cuadro Nº 1

2) Distribución marginal de Y: se construye con la primera fila (categorías, valores de variable y


clases de la variable Y) y la última fila.

Cuadro Nº 16

Alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias Económicas


de la UNT en 2002, según Número de aplazos

Aplazos Alumnos
(Y) f(Y )
0a1 22
2a3 22
4a5 14
6a7 6
8a9 1
10 a 11 1
12 a 13 1
Total 67
Fuente: Cuadro Nº 1

3) Distribuciones condicionales de X: Se toma la primera columna (columna del


encabezamiento de las filas) con cada una de las categorías, valores de la variable y clases de la
variable Y

27
Cuadro Nº 17

Alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias Económicas de la


UNT en 2002, según años de permanencia, dado que el Número de aplazos es 0 a 1

Permanencia
f(x)/ y=0 a 1
(X)

1 a menos de 3 13
3 a menos de 5 7
5 a menos de 7 1
7 a menos de 9 0
9 a menos de 11 0
11 y más 1
Total N(x/y=0 a 1) 22
Fuente: Cuadro Nº 1

Cuadro Nº 18

Alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias Económicas de la


UNT en 2002, según años de permanencia, dado que el Número de aplazos es 6 a 7

Permanencia
f(x)/ y=6 a 7
(X)
1 a menos de 3 0
3 a menos de 5 4
5 a menos de 7 1
7 a menos de 9 0
9 a menos de 11 0
11 y más 1
Total N(x/y=6 a 7) 6
Fuente: Cuadro Nº 1

En este caso hay 7 distribuciones condicionales de X

4) Distribuciones condicionales de Y: Se toma la primera fila (fila del encabezamiento de las


columnas) con cada una de las categorías, valores de la variable y clases de la variable X

Cuadro Nº 19

Alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias Económicas de la UNT en 2002,


según Número de aplazos, dado que los años de permanencia es 1 a menos de 3

Aplazos
f(Y)/ x=1 a menos de 3
(Y)
0a1 13
2a3 10
4a5 0
6a7 0
8a9 0
10 a 11 0
12 a 13 0
Total N(x/y=1 a menos de 3) 23
Fuente: Cuadro Nº 1

28
Cuadro Nº 20

Alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias Económicas de la UNT en


2002, según Número de aplazos, dado que los años de permanencia es 5 a menos de 7

Aplazos
f(Y)/ x=5 a menos de 7
(Y)
0a1 1
2a3 2
4a5 3
6a7 1
8a9 0
10 a 11 0
12 a 13 0
Total N(x/y=5 a menos de 7 7
Fuente: Cuadro Nº 1

En este caso hay 6 distribuciones condicionales de Y

5) Distribución conjunta: Se toma la primera fila (fila del encabezamiento de las columnas) y la
primera columna (columna del encabezamiento de las filas) y la parte del cuadro que corresponde a la
frecuencia conjunta, es decir cada una de las categorías, valores de la variable y clases de la variable X
e Y con el cuerpo de la tabla excluidas las marginales.

Cuadro Nº 21

Alumnos de la comisión Nº 1 de una materia de la Facultad de Ciencias Económicas de la UNT


en 2002, según los años de permanencia y el Número de aplazos

Aplazos (Y)
Permanencia (X)
0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13
1 a menos de 3 13 10 0 0 0 0 0
3 a menos de 5 7 9 9 4 0 0 0
5 a menos de 7 1 2 3 1 0 0 0
7 a menos de 9 0 1 0 0 1 0 1
9 a menos de 11 0 0 1 0 0 1 0
11 y mas 1 0 1 1 0 0 0
Fuente: Cuadro Nº 1

Porcentajes Verticales, Horizontales y Conjuntos

Porcentajes verticales: Consiste en relativizar las distribuciones condicionales de X con respecto


a cada subtotal y la distribución marginal de X con respecto al total

Cuadro Nº 22
Aplazos (Y)
Permanencia (X) Total f(x)
0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13
1 a menos de 3 59,09 45,45 0,00 0,00 0,00 0,00 0,00 34,33
3 a menos de 5 31,82 40,91 64,29 66,67 0,00 0,00 0,00 43,28
5 a menos de 7 4,55 9,09 21,43 16,67 0,00 0,00 0,00 10,45
7 a menos de 9 0,00 4,55 0,00 0,00 100,00 0,00 100,00 4,48
9 a menos de 11 0,00 0,00 7,14 0,00 0,00 100,00 0,00 2,99
11 y más 4,55 0,00 7,14 16,67 0,00 0,00 0,00 4,48
Total f(y) 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00
Fuente: Cuadro Nº 1

29
Porcentajes horizontales: Consiste en relativizar las distribuciones condicionales de Y con
respecto a cada subtotal y la distribución marginal de Y con respecto al total

Cuadro Nº 23
Aplazos (Y)
Permanencia (X) Total f(x)
0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13
1 a menos de 3 56,52 43,48 0,00 0,00 0,00 0,00 0,00 100,00
3 a menos de 5 24,14 31,03 31,03 13,79 0,00 0,00 0,00 100,00
5 a menos de 7 14,29 28,57 42,86 14,29 0,00 0,00 0,00 100,00
7 a menos de 9 0,00 33,33 0,00 0,00 33,33 0,00 33,33 100,00
9 a menos de 11 0,00 0,00 50,00 0,00 0,00 50,00 0,00 100,00
11 y más 33,33 0,00 33,33 33,33 0,00 0,00 0,00 100,00
Total f(y) 32,84 32,84 20,90 8,96 1,49 1,49 1,49 100,00
Fuente: Cuadro Nº 1

Porcentajes conjuntos: Consiste en relativizar las frecuencias conjuntas y marginales con


respecto al total (N).

Cuadro Nº 24
Aplazos (Y)
Permanencia (X) Total f(x)
0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13
1 a menos de 3 19,40 14,93 0,00 0,00 0,00 0,00 0,00 34,33
3 a menos de 5 10,45 13,43 13,43 5,97 0,00 0,00 0,00 43,28
5 a menos de 7 1,49 2,99 4,48 1,49 0,00 0,00 0,00 10,45
7 a menos de 9 0,00 1,49 0,00 0,00 1,49 0,00 1,49 4,48
9 a menos de 11 0,00 0,00 1,49 0,00 0,00 1,49 0,00 2,99
11 y más 1,49 0,00 1,49 1,49 0,00 0,00 0,00 4,48
Total f(y) 32,84 32,84 20,90 8,96 1,49 1,49 1,49 100,00
Fuente: Cuadro Nº 1

30
Bibliografía

ANDERSON, David R., SWEENE, Denis J. y WILLIAMS, Thomas A. “Estadística para Administración
y Economía”, 10ª Edición, CENGAGE Learning.

BERENSON, Mark L y LEVINE, David, “Estadística básica en Administración. Conceptos y


aplicaciones”, 6ª edición, Prentice Hall, México.

CROXTON, Frederick E. y COWDEN, Dudley J.; Estadística General Aplicada. México. Fondo de
Cultura Económica.1968.

MILLS, Frederick Cecil; Métodos Estadísticos Aplicados a la Economía y a los Negocios. Madrid.
Aguilar.1961.

NETER, Jhon, WASSERMAN, Williams y WHITMORE, Fundamentos de Estadística para Negocios y


Economía, CECSA, México

YAÑEZ, Daniel Enrique, Nota Nº 4/76, “Distribuciones de frecuencias”, Cátedra de Estadística, Fac. de
Cs. Económicas UNT, 2010

YA LUN CHOU, “Análisis estadístico”, Interamericana, México, 1972

YULE, G. Udny y KENDALL, Maurice G.; Introducción a la Estadística Matemática. Madrid.


Aguilar.1961.

31

También podría gustarte