Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudios Estadisticos Y Resumen de La Informacion
Estudios Estadisticos Y Resumen de La Informacion
Y
RESUMEN DE LA INFORMACION
2018
1
PROLOGO
Con esta publicación se propone brindar a los alumnos que cursan la materia Estadística de esta
facultad y personas interesadas, conceptos necesarios para hacer un estudio estadístico, resumir un
conjunto de datos univariables y sus correspondientes gráficos, como así también las formas más
usuales de los mismos y su interpretación y análisis. Además se incluye cómo sintetizar un conjunto de
datos bivariantes para facilitar su análisis e interpretación. No incluye el otro objetivo que es determinar
si existe asociación entre las variables y su grado.
Espero haber cumplido con los objetivos propuestos, y que el alumno tenga un material
disponga de un material de utilidad.
Mi agradecimiento a la CPN Mónica Inés Huerta Mendoza de Labastida y al Mg. Víctor Eduardo
Juliano por sus aportes para poder realizar este trabajo
El autor
2
ESTUDIOS ESTADISTICOS
1) Especificación del problema: En esta etapa se define qué deseo investigar, de dónde
obtengo los datos (población), qué datos relevantes necesito (variables) y cómo se
presentarán los mismos.
2) Búsqueda y recolección de los datos: Una vez elegida la población y las variables a relevar,
el próximo paso es la recolección de los datos. A partir de ese momento los datos (conjunto de
datos) me servirán como información. Esta recopilación puede hacerla el propio investigador a
través de una encuesta (fuente primaria) o usar datos ya recolectados (fuente secundaria).
Con ese conjunto de datos se construirá una tabla denominada Matriz de Datos
Esa población tiene ciertas características, en el caso de las personas, por ejemplo, sexo, edad,
color de ojos, estatura, nivel de educación, número de hijos etc. En el caso de objetos y cosas, color,
material con que fue construido etc.
Las variables pueden expresarse numéricamente (cuantitativas), por ejemplo edad, altura, número
de hijos, etc, ó cualitativamente (en categorías), por ejemplo sexo, nivel de educación, estado civil, color
de ojos etc.
3
b) Nominal/ ordinal: En la primera no hace falta ordenarla, por ejemplo, sexo,
estado civil. En la segunda, es necesario qué esté ordenado de menor a mayor, por ejemplo, nivel de
educación.
b) Cuantitativas continuas: Sus valores surgen del hecho de medir, entre dos
valores consecutivos existen infinitos valores intermedios. Este tipo de variable es continua
independientemente del instrumento de medición
Una vez relevada, la información personal pierde importancia para la Estadística y hay que tener
en cuenta que existe una ley de secreto estadístico que prohíbe divulgar información personal.
A continuación, se analizará, como se resume la información para cada tipo de variable en una
distribución de frecuencias y sus respectivos gráficos.
Para ello, se tomará la información obtenida de los alumnos de la comisión Nº 1 de una materia en
la Facultad de Ciencias Económicas de la UNT (FaCE UNT) en el año 2002 que llamaremos matriz de
datos.
Tabla Nº 1
Total Nivel de
Nº Materias Nivel de Educación del Año de Perma-
Edad Aplazos exámenes Sexo educación de
orden Aprobadas padre Ingreso nencia
rendidos la madre
4
15 21 4 6 10 Masculino Superior Superior 1999 4
Total Nivel de
Nº Materias Nivel de Educación del AÑO Perma-
Edad Aplazos exámenes Sexo educación de
orden Aprobadas padre INGRESO nencia
rendidos la madre
5
66 33 15 7 22 Femenino Secundario Secundario 1987 16
Total Nivel de
Nº Materias Nivel de Educación del AÑO Perma-
Edad Aplazos exámenes Sexo educación de
orden Aprobadas padre INGRESO nencia
rendidos la madre
Antes de empezar a ver cada tipo de variable, analizaremos de la matriz de datos cada tipo de
variable:
Edad: Variable cuantitativa continua, su unidad de medida es en años.
Nº de materias aprobadas: Variable cuantitativa discreta, su unidad de medida es cantidad de
materias aprobadas
Nº de aplazos: Variable cuantitativa discreta, su unidad de medida es cantidad de aplazos.
Sexo: es una variable cualitativa nominal, dicotómica y natural.
Nivel de educación del padre y Nivel de educación de la madre: variables cualitativas ordinal,
clasificación múltiple y natural.
Con la información de la matriz de datos vamos a construir una distribución de frecuencias que
es una técnica para resumir información y me permite ver la variación de la misma.
VARIABLES CUALITATIVAS
La primera variable cualitativa que tomaremos es el sexo, cuyas categorías son Masculino y
Femenino.
La distribución de frecuencias es una tabla que lleva Título, Fuente y Notas tanto al título como al
pie de tabla
Cuadro Nº 1
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas de la UNT
(FaCE UNT) en el año 2002, clasificados por Sexo
Nº de Alumnos Frecuencias
Sexo (X)
f(x) %
Masculino 34 50,75
Femenino 33 49,25
Total general (N) 67 100,00
Fuente: Tabla Nº 1
Las frecuencias relativas (Frecuencias %), se obtienen de dividir cada frecuencia en el total N y se
multiplica por 100.
Para construir la columna de Frecuencias - f(x) - se cuenta la cantidad de elementos unitarios que
corresponden a la categoría Masculino y cuántos al Femenino.
6
Gráfico Nº 1
30
20
10
0
Masculino Femenino
.
Fuente: Cuadro Nº 1
El gráfico anterior es el Gráfico de Barras. En el mismo se grafican las variables cualitativas, tanto
en valores absolutos, como relativos. Sus características son:
2) Cada categoría se grafica con un rectángulo, cuyo tamaño de la base es arbitrario, pero debe
mantenerse para todas las categorías y su altura es la frecuencia, sean absolutas o relativas
3) La distancia entre categorías es arbitraria, pero debe respetarse para todas ellas.
Gráfico Nº 2
Femenino Masculino
Fuente: Cuadro Nº 1
7
Si al gráfico circular hay que hacerlo en forma manual debe considerarse que la circunferencia
tiene 360º
Cuadro Nº 2
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas de la UNT
(FaCE UNT) en el año 2002, según Nivel de educación del padre
Nº de
Nivel de Educación Frecuencias
alumnos
del padre (X) %
f(X)
Primario Incompleto 3 4,48
Primario 15 22,39
Secundario 32 47,76
Superior 17 25,37
Total general 67 100,00
Fuente: Tabla Nº 1
Hay tres alumnos de la comisión 1 de una materia de la FaCE 2002, cuyo padre tiene nivel de
educación “Primario Incompleto”, 15 alumnos cuyo padre tiene Nivel de educación “Primario”. El 4,48%
de los alumnos tiene su padre con Nivel de educación “Primario incompleto”, el 22,39% de los alumnos
tienen padres con Nivel de educación “Primario.
Gráfico Nº 3
30
25
20
15
10
0
Primario Incompleto Primario Secundario Superior
Fuente: Cuadro Nº 2
8
Gráfico Nº 4
Superior
Primario
Secundario
Fuente: Cuadro Nº 2
Recuérdese que las variables cuantitativas discretas se expresan en números, sus valores surgen
del hecho de contar y entre dos valores consecutivos no existen valores intermedios.
Cuadro Nº 3
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas de la UNT
(FaCE UNT) en el año 2002, según número de aplazos
Nº de
Nº APLAZOS Frecuencias
alumnos
(X) %
f(x)
0 4 5,97
1 18 26,87
2 13 19,40
3 9 13,43
4 4 5,97
5 10 14,93
6 4 5,97
7 2 2,99
8 1 1,49
10 1 1,49
13 1 1,49
9
Total general 67 100,00
Fuente: Tabla Nº 1
La frecuencia absoluta se interpreta así: hay 4 alumnos de una materia de la FaCE en 2002 que
no tienen aplazos, hay 18 alumnos con 1 aplazo.
El gráfico para una variable discreta sin intervalos de clase es el de Bastones o Puntos. El mismo
es un eje de coordenadas cartesianas, en donde en el eje de las abscisas se representan los valores de
la variable y en el eje de las ordenadas la cantidad de elementos unitarios que corresponden a cada
valor de la variable. La intersección entre esos dos valores se representa con un punto (gráfico de
puntos) y luego se traza desde ese punto una línea recta en forma paralela al eje de las ordenadas
(gráfico de bastones)
Gráfico Nº 5
14
12
10
8
6
4
2
0
0 2 4 6 8 10 12 14
Nº de Aplazos
Fuente: Cuadro Nº 3
Para graficar la frecuencia relativa, sólo debe modificarse la escala en el eje de las
ordenadas.
Cuando los valores de la variable son muchos, conviene resumir en una distribución de
frecuencias con intervalos de clase.
1) La fórmula de Sturges
2) √
Para calcular donde empieza y donde termina es necesario determinar el rango o recorrido, que es
la diferencia entre el valor máximo observado de la variable y el mínimo valor observado de la variable.
10
1) Mutuamente excluyentes: Un valor observado de la variable pertenece a un solo intervalo.
2) Exhaustivos: incluye todos los valores observados de la variable
3) Adyacentes: El segundo intervalo es consecutivo del primero, el tercer intervalo es
consecutivo del segundo y así sucesivamente.
variables continuas es . Las amplitudes entre los distintos intervalos pueden ser iguales o
desiguales.
c) Punto medio ( ) :
N 67
Mínimo 3
Máximo 15
Rango 12
Cantidad de clases 7
Amplitud 2
El total de la población (N) es 67, el valor mínimo de la variable es 3 y el máximo es 15, con un
sea entre 7 u 8 intervalos. Al dividir 12 en 7, para obtener la amplitud del intervalo, obtengo 1,71 o sea la
amplitud es igual a 2.
Cuadro Nº 4
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas en el año 2002,
según Nº de materias aprobadas
Punto Medio Nº de alumnos Frecuencias
Clases
(x) f(x) %
2a 3 2,5 8 11,94
4a 5 4,5 25 37,31
6a7 6,5 19 28,36
8a9 8,5 6 8,96
10 a 11 10,5 5 7,46
12 a 13 12,5 2 2,99
14 a 15 14,5 2 2,99
Total (N) 67 100,00
Fuente: Tabla Nº 1
11
En este caso, la amplitud para el primer intervalo es , el punto medio
Para graficar una variable discreta con intervalos de clase, debo modificar las clases disminuyendo
media unidad (0,5) los limites inferiores y aumentando media unidad (0,5) los superiores
Cuadro Nº 5
Clases Nº de Alumnos f(x)
0 a - de 1,5 0
1,5 a - de 3,5 8
3,5 a - de 5,5 25
5,5 a - de 7,5 19
7,5 a - de 9,5 6
9,5 a - de 11,5 5
11,5 a - de 13,5 2
13,5 a - de 15,5 2
Total (N) 67
Fuente: Cuadro Nº 4
Gráfico Nº 6
30
25
Nº de Alumnos
20
15
10
5
0
0 a - de 1,5 1,5 a - de 3,5 3,5 a - de 5,5 5,5 a - de 7,5 7,5 a - de 9,5 9,5 a - de 11,5 11,5 a - de 13,5 13,5 a - de 15,5
Nº de Materias Aprobadas
Fuente: Cuadro Nº 5
Los valores de las variables cuantitativas continuas surgen del hecho de medir, es decir entre dos
valores consecutivos existen infinitos valores intermedios.
12
En este tipo de variable, las distribuciones de frecuencias se construyen con intervalos de clase.
Para explicar su construcción y la gráfica de la misma tomaremos la variable Edad.
Cuadro Nº 6
Alumnos de la comisión Nº 1 de una materia en la Facultad de Ciencias Económicas
en el año 2002, según Edad
Gráfico Nº 7
25
20
Alumnos
15
10
0
16 a 18 a 20 a 22 a 24 a 26 a 28 a 30 a 32 a 34 a
menos menos menos menos menos menos menos menos menos menos
18 de 20 de 22 de 24 de 26 de 28 de 30 de 32 de 34 de 36
Edad
Fuente: Cuadro Nº 6
Este tipo de variables se grafican con un histograma, que ya fue tratado y/o un polígono de
frecuencia, que consiste en trazar líneas rectas desde el punto medio a la altura de frecuencia de cada
clase a la próxima. Para que el área del histograma sea igual al área del polígono de frecuencia es
necesario crear una clase anterior a la primera clase y una posterior a la última, ambas con frecuencia
cero.
13
Gráfico Nº 8
30
25
Nº de Alumnos
20
15
10
5
0
10 15 20 25 30 35 40
Edad
Fuente: Cuadro Nº 6
CASOS ESPECIALES
Cuadro Nº7
Consorcistas de un edificio en San Miguel de Tucumán en
2017, según edad
Amplitud
de cada Punto medio Frecuencia
Clases f(x)/h=2
intervalo (X) f(x)
(h)
2 20 a menos de 22 21 6 6
4 22 a menos de 26 24 10 5
8 26 a menos de 34 30 30 7,5
4 34 a menos de 38 36 14 7
6 38 a menos de 44 41 8 2,67
Total (N) 68
Fuente: Datos Hipotéticos
Para graficar una distribución de frecuencias con intervalos de clase desiguales, sea esta continua
o discreta es necesario reformular la frecuencia, proporcionando cada frecuencia en función de la
amplitud del intervalo más chico, en este caso h=2. Para ello, se divide la amplitud de cada intervalo en
la amplitud más chica y la frecuencia de esa clase se divide en el cociente obtenido.
14
Así para el primer intervalo: , en este caso, el primer intervalo conserva la misma
grafica.
Gráfico Nº 9
Gráfico Nº 10
15
Empleados de una fábrica en San Miguel de Tucumán en 2017, según años de
Antigüedad en la fábrica
25
20
Nº de empleados
15
10
0
0 a menos de 3 3 a menos de 6 6 a menos de 9 9 a menos de 12 12 a menos de
15
Antigüedad
Nota: En la clase abierta de hay 2 empleados uno que tiene 30 años de antigüedad y otro de 35
años de antigüedad
Fuente: Cuadro Nº 8
En el gráfico anterior se observa que la clase abierta se expresa con una flecha a la altura de la
frecuencia de la misma y una nota tanto en el cuadro de la distribución de frecuencias, como en el
gráfico indicando los valores de la variable de los elementos unitarios incluidos en la clase abierta
Cuadro Nº 9
Nº de Frecuencias Frecuencias
Nº APLAZOS Frecuencias
alumnos acumulada Acumuladas
(X) %
f(x) F(X) Relativa
0 4 5,97 4 5,97
1 18 26,87 22 32,84
2 13 19,40 35 52,24
3 9 13,43 44 65,67
4 4 5,97 48 71,64
5 10 14,93 58 86,57
6 4 5,97 62 92,54
7 2 2,99 64 95,52
8 1 1,49 65 97,01
10 1 1,49 66 98,51
13 1 1,49 67 100,00
Total 67 100,00
Fuente: Tabla Nº 1
Las frecuencias acumuladas absoluta (F(X)) se obtiene de sumar las frecuencias absolutas de
cada valor con las frecuencias absolutas acumuladas anteriores, por ejemplo, para el valor 0, es 4
porque no tengo acumuladas anteriores, para el valor 1 es (4+18=22), para el valor 2 es (22+13= 35) y
así sucesivamente.
16
Las frecuencias acumuladas relativas surgen de dividir las frecuencias absolutas acumuladas en el
sucesivamente.
Con las frecuencias acumuladass absoluta F(X) o con las relativas, se realiza el gráfico
escalonado
Por ejemplo podemos decir que 22 alumnos obtuvieron un aplazo ó menos, o el 32,84% de los
alumnos obtuvo un aplazo ó menos. 44 alumnos obtuvieron 3 aplazos ó menos, o el 65,67% de los
alumnos obtuvo 3 aplazos ó menos y así sucesivamente.
Gráfico Nº 11
40
30
20
10
0
0 2 4 6 8 10 12 14
Nº de Aplazos
Fuente: Cuadro Nº 9
El gráfico escalonado también se lo puede hacer tomando frecuencias relativas en el eje de las
ordenadas.
17
DISTRIBUCIONES DE FRECUENCIAS ACUMIULADAS – Variables Continuas
Cuadro Nº 10
Nº de Frecuencias Frecuencias
Punto medio Frecuencias
Clases Alumnos Acumuladas Acumuladas
(x) %
f(x) F(X) relativas
18 a menos de 20 19 18 26,87 18 26,87
20 a menos de 22 21 25 37,31 43 64,18
22 a menos de 24 23 13 19,40 56 83,58
24 a menos de 26 25 3 4,48 59 88,06
26 a menos de 28 27 1 1,49 60 89,55
28 a menos de 30 29 2 2,99 62 92,54
30 a menos de 32 31 3 4,48 65 97,02
32 a menos de 34 33 2 2,99 67 100,00
Total (N) 67 100,00
Fuente: Tabla Nº 1
La manera de obtener las frecuencias acumuladas (F(X)), tanto absolutas como relativas es
exactamente igual a la explicada para la variable discreta.
El grafico que se obtiene se denomina Ojiva, éste se construye tomando los puntos medios de las
clases en el eje de las abscisas y la frecuencia acumulada absoluta correspondiente a ese punto medio
en el eje de las ordenadas y luego uniendo los puntos con líneas rectas.
Gráfico Nº 12
40
30
20
10
0
15 20 25 30 35 40
Edad
Fuente: Cuadro Nº 10
18
También se lo puede hacer con las frecuencias acumuladas relativas, tomando en el eje de las
ordenadas las mismas y en el eje de las abscisas los puntos medios.
Por ejemplo 59 alumnos tienen 18 a menos de 26 años o el 88,06% de los alumnos tienen entre 18 a
menos de 26 años
Las distribuciones de frecuencias pueden tener distintas formas teóricas, pero se destacan cuatro
de ellas:
1) Simétrica: en ella las mayor cantidad de elementos unitarios (mayor parte de las frecuencias) se
encuentran en los valores centrales de la variable y se distribuye de igual manera a ambos lados
de los valores centrales.
2) Asimétrica de derecha: En ella, la mayor parte de los elementos unitarios (mayor parte de las
frecuencias) se encuentran en los menores valores de la variable y la menor parte de los
elementos unitarios (menor parte de las frecuencias), en los mayores valores de la variable
3) Asimétrica de izquierda: En ella, la menor parte de los elementos unitarios (menor parte de las
frecuencias) se encuentran en los menores valores de la variable y la mayor parte de los
elementos unitarios (mayor parte de las frecuencias), en los mayores valores de la variable
Gráfico Nº 13:
f(xi)
xi
Simétrica
19
Gráfico Nº 14:
f(xi)
x
Asimétrica de Derecha
Gráfico Nº 15:
f(xi)
xi
Asimétrica de Izquierda
Gráfico Nº 16:
f(x)
Jota Invertida
20
Ejemplos:
Simétrica
Cuadro Nº 11
Empleados de una fábrica de San Miguel de Tucumán en 2017, según su Altura
Clases X f(x)
1,55 a menos de 1.60 1,575 0
1,60 a menos de 1,65 1,625 2
1,65a menos de 1,70 1,675 10
1,70 a menos de 1,75 1,725 20
1,75 a menos de 1,80 1,775 50
1,80 a menos de 1,85 1,825 20
1,85 a menos de 1,90 1,875 10
1,90 a menos de 1,95 1,925 2
1,95 a menos de 2,00 1,975 0
Total (N) 114
Fuente: Datos hipotéticos
Gráfico Nº 17:
40
30
20
10
0
1,55 a 1,60 a 1,65a 1,70 a 1,75 a 1,80 a 1,85 a 1,90 a 1,95 a
menos de menos de menos de menos de menos de menos de menos de menos de menos de
1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 2,00
Altura
Fuente: Cuadro Nº 11
Gráfico Nº 18:
50
40
Empleados
30
20
10
0
1,5 1,7 1,9 2,1
Altura
Fuente: Cuadro Nº 11
21
Interpretación en el contexto: La mayor parte de los empleados de una fábrica de San Miguel de
Tucumán en 2017 tiene una altura entre 1,75 a menos de 1,80 y se distribuye de igual manera alrededor
de esos valores.
Asimétrica de Derecha
Cuadro Nº 12
Empleados de una fábrica de San Miguel de Tucumán en 2017, según su Edad
Clases X f(x)
18 a menos de 20 19 0
20 a menos de 22 21 10
22 a menos de 24 23 25
24 a menos de 26 25 35
26 a menos de 28 27 15
28 a menos de 30 29 8
30 a menos de 32 31 2
32 a menos de 34 33 0
Total (N) 95
Fuente: Datos Hipotéticos
Gráfico Nº 19
25
20
15
10
5
0
18 a 20 a 22 a 24 a 26 a 28 a 30 a 32 a
menos menos menos menos menos menos menos menos
de 20 de 22 de 24 de 26 de 28 de 30 de 32 de 34
Edad
Fuente: Cuadro Nº 12
Gráfico Nº 20:
25
20
15
10
5
0
15 20 25 30 35
Edad
Fuente: Cuadro Nº 12
22
Interpretación: La mayor parte de los empleados de una fábrica de San Miguel de Tucumán en
2017 tienen las menores edades y la menor parte de los empleados tienen las mayores edades.
Asimétrica de Izquierda
Cuadro Nº 13
Empleados de una fábrica de San Miguel de Tucumán en 2017, según antigüedad en la empresa
Clases X f(x)
18 a menos de 20 19 0
20 a menos de 22 21 10
22 a menos de 24 23 25
24 a menos de 26 25 35
26 a menos de 28 27 15
28 a menos de 30 29 8
30 a menos de 32 31 2
32 a menos de 34 33 0
Total (N) 95
Fuente: Datos Hipotéticos
Gráfico Nº 21:
30
25
20
15
10
5
0
0 a menos 2 a menos 4 a menos 6 a menos 8 a menos 10 a 12 a 14 a
de 2 de 4 de 6 de 8 de 10 menos de menos de menos de
12 14 16
Antigüedad en la empresa
Fuente: Cuadro Nº 13
Gráfico Nº 22:
30
25
20
15
10
5
0
0 2 4 6 8 10 12 14 16
Antigüedad en la empresa
Fuente: Cuadro Nº 13
23
Interpretación: La mayor parte de los empleados de una fábrica de San Miguel de Tucumán en
2017 tienen los mayores años de antigüedad en la empresa y la menor cantidad de empleados tienen los
menores años de antigüedad en la empresa.
24
DISTRIBUCIONES DE FRECUENCIAS DE DOS VARIABLES
Dato apareado: Es un par de valores, categorías o ambas, que surgen de medir, contar u observar
simultáneamente en cada elemento unitario de la población y se simboliza .
A este conjunto de datos lo vamos a resumir en una tabla, que se denomina distribución de
frecuencia de dos variables como la siguiente:
Y
… …
X
… …
… …
… …
… …
… …
… …
… …
… …
… …
.
… N
.
La primera columna corresponde a (r) filas de la variable X, representa a las categorías (variable
cualitativa), valores de variable (variable discreta) o puntos medios o clases (variables cuantitativas
continuas) y se denomina “columna de encabezamiento de las filas”.
La primera fila corresponde a (s) columnas de la variable Y, representa a las categorías (variable
cualitativa), valores de variable (variable discreta) o puntos medios o clases (variable cuantitativa
continuas) y se denomina “fila de encabezamiento de las columnas”.
El cuerpo de la tabla (GRIS CLARO), está compuesto por celdas, en donde cada una de ellas
representa las frecuencias conjuntas.
En la última columna, cada celda representa la cantidad de elementos unitarios de cada categoría,
valor de variable o clase de la variable X.
En la última fila, cada celda representa la cantidad de elementos unitarios de cada categoría, valor
de variable o clase de la variable Y.
25
N: Total de la población
Para realizar la tabla siguiente, debe ordenarse de menor a mayor los datos apareados de
acuerdo a la variable X y contar la cantidad de elementos unitarios que corresponden a cada categoría,
valor de variable o clase de esa variable ( frecuencia marginal de X) y luego establecer qué cantidad de
elementos unitarios de esa frecuencia marginal de X, corresponden a cada categoría, valor de variable o
clase de la variable Y . Para obtener la frecuencia marginal de Y se suman las frecuencias por columna.
Cuadro Nº 14
Las frecuencias que están dentro del recuadro se denominan Frecuencias Conjuntas, las
frecuencias que están en la última columna se denominan Frecuencias Marginales de X y las frecuencias
que están en la última fila se denominan Frecuencias Marginales de Y.
Interpretaciones
Las distribuciones que se pueden obtener de una tabla de doble entrada son las siguientes:
26
Cuadro Nº 15
Permanencia Alumnos
(X) f(X)
1 a menos de 3 23
3 a menos de 5 29
5 a menos de 7 7
7 a menos de 9 3
9 a menos de 11 2
11 y más 3
Total 67
Fuente: Cuadro Nº 1
Cuadro Nº 16
Aplazos Alumnos
(Y) f(Y )
0a1 22
2a3 22
4a5 14
6a7 6
8a9 1
10 a 11 1
12 a 13 1
Total 67
Fuente: Cuadro Nº 1
27
Cuadro Nº 17
Permanencia
f(x)/ y=0 a 1
(X)
1 a menos de 3 13
3 a menos de 5 7
5 a menos de 7 1
7 a menos de 9 0
9 a menos de 11 0
11 y más 1
Total N(x/y=0 a 1) 22
Fuente: Cuadro Nº 1
Cuadro Nº 18
Permanencia
f(x)/ y=6 a 7
(X)
1 a menos de 3 0
3 a menos de 5 4
5 a menos de 7 1
7 a menos de 9 0
9 a menos de 11 0
11 y más 1
Total N(x/y=6 a 7) 6
Fuente: Cuadro Nº 1
Cuadro Nº 19
Aplazos
f(Y)/ x=1 a menos de 3
(Y)
0a1 13
2a3 10
4a5 0
6a7 0
8a9 0
10 a 11 0
12 a 13 0
Total N(x/y=1 a menos de 3) 23
Fuente: Cuadro Nº 1
28
Cuadro Nº 20
Aplazos
f(Y)/ x=5 a menos de 7
(Y)
0a1 1
2a3 2
4a5 3
6a7 1
8a9 0
10 a 11 0
12 a 13 0
Total N(x/y=5 a menos de 7 7
Fuente: Cuadro Nº 1
5) Distribución conjunta: Se toma la primera fila (fila del encabezamiento de las columnas) y la
primera columna (columna del encabezamiento de las filas) y la parte del cuadro que corresponde a la
frecuencia conjunta, es decir cada una de las categorías, valores de la variable y clases de la variable X
e Y con el cuerpo de la tabla excluidas las marginales.
Cuadro Nº 21
Aplazos (Y)
Permanencia (X)
0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13
1 a menos de 3 13 10 0 0 0 0 0
3 a menos de 5 7 9 9 4 0 0 0
5 a menos de 7 1 2 3 1 0 0 0
7 a menos de 9 0 1 0 0 1 0 1
9 a menos de 11 0 0 1 0 0 1 0
11 y mas 1 0 1 1 0 0 0
Fuente: Cuadro Nº 1
Cuadro Nº 22
Aplazos (Y)
Permanencia (X) Total f(x)
0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13
1 a menos de 3 59,09 45,45 0,00 0,00 0,00 0,00 0,00 34,33
3 a menos de 5 31,82 40,91 64,29 66,67 0,00 0,00 0,00 43,28
5 a menos de 7 4,55 9,09 21,43 16,67 0,00 0,00 0,00 10,45
7 a menos de 9 0,00 4,55 0,00 0,00 100,00 0,00 100,00 4,48
9 a menos de 11 0,00 0,00 7,14 0,00 0,00 100,00 0,00 2,99
11 y más 4,55 0,00 7,14 16,67 0,00 0,00 0,00 4,48
Total f(y) 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00
Fuente: Cuadro Nº 1
29
Porcentajes horizontales: Consiste en relativizar las distribuciones condicionales de Y con
respecto a cada subtotal y la distribución marginal de Y con respecto al total
Cuadro Nº 23
Aplazos (Y)
Permanencia (X) Total f(x)
0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13
1 a menos de 3 56,52 43,48 0,00 0,00 0,00 0,00 0,00 100,00
3 a menos de 5 24,14 31,03 31,03 13,79 0,00 0,00 0,00 100,00
5 a menos de 7 14,29 28,57 42,86 14,29 0,00 0,00 0,00 100,00
7 a menos de 9 0,00 33,33 0,00 0,00 33,33 0,00 33,33 100,00
9 a menos de 11 0,00 0,00 50,00 0,00 0,00 50,00 0,00 100,00
11 y más 33,33 0,00 33,33 33,33 0,00 0,00 0,00 100,00
Total f(y) 32,84 32,84 20,90 8,96 1,49 1,49 1,49 100,00
Fuente: Cuadro Nº 1
Cuadro Nº 24
Aplazos (Y)
Permanencia (X) Total f(x)
0a1 2a3 4a5 6a7 8a9 10 a 11 12 a 13
1 a menos de 3 19,40 14,93 0,00 0,00 0,00 0,00 0,00 34,33
3 a menos de 5 10,45 13,43 13,43 5,97 0,00 0,00 0,00 43,28
5 a menos de 7 1,49 2,99 4,48 1,49 0,00 0,00 0,00 10,45
7 a menos de 9 0,00 1,49 0,00 0,00 1,49 0,00 1,49 4,48
9 a menos de 11 0,00 0,00 1,49 0,00 0,00 1,49 0,00 2,99
11 y más 1,49 0,00 1,49 1,49 0,00 0,00 0,00 4,48
Total f(y) 32,84 32,84 20,90 8,96 1,49 1,49 1,49 100,00
Fuente: Cuadro Nº 1
30
Bibliografía
ANDERSON, David R., SWEENE, Denis J. y WILLIAMS, Thomas A. “Estadística para Administración
y Economía”, 10ª Edición, CENGAGE Learning.
CROXTON, Frederick E. y COWDEN, Dudley J.; Estadística General Aplicada. México. Fondo de
Cultura Económica.1968.
MILLS, Frederick Cecil; Métodos Estadísticos Aplicados a la Economía y a los Negocios. Madrid.
Aguilar.1961.
YAÑEZ, Daniel Enrique, Nota Nº 4/76, “Distribuciones de frecuencias”, Cátedra de Estadística, Fac. de
Cs. Económicas UNT, 2010
31