Está en la página 1de 8

ESTADÍSTICA APLICADA A LA EDUCACIÓN

1. LAS VARIABLES Y SU NIVEL DE MEDICIÓN

¿Podemos comparar personas? La respuesta es no, por el contrario lo que sí pueden compararse son características
claramente definidas de las personas. Del mismo modo no se pueden comparar escuelas, ni hogares, ni países si no se
especifica en qué aspecto se realiza la comparación. O dicho de otro modo, cuál es la característica que se compara,
y cómo se mide esa característica.
Podemos decir que una persona tiene más escolarización formal que otra, indicando con eso que ha aprobado más años
de la escuela o de la universidad. Podemos decir que un hogar es diferente a otro si uno se compone de una pareja sola
y el otro incluye tres hijos. Un país puede tener más habitantes, un régimen político diferente, o mayor libertad de
expresión que otro. En todos los casos especificamos una característica, un rasgo sobre la base del cual hacemos la
comparación.
Vamos a introducir ahora dos definiciones para los elementos que hemos mencionado hasta aquí.
En primer lugar, veamos que los entes cuyos aspectos se comparan pueden ser diferentes: personas, hogares, países,
escuelas, etc. Esas entidades se llaman unidades de análisis (a menudo indicadas UA). Son los elementos entre los
que se compara alguna cualidad, son los sujetos o individuos, de manera general.
Ejemplo
Reconocer las unidades de análisis en cada ítem.
i. En la escuelas-urbano periféricas hay más alumnos que repiten curso que en las urbanas.
ii. Las personas de menores recursos acceden menos frecuentemente a la educación superior.
iii. En los países más pobres, es menor la proporción de personas que acceden a la educación superior.

En segundo lugar, hay algo que se compara: la inteligencia, la composición del hogar, el régimen político, el número de
habitantes. Estas características de las unidades de análisis que se someten a comparación, se denominan variables,
que son los aspectos de los individuos que se someten a comparación; su cualidad central es la que le da nombre: la de
variar.
Cada vez que se haga referencia a una variable, debe conocerse cuál es la unidad de análisis a la que se refiere, si no
resulta claro, se debe indicar. Es diferente afirmar que un país es rico que decir que sus habitantes lo son.
Ejemplo
Dar posibles variables para cada uno de los ítems.
i. Edad:
ii. Régimen político:
iii. Tiempo para reconocer la imagen:

En tercer lugar, hemos dicho que las variables asumen valores para cada unidad de análisis, esos valores a menudo se
denominan categorías.
Ejemplo
Hallar la categoría para cada uno de los ítems.
i. Sexo:
ii. Nivel de escolaridad alcanzado:
iii. Edad:

Hay dos propiedades que debemos asegurar que cumplan las categorías que construyamos. La primera se llama
exclusión mutua, es decir que cada categoría excluya a todas las demás. Dicho de otra manera, si a un individuo le
corresponde una categoría, entonces sabemos que no le corresponde ninguna otra.
Ejemplo
Si analizamos hogares y a cada persona le preguntamos por su parentesco, sin indicar con quién, tendremos una
categorización defectuosa, porque …..

JAMES SANCHEZ PEREZ 1


ESTADÍSTICA APLICADA A LA EDUCACIÓN

Ejemplo
Al analizar los tipos de lectura preferida, nos equivocaríamos si categorizáramos como de ficción, de misterio,
policiales, románticas, biográficas, de aventuras porque…
Ejemplo
Cuando se clasifica las escuelas como céntricas, parroquiales, urbanas, rurales.

Resulta muy importante que, una vez definida la variable, se verifique que sus categorías sean mutuamente
excluyentes, porque de lo contrario, cuando se observa, no queda claro cómo hacer la clasificación y diferentes
observadores clasificarán de manera distinta el mismo hecho.

El segundo requisito que solicitaremos a las categorías de una variable es que agoten todas las posibilidades de
variación, es decir, que todos los valores posibles estén contemplados. Esta cualidad se llama exhaustividad.
Ejemplo
Si evaluamos la variable situación conyugal y ofrecemos como categorías: casado, soltero, divorciado, viudo.
Ejemplo
Cuando la variable es edad.

1.1. EL USO DE SÍMBOLOS NUMÉRICOS

Como hemos visto, las categorías pueden tener diferente naturaleza: algunas se expresan con números (como la edad)
y otras con palabras (como el tipo de hogar); sin embargo es muy común representar con números a las categorías,
aun cuando lo que se observe no sea numérico.
Tabla 1: Ejemplo de diferentes categorizaciones para la variable
Máximo nivel de educación formal alcanzado
Máximo nivel de educación formal Máximo nivel de educación
alcanzado formal alcanzado
ninguno ninguno
primario incompleto primario incompleto
primario completo primario completo
secundario incompleto secundario incompleto
secundario completo secundario completo
terciario o universitario incompleto terciario incompleto
terciario o universitario completo terciario completo
postgrado universitario incompleto
universitario completo
postgrado
Así, en la primera categorización de la variable de la tabla 1, podemos codificar las categorías de la siguiente manera:
Tabla 2: Codificación numérica de las
categorías de la variable Máximo nivel de
educación formal alcanzado
Máximo nivel de educación formal
Código
alcanzado
1 ninguno
2 primario incompleto
3 primario completo
4 secundario incompleto
5 secundario completo
6 terciario o universitario incompleto
7 terciario o universitario completo
8 postgrado
Ejemplo
Codificar numéricamente la variable: sexo.

JAMES SANCHEZ PEREZ 2


ESTADÍSTICA APLICADA A LA EDUCACIÓN

Ejemplo
Codificar numéricamente la variable: opinión sobre una propuesta de cambio de clase.

1.2. VARIABLES Y MEDICIÓN

El nivel de medición de una variable está determinado por el significado que tengan los símbolos numéricos que se
asignan a las categorías.

Trataremos el ejemplo anterior al enumerar las categorías del 1 al 8; habría habido otras opciones, por ejemplo usar
sólo números pares o números impares u otra secuencia arbitraria, pero hay algo importante que cualquier que
cualquier secuencia que elijamos deberá respetar: las categorías de la variable siguen un orden y los números deben
reflejarlo; no habría sido correcto usar números que no vayan aumentando, como lo hacen los niveles de educación.

Así entonces, podríamos decir que hay grados diferentes en la libertad que tenemos para asignar los números a las
categorías.

1.3. NIVELES DE MEDICIÓN

Según la mayor o menor arbitrariedad que exista en la relación que liga los números a las categorías, hablaremos de
niveles de medición. Una forma diferente de decirlo es que, según cuánta restricción haya en la asignación de los
números a las categorías, será el nivel de medición de las variables. Si los números se asignan de manera totalmente
arbitraria, el nivel de medición se llamará nominal (como en la variable sexo); si los números deben respetar el orden
de las categorías (como en la educación), el nivel de la variable se llama ordinal. Por ahora, nos detenemos en estos
dos niveles.
Una variable está medida a nivel intervalar cuando las distancias entre las categorías son proporcionales.
Una variable está medida a nivel proporcional cuando sus valores respetan relaciones de proporcionalidad y, en
consecuencia, el cero tiene un valor absoluto.

1.4. ALGUNOS ELEMENTOS TEÓRICOS DE LA DISCUSIÓN SOBRE MEDICIÓN

En función de lo expuesto, estamos en condiciones de referir brevemente algunos debates clásicos sobre este tema.
Según Galtung (1968) todo dato hace referencia a una estructura constituida por tres elementos: unidad de análisis,
variable y valor; así cualquier dato aislado sería: “una unidad de análisis que en una variable específica presentará un
determinado valor”. Esto significa que estos tres elementos deben ser considerados conjuntamente para sostener
una proposición empírica. Así un sistema tiene diferentes propiedades que pueden ser observadas y aportarán
diferentes datos; por ejemplo en el campo de la Psicología, un sistema sería la personalidad de los sujetos observados
(unidades de análisis), pero según el aspecto observado tendremos distintas propiedades (variables) derivadas del
mismo sistema y que nos permitirían distintos tipos de medición; a cada sujeto le corresponderá una categoría de cada
una de esas variables (valor).

ACTIVIDAD PRÁCTICA 1

Considere las variables:

Edad, Cantidad de materias aprobadas, Promedio a lo largo de la carrera, Método anticonceptivo usado, Carrera que
cursa

Y las siguientes, con sus categorías respectivas:

JAMES SANCHEZ PEREZ 3


ESTADÍSTICA APLICADA A LA EDUCACIÓN

Puntaje en la escala de Depresión


inteligencia de Wechsler (Escala de Beck)
130 o más Normal
120 - 129 Ligero trnastorno emocional
110 - 119 Depresión clínica borderline
90 - 109 Depresión moderada
80 - 89 Depresión grave
70 - 79
50 - 69
49 - 30

Titulo máximo alcanzado por


docentes de una Facultad

Doctorado
Maestría
Licenciatura
Tecnicatura
Aunque no hay valores numéricos, es posible decidir el nivel de medición de cada variable si se tienen en cuenta las
propiedades que cumplen las categorías. Por ejemplo, género admite como categorías varón y mujer, que solo se
distinguen entre ellas y no pueden ordenarse. Por lo tanto, género es una variable nominal.
1. Indique el nivel de medición de cada una de las variables mencionadas.
2. Identifique los juicios válidos en las variables.
1 2 1<2 3-1=4-2 1 = 1/2 * 2
Edad
Cantidad de materias aprobadas
Método anticonceptivo usado
Promedio a lo largo de la carrera
Carreraque cursa
Nivel de depresión
Título máximo de los docentes
Puntaje en la escala de inteligencia de Wechsler
3. Defina categorías para las siguientes variables e indique el nivel de medición de cada una:
Cantidad de materias rendidas desde que ingresó a la carrera.
Síntomas somáticos propios de la amistad.
Razones para la consulta a un hospital neuropsiquiátrico.
Actitud hacia la participación política.
Concepto que los docentes tienen de los alumnos.

JAMES SANCHEZ PEREZ 4


ESTADÍSTICA APLICADA A LA EDUCACIÓN

2. LA ORGANIZACIÓN DE LOS DATOS

2.1. DE LA INFORMACIÓN EN BRUTO A LA MATRIZ DE DATOS

El primer paso en la descripción de un conjunto de datos es el de organizar la información recogida con la construcción
de la llamada matriz de datos. Supongamos que hemos administrado una encuesta a 150 personas y que el siguiente es
un fragmento del cuestionario usado.
CUESTIONARIO Nº: …………………………………………
1 Masculino 1 soltero
Sexo Actualmente casado o
2 Femenino 2
usted unido
es: separado o
3
divorciado
Edad ……….. años 4 viudo
1 trabajó
buscó
2
¿Qué hizo durante la mayor parte del trabajo
tiempo la semana pasada? 3 estudió
4 realizó otra actividad

¿Cuáles fueron los ingresos de su hogar el mes pasado? …………soles


¿Cuántas personas habitan esta vivienda? ......personas

Una vez completados los cuestionarios, la información está “en bruto” y es necesario ordenarla para poder tener una
visión de conjunto. Eso se logra organizando los datos recogidos en la matriz de datos que tiene, para el fragmento
de cuestionario mostrado, la siguiente forma
actividad
ingresos personas
estado la
Orden sexo edad del en la
civil semana
hogar vivienda
anterior
1 1 25 1 3 2500 2
2 1 30 1 2 1650 3
3 2 21 2 2 720 1
4 2 57 2 3 3280 2
5 2 40 1 4 2700 2
………….
150 2 43 3 1 2000 4

Si tenemos datos, y queremos agruparlos en la tabla de frecuencias, seguiremos los siguientes pasos en forma manual:
a) Contamos la cantidad de datos (n).
b) Hallamos el número de intervalos con la regla de Sturges = 1+3.3log(n), donde n es el número de datos.
c) Encontramos el mínimo dato (xmin)
d) Encontramos el máximo dato (xmax)
e) Hallamos el rango = xmax - xmin
f) Hallamos la amplitud del intervalo.
g) Con lo anterior construimos la tabla de frecuencia.

JAMES SANCHEZ PEREZ 5


ESTADÍSTICA APLICADA A LA EDUCACIÓN

MARCA
FREC. FREC. ABS. FREC. FREC.RELAT. FREC.REL FREC.RELAT.ACUM
DE
N° INTERVALOS Li Ls ABSOLUTA ACUM RELATIVA ACUM PORCENTUAL PORCENTUAL
CLASE
ni Ni hi Hi hi% Hi%
Xi
h) En la primera columna enumeramos la cantidad de intervalos en forma correlativa.
i) En la segunda columna construimos cada intervalo semiabierto por la izquierda, empezando con el primer extremo
del intervalo igual al mínimo dato (Li) y el otro extremo del intervalo la suma del mínimo dato con la amplitud (Ls).
El segundo intervalo empieza con el extremo derecho del primer intervalo y el otro extremo del segundo intervalo
es la suma del extremo izquierdo más la amplitud, y así sucesivamente.
j) La marca de clase = (Li + Ls)/2
k) La frecuencia absoluta es la cantidad de datos que están en el respectivo intervalo.
l) La frecuencia relativa está dada por el cociente entre la respectiva cantidad de datos y el total de datos.
m) La frecuencia relativa porcentual está dada por la multiplicación de la frecuencia relativa por cien.

2.2. PRESENTACIÓN DE MANERA GRÁFICA LOS RESULTADOS

2.2.1. GRÁFICO DE BARRAS

Es adecuado cuando se trata de variables nominales, normalmente con pocas categorías.

2.2.2. DIAGRAMA DE SECTORES CIRCULARES (O “DE TORTA”)

También es adecuado cuando se trata de variables nominales, normalmente con pocas categorías.

2.2.3. HISTOGRAMA

Se usa en los casos en que la variable tiene categorías cuantitativas (intervalar o proporcional). No debemos
confundirlo con el de barras. El aspecto que debemos tener en cuenta en este gráfico, que será importante mas
adelante, es el hecho que se trata de un gráfico de áreas.

2.2.4. POLÍGONOS DE FRECUENCIAS

Es la transformación de los histogramas al unir los puntos medios de cada rectángulo (parte superior).

2.2.5. OJIVAS

ACTIVIDAD PRÁCTICA 2

En un trabajo desarrollado por el Laboratorio de Psicología Cognitiva de la Facultad de Educación, se llevó a cabo una
investigación dentro del marco de la teoría Psicolingüística. En este estudio dirigido por Manoiloff y Seguí, se realizó
un relevamiento de datos en una muestra de 35 estudiantes universitarios con el objeto de evaluar a qué edad se
adquirían determinadas palabras. Algunos de los resultados obtenidos fueron:

1. Responda a las siguientes preguntas:


a. ¿Cuántas personas de la muestra adquirieron la palabra “cangrejo” entre los 3 y los 6 años?

JAMES SANCHEZ PEREZ 6


ESTADÍSTICA APLICADA A LA EDUCACIÓN

b. ¿A qué edad se adquiere con mayor frecuencia la palabra “binoculares”?


c. ¿Cuál es la palabra que se adquiere más temprano según los estudios reportados?

Dadas las siguientes tablas de distribución de frecuencias


Tipo de delito
Robo 150 150 0.28 0.28
Lesiones leves 240 90 0.17 0.45
Hurto 440 200 0.37 0.82
Lesiones graves 520 80 0.15 0.97
Asesinato 535 15 0.03 1
Total 535 1

Cantidad de
Materias
aprobadas
0 200 0.1 200
1 450 0.13 250 0.1
2 750 0.15 300 0.23
3 1050 0.15 300 0.38
4 1450 0.2 400 0.53
5 1750 0.15 300 0.74
6 1950 0.1 200 0.89
7 1970 0.01 20 0.99
Total 1 1970 1
2. Para cada una:
a. Indique el nivel de medición de cada variable.
b. Rotule las columnas según se trate de frecuencias absolutas o relativas, simples o acumuladas. (Atención a que
en las tablas aparecen desordenadas).
c. Señale qué frecuencias tienen significado según el nivel de medición de las variables.
d. Redacte una interpretación para cada uno de los valores que se encuentran destacados en las tablas y que tengan
significado.
3. Construir la tabla de frecuencias y sus gráficos para los siguientes datos:
0.7859 0.0519 0.16 0.4885 0.8755 0.8052 0.3482 0.1945 0.4622 0.0539
0.6114 0.8167 0.3033 0.3102 0.8879 0.9984 0.3535 0.0391 0.1901 0.7613
0.7263 0.4042 0.3473 0.0522 0.0641 0.8982 0.5221 0.803 0.6001 0.3917
0.5991 0.6406 0.9271 0.7589 0.0358 0.4829 0.7308 0.4103 0.0783 0.7588
0.2202 0.2623 0.7569 0.4857 0.1003 0.7129 0.4643 0.5684 0.0045 0.3596
0.2875 0.3405 0.7031 0.9235 0.6204 0.3124 0.4273 0.2405 0.9046 0.6915
0.966 0.8968 0.0867 0.9056 0.3138 0.7476 0.504 0.4664 0.1771 0.964
0.0779 0.9281 0.7973 0.9906 0.7727 0.0747 0.0326 0.3681 0.7904 0.8563
0.5353 0.1825 0.3316 0.1187 0.4275 0.0066 0.1027 0.6535 0.0524 0.1054
0.4965 0.1812 0.2453 0.4098 0.4771 0.5716 0.7611 0.7294 0.2877 0.678
0.7506 0.6009 0.9468 0.8958 0.7212 0.2246 0.3535 0.4118 0.9335 0.0021
0.4785 0.6007 0.3026 0.0564 0.7539 0.0676 0.0469 0.37 0.8086 0.1546
0.9848 0.4749 0.4524 0.1408 0.9964 0.0587 0.9632 0.098 0.4286 0.1375
0.1025 0.0101 0.0408 0.3157 0.1793 0.9603 0.2836 0.3458 0.2395 0.8971
0.6432 0.7239 0.008 0.7566 0.3902 0.0018 0.316 0.0104 0.7728 0.7484
0.9017 0.1231 0.3059 0.2621 0.3347 0.0958 0.1786 0.6715 0.4066 0.0813
0.6421 0.6396 0.0943 0.2435 0.2407 0.1844 0.0038 0.9893 0.8421 0.3881
0.7253 0.5473 0.4087 0.8185 0.4207 0.226 0.2445 0.7884 0.6638 0.6131
0.4296 0.2769 0.5348 0.3152 0.3314 0.0426 0.6839 0.4979 0.6697 0.8601
0.2108 0.0602 0.4577 0.8179 0.889 0.8903 0.5316 0.9553 0.3947 0.2246
0.8499 0.8885 0.8252 0.4438 0.9421 0.6249 0.3598 0.5628 0.8401 0.4125

JAMES SANCHEZ PEREZ 7


ESTADÍSTICA APLICADA A LA EDUCACIÓN

3. LA EXPRESIÓN RESUMIDA DE LA INFORMACIÓN

La segunda etapa en la descripción de un conjunto de datos consistirá en calcular medidas que los resuman, que los
expresen de manera sintética. Esta etapa implicará un nuevo alejamiento de la información bruta, ya que perderemos
de vista no solo a los individuos —que aparecían en la matriz de datos—, sino también a las distribuciones de frecuencia.
La ventaja de los procedimientos que veremos en este capítulo es la posibilidad de presentar la información de modo
muy sintético; con unas pocas medidas descriptivas ofreceremos bastante información sobre los datos que se han
recogido.
Digamos antes de empezar que estas medidas requieren operaciones de diferente nivel de complejidad, por lo que
apelan a diferentes propiedades de las escalas de medición, entonces no serán las mismas las medidas que se puedan
calcular en una escala nominal que en una ordinal, intervalar o proporcional. El objetivo de describir el conjunto de
datos se logrará indicando tres tipos diferentes de medidas. En primer lugar, haremos referencia a las medidas de
posición. Estas medidas nos indicarán en torno a qué valores se distribuyen las observaciones. Dentro de las medidas
de posición, definiremos las medidas centrales, (también llamadas de centralidad o de tendencia central), y no
centrales. En segundo lugar, mencionaremos las medidas de dispersión (conocidas también como de variabilidad), que
mostrarán si los datos están concentrados alrededor de las medidas de centralidad o si están dispersos, alejados de
esas medidas centrales. En tercer lugar, nos detendremos en la forma que asume la distribución y allí, aunque hay
otras medidas, solo nos ocuparemos de describir la simetría o asimetría que manifiesta el conjunto de datos.

3.1. MEDIDAS DE POSICIÓN

Entre las medidas que resumen una distribución de frecuencias, mencionaremos las centrales y las no centrales. Las
medidas que se puedan calcular dependerán del nivel de medición de las variables que se describan, por lo que las
presentaremos separadamente para cada nivel, siempre recordando que las operaciones que son válidas a un
determinado nivel de medición también son válidas para niveles más altos. Por ejemplo: lo que pueda hacerse con
variables nominales, vale también para ordinales y métricas.
3.1.1. MEDIDAS DE CENTRALIDAD
Son las que indican alrededor de qué valores se ubican las observaciones de una distribución de frecuencias.
a) Variables nominales: la proporción (p)
Cuando se trabaja con una variable de nivel nominal, una manera sintética de presentar la información que ofrece
la tabla de distribución de frecuencias es indicando la proporción de casos que se encuentran en una determinada
categoría. Se trata de la frecuencia relativa simple (hi) de una categoría particular. Puede expresarse como decimal
o en porcentaje.
Esta medida descriptiva se usa a menudo cuando la variable nominal tiene solo dos categorías, ya que se presenta
la proporción de una de ellas e inmediatamente se sabe que el complemento es la proporción de la otra.
b) Variables nominales: el modo, o moda, o valor modal (Mo)
La más elemental de las medidas de centralidad que se usa en los distintos niveles de medición, es simplemente el
valor de la variable (la categoría) que tiene la mayor frecuencia. Dicho de otra manera, el valor de la variable más
frecuentemente observado. Esta medida no requiere ningún cálculo, no exige ninguna propiedad de la escala de
medición, por lo tanto se puede indicar en variables desde el nivel nominal, es decir en todos los niveles de medición.
La variable tipo hogar, tiene la siguiente distribución:
tipo hogar f
unipersonal 40
nuclear 90
extendido 20
ampliado 10

JAMES SANCHEZ PEREZ 8

También podría gustarte