Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de Excel
Manual de Excel
361
Revista de Investigacin Educativa, 31 (2), 361-374.
http://dx.doi.org/10.6018/rie.31.2.164111
RESUMEN
La codificacin y tabulacin de preguntas de respuestas mltiples es bien simple y conocida,
pero no por ello est exenta de errores y laboriosas tareas de introduccin de datos y anlisis de
los mismos. En este artculo se expone como facilitar la codificacin y la tabulacin de este tipo
de variables, suponiendo un ahorro drstico del tiempo necesario para su tabulacin y una reduccin considerable de los errores de datos que se pueden producir al introducirlos en el ordenador.
Asimismo, se obtiene una variable viva que se puede analizar y obtener informacin adicional.
Adems, se indica como obtener mayor informacin del estudio conjunto de ms de dos variables
dicotmicas a partir de la definicin de una nueva variable conjunta en la matriz de datos. Todo
ello se aplica a datos de una investigacin sobre las transversales en educacin primaria.
Palabras claves: multi-respuestas, variables dicotmicas, codificacin, tabulacin, materias
transversales.
MULTIPLE-CHOICE QUESTIONS IN EDUCATIONAL RESEARCH:
CODING,TABULATION AND ANALYSIS
ABSTRACT
The process of coding and tabulating multiple-choice questions is simple and well known,
yet not free from errors and time-consuming data entry and analysis. This article explains how
Correspondencia:
Jos Serrano Angulo, Departamento de Mtodos de Investigacin e Innovacin Educativa. Facultad de
Ciencias de la Educacin. Universidad de Mlaga. E-mail: joseserrano@uma.es.
362
to code and tabulate variables, which will save time and dramatically decrease the number of
errors derived from entering data into a computer. An active variable is calculated which
may be further analyzed. This article also explains how to obtain more information when
analyzing more than two dichotomous variables from the creation of a new joint variable in
the data matrix. These processes were applied to data of a research study on cross-curricular
subjects in primary education.
Keywords: multiple-choice questions, dichotomous variables, coding, tabulation, crosscurricular subjects.
1. INTRODUCCIN
Una pregunta de respuesta mltiple se plantea de tal modo que el sujeto puede
elegir ms de una de las opciones que se le ofrece, o todas. Esto hace que estas preguntas se desglosen para su tabulacin en tantas variables dicotmicas como opciones
se planteen. Tabulando cada variable dicotmicas por cero, si no es elegida la opcin
correspondiente, o por uno si es elegida. Si el cuestionario tiene varias preguntas de
este tipo el trabajo de tabulacin aumenta considerablemente, y el numero de errores
en la matriz de datos puede aumentar fcilmente, por dos motivos uno por el aumento
propio de la matriz de datos y otro porque los datos de 0 y 1 pueden fcilmente intercambiarse en el proceso de tabulacin generando errores de difcil localizacin.
Las investigaciones que utilizan encuestas a veces aparecen preguntas de respuestas
mltiples, en las que se pueden elegir una, o ms respuestas. As por ejemplo, en una
pregunta de respuestas mltiples con siete opciones resulta que para codificar y tabular
los datos de esa pregunta se definen siete variables dicotmicas que se tabulan con
ceros y unos, 0 si no se elige la opcin y 1 si se elige. En muchos casos bastantes ceros,
al ser respuestas no elegidas. Esto, adems de suponer un trabajo tedioso, se presta a
acumular errores de difcil localizacin entre los datos, al ser todos ceros y unos, con
la consiguiente monotona y ser indistinguibles en un anlisis de los mismos.
En otras ocasiones puede haber un nmero de preguntas con respuestas dicotmicas
con las que se suelen presentar el porcentaje de eleccin de cada una de las opciones
en cada uno de las preguntas. Maganto, Bartau y Etxebarria (2003) ofrecen una tabla
de frecuencias con las tareas domsticas con las que los hijos participan en casa. Se
puede plantear la cuestin, qu porcentaje de hijos participan en un grupo de tareas
ms laboriosa, o menos. Esto es, los que hacen la cama, hacen la compra, y ponen la
mesa?, esta pregunta con el anlisis que generalmente se hace no se puede contestar.
Aunque es relativamente fcil contestarla si se cruzan las variables de dos en dos, no
lo es si se trata de una combinacin de tres variables, o ms variables. As, resultara
interesante conocer, no slo cuntos ayudan en cada una de las tareas domsticas,
sino cuantos participan en slo una tarea, o en dos, o en ms de dos, y en que tipos
de tareas se dan estas combinaciones.
En el primer caso de variables de respuestas mltiples, se tienen ciertas limitaciones
de anlisis y relaciones con las dems variables bajo estudio. En la que algunos programas como el SPSS hay procesos para agrupar las variables dicotmicas resultantes
en una variable de respuestas mltiples con la que se puede obtener la distribucin de
RIE, vol. 31-2 (2013)
363
GRFICA 1
EJEMPLO TABLA DESDOBLE DE DATOS
364
tos y motivos sobre la lectura. Limn, et al. (2011) al preguntar sobre el conocimiento
previos en distintos contenidos de matemticas 18 categoras y sobre el reconocimiento
de los distintos tipos de smbolos, 11 smbolos.
En todos estos estudios los autores presentan las distribuciones de frecuencias
de cada una de las opciones. Como es bien sabido, la suma de los correspondientes
porcentajes es mayor que 100, ya que cada persona que responde puede elegir ms
de una opcin. Como indican los manuales al respecto, se supone que han codificado
y tabulado esas cuestiones como variable dicotmicas para su posterior anlisis. Una
pregunta interesante en este tipo de cuestiones es qu combinacin de respuestas
es la ms frecuente?, o qu combinacin no se da?. Con la codificacin y anlisis
que se hacen de los datos no se puede contestar a estas cuestiones. En cambio, con la
codificacin propuesta en este artculo s se puede dar respuestas a esa cuestiones y a
otras muchas, al tener una variable que recoge toda esa informacin se puede analizar
junto con las dems variables que se tenga, a la vez que se puede hacer agrupacin
de la misma, por ejemplo considerar los que eligen una sola opcin los que eligen
combinaciones de dos, los que eligen combinaciones de tres, y los que eligen combinaciones de 4 ms. Por supuesto tambin se puede tener las frecuencias con las que
cada opcin es elegida.
En primer lugar se expone como codificar, tabular y analizar las variables de respuestas mltiples, y en segundo lugar como unir varias variables dicotmicas en una
sola, para estudiar las combinaciones de respuestas que se dan. Esto se hace con ayuda
de la hoja de clculo Excel.
2. CODIFICACIN DE LAS RESPUESTAS MLTIPLES
La forma que se propone de codificar las respuestas mltiples de una pregunta es
asignarle un nmero segn las opciones que se eligen. Esto es, si se elige la primera
opcin y la quinta, se le asigna el 15, si se elige la segunda opcin, la tercera y la cuarta,
se le asigna el 234, y as respectivamente.
De este modo la pregunta ocupa una sola columna en la matriz de datos, al igual
que cualquier otra pregunta simple y se simplifica enormemente la tabulacin de los
datos. Siendo ahora ms fcil la revisin de los datos y la localizacin de posibles errores en la introduccin de los mismos. Adems a la hora de analizar los datos se puede
obtener una distribucin de frecuencias de esta variable, en la que se observar cuantos
han elegido una sola opcin y cuantos han elegido ms de una y que combinaciones
de ellas son elegidas, y cuantos no han elegido ninguna opcin. Cuestin esta ltima
que no se obtiene con la codificacin de 0 y 1 indicada en los manuales. Esto aporta
una informacin adicional que de otro modo no se tendra.
Para seguir mejor la explicacin se utiliza una variable de eleccin mltiple en un
caso real.
En una investigacin sobre las transversales que trabajaban los profesores de
primaria se tenan preguntas referidas a las transversales, cada una con 8 opciones
posibles, por lo que el nmero de variables a la hora de codificar las respuestas
se multiplicaba por 8, este fue el motivo de buscar una solucin al problema de
tabulacin y codificacin de este tipo de variables, despus de conseguir varias
RIE, vol. 31-2 (2013)
365
1
2
3
4
5
6
7
8
Educacin ambiental
Educacin para la salud
Educacin para el consumo
Coeducacin
Educacin moral
Educacin vial
Educacin para la paz
Educacin sexual
Las respuestas se codificaron como se indica al inicio de esta seccin, para conseguir el desdoblamiento de la variable en tantas variables dicotmicas como respuestas
posibles se utiliza la siguiente funcin
=SI(ESERR(ENCONTRAR(valor a buscar; celdilla donde buscar;1));0;1)
Aunque la expresin puede resultar compleja, el resultado es el deseado y slo se
necesita escribirla una vez, haciendo uso despus de la utilidad del Excel de rellenar
hacia la derecha y hacia abajo.
Para poder entender que hace esta funcin compuesta se explica cada una de las
funciones que la componen.
Explicacin de la funcin:
ENCONTRAR(expresin; donde; a partir de que lugar)
Es una funcin de texto con tres argumentos separados por ;. Esta funcin busca
el texto que hay en el primer argumento expresin en la celdilla que aparece en el
segundo argumento donde, a partir del lugar que aparece en el tercer argumento a
partir de que lugar. Si encuentra la expresin el resultado es el orden del lugar que
ocupa en el texto, o en caso contrario devuelve el error #VALOR!. Si se omite el tercer
argumento de la funcin, la bsqueda la hace desde el primer lugar, al no necesitar
buscar desde un lugar determinado, sino en cualquier lugar de la celdilla, en adelante
se escribir esta funcin sin el ltimo argumento para simplificar la expresin.
As ENCONTRAR(1;A2) busca si hay algn 1 en la celdilla A2. Obsrvese que da
igual el lugar que ocupe en esa celdilla. Es decir que si en A2 hay un 135 devuelve un
1, y si hay 351 devuelve un 3. Si es as devuelve el lugar que ocupa el texto en caso
contrario devuelve el error #VALOR!.
RIE, vol. 31-2 (2013)
366
367
GRFICA 2
HOJA EXCEL CON LA COLUMNA A PARA DESDOBLAR EN LAS COLUMNAS B A LA I
GRFICA 3
EXPRESIN EN LA CELDILLA B2
368
GRFICA 4
RESULTADO FINAL DEL DESDOBLAMIENTO DE LA VARIABLE
GRFICA 5
NOMBRES Y EXPRESIONES AUTOMTICOS
369
Al finalizar se guardar una copia como slo texto, para poder eliminar la primera
fila sin que se altere los resultados, quedando los datos de la forma esperada. Obsrvese,
que en la celdilla B2 se ha escrito el $ delante de A2, para cuando se rellene hacia la
derecha se mantenga fija la columna. Asimismo, en la celdilla B3 se ha puesto el $ en
B$1, para cuando se rellene hacia abajo se mantenga fija la primera fila. De este modo
se automatiza el cambiar el nmero a buscar en cada columna.
3. ANLISIS DE LAS VARIABLES: LAS VARIABLES DESDOBLADAS
Ahora se tiene la variables dicotmicas y la primera variable en la que aparece las
combinaciones elegidas con esta variable se puede hacer un anlisis de frecuencias
obteniendo las combinaciones que se dan y en que porcentaje. As mismo, cuanto han
elegido una sola opcin. En cualquier caso hay que tener en cuenta que el nmero
de combinaciones posibles son 2k donde k es el nmero de opciones, para 8 opciones
se puede tener hasta 256 combinaciones distintas, muchas de ellas no aparecern. En
cualquier caso se tiene esa informacin disponible, y se puede agrupar la variable para
estudiar las combinaciones de inters y/o cruzarlas con otras variables, cosa que no se
podra hacer si slo se tiene las variables dicotmicas.
Se puede guardar el archivo en formato Excel, pero para su uso en cualquier programa informtico de anlisis de datos se recomienda que se guarde una copia en
formato texto separado por tabuladores, de este modo el archivo de datos est slo
con los datos, sin expresiones ni formulas intermedias. Para ello ir al men Archivo a
la opcin guardar como y elegir el formato de texto separado por tabulaciones.
Tambin se puede copiar toda la hoja y en otra hoja elegir del men edicin, o
con el botn derecho del ratn, pegar especial seleccionando solo contenido de este
modo se tiene los datos sin las formulas listo para analizar en cualquier programa de
anlisis de datos.
Una vez concluido desde el Excel se le da a guardar como y se selecciona la opcin
de formato slo texto separados por tabulaciones. De este modo slo se guarda los
datos de sin formulas. Este nuevo archivo se puede leer desde cualquier programa de
anlisis estadstico en particular desde el spss.
4. UNA APLICACIN PRACTICA EN LA EVALUACIN DE MATERIALES EDUCATIVOS
A continuacin se muestra una aplicacin de los anterior con datos de una investigacin sobre el uso de los materiales curriculares bsicos por parte del profesorado
para trabajar las transversales. El tamaos de muestra fue de 278 profesores. Se obtuvo
el siguiente resultado en la cuestin, qu transversales has trabajado utilizando los
materiales curriculares bsicos?
Qu transversales has trabajado utilizando los materiales curriculares bsicos?
1 Educacin ambiental
2 Educacin para la salud
3 Educacin para el consumo
370
4
5
6
7
8
Coeducacin
Educacin moral
Educacin vial
Educacin para la paz
Educacin sexual
TABLA 1
DISTRIBUCIN DE FRECUENCIAS DE LAS MULTIRESPUESTAS
Estadsticos
TRANS
N
Vlidos
249
Perdidos
29
Frecuencias $TransvTrab
Respuestas
Transversalidades
trabajadasa
Porcentaje
Porcentaje de
casos
AMBIENTAL
211
17,1%
84,7%
SALUD
204
16,5%
81,9%
CONSUMO
132
10,7%
53,0%
COEDUCA
115
9,3%
46,2%
MORAL
154
12,5%
61,8%
VIAL
129
10,4%
51,8%
PAZ
197
15,9%
79,1%
SEXUAL
94
7,6%
37,8%
1236
100,0%
496,4%
Total
a. Agrupacin de dicotomas. Tabulado el valor 1.
371
TABLA 2
DISTRIBUCIN DE LAS COMBINACIONES DE RESPUESTAS
Valor
Frec
1
2
4
5
7
12
13
17
23
24
28
38
57
67
123
124
125
126
127
135
145
146
236
238
245
248
257
267
458
6
1
2
1
1
4
1
2
3
2
1
2
1
1
4
1
1
1
1
1
1
2
1
2
1
1
4
1
1
2,2
0,4
0,7
0,4
0,4
1,4
0,4
0,7
1,1
0,7
0,4
0,7
0,4
0,4
1,4
0,4
0,4
0,4
0,4
0,4
0,4
0,7
0,4
0,7
0,4
0,4
1,4
0,4
0,4
%vl
2,4
0,4
0,8
0,4
0,4
1,6
0,4
0,8
1,2
0,8
0,4
0,8
0,4
0,4
1,6
0,4
0,4
0,4
0,4
0,4
0,4
0,8
0,4
0,8
0,4
0,4
1,6
0,4
0,4
Valor
Frec
568
1234
1236
1237
1247
1248
1257
1267
1278
1367
1368
1378
1457
1458
1467
1567
2357
2358
2367
2457
2578
4578
12347
12356
12357
12367
12378
12456
12457
1
2
1
6
4
1
9
6
2
1
2
2
3
1
1
3
1
1
1
3
1
1
3
1
4
4
1
2
6
0,4
0,7
0,4
2,2
1,4
0,4
3,2
2,2
0,7
0,4
0,7
0,7
1,1
0,4
0,4
1,1
0,4
0,4
0,4
1,1
0,4
0,4
1,1
0,4
1,4
1,4
0,4
0,7
2,2
%vli
0,4
0,8
0,4
2,4
1,6
0,4
3,6
2,4
0,8
0,4
0,8
0,8
1,2
0,4
0,4
1,2
0,4
0,4
0,4
1,2
0,4
0,4
1,2
0,4
1,6
1,6
0,4
0,8
2,4
Perdidos
Total
Valores
12467
12567
12578
13467
13478
14578
15678
23457
23567
23578
123457
123467
123478
123567
123578
123678
124578
124678
125678
1234567
1234578
1234678
1235678
1245678
1345678
12345678
Total
Sistema
Frec
2
15
2
2
1
2
2
1
1
1
3
1
3
14
3
1
3
4
3
11
5
4
5
3
1
31
249
29
278
0,7
5,4
0,7
0,7
0,4
0,7
0,7
0,4
0,4
0,4
1,1
0,4
1,1
5
1,1
0,4
1,1
1,4
1,1
4
1,8
1,4
1,8
1,1
0,4
11,2
89,6
10,4
100
%vli
0,8
6
0,8
0,8
0,4
0,8
0,8
0,4
0,4
0,4
1,2
0,4
1,2
5,6
1,2
0,4
1,2
1,6
1,2
4,4
2
1,6
2
1,2
0,4
12,4
100
A partir de aqu se puede agrupar la variable inicial de respuestas segn los intereses
de informacin, a continuacin se muestra la distribucin de la variable recodificada
agrupando los valores con dos cifras en el nuevo valor DOS, los de tres cifras en TRES,
y as sucesivamente, se obtiene la distribucin de las transversales que se trabajan y
cuantas trabajan un mismo profesor.
RIE, vol. 31-2 (2013)
372
TABLA 3
DISTRIBUCIN DEL NMERO DE TRANSVERSALES TRABAJADAS POR EL
PROFESORADO
AMBIENTAL
SALUD
COEDUCA
MORAL
PAZ
DOS
TRES
CUATRO
CINCO
SEIS
SIETE
OCHO
Total
Sistema
Frecuencia
Porcentaje
6
1
2
1
1
17
24
52
50
35
29
31
249
29
278
2,2
0,4
0,7
0,4
0,4
6,1
8,6
18,7
18,0
12,6
10,4
11,2
89,6
10,4
100,0
Porcentaje
vlido
Porcentaje
acumulado
2,4
0,4
0,8
0,4
0,4
6,8
9,6
20,9
20,1
14,1
11,6
12,4
100
2,4
2,8
3,6
4
4,4
11,2
20,9
41,8
61,8
75,9
87,6
100
Hay 19 profesores que no trabajan con las transversales, 11 que trabajan con solo
una y 31 que trabajan con todas.
Adems se tiene informacin de cuantos no han elegido ninguna opcin, en este
caso 29 el 10,4%.
5. CONCATENACIN DE VARIABLES DICOTMICAS
El caso contrario resulta ms interesante desde un punto de vista analtico, ya que
se puede obtener informacin relevante sobre las combinaciones de respuesta que se
dan a las distintas preguntas del cuestionario.
Cuando se tiene la tabulacin de variables dicotmicas se puede construir la variable
de las combinaciones de respuestas con la funcin CONCATENAR(arg1;arg2;). Esta
funcin de texto permite unir cadenas de alfanumricas, por lo que se puede construir
la variable fcilmente, slo hay que eliminar los ceros, para ello se puede utilizar las
funcin condicional como se indica a continuacin.
=CONCATENAR(SI(A2=1;1;);SI(B2=1;2;);SI(C2=1;3; ))
Si se tiene la tabulacin de las respuestas de una pregunta de opcin mltiple,
fcilmente se puede obtener la variable con las respuestas numeradas como al inicio
de este artculo, bastara con concatenar los cdigos previamente multiplicados por su
opcin y evitando los ceros
373
SI(A2=1;1;)&SI(B1=1;2;)
Con esta funcin se consigue el proceso inverso, esto es a partir de variables dicotmicas se obtiene una variable en la que aparecen las combinaciones elegidas entre
las variables dicotmicas. Esto se puede utilizar tambin en aquellas ocasiones donde
se tiene variables dicotmicas y se pretenda obtener informacin de las combinaciones
de las respuestas. En muchas investigaciones de sondeos de opinin se presentan las
distribuciones de las respuestas a las distintas cuestiones planteadas, un resultado
interesante es conocer cuantos de los que han contestado una opcin en una pregunta
lo han hecho en otra opcin de otra pregunta, construyendo esta nueva variable se
puede obtener esa informacin detalladamente.
La cuestin que se puede hacer es, son los mismos los que responden mayoritariamente a una cuestin y a otra? Si se quiere comparar dos a dos de estas variables
la cuestin es simple pero si se quiere compara ms de dos simultneamente la cuestin se complica. Con el procedimiento descrito anteriormente se puede construir la
variable de las combinaciones elegidas. De este modo se puede hacer un estudio mas
detallado de los porcentajes que eligen slo una opcin o las combinaciones de ellas.
Tambin se puede combinar las opciones de inters de distintas variables seleccionando el valor de interese en cada una de las variables a combinar.
Con esta nueva variable es fcil obtener el porcentaje de los que eligen slo una
opcin, los que eligen dos opciones, los que eligen tres, y as sucesivamente. Basta con
recodificar la variable en unidades, decenas, centenas, etc.
6. CONCLUSIN
Con esta tabulacin en cuestionarios con preguntas de multirespuestas se simplifica
el nmero el trabajo de introduccin de datos con un ahorro importante, y se reduce
considerablemente los posibles errores a la hora de tabular, a la vez se dispone de una
variable en la que se tiene informacin detallada de las combinaciones que se dan en
las respuestas mltiples, permitiendo hacer un mejor anlisis de los datos pudindose
obtener informacin detallada de las elecciones y pudiendo cruzar esta variable con
otras, como por ejemplo las de carcter descriptivo de la muestra, como puede ser la
edad o el gnero, o la titularidad. Adems se tiene informacin de cuantos no han elegido ninguna opcin. Todo esto es complicado obtenerlo de las variables dicotmicas
que resultan del desdoble.
De otro lado el proceso inverso de unir variables dicotmicas, como las de respuestas
s, no, en una variable de respuesta mltiple permite obtener informacin adicional
sobre los porcentajes de leccin de cada una de las combinaciones posibles.
REFERENCIAS
Caballero, P. A. y Garca-Lagos, V. (2010). La lectura como factor determinante del
desarrollo de la competencia emocional: Un estudio hecho con poblacin universitaria. Revista de Investigacin Educativa, 28(2), 345-359.
374