Tecnica S

TCNICAS E INSTRUMENTOS DE INVESTIGACIN
Elas Meja Meja
UNMSM LIMA - 2005
ELAS MEJA MEJA
ISBN: 9972-834-08-05 Hecho el Depsito Legal en la Biblioteca Nacional del Per N. 2005-8142
Primera edicin Lima, noviembre de 2005 Elas Meja Meja Unidad de Post Grado de la Facultad de Educacin de la UNMSM Serie: Textos para la Maestra en Educacin Diseo y diagramacin: Centro de Produccin Editorial e Imprenta de la Universidad Nacional Mayor de San Marcos
FACULTAD DE EDUCACIN UNIDAD DE POST GRADO

Decana : Dra. Aurora Marrou Roldn
Director de la UPG Comit Directivo de la UPG
: :
Dr. Elas Meja Meja Dr. Kenneth Delgado Santa Gadea Mg. Gonzalo Pacheco Lay
NDICE
PRLOGO
09
CAPTULO I INSTRUMENTOS DE ACOPIO DE DATOS 1. La medicin 2. Postulados de la medicin 3. Niveles de medicin 4. Medicin de variables conductuales 5. Instrumentos de acopio de datos 6. Instrumentos para el estudio de variables conductuales 7. Cualidades de los instrumentos de acopio de datos 8. Principios para construir pruebas 9. Tcnica para elaborar pruebas 10. Indicadores para establecer la calidad de una prueba 11. Grado de dificultad de la prueba 12. ndice de discriminacin de una prueba 13. Los temes 14. Clasificacion de los temes 15. Determinacion del grado de dificultad de un tem 16. ndice de discriminacin de un tem Lecturas complementarias Fundamentos de medicin Donald Ary Recoleccin de los datos Roberto Hernndez Sampieri
5
13 14 15 18 19 20 22 34 35 39 40 41 42 42 49 50
55 80
ELAS MEJA MEJA
CAPTULO II EL MUESTREO 1. 2. 3. 4. 5. Poblacin y muestra Determinacin del tamao de la muestra Error de muestreo Ventajas de la tcnica de muestreo Muestreo probalstico 95 99 102 103 104 115
6. Muestreo no probalstico Lectura complementaria Condiciones y elementos de las muestras Restituto Sierra Bravo
119
CAPTULO III EL PROCESO DE PRUEBA DE HIPTESIS 1. Hiptesis nulas y prueba inversa 2. Errores que se pueden cometer al adoptar decisiones 3. Prueba de hiptesis 4. Nivel de significacin 5. Grados de libertad 6. Prueba chi cuadrada (x2) 7. Anlisis de varianza 7. Anlisis de regresin mltiple 8. Prueba t de Student Lectura complementaria Prueba de hiptesis y error estndar Fred Kerlinger 139 141 142 142 143 144 148 160 167
177
CAPTULO IV EL INFORME CIENTFICO 1. Comunicacin de la investigacin 2. Extensin del informe 3. Estilo de la redaccin del informe 4. Referencias bibliogrficas Lecturas complementarias El informe de investigacin Orfelio Len Anlisis, interpretacin y comunicacin de los resultados Donald Ary 211 221 197 204 204 205
BIBLIOGRAFA
243
PRLOGO
Las tcnicas para la realizacin de investigaciones cientficas son muy variadas y tienen distintos propsitos, pero todas ellas resultarn siendo intiles si antes no se ha comprendido a cabalidad la metodologa de la ciencia para producir conocimientos. Esta ardua tarea requiere formacin slida y lecturas intensas para comprender la racionalidad de la ciencia, explicarnos los hechos a partir de hiptesis y tomar decisiones con respecto a ellas en funcin de la evidencia que se halle en la observacin de los hechos. Nada tan evidente: si los hechos se presentan en el sentido propuesto por las hiptesis, stas se aceptan; mientras que si los hechos no se presentan en la forma planteada por los hechos, stas se rechazan. En otras palabras, son los hechos, y no las conjeturas, los que dirimen acerca de la validez del conocimiento, pues sera de una gran ingenuidad pretender dar por vlidas las hiptesis que no sean sustentadas por los hechos. Si una hiptesis no concuerda con los hechos, debe ser rechazada. No es posible lo contrario: rechazar los hechos para mantener la vigencia de nuestra hiptesis. Este volumen complementa lo dicho en Metodologa de la Investigacin Cientfica. Aqu se proponen las tcnicas ms necesarias para realizar el trabajo de campo que demanda toda investigacin. Se explica lo relacionado con el proceso de construccin de los instrumentos para el acopio de datos. Para ello existen determinadas tcnicas, pero si optamos por los mtodos cuantitativos, debemos tener en cuenta que los fenmenos que vamos a estudiar, si cuando nos referimos a ellos, podemos hablar en trminos de ms o de menos, es decir, frente a dos fenmenos podemos decir que uno es ms que otro, entonces es posible medirlos. Reconocer la magnitud de los fenmenos es requisito previo para poder medirlos. El investigador intuye que el fenmeno que estudia posee una determinada magnitud, pero le resulta difcil conocerla, medirla, porque no dispone de los instrumentos que le permitan acercarlo a la real magnitud de tales fenmenos. Tambin se dan las pautas para hacer el muestreo y se enfatiza que toda muestra, si partimos del razonamiento de que toda muestra es el subconjunto de la poblacin, es representativa, y si no es representativa la supuesta muestra, sencillamente no es muestra.
9
ELAS MEJA MEJA
En otro captulo se explica el proceso de prueba de hiptesis con procedimientos estadsticos. Para ello se han adoptado como ejemplos algunas investigaciones realizadas en la Facultad de Educacin, y que han servido a sus autores para optar los grados acadmicos correspondientes. Finalmente, en el presente volumen se explica lo relacionado con el Informe de Investigacin, que en realidad es la tesis que los graduandos deben redactar. La tesis es eso, el informe del trabajo de investigacin realizado. El graduando debe realizar un proceso de investigacin, debe recoger evidencias que contradigan o confirmen sus hiptesis y debe analizar sus resultados y tomar decisiones con respecto a ellas. Al final de todo este esfuerzo, el investigador, ya culminado el proceso de investigacin, se recluye en su gabinete para dar cuenta, por escrito, del proceso de investigacin que ha seguido y de la forma cmo ha sometido a contraste sus hiptesis con los hechos. Es decir, redacta su informe cientfico, empleando las formas del lenguaje ms apropiadas al caso. Esta es la tesis que los estudiantes del programa de Maestra en Educacin deben redactar, como resultado de un proceso de investigacin realizado. Se pretende, con este volumen, cubrir los vacos que puedan existir en la aventura de hacer ciencia y reiteramos nuestra invitacin a los participantes del programa para que asuman el reto de hacer investigaciones, informar acerca de sus hallazgos y, finalmente, optar el grado acadmico correspondiente, autntico motivo de su incorporacin a San Marcos de todos quienes estudian maestra.
DR. ELAS MEJA MEJA DIRECTOR DE LA UNIDAD DE POST GRADO
10
CAPTULO I
INSTRUMENTOS DE ACOPIO DE DATOS
11
ELAS MEJA MEJA
12
INSTRUMENTOS DE ACOPIO DE DATOS
Hasta aqu se ha visto cmo el investigador busca la mejor estrategia para probar sus hiptesis. Pero es el caso que el investigador tambin necesita ciertas herramientas o instrumentos que le permitan recopilar datos de la realidad para probar sus hiptesis, pues no sera conveniente que los recopilara en base a sus clculos, intuiciones o, como se dice, a ojo de buen cubero. Los instrumentos que requiere el investigador pueden ser de diferentes tipos: de medicin, de constatacin, de acopio de informacin, de verificacin de situaciones, etc. Los instrumentos ms conocidos y los que proporcionan informacin ms valiosa al investigador son los instrumentos de medicin. La medicin es una actividad muy importante cuando se trata de conocer la naturaleza de los fenmenos que proporcionan informacin precisa acerca de sus caractersticas.
1. LA MEDICIN
La medicin es un proceso que consiste en asignar numerales a determinados fenmenos o eventos, siguiendo reglas previamente establecidas. Esta definicin planteada por S. S. Stevens es intencionalmente muy genrica, pero es muy til porque hace posible abarcar todos los aspectos que se derivan del proceso de medicin y, adems, porque permite sostener que es posible, tericamente, medir cualquier fenmeno siempre y cuando las reglas tengan un fundamento racional o lgico. Los fenmenos o eventos a los que se hace referencia son las variables, es decir, fenmenos que varan cuando asumen dos o ms valores. En la investigacin interesa examinar y analizar cada uno de estos valores. Para realizar un proceso de medicin es necesario reconocer que el fenmeno a medir tiene su propia magnitud y que el problema radica en que el investigador, con los instrumentos que dispone, no la puede conocer plenamente. La medicin es, en estricto sentido, conocer la verdadera magnitud del fenmeno, de ah que resulta muy importante que toda autntica medicin sea isomrfica con la realidad que se est midiendo, es decir, que los datos que se obtengan como resultado de la medicin deben ser parecidos, equivalentes, o correspondientes a los que realmente posee el
13
ELAS MEJA MEJA
fenmeno que se mide; aunque en realidad no se mide el fenmeno directamente, sino los indicadores de sus caractersticas. Es muy importante tener en cuenta esto cuando se realizan procesos de medicin de fenmenos o variables del comportamiento que, por naturaleza, son muy elusivas, impredecibles y difciles de identificar, como la creatividad , el talento , el coeficiente intelectual , la personalidad, la agresividad, el rendimiento acadmico, la angustia, etc. Como estos fenmenos ofrecen dificultades a los esfuerzos por medirlos, solo se puede inferir sus caractersticas a partir de la observacin o el anlisis de sus indicadores. Analizar los aspectos relacionados con la medicin es muy importante cuando se trata especialmente de la investigacin cuantitativa en la que, en todo momento, se trata de emitir juicios de valor acerca de los fenmenos que se estudian y se trata de estimar, ponderar, puntuar, graduar, precisar, etc., sus caractersticas. Para realizar procesos de medicin es necesario que las variables que se estudian varen en trminos de ms o de menos cantidad, es decir, que de una variable se pueda decir que la caracterstica se presenta en trminos de ms cantidad o de menos cantidad. Por ejemplo, tratndose de la inteligencia, es posible decir que algunas personas tienen ms inteligencia y otras tienen menos inteligencia. Si esto se puede decir de la inteligencia, entonces es posible medirla.
2. POSTULADOS DE LA MEDICIN
Los postulados de la medicin son los referentes tericos que fundamentan los procesos de medicin. El investigador debe tenerlos muy presente si pretende realizar correctamente los procesos de medicin. Estos postulados son los siguientes: A es igual a B o A es diferente a B, pero no ambas situaciones a la vez. Este postulado es importante para la clasificacin, porque cuando se clasifica se ubican, exhaustiva y excluyentemente, todos los elementos del conjunto que se est clasificando en una u otra categora. Ningn elemento puede estar a medias en una categora ni puede estar en ms de una categora a la vez. Un objeto puede ser igual diferente de otro, pero no puede ser igual y diferente a otro al mismo tiempo. Si A es igual a B y B es igual a C, entonces, A es igual a C. Este postulado permite establecer la igualdad de los miembros de un conjunto en base a una caracterstica comn a partir de la comparacin de los objetos. Si A es mayor que B y B es mayor que C, entonces, A es mayor que C. Las relaciones tambin pueden ser menor que, o se halla a mayor distancia que, es ms fuerte que, precede, domina, etc. En este postulado se fundan la mayora de las mediciones psicolgicas y pedaggicas, pues al elaborar escalas, las categoras de stas surgen por comparacin con las caractersticas que poseen otros sujetos.
14
3. NIVELES DE MEDICIN
Los conceptos anteriormente expuestos permiten establecer una idea ms aproximada de lo que en realidad es la medicin. Sin embargo, todava es necesario explicar lo relacionado con los niveles de la medicin, concepto que tambin se debe a Stevens. Los niveles de la medicin son las diferentes estrategias que permiten medir, con ms o menos exactitud, el fenmeno. Estos niveles son cuatro: nominal, ordinal, de intervalo y de razn o proporcional. 3.1 Nivel nominal Como su nombre lo indica, este nivel de medicin consiste en asignar nombres o denominaciones a los sujetos o fenmenos de la realidad. Por ejemplo, todas las personas tienen dos nombres y dos apellidos. En nuestra sociedad el apellido paterno se lleva antepuesto al materno. sta es la regla pre establecida y, en este caso, se cumple la definicin de medicin. Ejemplos de situaciones que se miden en el nivel nominal abundan en la investigacin de la conducta. As, los estudiantes universitarios tienen su respectivo cdigo de matrcula que los identifica; todos los ciudadanos estn identificados por el nmero de su Documento Nacional de Identidad; los estudiantes de una sala de clases estn identificados por el nmero de orden. Se puede codificar las categoras con 1 2 para referirse al sexo masculino o al femenino, respectivamente. La misma codificacin se puede usar para registrar si un estudiante est aprobado o desaprobado, si su padre vive o no, si es nacional o extranjero, si es rico o pobre, si proviene de Lima o de provincias, etc. En este caso, las variables se miden nominalmente al asignarles un cdigo a cada uno de sus valores. Otros ejemplos en que la medicin se realiza en el nivel nominal es cuando los jugadores de un equipo deportivo llevan en su camiseta un nmero que los identifica; los autos de carrera se identifican por sus nmeros, as como los caballos de carrera o las candidatas en un concurso de belleza. En todos estos casos, los nmeros no tienen el significado de cantidad. A quien se asigne el nmero 2 no significa que sea ms con respecto a quien posea el nmero 1, sino que estas denominaciones slo son nombres, rtulos, cdigos convencionales. La asignacin de numerales se acepta como un proceso de medicin nominal si previamente se han observado las reglas pre establecidas. Las variables que se miden en este nivel generalmente son las categricas. La investigacin cualitativa se basa en este tipo de medicin, al ubicar la caracterstica que se estudia en una, y slo en una, categora. Estas categoras pueden ser nominadas denominadas segn el libre albedro del investigador; as por ejemplo, los valores del estado civil se pueden denominar como: soltero, casado, viudo, divorciado, conviviente, etc. El tipo de gestin de las universidades puede ser: nacional o particular. El lugar de nacimiento puede ser: nacional o extranjero.
15
ELAS MEJA MEJA
Como se ha dicho, estas categoras son excluyentes y no puede darse el caso de alguien que sea soltero o casado a la vez, como tampoco puede ocurrir que alguien sea nacional o extranjero, al mismo tiempo.
3.2 Nivel ordinal Como se habr notado, la medicin nominal slo identifica a los sujetos. No proporciona ninguna informacin adicional. En cambio, la medicin ordinal incorpora un elemento nuevo: indica el orden, precedencia o prelacin en el que se hallan los sujetos. En este caso funciona el tercer postulado (A es mayor que B y B es mayor que C, en consecuencia A es mayor que C ). Al emplear el nivel ordinal de medicin se puede afirmar, por ejemplo, que en una carrera de caballos, el N 5 lleg 1, el N 3, lleg 2 y que el N 7, lleg 3. El orden de mrito de los estudiantes es un caso tpico de medicin ordinal, as como lo son los resultados de los exmenes de admisin a las universidades. Este nivel informa que, por ejemplo, ocupar el 5 puesto entre 300 alumnos es ms meritorio que ocupar el mismo 5 puesto entre 6 alumnos, pero no informa con respecto a cul de los estudiantes es mejor. El siguiente grfico ilustra lo dicho:
5 4 3 2 1 Medicin ordinal
|||||
8 2 7 3 5 Medicin nominal
Grfico N 1 Un caso tpico de medicin en el nivel ordinal es la escala de evaluacin que se emplea en los procesos de sustentacin de tesis, en los que se evala como aprobado o desaprobado. Y dentro de la categora de aprobado se distingue todava las siguientes sub categoras: aprobado por mayora, aprobado por unanimidad, sobresaliente, o sobresaliente con recomendacin de publicacin de la tesis. Tambin los resultados de un proceso de admisin para ingresar en una Universidad se expresan en el nivel de medicin ordinal, pues se dice que alguien ocup el primer puesto, el segundo puesto, o el tercer puesto, etc. La medicin ordinal requiere de la informacin que proporciona la medicin nominal. 3.3 Nivel de intervalo Como quiera que la medicin ordinal proporciona informacin acerca de la precedencia, prelacin o del orden en que se ubican los sujetos, se observa en muchos casos que el segundo lugar est muy prximo al primero y que el tercero,
16
muy lejos de los dos primeros, tal como pude verse en el grfico N 1. Para evitar estas distorsiones y hacer una medicin ms exacta, se emplea la medicin en el nivel de intervalo, en el que se establecen distancias iguales para cada puntuacin, es decir, se disea una escala con intervalos iguales. Las escalas intervalares o de intervalos iguales poseen las caractersticas de las escalas nominales y de las ordinales. La diferencia est en que las distancias de cada intervalo son iguales. La representacin de este tipo de escala es la siguiente:
a b c d e f g h
|||||||||
0 1 2 3 4 5 6 7 8
Grfico N 2 Por ejemplo, si se midieran cuatro objetos en el nivel intervalar se obtendran los siguientes valores: 8, 6, 5 y 3. En este caso se puede afirmar, con toda razn, que la diferencia entre el primer objeto y el tercero (8 5 = 3) es igual a la diferencia que existe entre el segundo y el cuarto (6 3 = 3). En la medicin intervalar, los intervalos se pueden sumar o restar. Usando la representacin anterior, se puede afirmar que el intervalo entre c y a es 3 1, sea 2; el intervalo que existe entre d y c es 4 3, sea 1. Adems se pueden sumar los intervalos: 2 + 1 = 3 Y se puede comparar la distancia entre d y a (4 1 = 3) y la distancia entre g y d (7 4 = 3) y afirmar que las distancias son iguales. Lo que no se puede es afirmar que el aprovechamiento de d es dos veces superior al de b. Para formular este tipo de afirmacin se requiere un nivel ms elevado de medicin. Con la medicin intervalar se puede elaborar escalas, como la escala vigesimal para medir el rendimiento acadmico. Esta escala abarca del 1 al 20. La medicin del coeficiente intelectual tambin se realiza en una escala de intervalo. La medicin en el nivel de intervalo supone la medicin en los niveles previos, es decir, en el nivel nominal y ordinal. 3.4 Nivel proporcional o de razn Este nivel es el ms elevado de la medicin. Es el ideal de la medicin cientfica. Una escala de este tipo, adems de poseer las caractersticas de los niveles que se han descrito, parte del concepto de cero. Sin embargo, en algunos casos, la ubicacin
17
ELAS MEJA MEJA
del cero es relativa, lo que origina diferencias entre las escalas: la escala Celsius es diferente a la escala Farenheit, porque para medir la temperatura ambas escalas ubican el cero en posiciones diferentes. En el nivel de medicin de razn se puede elaborar escalas que consideren valores sobre cero o bajo cero, como es el caso de las escalas para medir la temperatura o la presin atmosfrica. Con estas escalas se puede realizar todas las operaciones aritmticas, como son la multiplicacin y la divisin, adems de la suma y la resta. Si existiera una escala para medir el rendimiento acadmico en el nivel proporcional, se podra decir que un estudiante, cuya calificacin fuese 16, tendra un rendimiento acadmico dos veces superior con respecto de otro estudiante que obtenga la nota 08, sin embargo esto no es as en la realidad. La medicin de la temperatura o de la presin atmosfrica son ejemplos de mediciones realizadas en el nivel proporcional, debido a que informan de temperaturas o niveles de presin atmosfrica sobre cero o bajo cero, pero la medicin que se expresa bajo cero, indica la presencia de alguna magnitud y no la ausencia total de la caracterstica. En las ciencias naturales, ltimamente se est trabajando en el concepto del cero absoluto o de la ausencia total de la caracterstica. Lord Kelvin considera que el punto donde no hay choques de molculas que crean calor es el punto en el que se ubica el cero absoluto, ausencia de temperatura, y este punto es equivalente a 273 grados Celsius, punto en el que los cientficos consideran que no existe temperatura debido a que no existe actividad molecular. La medicin de la temperatura, empleando este criterio, sera una medicin exacta, pues el punto en el que se ubica el cero es precisamente el punto donde no existe temperatura. Sin embargo, parece que son muy pocos los sistemas de medicin que parten del cero absoluto que permiten una medicin exacta de los fenmenos.
4. MEDICIN DE VARIABLES CONDUCTUALES

Cabe enfatizar que los niveles de medicin que se acaban de describir son jerrquicamente secuenciales, es decir, en el nivel siguiente se reflejan las caractersticas del nivel previo. As, en la medicin ordinal tambin estn presentes las caractersticas del nivel nominal; en el nivel de intervalo se presentan tambin las caractersticas de los niveles nominal y ordinal y, en el nivel proporcional o de razn se presentan, como se ha dicho, las caractersticas de todos los niveles anteriores. Por ejemplo, sean 16,54 y 12,67 las puntuaciones halladas en la variable xito acadmico de un grupo experimental y de otro de control, respectivamente. Tales puntuaciones han sido establecidas en el nivel de intervalo, pero pudieran tambin haber sido obtenidas en el nivel ordinal o nominal. Los datos a los que se
18
hace referencia informan que el xito acadmico del grupo experimental es mayor que el xito acadmico del grupo de control: nivel ordinal. Los mismos datos nos informan que el grupo experimental y el grupo de control son diferentes, pues estn identificados con distintas puntuaciones: nivel nominal. Para medir con mayor exactitud una variable es recomendable identificarla con la mayor precisin posible y, si fuera el caso, operacionalizarla, es decir, expresarla en funcin de sus indicadores o manifestaciones ms significativas. Tambin es importante destacar que la mayora de las variables conductuales o las variables que estudian las ciencias sociales, en general, se miden en el nivel nominal, aunque algunas se miden en el nivel ordinal y muy pocas en el nivel de intervalo. Cuando se mide variables en el nivel de intervalo, se elaboran escalas ad hoc, que tienen su punto de partida en la definicin operacional de la variable que previamente debe haber elaborado el investigador. Pero se debe tener cuidado al analizar la informacin que proporciona este tipo de medicin pues, en la mayora de los casos, el nivel de intervalo slo proporciona algo ms de informacin de la que proporciona el nivel ordinal. Por ejemplo, si un estudiante obtiene un coeficiente intelectual de 110, esto no quiere decir que este estudiante sea 7 puntos ms inteligente que un estudiante que, sea el caso, obtiene un coeficiente intelectual de 103. ltimamente, los niveles de medicin descritos por Stevens estn recibiendo duras crticas de parte de los cientficos sociales quienes consideran que estos niveles son muy rgidos y no reflejan, de manera natural, los fenmenos que suceden en el mundo real. Estos crticos consideran que algunas variables conductuales no necesariamente deben ser medidas en uno de estos cuatro niveles, como por ejemplo la inteligencia y el aprendizaje. Por ejemplo, estas variables no podran ser medidas en el nivel de razn, porque carecen del cero, debido a que una persona no puede tener cero, es decir, ausencia total de inteligencia o de conocimientos, como se pretende cuando se dice que el aprendizaje se mide en la escala vigesimal de 0 a 20 puntos. No es posible asignar a un alumno el calificativo de cero porque un ser humano no puede tener la mente en blanco o vaca, que es lo que corresponde al concepto de cero. Este estudiante, por muy pocos conocimientos que posea, tendra alguna cantidad de conocimientos, sus conocimientos deben tener alguna magnitud; es imposible que no tenga conocimientos o est con la mente vaca. El rendimiento acadmico no puede medirse a partir de cero.
5. INSTRUMENTOS DE ACOPIO DE DATOS

Con el nombre genrico de instrumentos de acopio de datos se denomina a todos los instrumentos que pueden servir para medir las variables, recopilar informacin con respecto a ellas o simplemente observar su comportamiento.
19
ELAS MEJA MEJA
Los instrumentos que pueden medir las caractersticas de las variables se denominan tests o pruebas, son los instrumentos que sirven para medir distintas variables conductuales, en especial los resultados del aprendizaje. A travs de los datos que proporcionan los instrumentos se trata de obtener informacin exacta sobre el logro de los aprendizajes y se detectan los xitos y fracasos. Cuando el investigador no puede medir directamente las variables debe recopilar informacin acerca de los fenmenos que le interesa conocer haciendo uso de ciertos instrumentos. Para ello emplea listas de cotejo, hace el anlisis documental, construye escalas de opinin, etc. En otros casos, el investigador debe observar el comportamiento de las variables y entonces emplear instrumentos o guas de observacin que, a su vez, pueden ser estructurados o no estructurados.
6. INSTRUMENTOS PARA EL ESTUDIO DE VARIABLES CONDUCTUALES

Las pruebas o instrumentos para estudiar variables conductuales son los siguientes: De medicin de los aprendizajes. De actitudes o de opiniones. De inventario. 6.1 Pruebas de medicin de los aprendizajes Las pruebas para medir aprendizajes se deben elaborar pensando en las caractersticas y las necesidades de la investigacin, por lo que su aplicabilidad se halla limitada a stas y condicionada para la muestra elegida. La calificacin de estas pruebas puede hacerse por la va de dos mtodos: a) En referencia a una norma, y b) En referencia a un criterio. Se dice que una prueba est referida a una norma, cuando para establecer la significatividad de sus resultados, se recurre a la comparacin del puntaje de un estudiante con el promedio alcanzado por el grupo al que pertenece este estudiante. Pruebas referidas a una norma son las que se aplican en los concursos de admisin a las universidades. En este caso, si un postulante alcanza 150 puntos en una prueba que tiene el puntaje mximo de 300 puntos y el promedio del grupo es 137, se puede decir que es un buen estudiante, pues se halla por encima de la norma del grupo. Tambin se puede decir que este alumno ocup el segundo puesto si slo existiera un solo postulante que tenga un puntaje mayor que l y obviamente, que ingres en la universidad.
20
Se dice que una prueba est referida a un criterio si previamente se ha establecido este criterio o nivel de desempeo especfico para esta prueba. Por ejemplo, cuando se mide aprendizajes se usa, por lo general, la escala vigesimal y se establece que para estar aprobado es necesario obtener la nota 11. Este criterio cambia en otras circunstancias, por ejemplo, en las escuelas de postgrado de las universidades, cuando se establece que la nota aprobatoria es 13 14, dentro de la misma escala vigesimal. Como se podr apreciar, aqu aparece otro criterio, naturalmente ms exigente. Como consecuencia de la aplicacin de este criterio se establece una particin del grupo de estudiantes que han dado la prueba: aprobados y desaprobados.
6.2 Pruebas de actitud En las pruebas de actitud, llamadas tambin de opiniones, se indaga acerca de las actitudes u opiniones de los individuos con respecto a ciertas situaciones que plantea el investigador. Por ejemplo, si se desea estudiar las actitudes u opiniones que asumen los docentes universitarios con respecto al tipo de formacin profesional que se debe realizar en las universidades, el investigador plantear algunos reactivos acerca de los cuales deben opinar quienes resuelven esta prueba. El formato bsico segn el cual se elaboran estas pruebas es el siguiente: a) Se establece, con la mayor precisin posible, el nombre de la prueba. b) Se redacta un enunciado con las instrucciones segn las cuales debe actuar la persona a quien se aplica la prueba. Segn las necesidades del investigador, la prueba puede ser nominal o annima. c) Se traza una tabla con tantas columnas como datos se pretende recoger y con tantas lneas como temes o reactivos se haya previsto plantear. En la primera columna se colocan los temes o reactivos que en realidad son proposiciones redactadas en sentido positivo o negativo a las que el examinado pueda responder emitiendo su opinin a favor o en contra. En las columnas siguientes se colocan las posibilidades de respuesta, organizadas en una especie de escala de tres, cuatro, cinco o seis alternativas. Suponiendo que la escala fuese de cinco valores, las alternativas pueden ser las siguientes: MA (muy de acuerdo); A (de acuerdo); I (indiferente); D (en desacuerdo); MD (muy en desacuerdo). El investigador debe asignar, en seguida, puntajes a cada tipo de respuesta, por ejemplo: MA = 5; A = 4; I = 0 (por ser indiferente); D = 2; MD = 1. En el Cuadro N 1 se grafica lo que se acaba de decir:
21
ELAS MEJA MEJA
FRAGMENTO DE UNA PRUEBA DE ACTITUDES

N OPINIONES MA 1 Es muy acertada la orientacin que se ha adoptado en la 1 Universidad para formar profesionales en el aspecto intelectual, fundamentalmente. 2 Todo buen profesional debe poseer habilidades para comunicarse 5 con eficiencia con sus semejantes. Por eso son muy importantes los cursos de Lenguaje y Comunicacin. 3 La identificacin con la cultura y la realidad de su pas es una 5 condicin bsica para un exitoso desempeo profesional. 4 En la Universidad no deben llevarse a cabo actividades para 1 orientar la conducta tica y moral de los alumnos, porque esos aspectos no son parte de la formacin profesional. 5 Por lo general, los profesionales que, adems de su especialidad 1 profesional, conocen el arte y saben apreciarlo, no tienen tanto xito en su especialidad profesional. A 2 I 0 D 4 MD 5
4 2
0 0
2 4
1 5
Cuadro N 1
Para evaluar la prueba, el investigador debe establecer, previamente cules respuestas debe evaluar en sentido positivo y cules en sentido negativo. Las puntuaciones obtenidas las debe totalizar mediante una suma algebraica, es decir, sumando las respuestas en positivo y restando las respuestas en negativo.
7. CUALIDADES DE LOS INSTRUMENTOS DE ACOPIO DE DATOS

El xito de una investigacin, adems de la plena identificacin de las variables, la correcta formulacin de la hiptesis, la estrategia adecuada para probar dichas hiptesis, etc., depende de la calidad de los instrumentos de acopio de datos, de ah que resulta muy importante que el investigador asuma esta tarea con la mayor responsabilidad posible. Esto quiere decir que el investigador debe preocuparse en cuidar que los instrumentos que elabora para acopiar los datos, posean cualidades bsicas y necesarias. Si un instrumento no posee las cualidades necesarias, la investigacin puede adoptar un sesgo peligroso y se puede llegar a lo que los expertos denominan, resultados espreos o incorrectos en una investigacin. Los instrumentos de acopio de datos deben poseer estas cualidades que pongan en evidencia su bondad para recolectar los datos que requiere el investigador. Muchas veces, el investigador fracasa en sus esfuerzos al recolectar los datos debido a que sus instrumentos no poseen las cualidades mnimas y le proporcionan datos falsos o equivocados. Un buen instrumento debe reunir ciertas cualidades que lo tipifiquen como tal.
22
Son muchas las cualidades que deben poseer los instrumentos de acopio de datos, pero las ms importantes son las siguientes: validez, confiabilidad, objetividad, amplitud, practicabilidad y adecuacin. 7.1 Validez La validez es una cualidad que consiste en que las pruebas midan lo que pretenden medir. Las pruebas deben medir las caractersticas especficas de las variables para las cuales fueron diseadas. Las pruebas que no poseen validez no tienen utilidad alguna. La validez tambin se denomina veracidad, exactitud, autenticidad, o solidez de la prueba. La validez se refiere a los resultados de la prueba, no a la prueba misma. Estos resultados no se expresan en trminos categricos: resultados vlidos o resultados no vlidos, sino que estos resultados se expresan en forma de una continuidad o progresin, as los resultados sern de escasa validez o de mucha validez, pasando por mltiples situaciones intermedias. La validez de los resultados de una prueba slo tiene sentido dentro del contexto en el que ocurre la prueba. Por ejemplo, un tem de resolucin de problemas de sumas ser vlido si lo que se desea es medir esta habilidad en los estudiantes. Pero este mismo tem no ser vlido si lo que se desea es explorar las habilidades de multiplicacin que habran desarrollado. Sin embargo, las pruebas no poseen validez universal. Una prueba vlida para una situacin determinada puede carecer de validez para otra. La validez puede ser de varios tipos: validez de contenido, validez de construccin, validez predictiva, validez concurrente y validez estadstica. Validez de contenido Denominada tambin validez lgica o de muestreo. Consiste en que los contenidos o conceptos planteados en los temes correspondan con los previstos en los objetivos del aprendizaje. La validez de contenido adquiere mayor importancia cuando se trata de comprobar resultados del aprendizaje. En otras palabras, la validez de contenido es el grado de fidelidad con el que una prueba refleja el universo de reactivos del cual se extrajeron los temes. Universo de reactivos es un concepto terico que alude a todos los posibles temes que se podran formular sobre un determinado tema. Por ejemplo, si se desea explorar cunto saben los estudiantes de medicina acerca de la Histologa, se tendra que redactar todos los temes posibles sobre este tema, lo que resulta un imposible. Sin embargo, teniendo en cuenta que ste es un concepto terico, los temes que se
23
ELAS MEJA MEJA
redacten de una prueba de Histologa se considerarn una muestra de este universo de reactivos y, por tanto, se asume que lo representan fielmente. As, la prueba de Histologa que se prepare, ser capaz de medir realmente los conocimientos de Histologa y no otro tipo de conocimientos. Para determinar la validez de contenido se analiza el universo de contenidos respectivo y se selecciona una muestra representativa de ellos, la que debe ser explorada por la prueba. Por ejemplo, si se trata construir una prueba de lgebra, se debe partir de los objetivos del aprendizaje previstos y examinar los textos que existen sobre la materia con la finalidad de determinar el universo de contenidos y luego decidir qu contenidos debe abarcar la prueba y qu proporcin de temes debe asignarse a cada uno de los aspectos de la materia que se evala. Si se desea saber si una prueba ya publicada tiene validez de contenido para los estudiantes a quienes se pretende aplicar, se deber comparar los objetivos de aprendizaje previstos para ellos con el contenido de la prueba a aplicarse. La validez de contenido se puede comprobar segn los siguientes criterios: a) Criterio curricular o programtico: Los contenidos a medir deben estar previstos en el currculo o en el programa de enseanza. Para el caso se puede elaborar una tabla de cotejo que permita determinar que todos los contenidos que aparecen en la prueba han sido considerados en el programa curricular. b) Criterio bibliogrfico: Los contenidos a medir deben aparecer en los diferentes textos de la materia. c) Criterio de pertinencia: Los contenidos a medir deben estar adecuados a las capacidades intelectuales de los sujetos que respondern la prueba. De este criterio se desprende la necesidad de determinar los ndices de dificultad, tanto de los temes como de la prueba. d) Criterio de utilidad social: Los contenidos a medir deben tener significado o importancia para la vida prctica. La validez de contenido se determina generalmente mediante el juicio de expertos, sin embargo, hay tcnicas como la aplicacin de pruebas paralelas o el estudio de errores comunes, que proporcionan la informacin requerida sobre este tipo de validez. Validez de constructo o de concepto El constructo es un concepto elaborado al ms alto nivel de abstraccin y sirve para referirse a una caracterstica o aspecto de la conducta humana, como por ejemplo, la habilidad mecnica, la inteligencia o el aprendizaje.
24
La validez de constructo es el grado de correspondencia o congruencia que existe entre los resultados de una prueba y los conceptos tericos en los que se basan los temas que se pretenden medir. La validez de constructo trata de establecer en qu medida la prueba tiene en cuenta los aspectos que se hallan implcitos en la definicin terica del tema a medirse. Este tipo de validez es el ms importante, pues si se elabora una prueba sobre Anatoma, los resultados de la prueba deben medir realmente conocimientos acerca de lo que entendemos por Anatoma y no sobre cualquier otro concepto. En este caso, la dificultad radica en la capacidad que se tenga para definir correctamente el constructo que se desea explorar. Se denomina tambin validez de elaboracin o de hiptesis de trabajo. Se determina en base al juicio de expertos o a los tipos y grados de relaciones existentes entre el resultado de la prueba y las medidas de otros factores asociados. Es el tipo de validez ms importante. Cuando se trata de determinar la validez de constructo, se procura analizar la naturaleza de las caractersticas que el investigador se ha propuesto medir. La validez de constructo no slo evala la prueba, sino tambin la teora en la que se apoya la prueba. Cuando los datos obtenidos confirman las predicciones de la teora, significa que, al menos por el momento, se han hallado evidencias que convalidan la hiptesis e indican que la prueba mide las relaciones previstas por esta ltima. Si las predicciones no son confirmadas, se debe suponer que la causa puede ser una de las siguientes: la prueba no mide el concepto, la hiptesis es incorrecta, se requiere un nuevo anlisis, o el diseo de la investigacin no es el ms adecuado.
Validez predictiva La validez predictiva es la capacidad que tienen las pruebas de predecir acontecimientos futuros, tales como el xito que un individuo alcanzar en sus estudios o en su trabajo. Para determinar la validez predictiva se procede del siguiente modo: 1. Se administra la prueba. 2. Se espera que se produzcan los desempeos pronosticados. 3. Se compara los puntajes de la prueba con los desempeos reales del sujeto. Suponiendo que una prueba ha sido elaborada para predecir el xito que los alumnos lograrn durante el primer ao de estudios universitarios, para determinar su validez predictiva, se administrar la prueba a una amplia muestra de alumnos
25
ELAS MEJA MEJA
del 5 ao de Secundaria, seleccionados al azar. Una vez que estos sujetos hayan terminado el 1er. ao de estudios universitarios, se cotejarn ambas series de puntuaciones. Cuanto ms alta sea la correlacin entre ambas series de puntuaciones, la prueba tendr mayor capacidad predictiva. Sin embargo, a nivel terico, el pronstico slo puede ser vlido si la comparacin con los desempeos reales se hace en situaciones iguales o semejantes a las existentes al momento de aplicar la prueba, cosa que no habra ocurrido en la situacin descrita en el prrafo anterior.
Validez concurrente La validez concurrente es la correlacin que puede hallarse entre las puntuaciones logradas luego de la aplicacin de la prueba, con respecto a las puntuaciones obtenidas por los mismos sujetos en otras mediciones realizadas simultneamente. El procedimiento para determinar la validez concurrente es similar al que se emplea para verificar la validez predictiva, slo que la correlacin puede hallarse casi de inmediato, ya que los datos se obtienen simultneamente. Los puntajes que los estudiantes obtienen en una nueva prueba se pueden comparar con las calificaciones que recibieron ltimamente en la materia o con los puntajes que los mismos alumnos alcanzaron en otras pruebas similares, cuya validez ya fue comprobada. Por ejemplo: En lugar de esperar varios aos para determinar si una prueba de inters vocacional es capaz de predecir el xito en determinada profesin, se puede cotejar esta prueba con las pautas de inters de las personas que han alcanzado xito en la profesin correspondiente.
Validez estadstica o emprica Es el tipo de correlacin que existe entre los resultados de la prueba y la situacin real del sujeto en los aprendizajes cuyos resultados se mide. Para establecerla se usa las siguientes tcnicas: 1. Comparacin con las diferentes calificaciones obtenidas. 2. Incremento del porcentaje de xito por edades y grados sucesivos. 3. Anlisis de las diferencias entre los puntajes obtenidos por 2 grupos diferentes de alumnos.
26
7.2 Confiabilidad El trmino confiabilidad proviene de la palabra fiable, y sta a su vez de fe. La confiabilidad es el proceso de establecer cuan fiable, consistente, coherente o estable es el instrumento que se ha elaborado. Por eso, cuando el investigador, al referirse a una persona dice que sta es confiable, quiere decir que le inspira confianza, que tiene fe en ella y en cambio cuando se refiere a otra persona puede decir que no le merece confianza, que duda de su conducta futura. Una persona considerada confiable es aquella que actuar en el futuro, del mismo modo como ha actuado en el pasado. As tambin, un instrumento de acopio de datos ser confiable, inspirar confianza, cuando al ser aplicado en repetidas ocasiones arroje los mismos resultados. Cuando se realizan procesos de medicin, el puntaje observado de una variable equivale al puntaje verdadero ms el margen de error. El puntaje observado es el valor que se obtiene al medir una variable, sin embargo, ste no es el puntaje verdadero; el puntaje verdadero es el resultado de la medicin exacta de la variable. Por ejemplo, los estudiantes tienen un determinado nivel de xito acadmico en sus estudios que es precisamente el que se quiere conocer. Este valor es nico y cuando se hacen sucesivas mediciones, se obtienen diversos puntajes aproximados a este valor, pero no se obtiene el verdadero valor de la variable, precisamente porque el investigador no dispone de un instrumento tan perfecto que sea capaz de medir la real magnitud de, en este caso, el xito acadmico de los estudiantes, que efectivamente existe pero no lo puede conocer. De esta idea parte aquello de que toda medicin debe ser isomrfica con la realidad, es decir, que las mediciones que se obtengan, aunque no sean exactas, deben ser, por lo menos, aproximadas a la real magnitud del fenmeno que se estudia. La humanidad ha avanzado mucho en la medicin del tiempo, entre otros fenmenos que ha medido, y los resultados de tales mediciones son asombrosamente aproximadas a la real magnitud del tiempo, sin embargo, los cientficos declaran que sus mediciones del tiempo se estn realizando con aproximaciones de dcimas, centsimas o milsimas de segundo, pero nunca logran medir el tiempo exactamente y sin mrgenes de error. Sin embargo, se puede decir que la medicin del tiempo es isomrfica con la realidad, porque el margen de error es muy pequeo, tan pequeo que resulta insignificante. Pero es el caso que se constata que los instrumentos que se disponen para medir las variables del comportamiento, tales como la inteligencia, el xito acadmico, la motivacin por los estudios, etc., no son tan precisos como los instrumentos que la humanidad dispone para medir el tiempo o el espacio. Ah radica, entonces, la importancia de elaborar instrumentos confiables que permitan al investigador aproximarse, lo ms cerca posible, al valor real de las variables y
27
ELAS MEJA MEJA
para ello debe el investigador reducir el margen de error con el que hace las mediciones. En este sentido, si tericamente un estudiante tiene 17,57 puntos de xito acadmico en sus estudios y el investigador ha obtenido, con los instrumentos que dispone, una puntuacin de 17,13, se podr decir que ha hecho una medicin exacta y el margen de error es relativamente pequeo, pero si le asigna un puntaje de 12,45, entonces el investigador se est alejando del valor verdadero del xito acadmico del estudiante. Sin embargo, con una prueba confiable, en las repetidas oportunidades en que se realicen las mediciones, se obtendrn valores muy prximos al valor terico y, en este caso, se podra considerar que los resultados de estas mediciones son ms cercanos al puntaje verdadero, 17,57, son ms plausibles que el valor de 12,45 obtenido con una prueba poco confiable. Como se ha dicho, la confiabilidad es la seguridad, exactitud, precisin o consistencia que debe poseer una prueba. Una prueba es confiable si al aplicarla en reiteradas ocasiones a los mismos sujetos y en idnticas condiciones se obtiene iguales resultados. Por ejemplo, si un estudiante alcanza un puntaje de 110 en una prueba de inteligencia, debe lograr aproximadamente el mismo resultado si, una semana ms tarde, se le administra una forma equivalente de la misma la prueba. La confiabilidad se expresa mediante el ndice de confiabilidad. El ndice de confiabilidad perfecto es 1, muy difcil de alcanzar. Los ndices de confiabilidad aceptables oscilan entre 0,66 y 0,71, como mnimo, es decir, decimales que tienden a acercarse a la unidad. El ndice de confiabilidad de una prueba se obtiene aplicando la siguiente frmula:
Donde: Cf = n = x = = Coeficiente de confiabilidad Puntaje mximo alcanzado. Promedio. Desviacin standard de las puntuaciones de la prueba.
Sean los siguientes datos: n = 18 x = 14,27 = 3,1 Entonces:
28
Cf = 1,0588 x [1 0,3077] Cf = 1,0588 x 0,6923 Cf = 0,73 Con los datos proporcionados, el ndice de confiabilidad hallado es 0,73. La tabla de Kder Richardson permite interpretar este valor hallado: 0,53 a menos 0,54 a 0,59 0,60 a 0,65 0,66 a 0,71 0,72 a 0,99 1,0 = = = = = = Confiabilidad nula Confiabilidad baja Confiable Muy confiable Excelente confiabilidad Confiabilidad perfecta
Como se ha obtenido el valor de 0,73, se deduce que la supuesta prueba analizada tiene un excelente coeficiente de confiabilidad Otro ejemplo. Sean los siguientes datos: n = 98 x = 70 = 6,8 Entonces:
El resultado 0,57 significa que la prueba tiene bajo ndice de confiabilidad.
Factores que permiten mejorar la confiabilidad de una prueba Existen muchos factores que permiten mejorar el ndice de confiabilidad. Mucho depende del cuidado y del esmero que ponga el investigador al elaborar la prueba y tambin de su experiencia en este tipo de tarea. Sin embargo, en forma muy puntual, se puede mencionar los siguientes factores:
29
ELAS MEJA MEJA
a) Adecuado nmero de temes. Una prueba con pocos temes no es muy confiable. b) Homogeneidad de los elementos de la prueba. Cuanto mayor sea la homogeneidad de los elementos de una prueba, la prueba ser ms confiable. c) ndice de discriminacin de los temes. A mayor ndice de discriminacin de los temes, mayor confiabilidad de la prueba. d) Grado de dificultad de la prueba. Las pruebas que tienen un ndice de dificultad media son ms confiables. e) Grado de representatividad de la prueba. La prueba debe contener temes que constituyan una muestra representativa de las conductas a medir.
Tcnicas para incrementar la confiabilidad de una prueba Como quiera que la confiabilidad depende de la relacin que existe entre el puntaje verdadero y el puntaje observado, es lgico suponer que cuanto menor sea el margen de error, el puntaje observado se hallar ms cercano al puntaje verdadero, que es un concepto terico. De modo que si se desea incrementar la confiabilidad de un instrumento de acopio de datos, lo que se deber hacer es tratar de disminuir el margen de error. Las siguientes son las tcnicas ms eficaces para incrementar la confiabilidad. Aumentar el nmero de temes o de observaciones de una prueba. Cuanto mayor sea la muestra extrada del universo de conductas que se est estudiando, es ms probable que tal muestra sea ms representativa y ms confiable. Eliminar los temes difciles o ambiguos. Los temes difciles o ambiguos son respondidos de distintas formas, lo que hace disminuir la confiabilidad de la prueba. Estandarizar las condiciones en las que se administra la prueba. Todas las personas a quienes se aplique la prueba deben resolverla en igualdad de condiciones. No puede ser que mientras un grupo de sujetos resuelva la prueba en un ambiente adecuado y sin ruidos ni interferencias, otro grupo resuelva la prueba en un ambiente inapropiado y con muchas interferencias. Emplear temes con adecuado ndice de dificultad. Toda prueba que contenga tems demasiado fciles o demasiado difciles no mide el real desempeo de los examinados. Minimizar los efectos de factores externos. Es preferible no someter las pruebas a procesos de confiabilidad en momentos en que la sociedad vive circunstancias especiales, como son las pocas de elecciones, la sucesin de
30
varios das feriados, los das de convulsin social, etc. Es recomendable postergar la prueba para momentos ms oportunos debido a que es muy probable que tales eventos influyan en el nimo de los sujetos y produzcan distorsiones en los resultados de la medicin. Estandarizar las instrucciones. Diferentes investigadores que administran la prueba en distintos grupos, debern leer las mismas instrucciones y presentar la prueba en las mismas condiciones. Mantener procedimientos de calificacin coherentes. Esto es recomendable especialmente cuando la prueba contiene temes de respuesta abierta. En este caso, un evaluador no acta del mismo modo cuando califica la primera prueba que cuando califica la ltima de una cantidad grande de pruebas. Es necesario que la actitud del evaluador sea consistente y que disponga de criterios objetivos segn los cuales pueda guiarse al momento de asignar puntajes a las respuestas.
Tcnicas para establecer la confiabilidad de una prueba Para determinar la confiabilidad de una prueba, por lo general, se compara dos versiones de la misma prueba. La forma numrica de expresar esta comparacin es a travs de un coeficiente de correlacin (r) que puede existir entre ellas. Cuanto ms alto sea el coeficiente de correlacin positiva entre las dos versiones de la prueba, la prueba ser ms confiable. Dems est decir que el coeficiente de correlacin perfecto es 1,00 y para asignar alto grado de confiabilidad a una prueba se debe esperar obtener coeficientes de, ms o menos, 0,80. Las principales tcnicas para determinar la confiabilidad son las siguientes: a. Tcnica de la replicacin o test - retest: La prueba o test se aplica dos o ms veces al mismo grupo de estudiantes y se correlacionan las series de puntuaciones obtenidas. Para que la prueba sea confiable se espera que la correlacin sea alta. La desventaja de este mtodo consiste en que los resultados del post test puedan ser influenciados por el pre test, habida cuenta que el test que se aplica es el mismo, as como el grupo que responde la prueba. b. Tcnica de la aplicacin de dos versiones paralelas de una misma prueba. Se elabora dos versiones paralelas de la misma prueba y se aplica, cada una de ellas, a dos grupos distintos. En base a las dos series de puntuaciones as obtenidas se calcula el coeficiente de correlacin de tales series de puntuaciones; si la correlacin es alta, se puede establecer que la prueba es confiable. Esta tcnica se aplica cuando se sospecha que el recuerdo o la prctica en el pre test, pueda influir en los resultados del post test. La desventaja de esta tcnica es la dificultad
31
ELAS MEJA MEJA
para elaborar versiones paralelas de la misma prueba y cuidar que los grupos a los que se aplica sean relativamente iguales entre s. c) Tcnica de aplicacin de la prueba en mitades. Esta tcnica consiste en dividir la prueba, al azar, en mitades y aplicarla al mismo grupo en un solo momento. El coeficiente de correlacin se obtiene correlacionando la serie de puntuaciones obtenidas en la primera mitad de la prueba con las puntuaciones obtenidas en la segunda mitad. Si por ejemplo una prueba tiene 40 temes, se considera la primera mitad a los 20 primeros temes y la segunda mitad sern los 20 temes restantes. Otra tcnica ms efectiva es considerar primera mitad a los temes impares y segunda mitad a los temes pares. Para dividir la prueba en dos mitades empleando este criterio, se disea una hoja de respuestas de modo tal que las respuestas a los temes impares se coloquen en la columna de la derecha y las respuestas a los temes pares se coloquen en la columna de la izquierda. De este modo es posible obtener dos series de puntuaciones en un mismo tiempo y con los mismos sujetos, lo que neutraliza la desventaja de la administracin de test, es decir, la influencia que puede producir el hecho de aplicar dos veces una prueba a un mismo sujeto. El siguiente grfico ilustra lo dicho:
HOJA DE RESPUESTAS
1 3 5 7 9 11 13 15 17 19 a a a a a a a a a a b b b b b b b b b b c c c c c c c c c c d d d d d d d d d d 2 4 6 8 10 12 14 16 18 20 a a a a a a a a a a b b b b b b b b b b c c c c c c c c c c d d d d d d d d d d
Grfico N 3 Con este mtodo, la prueba se aplica una sola vez, se evita los efectos del pre test y se puede establecer que la prueba ha sido aplicada a dos grupos iguales de sujetos. a. Tcnica de la administracin en tiempo diferido. Una misma prueba debe ser administrada al mismo grupo en dos ocasiones diferentes. De este modo se obtiene las dos series de puntuaciones necesarias para calcular el coeficiente de correlacin. Es recomendable que el lapso entre la primera y la segunda aplicacin no sea ser muy breve, para evitar la llamada administracin de test,
32
es decir, la influencia de la primera aplicacin en los puntajes que se obtengan en la segunda aplicacin. 7.3 Relaciones entre la confiabilidad y la validez La confiabilidad y la validez son cualidades estrechamente relacionadas entre s. Sin embargo, una prueba puede ser confiable pero no necesariamente vlida, por eso, una prueba no puede ser vlida, si previamente no se ha establecido su confiabilidad. Esto significa que la confiabilidad es una condicin necesaria pero no suficiente para establecer la validez de una prueba. Por ejemplo, una prueba para medir aprendizajes matemticos puede ser altamente confiable, pero si pretendemos que esa prueba mida comprensin lectora, obviamente esta prueba ya no ser vlida, aunque siga siendo confiable. En resumen, una prueba puede ser confiable y evaluar de manera consistente un constructo, pero si este constructo no es el mismo que se est estudiando, la prueba no ser vlida. Como se puede notar, en las ciencias sociales an existen serias dificultades para medir las variables que son materia de investigacin. En cambio, en las ciencias naturales, existe un mayor nivel de desarrollo al respecto, debido principalmente a que la mayora de las variables cientfico naturales estn plenamente operacionalizadas y existen diversos instrumentos para medirlas. Las variables del comportamiento humano, por ser elusivas e impredecibles, ofrecen mayores dificultades, tanto para su operacionalizacin como para su medicin. Por eso es que en las ciencias sociales no se dispone de muchos instrumentos para medir estas variables. De ah que resulta de enorme responsabilidad del cientfico social realizar los mayores esfuerzos para construir instrumentos vlidos y confiables que le permitan conocer, con aproximaciones muy cercanas a lo real, las caractersticas de los fenmenos que estudia. De lo contrario, si no se miden correctamente las variables cientfico sociales, se corre el riesgo de arribar a conclusiones equivocadas en la investigacin y de nada habra valido haber planteado buenas hiptesis o haber elegido las mejores estrategias para contrastarlas. El xito en las investigaciones cientfico sociales depende, muy significativamente, de la calidad de los instrumentos con los que se estudian los fenmenos. 7.4 Objetividad La objetividad consiste en que la prueba debe producir los mismos puntajes sea quien fuere el que evale las respuestas. Para lograr esta condicin, las pruebas deben disponer de normas de asignacin de puntajes o claves de respuestas para no tener la necesidad de recurrir a juicios subjetivos para decidir si cada respuesta es correcta o incorrecta.
33
ELAS MEJA MEJA
7.5 Amplitud Es la adecuada extensin que debe tener la prueba. Una buena prueba debe explorar, en un tiempo determinado, la mayor cantidad de informacin. Las pruebas no deben ser muy amplias ni muy escuetas, es recomendable que las pruebas sean de amplitud mediana. 7.6 Practicabilidad Una prueba debe ser prctica o aplicable. Para ello debe estar diseada de tal modo que su administracin e interpretacin sea fcil y de bajo costo. Tambin es conveniente tener en cuenta su utilidad social. La prueba debe conducir a soluciones prcticas, que ofrezcan alguna utilidad en la solucin de los problemas de la vida diaria. 7.7 Adecuacin Cuando se disea una prueba, es necesario determinar si sta es apropiada para el fin que se persigue. Habr que tener en cuenta si la prueba proporciona los datos necesarios, si permitir obtener las medidas en el grado de precisin que el investigador desea, si ser apropiada para la edad y caractersticas de los sujetos, para el momento y la localidad en que se pretende administrarla, o cundo preferir entre dos pruebas igualmente confiables y vlidas. Por estas consideraciones, resultan ms adecuadas las pruebas que tienen formas paralelas y normas especficas para su empleo o aplicacin.
8. PRINCIPIOS PARA CONSTRUIR PRUEBAS

Para construir una prueba, se deben tener en cuenta los siguientes principios: a. Toda prueba debe cumplir un propsito bien definido. Los propsitos pueden ser el diagnstico, el pronstico, la investigacin, etc. Segn sus propsitos, las pruebas adquieren caractersticas particulares en relacin con el ndice de dificultad de los tems, la interpretacin de los resultados, el momento en que deben ser aplicados, etc. b. Las pruebas deben recoger evidencias sobre determinados productos del aprendizaje en funcin de objetivos previamente determinados. Cada tem debe medir algn conocimiento o habilidad especfica. El tipo de tem depender del tipo de aprendizaje que se desee evaluar. Por ejemplo, si se pretende medir conocimientos especficos, no es lo mismo utilizar una pregunta de ensayo que un tem de verdadero falso.
34
c. Las pruebas se construyen en base a un muestreo del universo de contenidos a evaluar. El diseo previo de la estructura de la prueba asegura un buen muestreo. d. Segn sus propsitos, las pruebas deben tener un nivel apropiado de dificultad. Sin embargo, en las pruebas de diagnstico, o en las formativas, lo que interesa es la respuesta personal de los estudiantes para analizar sus deficiencias de aprendizaje y recomendar las alternativas que les permitan lograr los objetivos. e. Los tems de las pruebas deben estar elaborados de modo tal que en la respuesta incluyan slo el logro de un determinado aprendizaje. Lo que importa es que un tem mida determinados productos de aprendizaje y no habilidades pre requeridas para ello. f. Los tems se deben elaborar de tal forma que slo cuando el alumno haya logrado el producto del aprendizaje, sea capaz de formular la respuesta correcta.
9. TCNICA PARA ELABORAR PRUEBAS

Como se requiere mayor cuidado para elaborar tests o pruebas que midan los resultados del aprendizaje, es necesario aplicar una tcnica especfica para construirlos. Si, por ejemplo, se desea elaborar una prueba para medir el aprendizaje de estudiantes universitarios en un curso de Fsica, se procede de la siguiente manera: 1. Determinacin de los propsitos y los usos para los cuales servir la prueba. Los propsitos para los cuales se elaboran las pruebas son mltiples, pero los ms conocidos son los siguientes: motivacin, orientacin, diagnstico, pronstico, administracin, investigacin, validacin, o evaluacin de los resultados del proceso educativo. En este momento se debe establecer si la prueba que se va a elaborar servir para diagnosticar, pronosticar o simplemente para validar el instrumento. En este caso se desea elaborar una prueba para diagnosticar el nivel de aprendizaje en el curso de Fsica. 2. Identificacin del objeto a evaluar. Una vez establecido el objetivo, se determina el objeto a evaluar, es decir la identificacin de los sujetos a quienes se les aplicar la prueba. En este caso, los estudiantes del III Ciclo de la carrera profesional de Ingeniera Mecnica. Cuando la prueba se elabora con fines de investigacin, los sujetos a quienes est dirigida la prueba constituyen la poblacin y los sujetos a quienes se les aplica, deben constituir una muestra representativa de la poblacin que se estudia. 3. Elaboracin de la estructura de la prueba. La estructura de la prueba se grafica mediante un cuadro de doble entrada en el que se consignan los datos requeridos. Este cuadro tambin permite identificar los sub tests que contiene la prueba. En el ejemplo propuesto, se trata de medir el aprendizaje en funcin
35
ELAS MEJA MEJA
de dos variables: a) los objetivos clasificados segn una Taxonoma, en este caso la de Bloom, y b) los contenidos ordenados en Unidades de Aprendizaje. Luego se identificarn los aspectos a medir, que resultan del cruce de estas dos variables. Se decidir si se van a medir todos los aspectos que aparecen en el Cuadro N 2 o solamente algunos de ellos, segn su importancia. En el cuadro de doble entrada segn el cual se representa la estructura de la prueba se consignan los siguientes datos: a. Los objetivos o capacidades que se pretenden medir deben estar identificados en forma clara y precisa en funcin de una determinada taxonoma de objetivos. En este caso, como se ha dicho, se usar la Taxonoma propuesta por Bloom que considera tres dominios del aprendizaje: el cognitivo, el afectivo y el motriz. En el presente ejemplo se han considerado los tres primeros niveles del dominio cognitivo. Cada objetivo debe estar en correspondencia con un determinado nivel del dominio de aprendizaje. En este caso se medirn los resultados del aprendizaje en funcin de dos variables: los objetivos clasificados en la Taxonoma de Bloom y los contenidos, ordenados en Unidades de Aprendizaje. b. Los contenidos en funcin de los objetivos o capacidades. c. La extensin de la prueba, que depende de los siguientes factores:

Propsitos de la prueba. Importancia del objetivo. Grado de confiabilidad que se desea asignar. Tipo de tems que se emplearn. Tamao y complejidad de la pregunta. Modo y tiempo probable de aplicacin. Puntaje total de la prueba. Escala en la que se calificar. Edad de los sujetos. Nivel de capacidad intelectual.
36
ESTRUCTURA DE UNA PRUEBA

Obj. Cont. (total x peso) U. D. N 1 U. D. N 2 U. D. N 3 Total Peso Puntaje (total x peso) 5 4 2 11 1 11 5 3 4 12 2 24 -2 3 5 3 15 50 10 9 9 28 15 16 19 Informacin Comprensin Aplicacin Total Puntaje
Cuadro N 2 En el ejemplo propuesto se observa que se elaborar una prueba con 28 tems que darn un puntaje de 50 puntos que resultan de multiplicar el total de tems de cada nivel de dominio por el peso asignado. La asignacin de pesos depende de la importancia que asigne el investigador a un determinado nivel o dominio de aprendizaje. En el presente caso se observa que se est asignando mayor peso (3) a la aplicacin de la informacin. 4. Seleccin de los tems. Este paso consiste en seleccionar los tems, reactivos o preguntas que debe contener la prueba. En este momento tambin se decide acerca del tipo de tem a utilizar en funcin del nivel y tipo de resultado de aprendizaje o capacidad que se desea medir, de las ventajas y desventajas de los diferentes tipos de tems, del modo en que se utilizarn estos, de las caractersticas de los estudiantes, del tiempo que se requerir para construirlos, del modo de administrar el test, de la escala de medicin a emplear, y de otros factores que considere el investigador. El mejor tem es aquel que mide, del modo ms directo posible, el resultado de aprendizaje deseado. Tambin se debe tener en cuenta si los tems poseen adecuados ndices de dificultad y de discriminacin. 5. Elaboracin de los tems. Si el investigador dispone de un banco de tems, reactivos o preguntas, seleccionar los tems ms adecuados para la prueba que est construyendo, teniendo en cuenta las necesidades de la investigacin. En caso contrario, deber elaborar los tems previstos en la estructura.
37
ELAS MEJA MEJA
6. Eleccin de la escala de medicin. En este punto es necesario establecer si la escala ser decimal, vigesimal, centesimal o cualquier otra. 7. Asignacin de los puntajes de la prueba. Los puntajes de la prueba deben estar de acuerdo con los objetivos, contenidos y o capacidades que se pretende medir o evaluar. Segn la extensin de la prueba, se decidir con respecto a su divisin en partes menores llamadas sub tests. Aqu se realiza el ensamblaje de los tems, que consiste en el ordenamiento de los tems agrupados para cada uno de los sub tests de la prueba. 8. Asignacin de pesos. Se asignan pesos a cada uno de los sub tests de la prueba. De preferencia los pesos deben asignarse porcentualmente en funcin de la importancia de los temas tratados. En el presente ejemplo, el nivel de informacin tiene peso 1, el nivel de comprensin tiene peso 2 y el nivel de aplicacin tiene peso 3. As, la prueba que se va a construir tendr 28 tems que multiplicados por sus respectivos pesos, producirn 50 puntos. 9. Jerarquizacin lgica de los tems. Es conveniente presentar previamente los tems simples y los ms complejos despus. Tambin conviene agrupar los tems por afinidad temtica u otros criterios. 10. Elaboracin de la Tabla de Especificaciones de la prueba. La Tabla de Especificaciones es el conjunto de instrucciones que deben observarse para usarla convenientemente. En este punto se decidir si la aplicacin de la prueba debe ser individual o grupal, si se aplicar a los estudiantes de un determinado ciclo de su formacin profesional, etc. Para hacer un mejor uso de las pruebas, se debe respetar sus especificaciones tcnicas. Las pruebas que cuentan con especificaciones tcnicas pueden ser generalizadas para otras poblaciones. Las especificaciones tcnicas, redactadas de manera clara y concisa, deben referirse a los siguientes aspectos: a) Grado de dificultad que ofrece la prueba. Cuando la medicin se realiza en funcin de una norma, como el caso de los procesos de seleccin de postulantes, los tems debern tener un 50% de dificultad. b) Cuando la medicin se realiza en base a un criterio, el nivel de dificultad variar de acuerdo con el nivel de rendimiento de los estudiantes y la variabilidad que exista entre ellos. La dificultad del tem se determinar, slo en parte, por el nivel de rendimiento que ha alcanzado el estudiante. c) Forma de presentacin de la prueba. Se debe disear un formato que facilite la lectura de las preguntas y la tabulacin de los resultados. Las pruebas generalmente se presentan en forma de cuadernillo.
38
d. Forma cmo deben responder los sujetos. Las respuestas pueden ser orales, escritas o manifestadas a travs de acciones concretas. Las pruebas objetivas son ms fciles de revisar y se responden en hojas separadas. Las de ensayo se contestan normalmente por escrito. La respuesta oral es ms fcil y rpida de evaluar que una escrita o de tipo ensayo. e. Tiempo que demande la aplicacin del test. f. Normas que ayuden a quienes los administraran para establecer si los sujetos alcanzaron el nivel de habilidad promedio, lo superaron o si se hallan por debajo de l. Para formular las normas, el diseador de la prueba extrae una muestra de la poblacin a la cual se destina la prueba, administra la forma final a los sujetos seleccionados y elabora las reglas de acuerdo con los datos obtenidos. 11. Realizacin del Estudio Piloto. Antes de aplicar una prueba, es recomendable realizar un estudio piloto. Cuando los sujetos del estudio piloto terminan de responder el test, el investigador analiza sus respuestas y revisa las instrucciones que no fueron comprendidas claramente. Tambin debe superar los inconvenientes relacionados con el formato elegido y elimina o mejora los tems que mostraron poseer escasa utilidad, etc. Una vez realizadas las correcciones, efecta un nuevo examen para asegurarse que todos los aspectos de la habilidad que se desea medir se hallan representados en el test, con la debida proporcin.
10. INDICADORES DE LA CALIDAD DE UNA PRUEBA

La calidad de una prueba se puede establecer empleando los siguientes criterios: a. Observaciones ms frecuentes de los estudiantes con respecto: Al excesivo nmero de preguntas referidas a uno o ms temas y muy pocas al resto de los contenidos explorados.
A la redaccin ambigua de las pruebas que hasta los alumnos ms aplicados no pueden entenderlas. b. Demasiadas preguntas de los estudiantes durante el examen. c. Mayor tiempo del previsto que necesitaron los estudiantes para responder a las preguntas. d. Situacin en la que los estudiantes ms aplicados no respondieron satisfactoriamente la prueba. e. Anlisis de los temas para determinar su calidad. Para ello se debe obtener el grado de dificultad y el ndice de discriminacin de cada tem.
39
ELAS MEJA MEJA
11. GRADO DE DIFICULTAD DE LA PRUEBA

El grado de dificultad de la prueba se determina aplicando la siguiente frmula:
Donde: Gd x
Gd =
x x 100 Pm
= Grado de dificultad de la prueba. = Promedio de los puntajes obtenidos.
Pm = Puntaje mximo posible de alcanzarse en la prueba. Ejemplo: Hallar el grado de dificultad de una prueba en la que el grupo ha obtenido un promedio de 13,27 y el puntaje mximo es 20. Entonces:
Para interpretar esta cifra se recurre a la siguiente escala de Kuder-Richardson 81% a ms 61% a 80% 51% a 60% 31% a 50% 11% a 30% = Muy fcil = Relativamente fcil = Dificultad adecuada = Relativamente difcil = Difcil
Debajo del 10% = Muy difcil El valor obtenido, 66, revela que la prueba es relativamente fcil. Otro ejemplo: Hallar el grado de dificultad de una prueba cuyo promedio es 18,37 y el puntaje mximo es 40.
Esta es una prueba relativamente difcil.

40
12. NDICE DE DISCRIMINACIN DE UNA PRUEBA

Para hallar el ndice de discriminacin de una prueba se forman dos grupos de estudiantes en funcin de sus respuestas correctas. El grupo superior est constituido por los estudiantes que respondieron mejor y el grupo inferior por los que alcanzaron puntajes ms bajos. El ndice de discriminacin se establece analizando las diferencias de las respuestas correctas del grupo superior y las respuestas correctas del grupo inferior. Se supone que los estudiantes del grupo superior tendrn mejores respuestas que los del grupo inferior y el ndice de discriminacin ser ms alto cuanto mayor sea la diferencia de las puntuaciones correctas del grupo superior con respecto a las del grupo inferior. Para hallar el ndice de dificultad de una prueba se aplica la siguiente frmula:
Id =
Donde: Id
pms pmi x 100 PM
= ndice de dificultad de la prueba.
pms = Puntaje mximo de respuestas correctas del grupo superior. pmi = Puntaje mximo de respuestas correctas del grupo inferior. PM = Puntaje mximo de la prueba. Si se ha aplicado una prueba a un grupo de 50 estudiantes y se ha elaborado el orden de mrito, de mayor a menor, se considerar grupo superior a los 25 estudiantes que obtienen las ms altas puntuaciones y grupo inferior a los 25 restantes que tienen ms bajas puntuaciones. Ejemplo: Hallar el ndice de discriminacin de una prueba en la que el puntaje mximo de respuestas del grupo superior es 18 y el puntaje mximo de respuestas correctas del grupo inferior es 11. El puntaje total de la prueba es 20. Entonces:
Id =
18 11 x 100 = 35 20
Para interpretar esta cifra se recurre a la siguiente tabla: 40% a ms = 30% al 39% = 20% al 29% = menos de 19% = Buen ndice de discriminacin. Razonable ndice de discriminacin. Regular ndice de discriminacin. Deficiente ndice de discriminacin.
41
ELAS MEJA MEJA
La prueba analizada posee un razonable ndice de discriminacin. Otro ejemplo: Hallar el ndice de discriminacin de una prueba en la que el puntaje mximo del grupo superior es 15 y el puntaje mximo del grupo inferior es 6. El puntaje mximo de la prueba es 20.
45 % significa que esta prueba posee un buen ndice de discriminacin.
13. LOS TEMES

Los tems, llamados tambin reactivos, son preguntas que se formulan en funcin de los propsitos para los que ha sido elaborada la prueba. La respuesta a los tems proporciona la informacin requerida por lo que de su construccin depende la mayor y mejor informacin que se pueda obtener. Para construir un buen tem se debe tener un profundo conocimiento de la materia que se explora, asumir un conjunto de valores educativos, conocer y entender a las personas que van a responder la prueba y ostentar ciertas capacidades especficas de comunicacin verbal. Un tem debe estar diseado de tal manera que motive a la persona a proporcionar un determinado tipo de respuesta. Es muy importante que el tem est bien construido y que mida, tan directamente como sea posible, el resultado del aprendizaje que se desea conocer.
Id =
15 0 20
14. CLASIFICACIN DE LOS TEMES

Existe una amplia variedad de temes, cada uno de los cuales posee ventajas y desventajas. Segn el tipo de respuesta que se espera de los temes, stos pueden clasificarse en dos grandes grupos: temes de respuesta abierta e temes de respuesta cerrada. 14.1 temes de respuesta abierta Los temes de respuesta abierta se conocen tambin como temes de tipo cuestionario o ensayo. Como su nombre lo indica, las respuestas las proporcionan los estudiantes quienes las redactan tratando de demostrar los conocimientos que poseen. Este tipo de tem permite explorar una amplia gama de conocimientos que poseen, sin embargo, su desventaja consiste en que ofrecen muchas dificultades para calificarlos pues los criterios que emplea el evaluador casi siempre son subjetivos.
42
Los tems de respuesta abierta todava pueden variar en dos tipos: a) los que se aplican con lmite de tiempo y, b) los que se aplican sin lmite de tiempo. En este ltimo caso, los tems o reactivos sirven para medir la performance de quien responde, es decir, hasta donde es capaz el estudiante de responder las preguntas sin la presin del tiempo.
14.2 tems de respuesta cerrada Como su nombre lo indica, presentan respuestas preestablecidas y la tarea consiste en seleccionar o identificar una de las respuestas planteadas. Este tipo de tem tiene la ventaja de estar referido a criterios objetivos para su calificacin; sin embargo, limitan, por la respuesta ya planteada, otras respuestas que pudiera formular el sujeto. Los tems de respuesta cerrada se subdividen en los siguientes tipos: a) de pareamiento, b) de respuesta corta, c) de oraciones incompletas, d) verdadero-falso, e) de alternativa mltiple, f) de plan de redaccin, g) de eliminacin de oraciones. tems de pareamiento Los tems de pareamiento presentan dos columnas de palabras, frases o smbolos. Las palabras, frases o smbolos de una columna deben asociarse con las de la otra columna tratando de establecer entre ellas correspondencias lgicas o verdaderas. La primera columna es la de las premisas y la segunda columna es la de las respuestas. En esta columna se incluyen las asociaciones correctas y los distractores. La persona que responde el tem deber hacer las asociaciones planteadas y para evitar que en el ltimo par de datos responda sin posibilidad de eleccin es recomendable que la columna de las respuestas contenga ms distractores para mantener las posibilidades de eleccin. La instruccin que se da a la persona que responder el tem es la siguiente: Relacione las afirmaciones de la columna A con las palabras de la columna B, escribiendo el nmero que corresponde dentro del parntesis:
43
ELAS MEJA MEJA
En este caso, se presenta dos series de datos en dos columnas, por ejemplo, los nombres de pensadores y las corrientes de pensamiento que generaron. El examinado debe relacionar los datos de las columnas escribiendo, dentro del parntesis, la letra o el nmero que corresponde a la columna de las preguntas. Ejemplo: a. Jean Piaget b. Lev Vigotsky c. Skinner d. John Dewey conductismo epistemologa gentica pragmatismo cultural historicismo naturalismo ( ) ( ) ( ) ( ) ( )
Por lo general, este tipo de tem se emplea para medir informacin sencilla mediante la realizacin de asociaciones. Las relaciones que pueden plantearse son muy diversas, entre ellas las siguientes: Hombres / realizaciones. Autores / ttulos de obras. Fechas / hechos histricos. Trminos / definiciones. Smbolos / conceptos. Causas / efectos. Reglas o principios / ejemplo o aplicacin. Plantas o animales / clasificacin. rganos / funciones. Objetos / nombres de los objetos. Principios / ilustraciones. Mquinas / usos. Este tipo de pregunta se puede usar tambin con materiales grficos, planteando relaciones entre cuadros y palabras, o identificando posiciones en mapas, grficos y diagramas. tems de respuesta corta Los tems de respuesta corta estn constituidos por una pregunta que el estudiante debe responder en forma precisa y breve. Ejemplos: Quin sostiene la tesis del aprendizaje significativo? Respuesta: Ausubel
44
Quin postula una pedagoga naturalista? Respuesta: Rousseau
tems de oraciones incompletas Los tems de oraciones incompletas son oraciones en las que se omiten una o algunas palabras, las que se colocan debajo del tem, junto con otras llamadas distractores. El examinando debe escoger la palabra correcta para que cuando sea colocada en el espacio en blanco, la oracin adquiera el sentido deseado. Ejemplos: Los conceptos que el investigador elabora para referirse a los fenmenos que estudia se denominan ........... a) variables b) distractores c) hiptesis d) problemas Una estrategia para probar hiptesis consiste en ............... los efectos de las variables independientes, ............... los efectos de las variables intervinientes y ................. los posibles errores al medir o recolectar datos. a) minimizar b) cancelar c) identificar d) generalizar maximizar controlar
operacionalizar analizar controlar evitar predecir evitar
tems verdadero-falso Los tems verdadero o falso plantean una afirmacin ante la cual el examinando tiene dos posibilidades de respuesta: verdadero o falso, correcto o incorrecto. Para responderlos, debe encerrar en un crculo la alternativa que considera conveniente. Para construir tems del tipo verdadero o falso, se debe seguir las siguientes recomendaciones: a. Solicitar que corrija los enunciados falsos que aparecen en la pregunta. Un estudiante que identifique correctamente los enunciados falsos puede ser que atine, por casualidad, pero tambin puede haber elegido la respuesta en base a una mala informacin.
45
ELAS MEJA MEJA
b. La pregunta de doble alternativa debe estar basada en un material de estmulo especfico que haya sido proporcionado previamente. Este tipo de tem es efectivo cuando se sustenta en algn material que ha sido entregado al examinando, tales como mapas, grficos, tablas, lecturas, etc. Aqu se proporciona un marco de referencia para responder la pregunta. c. Se puede usar este tipo de tem para establecer relaciones de causa - efecto. Para ello se presenta dos afirmaciones unidas por la relacin mencionada. Ejemplos: Diga si la siguiente relacin es verdadera o falsa: Las variables independientes son las supuestas causas y las variables dependientes son los posibles efectos. tems de alternativa mltiple Los tems de alternativa mltiple estn constituidos por un enunciado o base, que en realidad es la pregunta planteada como un problema o afirmacin incompleta y por 4 5 alternativas de respuesta o distractores, uno de los cuales es la respuesta correcta. Al examinado se le solicita que seleccione la respuesta correcta o la mejor respuesta. La alternativa correcta recibe el nombre de clave. Para construir este tipo de tem se debe tener en cuenta las siguientes recomendaciones: 1. Que todas las alternativas sean plausibles o verosmiles, es decir todas deben aparecer como verdaderas para que acten, precisamente, como distractores. 2. Todos los distractores deben contener, en lo posible, el mismo nmero de palabras. 3. Se debe evitar el uso de distractores en negativo, como por ejemplo, no es un factor de ....... Los enunciados negativos plantean problemas de lectura y proporcionan muy poca informacin acerca de los conocimientos que posee el sujeto. 4. Si se trata de medir conocimientos de excepciones a reglas o la capacidad de advertir errores, es conveniente subrayarlos o escribirlos con otro tipo de letra. 5. Para economizar tiempo en la lectura, las alternativas deben ser, en lo posible, muy breves. 6. Si algunas palabras se repiten en todas las alternativas o en la mayora de ellas, se debe redactar nuevamente el enunciado incluyendo en el enunciado las palabras que se repiten, para no tener que presentarlas nuevamente en las alternativas.
46
(V)
(F)
7. El problema o enunciado debe plantearse con toda claridad. 8. Se debe evitar el uso de distractores tales como: todas las anteriores, todas, ninguna de los anteriores, slo a y b, etc. 9. El enunciado debe plantear el problema en forma muy clara para facilitar la comprensin del examinado, antes de que lea las alternativas. 10. El enunciado debe contener nicamente lo necesario para dar al problema o pregunta un carcter claro y especfico. Los enunciados extensos, con ideas que nada tienen que ver con la pregunta, reducen la eficacia y la validez de la pregunta. El material que innecesariamente se aade aumenta el tiempo para la lectura del tem y disminuye el tiempo para la respuesta. 11. Al redactar enunciados orientados a la evaluacin de la comprensin o la capacidad de aplicacin de principios, se debe utilizar un material novedoso. La mayora de los tems asigna demasiado nfasis al aprendizaje memorstico y se descuida otras capacidades ms complejas. 12. Se debe asegurar que ante el problema planteado exista slo una solucin o una sola respuesta correcta, o una mejor respuesta. 13. Se debe tener cuidado de no proporcionar indicios o dejar traslucir, involuntariamente, la respuesta correcta. Tales indicios pueden ser incongruencias gramaticales, distractores ms extensos, uso de determinadores especficos, etc. Los tems de alternativa mltiple presentan las siguientes ventajas: a. Son ms adecuados para medir niveles de comprensin y aplicacin del dominio cognoscitivo. b. Plantean al sujeto la eleccin de una respuesta entre varias alternativas con lo que se reduce la posibilidad de acierto por azar. Sin embargo las opciones errneas deben servir para atraer la atencin de los examinandos que carecen de informacin o la poseen en medida muy limitada; por eso los distractores deben ser lgicamente congruentes con el enunciado. c. Pueden medir varios tipos de aprendizaje, as como productos complejos de procesos de aprendizaje. d. Ofrecen mayor confiabilidad, ya que el nmero de alternativas reduce la influencia del azar. e. El adecuado nmero y calidad de las alternativas o distractores permite el aprovechamiento de la informacin para efectos de la evaluacin formativa. Si una alternativa errnea es elegida por muchos sujetos, pone en evidencia el error y facilita la deteccin de problemas de aprendizaje.
47
ELAS MEJA MEJA
Sin embargo, este tipo de tem presenta las siguientes desventajas: a. Se limitan a medir aprendizajes expresados en forma de productos verbales, pero no predice la forma en que actuar o qu actitud adoptar el examinando ante lo que sabe. b. Es difcil obtener suficientes distractores adecuados. c. No permiten medir pensamientos creativos, organizacin de ideas, habilidades para organizar pensamientos y construir respuestas. d. No se adapta bien para medir ciertas habilidades para resolver problemas matemticos. Variaciones de los tems de alternativa mltiple Este tipo de tem tiene diversas variantes, algunas de las cuales son las siguientes: tems de respuesta correcta. En este caso, todos los distractores son falsos, menos uno, que es el correcto. Ejemplo: Cuando se operacionaliza variables, el lenguaje se usa en la funcin a) denotativa b) connotativa c) esttica d) metaligstica tems de mejor respuesta. En este caso, todos los distractores son correctos pero slo uno constituye la mejor respuesta. Este ltimo tipo de tem es el ms conveniente porque permite explorar otros niveles de aprendizaje como son la comprensin, aplicacin, etc., pero su construccin demanda mayores dificultades y entrenamiento de parte del investigador. Ejemplo: La investigacin cientfica es, ante todo: a) un proceso de produccin de conocimientos. b) una actividad eminentemente racional. c) un procedimiento de comprobacin de hiptesis. d) la secuencia metodolgica hipottico deductiva.
48
15. GRADO DE DIFICULTAD DE UN TEM

El grado de dificultad de un tem se calcula estableciendo el porcentaje de examinados que respondieron correctamente un determinado tem. Si un tem fue respondido por casi la totalidad de los examinados, por ejemplo el 98%, ser un tem muy fcil. Si en cambio fue respondido slo por el 5%, ser muy difcil. Cuanto ms difcil sea el tem ms alto ser su ndice de dificultad. Es recomendable que los tems de una prueba posean un grado de dificultad intermedia. Se considera que un tem tiene un adecuado ndice de dificultad si es contestado correctamente por el 60 al 70% de los examinados. Para hallar el grado de dificultad de un tem se aplica la siguiente frmula:
Gd =
en donde:
Rc x 100 N
Gd = Grado de dificultad = Sumatoria Rc = Respuestas correctas N = Nmero de alumnos examinados Ejemplo: Sea una prueba de 20 tems respondida por 40 alumnos. Se totalizan las respuestas correctas e incorrectas.
TEMS Alumno 1 Alumno 2 Alumno 3 Alumno 4 1 1 0 1 1 1 10 30 2 0 0 1 1 0 24 16 20 0 1 1 1 1 30 10
Alumno 40
Correctas Incorrectas
Grado de dificultad del tem N 1, respondido correctamente por 10 de los 40 alumnos:

49
ELAS MEJA MEJA
Grado de dificultad del tem N 20, respondido correctamente por 30 de los 40 alumnos:
Estas cifras se interpretan segn la siguiente tabla: 85% de respuestas correctas = Muy fciles
50 al 85% de respuestas correctas = Relativamente fciles 15 al 50% de respuestas correctas = Relativamente difciles 0 a 15 % de respuestas correctas = Difciles o muy difciles. 25 % significa que el tem es relativamente difcil. 76 % significa que el tem es relativamente fcil.
16. NDICE DE DISCRIMINACIN DE UN TEM

Un buen tem debe discriminar entre los alumnos que realmente conocen la repuesta y los que no la conocen. El ndice de discriminacin de un tem indica el nmero de discriminaciones que el tem puede producir. Se basa en la relacin entre una respuesta y el puntaje total de la prueba, presuponindose que sta realmente mide lo que pretende medir y que en consecuencia el mejor tem ser aquel cuya correlacin con el puntaje total sea ms alta. El ndice de discriminacin de un tem resulta de hallar la diferencia entre la proporcin del grupo superior que respondi bien el tem y la proporcin del grupo inferior que tambin respondi bien. Para determinar el grupo superior e inferior se consideran las puntuaciones totales obtenidas por los estudiantes a quienes se les aplic el test. Aquellos que obtuvieron los ms altos porcentajes son considerados como los ms conocedores y, por tanto, constituyen el grupo superior y los que obtuvieron los ms bajos, como los menos conocedores y constituyen el grupo inferior. Ejemplo: De 100 alumnos que respondieron una prueba, los 27 alumnos que obtuvieron puntuaciones ms altas sern considerados miembros del grupo superior y los 27 que obtuvieron puntuaciones ms bajas, sern considerados miembros del grupo inferior.
50
Averiguaremos luego cuntos alumnos de los 27 del grupo superior respondieron el tem correctamente y cuntos alumnos de los 27 del grupo inferior tambin lo hizo correctamente. Luego se obtiene la diferencia. Si los 27 alumnos del grupo superior respondieron correctamente el tem, o sea el 100%, y en el grupo inferior slo 12 de los 27 tambin lo hicieron correctamente, o sea el 44%, estableciendo la diferencia tenemos: 100 % - 44 % = 56%, que es el ndice de discriminacin del tem analizado. El ndice de discriminacin puede hallarse tambin aplicando la siguiente frmula:
Donde: Id = ndice de discriminacin.
pms = puntaje mximo alcanzado por el grupo superior. pmi = puntaje mximo alcanzado por el grupo inferior. N = nmero de alumnos.
Ejemplo: Hallar el ndice de discriminacin de un tem cuyas respuestas correctas del grupo superior son 25 y las respuestas correctas del grupo inferior son 12. El nmero de examinados en los dos grupos es 50. Reemplazando los valores se tiene:
La interpretacin de este resultado se hace empleando la siguiente tabla: 40% a ms 30 al 39% 20 al 29% menos del 19% = Alto ndice de discriminacin. = ndice de discriminacin bueno. = ndice de discriminacin regular. = Deficiente ndice de discriminacin.
La cifra hallada, 26 %, indica que el ndice de discriminacin de este tem es regular. Otro ejemplo: Se ordena en forma descendente el promedio de las notas.
51
ELAS MEJA MEJA
Alumno 1 Alumno 2 ... Alumno 20 Sub Total Alumno 21 Alumno 22 ... Alumno 40 Sub Total
1 1 0 ... 1 16 0 1 0 9
TEMS 3
....
20 0 1 ... 1 17 0 1 0 3
Se totaliza el nmero de respuestas correctas de cada tem y por cada grupo. En este caso, el grupo superior es 20 y el inferior es 20. El nmero total de alumnos es 40. Se ha ordenado a los estudiantes en funcin de su rendimiento acadmico, de mayor a menor. Para hallar el ndice de discriminacin del tem N 1 se hacen los siguientes clculos:
Segn la tabla, este es un tem deficiente y debe descartarse. Para obtener el ndice de discriminacin del tem 20 se procede del siguiente modo:
Este tem, con un ndice de discriminacin de 30%, es bueno, aunque podra mejorarse.
52
LECTURAS COMPLEMENTARIAS
FUNDAMENTOS DE MEDICIN
Donald Ary*
Uno de los propsitos de la investigacin educacional es lograr un entendimiento ms profundo de las relaciones que hay entre las variables de las poblaciones. Por ejemplo, se podra preguntar: qu relacin hay entre la inteligencia y la creatividad de los nios de seis aos? No es posible observarlas directamente, ni a todos los nios de esa edad. Pero esto no quiere decir que debamos permanecer en la ignorancia acerca de stas y otras preguntas similares. Se dispone de ndices que ofrecen aproximaciones de las construcciones, inteligencia y creatividad; es decir, hay comportamientos observables que son aceptados como indicadores vlidos de ambas. El uso de ndices para lograr aproximaciones de las construcciones constituye el aspecto cuantitativo de la investigacin.
INSTRUMENTOS DE MEDICIN
Es importante seleccionar instrumentos seguros de medicin con el propsito de cuantificar los comportamientos y atributos que habrn de estudiarse. En algunos casos esto no presenta ningn problema. Por ejemplo si se desea indagar el orden de nacimiento de un grupo de sujetos o la escolaridad de sus padres, lo nico que hay que hacer es plantearles estas preguntas a los sujetos y registrar sus respuestas. Sin embargo, la tarea de cuantificar la informacin no es siempre tan sencilla. Algunas interrogantes requieren la creacin de instrumentos confiables que midan cualidades abstractas y complicadas. Habr que seleccionar o idear escalas e instrumentos capaces de medir caractersticas tales como inteligencia, aprovechamiento, personalidad, motivacin, actitudes, aptitudes, intereses y otras. La cuantificacin de cada cualidad exige un instrumento adecuado. En la siguiente seccin expondremos brevemente algunas de las clases de instrumentos que se utilizan en la investigacin educacional.
Tomado de: ARY, Donald et al.: Introduccin a la investigacin pedaggica. Mxico, D.F. McGrawHill Interamericana, 1989. pp. 178-202.
ELAS MEJA MEJA
Entrevistas y cuestionarios Una forma de obtener datos consiste simplemente en hacer preguntas. Las entrevistas y los cuestionarios aplican este mtodo. Con ellos se recoge informacin sobre hechos, creencias, sentimientos, intenciones, etc. Aunque en ambos se emplean preguntas, muestran notables diferencias. Entrevistas Las entrevistas son un mtodo muy til para recabar datos y gracias a ciertas cualidades especiales todava se usan muchsimo. La flexibilidad es uno de sus aspectos ms sobresalientes. El rapport (relacin personal) que se establece con los sujetos crea una atmsfera de cooperacin en la que puede obtenerse informacin verdica. Hay que tomar en cuenta la clase de persona que se va a entrevistar y la situacin dentro de la cual se desarrolla la entrevista. El entrevistador puede explayarse sobre alguna pregunta, explicar su significado en caso de que a su interlocutor le parezca poco clara. Ninguno de los otros tipos de recopilacin de datos, entre ellos los cuestionarios y las pruebas, ofrece estas ventajas. Hay dos tipos de entrevistas: estructuradas y no estructuradas. En las primeras las preguntas y las respuestas alternativas que estn permitidas a los sujetos se fijan de antemano y se aplican con rigidez a todos ellos. La ventaja es que se trata de un sistema normalizado, de modo que las respuestas pueden ser clasificadas y analizadas fcilmente. Su desventaja es la falta de flexibilidad y que dan la impresin de ser demasiado formales. Las restricciones impuestas a este tipo de entrevista aumentan su confiabilidad, pero pueden mermar su profundidad. Las entrevistas no estructuradas son ms informales. Es posible interrogar libremente a los sujetos sobre sus opiniones, actitudes, creencias y otros puntos. Estas entrevistas son flexibles y suelen planearse para adaptarse a los sujetos y a las condiciones dentro de las que se desarrollan. Los sujetos tienen libertad para ir ms all de las simples respuestas y expresar sus puntos de vista en la forma que deseen. Las preguntas pueden desviarse de los planes originales y centrarse en los puntos que parezcan importantes. Todo eso requiere personal experto, capacitado y alerta. No se prestan mucho a cuantificacin, pero ayudan a generar y aclarar las dimensiones presentes en la materia que se estudia. Se utilizan mucho en la psicologa clnica, en el asesoramiento, en la direccin y en el estudio de casos. En la investigacin su empleo suele limitarse a las etapas preliminares, en las que el investigador escoge las variables del estudio. Por ejemplo, para determinar las habilidades que los patrones potenciales desean que se enseen en un programa de capacitacin para el trabajo de oficina, podra comenzarse con entrevistas no
56
estructuradas destinadas a identificar cules habilidades se mencionan con mayor frecuencia, enumerarlas y solicitar a los patrones, mediante entrevistas estructuradas, que estimen la importancia de cada una. Cuestionarios En las entrevistas el contacto directo con los sujetos requiere tiempo y dinero. Una buena parte de esa informacin puede obtenerse por medio un cuestionario escrito. Si se le compara con la entrevista, sta es ms eficiente y prctica y permite usar una muestra ms amplia. En la investigacin experimental se utiliza frecuentemente. He aqu otra de sus ventajas: los sujetos reciben instrucciones normalizadas y ni la apariencia personal ni el estado de nimo ni la conducta del examinador influyen en los resultados finales. Los cuestionarios son de dos clases: estructurados, o de forma cerrada, y no estructurados, o de forma abierta. Los primeros contienen preguntas y respuestas alternativas. Las respuestas dadas a cada pregunta debern agotar todas las posibles preguntas y excluirse mutuamente. En los cuestionarios no estructurados no hay respuestas sugeridas. La administracin y la calificacin de un cuestionario estructurado se realiza en forma directa, y los resultados se prestan a un anlisis fcil. Este tipo de cuestionario tiene la desventaja de obligar a los respondientes a escoger entre una de varias respuestas alternativas seleccionadas previamente, aunque tal vez no vislumbren respuestas claras, o a elegir alternativas que no representen realmente sus actitudes. Por el contrario, los cuestionarios no estructurados tienen la ventaja de dejarlos en libertad para que expresen sus opiniones y sus actitudes, slo que la informacin que aportan es difcil de procesar y analizar. Al contestar cuestionarios no estructurados, los sujetos pueden omitir puntos importantes, recalcar asuntos que carezcan de inters para el investigador o que no tengan importancia para el estudio. Por tal razn la mayora de los investigadores prefiere los cuestionarios estructurados. Una desventaja de ambos tipos es la posibilidad de que los respondientes malinterpreten las preguntas. Es muy difcil elaborar una serie preguntas cuyo significado sea tan claro como el agua para todos. El investigador puede saber con exactitud lo que significa una pregunta, pero por una formulacin deficiente o la distinta acepcin que se da a los trminos, el sujeto los entiende errneamente. Esta desventaja puede obviarse mediante un estudio piloto en el que se ensaya el cuestionario con unos cuantos sujetos, representativos de aquellos a quienes se aplicar.
57
ELAS MEJA MEJA
Una desventaja peculiar del envo de cuestionarios por correo en su bajo porcentaje de respuestas. Por lo comn cabe esperar que regresen menos de la mitad, lo cual no slo reduce el tamao de la muestra sino que puede viciar los resultados, e impedir que se hagan generalizaciones vlidas. No es legtimo suponer que la ausencia de respuestas se distribuye aleatoriamente a lo largo de un grupo. Los estudios han mostrado que suele haber diferencias sistemticas en las caractersticas de los sujetos que responden o no a los cuestionarios. Los que contestan pueden ser ms inteligentes, educados, concienzudos e interesados en la cuestin y en general ms favorables al tema del cuestionario. Una muestra no representativa como sta puede daar la generalizacin de los resultados. La meta de un cuestionario es obtener de un 70 a 80 por ciento de respuestas. Si la ausencia de respuestas supera al 30 por ciento, el valor de los resultados se pondr en duda. Un cuestionario bien construido tiene mayores probabilidades de producir una buena respuesta que uno que est mal elaborado. Elaboracin de cuestionarios Es una tarea difcil y que requiere tiempo. A continuacin presentamos algunas indicaciones para redactar los reactivos de un cuestionario escrito. 1. Construir el instrumento de modo que refleje calidad. Un cuestionario que parezca haber sido integrado sin orden y con mucha rapidez no obtendr un alto porcentaje de respuestas. Durante el proceso de elaboracin a veces se necesitan muchas revisiones para eliminar reactivos ambiguos o innecesarios. 2. Hacer el cuestionario lo ms breve posible, de modo que se requiera el mnimo de tiempo para llenarlo. Es ms probable que los sujetos contesten y regresen un cuestionario corto. El examinador debe suprimir todos los puntos innecesarios, en especial aquellos cuyas respuestas puedan hallarse en otras fuentes. Todos los reactivos debern estar en funcin del problema de investigacin; es decir, habrn de aportar datos necesarios para comprobar la hiptesis o contestar las interrogantes. Por ejemplo, puede eliminarse una pregunta sobre la edad del respondiente en un estudio donde esta informacin no sea necesaria para el anlisis de la mayora de los datos. 3. Redactar los reactivos del cuestionario de manera que todos puedan entenderlo. Se utilizar un lenguaje que no sea tcnico y que se ajuste al respondiente menos educado. Las oraciones sern cortas y simples. Conviene hacer que otras personas, que de preferencia tengan una educacin similar a la de las que habrn de participar en el estudio, lean e interpreten el contenido de cada pregunta. Por ejemplo, las interrogantes que incluyan trminos como, gasto
58
deficitario, balanza de pagos, producto nacional bruto, no sern apropiadas en una encuesta dirigida al pblico en general. 4. Formular el cuestionario de modo que produzca respuestas que no sean ambiguas. Cuando sea posible, las respuestas debern estar cuantificadas. Por ejemplo, en lugar de que los respondientes marquen algunas veces, con frecuencia o siempre, exprsese la alternativa nmero de veces por semana. Es decir, la redaccin de las preguntas no deber tener distintos significados para la gente. 5. Elaborar las preguntas evitando los prejuicios que pudieran influir u orientar al sujeto hacia determinada direccin. Por tal razn conviene evitar las palabras estereotipadas que impliquen prestigio, las cargadas de emocin o superlativas. Por ejemplo, la pregunta se ha inscrito usted en el registro federal de electores para votar? Sera preferible a decir: ha ejercido usted sus derechos ciudadanos registrndose para votar? La pregunta estara usted de acuerdo en que Estados Unidos desarrollase el potencial atmico como una fuente alternativa de energa? Podra producir diferentes respuestas a las que originara que esta otra: En razn de la huelga del carbn ms larga de la historia, recomendara usted que Estados Unidos desarrollase el potencial atmico como una fuente alternativa de energa? 6. Los reactivos de un cuestionario no debern ser engaosos a causa de supuestos implcitos. El marco de referencia para responder las preguntas deber ser claro y uniforme para todos los sujetos. Si hay que plantear alguna premisa antes de que den la respuesta, debern incluirse preguntas tendientes a indagar esas suposiciones. Por ejemplo, en una encuesta diseada para estudiantes del ltimo ao, la pregunta siguiente: Piensa usted que la enseanza superior lo ha preparado adecuadamente para la universidad?, supone que el estudiante asistir a la facultad y que est al tanto de la preparacin requerida. Esta otra: Se ha registrado usted para votar en la prxima eleccin?, supone que sea mayor de 18 aos, lo cual tal vez no sea as. 7. Las alternativas de las preguntas del cuestionario deben ser exhaustivas; es decir, se expresarn todas las alternativas posibles sobre la cuestin. Por ejemplo, cul es su estado civil? Es una pregunta que debe incluir no slo las alternativas casado o soltero, sino tambin viudo, divorciado, separado. Al idear las alternativas para cuestionarios cuyo fin es identificar actitudes u opiniones sobre ciertos temas, es conveniente presentar primero las preguntas
59
ELAS MEJA MEJA
en forma abierta a una muestra pequea de sujetos. Sus respuestas pueden utilizarse despus como alternativas en la redaccin final. En las preguntas con gran variedad de posibles respuestas, inclyase siempre la alternativa otra acompaada de una peticin para que el sujeto explique su eleccin. Por ejemplo, la pregunta: Cul es su posicin en el sistema escolar? deber comprender las alternativas administrador, maestro, bibliotecario, otra. 8. Evitar preguntas que pudieran ocasionar reacciones de turbacin, desconfianza u hostilidad. Las preguntas no debern de poner a la defensiva. Por ejemplo, a la gente no le gusta que le hagan preguntas acerca de su edad, ingresos, religin o nivel educacional. Es preferible escribir una pregunta relacionada con la edad en trminos de escalas en vez de edades exactas pues con ello se les permite elegir la categora apropiada. La pregunta: Tiene usted un diploma de enseanza media?, podra causar vergenza a quien no la haya terminado. La pregunta debera ser: A qu grado haba usted llegado cuando abandon la escuela? 9. Colocar las preguntas en correcto orden psicolgico. Cuando se planteen preguntas generales y especficas sobre un mismo tema, presentar las generales primero. Por ejemplo, verifquese si los sujetos estn satisfechos o no con sus condiciones laborales antes de preguntarles sobre los cambios que recomendaran. Las preguntas objetivas sobre un tema o situacin han de preceder a las ms subjetivas. Algunas veces los respondientes se muestran reticentes a contestar preguntas acerca de actitudes, preferencias, sentimientos personales, motivos y cosas por el estilo. Pero si con preguntas objetivas se aclara y especifica la situacin, les ser tal vez ms fcil formular y expresar sus opiniones sobre la cuestin. 10. Disponer las preguntas de manera que las respuestas puedan tabularse e interpretarse inmediatamente. Es necesario prever la forma de los datos necesaria para el anlisis y asegurarse que el cuestionario producir esos datos. 11. El cuestionario debe ir acompaado de una carta explicatoria, con el nombre y la profesin del respondiente. La carta explica el propsito y el valor del estudio y la razn por la que el sujeto fue incluido en la muestra. Por lo tanto deber motivarlo para que conteste. Es preciso hacerle creer que va a hacer una contribucin importante al estudio. La firma de la carta tambin puede influir en la devolucin del cuestionario. Ser de gran utilidad que una persona muy conocida por los sujetos, como el director de un departamento universitario o el decano de una escuela, firme esa carta. Esta tendr probablemente mayor efecto que la de un estudiante graduado desconocido. Si existe un patrocinador, digamos alguna institucin o agencia, se le mencionar.
60
Conviene dejarles la posibilidad de permanecer en el anonimato. En cualquier caso, debe asegurrseles que sus respuestas sern confidenciales. Tambin hay que ofrecerles compartir los resultados del estudio con ellos si estn interesados. Es necesario adjuntar un sobre con estampillas y un sobre con el domicilio del examinador. Si los sujetos permanecen en el anonimato es aconsejable incluir una tarjeta postal, que ser mandada por separado al investigador y que indique que el cuestionario ha sido depositado ya en el correo. De esta manera puede llevarse un registro de los cuestionarios devueltos. Pedir una contestacin inmediata del cuestionario. Si se concede un lapso de tiempo, por ejemplo, de un mes, los sujetos pueden darle largas al cuestionario y olvidarlo a pesar de sus buenas intenciones. 12. Un recordatorio es necesario si se desea alcanzar el porcentaje mximo de contestaciones . Cuando el cuestionario no haya sido contestado inmediatamente despus de haberlo mandado, envese a los sujetos un recordatorio en forma de tarjeta postal. Hecho eso se recomienda mandar por segunda vez el cuestionario acompaado de otra carta explicatoria. Tal vez deba usarse un tono distinto para persuadir a los respondientes a llenar y regresar el cuestionario. Si el lector quiere obtener mayor informacin sobre la elaboracin de cuestionarios, consulte un texto de Selltiz, Wrightsman y Cook. Cmo resolver el problema de ausencia de respuestas El mtodo usual consiste en tratar de entrevistar a una pequea muestra aleatoria de los que no contestaron, con el propsito de saber algo sobre sus caractersticas y lograr sus respuestas. Quizs se averige que no hay ninguna diferencia entre sus respuestas y las de los sujetos originales. En este caso es posible pensar que los que contestan representan una muestra imparcial de todos los que recibieron el cuestionario. Despus de establecer el patrn de respuesta mediante las entrevistas con ellos, es posible ponderar sus respuestas en el anlisis final de los datos. Si se descubre que ciertos subgrupos claramente identificables no contestaron el cuestionario, posiblemente haya que cambiar la interrogante de investigacin para excluirlos. Por ejemplo, si los maestros de secundaria mostraron un porcentaje mucho menor de devoluciones que los de primaria, el investigador podra restringir la encuesta en estos ltimos y formular de nuevo la pregunta para sealarlo. Validez de los cuestionarios En la investigacin, con mucha frecuencia se utilizan cuestionarios sin reflexionar sobre cun adecuados son para hacer las mediciones que se desean. Esto se relaciona con el problema de la validez. Es muy importante sealar que la validez no puede suponerse sino que debe probarse.
61
ELAS MEJA MEJA
Un factor que afecta de manera especial a la validez de los cuestionarios es el hecho de que se requiera una firma o no. Hay buenas razones para creer que se obtendra mayor veracidad si los respondientes pudieran permanecer en el anonimato. No obstante, esta probabilidad depende de la naturaleza de las preguntas incluidas es decir, si se busca o no una informacin muy personal. Si la identificacin de ello no es importante para el anlisis de resultados convendr ofrecerles el anonimato. Algunos estudios han usado la observacin directa del comportamiento como criterio de validez de las respuestas en un cuestionario. Es decir, despus de conseguir muchas respuestas mediante el cuestionario, se realizan observaciones para confirmar si el comportamiento real de los sujetos concuerda con las actitudes y opiniones que expresaron. En otros casos las consideraciones sobre la validez requieren estudios sobre la interpretacin que hagan de las preguntas. Tales estudios suelen revelar ambigedades o imprecisiones de las preguntas. Pruebas Las pruebas (tests) constituyen valiosos instrumentos de medicin en el anlisis educacional. Son una serie de estmulos que se presentan a un individuo para suscitar respuestas, en base a las cuales se asigna una puntuacin numrica. Esta puntuacin se apoya en una muestra representativa del comportamiento individual, y es un ndice del grado en que el sujeto posee las caractersticas que se van a medir. Dos requisitos esenciales de los tests son la validez y la confiabilidad. Otra condicin indispensable de las pruebas es su objetividad, que se muestra por un nivel mximo de concordancia entre los calificadores. Una vez preparada la clave de registro para una prueba objetiva, cualquier persona aunque no est entrenada, o incluso una mquina, pueden calificar el test. Con las pruebas objetivas se puede examinar gran variedad de caractersticas. Algunas fuentes de utilidad para encontrar pruebas que se amolden a los propsitos de una investigacin son Mental Measurements Yearbooks de Buros y Tests in Print II. En los manuales los editores de pruebas incluyen las instrucciones para administrarlas, calificarlas e interpretarlas Pruebas de aprovechamiento En la mayora de las investigaciones sobre la eficacia de los mtodos didcticos la variable dependiente es el aprovechamiento. De ah que las pruebas de aprovechamiento se utilicen ampliamente en la investigacin educacional as como en los sistemas escolares. Miden el dominio y la destreza en distintas reas de conocimiento.
62
Se clasifican en estandarizadas y aquellas que son construidas por el maestro o el investigador. Las primeras son pruebas publicadas y son fruto de una preparacin cuidadosa y experta, que cubren amplios objetivos acadmicos comunes a gran nmero de sistemas escolares. Estas pruebas disponen de normas comparativas; su validez y confiabilidad se ha probado; se cuenta con instrucciones para administrarlas y calificarlas. Con el propsito de establecer las normas que las rigen, sus creadores las aplicaron a una muestra que escogieron para representar al pas en su totalidad. La media de un nivel de grados particular se convierte en la norma para ese nivel. Las habilidades medidas no constituyen necesariamente lo que sera necesario ensear en cualquier grado, pero el uso de normas suministra una base a los investigadores para comparar sus grupos con una estimacin de la media para todos aquellos alumnos que se hallan en ese nivel. Hay pruebas estandarizadas para asignaturas individuales, como matemticas o qumica, y tambin en forma de bateras generales que miden diversas reas de aprovechamiento. Por ejemplo, la Prueba California de Aprovechamiento (CAT) contiene exmenes en las reas de lectura, lenguaje y aritmtica. Las pruebas consecutivas del progreso educacional (STEP) cubren siete reas. Al seleccionar una prueba de rendimiento los investigadores tienen que ser muy cuidadosos y elegir una que sea confiable y resulte apropiada (vlida) para medir el aspecto del rendimiento en el cual estn interesados. Algunas veces les ser imposible escogerla pues tendrn que usar la que el sistema escolar haya seleccionado. Buros presenta una lista muy amplia y reseas de distintas pruebas de aprovechamiento disponibles. Si una prueba existente mide el comportamiento deseado y si la confiabilidad y las normas resultan adecuadas para el propsito del estudio, hay ventajas en el uso de un instrumento estandarizado. Aparte del tiempo y esfuerzo que se ahorran, la continuidad de los procedimientos de comprobacin constituye ya una ventaja. Es decir, usando el mismo instrumento se pueden comparar los resultados de los estudios e interpretarse con respecto a los de otros estudios. Si las pruebas estandarizadas de aprovechamiento no se consideran adecuadas para los objetivos de un estudio de investigacin, los experimentadores pueden construir sus propias pruebas. Es preferible hacer esto que emplear alguna prueba estandarizada que resulte inadecuada aunque se encuentre disponible. En este caso deber prepararse la prueba con gran cuidado, particularmente al determinar su validez y confiabilidad antes de aplicarla. Algunas indicaciones sobre la construccin de pruebas se hallan en textos especializados en medicin como los de Gronlund, Stanley, Thorndike y Hagen.
63
ELAS MEJA MEJA
Algunas veces los promedios de las calificaciones de los sujetos en sus escuelas se utilizan como indicadores de xito y aprovechamiento acadmico. Cuando participen estudiantes de distintos sistemas escolares debern tomarse ciertas precauciones. Las letras de calificacin de diferentes escuelas no significan necesariamente lo mismo, y por tanto no indican el mismo grado de dominio y destreza.
Pruebas de inteligencia Mientras que las pruebas de aprovechamiento intentan medir el rendimiento en reas especficas, las de inteligencia se ocupan del rendimiento general. Se proponen medir la capacidad del sujeto para percibir relaciones, resolver problemas y aplicar el saber en una variedad de contextos. No se les ha de considerar como mediciones de la inteligencia pura o innata. El rendimiento en esta clase de pruebas depende en parte de la experiencia y de los antecedentes del sujeto. La controversia sobre el significado del concepto inteligencia y la tendencia de algunos a asociarla con habilidad heredada, ha hecho que el uso del trmino inteligencia para describir estas pruebas haya disminuido en los ltimos aos. Paulatinamente se la ha ido substituyendo por aptitud acadmica locucin ms descriptiva ya que seala la funcin principal de esas pruebas: predecir el aprovechamiento acadmico. Estas pruebas son de gran utilidad para los educadores y poseen una validez muy amplia para predecir el xito escolar. Los investigadores tambin las usan mucho. La inteligencia es una variable independiente que debe ser controlada en los experimentos educacionales. Y para ello el investigador utiliza las puntuaciones de alguna prueba de inteligencia. Algunas de ellas han sido diseadas para aplicarlas a individuos y otras para usarlas con grupos. Pruebas individuales de inteligencia. Las ms conocidas son las de Stanford-Binet y las tres pruebas de Wechsler. La Stanford-Binet actualmente en uso es el resultado de varias revisiones hechas a la que cre Alfred Binet en Francia para medir las diferencias en la madurez mental de los nios. En su forma original serva para medir la edad mental. Ms tarde apareci el concepto de cociente intelectual (CI), que se obtiene dividiendo la edad mental (EM) entre la edad cronolgica (EC) y multiplicando el resultado por 100. La presente versin produce edades mentales pero no emplea la razn EM/EC para determinar el CI. El cociente intelectual se obtiene comparando el rendimiento de un individuo (la puntuacin) con las normas obtenidas de su grupo
64
cronolgico mediante el uso de puntuaciones estndar. Una caracterstica importante de este tests consiste en que da una medicin general de la inteligencia. No intenta medir habilidades separadas, como lo hacen otras pruebas. Las pruebas Wechsler son el producto de un intento de David Wechsler por crear un instrumento para medir la inteligencia de los adultos. Su primera prueba se public en 1939 y le siguieron otras tres: una en 1949, la Escala Wechsler de Inteligencia para Nios (WISC), que fue revisada en 1974 y se conoce como la WISC-R; otra en 1955, la Escala Wechsler de Inteligencia para Adultos (WAIS); y la ltima en 1967, la Escala Wechsler de inteligencia para Nios de Nivel Preescolar y de Primaria (WPPSI), que se implant para el grupo de edad comprendido entre 4 y 6 aos y medio. Un aspecto destacado de las pruebas Wechsler es que estn divididas en subpruebas, lo cual le permite al investigador obtener dos puntuaciones para cada sujeto, una para el CI verbal y otra del CI no verbal. Estas subpruebas se dividen adems en subescalas, que indican el rendimiento del sujeto en tareas especficas. Pruebas colectivas de inteligencia. Las pruebas de Stanford-Binet o de Wechsler las debe aplicar un psicometrista experto a un sujeto individual, lo cual comporta un gasto de tiempo y dinero. Son imprcticas cuando se desea conseguir mediciones de inteligencia para grandes grupos. En estos casos se emplean pruebas colectivas. La primera prueba colectiva de la capacidad mental fue creada durante la Primera Guerra Mundial para medir la inteligencia de los hombres que prestaban servicio militar. Una versin de esta prueba, la Army Alpha, comenz a aplicarse en la vida civil despus de la guerra y se convirti en el modelo de muchas pruebas colectivas. Hoy da existe un nmero considerable de este tipo de tests.
Inventarios de Personalidad
Obtener mediciones de la personalidad constituye otra rea de inters para los pedagogos. Hay diversos tipos de mediciones de la personalidad, cada uno de los cuales refleja un distinto punto de vista terico. Algunos provienen de las teoras de los rasgos y de la tipologa, mientras que otras emanan de las teoras psicoanalticas y de la motivacin. Los investigadores deben saber con precisin lo que desean medir y seleccionar despus el instrumento, prestando gran atencin a los datos relativos a su validez. Los tres tipos de medicin de la personalidad ms comunes en la investigacin son los siguientes: 1) inventarios, 2) escalas de clasificacin, 3) tcnicas proyectivas.
65
ELAS MEJA MEJA
Inventarios En un inventario se presenta a los sujetos una recopilacin extensa de enunciados que describen normas de comportamiento; se les pide decir si cada enunciado es caracterstica o no de su conducta marcando si, no o indeciso. Las puntuaciones se calculan contando el nmero de respuestas que concuerden con el rasgo que el investigador est tratando de medir. Por ejemplo, cabe esperar que los paranoicos contesten afirmativamente a este enunciado: Las personas siempre andan murmurando a mis espaldas, y que respondan negativamente a este otro: Yo pienso que la polica debe ser justa y razonable. Por supuesto si tales respuestas se dan solamente a dos incisos nos indicarn tendencias paranoicas. Sin embargo, podr verse en ellas un indicador de paranoia si se encuentran en varios reactivos. Algunos de los inventarios introspectivos miden un solo rasgo, como la EscalaF de California, que se ocupa del autoritarismo. Otros, como el cuestionario de los diecisis factores de la personalidad de Cattell, miden varios rasgos. He aqu algunos de los ms usados en la investigacin: el Inventario multifsico de la personalidad de Minnesota, la Encuesta de la preferencia de temperamento de Guilford-Zimmerman, la Lista de verificacin de problemas de Mooney y el Programa de preferencias personales de Edwards. Los inventarios pueden usarse en la investigacin educacional para obtener descripciones de las caractersticas de ciertos grupos definidos, como los estudiantes de bajo rendimiento, los que abandonan sus estudios, los miembros de grupos minoritarios, etc. Tambin se utilizan en estudios sobre las interacciones de los rasgos de la personalidad y de variables como inteligencia, aprovechamiento y actitudes. Los inventarios poseen las ventajas de economa, sencillez y objetividad. La mayora de sus desventajas estn relacionadas con el problema de la validez. sta depende en parte de la capacidad de sujetos para leer y entender los reactivos, su conocimiento de s mismos y especialmente su buena disposicin para dar respuestas francas y honestas. De ah que la informacin de los inventarios pueda ser superficial o viciada. Dicha posibilidad debe tenerse en cuenta al emplear los resultados obtenidos con ellos. Escalas de clasificacin Uno de los instrumentos de medicin ms usado es la escala de clasificacin. Consiste en que una persona evale el comportamiento o rendimiento de otra. Generalmente se le pide al clasificador colocar al sujeto en algn punto de un continuo o en una categora que describa su comportamiento tpico. Un valor numrico se
66
asigna al punto o categora. Se supone que los clasificadores estn familiarizados con el comportamiento tpico del individuo. La clasificacin se ha venido utilizando en investigaciones sobre el desarrollo de los nios y en muchos otros aspectos de la conducta. Hay diversos tipos de escalas de clasificacin. Una de las ms comunes es la Escala grfica, en que el clasificador se limita a colocar una marca en el punto apropiado de una lnea horizontal que une ambos extremos de la conducta. La figura 1 contiene un ejemplo de esta clase de escalas. El clasificador puede marcar cualquier punto de la lnea continua. En algunas escalas grficas el constructor de la prueba asigna valores numricos a los puntos descriptivos, lo cual origina una Escala de clasificacin numrica.
EJEMPLO DE UNA ESCALA GRFICA

b a ja A p a r ie n c ia P e r s o n a l A c e p ta b ilid a d s o c ia l H a b ilid a d e s o r a to ria s m e d ia a lta
Figura 1 El reactivo sobre las habilidades oratorias de la figura podra aparecer de la siguiente manera en una escala numrica:
1 2 Uno los Uno dede los oradores ms oradores ms mediocres mediocres 3 4 Un orador medio 5 6 7 Uno de los mejores oradores
Un segundo tipo de escala de clasificacin es la de categoras, que comprende un nmero de categoras dispuestas en una serie ordenada. La serie ms usada abarca de 5 a 7 categoras. El clasificador escoge la que representa mejor el comportamiento de la persona que va ser estudiada. Supongamos que se estiman las habilidades de un estudiantes y que una de las caractersticas por clasificar es la creatividad. Un reactivo podra ser ste: Cun creativa es esta persona? (marcar uno) Excepcionalmente creativa. Muy creativa.
67
ELAS MEJA MEJA
Creativa. No creativa. Absolutamente no creativa. Algunas veces las categoras en este tipo de escalas constan de breves frases descriptivas. Por ejemplo: Cun creativa es esta persona? Siempre tiene ideas creativas. Tiene muchas ideas creativas. Algunas veces produce ideas creativas. Al usar las escalas grficas y de categoras, los estimadores emiten sus juicios sin comparar directamente al sujeto con otros individuos o grupos. En las Escalas de clasificacin comparativas, por otra parte, se les instruye para que hagan sus juicios con referencia directa a las posiciones de otros sujetos con las cuales podra compararse el individuo. Las posiciones de la escala de clasificacin se definen de acuerdo con una poblacin con caractersticas conocidas. En la figura 2 se muestra una de las escalas. Esta podra utilizarse para seleccionar aspirantes a una escuela universitaria de graduados. Al estimador se le solicitara que juzgase la habilidad del aspirante para realizar actividades propias de graduados en comparacin con todos los estudiantes que conoce. Para que su estimacin tenga validez, debe estar al tanto de la gama y distribucin de las habilidades del grupo total de estudiantes graduados. Todas las tcnicas de clasificacin estn sujetas a errores considerables, lo cual reduce su validez y confiabilidad. Entre los errores sistemticos ms frecuentes en que se incurre al clasificar personas figura el efecto del halo, que aparece cuando los estimadores permiten que una impresin generalizada del sujeto influya sobre la clasificacin de algunos aspectos especficos del comportamiento. Esta impresin se extiende de un reactivo de la escala a otro. Por ejemplo, un maestro podra clasificar a un estudiante que realiza una buena actividad acadmica como superior en inteligencia, popularidad, honestidad, perseverancia y en todos los otros aspectos de la personalidad. Existe tambin el error de generosidad, o sea la tendencia a conceder al sujeto el beneficio de la duda. Es decir, cuando los estimadores se muestran inseguros es probable que se expresen favorablemente de la persona. En cambio el error de severidad es la inclinacin a dar a los individuos una clasificacin muy baja en todas las caractersticas. El error de la tendencia central es la propensin a evitar cualquier extremo y situarlos en la mitad de la escala.
68
TCNICAS E INSTRUMENTOS DE INVESTIGACIN EJEMPLO DE UNAESCALADE CATEGORAS

Peor que la mayora de los estudiantes
Mejor que la mayora
Excesivamente bajo
rea de competencia (que habr de clasificarse) 1. Muestra esta persona tener metas profesionales bien definidas y notables?
2. Afronta los problemas en forma constructiva?
3. Toma en cuenta las crticas positivas y las usa en forma constructiva?
Figura 2 Una forma de evitar estos errores consiste en entrenar a fondo a los estimadores antes que entren en accin. Debern estar informados sobre la posibilidad de cometer uno de estos errores. Y es de gran importancia que dispongan de tiempo suficiente para observar al sujeto y a su comportamiento antes de llevar a cabo la clasificacin. Otra forma de prevenir un error es asegurarse que el comportamiento que se va a estimar y los reactivos de la escala estn definidos con claridad. Los reactivos debern describirse en trminos del comportamiento total observable y no de las conductas que obliguen al estimador a realizar inferencias. Una exposicin notable sobre la forma de evitar el error del estimador se halla en la obra de Guilford. La confiabilidad de este procedimiento suele incrementarse al hacer que varios estimadores se ocupen de un mismo sujeto de forma independiente. Con ello se consiguen clasificaciones independientes que se combinan o prorratean para obtener una puntuacin total. Tcnicas proyectivas Son medidas en las cuales se pide a un individuo que responda a estmulos ambiguos o no estructurados. Reciben ese nombre porque se espera que el sujeto
69
Imposible de juzgar
Cerca del promedio estudiantil
Muy superior
ELAS MEJA MEJA
proyecte dentro del estmulo sus necesidades, deseos, temores, ansiedades, etc. Basndose en las interpretaciones y respuestas, el examinador intenta construir un cuadro general de la estructura de la personalidad del individuo. Los mtodos proyectivos son usados principalmente por los psiclogos clnicos para el estudio y el diagnstico de los que sufren problemas emocionales. En la investigacin educacional, se usan poco porque se necesita un entrenamiento especial para administrarlas y calificarlas y del gasto que representa su aplicacin a un individuo aislado. Adems, algunos investigadores creen que su validez no ha sido probada satisfactoriamente. Las dos tcnicas proyectivas ms conocidas son la prueba de Rorschach y la de Apercepcin Temtica (TAT). La primera utiliza manchas de tinta como el estmulo; en la segunda se le muestran al sujeto varias fotografas y se le pide que invente una historia acerca de cada una. En la obra de Anderson y Anderson se encuentra un estudio ms profundo de estas tcnicas y sobre la forma de interpretarlas. Escalas Una escala es un conjunto de valores numricos asignados a sujetos, objetos o comportamientos con el propsito de cuantificar y medir sus cualidades. Las escalas sirven para medir actitudes, valores e intereses. En contraposicin con las pruebas, los resultados de estos instrumentos no indican xito o fracaso, fuerza o debilidad; se limitan a medir el grado en que un individuo posee la caracterstica. Por ejemplo, con una escala puede medirse la actitud de los universitarios hacia la religin. La elaboracin de escalas para medir actitudes, valores e intereses puede exigir la aplicacin de diversas tcnicas. En la siguiente exposicin intentaremos presentar algunas de ellas. Escalas de actitudes Hay cuatro tipos principales de esas escalas: 1) escalas de evaluacin, sumaria (escalas de Likert), 2) escalas de intervalos de aparicin constante (escalas de Thurstone), 3) escalas acumulativas (escalas de Guttman), 4) escalas de diferencial semntico. Escalas de Likert (mtodo de evaluaciones sumarias). Presentan un nmero de enunciados negativos y positivos acerca de un objeto de actitud. Al responder a los puntos de estas escalas los sujetos indican si estn firmemente de acuerdo, si estn de acuerdo, indecisos, en desacuerdo, o en desacuerdo total con cada enunciado. El valor numrico que se asigna a cada respuesta depende del grado de acuerdo o desacuerdo con un enunciado individual.
70
La puntuacin de un sujeto se determina sumando los valores asignados a las respuestas. Por ejemplo, se puede calificar una escala de Likert adscribiendo un valor de 2 puntos a cada respuesta que indique gran acuerdo con enunciados favorables, un valor de 1 punto al simple acuerdo, o a la indecisin, 1 al desacuerdo y 2 al desacuerdo total. En los enunciados desfavorables se invierte el procedimiento, ya que el desacuerdo se considera psicolgicamente equivalente al acuerdo con un enunciado favorable. No importa si 2 representa una puntuacin alta y -2 una puntuacin baja, o viceversa. Lo esencial es calificar las respuestas uniformemente, segn la actitud que indiquen. Por supuesto el hecho de la actitud favorable corresponda a la aprobacin completa o a la desaprobacin total depender del contenido del enunciado.
Para construir una escala de Likert suelen seguirse los siguientes pasos: 1. Recopilar gran nmero de enunciados favorables y desfavorables sobre un objeto de actitud. 2. Seleccionar de entre ellos un nmero aproximadamente igual de enunciados favorables y desfavorables. 3. Administrar estos reactivos a varios individuos, pidindoles que indiquen sus opiniones acerca de cada uno y que digan si estn en acuerdo total, de acuerdo, indecisos, en desacuerdo o en completo desacuerdo. 4. Calcular la puntuacin de cada uno por medio del procedimiento descrito con anterioridad. 5. Analizar los reactivos para seleccionar aquellos que produzcan la mejor diferenciacin. Mediante este estudio se descubre la correlacin existente entre las puntuaciones totales de los sujetos y sus respuestas a cada reactivo. Examinemos estos ejemplos sacados de los reactivos sobre actitudes hacia el negro que Likert incluy en su Encuesta de opiniones.
Si se requiere la misma preparacin el maestro de raza negra deber percibir el mismo salario que el banco.
SA
(2)
A
(1)
U
(0)
D
(-1)
SD
(-2)
Los barrios de negros debern estar Separados de los blancos.
SA
(-2)
A
(-1)
U
(0)
D
(1)
SD
(2)
71
ELAS MEJA MEJA
Escalas de Thurstone Mtodo de los intervalos de aparicin constante. Thurstone ide un mtodo para asignar valores escalares especficos a los reactivos que representan diferentes grados de actitud favorable. En la elaboracin de este tipo de escala se siguen los pasos siguientes: 1. Recopilar gran nmero de enunciados sobre el objeto de actitud. 2. Presentarlos a cierto nmero de personas que les juzgarn. Suelen usarse de 50 a 100 jueces para evaluarlas. Trabajan de forma independiente y dividen todos los enunciados en siete, nueve u once categoras, conforme al grado favorable expresado. En el primer grupo se colocan los que consideren ms favorables al objeto; en el segundo grupo los menos favorables, y as sucesivamente. El sexto grupo representa la posicin neutral y el decimoprimero contiene los enunciaos ms desfavorables. Es importante observar que esta clasificacin no tiene nada que ver con las actitudes de los jueces hacia el objeto, sino que slo representa sus juicios acerca de lo favorable de los enunciados. 3. Encontrar la escala que habr de asignarse al valor de cada enunciado, calculando para ello la mediana de los pesos o posiciones que los jueces les asignaron en la escala. Se suprimen los reactivos que muestren gran variabilidad. 4 Seleccionar de 20 a 30 enunciados que tengan igual grado de dispersin en la escala. Tales enunciados vienen a constituir la escala de actitudes. Los siguientes reactivos con sus valores escalares provienen de la escala de Thurstone, que mide actitudes ante la iglesia. Valor escalar 0.2 Creo que hoy la iglesia es la institucin ms importante de Estados Unidos. 1.5 Pienso que pertenecer a la iglesia es esencial para vivir en plenitud. 2.3 La liturgia me procura una sensacin de tranquilidad y me alienta. 3.3 Me gusta la iglesia porque encuentro en ella un ambiente amoroso. 4.5 Creo en las enseanzas de la iglesia, con algunas reservas. 5.6 Algunas veces pienso que la iglesia y la religin son necesarias pero en otras ocasiones lo dudo. 6.7 Creo en la sinceridad y en la bondad sin necesidad de asistir a ceremonias religiosas. 7.4 Me parece que la iglesia esta perdiendo terreno conforme avanza la educacin. 8.3 Considero que las enseanzas de la iglesia son demasiado superficiales y que por lo mismo tienen poca trascendencia social. 9.6 Pienso que la iglesia es un estorbo para la religin ya que todava se basa en la magia, la supersticin y el mito. 11.0 Creo que la iglesia es un parsito de la sociedad.
72
Para administrar una escala de Thurstone se pide a los sujetos que seleccionen de la lista los enunciados representativos de sus opiniones, o que escojan tres de ellas que se acerquen lo ms posible a su posicin al respecto. Por supuesto que los valores de la escala no vienen indicados en la escala de actitud, y los incisos se presentan en orden aleatorio. La puntuacin de cada sujeto sera la media de los valores de las declaraciones que haya seleccionado. Escalas de Guttman (tcnica acumulativa) Los crticos de las escalas de actitudes de Thurstone y Likert recalcan que contienen enunciados heterogneos acerca de varias dimensiones de un objeto de actitud. Por ejemplo, en la escala de Thurstone que meda las actitudes hacia la guerra se separaron los enunciados ticos de los que hacan referencia a sus consecuencias econmicas ni de los que reflejaban otros aspectos de las actitudes hacia ella. Esta combinacin de diversas dimensiones sobre una escala puede hacer muy difcil interpretar con claridad las puntuaciones. Guttman ide una tcnica para resolver este problema. Su mtodo caracterizado como una escala unidimensional, pretende determinar si la actitud que se va a estudiar comprende en realidad una sola dimensin. Una actitud se considera unidimensional slo si produce una escala acumulativa, aquella en que los enunciados se relacionen entre s, de modo que un sujeto que est de acuerdo con el reactivo 2 lo estar tambin con el 1; el que coincida con el 3 coincidir con el 1 y el 2, etc. Por lo tanto, los que le den su aprobacin a un punto particular de este tipo de escala tendrn una puntuacin ms alta en la escala total que los que no estn de acuerdo con l. Por ejemplo, consideremos los siguientes enunciados con que los sujetos debern de estar de acuerdo o discrepar:
Puntuacin 3 2 1 0 Con cu e rd a c on e l re ac tivo 3 X 0 0 2 X X 0 1 X X X No concuerda con el reactivo 3 0 X X X 2 0 0 X X 1 0 0 0 X
* El sujeto obtiene un punto cada vez que manifiesta estar de acuerdo
1. 2. 3.
La asociacin de padres y maestros es una institucin que da buenos nos frutos. La asociacin de padres y maestros influye notablemente en el mejoramiento de las escuelas. La asociacin de padres y maestros constituye la organizacin ms importante de Estados Unidos para el mejoramiento de las escuelas.
Figura 3
73
ELAS MEJA MEJA
Si lo anterior es una escala acumulativa, deber ser posible disponer todas las respuestas de los sujetos dentro de la estructura que aparece en el cuadro 3. Por tanto, si conocemos una puntuacin individual podra decirse exactamente cules enunciados aprob el sujeto. Por ejemplo, todos los individuos con una puntuacin de 2 creen que la asociacin de padres y maestros da buenos frutos y que influye notablemente en el mejoramiento de las escuelas, pero no piensan que sea la organizacin ms importante en ese aspecto. Los sujetos pueden clasificarse segn sus respuestas en la escala. Al construir una escala acumulativa, ante todo ha de averiguarse si los reactivos forman o no una escala unidimensional. Para ello se analiza la reproductividad de las respuestas esto es, la proporcin de las que caen dentro de una plantilla como la que se muestra en el cuadro 3. Tomando como base la puntuacin total, se predice la estructura de respuestas a incisos particulares. A continuacin se estudia la estructura real de las respuestas y se mide el grado en que fueron reproducidos en la puntuacin total. Una tcnica consiste en dividir el nmero total de errores entre el nmero de respuestas y restar de uno el cociente. Guttman sugiere 0,90 como el mnimo coeficiente de reproductividad necesario para admitir que una serie de reactivos constituye una escala unidimensional o acumulativa. Escalas de diferencial semntico. El diferencial semntico es otra forma de medir las actitudes hacia objetos, sujetos o eventos. Esta tcnica fue inventada y usada por Osgood, Suci y Tannenbaum. Se basa en la idea de que los objetos tienen dos tipos de significado para los individuos, el denominativo y el connotativo, que pueden clasificarse independientemente. Es fcil expresar el primero, no as el segundo. Es factible y til medir indirectamente el significado connotativo de los objetos mediante adjetivos bipolares y solicitando a los sujetos que para clasificar los objetos los comparen con esos adjetivos. As, el significado que tenga un objeto para un individuo ser la estructura de sus estimaciones del mismo sobre las escalas de adjetivos bipolares que hayan sido usadas. Osgood y sus colegas emplean escalas de siete puntos, con un punto medio igual a cero y de +3 a 3 para clasificaciones de actitud. A continuacin presentamos algunos ejemplos: Al obtener las clasificaciones que los individuos hacen de un objeto, el investigador puede determinar si la actitud de ellos hacia el objeto es positiva o negativa. Las puntuaciones de actitud logradas por cada respondiente se comparan con la actitud tpica que hacia el objeto externa un grupo designado. Una puntuacin de la actitud tambin se obtiene comparando las actitudes de varias personas hacia el objeto y la estructura de sus clasificaciones con las de los otros.
74
Bueno Limpio Dulce Fuerte Grande Pesado Activo Rpido Caliente
+3 +3 +3 +3 +3 +3 +3 +3 +3
+2 +2 +2 +2 +2 +2 +2 +2 +2
+1 +1 +1 +1 +1 +1 +1 +1 +1
0 0 0 0 0 0 0 0 0
-1 -1 -1 -1 -1 -1 -1 -1 -1
-2 -2 -2 -2 -2 -2 -2 -2 -2
-3 -3 -3 -3 -3 -3 -3 -3 -3
Malo Sucio Amargo Dbil Pequeo Ligero Pasivo Lento Fro
A travs de estudios de anlisis factoriales, Osgood, Suci y Tannenbaum descubrieron tres grupos de adjetivos: valorativos, que corresponden a adjetivos como bueno y malo, o limpio y sucio; de potencia, que incluyen adjetivos como fuerte y dbil, o grande y pequeo; y de actividad, que abarca adjetivos como activo y pasivo, rpido y lento. Del grupo, el valorativo es el ms sobresaliente de los tres. Los informes sobre la validez y confiabilidad de las escalas de diferencial semntico son generalmente satisfactorios. Los estudios de validez muestran coeficientes de correlacin de un 0,80 entre las estimaciones derivadas del diferencial semntico y las de las escalas de Thurstone, Likert y Guttman. Su confiabilidad de preprueba y posprueba viene a ser aproximadamente de 0,90, un resultado que es satisfactorio. Aunque, segn parece, el diferencial semntico se utiliza menos que los otros tres tipos de escalas de actitudes es una tcnica til para medir las actitudes hacia los objetos.
Tcnicas sociomtricas
Sirven para estudiar la organizacin de los grupos sociales. El procedimiento bsico, que puede modificarse de distintas maneras, consiste en solicitar a los miembros de un grupo particular que indiquen sus primeras, segundas y subsecuentes elecciones de compaeros segn un criterio especfico, por lo general en relacin con una actividad concreta. Por ejemplo, con quin le gustara trabajar en este proyecto, junto a quin le gustara sentarse? con quien almorzara o ira a jugar al salir de la escuela? El mtodo sociomtrico es en esencia un estudio de las selecciones hechas por los integrantes de un grupo.
SOCIOGRAMA DE UN GRUPO
A B
C D E
Figura 4
75
ELAS MEJA MEJA
Las preferencias se trazan en un Sociograma, que muestra el patrn de las relaciones interpersonales. En la figura 4 aparece un Sociograma donde C es el miembro que acapara las preferencias y al que podra llamrsele la estrella. Obsrvese que D, C y E se escogen mutuamente. Esto representa una camarilla; es decir, tres o ms individuos que muestran una preferencia mutua. B escoge a otros miembros y en cambio nadie escoge a l; es un aislado. Las preferencias que revele un Sociograma pueden cuantificarse y utilizarse en la investigacin. Los mtodos sociomtricos se aplican ampliamente en la psicologa social y tambin en la investigacin educacional, en la cual la posicin sociomtrica puede examinarse segn su relacin con otras variables como habilidad mental aprovechamiento, las preferencias de los maestros por los alumnos.
Observacin directa
La observacin directa y sistemtica del comportamiento constituye en muchos casos el mtodo de medicin ms adecuado. El investigador escoge la conducta que le interesa y elabora un procedimiento sistemtico para identificarla, clasificarla y registrarla en una situacin natural o preparada. Un ejemplo excelente de la aplicacin de este procedimiento en una situacin natural es el estudio de Urban Cambios del comportamiento resultantes de un estudio sobre enfermedades contagiosas. Los observadores. registraron el nmero de casos de comportamiento indeseable (v. gr.: meter los dedos u otros objetos en la boca) y el nmero de conductas deseables; utilizar el pauelo al toser o estornudar. Despus de esto seleccionaron un grupo experimental al cual se imparti un curso de seis semanas sobre enfermedades contagiosas, diseado para cambiar su comportamiento total y proporcionar informacin objetiva y conocimientos. Al final del curso reaparecieron los comportamientos indeseables. Se descubri que stos haban disminuido grandemente y que los deseables haban aumentado muchsimo en el grupo experimental, mientras que el cambio era mnimo en el grupo de control que no recibi el curso. Las observaciones realizadas doce semanas despus demostraron que persistan las diferencias entre ambos grupos. Hartshorne, May y Shuttleworth se valieron de la observacin directa para medir rasgos como dominio de s mismo, cooperatividad, veracidad y honestidad. Hicieron observaciones sobre nios ocupados en actividades escolares ordinarias y tambin prepararon situaciones artificiales para examinar conductas especficas. Por ejemplo, les administraron pruebas de vocabulario y de lectura, las recogieron y, sin que los nios lo supieran sacaron copias de las respuestas. Ms tarde les dieron claves de respuesta y les pidieron que calificaran sus exmenes. La diferencia entre las puntuaciones que dieron los nios y las puntuaciones verdaderas obtenidas al calificar las copias de los exmenes proporcion una medicin del engao.
76
Toda la observacin directa ha de estar precedida de cinco pasos preliminares: 1. Debe seleccionarse el aspecto del comportamiento que se va a observar. Como no es posible observar todo lo que ocurre, el investigador tiene que escoger de antemano los comportamientos que va registrar y los que ignorar. 2. Los comportamientos que pertenezcan a la categora elegida tienen que estar claramente definidos. Los observadores deben entender las acciones que clasificarn como, por ejemplo, conducta cooperativa o egosta. 3. Las personas que realizarn las observaciones deben haber recibido adiestramiento. El adiestramiento y la prctica son necesarios para que el investigador pueda confiar en que seguirn el procedimiento establecido para observar, interpretar y comunicar las observaciones. 4. Debe idearse un sistema para cuantificar las observaciones. El investigador tiene que escoger un mtodo corriente para contar los comportamientos observados. Por ejemplo, es necesario establecer de antemano si una accin y la reaccin correspondiente sern consideradas como uno o como dos casos de la conducta. Un buen mtodo es dividir el periodo de observacin en breves periodos y registrar en cada uno, digamos de 30 segundos, si el sujeto mostr el comportamiento o no. 5. Tienen que idearse procedimientos minuciosos para registrar el comportamiento. No puede confiarse demasiado en la memoria de los observadores. La mejor solucin es un sistema codificador que permita registrar inmediatamente, con una simple letra o un dgito, lo que se est observando. Se prefiere este sistema al narrativo, porque ste requiere mucho tiempo y atencin por parte de los observadores. Un ejemplo muy usado del plan codificador es el sistema Flanders para clasificar la conducta verbal en el aula. Tal como puede verse en la figura 5.
Este sistema proporciona categoras minuciosas y mutuamente exclusivas, cada una de las cuales puede registrarse como un solo digito. Los observadores expertos estn capacitados para registrar un dgito cada tres segundos. La cadena de dgitos que aparezca podr analizarse con facilidad para obtener no slo un registro de las proporciones de la conducta verbal que caen dentro de cada categora, sino tambin un cuadro de las que precedan o seguan a otras.
77
ELAS MEJA MEJA
CATEGORAS DEL ANLISIS DE LA INTERACCIN SEGN FLANDERS
LENGUAJE DE MAESTRO:
1.* Acepta los sentimientos: acepta y esclarece una actitud al tono emotivo de una alumna sin adoptar un gesto amenazador. Los sentimientos pueden ser positivos o negativos. Se incluyen sentimientos de prediccin y de recuerdo. Alienta o elogia: alienta o alaba la accin o el comportamiento de los alumnos. Rompe la tensin contando chistes, pero sin burlarse de otros; inclina la cabeza en seal de aprobaci6n o dice "aj" o " prosiga".
2.*
Respuesta
3.*
Acepta o utiliza las ideas de los alumnos: clarifica, construye o desarrolla las ideas que sugiere un alumno. Se incluyen las ampliaciones que haga de las ideas de los estudiantes; pero conforme aporte ms de las propias stas se desplazan a la categora 5. 4.* Formula preguntas: plantea una pregunta sobre el contenido a el procedimiento, basado en sus conocimientos pero con la intencin de que el alumno la conteste. 5.* Instruye: ofrece hechos u opiniones sobre contenidos o procedimientos; expresa sus ideas personales, da su propia explicacin o cita a una autoridad en la materia que no sea una alumna. 6.* Imparte instrucciones: da instrucciones, mandatos u ordena lo que el alumno debe hacer.
Iniciacin
7.*
Critica o justifica la autoridad: hace afirmaciones con el prop6sito de cambiar el comportamiento del alumno y lograr que adopte una conducta aceptable; regaa a veces; expone los motivos de sus acciones: demasiadas alusiones a s mismo.
LENGUAJE DEL A LUMNO: Respuesta
Iniciacin
Silencio
Respuesta-lenguaje del alumno: conversacin de los alumnos en respuesta al maestro. Este inicia el contacto, les pide que hablen o estructura la situacin. La libertad para expresar las propias ideas est limitada. 9.* Iniciacin-lengua del alumno: conversacin de los alumnos iniciada por ellos mismos. Expresan sus propias ideas; comienzan un nuevo tema: se les permite exponer opiniones y seguir una lnea de pensamiento, les gusta formular preguntas profundas; van ms all de la estructura actual. 10.* Silencio o confusin: pausas, cortos periodos de silencio y periodos de confusin en los cuales el observador no entender la comunicacin.
8.*
Estos nmeros no implican ninguna escala. Cada nmero es de ndole clasificatoria y designa un tipo especial de proceso de comunicacin. Al escribir estos nmeros durante la observacin se pretende enumerar, y no juzgar, una posicin en la escala. FUENTE: Ned A. Flanders: Analyzing Teaching Behavior (Boston: Addison-Wesley, 1970).
Figura 5
78
Resumen
Una tarea importante de los investigadores de las ciencias del comportamiento consiste en seleccionar los instrumentos de medicin para cuantificar la informacin. A los sujetos se les formulan preguntas directas mediante las entrevistas o los cuestionarios. Ambas tcnicas pueden ser estructuradas o inestructuradas. En las entrevistas y cuestionarios inestructurados se presentan las preguntas a los sujetos y se registran sus respuestas libres. En las formas estructuradas las preguntas estn organizadas y a los sujetos se les ofrece una seleccin limitada de respuestas. Las pruebas constituyen los instrumentos ms importantes para la recopilacin de datos en la investigacin educacional. Una prueba es una serie de estmulos que producen el rendimiento tpico en el sujeto. Las Pruebas de aprovechamiento son excelentes ejemplos de esta clase de medicin. Hay una gran variedad de ellas que proporcionan normas que pueden emplearse se como base de comparacin. Las pruebas de inteligencia son instrumentos para evaluar las capacidades verbales y no verbales de un individuo. Los inventarios de la personalidad tienen por objeto medir las caractersticas personales del sujeto. Las escalas de actitudes son instrumentos para medir las creencias, los sentimientos y reacciones del individuo a ciertos objetos. Los tipos ms importantes son las escalas de Likert, las de Thurstone, las de Guttman y el Diferencial Semntico. Las tcnicas sociomtricas sirven para estimar la posicin de un individuo entre sus compaeros. Permiten identificar a los miembros populares de los grupos (las estrellas), a los aislados y a las camarillas. Los mtodos de observacin directa fueron creados para observar sistemticamente el comportamiento.
79
ELAS MEJA MEJA
RECOLECCIN DE LOS DATOS

Roberto Hernndez Sampieri*
QU IMPLICA LA ETAPA DE RECOLECCIN DE LOS DATOS?

Una vez que seleccionamos el diseo de investigacin apropiado y la muestra adecuada de acuerdo con nuestro problema de estudio e hiptesis, la siguiente etapa consiste en recolectar los datos pertinentes sobre las variables involucradas en la investigacin. Recolectar los datos implica tres actividades estrechamente vinculadas entre s: a) Seleccionar un instrumento de medicin de los disponibles en el estudio del comportamiento o desarrollar uno (el instrumento de recoleccin de los datos). Este instrumento debe ser vlido y confiable, de lo contrario no podemos basarnos en sus resultados. b) Aplicar ese instrumento de medicin. Es decir, obtener las observaciones y mediciones de las variables que son de inters para nuestro estudio (medir variables). c) Preparar las mediciones obtenidas para que puedan analizarse correctamente (a esta actividad se le denomina codificacin de los datos).
QU SIGNIFICA MEDIR?
De acuerdo con la definicin clsica del termino ampliamente difundida medir significa asignar nmeros a objetos y eventos de acuerdo a reglas (Stevens, 1951). Sin embargo, como sealan Carmines y Zeller (1979), esta definicin es ms apropiada para las ciencias fsicas que para las ciencias sociales, ya que varios de los fenmenos que son medidos en stas no pueden caracterizarse como objetos o eventos, puesto que son demasiado abstractos para ello. La disonancia cognitiva, la alienacin, el producto nacional bruto y la credibilidad son conceptos tan abstractos para ser considerados cosas que pueden verse o tocarse (definicin de objeto) o solamente como resultado, consecuencia o producto (definicin de evento) (Carmines y Zeller, 1979, p. 10).
* Tomado de: HERNNDEZ, Roberto: Metodologa de la investigacin. Mxico, D.F., Mc Graw-Hill. 1998. pp. 241-346.
80
Este razonamiento nos hace sugerir que es ms adecuado definir la medicin como el proceso de vincular conceptos abstractos con indicadores empricos, proceso que se realiza mediante un plan explcito y organizado para clasificar (y frecuentemente cuantificar) los datos disponibles los indicadores en trminos del concepto que el investigador tiene en mente (Carmines y Zeller, 1979, p. 10). Y en este proceso, el instrumento de medicin o de recoleccin de los datos juega un papel central. Sin l no hay observaciones clasificadas. La definicin sugerida incluye dos consideraciones: La primera es desde el punto de vista emprico y se resume en que el centro de atencin es la respuesta observable (sea una alternativa de respuesta marcada en un cuestionario, una conducta grabada va observacin o una respuesta dada a un entrevistador). La segunda es desde una perspectiva terica y se refiere a que el inters se sita en el concepto subyacente no observable que es representado por la respuesta (Carmines y Zeller, 1979). As, los registros del instrumento de medicin representan valores observables de conceptos abstractos. Un instrumento de medicin adecuado es aquel que registra datos observables que representan verdaderamente a los conceptos o variables que el investigador tiene en mente. En toda investigacin aplicamos un instrumento para medir las variables contenidas en las hiptesis (y cuando no hay hiptesis, simplemente para medir las variables de inters). Esa medicin es efectiva cuando el instrumento de recoleccin de los datos realmente representa a las variables que tenemos en mente. Si no es as nuestra medicin es deficiente y por lo tanto la investigacin no es digna de tomarse en cuenta. Desde luego, no hay medicin perfecta, es prcticamente imposible que representemos fielmente variables tales como la inteligencia, la motivacin, el nivel socioeconmico, el liderazgo democrtico, la actitud hacia el sexo y otras ms; pero s debemos de acercarnos lo ms posible a la representacin fiel de las variables a observar, mediante el instrumento de medicin que desarrollemos.
QUE REQUISITOS DEBE CUBRIR UN INSTRUMENTO DE MEDICIN?

Toda medicin o instrumento de recoleccin de los datos debe reunir dos requisitos esenciales: confiabilidad y validez. La confiabilidad de un instrumento de medicin se refiere al grado en que su aplicacin repetida al mismo sujeto u objeto, produce iguales resultados. Por ejemplo, si yo midiera en este momento la temperatura ambiental mediante un termmetro y me indicara que hay 22C. Un minuto ms tarde consultara otra vez y el termmetro me indicara que hay 5C. Tres minutos despus observara el termmetro y ahora me indicara que hay 40C.
81
ELAS MEJA MEJA
Este termmetro no sera confiable (su aplicacin repetida produce resultados distintos). Igualmente, si una prueba de inteligencia la aplico hoy a un grupo de personas y me proporciona ciertos valores de inteligencia; la aplico un mes despus y me proporciona valores diferentes, al igual que en subsecuentes mediciones. Esa prueba no es confiable (analcense los valores de la figura 1, suponiendo que los coeficientes de inteligencia puedan oscilar entre 95 y 150). Los resultados no son consistentes; no se puede confiar en ellos.
EJEMPLO DE RESULTADOS PROPORCIONADOS POR UN INSTRUMENTO DE MEDICIN SIN CONFIABILIDAD
PRIMERA APLICACIN Martha Laura Arturo Lus Marco Rosa Maria Chester Teresa 130 125 118 112 110 110 108 107 Laura Luis Marco Arturo Chester Teresa Martha Rosa Maria SEGUNDA APLICACIN 131 130 127 120 118 118 115 107 Luis Teresa Martha Rosa Maria Laura Chester Arturo Marco TERCERA APLICACIN 140 129 124 120 109 108 103 101
Figura 1
La confiabilidad de un instrumento de medicin se determina mediante diversas tcnicas, las cuales se comentarn brevemente despus de revisar el concepto de validez. La validez, en trminos generales, se refiere al grado en que un instrumento realmente mide la variable que pretende medir. Por ejemplo, un instrumento vlido para medir la inteligencia debe medir la inteligencia y no la memoria. Una prueba sobre conocimientos de Historia debe medir esto y no conocimientos de literatura histrica. Aparentemente es sencillo lograr la validez. Despus de todo como dijo un estudiante pensamos en la variable y vemos cmo hacer preguntas sobre esa variable. Esto sera factible en unos cuantos casos (como lo sera el sexo de una persona). Sin embargo, la situacin no es tan simple cuando se trata de variables como la motivacin, la calidad de servicio a los clientes, la actitud hacia un candidato poltico y menos an con sentimientos y emociones, as como diversas variables con las que trabajamos en ciencias sociales. La validez es una cuestin ms compleja que debe alcanzarse en todo instrumento de medicin que se aplica. Kerlinger (1979, p. 138) plantea la siguiente pregunta respecto a la validez: Est usted midiendo lo que usted cree que esta midiendo? Si es as, su medida es vlida; si no, no lo es.
82
La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia (Wiersma, 1986; Gronlund, 1985): 1) evidencia relacionada con el contenido, 2) evidencia relacionada con el criterio y 3) evidencia relacionada con el constructo. Hablemos de cada una de ellas.
1) Evidencia relacionada con el contenido La validez de contenido se refiere al grado en que un instrumento refleja un dominio especfico de contenido de lo que se mide. Es el grado en que la medicin representa al concepto medido (Bohrnstedt, 1976). Por ejemplo, una prueba de operaciones aritmticas no tendr validez de contenido si incluye slo problema de resta y excluye problema de suma, multiplicacin o divisin (Carmines y Zeller, 1979). O bien, una prueba de conocimientos sobre las canciones de Los Beatles no deber basarse solamente en sus lbumes Let it Be y Abbey Road, sino que debe incluir canciones de todos sus discos. Un instrumento de medicin debe contener representados a todos los tems del dominio de contenido de las variables a medir. Este hecho se ilustra en la figura 2.
2) Evidencia relacionada con el criterio La validez de criterio establece la validez de un instrumento de medicin comparndola con algn criterio extremo. Este criterio es un estndar con el que se juzga la validez del instrumento (Wiersma, 1986). Entre los resultados del instrumento de medicin se relacionen ms al criterio, la validez del criterio ser mayor. Por ejemplo, un investigador valida un examen sobre manejo de aviones, mostrando la exactitud con que el examen predice qu tan bien un grupo de pilotos puede operar un aeroplano. Si el criterio se fija en el presente, se habla de validez concurrente (los resultados del instrumento se correlacionan con el criterio en el mismo momento o punto del tiempo). Por ejemplo, un cuestionario para detectar las preferencias del electorado por los distintos partidos contendientes, puede validarse aplicndolo tres o cuatro das antes de la eleccin y sus resultados compararlos con los resultados finales de la eleccin (si no hay fraude desde luego). Si el criterio se fija en el futuro se habla de validez predictiva. Por ejemplo, una prueba para determinar la capacidad administrativa de altos ejecutivos se puede validar comparando sus resultados con el futuro desempeo de los ejecutivos medidos.
83
ELAS MEJA MEJA ILUSTRACIN DE UN INSTRUMENTO DE MEDICIN CON VALIDEZ DE CONTENIDO VERSUS CON UNO QUE CARECE DE STA
DOMINIO DE VARIABLE
L E N A U
R A M Z G
Instrumento con validez de contenido
Instrumento sin validez de contenido
L E N A U
R A M Z G
Figura 2 3) Evidencia relacionada con el constructo La validez de constructo es probablemente la ms importante sobre todo desde una perspectiva cientfica y se refiere al grado en que una medicin se relaciona consistentemente con otras mediciones de acuerdo con hiptesis derivadas tericamente y que conciernen a los conceptos (o constructos) que estn siendo medidos. Un constructo es una variable medida y que tiene lugar dentro de una teora o esquema terico. Por ejemplo, supongamos que un investigador desea evaluar la validez de constructo de una medicin particular, digamos una escala de motivacin intrnseca: el Cuestionario de Reaccin a Tareas, versin mexicana (HernndezSampieri y Cortes, 1982). Estos autores sostienen que el nivel de motivacin intrnseca hacia una tarea est relacionado positivamente con el grado de persistencia adicional en el desarrollo de la tarea (v.g., los empleados con mayor motivacin intrnseca son los que suelen quedarse ms tiempo adicional una vez que concluye su jornada). Consecuentemente, la prediccin terica es que a mayor motivacin intrnseca, mayor persistencia adicional en la tarea. El investigador administra dicho cuestionario de motivacin intrnseca a un grupo de trabajadores y tambin determina su persistencia adicional en el trabajo. Ambas mediciones son correlacionadas. Si la
84
correlacin es positiva y sustancial, se aporta evidencia para la validez de constructo del Cuestionario de Reaccin a Tareas, versin mexicana (a la validez para medir la motivacin intrnseca). La validez de constructo incluye tres etapas: 1) Se establece y especfica la relacin terica entre los conceptos (sobre la base del marco terico). 2) Se correlacionan ambos conceptos y se analiza cuidadosamente la correlacin. 3) Se interpreta la evidencia emprica de acuerdo a qu tanto clarifica la validez de constructo de una medicin en particular. El proceso de validacin de un constructo est vinculado con la teora. No es posible llevar a cabo la validacin de constructo, a menos que exista un marco terico que soporte a la variable en relacin con otras variables. Desde luego, no es necesaria una teora sumamente desarrollada, pero s investigaciones que hayan demostrado que los conceptos estn relacionados. Entre ms elaborado y comprobado se encuentre el marco terico que apoya la hiptesis, la validacin de constructo puede arrojar mayor luz sobre la validez de un instrumento de medicin. Y mayor confianza tenemos en la validez de constructo de una medicin, cuando sus resultados se correlacionan significativamente con un mayor nmero de mediciones de variables que tericamente y de acuerdo con estudios antecedentes estn relacionadas. Esto se representa en la figura 3.
GRAFICACIN DE UN INSTRUMENTO CON VALIDEZ DE CONSTRUCTO Instrumento mide constructo A Teora
(Investigaciones hechas) encontraron que A se relaciona positivamente con B, C y D. Y negativamente con W.
Si el instrumento mide realmente A, sus resultados deben relacionarse positivamente con los resultados obtenidos en las mediciones B, C y D y relacionarse negativamente con resultados de W.
+B +C
+D -W
El instrumento parece realmente medir A Para analizar las posibles interpretaciones de evidencia negativa en la validez de constructo, se sugiere consultar a Cronbach y Meehl (1955) y Cronbach (1984).
VALIDEZ TOTAL = VALIDEZ DE CONTENIDO + VALIDEZ DE CRITERIO + VALIDEZ DE CONSTRUCTO
Figura 3
85
ELAS MEJA MEJA
As, la validez de un instrumento de medicin se evala sobre la base de tres tipos de evidencia. Entre mayor evidencia de validez de contenido, validez de criterio y validez de constructo tenga un instrumento de medicin; ste se acerca ms a representar la variable o variables que pretende medir. Cabe agregar que un instrumento de medicin puede ser confiable pero no necesariamente vlido (un aparato por ejemplo puede ser consistente en los resultados que produce, pero no medir lo que pretende). Por ello es requisito que el instrumento de medicin demuestre ser confiable y vlido. De no ser as, los resultados de la investigacin no los podemos tomar en serio.
FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y VALIDEZ

Hay diversos factores que pueden afectar la confiabilidad y la validez de los instrumentos de medicin. El primero de ellos es la improvisacin. Algunas personas creen que elegir un instrumento de medicin o desarrollar uno es algo que puede tomarse a la ligera. Incluso algunos profesores piden a los alumnos que construyan instrumentos de medicin de un da para otro, o lo que es casi lo mismo, de una semana a otra. Lo cual habla del poco o nulo conocimiento del proceso de elaboracin de instrumentos de medicin. Esta improvisacin genera casi siempre instrumentos poco vlidos o confiables y no debe existir en la investigacin social (menos an en ambientes acadmicos). Aun a los investigadores experimentados les toma tiempo desarrollar un instrumento de medicin. Es por ello que los construyen con cuidado y frecuentemente estn desarrollndolos, para que cuando los necesiten con premura se encuentren preparados para aplicarlos, pero no los improvisan. Adems, para poder construir un instrumento de medicin se requiere conocer muy bien a la variable que se pretende medir y la teora que la sustenta. Por ejemplo, generar o simplemente seleccionar un instrumento que mida la inteligencia, la personalidad o los usos y gratificaciones de la televisin para el nio, requiere amplios conocimientos en la materia, estar actualizados al respecto y revisar cuidadosamente la literatura correspondiente. El segundo factor es que a veces se utilizan instrumentos desarrollados en el extranjero que no han sido validados a nuestro contexto: cultura y tiempo. Traducir un instrumento aun cuando adaptemos los trminos a nuestro lenguaje y los contextualicemos no es de ninguna manera (ni remotamente) validarlo. Es un primer y necesario paso, pero slo es el principio. Por otra parte, hay instrumentos que fueron validados en nuestro contexto pero hace mucho tiempo. Hay instrumentos que hasta el lenguaje nos suena arcaico. Las culturas, los grupos y las personas
86
cambian; y esto debemos tomarlo en cuenta al elegir o desarrollar un instrumento de medicin. Un tercer factor es que en ocasiones el instrumento resulta inadecuado para las personas a las que se les aplica: no es emptico. Utilizar un lenguaje muy elevado para el respondiente, no tomar en cuenta diferencias en cuanto a sexo, edad, conocimientos, capacidad de respuesta, memoria, nivel ocupacional y educativo, motivacin para responder y otras diferencias en los respondientes; son errores que pueden afectar la validez y confiabilidad del instrumento de medicin. Un cuanto factor que puede influir est constituido por las condiciones en las que se aplica el instrumento de medicin. Si hay ruido, hace mucho fro (por ejemplo en una encuesta de casa en casa), el instrumento es demasiado largo o tedioso, son cuestiones que pueden afectar negativamente la validez y la confiabilidad. Normalmente en los experimentos se puede contar con instrumentos de medicin ms largos y complejos que en los diseos no experimentales. Por ejemplo, en una encuesta pblica sera muy difcil poder aplicar una prueba larga o compleja. Por otra parte, aspectos mecnicos tales como que si el instrumento es escrito, no se lean bien las instrucciones, falten pginas, no haya espacio adecuado para contestar, no se comprendan las instrucciones, tambin pueden influir de manera negativa.
CMO SE SABE SI UN INSTRUMENTO DE MEDICIN ES CONFIABLE Y VLIDO?

En la prctica es casi imposible que una medicin sea perfecta. Generalmente se tiene un grado de error. Desde luego, se trata de que este error sea el mnimo posible. Es por esto que la medicin de cualquier fenmeno se conceptualiza con la siguiente frmula bsica: X=t+e Donde X representa los valores observados (resultados disponibles), t son los valores verdaderos y e es e1 grado de error en la medicin. Si no hay error de medicin (e es igual a cero), el valor observado y el verdadero son equivalentes. Esto puede verse claramente as: X=t+0 X=t Esta situacin representa el ideal de la medicin. Entre mayor sea el error al medir, el valor que observamos (y que es en el que nos basamos) se aleja ms del valor real o verdadero. Por ejemplo, si medimos la motivacin de un individuo y esta
87
ELAS MEJA MEJA
medicin est contaminada por un grado de error considerable, la motivacin registrada por el instrumento ser bastante diferente de la motivacin real que tiene ese individuo. Por ello es importante que el error sea reducido lo ms posible. Pero cmo sabemos el grado de error que tenemos en una medicin? Calculando la confiabilidad y validez. Clculo de la confiabilidad Existen diversos procedimientos para calcular la confiabilidad de un instrumento de medicin. Todos utilizan frmulas que producen coeficientes de confiabilidad. Estos coeficientes pueden oscilar entre 0 y 1. Donde un coeficiente de 0 significa nula confiabilidad y 1 representa un mximo de confiabilidad (confiabilidad total). Entre ms se acerque el coeficiente a cero (0), hay mayor error en la medicin. Esto se ilustra en la figura 4. INTERPRETACIN DE UN COEFICIENTE DE CONFIABILIDAD
MUY BAJA 0 0
0% de confiabilidad en la medicin (la medicin est contaminada de error)
BAJA
REGULAR
ACEPTABLE
ELEVADA
1
1
100% de confabilidad en la medicin (no hay error)
Figura 4 Los procedimientos ms utilizados para determinar la confiabilidad mediante un coeficiente son: 1. Medida de estabilidad (confiabilidad por testretest). En este procedimiento un mismo instrumento de medicin (o tems o indicadores) es aplicado dos o ms veces a un mismo grupo de personas, despus de un periodo de tiempo. Si la correlacin entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable. Se trata de una especie de diseo panel. Desde luego, el periodo de tiempo entre las mediciones es un factor a considerar. Si el periodo es largo y la variable susceptible de cambios, ello puede confundir la interpretacin del coeficiente de confiabilidad obtenido por este procedimiento, y si el periodo es corto las personas pueden recordar cmo contestaron en la primera aplicacin del instrumento, para aparecer como ms consistentes de lo que son en realidad (Bohrnstedt, 1976). 2. Mtodo de formas alternativas o paralelas. En este procedimiento no se administra el mismo instrumento de medicin, sino dos o ms versiones
88
equivalentes de ste. Las versiones son similares en contenido, instrucciones, duracin y otras caractersticas. Las versiones generalmente dos son administradas a un mismo grupo de personas dentro de un periodo de tiempo relativamente corto. El instrumento es confiable si la correlacin entre los resultados de ambas administraciones es significativamente positiva. Los patrones de respuesta deben variar poco entre las aplicaciones. 3. Mtodo de mitades partidas (splithalves). Los procedimientos anteriores (medida de estabilidad y mtodo de formas alternas), requieren cuando menos dos administraciones de la medicin en el mismo grupo de individuos. En cambio, el mtodo de mitades partidas requiere slo una aplicacin de la medicin. Especficamente, el conjunto total de tems (o componentes) es dividido en dos mitades y las puntuaciones o resultados de ambas son comparados. Si el instrumento es confiable, las puntuaciones de ambas mitades deben estar fuertemente correlacionadas. Un individuo con baja puntuacin en una mitad, tender a tener tambin una baja puntuacin en la otra mitad. El procedimiento se diagrama en la figura 5.
ESQUEMA DEL PROCEDIMIENTO DE MITADES-PARTIDAS

El instrumento de medicin se aplica a un grupo Los tems se dividen en dos mitades (el instrumento se divide en dos) Cada mitad se califica independientemente Se correlacionan puntuaciones y se determina la confiabilidad
1 2 3 4 5 6 7 8 9 10
1 3 4 7 10
resultados (puntuaciones)
C (0 a 1
2 5 6 8 9
resultados (puntuaciones)
Figura 5
89
ELAS MEJA MEJA
Al dividir los tems, estos se empareja en contenido y dificultad La confiabilidad vara de acuerdo al nmero de tems que incluya el instrumento de medicin. Cuantos ms tems la confiabilidad aumenta (desde luego, que se refieran a la misma variable). Esto resulta lgico, vemoslo con un ejemplo cotidiano: Si se desea probar qu tan confiable o consistente es la lealtad de un amigo hacia nuestra persona, cuantas ms pruebas le pongamos, su confiabilidad ser mayor. Claro est que demasiados tems provocarn cansancio en el respondiente. 4. Coeficiente alfa de Cronbach. Este coeficiente desarrollado por J. L. Cronbach requiere una sola administracin del instrumento de medicin y produce valores que oscilan entre 0 y 1. Su ventaja reside en que no es necesario dividir en dos mitades a los tems del instrumento de medicin, simplemente se aplica la medicin y se calcula el coeficiente. 5. Coeficiente KR20. Kuder y Richardson (1937) desarrollaron un coeficiente para estimar la confiabilidad de una medicin, su interpretacin es la misma que la del coeficiente alfa. Clculo de la validez La validez de contenido es compleja de obtener. Primero, es necesario revisar cmo ha sido utilizada la variable por otros investigadores. Y en base a dicha revisin elaborar un universo de tems posibles para medir la variable y sus dimensiones (el universo tiene que ser lo ms exhaustivo que sea factible). Posteriormente, se consulta con investigadores familiarizados con la variable para ver si el universo es exhaustivo. Se seleccionan los tems bajo una cuidadosa evaluacin. Y si la variable tiene diversas dimensiones o facetas que la componen, se extrae una muestra probabilstica de tems (ya sea al azar o estratificada cada dimensin constituira un estrato). Se administran los tems, se correlacionan las puntuaciones de los tems entre s (debe haber correlaciones altas, especialmente entre tems que miden una misma dimensin) (Bohmstedt, 1976), y se hacen estimaciones estadsticas para ver si la muestra es representativa. Para calcular la validez de contenido son necesarios varios coeficientes. La validez de criterio es ms sencilla de estimar, lo nico que hace el investigador es correlacionar su medicin con el criterio, y este coeficiente es el que se toma como coeficiente de validez (Bohrnstedt, 1976). Esto podra representarse as:
Medicin Correlacin Criterio
Figura 6
90
La validez de constructo se suele determinar mediante un procedimiento denominado Anlisis de Factores. Su aplicacin requiere de slidos conocimientos estadsticos y del uso de un programa estadstico apropiado en computadora. Para quien desee compenetrarse con esta tcnica recomendamos consultar a Harman (1967), Gorsuch (1974), Nie et al. (1975), OnKim y Mueller (1978 y 1978) y Hunter (1980). Asmismo, para aplicarlos se sugiere revisar a Nie et al. (1975), Cooper y Curtis (1976) y en espaol Padua (1979). Aunque es requisito conocer el programa estadstico para computadora.
91
ELAS MEJA MEJA
92
CAPTULO II
EL MUESTREO
93
ELAS MEJA MEJA
94
EL MUESTREO
Una vez que el investigador ha diseado la estrategia para contrastar la hiptesis y ha elaborado sus instrumentos de acopio de datos, debe resolver el problema de identificar a los sujetos con los que trabajar o cul ser el objeto de estudio, para saber a quines o dnde aplicar los instrumentos, ya sea de medicin, de observacin o simplemente de acopio de informacin. En esta etapa el investigador debe definir la unidad de anlisis que, en el caso de la investigacin de la conducta pueden ser personas, organizaciones, locales, mtodos didcticos, etc. Una vez establecida la unidad de anlisis, debe delimitar la poblacin que ser estudiada. Sobre esta poblacin el investigador tratar de generalizar los resultados de su trabajo.
1. POBLACIN Y MUESTRA
Una poblacin es la totalidad de sujetos o elementos que tienen caractersticas comunes. En otras palabras, una poblacin es la totalidad de los miembros de la unidad de anlisis. El concepto de poblacin equivale al concepto de conjunto y ste es delimitado por el investigador segn los criterios que considere pertinentes. Una poblacin as conceptualizada ser ms grande o ms pequea, es decir, el tamao de la poblacin depender de la definicin que el investigador formule. Si define la poblacin como el total de personas que estudian educacin superior en el Per, el nmero de esta poblacin es una cifra diferente a la cifra que corresponde al nmero de individuos varones que estudian educacin superior en el Per. Tambin constituye una poblacin el nmero de participantes de los programas de maestra de las universidades nacionales, este nmero existe y es diferente al nmero de esta otra poblacin: el nmero de participantes de los programas de maestra en educacin de la Universidad Nacional Mayor de San Marcos. Es muy importante que el investigador defina claramente la poblacin porque, como se ha visto, de esta definicin depende el nmero de los elementos del conjunto. Segn las exigencias de la estrategia para contrastar hiptesis, el investigador debe definir la poblacin. Muchos investigadores no definen con claridad la poblacin ni mucho menos el nmero de sus elementos y directamente identifican la muestra.
95
ELAS MEJA MEJA
En este caso, los investigadores actan a ciegas, pues no tienen claro cul es la unidad de anlisis con la que van a trabajar, ni tienen idea del tamao de la poblacin. Si por ejemplo se trata de hacer una investigacin acerca de los hbitos de lectura de estudiantes universitarios, la unidad de anlisis es estudiantes universitarios, pero es necesario definir qu estudiantes universitarios: estudiantes universitarios de universidades nacionales o de universidades particulares?, estudiantes universitarios de facultades de medicina o de ingeniera?, estudiantes universitarios varones o mujeres? Las respuestas a estas interrogantes conducen a nmeros diferentes de elementos del conjunto, pues el nmero de estudiantes universitarios del pas es diferente del nmero de estudiantes universitarios de universidades nacionales. El nmero de estudiantes universitarios del Per, no es el mismo que el nmero de estudiantes universitarios latinoamericanos. Es pues muy importante definir la poblacin, porque de esta definicin se deriva el nmero de sus elementos. La poblacin se llama tambin universo y su estudio se realiza mediante el censo, es decir, mediante el conteo, uno a uno, de todos los elementos del conjunto. Son ejemplos de poblaciones o universos, los alumnos que estudian educacin superior en el Per, los docentes sin ttulo profesional de la ciudad de Lima o la totalidad de estudiantes de post grado de la Universidad Nacional Mayor de San Marcos. La muestra es un sub conjunto de la poblacin. Para que un sector de la poblacin sea considerado como muestra es necesario que todos los elementos de ella pertenezcan a la poblacin, por eso se dice que una muestra debe ser representativa de la poblacin, es decir, debe tener las mismas caractersticas generales de la poblacin. No se consideran muestras si algunos sujetos de la supuesta muestra no pertenecen a la poblacin. El estudio de la muestra se realiza empleando tcnicas de muestreo. El muestreo es la tcnica a travs de la cual se estudia la muestra. Cuando se desea conocer, por ejemplo, la totalidad de habitantes del Per, se necesita recurrir a un censo que es, como se ha dicho, el conteo uno a uno de todos los habitantes del pas. El resultado del censo es una cifra exacta que se denomina parmetro. Pero es el caso que los censos, por la complejidad que demanda su ejecucin y por los recursos econmicos que requiere, no se realizan a cada momento. Por otra parte, los resultados de un censo no pueden ser conocidos de inmediato, por lo que la pregunta sobre la poblacin del Per queda sin respuesta inmediata. Pero como el investigador necesita una respuesta inmediata, recurre a otras formas de estimar el nmero de habitantes del Per y, va aproximaciones o anlisis de los ltimos datos censales y de los ndices de mortalidad y natalidad en un perodo determinado, puede identificar una cifra, no exacta pero aproximada, que se denomina estadgrafo. Como resultado de la aplicacin de la tcnica de muestreo, el investigador obtiene
96
un estadgrafo, una cifra lograda por estimacin, clculo o aproximacin al nmero real de los elementos de la poblacin. Por eso se dice que el muestreo es una tcnica que permite conocer los parmetros de la poblacin a travs de los estadgrafos de la muestra . Esto quiere decir que la muestra, al ser considerada un sub conjunto de la poblacin tiene que ser, necesariamente, representativa de la poblacin para poder generalizar los datos que se obtengan al estudiar la muestra. Una muestra no representativa es una muestra sesgada, por no poseer las mismas caractersticas de la poblacin. Por ejemplo, si se quiere estudiar el ndice de eficiencia de un Centro de Estudios Pre Universitarios, no se puede aplicar una prueba a todos los estudiantes que ingresaron en la Universidad, porque no todos los estudiantes que ingresaron provienen del mismo Centro de Estudios Pre Universitarios. El conocimiento aproximado del nmero de elementos de la poblacin es vlido siempre y cuando se ubique dentro de los niveles de tolerancia o de variacin de los datos. Por el contrario, cuando la discrepancia entre el estadgrafo y el parmetro es demasiada, no ser posible conocer la real dimensin de la poblacin. Si supuestamente se conociera el parmetro y se aceptara que el nmero de habitantes del Per, el da de hoy, es de 28867,563 habitantes, el estadgrafo que se obtendra sera vlido si se aproximara a esta cifra ideal, como por ejemplo decir que la poblacin del Per, el da de hoy, se aproxima a los 29 millones de habitantes o se dijera que la poblacin del Per supera los 28 millones y medio de habitantes. Estas ltimas son cifras calculadas, cifras estimadas, no son el resultado de un censo, son estadgrafos que tienen la particularidad de aproximarse al parmetro. Pero si dijramos que la poblacin del Per supera los 100 millones de habitantes o se dijera que el nmero de habitantes del Per es menos de 6 millones, entonces, no se estara contribuyendo al conocimiento del parmetro a travs de los estadgrafos, el investigador se estara engaando con respecto al nmero de habitantes que hay, hoy da, en el Per, porque estara proporcionando cifras que no estn prximas al parmetro y, con toda seguridad, para obtenerlas, no habra realizado los clculos adecuados. Para que un estadgrafo sea vlido debe coincidir con el parmetro, con ms o menos aproximacin. En caso contrario, tal cifra no puede ser considerada un estadgrafo porque no se aproxima al parmetro. La tcnica del muestreo se usa cuando la poblacin es relativamente grande y no se puede censar a todos los sujetos y hallar parmetros. Por el contrario, si la poblacin de estudio es pequea, no ser necesario emplear la tcnica del muestreo y ser preferible disponer de datos censales o parmetros. As, cuando la poblacin es relativamente pequea, la muestra tender a ser ms grande. Y, por el contrario, si la poblacin es demasiado grande, la muestra tender a ser relativamente pequea.
97
ELAS MEJA MEJA
La tcnica de muestreo permite generalizar los datos obtenidos para todos los elementos de la poblacin y no slo para los elementos de la muestra. Tambin se puede generalizar para otras poblaciones que tengan caractersticas similares a las que se estudia. Esta es la manera inferencial que hace posible la generalizacin del conocimiento y, por consiguiente, el avance de la ciencia. Para obtener muestras, el investigador debe tener en cuenta lo siguiente: La muestra debe ser una parte de la poblacin fcilmente accesible. Si por ejemplo se desea hacer el anlisis de la pureza del agua potable que se consume en Lima, los investigadores podrn abrir cualquier cao y llenar sus probetas de laboratorio con el agua que salga de dichos caos. Ahora si existiese alguna duda de que el agua que sale del cao no proviene de la planta central de procesamiento de agua, los investigadores pueden constituirse en dicha planta de tratamiento y llenar sus probetas en la laguna que contiene el agua lista para distribuirse en la ciudad. Si un investigador desea estudiar la influencia que determinados mtodos didcticos producen en el aprendizaje de alumnos universitarios, puede seleccionar su muestra acudiendo a distintas aulas de su Universidad en donde encontrar varios grupos de estudiantes. El investigador en su recorrido por distintas facultades puede ir seleccionando, para su muestra, a uno u otro grupo de alumnos a cuyas aulas llegue. Si se tiene, en un Hospital, un conjunto de Historias Clnicas, el investigador puede coger, al azar, el nmero de Historias Clnicas que desee o las que encuentre ms a la mano. Cuando el investigador trabaja con poblaciones pequeas pero heterogneas, es preferible hacer censos y evitar aplicar la tcnica de muestreo. En todo caso, lo que debe hacer el investigador es ubicar las llamadas unidades tpicas de esa poblacin. Estas unidades tpicas son las que, a juicio del investigador, ms se acercan al promedio de la poblacin. Por ejemplo, en un aula de 40 estudiantes, la muestra puede estar constituida por los alumnos que tienen rendimientos acadmicos medios, de ninguna manera por los que tienen rendimientos acadmicos muy altos o muy bajos. En la investigacin de la conducta, como quiera que se deben hacer mediciones, entrevistas, encuestas o aplicar otro tipo de instrumentos, es necesario que los sujetos que constituyan la muestra sean voluntarios, es decir, que demuestren su predisposicin de participar en la investigacin. En otras ciencias, como por ejemplo la Biologa, esta condicin no es relevante, porque si por ejemplo se estudia el comportamiento de los animales, el investigador puede coger, de las distintas jaulas de animales que dispone, el ejemplar cuyas caractersticas desea observar.
98
2. DETERMINACIN DEL TAMAO DE LA MUESTRA

No existe un criterio definido acerca del tamao recomendable que debe tener la muestra. La experiencia del investigador, los recursos que dispone o las facilidades tcnicas que se le presenten, sern los determinantes para fijar el tamao de la muestra. Sin embargo, desde la etapa de planificacin de la investigacin, se debe fijar el tamao de la muestra. Para ello se debe sopesar las ventajas y desventajas de trabajar con una muestra de una determinada magnitud. En principio, una muestra grande, produce informacin ms confiable, cuando la poblacin es relativamente pequea. Por el contrario, una muestra pequea extrada de una poblacin grande, proporciona informacin ms confiable de esta poblacin y su grado de representatividad y generalizacin es mayor. Existen muchas tcnicas para calcular el tamao de una muestra. Cada una de ellas parte de criterios especficos derivados de las caractersticas que tienen las investigaciones que se desean realizar. En trminos generales, el tamao de una muestra debe determinarse en funcin de las siguientes condiciones: La desviacin estndar de los datos de la variable dependiente. El nivel de significacin elegido para aceptar o rechazar la hiptesis nula. La magnitud que asigna el investigador a la diferencia de los promedios entre el grupo experimental y el de control. Por ejemplo se trata de determinar el tamao de la muestra necesaria para probar la siguiente hiptesis: Existen diferencias significativas entre los promedios del grupo de profesores que particip en un proceso de capacitacin profesional presencial, con respecto del grupo de profesores que particip en el mismo proceso de capacitacin profesional mediante la modalidad de educacin a distancia. En este caso, luego de analizar los resultados de la prueba de rendimiento acadmico, se debe hallar la desviacin estndar de estos datos que, por ejemplo, puede ser 3,5. Seguidamente se establece el nivel de significacin en 0,05, es decir el nivel de confianza o margen de error aceptable para decidir sobre la hiptesis nula. Finalmente se establece la diferencia que se estima deben tener los promedios de los grupos, por ejemplo 2,76. Con estos datos, es posible resolver la siguiente frmula:
En donde: n = tamao estimado de la muestra. = desviacin estndar de los datos de la variable dependiente.
99
ELAS MEJA MEJA
t = nivel de significacin para decidir acerca de la hiptesis nula. P = tamao de la poblacin. D = estimacin de la diferencia entre grupos establecida por el investigador. Al sustituir los trminos en la frmula se tiene:
El tamao de la muestra, segn esta tcnica es: 482 Otra frmula que permite determinar el tamao de la muestra es la siguiente:
En donde: n: tamao de la muestra. E: margen de error. P y Q: probabilidades de xito o fracaso (50%). N: Tamao de la poblacin. E2 : Margen de error al cuadrado. Reemplazando los valores, los datos son los siguientes:
Hechas las operaciones resulta:
El tamao de la muestra es de 568, para una poblacin de 6,250 sujetos. Sin embargo, estos procedimientos complican el trabajo del investigador, por lo que resulta muy prctica la tabla de Arkin y Colton (Ver Cuadro N 3) que permite identificar el tamao de la muestra para una determinada poblacin segn el margen de error con el que se desea trabajar. Empleando esta tabla, se puede hallar el tamao de la muestra deseada. Por ejemplo, con ayuda de esta tabla, si la poblacin es 3,000, la muestra ser 353, con un margen de error de 0,05, que es igual al nivel de significacin elegido para decidir sobre la hiptesis nula. En el ejemplo propuesto, luego de hacer las operaciones se obtiene que, para una poblacin de 6,250, con un margen de error de 0,04, la muestra debe ser de 568. Este dato hallado es muy cercano al valor que se encuentra en la tabla: para una poblacin de 6,000 sujetos, con el 0,04 de margen de error, la muestra es 566.
100
Como se podr observar en esta tabla, cuanto ms pequea es la poblacin, ms grande es el tamao de la muestra. As, para una poblacin de 500, con un margen de error de 0.05, la muestra es del mismo tamao, es decir del 100%. Sin embargo, para una poblacin muy grande, de 10,000, la muestra es de 350, que viene a constituir slo el 3,5 % de la poblacin. Por eso no se puede afirmar que el tamao de una muestra para que sea representativa debe ser del 5% o del 10%. En los casos en los que el casillero aparece en blanco, el tamao de la muestra deber ser de ms de la mitad del tamao de la poblacin.
TAMAO DE LA MUESTRA
Amplitud poblacin 500 1,000 2,000 3,000 4,000 5,000 6,000 7,000 8,000 10,000 15,000 20,000 25,000 50,000 100,000 Infinito
+ 1% ---------5,000 6,000 6,670 7,143 8,333 9,091 10,000
Amplitud de la muestra segn mrgenes de error +2% + 3% + 4% + 5% +10% ---222 83 --385 286 91 -714 476 333 95 1,364 811 517 353 97 1,538 870 541 364 98 1,667 909 556 370 98 1,765 938 566 375 98 1,842 959 574 378 99 1,905 976 580 381 99 2,000 1,000 588 385 99 2,143 1,034 600 390 99 2,222 1,530 606 392 100 2,273 1,064 610 394 100 2,381 1,087 617 397 100 2,439 1,099 621 398 100 2,500 11,111 625 400 100
Arkin y Colton: Tables for statisticians. Fundamental Statistics in Psychology and Education. Tokio, Mc Graw-Hill, 1965. Cuadro N 3 Es muy relativo afirmar que una muestra sea grande o pequea. Si la poblacin es pequea, por ejemplo 800 sujetos, la muestra podra ser del 50%, muestra porcentualmente grande, pero con slo 400 sujetos. En cambio si la poblacin es de 80,000, una muestra de 400 sujetos es porcentualmente muy pequea: slo el 0.5%. Por eso, en la prctica, los investigadores aplican la siguiente regla: muestras grandes para poblaciones pequeas y muestras pequeas para poblaciones grandes.
101
ELAS MEJA MEJA
Segn lo que se puede observar en la tabla y las diferentes situaciones en las que se determina el tamao de la muestra, se establece que una poblacin es pequea cuando el nmero de sus elementos no sobrepasa los 500. El tamao de la muestra depende de la precisin con la que el investigador desea conocer el fenmeno que estudia. Si por ejemplo un investigador desea analizar el nivel de rendimiento acadmico de los estudiantes de una Universidad, el tamao de la muestra depender de cuan exactamente este investigador desea conocer cuntos estudiantes tienen rendimiento acadmico alto y cuntos tienen rendimiento acadmico bajo en su poblacin de estudio. En las Ciencias Sociales se acepta un margen de error de ms o menos 5%. As, si el porcentaje de estudiantes con rendimiento acadmico alto se calcula en el orden del 78%, luego de estudiar una muestra pequea, el porcentaje de estudiantes con rendimiento acadmico alto de toda la poblacin estar entre el 73%, que resulta de restar 5 de 78 y el 83%, que resulta de sumar 5 a 78. Como se ve, el margen de error que se elige es arbitrario. Pero es muy importante tenerlo identificado al momento de decidir acerca del tamao de la muestra. Los mrgenes de error de diferentes magnitudes influyen en los resultados de la investigacin y en las decisiones que se adopten. Si en la investigacin no es aceptable correr grandes riesgos al adoptar las decisiones, los mrgenes de error deben ser ms pequeos, en cambio si las decisiones no conllevan riesgos serios, los mrgenes de error pueden sen ms grandes. Por ejemplo, si se trata de hacer presupuestos y calcular la cantidad de dinero que se va a gastar en un determinado proyecto, la decisin debe tomarse de modo muy preciso, mientras que si se va a decidir acerca de si se aplica o no se aplica un determinado mtodo didctico, la decisin no es tan riesgosa y el margen de error tolerable puede ser ms grande.
3. ERROR DE MUESTREO
En la investigacin de la conducta es ms difcil que una muestra represente fielmente las caractersticas de la poblacin. A las discrepancias entre las caractersticas de la poblacin y las caractersticas de la muestra se denomina error de muestreo que, si es muy grande, tergiversa el sentido del concepto de muestra, pero si es pequeo, puede ser tolerado y, en tal caso, se puede asumir que una muestra representa fielmente a la poblacin pero con un error pequeo o poco significativo que no es tan grande como para tergiversar el conocimiento de dicha poblacin. Por ejemplo, si el promedio del coeficiente intelectual de una poblacin de 2,300 estudiantes universitarios es 110, una muestra ser muy representativa si el promedio
102
del coeficiente intelectual de los 100 estudiantes de la muestra fuese tambin 110. En este caso no habra error de muestreo. Sin embargo, en la realidad, casi nunca se presenta esta situacin y antes bien es posible encontrar coeficientes intelectuales de 109, 111 110,5. Lo que interesa es establecer cul es el margen de error que debe ser tolerado al identificar muestras para la investigacin de la conducta. Baste decir que cuanto menor sea el margen de discrepancia, mayor ser la capacidad de la muestra de representar fielmente a la poblacin.
4. VENTAJAS DE LA TCNICA DE MUESTREO

En la investigacin, la tcnica de muestreo se aplica cuando es necesario y no en todos los casos. Si por ejemplo al definir la poblacin el investigador establece que el nmero de los elementos de la poblacin es 100, entonces no corresponde trabajar con una muestra, porque la poblacin es pequea y el investigador debe realizar un censo de todos los elementos de la poblacin. Los datos que obtenga luego del censo se denominan, como se ha dicho, parmetros y son datos ms exactos y precisos que las cifras estimadas que se obtienen por medio del muestreo. Al realizar investigaciones no siempre se debe emplear la tcnica del muestreo. Slo debe emplearse en casos necesarios, es decir, cuando el nmero de los elementos de la poblacin, definida por el investigador, sea mayor de 500 elementos. Cuando es necesario, el empleo de la tcnica de muestreo proporciona considerable ayuda al investigador y le ofrece las siguientes ventajas: Ocasiona menores costos: Los menores costos son producto del menor esfuerzo que se realiza para obtener los datos; pues el trabajo se facilita al estudiar una pequea porcin de la poblacin. Si, por el contrario, el investigador tuviera que realizar un censo, los esfuerzos y los costos seran mayores. Paradgicamente, cuando las poblaciones son muy grandes es recomendable trabajar con muestras pequeas. Permite mayor rapidez: Al trabajar con pequeas cantidades, los datos se pueden obtener ms rpidamente. Si el investigador requiere la informacin con urgencia, el muestreo le resuelve este problema. Proporciona mayores posibilidades de aplicacin: Las tcnicas censales requieren personal altamente calificado, planificacin rigurosa y anticipada del trabajo, equipos especializados, etc. En cambio, las tcnicas de muestreo flexibilizan el trabajo porque no requieren las condiciones exigidas cuando se trata de hacer censos, y, por tanto, proporcionan mayores posibilidades de aplicacin. Produce mayor exactitud en el estudio de la poblacin: Cuando se reduce el nmero de casos de estudio, se ahorra un tiempo que el investigador puede
103
ELAS MEJA MEJA
aprovechar para capacitar ms intensamente a un menor nmero de personal auxiliar que realizar un mejor trabajo. As tambin el investigador tendra mejores oportunidades de realizar supervisiones ms minuciosas, tanto durante el trabajo de campo como en el procesamiento de la informacin.
5. MUESTREO PROBABILSTCO
El muestreo, segn las condiciones en las que se realice, puede ser probabilstico o no probabilstico Se denominan muestras probabilsticas a las que se obtienen por procedimientos del azar o de la probabilidad, mientras que las muestras no probabilsticas se obtienen siguiendo criterios seleccionados por el investigador y por ello se llaman muestras intencionadas. Para comprender mejor esta distincin es necesario explicar qu es la probabilidad. La probabilidad es la situacin que permite seleccionar a un miembro individual de una poblacin sin que intervengan, en absoluto, la intencin o los propsitos del investigador y, por el contrario, esta seleccin se realice completamente al azar o en forma totalmente aleatoria. Por ejemplo, si en un programa de maestra existen 2,345 estudiantes y se desea obtener una muestra de 334 estudiantes, la probabilidad de seleccionar un estudiante para que conforme la muestra ser: 334: 2,345 = 0,14. Para que un hecho sea considerado probabilstico o del azar se requiere que se cumplan las siguientes condiciones: 1 Igualdad de oportunidades y, 2 Independencia en la ocurrencia de los eventos. La igualdad de oportunidades exige que todos los sujetos de la muestra tengan la misma oportunidad que los dems de ser seleccionados para conformar la muestra. Por ejemplo, si la poblacin es de 30 y se quiere obtener una muestra de 1, cada sujetos tendr una oportunidad sobre 30. En una situacin autnticamente probabilstica, no se acepta que uno de los 30 sujetos tenga ms de una oportunidad o que alguno de los 30, no tenga ninguna oportunidad de ser seleccionado para la muestra. La independencia en la ocurrencia de los eventos, significa que la ocurrencia de un evento no anticipa la ocurrencia del siguiente o no predisponga al investigador a seleccionar al siguiente elemento de la muestra. Si por ejemplo, en un sorteo, sale premiado el nmero 15, este hecho no debe anticipar que el siguiente nmero premiado fuese el 16. Si sucediera este evento, se puede decir que los premios estn saliendo en orden correlativo, lo que descalificara de probabilstico a dicho procedimiento muestral. Como consecuencia de la aplicacin del muestreo probabilstico se obtiene que las muestras que se extraigan tengan caractersticas muy parecidas a las de la poblacin. Lo contrario a estos casos es la intencionalidad o el sesgo. Azar e intencin
104
son, en consecuencia, dos extremos de un mismo continuum semntico. Azar e intencin nos interesan, por igual, en la investigacin de la conducta. As, cuando los eventos suceden por obra del azar, se dice que el muestreo es probabilstico. En caso contrario, si los eventos se producen por obra de la intencin del investigador, el muestreo se denomina intencionado o no probabilstico. 5.1 Tipos de muestreo probabilstico En la investigacin cientfica es ms comn y recomendable el uso del muestro probabilstico porque existe mayor posibilidad de que la muestra sea ms representativa de la poblacin. Los tipos de muestreo probabilstico ms conocidos son el sorteo, el muestreo aleatorio simple, el muestreo sistemtico y el muestreo estratificado. a) Sorteo El sorteo es el tipo de muestreo probabilstico ms conocido. Para realizar un sorteo es necesario que todos los sujetos de la poblacin estn identificados por un nmero y cuando se realice el sorteo, todos los sujetos deben tener la misma oportunidad de salir premiados (igualdad de oportunidades). Y si hay ms de un premio, el primer sujeto premiado, no debe constituirse en indicador para intuir sobre quin recaer el segundo premio; esto es lo que se ha denominado independencia en la ocurrencia de los eventos. En muchos casos, los investigadores, para identificar sus muestras, hacen sorteos entre los elementos de la poblacin, pero como es muy fcil en un sorteo sesgar los datos, la tcnica del sorteo es poco recomendable. b) Muestreo aleatorio simple Para identificar una muestra empleando la tcnica del muestreo aleatorio simple, en primer lugar es preciso conocer el tamao de la poblacin de la cual se desea obtener la muestra; en segundo lugar, se debe tener los listados de todos los miembros de la poblacin; en tercer lugar, cada miembro de la poblacin debe recibir un nmero de orden o un cdigo numrico, y finalmente, se debe disponer de tablas de nmeros aleatorios. Estas tablas son una secuencia de dgitos generados en el ms completo desorden, es decir, sin que entre ellos exista ninguna correlacin. En todo caso, mediante procedimientos de cmputo, se puede generar dgitos del 0 al 9, cuidando que entre ellos no exista correlacin, es decir que la correlacin sea cero o cercana a cero. Las tablas de nmeros aleatorios aparecen en las pginas finales de los tratados formales de Estadstica, de uno de los cuales hemos extrado parte del milln de dgitos que public Rand Corporation en 1955, y que aparecen en el Cuadro N 4.
105
ELAS MEJA MEJA TABLA DE NMEROS ALEATORIOS

00000 00001 00002 00003 10097 37542 08422 99019 32533 04805 68953 02529 76520 64894 19645 09376 13586 74296 09303 70715 34673 24805 23209 38311 54876 24037 02560 31165 80959 20636 15953 88676 09117 10402 34764 74394 39292 00822 35080 04436 74945 91665 33606 27659
00004 12807 99970 80157 36147 64032 36653 98951 16877 12171 76833 00005 66065 74717 34072 76850 36697 36170 65813 39885 11199 29170 00006 00007 00008 00009 31060 85269 63573 73796 10805 77602 32135 45753 45571 02051 05325 03529 82406 65692 47048 64778 35303 68665 90553 35808 42614 74818 57548 34282 86799 73053 28468 60935 07439 85247 28709 20344 23403 18623 83491 35273 09732 88579 25624 88435
00010 98520 17767 14905 68607 22109 40558 60970 93433 50500 73998 00011 11805 05431 39808 27732 50725 68248 29405 24201 |52775 67851 00012 83452 99634 06288 98033 13746 70078 18475 40610 68711 77817 00013 88685 40200 86507 50401 36766 67951 90364 76493 89609 11062 00014 99594 67348 87517 64969 91826 08928 93785 61368 23478 34113 00015 65481 17674 17468 50950 58047 76974 73039 57186 40218 16544 00016 00017 00018 00019 80124 74350 69916 09893 35635 99817 26803 20505 17727 77402 66252 14225 08015 77214 29148 68514 45318 43236 36936 46427 22364 00210 87203 56788 21115 45521 76621 96297 78253 64237 13990 78822 14385 96286 94400 54382 53763 02655 56418 14598
00020 91499 14523 68479 27686 46162 83554 94750 89923 37089 20048 00021 80336 94598 26940 36858 70297 34135 53140 33340 42050 82341 00022 44104 81949 85157 47954 32979 26575 57600 40881 22222 06413 00023 12550 73742 11100 02040 12860 74697 96644 89439 28707 25815 00024 63606 49329 16505 34484 40219 52563 43651 77082 07207 31790 00025 00026 00027 00028 61196 15474 94557 42481 90446 45266 28573 16213 26457 95270 67897 93344 47774 79953 54387 08721 51924 59367 54622 16868 65394 83848 44431 48767 59593 82396 91190 03071 59593 10118 42592 12059 42582 33211 92927 25701 60527 59466 45973 46670
00029 23523 78327 73208 89837 68935 91416 26252 29663 05522 82562
Tomado de: Haber/Runyon: Estadstica General. Mxico, Fondo Educativo Interamericano, 1973. Cuadro N 4
Para identificar una muestra empleando la tabla de nmeros aleatorios, se requiere conocer el tamao de la poblacin P y el tamao de la muestra s. Si el
106
tamao de la poblacin es una cifra de 3 dgitos, los nmeros aleatorios se leern de 3 en 3. Si el tamao de la poblacin es una cifra de 4 dgitos, los nmeros se leern de 4 en 4, y as respectivamente segn los dgitos que tenga el tamao de la poblacin. La lectura de los nmeros se puede realizar partiendo de cualquier fila o de cualquier columna de la tabla y se puede realizar la lectura comenzando, no necesariamente del primer dgito sino de cualquier dgito de la fila o columna seleccionada. Para proceder a la lectura de las tablas de nmeros aleatorios, se utilizan varios mtodos. Se explica a continuacin dos de los ms usados. Mtodo de lectura normal: Este mtodo se emplea cuando el primer dgito del nmero de la poblacin P se encuentra entre 5 y 9. As, si la poblacin es de 857 sujetos y se requiere una muestra de 10, se empezar a leer la tabla de 3 en 3, comenzando de cualquier fila o cualquier columna de la tabla de nmeros aleatorios hasta identificar a los 10 sujetos que se requieren para la muestra. Para ejemplificar este procedimiento presentamos una parte de la tabla de nmeros aleatorios que aparece en el Cuadro N 4 y si por ejemplo se empieza la lectura de la fila 18, los sujetos de la muestra sern los siguientes:
177, 435, 099, 817, 774, 027, 721, 443, 236 y 002.
Que en el fragmento de la tabla se han resaltado con negritas:

00015 00016 00017 00018 00019 65481 80124 74350 69916 09893 17614 35635 99817 26803 20505 17468 17727 77402 66252 14225 50950 08015 77214 29148 68514 58047 45318 43236 36936 46427 76974 22364 00210 87203 56788 73039 21115 45521 76621 96297 57186 78253 64237 13990 78822 40218 14385 96286 94400 54382 16544 53763 02655 56418 14598
Con estos mismos datos y leyendo por columnas, se procede del siguiente modo: si se comienza por las columnas 16, 17 y 18, se recorrer, hacia abajo, las tres columnas mencionadas seleccionando los 10 primeros nmeros distintos, comprendidos entre el 001 y 857. Los nmeros as encontrados son los siguientes:
765, 648, 196, 093, 801, 340, 455, 020, 053 y 035.
que en el fragmento de la tabla se han resaltado en negritas:

76520 64894 19645 09376 13586 74296 09303 70715 34673 24805 23209 38311
80157 36147 64032
107
ELAS MEJA MEJA
34072 76850 36697 45571 02051 05325 03529 82406 65692 47048 64778 68665 68665 90553 35808
14905 68607 22109 39808 27732 50725 06288 98033 13746 86507 50401 36766 87517 64969 91826 17468 17727 77402 66252 50950 08015 77214 29148 58047 45318 43236 36936
14225 68514 46427
Se sobreentiende que los nmeros comprendidos entre el 858 y 999, no se consideran en la muestra puesto que no existen sujetos identificados con estos nmeros dentro de este rango. Si al terminar de recorrer la columna no se ha terminado de identificar a los 10 sujetos que se necesitan, se puede pasar a recorrer las tres columnas siguientes, o bien saltar a otras tres columnas distintas. Mtodo de lectura con sustraccin: Es recomendable emplear este mtodo cuando el primer dgito de la poblacin es 4 o menor que 4. Por ejemplo, si se desea obtener una muestra de 13 sujetos de una poblacin es 167. Esta cifra se redondea a la centena siguiente, as se sustrae 200 a cada nmero comprendido entre 201 y 400; se sustrae 400 a todos los nmeros comprendidos entre 401 y 600; 600 de todos los nmeros entre 601 y 800; y 800 de todos los nmeros entre 801 y 999. Todos los residuos mayores de 168 hasta 200, se desechan. Por la razn anteriormente expuesta, al leer en la tabla las columnas 26, 27 y 28, se ubican los siguientes nmeros que corresponden a los sujetos de la muestra:
346 - 200 = 146 248 - 200 = 048 232 - 200 = 032 383 - 200 = 183 640 - 600 = 040
108
366 - 200 = 166 353 - 200 = 153 686 - 600 = 086 905 - 800 = 105 358 - 200 = 158 221 - 200 = 021 507 - 400 = 107 y 137.
Los nmeros hallados se ubican en el siguiente fragmento de la tabla:

00000 10097 32533 76520 13586 34673 54876 80959 09117 39292 74945 00001 37542 04805 64894 74296 24805 24037 20636 10402 00822 91665 00002 08422 68953 19645 09303 23209 02560 15953 34764 35080 33606 00003 99019 02529 09376 70715 38311 31165 88676 74394 04436 27659 00004 12807 99970 80157 36147 64032 36653 98951 16877 12171 76833 00005 00006 00007 00008 66065 31060 85269 63573 74717 10805 77602 32135 34072 45571 02051 05325 76850 82406 65692 47048 36697 35303 68665 90553 36170 42614 74818 57548 65813 86799 73053 28468 39885 07439 85247 28709 11199 23403 18623 83491 29170 09732 88579 25624
00009 73796 45753 03529 64778 35808 34282 60935 20344 35273 88435 00010 98520 17767 14905 68607 22109 40558 60970 93433 50500 73998 00011 11805 05431 39808 27732 50725 68248 29405 24201 52775 67851 00012 83452 99634 06288 98033 13746 70078 18475 40610 68711 77817 00013 88685 40200 86507 50401 36766 67951 90364 76493 89609 11062 00014 99594 67348 87517 64969 91826 08928 93785 61368 23478 34113
Con la misma poblacin y muestra, si se comienza a leer la tabla a partir de la vigsima fila, los nmeros son los siguientes:
190 989 - 800 = 189 320 - 200 = 120 505 - 400 = 105 142 256 - 200 = 056 851 - 800 = 051 464 - 400 = 064 275 - 200 = 075
109
ELAS MEJA MEJA
678 - 600 = 078 896 - 800 = 096 297 200 = 097 788 700 = 088
Que en el siguiente fragmento de la tabla se encuentran en la siguiente ubicacin:

00018 69916 26803 66252 29148 36936 87203 76621 13990 94400 56418 00019 09893 20505 14225 68514 46427 56788 96297 78822 54382 14598 00020 91499 14523 68479 27686 46162 83554 94750 89923 37089 20048 00021 80336 94598 26940 36858 70297 34135 53140 33340 42050 82341 00022 44104 81949 85157 47954 32979 26575 57600 40881 22222 06413
Si la poblacin fuese 384, se redondea la cifra a 400 y se sustrae 400 a todo nmero comprendido entre 401 y 800 y automticamente se desechan todos los nmeros mayores de 800. Si se requiere extraer varias muestras de una misma poblacin, es aconsejable cambiar el punto de partida en la tabla. As ser posible disponer de varias series de muestras y, eventualmente, se pueden identificar muestras de muestras. c) Muestreo sistemtico El muestreo sistemtico es una tcnica diferente de la anterior. Para utilizar esta tcnica se requiere disponer de listados de los sujetos que deben estar identificados por sus nombres o por sus cdigos numricos. Es preciso conocer el tamao de la poblacin P y el tamao de la muestra s. Sea, por ejemplo 750, el tamao de la poblacin y 15, el tamao de la muestra. Entonces se divide P entre s. El coeficiente hallado es la constante k. En este caso: K=P/s sea: 750 / 15 = 50. La constante as encontrada es 50. Ubicada la constante, se recorre los listados en los que aparecen los nombres de los sujetos de la poblacin y se entresaca, para la muestra, a los sujetos que se hallan separados por cada 50 nombres, es decir, por la distancia establecida por la constante. Pero en este caso, si se comienza a identificar la muestra a partir del sujeto que tiene el nmero 01, y si se sabe cul es la constante, va a ser posible anticipar que los sujetos de la muestra sern quienes cuyos nmeros de orden sean mltiplos de 50 (50, 100, 150, 200, etc.) Este hecho
110
estara en contradiccin con el segundo principio que rige los fenmenos probabilsticos: la independencia en la ocurrencia de los eventos, porque la ocurrencia del primer evento, ya est anticipando la ocurrencia de los siguientes. Para evitar esta situacin, se sortea los nmeros ubicados en el primer rango, en este caso, los primeros 50, (la constante) y se comienza a aplicar la constante a partir del nmero que sali sorteado. Por ejemplo, si en el sorteo de los 50 primeros nmeros sale el nmero 13, se aplicar la constante a partir del 13 y se proceder de la siguiente manera: 13 + 50 = 63, 63 + 50 = 113, 113 + 50 = 163 ; y as sucesivamente hasta agotar la lista de los sujetos de la poblacin. Este es un mtodo que tiene la gran ventaja de entresacar a los sujetos de la muestra de manera uniforme en toda la poblacin, es decir, este mtodo permite distribuir la muestra de manera uniforme en toda la poblacin. Otra ventaja de este mtodo es que se puede identificar a los sujetos de la muestra sin cometer errores. Adems es ms rpido en algunos casos como por ejemplo si se tienen datos en un fichero, y la constante es una determinada cifra y si el grosor de las fichas que contiene la constante es, por ejemplo, de una pulgada, se puede extraer una ficha, sin necesidad de contar cada una de las fichas, sino simplemente midiendo, de pulgada en pulgada, el espacio que ocupan las fichas. Naturalmente que con esta variante del mtodo no se identificar exactamente a los sujetos de la muestra, pero la aproximacin ser muy alta. Otra situacin puede ser la siguiente. Si por ejemplo se desea obtener una muestra de 400 personas cuyos nombres aparecen en la Gua Telefnica de Lima, se puede proceder de la siguiente manera: Si la Gua Telefnica de Lima tiene 1,000 pginas y en cada pgina aparecen cuatro columnas de nombres y en cada columna hay 135 nombres, entonces su puede calcular, rpidamente el tamao de la poblacin, en este caso el nmero de abonados al servicio telefnico en Lima. El resultado de estos clculos es el siguiente: 135 x 4 x 1,000 = 540,000 La poblacin es, entonces, 540,000 abonados. Si se desea obtener una muestra de 400, se dividir 540,000 entre 400, lo que dar la constante, K, o sea 1,350. Como quiera que en cada pgina aparecen 540 nombres (135 por columna por cuatro columnas de nombres), se dividir 1,350 entre 540, lo que da la cifra de 2,5, es decir, se sacar un nombre cada 2,5, dos pginas y media de la Gua Telefnica y as, al terminar de hojear dicha Gua, se habr identificado a las 400 personas que se requieren para la muestra. Si se desea todava mayor precisin, se comenzar identificando el primer nombre luego de hacer un sorteo de las 2,5 primeras pginas
111
ELAS MEJA MEJA
de la Gua. Pero si se va a sacar un nombre cada 2,5 pginas de la Gua, de cul de estas 2,5 pginas se sacar el nombre? Lo aconsejable en este caso es sacar el nombre del centro, es decir de los lugares centrales de cada 2,5 pginas. Lo dicho tiene sus consecuencias en la precisin al identificar el tamao de la muestra. Al parecer, este es un mtodo ms exacto, pues entresacando a un sujeto luego de cada 2,5 pginas, es decir segn la constante, se puede decir que la muestra se ha distribuido uniformemente en toda la poblacin.
d) Muestreo estratificado Si al investigador slo le interesan los sujetos en trminos de cantidad para identificar las muestras es suficiente emplear las tcnicas que acabamos de describir. En cambio, si el investigador est interesado en conocer algunas caractersticas de la poblacin, tales como edad, sexo, etc., es necesario estratificar la poblacin y lograr que las caractersticas de la muestra coincidan con las caractersticas estratificadas de la poblacin. El muestreo estratificado consiste en reducir la poblacin en funcin de los sub conjuntos o estratos que se han identificado en sta. Sea el caso de la poblacin de estudiantes universitarios de la ciudad de Lima y se desea estratificar la poblacin segn dos variables: sexo de los estudiantes y tipo de gestin de la Universidad. As se tendr, si cada variable asume dos valores, los cuatro siguientes estratos: 1. Estudiantes varones de universidades nacionales; 2. Estudiantes varones de universidades particulares; 3. Estudiantes mujeres de universidades nacionales y 4. Estudiantes mujeres de universidades particulares. Estos cuatro estratos, tienen sus respectivos tamaos, no son todos iguales, y el investigador debe conocer el tamao de cada estrato.
Estrato 1 41.67%
Estrato 2 20%
Estrato 3 25%
Grfico 4 Si estos son los estratos y se conoce el tamao de cada uno, el investigador tendr que representar, en la muestra y en los mismos porcentajes, cada uno de los estratos de la poblacin. Luego de establecidos los estratos en la muestra para
112
identificar a los sujetos se puede emplear cualquiera de los procedimientos descritos anteriormente. Lo que en realidad se hace es reducir el tamao de la poblacin, guardando su apariencia estratificada original. Sea el siguiente ejemplo:
Total de estudiantes varones y mujeres de universidades nacionales y particulares: Total de estudiantes de universidades nacionales: Total de estudiantes de universidades particulares: Total de estudiantes varones de universidades nacionales: Total de estudiantes mujeres de universidades nacionales: Total de estudiantes varones de universidades particulares: Total de estudiantes mujeres de universidades particulares: 120,000 80,000 40,000 50,000 30,000 25,000 15,000 100,00 % 66,67 % 33,33 % 41,67 % 25,00 % 20,83 % 12,50 %
Con estos datos se puede hacer la siguiente graficacin:
50,000 41.67%
25,000 20,83% 15,000 12,50% 30,000 25%
Grfico N 5 Como se trata de obtener una muestra de 400 sujetos, entonces se proceder, respetando los porcentajes encontrados, a calcular el nmero de sujetos para cada estrato. Los datos son los siguientes:
Muestra de estudiantes varones de universidades nacionales: Muestra de estudiantes mujeres de universidades nacionales: Muestra de estudiantes varones de universidades particulares: Muestra de estudiantes mujeres de universidades particulares: 41,70 % = 167 25,00 % = 100 20,83 % = 83 12,50 % = 50
Esto significa que de los 50,000 estudiantes varones de universidades nacionales, se debe elegir a 167 estudiantes para la muestra. De las 30,000 estudiantes mujeres de universidades nacionales, se debe elegir a 100 estudiantes para la muestra. De los 25,000 estudiantes varones de universidades particulares, se debe elegir a 83
113
ELAS MEJA MEJA
estudiantes para la muestra y de las 15,000 estudiantes mujeres de universidades particulares, se debe elegir a 50 estudiantes para la muestra. Pero cmo identificar a estos estudiantes en la poblacin? Para estos casos se aplican las tcnicas probabilsticas descritas. Por ejemplo, mediante el muestreo aleatorio simple se puede identificar la muestra de 167 sujetos de una poblacin de 50,000. As se debe proceder en cada uno de los estratos. Esta tcnica se denomina muestreo aleatorio estratificado. Las ventajas de aplicar la tcnica del muestreo aleatorio estratificado son las siguientes: Si se requiere precisin en los datos que se analizan en cada una de las divisiones de los estratos, se puede considerar una poblacin independiente a cada uno de los estratos. Por ejemplo, el nmero de estudiantes de universidades nacionales. Tambin es conveniente la estratificacin por razones administrativas: Si una institucin tiene, por separado, identificados a los alumnos varones y mujeres, los estratos identificados facilitan el manejo de los datos institucionales. Los sujetos de la muestra pueden ser diferentes en funcin de cada estrato. El investigador puede asumir que las caractersticas de los estudiantes de universidades nacionales no son las mismas que las caractersticas de los estudiantes de universidades particulares. Para mantener sus respectivas identidades o particularidades, es conveniente estudiarlas en estratos diferentes. Al identificar estratos, el investigador puede obtener mayor precisin en la estimacin de las caractersticas de cada estrato, porque si la poblacin es heterognea, los estratos ya son homogneos, pues se han agrupado a los miembros de cada estrato por sus caractersticas comunes: estudiantes varones, que obviamente tienen caractersticas diferentes a las que poseen las estudiantes mujeres. El investigador, en funcin de las necesidades que tenga de analizar los datos o, en funcin de la precisin que busca, debe estratificar la poblacin, segn los criterios que crea ms convenientes. Asimismo, depende de cada investigador determinar el tamao de la muestra en funcin del tamao del estrato que tiene identificado. Por lo general, la varianza de las muestras estratificadas es ms pequea que la varianza que se observa en las muestras obtenidas con la tcnica del muestreo aleatorio simple. Esta menor varianza ya constituye una importante ventaja de este mtodo.
114
6. MUESTREO NO PROBABILSTICO
Cuando el investigador, por las caractersticas de su estudio, necesita incorporar en la muestra a sujetos que posean las caractersticas deseadas por l, no es posible emplear el muestreo probabilstico, sino un tipo de muestreo completamente distinto. Este es un tipo de muestreo en el que la probabilidad no es imprescindible y, por el contrario, es necesario identificar a los sujetos de la muestra con criterios intencionados, es decir, identificando a los sujetos de la muestra en base a criterios previamente establecidos. Si por ejemplo se trata de un concurso universitario de ajedrez, y las autoridades de una determinada Universidad deben acreditar a tres representantes, entonces seleccionarn a los tres mejores jugadores de ajedrez que tiene la Universidad para que la representen en el concurso. Como es natural, a estos tres jugadores que constituyen la muestra de la Universidad, no se los puede identificar mediante el azar ni empleando los mtodos probabilsticos, sino de forma intencionada buscando, entre todos los alumnos de la Universidad, a los tres estudiantes que renen las caractersticas necesarias, en este caso, ser buenos jugadores de ajedrez. a) Muestreo por cuotas Cuando se desea obtener la muestra de una poblacin organizada en forma piramidal o arborescente, como es el caso del sistema educativo nacional, se puede asignar cuotas a cada escaln de la organizacin. Por ejemplo, si se desea hacer una investigacin, a nivel nacional, sobre el rendimiento de los estudiantes de educacin secundaria y se estima que la poblacin estudiantil de secundaria en el Per sobrepasa los dos millones de alumnos y se desea obtener una muestra de 504 estudiantes, se procede de la siguiente manera: Si por ejemplo, desde el punto de vista de la administracin, el Ministerio de Educacin tiene 8 Regiones, se asignan cuotas a cada una de las Regiones. Las cuotas pueden ser proporcionales a la poblacin estudiantil de cada Regin o bien pueden ser iguales para todas. En el caso que se decidiera que fueran iguales, se asignaran cuotas de 63 alumnos por cada Regin (504 / 8 = 63). Seguidamente, en cada una de las Regiones, se asignarn nuevas cuotas para ser cubiertas por cada una de las UGEs. Suponiendo que en la Regin N 1, existieran 7 UGEs, a cada UGE le correspondera una cuota de 9 sujetos (63 / 7 = 9). Si cada UGE tuviera 9 Colegios, se asignar un alumno por Colegio. En este caso, para identificar al alumno de cada Colegio, se tendra que hacer un sorteo entre todos los alumnos o aplicar los otros tipos de muestreo como el aleatorio simple o el muestreo estratificado. Luego, las autoridades harn el reporte inverso, de abajo hacia arriba, es decir el informe de los colegios a las UGEs, el informe de las UGEs a la Direcciones Regionales y stas a la Sede Central de Ministerio de Educacin y as se lograra, sumando las cuotas de las Regiones, obtener la muestra de los 504 estudiantes requeridos para el estudio.
115
ELAS MEJA MEJA
b) Juicio de expertos El juicio de expertos es el criterio que maneja un profesional especializado cuando tiene que seleccionar sujetos. El experto decide qu sujetos van a participar en la muestra. Si por ejemplo se convoca a nivel de Lima a un Concurso Universitario de Matemtica, sern los matemticos o los profesores de matemtica quienes debern emitir opinin o seleccionar, ellos, a los mejores alumnos de Matemtica de cada Universidad para que representen, exitosamente, a la institucin. Si se trata de estudiar aspectos relacionados con el retardo mental, los profesores de la especialidad, o mejor un psiclogo, y ms an, un equipo multidisciplinario de profesionales, actan como expertos para diagnosticar o decidir sobre el tipo de tratamiento que requieren estos alumnos. En estos casos, aplicando el juicio de expertos se determina quines van a formar parte la muestra. Las selecciones deportivas de una pas, por ejemplo las de ftbol o voleybol, son muestras representativas del pas y los jugadores han sido escogidos por el seleccionador/entrenador de entre un universo muy vasto de deportistas. En este caso, el seleccionador/entrenador acta como experto para emitir opinin y convocar a los jugadores. c) Muestreo ocasional En muchas oportunidades, en la investigacin de la conducta se recoge la opinin de las personas con las que ocasionalmente tropieza el investigador. Esta es la tcnica ms sencilla y muchas veces la nica manera de recopilar informacin. Su validez es relativa aunque parte del supuesto que los sujetos a quienes se entrevista son representativos de la poblacin. Por ejemplo, las agencias dedicadas al estudio de la opinin colectiva, para anticipar los resultados de una votacin de los ciudadanos, recogen informacin de los electores que salen del local en el que votaron. A partir de estos informes, realizan sus progresiones para llegar a la prediccin deseada.
116
AIRATNEMELPMOC ARUTCEL
NICAGITSEVNI ED SOTNEMURTSNI E SACINCT
SARTSEUM SAL ED SOTNEMELE Y SENOICIDNOC

*
ovarB arreiS otutitseR
NICON
sadanimreted ,sisetpih sal sadalumrof ,ragitsevni a amelborp le odinifed zev anU al ed opmac le odatimiled y selbairav sal ed serodacidni e senoisnemid sal setna nicpo arto ,seroiretna sal ed smeda ,razilaer osicerp ecah es ,nicagitsevni ed nicacilpa al etnaidem sotad ed adigocer al ,opmac ed ojabart le noc razepme ed .sodigele sodotm sol nicavresbo ed otejbo sedadinu sal is ed nisiced al ne etsisnoc nicpo aveun atsE rednetxe a av es etnemac in o ,osrevinu le namrof euq sal sadot res a nav oidutse o .salluqa ed artseum o avitatneserper etrap anu a nicagadni al es euq al se niculos amitl atse ,saeuqep senoicalbop ed osac le ne ovlaS y etsoc ,opmeit ed senozar ,sosac smed sol ne euq odad ,dadilaer al ne enopmi ,sotad sol ed sisilna y nicacifisalc ,adigocer ed senoicarepo sal ed dadijelpmoc a etnemlaudividni euqraba oidutse le euq ed dadilibisop al acitcrp al ne natracsed .osrevinu le ednerpmoc euq sedadinu sal sadot isac nicacilpa ed acinct anu sartseum sal ed osu le riutitsnoc la ,olle roP us eneit euq aicnatropmi al etnedive se ,selaicos senoicagitsevni sal ne lareneg ol rop reconoc ed laicos rodagitsevni le allah es euq ne dadisecen al y oidutse ne adasab ,airetam anu ed etart es euqnua ,socisb sacitcrp y soipicnirp sus sonem ocitmetam opmac la ecenetrep euq ,sedadilibaborp ed oluclc le y raza ed seyel sal .acitsdatse al ed ,otnujnoc nu ed avitatneserper etrap anu ,lareneg ne ,etnemelpmis se artseum anU sm ol oeuqep ne ricudorper ebed sacitsretcarac sayuc ,osrevinu o nicalbop .elbisop etnematcaxe nu ed etrap anu omoc sartseum sal rinifed nedeup es ,ociftneic sm odom eD aciftneic nicavresbo a etemos es euq ,adigele etnemadibed nicalbop o otnujnoc
.pp .2991 .A.S ,ofninaraP .aapsE .laicos nicagitsevni ed sacincT :R ,ovarB arreiS :ed odamoT .091-471
*
911
A J E M A J EM S A L E
nibmat ,sodilv sodatluser renetbo ed otisporp le noc ,otnujnoc led nicatneserper ne .odagitsevni latot osrevinu le arap ne etsisnoc ets .ocitsdatse ocitmetam otnemadnuf nu neneit sartseum saL ,adauceda nicroporp ne y etnematcerroc adigele ,artseum anu ed sodinetbo euq adadnuf ,nicazilareneg o aicnerefni al recah edeup es ,sodatluser sodanimreted sonu es euq led osrevinu le arap sodilv nos sodatluser sohcid euq ed ,etnemacitmetam nedeup es euq ,dadilibaborp y rorre ed setiml sonu ed ortned ,artseum al odartxe ah .osac adac ne etnemacitsdatse ranimreted :selaicos saicneic sal ne ,sajatnev setneiugis sal natneserp sartseum saL ,osrevinu la nicaler ne adicuder etnemavitaler artseum anu noc ,salle etnaideM .1 arto ed euq ,sonamuh soelcn y senoicalbop sednarg sal ratseucne nedeup es .ragitsevni elbisopmi etnemacitcrp o licfid yum ares arenam al y satseucne sal ne amonoce narg anu nenopus sartseum sal osac odot nE .2 .nicuceje us ne zedipar royam ed dadilibisop .R ed ,acirpme agoloicoS ed odatarT le ne ,hcuehS alaes omoc ,smedA .3 isac y etnatropmi yum ,ajatnev arto necerfo sartseum sal ,)sonceT( ginK atseucne anu euq sosicerp sm sodatluser recerfo edeup artseum anu ;aditrevdani .etrap anu a odot le ratimil ed atluser euq rorre led adatcefa tse euqnua ,latot atluser olle eD .ralucitrap osac la nicneta sm ratserp edeup es artseum anu nE artseum al euq ,nedro lat ed socitcf serorre sol ed nicatimil anu etnemlautneve .latot atseucne anu ed dadilatot us ne osicerp sm odatluser nu a ricudnoc edeup le raborpmoc arap sanacirema sacitsdatse sal ne sartseum necilitu es euq ha eD .selatot satseucne sal ed dutitcaxe ed odarg
SARTSEUM SAL ED SENOICIDNOC

:ortauc nos sartseum sal ed selatnemadnuf senoicidnoc saL .etse ed dadilatot al on y osrevinu led etrap nadnerpmoc euQ .osrevinu le dutingam al a adanoicroporp etnemacitsdatse aes dutilpma us euQ led nicanimreted ocitcrp otnup le noc nicaler ne allah es nicidnoc atsE ednerpmoc euq sedadinu sal nges ,is ridiced arap evris y artseum al ed oamat .elbisimda on o se artseum anu ,osrevinu la otcepser atse iS .artseum al ed sotnemele sol ed niccele al ne nisrotsid ed aicnesua aL ohceh omsim etse rop ratluser artseum al ,alamona anugla atneserp niccele .adaiciv aczudorper euq odom lat ed ,osrevinu led leif ojelfer o avitatneserper aes euQ is euq riced ereiuq otsE .nicagitsevni al a nedro ne sacisb sacitsretcarac sus sacitsretcarac necerfo enopus es euq nicalbop al ne sodaicnerefid serotces yah
021
.1 .2
.3
.4
nibmat artseum al ,nicagitsevni al ed sovitejbo sol ed sotcefe a ,selaicepse rebed ,riced se ,nicroporp amsim al ne etnemasicerp y solrednerpmoc rebed .osrevinu le omoc adacifitartse ratse sal euq atneuc ne renet ed ah es ,selatnemadnuf senoicidnoc satse ed smedA ocilbp led aroet anu ne ,serotua sonugla odacatsed nah omoc ,nasab es sartseum y saciglopot seder sal ed arutpur al necudorp ,)ueidroB( adazimota asam omoc selaicos sogsar ed nednicserp y )zebI( laicos erbmidru al ed oudividni la nacnarra arebed sartseun sal ed oelpme le ,olle roP .)hcuehcS( setnatropmi selarutcurtse .adagitsevni dadivitceloc al ed arutcurtse al erbos aiverp nicamrofni anu racilpmi selautxetnoc soednos sodamall sol nos amelborp etse a niculos atreic anU ed setnatilim sol ed ninipo al reconoc arap ,laudarg oertseum le ,olpmeje rop ,omoc ,y selacol senoicces ed ,odnuges ,selaicnivorp senoicaredef ,oremirp ,ed oditrap nu acnun tse on oudividni le euq radrocer ed ah eS .sats ed setnatilim ed ,orecret ed etnemadalsia etca euqnua ,euq onis ,dadeicos al ed odatcenocsed etnemlatot .ecenetrep euq sol a selaicos sopurg sol ed ojulfni le s ne avell ,ats
ARTSEUM AL ED ESAB
.amsim al ed dadinu al y esab al nos artseum al ed selapicnirp sotnemele soL acas o eneitbo es euq al ed nicalbop al ,osac odot ne ,se artseum al ed esab aL remirp le nE .olratse edeup o adasnec ratse on edeup nicalbop atsE .artseum al oditnes ne on orep ,lairetam o laer oditnes ne artseum al ed esab al etsixe ,osac al ,lairetam otnat artseum al ed esab yah osac odnuges le ne euq sartneim ,lamrof al euq soudividni sol sodot ed osnec le ,lamrof omoc ,ragitsevni a laer nicalbop ed rangised eleus es artseum al ed esab ed onimrt le noc etnemasicerP .nenopmoc .ortsiger o osnec etse acifcepse arenam oditnes ne o etnemacifcepse adamot ,artseum al ed esab al ed aicnatropmi aL niccele al ed odatluser le se ,etnemavitarepo ,artseum al euq ed avired es ,otcirtse .salluqa ed odanimreted etnemaiverp otnujnoc o nicalbop anu ed ortned sedadinu ed ohcid ed ortsiger nu ed aicnetsixe al se ,artseum al ed ocisb otnemadnuf ,olle roP razilaer atimrep y ,sedadinu sus sadot sadazilaudividni naczerapa euq le ne ,otnujnoc .osorugir oetros nu etnaidem niccele al ed otnup le se osrevinu led sedadinu sal ed adazilaudividni nicercnoc atsE etsisnoc euq ne niccele al rogir noc razilaer arap oirasecen otnemadnuf le y aditrap .otcirtse oditnes ne artseum al ed esab al eyutitsnoc euq ecid es olle rop y artseum al ,ogoltac nu ,orehcif nu ,atsil anu ,ortsiger nu ,osnec nu ne ritsisnoc edeup ats otnemele o ahcif adac a oremn nu etnemlamron rad ebed eS .cte ,onalp nu ,apam nu .ogoltac led
121
euq sedadinu sal sadot sadazilaudividni rarugif nebed artseum al ed esab al nE oilicimod ,erbmon ,osrevinu le ne oremn us ed niserpxe noc nicalbop al namrof sol ed nicacifitnedi al elbisop ecah artseum al ed esab al ,olle roP .cte ,osac us ne .roiretsop atseucne us y artseum al etnaidem odanoicceles nayah es euq sotnemele sohcum yaH .etsixe erpmeis on ,otcirtse oditnes etse ne artseum al ed esab aL elbisopmi etnemacitcrp se euq y sodagolatac o sodasnec ntse on euq sosrevinu setnetsisa sol in sellac sal rop alucric euq ocilbp le ntse ol on ,olpmeje roP .ragolatac al ed niccele al racitcarp se secnotne atpoda es euq niculos aL .oluctcepse nu a ed onu ratseucne .g.v omoc ,otcefrepmi oirotaela otneimidecorp ngla rop artseum ellac al rop nertneucne es euq ocnic adac oreP .atseucne al arap acifcepse artseum ed esab anu ramrof ares laedi oL isac ardnopuS .selaicos senoicagitsevni sal ne ,lareneg ol rop ,elbisop se on otse arap is ,olpmeje roP .nicalbop al adot a atseucne al rautcefe omoc datlucifid atnat ed esab anu ramrof eseidiced es aapsE adot a esaznacla euq atseucne anu recah .seloapse sol sodot ed osnec nu razilaer ardnopus otse ,aiporp artseum al se osac etse nE .sadamrof ay sesab nazilitu es etnemlamron ,nzar atse roP a somenopxe son on is seup ,adazilautca tse esab al euq ed esrarugesa osicerp .alle ed nevoj sm nicalbop al a ,olpmeje rop ,artseum al ed areuf rajed osrevinu( ratseucne somereuq euq nicalbop al is racifirev euq yah smedA a o )ojabart ed osrevinu( artseum al ohceh ed amot es euq al ed alleuqa y )ociret saicnapercsid rebah ardop euqrop ,nedicnioc ,artseum al ed esab al ereifer es euq al .salle ertne sasnetxe sonem o sm alrazilana ,alracsub euq yah ,artseum al ed esab al a otcepser ,ocitcrp nedro le nE euq yah ,elbisop se olle y ,etsixe on iS .etsixe is oertseum led sotcefe a alraraperp y on euq ,odacidni ol nges ,laicepse odom ed ,radiuc ebed es osac etse nE .alramrof adanoisrotsid niccele anu ranimreted adeup euq amrof anugla ed adanedro etluser .artseum al ed avitatneserper on o opserC zehcnS solle ertne ,serotua sonugla euq ritrevda euq yah omitl roP .ocram artseum al ed esab al a namall ,)6 .p ,6791( ,ocram rop nibmat edneitne ,odacidni eh euq otcirtse oditnes etse ed smedA atimrep euq ,cte ,senoicacinumoc ,sapam ,aiverp nicamrofni al ,oilpma oditnes ne .ratseucne a nicalbop al ed sotnemele sol sodot a ragell
ARTSEUM AL ED DADINU
esab us ednerpmoc euq sotnemele sol ed onu adac se artseum al ed dadinu aL .etsixe odnauc amsim al ed ortsiger le ne ,sodazilaudividni e sodaremun ,narugif y
221
nicavresbo ed sedadinu sal a netimer y natneserper ortsiger etse ed sedadinu saL .ragitsevni a osrevinu le namrof euq al elbisop necah sedadinu sus y ,atcirtse ,lamrof esab al odacidni eh omoC .ratseucne a osrevinu led nicavresbo ed sedadinu sal ed nicacifitnedi ,savitceloc nibmat onis ,selpmis res nedeup ols on artseum al ed sedadinu saL ,solbeup ,sedaduic ed serotces ,sopurg ,sailimaf rop sadiutitsnoc ntse odnauc omoc se odnauc artseum al ed dadinu al ednerpmoc euq soudividni ed oremn lE .cte .artseum al ed allat amall es avitceloc animreted euq ol se nicalbop o artseum al ed esab al ed sedadinu sal ed allat atsE edeup levin etsE .nicagitsevni al ne nicagerga ed levin le ramall eleus es euq ol ,ocimnoce ,laicos ,laicapse retcrac ed neib ,sosrevid nicagerga ed sodarg ratneserp .sodagerga omoc najile es euq sovitceloc sol nges la rarepo edeup es roloc ne VT ed sarpmoc sal raidutse arap ,olpmeje rop ,sA ,sovitceloc sol ed ortned ,y sovitceloc ed o soudividni ed nicagerga ed levin nu edseD .senoican ,senoiger ,sotirtsid ,soipicinum res nedeup sots ,etnemlaicepse ,atnev ed sotneimicelbatse ,sailimaf res nedeup sodagerga sol laicos atsiv ed otnup .sodanimreted senoicaicosa y somsinagro ,saserpme
ARTSEUM Y OSREVINU ERTNE NICALER

al etnemacifrg artseum ,)21 .p ,3791( ojuarA y aroM ed eugis euq amargaid lE .artseum y osrevinu ertne nicaler o nicalbop adanimreted anu ed adicuder etrap anu se ,ev es omoc ,artseum aL .niccarf anu etnemavitatitnauc atneserper lauc al a nicaler ne ,osrevinu ollE .osrevinu le euq ralucric amrof amsim al eneit artseum al nibmat oreP samsim sal renet ebed artseum al ,etnemavitatilauc ,euq racidni edneterp .atneserper euq nicalbop al euq sacitsretcarac es euq sedadinu ed otnujnoc o nicalbop al adot rop odamrof tse osrevinu lE .oidutse le ne etnemlaudividni sadavresbo res nardop euq y raidutse ereiuq al ,nicatneserper us ne ,agitsevni es amonoce ed senozar rop ,ograbme niS .artseum nibmat etrap amrof nicalbop o osrevinu le omc ev es nibmat ocifrg le nE osrevinu etsE .ocittopih osrevinu amall es euq la oilpma sm otnujnoc nu ed ardop es euq sal ne setnetsixe senoicalbop sal sadot rop odiutitsnoc tse ocittopih .adatceyorp nicagitsevni al rautcefe nibmat
321
OSREVINU OCIT ETOPIH )otinifni etnemacitcrP( OSREVINU O )otinif( N ,NICALBOP
n ,ARTSEUM ravresbo a sedadinU
nardop euq sedadinU sadavresbo odis rebah
setnetsixe sedadinu ed otnujnoC aroet al acilpa es euq sal a
1 arugiF odis rebah se ociftneic ogzallah nu a amixm zedilav ad euq ol etnemasicerP .setnetsixe sal ed sahcum a nicaler ne onis nicalbop anu ne ols on odaborpmoc arto y avitatilauc nicaler anu riugnitsid edeup es artseum al y osrevinu le ertnE .avitatitnauc y oertseum ed niccarf ed sotpecnoc sol nereifer es avitatitnauc nicaler al A atneserper euq ejatnecrop le se oertseum ed niccarf aL .nicavele ed etneicifeoc ed .osrevinu la otcepser artseum al osrevinu nu ne is ,olpmeje roP .osrevinu le rop artseum al odneidivid eneitbo eS res oertseum ed niccarf al ,006 ed artseum anu odigele someh sedadinu 000,3 ed .%02 le o 02,0 al rallah ed al salle ertne ,senoicacilpa sasrevid renet edeup niccarf atsE rop nicisopmoc al econoc es odnauc artseum anu ed sotartse rop nicisopmoc .nicalbop o osrevinu led sotartse a osrevni oremn le euq asoc arto se on nicavele ed etneicifeoc la otnauc nE al ravele euq yah euq al rop daditnac al ne etsisnoc y oertseum ed niccarf al .osrevinu le renetbo arap artseum le nE .artseum al rop osrevinu le odneidivid ,roiretna al ed sver la ,eneitbo eS secev sal alaes nicavele ed etneicifeoc le etnemacitcrP .5 ares odacidni osac .osrevinu le ne adinetnoc tse artseum al euq artseum al y osrevinu le euq ,odacidni ah es omoc ,egixe avitatilauc nicaler aL etnatropmi se ollE .nicroporp laugi ne sacisb sacitsretcarac samsim sal naner .sasrevid sarogetac nednerpmoc euq ,sodacifitartse sosrevinu sol ne odot erbos
421
erbos ,etnematcaxe ed es acitcrp al ne euq licfid se aicnednopserroc atsE es on euq satsiverp satsivertne :sollaf yah erpmeis satseucne sal ne euqrop odot .cte ,nevleuved es on euq soiranoitseuc ,sadilv nos on o razilaer nedeup ramrof etnatropmi se ,etnetsixe aicnapercsid al aczonoc es euq arap ,olle roP arogetac adac enopus euq sejatnecrop sol netsnoc euq le ne ovitarapmoc ordauc nu ed oirbiliuqe le racifirev amall el es nicarepo atse A .artseum al ne y osrevinu le ne .artseum al sal ne sotartse sol ed sejatnecrop sol euq secev a rev ecah nicarepo atsE led sol ed etnatsab nereifid ,atseucne al adazilaer zev anu odot erbos ,sartseum .osrevinu ed nif a ,etnemadarebiled arucorp es aicnapercsid atse euq sol ne sosac yaH etnemetneicifusni aredisnoc es y etnemlaicepse raidutse aseretni euq otartse nu euq el euq ejatnecrop le atnemua es olle araP .sm tse ol artseum al ne odatneserper sotse nE .nicroporp amsim al ne sotartse sorto ed le eyunimsid es y ednopserroc al ne sots odnarednop ,sodatluser sol ne aicnapercsid atse rigerroc ebed es ,sosac .osrevinu le ne otartse adac a nednopserroc euq sejatnecrop sol nges artseum
soicicrejE
ranimreted edip es ,nicaunitnoc a nacidni es euq senoicagitsevni sal sadaD . 1 ,is y etneidnopserroc osrevinu led artseum anu ne nasab es is etnemadanozar .atcerroc se artseum al ,ovitamrifa osac ne sol sodot a odidep ah es ,esalc anu ed amargoicos le razilaer ed sotcefe A )A ed soreapmoc sus ed serbmon sol atelepap anu ne naraserpxe euq sonmula .on euq solleuqa y odal us a sodatnes renet aratsug sel euq esalc atseupseR sol sodot nos osrevinu le otnauc ne ,artseum anu eyutitsnoc on euq oralc sE .sodatseucne noreuf solle sodot y esalc al ed sonmula tsivertne es nisirp anu ne senorav sol ed selauxes sacitcrp sal raidutse araP ) B euq oiranoitseuc la rednopser a etnemairatnulov noratneserp es euq sol sodot a .odaraperp abah es atseupseR otnauc ne ,artseum anu yah ,osac etse ne ,euq riced edeup es etnemacirneG niS .nisirp al ne sodanretni ed latot led etrap anu a atseucne al ozih es olos niccele ed ametsis nu ne adasab ,adaiciv artseum anu ed atart es ,ograbme in ,osrevinu led avitatneserper raredisnoc edeup es on euq ol rop ,odaucedani .ets a sodidnetxe sodatluser sus
521
acipt ailimaf anu noc soa sod etnarud odivivnoc ah laicos ogolportna nU )C euq odargol ah y aznaifnoc us odanag ah es ,sedruH sal ed dadilacol anu ed us arap sretni ed adiv us ed sotcepsa sol nareisupxe el sorbmeim sus .nicagitsevni atseupseR edeup es on ,acipt ailimaf anu ne asab es euq agid es euqnua ,oidutse etsE .otcefe la etneicifus se on osac olos nu seup ,artseum omoc raredisnoc etna nicneted on rop saditemoc nicalucric ed senoiccarfni sal raidutse araP ) D a anaam al ed ohco ed ,odicenamrep ah nicavresbo ed opiuqe nu ,pots nu y ,sovitucesnoc anames al ed sad sert etnarud pots le etna ,edrat al ed ohco senoiccarfni sert adac rop anu ed sellated sol norangisnoc serodavresbo sol .sadavresbo atseupseR es ,etrap anu agitsevni es ols omoC .senoiccarfni sal sadot nos osrevinu lE on y adaivsed se artseum atse oreP .salle sadot ed artseum ed ralbah edeup saroh sanu ed nicamrofni anoicroporp ols euqrop ,osrevinu led avitatneserper agid adan euq nis ,anames al a sovitucesnoc sad sert ols ed y sadanimreted le euq sol ne ,anames al ed sad smed sol y ad led saroh setnatser sal erbos .etnerefid res edeup senoic carf ni sal ed dadilac y oremn euq lapicinum niccele anu ed dadinumoc anu ne sodatluser sol ricederp araP )E otadidnac us tnugerp rodatseucne le ,supsed sad sonu ragul renet a abi .otov a ohcered noc serejum y serbmoh sol sodot a odireferp atseupseR serejum y serbmoh sol ,osrevinu le odot a atlusnoc es seup ,artseum etsixe oN se on osrevinu le ,etrap arto rop ,oreP .solle ed etrap a on y otov a ohcered noc atlusnoc es ,ecid es auq ay ,atseucne al ed sotcefe sol a ovitatneserper renet euq yah y otov a ohcered noc sanosrep sal sadot a etnemadanimircsidni on euq odavele yum secev a ejatnecrop nu rebah eleus erpmeis euq atneuc ne sol seup ,nicciderp al naraiciv saicnereferp sus ,aicneucesnoc nE .natov etnemlaer euq sol ed atcudnoc al ne etnemacin nasab es sovitcefe sodatluser .netov y ratov ed nicnetni nagnet ed onu ,sotadidnac sol nabatneserp es euq al ne ,sodatupid a niccele arto nE )F artseum anu a ,ninipo ed oednos le zilaer es ,sadreiuqzi ed orto y sahcered ovutbo eS .onoflet led oidem rop ,acinfelet atsil al ne esab noc raza la adigele odigele ogeul tluser euqnua ,sahcered ed otadidnac la elbarovaf odatluser nu .sadreiuqzi ed le
621
atseupseR odigele ayah es euqnua ,avitatneserper se ocopmat artseum al oednos etse nE onoflet neesop euq sol euq ed ohceh le enopus euq nisrotsid al atneserP .raza la ne naes euq renopus ed se olle rop y ,ocimnoce levin otreic nu ed etneg nos atseucne al ed otreica ed atlaf al acilpxe ollE .sahcered ed nicroporp royam .senoiccele sal ed ovitcefe odatluser led ,dadisrevinu al ed asoremun esalc anu ne seuqilc ed aicnetsixe al rirbucsed araP )G erbmon le setnaidutse ed raza la adigele artseum anu a tnugerp rodagitsevni le .somitn sm sogima sus ed atseupseR etnedecorpmi se artseum atse orep ,odaicnune le nges ,artseum anu ne asab es iS euqrop ,seuqilc sol rirbucsed ,nicagitsevni al ne otseuporp nif la nicaler ne .esalc al ed sorbmeim sol sodot a euqraba atseucne al euq osicerp se olle arap es euq somitn sogima ed odarrec opurgbus le se ,odibas se omoc ,euqilC .etnemacorpcer ,sorto a sonu solle sodot negile 000,5 apurga euq larutluc dadeicos anu ed sacitlop sedutitca sal raidutse araP ) H solle ed 005 a oiranoitseuc rop atseucne anu razilaer odidiced ah es sorbmeim sodigele soicos sotnat sorto a satsivertne 002 ed smeda ,etnemairartibra sodigele riutitsus noreitimrep es serodatsivertne sol dadilaer al ne neib is ,raza la .sorto rop sodigele soicos sol etnemetneucerf atseupseR aremirp al ,ograbme niS .osrevinu led artseum ,oipicnirp ne ,sosac sod sol ne yaH nu ne niccele al esrasab ed nicidnoc al ener on otnauc ne elbisimdani se ed oipicnirp la enopo es smeda y ,raza la elbisop se is ,lanoicar otneimidecorp euq ed orgilep narg yah seup ,airartibra res ebed on niccele ahcid euq atcerroc artseum al osac odnuges le nE .alle ne sovitejbus soiretirc naczelaverp rop ,y lanosrep nicutitsus al rop dadilaer al ne adaiciv odatluser ah etnemlaicini .oditimrep nah es serodatsivertne sol euq avitejbus ,otnat dade ed royam ocilbp led sretni le ragitsevni arap sodacrem ed aserpme anU ) I ,sazar sarto ed 000,3 y sorgen 000,5 ,socnalb 000,8 neviv ednod daduic anu ed anu a atseucne anu razilaer odidiced ah ,adanimreted rocil ed acram anu rop .sorgen 004 ed raza la adigele artseum atseupseR osrevinu le euqnua euqrop ,adilvni artseum anu ed atart es nibmat osac etse nE al ad es smeda y alle ed rotces nu ne asab es ols ,nicalbop al adot se
721
se euq ,nicalbop al ed aicnerefid a ,oengomoh se euq aicnatsnucric sal ed etrap anu rednerpmoc arebed artseun al atcerroc res araP .aengoreteh .adacifitartse ratse arebed ,riced sE .nicroporp amsim al ne sazar sert ed amargorp nu otsiv nabah euq asac ed sama ed nicroporp al ramitse araP ) J ed raza la artseum anu noreigile serodagitsevni sol ,roiretna anames al ne VT ,sosip 051 ed atseupmoc ,sanaznam sahcid ed anu nE .daduic al ed sanaznam sadartnocne noreuf euq ,asac ed sama 001 a noratsivertne serodatseucne sol .atreup al a ramall la osip le ne atseupseR ah on ,051 ed 05 ,artseum al ed odavele yum ejatnecrop nu euq eneit es uqA odot erbos ,artseum al a dadivitatneserper atiuq ollE .odatsivertne res odidop ,senoicapuco sarto u ojabart rop ,euq elbisop se nabatlaf euq sal ed sahcum euqrop euq sal ed nicroporp al salle ne ,otnat rop ,y asac ed areuf etnemlautibah ntse .royam aes amargorp le otsiv nah on atseucne rop razilaer odasnep ah es euq soidutse setneiugis sol sotseupuS . 2 .solle sodot ne artseum al ed dadinu al y esab al racidni edip es ,lartseum sasoigiler senoicamrofni sal ed sotcepsa sosrevid sus ne niculove al ed sisilnA ) A .oilicnoC led supsed y setna seloapse socidirep sol ne atseupseR ,socidirep ed dadilarulp anu acraba oidutse le euq ritrevda euq yah ragul remirp nE lareneg artseum aL .oa adac ed ortned ocidirep adac ed soremn ed y soa ed sasrevid sal a setneidnopserroc sartseumbus sert ,seup ,rednerpmoc ebed .sadacidni sedadilarulp ed laicifo ortsiger le res arebed artseum al ed esab al ,socidirep sol a otcepseR .ocidirep adac artseum al ed dadinu al y sodazirotua seloapse socidirep sol sodot ed larutan atsil al se artseum al ed esab al euq oivbo se ,soa sol a otnauc nE .oa adac dadinu al y nicagitsevni al euqraba euq sol sodot soremn ed latot le ares esab al ,oa y ocidirep adac ed ortned ,omsimisA .oremn adac dadinu al y oa la ocidirep adac rop sodacilbup aelirdam anoz al ed serailimaf sadneiviv ed senoicidnoc sal erbos oidutse nU ) B .sacellaV ed atseupseR ,euq le ne ,anoz al ed onalp le res arebed artseum al ed esab al osac etse nE odacifitartse oertseum ed sotcefe a serotces rop etnemavitalerroc sadaremun .artseum al ed dadinu al nariutitsnoc sanaznam sal ,osac us ne
821
senoicaicosa sal ed selanoicnuf y selarutcurtse senoicidnoc sal erbos oidutse nU )C ,sasoigiler ,sacimnoce sal ed nisulcxe noc ,aapsE ed sadavirp sairatnulov .selacidnis y sacitlop atseupseR .nicaicosa adac :dadinU .senoicaicosa ed laicifo ortsiger lE :artseum al ed esaB laicos esalc al y railimaf dadilibatse al ertne nicaler al erbos nicagitsevni anU ) D .aeuqep daduic anu ne atseupseR ed nrdap o osnec la artseum al ed esab omoc rirrucer euq arbah osac etse nE .ailimaf al ares artseum al ed dadinu aL .daduic al ed sonicev .dadilanosrep ed opit y oiretsim ed y rorroh ed enic la nicifA )E atseupseR anu artseum al ed esab omoc renetbo ed dadilibisop al ev es on osac etse nE ed otneimidecorp le ,olpmeje rop ,ratpoda euq arbah olle roP .ortsiger o atsil ed nicceyorp al a setnetsisa sol ed ,.cte ,ohco ,ocnic adac ed onu a ratseucne .saluclep ed opit etse ed seroyam setnatibah 005,8 ed dadinumoc anu erbos ocigloicos oidutse nu nE . 3 .058 ed artseum anu odigele ah es dade etse odicelbatsE .nicavele ed etneicifeoc le y oertseum ed niccarf al rallaH ,sodaicrovid ohco odatluser nah odazilaer oidutse le ne euq otseupus y omitl .dadinumoc al ne atsixe elbaborp se euq sodaicrovid ed latot oremn le ranimreted atseupseR
%01 = 001 x 058 005 ,8
:oertseum ed niccarF :nicavele ed etneicifeoC
01 =
0 05 ,8 058
sodaicrovid ed oremn la laugi :nicalbop al ne sodaicrovid ed elbaborp oremN .08 = 01 x 8 :nicavele ed etneicifeoc le rop artseum al ne .sailimaf sal ne ehcel ed omusnoc le erbos atseucne anu razilaer odatceyorp ah eS . 4 .048 ,artseum al ed dutilpma al y ,000,6 se osrevinu led sailimaf ed oremn lE es ,artseum atse atneserper euq oertseum ed niccarf al atneuc ne odneineT ed artseum al ne riulcni nebed es euq sedadinu ed oremn le ranimreted edip :osrevinu le ednerpmoc euq setneiugis selanoiseforp sotartse sol ed onu adac
921
001 002 000,2 006 009,1 .002,1
selarebil selanoiseforP setnaicremoC sorerbO serotlucirgA soicivreS sodaelpmE atseupseR

001 x 048 :oertseum ed niccarF 000 ,6
%41 =
:otartse adac arap artseum ed sedadinU

41 82 0 82 48 6 62 8 61 0 48 = % 4 1 .00 1 .... sel a re bil senoi sefo r P = % 4 1 .00 2 se tn ai c re mo C = % 4 1 .00 0.2 so re r bO = % 4 1 .00 6 sero tl uci rgA = % 4 1 .00 9.1 soi ci vre S = % 4 1 .00 2.1 sod ael pm E L A TO T
oicicreje ne etnemlaicifo sodagoba ertne atseucne anu razilaer odatceyorp ah eS . 5 .liviC ogidC led amrofer al erbos ninipo us reconoc ed otejbo noc ,dirdaM ed nemitse es euq ed osac le ne ,artseum al ed sesab y sedadinu selbisop sal ralaeS senif sol a adauceda sm ares luc etnemadanozar racidni e ,sairav res nadeup .sodiugesrep atseupseR ,oicicreje ne sodagoba sol ,odaicnune le nges ,res ed ah artseum al ed dadinu aL o sodapurga neib ,etnemlaudividni neib natca sots euq ritrevda euq yah orep ed eires anu ohcapsed us ne neneit euq sodacatsed ,sodagoba netsixe neib a artseum al ed dadinu omoc ramot ed dadilibisop al etsixe otnat roP .setnaduya sodamrof ntse ay ,setefub y sohcapsed sol neib o oicicreje ne odagoba adac .sodagoba soirav o onu rop ne sodagoba sol ed ninipo al reconoc se nicagitsevni al ed otejbo le euq odaD ed se ,sorto noc ohcapsed nu ne ejabart euqnua ,odagoba adac euq y oicicreje sus ed al ed etnerefid sonem o sm ,aiporp ninipo us agnet euq renopus res arebed osac etse ne rigele a artseum al ed dadinu al euq ecerap ,soreapmoc a o noc ejabart euq ed etnemetneidnepedni ,oicicreje ne laudividni odagoba adac sol ed artseum al ed dadinu omoc niccele al ,etrap arto roP .sorto ed senedr sal .artseum al ed esab al ramrof arap selicfid sm samelborp aetnalp sohcapsed
031
ed esab al renetbo arap ,artseum al ed dadinu al amrof atse ed adanimreteD a rirrucer ardop es ,dirdaM ed oicicreje ne sodagoba sol sodot ed atsil o ,ats sal o selacsif sortsiger sol razilitu ,olpmeje rop ,omoc ,sotneimidecorp soirav y sortsiger sol rigele elbireferp se euq oivbo sE .sodagobA ed oigeloC led satsil ed laicifo otnemucod le neyutitsnoc otnauc ne ,sodagobA ed oigeloC led satsil oicicreje ne sodagoba sol a atseucne al rigirid la euq esetN .oicicreje ne sodartel oigeloC le ne sodalucirtam ntse euq sol a omsim ohceh etse rop neyulcxe es .oicicreje nis sodagoba omoc serolav y sedutitca ,senoinipo erbos lanoican atseucne anu rautcefe edneterp eS . 6 ed senevj ed oremn le ,0691 ed osnec 1e ngeS .aloapse dutnevuj al ed niccarf aL .000,007,4 ed ,sodnoder soremn ne ,are soa ortaucitniev a ecniuq .000,1/1 ne odajif ah es oertseum ed ed sedadivitca rop nicisopmoc al ,naesop es euq socitsdatse sotad sol ngeS :etneiugis al are aloapse dutnevuj al 001 rop 51 arutlucirgA 001 rop 52 airtsudnI 001 rop 02 oicremoC 001 rop 53 soicivres y sanicifO 001 rop 5 setnaidutsE sal reconoc laicepse sretni etsiver euq eerc atseucne al azilaer euq opiuqe lE ed oremn le euq atluser orep ,litnaidutse dutnevuj al ed sedutitca y senoinipo ,ednopserroc sel euq nicroporp al nges ,soiratisrevinu a razilaer a satseucne .otcefe la etneicifusni aredisnoc es euq oremn ,532 ed ols se al ed oamat le rairav nis ,euq arap recah edeup es uq ranimreted edip eS secev ortauc osep nu noc alle ne sodatneserper ntse setnaidutse sol ,artseum le ne otartse us ed aicnatropmi al nges arednopserroc sel euq la roirepus .sotartse rop artseum al ed etnatluser nicisopmoc al odnacidni ,osrevinu atseupseR tse on otartse nu odnauc ,elbisimda se ,niccudortni al ne odacidni ah es omoC nicatneserper al ratnemua o razrof ,osrevinu le ne odatneserper etnemetneicifus al nicroporp amsim al ne odneyunimsid ,artseum al ne otartse etse ed .sodatneserper etnemetneicifus sotartse sorto ed alle ne nicapicitrap setnaidutse sol euq amitse es euq odaicnune le ne ecid es omoc ,osac etse nE sel euq la roirepus secev ortauc osep nu noc sodatneserper ratse nebed al ne nicroporp us euq oralc se ,001 rop 5 ,osrevinu le nges ednopserroc
131
,001 rop 51 led otnemua nu enopus otsE .001 rop 02 nu ed res rebed artseum sanicifo ne 001 rop 8 nu ,olpmeje rop ,sotartse sorto ne odicuder res rebed euq .airtsudni al ne 001 rop 3 nu y oicremoc ne 001 rop 4 nu ,soicivres y % 51 22 61 72 02 001 :ares sotartse rop artseum al ed nicisopmoc al ,otse ngeS ..... arutlucirgA .. airtsudnI .. oicremoC . . . . . . . . . . . . . . . . . sanicifo y soicivreS setnaidutsE LATOT
sol sodigocer y roiretna oicicreje le ereifer es euq a atseucne al adautcefE A7 odaralced nah es ,atsiverp nicroporp al ne otartse adac ed ortned soiranoitseuc sejatnecrop setneiugis sol atsilaicos ocimnoce ametsis nu ed soiraditrap .otartse adac ed ortned sotseupus % 04 07 04 05 09 03,95 arutlucirgA airtsudnI oicremoC soicivreS setnaidutsE lanoican latoT
noc artseum al ed nicisopmoc al ne adazilaer nicaretla al otneuc ne odneineT najelfer otartse adac ed sejatnecrop sol is racidni ed osrevinu la nicaler latot ejatnecrop le is y otartse us ne dutitca atse ed nisnetxe al etnemavitcefe .dutnevuj al adot a nicaler ne ajelfer al lanoican atseupseR dutitca al a nisehda al etnemavitcefe najelfer otartse adac ed sejatnecrop soL arajelfer al ets .lanoican latot le sa on orep ,otartse us ed ortned nitseuc ne al euq amsim al areuf osrevinu led sotartse sol ed lautnecrop nicisopmoc al is etnemairatnulov odaretla ah es roiretna oicicreje le nges omoC .artseum al ed royam le otercnoc ne euq acilpmi nicaretla atse ,artseum al ed nicisopmoc al anu neneit euq sol nos etnemasicerp euq ,setnaidutse sol a odidecnoc osep led otnemua nu agnopus ,atsilaicos ocimnoce ametsis la elbarovaf sm dutitca amsim al aradraug artseum al is odatluser areibuh euq la otcepser lanoican latot .osrevinu le euq sotartse sol ne nicroporp
231
led ovitcefe lanoican latot le ranimreted edip es ,roiretna nisulcnoc al adaD B 7 odneigirroc ,atsilaicos ocimnoce ametsis led soiraditrap senevj ed ejatnecrop sol ed nicacilpitlum o nicarednop al etnaidem atart es euq ed nicaivsed al otcudorp le odneidivid y osrevinu le ne ejatnecrop le rop otartse adac ed sodatluser .001 rop atseupseR :atsilaicos ocimnoce nemigr nu ed soiraditrap senevJ
sol ed odarednop % otatse adac ne selbarovaf otartse led % osrevinu le ne ed % selbarovaf DADIVITCA ED SOPURG
6 5,71 8 5,71 5,4 05,35
51 52 02 53 5
04 07 04 05 09 03,95
. . .
arutlucirgA airtsudnI oicremoC soicivreS setnaidutsE

LANOICAN LATOT
anu ,atsilaicos ocimnoce nemigr led soiraditrap lanoican latot le euq ev eS 05,35 le se ,artseum al ed sotartse sol ne adautcefe nicaretla al adigerroc zev .ats ne abatluser omoc ,001 rop 03,95 le on y ,001 rop omoc ,etnemairatnulov sadaretla sadacifitartse sartseum ed ,osac etse ne otnaT areifid atseucne al adautcefe ed supsed adinetbo artseum al euq ed le ne es ,osrevinu le ne sots ed sejatnecrop sol ed sotartse sonugla ne etnemelbisnes .selatot sodatluser sol odom etse ed rigerroc nebed nabapucoerp euq sacitlopocimnoceoicos senoitseuc sal erbos oednos nu nE . 8 ne odneinet ,adacifitartse arenam ed artseum anu igile es ,agleb nicalbop al a y anolav ,acnemalf :niger al )a :sacitsretcarac o setroc sod atneuc .dadinumoc al ed oamat le )b y ,latipacsalesurB ed otnematraped ed sotartse sotnitsid sol ed artseum al ne nicatneserper ed sejatnecrop soL :setneiugis sol ,atseucne al adazilaer zev anu ,noreuf acitsretcarac o etroc adac % 02,25 acnemalf nigeR 04,23 anolav nigeR 04,51 latipacsalesurB 00,001
331
% 51 2,81 6,61 8,51 7,61 6,8 1,9 00,001
setnatibah 000.2 ed sonem eD 000,5 a 2 eD 000,01 a 5 eD 000,02 a 01 eD 000,05 a 02 eD 000,001 a 05 eD sm y 000,001 eD
atneuc ne odneinet ,osrevinu led otcepser artseum al ed oirbiliuqe le racifireV al ,atseucne al ed acop al ne ,are otartse adac ed ets ne nicatneserper al euq :eugis euq % 6,94 acnemalf nigeR 7,33 anolav nigeR 7,61 latipac-salesurB 00,001 % 1,51 5,81 2,71 9,41 7,61 3,8 3,9 00,001
setnatibah 000,2 ed soneM 000,5 a 2 eD 000,01 a 5 eD 000,02 a 01 eD 000,05 a 02 eD 00,001 a 05 eD sm o 000,001 eD atseupseR
ordauc nu ramrof ragul remirp ne osicerp se odidep oirbiliuqe le racifirev araP ,osrevinu le y artseum al ne arogetac adac ed sejatnecrop sol ed ovitarapmoc :eugis euq la ralimis osrevinu ne % artseum ne % SAROGETAC :nigeR acnemalF anolaV latipacsalesurB
6,94 7,33 7,61
2,25 4,23 4,51

431
1,51 5,81 2,71 9,41 7,61 3,8 3,9
0,51 2,81 6,61 8,51 7,61 6,8 1,9
:sedadinumoc oamaT setnatibah 000,2 ed sonem eD 000,5 a 2 eD 000,01 a 5 eD 000,02 a 01 eD 000,05 a 02 eD 000,001 a 05 eD sam y 000,001 eD
ne setnatropmi senoicairav netsixe on euq artseum raluco niccepsni elpmis aL .latot nicalbop o osrevinu le ne y artseum al ne otartse adac ed senoicroporp sal nebed es o savitacifingis nos saicnerefid satse is raborpmoc arap ,etnatsbo oN .2x ed abeurp al razilitu edeup es ,raza la etnemelpmis
531
631
CAPTULO III
EL PROCESO DE PRUEBA DE HIPTESIS
137
ELAS MEJA MEJA
138
EL PROCESO DE PRUEBA DE HIPTESIS
1. HIPTESIS NULAS Y PRUEBA INVERSA

El mtodo cientfico, en su secuencia final, plantea la necesidad de someter a prueba las hiptesis. Esta tarea es la que hace distinto al conocimiento cientfico de los otros tipos de conocimientos. Someter a prueba las hiptesis consiste en recolectar datos de la realidad para disponer de evidencia emprica que confirme o contradiga la hiptesis planteada. Para someter a prueba o contrastar una hiptesis es necesario, adems de formular la hiptesis alterna, elaborar una hiptesis nula, que viene a ser la negacin de la alterna. Es preciso realizar este artificio debido a que es la nica manera posible de probar una hiptesis. Esto se debe a que, tericamente, las hiptesis siempre plantean diferencias, incrementos, efectos, consecuencias, etc., que produciran las variables independientes en las dependientes, y bien se sabe que tales diferencias o incrementos pueden presentarse en diferentes formas, en distintas manifestaciones o en diferentes cantidades. Las hiptesis alternas plantean infinitas maneras de establecer relaciones entre las variables. Por el contrario, las hiptesis nulas, al negar lo planteado en las hiptesis alternas, sostienen que las variables independientes no influyen o no producen ningn efecto en las variables dependientes. Las hiptesis nulas niegan los efectos, niegan las diferencias, niegan los incrementos y tratan de establecer igualdades o semejanzas. En las hiptesis nulas la posibilidad de que una variable no produzca efectos en otra, es una y slo una, por lo que es ms fcil adoptar decisiones con respecto a una hiptesis nula, la que niega los efectos, la que constituye una sola posibilidad, que adoptar decisiones acerca de las diferencias que plantea la hiptesis alterna, que suponen infinitas posibilidades de influencia o incremento. Por ejemplo, dadas las lneas AB y CD, sean las siguientes hiptesis: A ___________________________ B C ___________________________ D
Grfico N 6
139
ELAS MEJA MEJA
Hiptesis alterna: Hiptesis nula:
Las lneas son diferentes Las lneas no son diferentes
Como se ha dicho, existen muchas maneras de que estas lneas sean diferentes, pero existe una sola posibilidad de que estas lneas no sean diferentes, es decir, que sean iguales. La prueba de hiptesis consiste en reunir evidencia emprica con respecto a la hiptesis nula, es decir, reunir datos que pongan en evidencia la nica posibilidad en la que las lneas no sean diferentes, que permitan establecer que las lneas sean iguales. Si el investigador acumula datos en apoyo de la hiptesis de la no existencia de diferencias entre las lneas, entonces se acepta la hiptesis nula y se rechaza la hiptesis alterna. Por el contrario, si los datos no confirman la igualdad de las lneas, se rechaza la hiptesis nula y se tiene que aceptar la hiptesis alterna. Pero, en este caso, aceptar la hiptesis alterna no significa comprobar la verdad de tal hiptesis, slo significa que se ha encontrado evidencia emprica que hace pensar que tal hiptesis no es falsa. Si un cientfico sostiene que la inteligencia incrementa el aprendizaje, para contrastar esta hiptesis puede formar dos grupos de estudiantes. En uno de ellos puede ubicar estudiantes con alto nivel de inteligencia y en el otro grupo puede ubicar estudiantes con bajo nivel de inteligencia. La teora cientfica al respecto conduce a pensar que el grupo de estudiantes que ostenta altos niveles de inteligencia, alcanzar ms altos niveles de aprendizaje, mientras que el grupo de estudiantes con bajos niveles de inteligencia alcanzar niveles bajos de aprendizaje. Las diferencias en los niveles de aprendizaje que se puede encontrar entre estos dos grupos son mltiples; se puede hallar pocas diferencias, que las diferencias pueden ser profundas, las diferencias pueden ser de un nivel medio, etc. Existen, en teora, infinitas posibilidades de que los grupos sean diferentes en cuanto a sus niveles de aprendizaje. Pero si el investigador, cada vez que realiza el experimento, halla las mismas puntuaciones, tanto en grupos de estudiantes con altos niveles intelectuales como en grupos de estudiantes con bajos niveles intelectuales; por ejemplo, si los promedios hallados en ambos grupos fuese, 12,35, entonces podr decir que acepta la hiptesis nula porque halla, cada vez que examina el aprendizaje en grupos de estudiantes con diferentes niveles intelectuales, promedios de 12,35. Pero esto es un absurdo. No es posible que los grupos de estudiantes con diferentes niveles de inteligencia alcancen puntuaciones iguales, pues las bases tericas que sustentan esta hiptesis establecen que la inteligencia incrementa el aprendizaje. Sin embargo, si sucediera esta absurda situacin, el investigador deber aceptar la hiptesis nula, aquella que sostiene que no existen diferencias en el aprendizaje entre los grupos de estudiantes con altos niveles de inteligencia con respecto a aquellos grupos de estudiantes que poseen bajos niveles de inteligencia. sta constituira una nica situacin y al hallarla, debe rechazar la hiptesis alterna, aquella que sostiene que
140
existen diferencias en los niveles de aprendizaje entre ambos grupos de estudiantes. Pero como sta es la situacin absurda, en los hechos, cabe la posibilidad de que el investigador se incline por rechazar la hiptesis nula, pues es ms posible encontrar diferencias que igualdades. Esta es la manera de contrastar hiptesis. La metodologa cientfica indica que se debe proceder de este modo, pues es ms fcil hallar la nica posibilidad que no se produzcan diferencias que demostrar las infinitas posibilidades de diferencias que plantean las hiptesis alternas. Algunos autores llaman a este procedimiento la prueba del absurdo, pues se asume, como hiptesis, una situacin absurda para luego buscar evidencias que nieguen o contradigan esta absurda situacin.
2. ERRORES AL ADOPTAR DECISIONES

En base a la evidencia emprica reunida, el investigador adopta sus decisiones y, como es natural, toda decisin humana lleva implcita la posibilidad de error. El investigador debe tratar de no cometerlos; sin embargo, cuando se adoptan decisiones con respecto a la hiptesis, el investigador puede cometer dos tipos de errores: Error de tipo I: El error de tipo I consiste en aceptar la hiptesis nula cuando en realidad es falsa. Para evitarlo, se recomienda ampliar el tamao de la muestra. Error de tipo II: El error de tipo II consiste en rechazar la hiptesis nula cuando en realidad no existen argumentos para rechazarla. Para evitarlo se recomienda perfeccionar la calidad de los instrumentos de acopio de datos. Considerando este contexto, el investigador siempre correr el riesgo de cometer errores, por lo que debe trazar estrategias ms eficaces, utilizar instrumentos ms precisos y trabajar con muestras del tamao adecuado. Es normal que se produzcan estos errores. El avance cientfico tecnolgico depende, en muchos casos, de las correcciones que hacen los cientficos a los errores que han cometido otros cientficos que realizaron investigaciones precedentes. Los esfuerzos por realizar replicaciones o refutaciones cientficas permiten corregir los errores que un investigador hubiera cometido o confirmar las decisiones a las que puede haber llegado luego de repetir los experimentos en varias oportunidades, lo que permite confirmar la validez de las decisiones adoptadas.
141
ELAS MEJA MEJA
3. PRUEBA DE HIPTESIS
El proceso de prueba de hiptesis puede hacerse de dos maneras: mediante tcnicas estadsticas o mediante tcnicas que no requieren el empleo de la estadstica. Se ha dado en llamar investigacin cuantitativa cuando se usan tcnicas estadsticas y se denomina investigacin cualitativa cuando no se usan tcnicas estadsticas. En la actualidad se desarrolla una polmica muy intensa en torno a la validez de estas tcnicas, pero parece ser que algunas variables, necesariamente deben ser estudiadas con mtodos cuantitativos, porque es posible medir o cuantificar sus magnitudes o propiedades, mientras que otras variables, por su propia naturaleza, no pueden estimarse cuantitativamente, entonces se deben emplear, necesariamente, los mtodos cualitativos. En muchos casos, las ltimas investigaciones cientfico sociales se realizan integrando el anlisis cuantitativo con el cualitativo, lo que permite una mejor comprensin de los fenmenos que se estudian. En lo que sigue, se explicar la metodologa que emplea tcnicas estadsticas. Cuando se emplean mtodos estadsticos o cuantitativos, se dispone de dos tipos de pruebas estadsticas: las paramtricas y las no paramtricas. Las pruebas paramtricas sirven para analizar eventos producidos por el azar o la suerte, mientras que las pruebas no paramtricas sirven para analizar eventos producidos por la intencin, la voluntad o los propsitos. En la investigacin de la conducta, campo en el que predomina la voluntad y la intencin de los individuos, las hiptesis se contrastan con pruebas no paramtricas. En cambio, las pruebas paramtricas se usan cuando las hiptesis tienen que ver con situaciones en las que no acta la voluntad o la intencin de las personas, es decir, cuando los hechos se producen al azar. Es ms plausible usar pruebas paramtricas en la investigacin en ciencias naturales.
4. NIVEL DE SIGNIFICACIN
En todo proceso de investigacin cabe suponer que los eventos pueden ocurrir por causa del azar o de la intencin. El problema radica en determinar cundo un evento se produce por causas del azar o cundo un evento se produce por causas de la intencin. El nivel de significacin proporciona los criterios para decidir acerca de esta situacin. El nivel de significacin es el margen de tolerancia aceptable para establecer los lmites, dentro de los cuales, se debe decidir si los eventos ocurren por causas del azar o por causas de la intencin. El nivel de significacin se expresa en trminos de porcentajes. Para el caso de la investigacin de la conducta el porcentaje aceptable es del 5%, lo que significa que para aceptar una hiptesis alterna tendr que ser necesario que los eventos sucedan en el 95% de los casos, y slo en el 5% sucedan por causas del azar. Por ejemplo, si el investigador postula la siguiente hiptesis: el
142
mtodo didctico de trabajo en equipo permite mejorar el nivel de aprendizaje de los estudiantes, y encuentra que en el grupo en el que ha aplicado la variable mtodo didctico de trabajo en equipo, el nivel de aprendizaje del grupo, en promedio, es 13,45, mientras que en el grupo en el que no ha aplicado dicha variable el promedio del grupo llega a 13,06, debe decidir si la diferencia entre estas dos puntuaciones, que slo es de 0,39 centsimos, ha sido producida por la aplicacin de la variable mtodo didctico de trabajo en equipo o simplemente ha sido producida por la casualidad o el azar. En estas situaciones, el investigador no tiene elementos de juicio para decidir si los hechos se han producido por el azar o por la aplicacin de la variable, que es la situacin intencionada. Como es natural, si las diferencias que halla son mnimas, cabe suponer que los hechos se producen por la casualidad o el azar. En cambio, si las diferencias son notorias, cabe suponer que los hechos se han producido como consecuencia de la aplicacin de la variable. El problema que tiene el investigador, en esta etapa del proceso, radica en establecer a qu llama pequea diferencia o diferencia no significativa o diferencia grande o significativa. El nivel de significacin es el criterio que le permite adoptar la decisin ms adecuada. El nivel de significacin tambin se puede expresar en trminos decimales: En este caso, 5% equivale a 0,05 ya que el margen de confianza es 0,95. La suma de estas cifras da 1. En las Ciencias Sociales, el nivel de significacin que generalmente se usa es de 0,05. En otras disciplinas cientficas se usan niveles de significacin ms finos, es decir, se acepta que los hechos ocurran al azar en porcentajes menores como por ejemplo: el 0,5%, 0,1% 0,01%, que en trminos decimales, estos niveles de significacin son del 0,005, 0,001 y 0,0001, respectivamente. En cambio, en los estudios de opinin o de mercado, debido a que la voluntad de los sujetos es muy cambiante, se aceptan mrgenes de error o niveles de significacin ms amplios, como por ejemplo del 10%, es decir, 0,10.
5. GRADOS DE LIBERTAD
Los grados de libertad son las posibilidades de libre variacin que tienen las categoras de una variable. Si por ejemplo se debe expresar las categoras de variacin de la variable rendimiento acadmico y se tienen los siguientes datos: matriculados 48, aprobados 41, los desaprobados cuntos sern? Estos sern necesariamente 7, que es la diferencia entre estas dos cifras propuestas al azar. En este ejemplo existen tres categoras matriculados, aprobados y desaprobados y los grados de libertad son dos, porque 48 y 41 son cifras arbitrarias y 7 es la cifra que expresa la diferencia entre aquellas. Los grados de libertad se calculan aplicando la siguiente frmula: gl = K1
143
ELAS MEJA MEJA
en este caso, gl = 31 = 2. Lo que significa que dadas tres categoras de variacin, los grados de libertad son 2. Tanto el establecimiento del nivel de significacin como la identificacin de los grados de libertad son tareas necesarias para poder interpretar los datos que se obtienen en el proceso de prueba de hiptesis. En la investigacin cuantitativa, al realizar el proceso de prueba de hiptesis, se obtiene un dato, una cifra, a la que se denomina valor hallado que no tiene ningn sentido si no es comparada con otra cifra, llamada valor tabulado. Este valor tabulado, aparece en unas tablas que generalmente se publican como anexos de los libros de estadstica inferencial. La tarea del investigador consiste en comparar el valor hallado, que es el que ha encontrado luego de hacer los respectivos clculos, con el valor tabulado. En las tablas, se puede ubicar el valor tabulado identificando la interseccin entre el nivel de significacin y los grados de libertad previstos. De ah que resultan muy importantes para la toma de decisiones con respecto a las hiptesis, los conceptos de nivel de significacin y grados de libertad.
6. PRUEBA DE CHI CUADRADA (X2)

Una de las pruebas no paramtricas ms conocidas es la prueba de Chi cuadrada. Esta prueba ayuda a adoptar la decisin ms adecuada con respecto a la hiptesis. Sus frmulas tienen algunas variaciones segn los datos que se desee estudiar, pero en todos los casos se requiere que los datos se presenten en forma de frecuencias. Sea la siguiente investigacin: Estudio de las actitudes de los profesores con respecto al ascenso por mritos. La hiptesis sera: Los profesores, a medida que avanzan en edad, cambian de actitud con respecto al ascenso por mritos . Esto significa, hipotticamente, que los profesores jvenes estn de acuerdo con el ascenso por mritos en la carrera profesional, mientras que los profesores de ms edad, estn en contra de este tipo de criterio para el ascenso. Sean, por ejemplo, los siguientes datos:
EDAD FAVORABLE NEUTRAL DESFAVORABLE TOTAL
21 25 26 30 31 35 36 40 41 45 N
15 (8,6) 11 (8,6) 9 (8,6) 5 (8,6) 3 (8,6) 43
2 (3,6) 4 (3,6) 5 (3,6) 5 (3,6) 2 (3,6) 18
3 (7,8) 5 (7,8) 6 (7,8) 10 (7,8) 15 (7,8) 39
20 20 20 20 20 100
Cuadro N 5
144
Los datos se presentan en una tabla de contingencia 3 x 5, por lo que los grados de libertad son 8. Para el clculo de los grados de libertad se ha procedido de la siguiente manera: gl = (K 1) (L 1) K, representa el nmero de columnas que tiene la tabla de contingencia. En este caso, las columnas son 3, que corresponden a las actitudes favorable, neutral y desfavorable. L representa el nmero de lneas que tiene la tabla de contingencia. En este caso, las lneas son 5, que corresponden a los cinco grupos etreos en que se han agrupados a los sujetos: 21 a 25 aos, 26 a 30, 31 a 35, 36 a 40 y 41 a 45. Con estos datos, deben hacerse las siguientes operaciones: gl = (3 1) (5 1) = 2 x 4 = 8 En este caso, las decisiones se adoptarn con 8 grados de libertad y al nivel de significacin de 0,05 La frmula de Chi cuadrada que se emplear en este caso es la siguiente:
= Sumatoria. fo = frecuencia obtenida. fe = frecuencia esperada. Como la frmula exige hallar la sumatoria total del cuadrado de las diferencias entre la frecuencia obtenida y la frecuencia esperada, dividida entre la frecuencia obtenida, se requiere hallar el cuadrado de las diferencias entre la frecuencia obtenida y la frecuencia esperada y dividirla entre la frecuencia esperada que corresponde a cada una de las tres actitudes. Para ello es necesario organizar los datos de la siguiente manera. En donde:
DATOS PARA EL CLCULO DE CHI CUADRADA DE LA ACTITUD FAVORABLE
Edades 21-25 26-30 31-35 36-40 41-45 N fo 15 11 9 5 3 43 fe 8,6 8,6 8,6 8,6 8,6 43 fo-fe 6,4 2,4 0,4 -3,6 -5,6 (fo-fe) 2 40,96 5,76 0,16 12,96 31,36 (fo-fe)2 fe 4,76 0,66 0,0018 1,51 3,65 10,5818
Cuadro N 6
145
ELAS MEJA MEJA
DATOS PARA EL CLCULO DE CHI CUADRADA DE LA ACTITUD NEUTRAL
Edades 21-25 26-30 31-35 36-40 41-45 N
fo 2 4 5 5 2 18
fe 3,6 3,6 3,6 3,6 3,6 18
fo-fe -1,6 0,4 1,4 1,4 -1,6
(fo-fe)2 2,56 0,16 1,96 1,96 2,56
(fo-fe)2 fe 0,71 0,04 0,54 0,54 0,71 2,54
Cuadro N 7
DATOS PARA EL CLCULO DE CHI CUADRADA DE LA ACTITUD DESFAVORABLE
Edades 21-25 26-30 31-35 36-40 41-45 N
fo 3 5 6 10 15 39
fe 7,8 7,8 7,8 7,8 7,8 39
fo-fe -4,8 -2,8 -1,8 2,2 7,2
(fo-fe)2 23,04 7,84 3,24 4,84 51,84
(fo-fe)2 fe 2,95 1,00 0,42 0,62 6,65 11,64
Cuadro N 8 Las sumatorias de Chi cuadrada obtenidas en cada caso son las siguientes, tal como pueden verse en los respectivos cuadros: Para la actitud favorable: 10,58 Para la actitud neutral: 2,54 Para la actitud desfavorable: 11,64 La sumatoria total es: 24,76. Este es el valor de Chi cuadrada hallado o encontrado para estos datos. Seguidamente se recurre a la Tabla de Valores Crticos de Chi cuadrada y se ubica el valor que se encuentre en la interseccin de la fila que corresponde a 8 grados de libertad y de la columna que corresponde al nivel de significacin 0,05, para una prueba bilateral. Se dice que la prueba o la hiptesis es bilateral cuando no seala el sentido de las diferencias, es decir, no especifica si la variable independiente incrementa o disminuye el valor de la variable dependiente,
146
slo plantea la influencia; mientras que una prueba o una hiptesis unilateral s es especfica, expresa que la variable independiente incrementa o, por el contrario, disminuye, los valores de la variable dependiente. En el presente caso, el valor hallado en la tabla es 15,51, tal como puede verse en el cuadro N 9. En este caso, como el valor encontrado: 24,76 es mayor que el valor que aparece en la tabla, se debe adoptar la decisin de rechazar la hiptesis nula que sostiene: Los profesores no cambian de actitud con respecto al ascenso por mritos a medida que aumentan en edad y se debe aceptar la hiptesis alterna que sostiene: Los profesores cambian de actitud con respecto al ascenso por mritos a medida que aumentan en edad.
VALORES CRTICOS DE CHI CUADRADA
Gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Nivel de significacin para una prueba bilateral 0,20 0,10 0,05 0,02 0,01 0,001 10,87 6,64 5,41 3,84 2,71 1,64 13,82 9,21 7,82 5,99 4,60 3,22 16,27 11,34 9,84 7,82 6,25 4,64 18,46 13,28 11,67 9,49 7,78 5,99 20,52 15,09 13,39 11,07 9,24 7,29 22,46 16,81 15,03 12,59 10,64 8,56 24,32 18,48 16,62 14,07 12,02 9,80 26,12 20,09 18,17 15,51 13,36 11,03 27,88 21,67 19,68 16,92 14,68 12,24 29,59 23,21 21,16 18,31 15,99 13,44 31,26 24,72 22,62 19,68 17,28 14,63 32,91 26,22 24,05 21,03 18,55 15,81 34,53 27,69 25,47 22,36 19,81 16,98 36,12 29,14 26,87 23,68 21,06 18,25 37,70 30,58 28,26 25,00 22,31 19,31 39,20 32,00 29,63 26,30 23,54 20,46 40,75 33,41 31,00 27,59 24,77 21,62 42,31 34,80 32,35 28,87 25,99 22,76 43,82 36,19 33,69 30,14 27,20 23,90 45,32 37,57 35,02 31,41 28,41 25,04 46,80 38,93 36,34 32,67 29,62 26,17
Cuadro N 9
147
ELAS MEJA MEJA
7. ANLISIS DE VARIANZA
Cuando en la investigacin se aplica una estrategia factorial o multivariada, es decir, cuando intervienen dos o ms variables independientes y stas no se encuentran correlacionadas entre s, se recomienda aplicar el Anlisis de Varianza como mtodo ms apropiado para probar hiptesis. Para aplicar el anlisis de varianza se debe, en primer lugar, trazar una estrategia adecuada. Si por ejemplo el investigador estudia los efectos que dos variables independientes producen en una dependiente y cada una de estas variables asume dos valores, la estrategia consistir en acomodar los datos en una tabla de contingencia 2x2, que algunos autores llaman rejilla 2x2 tabla de divisiones cruzadas 2x2. 2x2 significa que se analizarn los efectos de dos variables independientes cuando cada una de ellas vara en dos valores. Al aplicar el anlisis de varianza, y para mantener una misma nomenclatura, a cada una de las variables se denomina factor. Una de ellas es el factor A y la otra es el factor B. Pero como cada variable asume dos valores, el factor A variar en A1 y A2 y el factor B variar en B1 y B2. El sub ndice 1 significa que la variable se presenta en su nivel ms bajo de variacin y el sub ndice 2 significa que la variable se presenta en su nivel ms alto de variacin.
Sea la siguiente tabla de contingencia:
Factor A: A1 [1] B1 Factor B: [b] B2 A1 B2 A2 B2 [ab] A1 A1 A2 B1 A2 [a]
Grfico N 7 Como resultado de acomodar las variables en la tabla de contingencia 2x2 se produce un cruce de variables, y como consecuencia de ello es posible distinguir los siguientes cuatro tratamientos: A1, B1; A2, B1; A1, B2; A2, B2 . El ejemplo que ilustra lo dicho es el siguiente: Suponiendo que se desea estudiar los efectos de las variables desempeo docente y mtodos didcticos . El desempeo docente es el factor A y vara en A1, que corresponde a un desempeo
148
docente no eficiente y A2 que corresponde a un desempeo docente eficiente. Como se aprecia, el desempeo docente no eficiente es la presencia de la variable en su nivel ms bajo, no eficiente, o sea 1. Mientras que A2, corresponde al desempeo docente eficiente, es decir, el valor alto de la variable: 2. Por otra parte, el factor mtodos didcticos puede variar tambin en dos niveles: B1, aplicacin de mtodos didcticos centrados en la enseanza o valor bajo de la variable B1, y B2, aplicacin de mtodos didcticos centrados en el aprendizaje, o valor alto de la variable B. La teora pedaggica sostiene que el problema fundamental en todo proceso educativo es el aprendizaje y no la enseanza, de ah que se considera valor bajo a los mtodos didcticos centrados en la enseanza y valor alto a los mtodos didcticos centrados en el aprendizaje. La hiptesis que se puede elaborar con estos datos es la siguiente: El eficiente desempeo docente y los mtodos didcticos centrados en el aprendizaje son factores que contribuyen a incrementar el nivel de rendimiento acadmico de los estudiantes . Con estos datos, la primera combinacin de las variables es A1, B1, es decir grupo de alumnos que tiene profesores con desempeo docente no eficiente y a quienes se les aplica mtodos didcticos centrados en la enseanza. El primer tratamiento es, entonces, el tratamiento A1, B1, en el que los valores de las variables se presentan en sus niveles ms bajos. Ambos factores estn en 1 y para simplificar la denominacin de este tratamiento se asume la convencin de llamarlo tratamiento [1], que en realidad significa el tratamiento menos deseado, el tratamiento en el que prcticamente no actan o no influyen las variables. A partir de este tratamiento se puede elaborar la hiptesis nula. El segundo tratamiento, o segundo grupo, corresponde a la combinacin A2, B1, es decir el grupo de estudiantes que tiene profesores con desempeo docente eficiente y a quienes se les aplica mtodos didcticos centrados en la enseanza. En este grupo o tratamiento acta la variable A, es decir, la variable est en su valor ms alto: desempeo docente eficiente. Para simplificar su denominacin a este tratamiento se le conoce como tratamiento [a], porque A, y no B, asume el valor alto; B permanece en el nivel bajo. El tercer campo del cuadro es el tratamiento A1, B2, es decir, el grupo de alumnos que tiene profesores con desempeo docente no eficiente pero a quienes se les aplica mtodos didcticos centrados en el aprendizaje . En este grupo o tratamiento acta la variable B, es decir, la variable est en su valor ms alto: mtodos didcticos centrados en el aprendizaje , B 2. Para simplificar su denominacin a este tratamiento se le conoce como tratamiento [b], porque B asume el valor alto, mientras que la variable A no acta.
149
ELAS MEJA MEJA
El cuarto campo del cuadro es el tratamiento A2, B2, es decir el grupo de estudiantes que tiene profesores con desempeo docente eficiente y a quienes se les aplica mtodos didcticos centrados en el aprendizaje. En este grupo o tratamiento actan las variables A y B, es decir ambas estn en sus valores ms altos: profesores con desempeo didctico eficiente, A2, y mtodos didcticos centrados en el aprendizaje , B 2. Para simplificar su denominacin a este tratamiento se le conoce como tratamiento [ab], porque A y B asumen sus valores ms altos. Como se ha dicho, el anlisis de varianza es una metodologa que se aplica para probar hiptesis siempre y cuando las variables independientes no se encuentren relacionadas entre s. Algunas veces sucede que las variables independientes que actan sobre la dependiente se hallan, a su vez, relacionadas entre s, o dicho en otros trminos, existe covarianza entre las variables independientes. Cuando la covarianza entre las variables independientes no existe, o es igual a cero, se puede aplicar el anlisis de varianza. Cuando se presenta esta situacin, el investigador puede asumir que las variables influyen por separado, cada una en su oportunidad, en la variable dependiente. Por eso es que se puede hacer el anlisis, en forma independiente, de cada uno de los factores, y por eso es que se puede elaborar la estrategia de formar grupos o tratamientos que se ubican en una tabla de contingencia como la descrita. En el ejemplo que se est presentando, existen dos variables y cada una de ellas asume dos valores, de ah que la tabla de contingencia, como se ha dicho, se denomina 2x2, o sea, existe la posibilidad de formar cuatro grupos. Si una de las variables asumiera tres valores, la tabla se denominara 2x3, o sea se formarn 6 grupos o tratamientos. Las tablas de contingencia se tornan cada vez ms complejas, es decir, aparecen ms grupos de tratamiento a medida que las variables asuman ms valores o en la hiptesis se consideren tres o ms variables independientes. En el ejemplo que se est presentando, existen dos variables y cada una de ellas asume dos valores, de ah que resulta la posibilidad, o contingencia, de formar cuatro grupos a quienes se puede aplicar distintos tratamientos. Los valores hallados para la variable dependiente se ubican en cada celda o recuadro de la tabla de contingencia 2x2. El anlisis de varianza consiste en analizar la varianza de las puntuaciones alcanzadas por los cuatro grupos. Este anlisis se hace desde dos perspectivas, la primera consiste en analizar la varianza que podra existir al interior de cada uno de los grupos, es la varianza dentro de los grupos, o varianza intra grupo, de ah las denominaciones que se dan a los datos que se encuentran: suma de cuadrados dentro de los grupos, SSD, o media de cuadrados dentro de los grupos, MSD, en
150
donde el sub ndice D expresa que el anlisis se ha hecho con las puntaciones obtenidas por los sujetos dentro de cada grupo. La segunda perspectiva es realizar el anlisis de la varianza entre cada uno de los grupos, de ah las denominaciones de los datos que se encuentran: suma de cuadrados entre grupos, SSE, o media de cuadrados entre grupos, MSE, en donde el sub ndice E expresa que el anlisis se ha hecho comparando las puntaciones obtenidas por los sujetos entre cada uno de los grupos.
El siguiente grfico expresa lo dicho hasta el momento:
Factor A:
Desempeo docente
A1
No eficiente
A2
Eficiente
[1] B1 Factor B:
Mtodos didcticos Centrados en la enseanza
[a] A2 B1
A1 A1 [b]
[ab] A2 B2
B2
Centrados en el aprendizaje
A1 B2
Grfico N 8
A manera de ejemplos, se presentan a continuacin la sntesis de algunos trabajos realizados por investigadores de la Facultad de Educacin de la U.N.M.S.M. El que sigue es el estudio realizado por Constantino Domnguez Barrera, titulado Influencia del Desempeo Docente y de los Mtodos Didcticos en el Rendimiento Acadmico de Alumnos del Ciclo Bsico de Obstetricia. En este caso se investiga la influencia de dos variables independientes sobre una variable dependiente.
Problema Qu efectos producen, en el rendimiento acadmico de alumnos de Ciclo Bsico de Obstetricia, el desempeo docente y los mtodos didcticos que se emplean en el proceso enseanza-aprendizaje?
151
ELAS MEJA MEJA
Variacin de las variables: Desempeo docente, asume dos valores: Desempeo docente no eficiente, o nivel bajo de la variable, (A1), y Desempeo docente eficiente, o nivel alto de la variable, (A2). Mtodos didcticos: Mtodos didcticos centrados en la enseanza, o nivel bajo de la variable, (B1), y Mtodos didcticos centrados en el aprendizaje, o nivel alto de la variable, (B2).
Sistema de hiptesis
Hiptesis general El eficiente desempeo docente, (A2), y la aplicacin de mtodos didcticos centrados en el aprendizaje, (B2), incrementan significativamente el nivel de rendimiento acadmico de estudiantes del Ciclo Bsico de Obstetricia. En trminos formales: el rendimiento acadmico, representado por el smbolo Y es influenciado, en forma positiva, por el desempeo docente eficiente (A2) y por la aplicacin de mtodos didcticos centrados en el aprendizaje (B2). Es decir, se plantea el siguiente modelo estadstico propuesto por Jaime Arnau: Yijk = + i + j + ()ij + ijk En donde: Yijk es la k-sima observacin bajo el i-simo tratamiento de la variable A (Desempeo docente) y bajo el j-simo tratamiento de la variable B (Mtodos didcticos). (i = 1,2; j = 1,2; k = 1,2,3 ... 80) :Es la media general del experimento y recoge todos los efectos constantes. i: Es el efecto del i-simo nivel del factor A (Desempeo docente). j : Es el efecto del j-simo nivel del factor B (Mtodos didcticos). ()ij : Es el efecto de la interaccin de las variables. : Es el error estimado. Este modelo de hiptesis permite estimar los efectos de cada una de las variables independientes en el rendimiento acadmico. Sub hiptesis alterna 1 El rendimiento acadmico del grupo de estudiantes del Ciclo Bsico de Obstetricia, que tuvo profesores con desempeo docente eficiente, (A 2), es mayor que el rendimiento acadmico del grupo de estudiantes que tuvo
152
profesores con desempeo docente no eficiente, (A1). En trminos formales, para el factor A: H1 : 20 > 10 Sub hiptesis nula 1 El rendimiento acadmico del grupo de estudiantes del Ciclo Bsico de Obstetricia, que tuvo profesores con desempeo docente eficiente, (A2), no difiere significativamente del rendimiento acadmico del grupo de estudiantes que tuvo profesores con desempeo docente no eficiente, (A1). En trminos formales, para el factor A: H1 : 20 = 10 Sub hiptesis alterna 2 El rendimiento acadmico del grupo de estudiantes del Ciclo Bsico de Obstetricia, a quienes se les aplic mtodos didcticos centrados en el aprendizaje, (B 2) , es mayor que el rendimiento acadmico del grupo de estudiantes a quienes se les aplic mtodos didcticos centrados en la enseanza, (A1). En trminos formales, para el factor B: H1 : 02 > 01 Sub hiptesis nula 2 El rendimiento acadmico del grupo de estudiantes del Ciclo Bsico de Obstetricia, a quienes se les aplic mtodos didcticos centrados en el aprendizaje, (B 2) , no difiere significativamente del nivel de rendimiento acadmico del grupo de estudiantes a quienes se les aplic mtodos didcticos centrados en la enseanza, (A1). En trminos formales, para el factor B: H1 : 02 = 01 Sub hiptesis alterna 3 La interaccin de los factores desempeo docente y mtodos didcticos, (A x B) , produce efectos significativos en el rendimiento acadmico de estudiantes del Ciclo Bsico de Obstetricia. En trminos formales: H3 : ()ij > 0 para todo ij Sub hiptesis nula 3 La interaccin de los factores desempeo docente y mtodos didcticos, (A x B), no produce efectos significativos en el rendimiento acadmico de estudiantes del Ciclo Bsico de Obstetricia. En trminos formales: H3 : ()ij = 0 para todo ij
153
ELAS MEJA MEJA
Proceso de prueba de hiptesis. Mtodo I Luego de la aplicacin de los instrumentos de acopio de datos, en este caso el test para medir el rendimiento acadmico de los estudiantes de la muestra, los datos encontrados fueron los siguientes: Factor A:
Desempeo docente
A1
No eficiente
A2
Eficiente
[1] B1 Factor B:
Mtodos didcticos Centrados en la enseanza
[a] 998
867 [b]
[ab] 1087
B2
Centrados en el aprendizaje
985
Grfico N 9
CLCULO DE LOS EFECTOS DE LOS FACTORES MEDIANTE LA COMBINACIN LINEAL
Factores
Efecto del factor A Efecto del factor B Efecto de AxB
Combinacin lineal 1 a b ab 867 998 985 1087 + + + + + +
Total 233 207 -29
Efecto de los factores 1,46 1,30 -0,18
Cuadro N 10 Para el clculo de los efectos de los factores mediante la combinacin lineal, se han colocado los datos de la tabla de contingencia 2x2 en la secuencia lineal: 1, a, b, y ab. Para calcular el efecto del factor A , desempeo docente , se suma algebraicamente los valores de cada tratamiento. Se considera que en el tratamiento [1], el factor A no interviene debido a que est en su nivel bajo: A1, por lo que este
154
tratamiento est sealado con el signo negativo. Se considera que en el tratamiento [a], el factor A interviene debido a que est en su nivel alto: A2, por lo que este tratamiento est sealado con el signo positivo. Se considera que en el tratamiento [b], el factor A no interviene debido a que est en su nivel bajo: A1, por lo que este tratamiento est sealado con el signo negativo. Se considera que en el tratamiento [ab], el factor A interviene debido a que est en su nivel alto: A2, por lo que este tratamiento est sealado con el signo positivo. En consecuencia la suma algebraica para este factor es 233. Este puntaje ha sido alcanzado debido a que hay 80 alumnos en cada uno de los tratamientos signados con el signo positivo. Como para este factor hay dos tratamientos con signo positivo, se considera que son 160 los sujetos que han hecho posible alcanzar los 233 puntos en la suma algebraica; dividiendo 233 entre los 160 sujetos, se obtiene el valor de 1,46 que se considera es el valor con que el factor A, en este caso, desempeo docente influye en el rendimiento acadmico de los estudiantes de Obstetricia. Y si el factor A, desempeo docente influye en 1,46 en el rendimiento acadmico, se puede adoptar la decisin de rechazar la sub hiptesis nula 1 y aceptar la sub hiptesis alterna 1, que sostiene: El rendimiento acadmico del grupo de estudiantes del Ciclo Bsico de Obstetricia, que tuvo profesores con desempeo docente eficiente, (A2), es mayor que el rendimiento acadmico del grupo de estudiantes que tuvo profesores con desempeo docente no eficiente. De manera similar al caso anterior se procede para analizar la influencia del factor B: mtodos didcticos. Se considera que en el tratamiento [1], el factor B no interviene debido a que est en su nivel bajo: B1, por lo que este tratamiento est sealado con el signo negativo. Se considera que en el tratamiento [a], el factor B no interviene debido a que tambin est en su nivel bajo: B1, por lo que este tratamiento est sealado con el signo negativo. Se considera que en el tratamiento [b], el factor B interviene debido a que est en su nivel alto: B2, por lo que este tratamiento est sealado con el signo positivo. Se considera que en el tratamiento [ab], el factor B interviene debido a que tambin est en su nivel alto: B2, por lo que este tratamiento est sealado con el signo positivo. En consecuencia, la suma algebraica para este factor es 207. Este puntaje ha sido alcanzado debido a que hay 80 alumnos en cada uno de los tratamientos signados con el signo positivo. Como para este factor hay dos tratamientos con signo positivo, se considera que son 160 los sujetos que han hecho posible alcanzar los 207 puntos en la suma algebraica. Dividiendo 207 entre los 160 sujetos, se obtiene el valor de 1,29 que se considera es el valor con que el factor B, en este caso, mtodos didcticos, influye en el rendimiento acadmico de estudiantes de Obstetricia. Y si el factor B, mtodos didcticos, influye en 1,29 en el rendimiento acadmico, se puede adoptar la decisin de rechazar la hiptesis nula 2 y aceptar la sub hiptesis alterna 2, que
155
ELAS MEJA MEJA
sostiene: El rendimiento acadmico del grupo de estudiantes del Ciclo Bsico de Obstetricia, a quienes se les aplic mtodos didcticos centrados en el aprendizaje, (B 2) , es mayor que el rendimiento acadmico del grupo de estudiantes a quienes se les aplic mtodos didcticos centrados en la enseanza, (A1). Para analizar la interaccin o el efecto conjunto de los factores A y B se procede del siguiente modo: En el tratamiento [1] los factores A y B estn en sus valores ms bajos, es decir, A1B1, por lo que se puede decir que en este tratamiento ambos factores se encuentran iguales, por lo que se les reconoce con el signo positivo. En el tratamiento [a], slo el factor A est en su nivel alto, por tanto, al no haber interaccin, corresponde colocar el signo negativo. En el tratamiento [b], slo el factor B est en su nivel alto, por tanto, tambin corresponde colocar el signo negativo. En cambio, en el tratamiento [ab] ambos factores estn en sus niveles altos, A2B2, por lo que corresponde colocar el signo positivo. De ah que la suma algebraica para la interaccin o el efecto conjunto de los factores A y B sea 29 que dividido entre 160 resulta -0,18, es decir, un valor menor que cero, por lo que se adopta la decisin de aceptar la sub hiptesis nula 3 que sostiene: La interaccin de los factores desempeo docente y mtodos didcticos, (A x B), no produce efectos significativos en el rendimiento acadmico de estudiantes del Ciclo Bsico de Obstetricia, y rechazar la sub hiptesis alterna 3. Esta decisin concuerda con la teora al respecto, pues los factores A y B actan independientemente, no se entremezclan ni se traslapan, no producen efectos conjuntos, de ah que el valor hallado para la hiptesis de la interaccin sea una cifra muy pequea, incluso menor que cero.
CLCULO DE LOS EFECTOS DE LOS FACTORES A PARTIR DE LOS PROMEDIOS
A1 B1 10,84 B2 Totales Medias [1]
A2 [a]
Totales 23,32 25,90 49,22
Medias Y01 = 11,66 Y02 = 12,95 Y00 = 12,31
12,48 [b] [ab] 12,31 13,59 23,15 26,07 Y10 = 11,58 Y20 = 13,04
Cuadro N 11
156
Empleando este mtodo, los resultados son iguales a los encontrados con el mtodo I, pues al hacer las operaciones correspondientes se obtiene:
Para el factor A: Desempeo docente: 1 = Y1 Y = 11,58 12,31 = 0,73 2 = Y2 Y = 13,04 12,31 = 0,73 Total: 0.73 + 0,73 = 1,46
Para el factor B: Mtodos didcticos: 1 = Y01 Y = 11,66 12,31 = -0,65 2 = Y02 Y = 12,95 12,31 = 0,64 Total: 0,65 + 0.64 = 1,29
Mtodo II. Anlisis entre y dentro de los grupos Como se ha dicho, el anlisis de varianza realizado a un nivel ms profundo consiste en analizar la varianza al interior de los grupos o varianza dentro de los grupos, y la varianza entre los grupos. Luego de hacer este anlisis se obtiene la suma de cuadrados dentro de los grupos y la suma de cuadrados entre los grupos. Los procesadores estadsticos que se disponen ltimamente permiten realizar todos estos clculos que, hechos manualmente, suponen algn nivel de complejidad para quienes no son expertos en temas estadsticos, de modo que en este punto obviamos la descripcin de todo este proceso. Prueba F Para adoptar las decisiones con respecto a la hiptesis, se aplica la prueba F que arrojar un valor como consecuencia de dividir la media de cuadrados entre grupos, sobre la media de cuadrados dentro de los grupos. La frmula de F para el anlisis de varianza es la siguiente: F = MSE / MSD La media de cuadrados, entre y dentro de los grupos, se obtiene dividiendo las sumas de cuadrados respectivas entre los grados de libertad entre y dentro de los grupos. El siguiente cuadro ilustra lo que se dice:
157
ELAS MEJA MEJA
Fuente de variacin Variacin entre las combinaciones Variacin dentro de combinaciones Totales
las
SS 306,26 740,86 1047,12
gl 3 316 319
MS 102,9 2,34
Cuadro N 12 SS es la abreviacin de suma de cuadrados (del ingls sume of square). MS es la abreviacin de media de cuadrados (del ingls mean of square); gl es la abreviacin de grados de libertad. Los grados de libertad se obtienen de la manera que a continuacin se describe. Grados de libertad entre las combinaciones: como quiera que existen cuatro combinaciones o cuatro grupos de tratamiento, el investigador ha trabajado con una tabla de contingencia 2x2, por tanto los grados de libertad, entre las combinaciones, son 4 1 = 3. Grados de libertad dentro de las combinaciones: como quiera que en cada uno de los tratamientos o combinaciones existen 80 alumnos, se resta 80 1 = 79, en cada combinacin. Como existen cuatro combinaciones se tiene: 79 x 4 = 316 grados de libertad dentro de las combinaciones. Las operaciones para obtener F son las siguientes: F = MSE / MSD F = 102,09 / 2,34 = 43,63 43,63 es el valor hallado de F. Este valor se compara con el valor tabulado de F. El valor tabulado de F aparece en el cuadro N 13. En este caso, para 3 grados de libertad entre las combinaciones y 316 grados de libertad dentro de las combinaciones, el valor tabulado es 2,62. Entonces se observa que: 43,63 > 2,63 Como el valor hallado es mayor que el valor tabulado, se adopta la decisin de rechazar la hiptesis nula, que sostiene: El eficiente desempeo docente, (A2), y la aplicacin de mtodos didcticos centrados en el aprendizaje, (B2), no se relacionan significativamente con el nivel de rendimiento acadmico de estudiantes del Ciclo Bsico de Obstetricia y, por el contrario, se acepta la hiptesis alterna que sostiene: El eficiente desempeo docente, (A2), y la aplicacin de mtodos didcticos centrados en el aprendizaje, (B 2 ) ,influyen significativamente en el nivel de rendimiento acadmico de estudiantes del Ciclo Bsico de Obstetricia.
158
DISTRIBUCIN DE F (95% de confianza)
Entre las combinaciones
d e n t r o d e l a s c o m b i n a c i o n e s
Gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 18 20 21 22 oo
1 161,40 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 3,84
2 199,50 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,00
3 215,70 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 3,07 3,05 2,60
4 224,60 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,37
5 230,20 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,21
6 234,00 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,10
Cuadro N 13
159
ELAS MEJA MEJA
8. ANLISIS DE REGRESIN MLTIPLE El Anlisis de Regresin Mltiple es otra tcnica para contrastar hiptesis con dos o ms variables independientes. El diseo o la estrategia, en este caso, es factorial o multivariado. Se emplea el Anlisis de Regresin Mltiple cuando las variables independientes se encuentran relacionadas entre s. Esto significa que existe covariacin entre las variables independientes. El siguiente ejemplo es una investigacin realizada por el autor. Estudio de la correlacin entre el ndice acadmico, la organizacin del tiempo libre y la afinidad de la actividad laboral con los estudios, con respecto al xito acadmico de alumnos de post-grado de la Universidad Nacional Mayor de San Marcos. El objetivo principal de este estudio es predecir el xito acadmico. Esto es posible empleando el Anlisis de Regresin Mltiple. Esta prueba, segn Kerlinger, se basa en la misma idea de la correlacin simple excepto cuando X, la variable independiente, es ms de una. En el anlisis de regresin simple, la variable X se emplea para predecir Y. En el anlisis de regresin mltiple, se emplean las variables X1, X2, X3, Xn para predecir Y. La organizacin de los datos y los clculos se hacen de tal manera que se pueda obtener la prediccin ms acertada a partir de la combinacin de las variables independientes. Es decir, en lugar de afirmar: si se tiene X, se obtendr Y, se afirma: si se tiene X1, X2, X3, Xn, se obtendr Y. El resultado de los clculos expresar la bondad o exactitud de la prediccin y medir la fraccin de la varianza de Y que depende de la mejor combinacin de las variables independientes. Es oportuno aplicar el Anlisis de Regresin Mltiple cuando las variables se presentan concurrente y concomitantemente, esto significa que cuando al presentarse juntas, se potencian los efectos de cada una de las variables: los efectos conjuntos de las variables son mayores de lo que podran producir, por separado, cada una de ellas. Y como las variables independientes estn relacionadas entre s, ya no se pueden separar para estudiar los efectos de cada una de ellas, como se hace en el Anlisis de Varianza, sino que se trata de hallar la mejor combinacin posible de los efectos conjuntos de las variables independientes. Para estudiar los datos empleando el Anlisis de Regresin Mltiple, es necesario reconocer el principio de la particin de la varianza, es decir reconocer la medida en que Y (variable dependiente) se debe a cada una de las variables independientes. Pero es el caso que las variables independientes del presente estudio no solamente estn correlacionadas cada una con la variable dependiente, sino que tambin se encuentran correlacionadas entre s. Esta particularidad de las variables va a determinar el proceso a seguir.
160
Problema Qu grado de correlacin existe entre las variables ndice acadmico, organizacin del tiempo libre y afinidad de la actividad laboral con los estudios, con respecto al xito acadmico de estudiantes de Post Grado de la Universidad Nacional Mayor de San Marcos? Operacionalizacin de las variables ndice Acadmico : Es el promedio ponderado de las puntuaciones que alcanzaron estudiantes de post grado, cuando cursaron estudios de pre grado. Es variable continua que puede medirse en el nivel de intervalo. Ha sido medida en la escala vigesimal. Organizacin del tiempo libre: Es la puntuacin en la escala vigesimal que alcanzan los estudiantes de post grado a partir del anlisis de componentes tales como: ocupaciones remuneradas, horas libres, horas de estudio dedicado a la lectura y posesin personal de libros. Es variable continua que puede medirse en el nivel de intervalo. Ha sido medida en la escala vigesimal. Afinidad de la actividad laboral con los estudios: Se determina por el anlisis de dos componentes: la declaracin del propio sujeto y la interpretacin de las tareas que cumple en su actividad laboral. Es variable continua que puede medirse en el nivel de intervalo. Ha sido medida en la escala vigesimal. xito acadmico: Es el promedio ponderado de las calificaciones obtenidas por estudiantes de post grado de la UNMSM. Es variable continua que puede medirse en el nivel de intervalo. Ha sido medida en la escala vigesimal. Hiptesis alterna Existe un coeficiente de correlacin, estadsticamente significativo, al nivel de 0,05, entre las variables ndice acadmico, organizacin del tiempo libre y afinidad de la actividad laboral con los estudios, con respecto al xito acadmico de estudiantes de post grado de la Universidad Nacional Mayor de San Marcos. En trminos formales, la hiptesis se puede expresar en trminos de la siguiente funcin: Y = f (X1 X2 X3) Hiptesis nula El ndice acadmico, la organizacin del tiempo libre y la afinidad de la actividad laboral con los estudios no estn correlacionados con el xito acadmico de estudiantes de post grado de la UNMSM.
161
ELAS MEJA MEJA
Correlacin simple Como se ha sealado anteriormente, las variables independientes de esta investigacin se encuentran correlacionadas entre s. Esto ha sido demostrado luego de hallar los ndices de correlacin simple entre tales variables. Para ello se emple la frmula de correlacin producto momento de Spearman, para encontrar los coeficientes de correlacin entre: X1 X2 X1 X3 X2 X3 antes de hallar la correlacin entre: YX1 YX2 YX3 Covarianza Elevando al cuadrado cada uno de los coeficientes de correlacin simple se obtuvo la covarianza, es decir, los porcentajes de la varianza compartida entre las tres variables independientes y la dependiente. Los datos obtenidos son los siguientes:
X1 X2 X3
Y 0,16 0,03 0,08
X1 0,03 0,08
X2
0,11
Cuadro N 14
La presencia de correlacin entre las variables independientes significa que stas se traslapan entre s, no slo en el plano bidimensional, sino en mltiples dimensiones. Este fenmeno complica el anlisis de los datos y no se puede graficar en el plano bidimensional del papel. Sin embargo, en el Grfico N 9, se trata se representar los traslapamientos entre cada una de las variables y la zona sombreada viene a ser el sector de la varianza de Y de la que es responsable la presencia conjunta, concurrente y concomitante de las variables independientes.
162
Grfico N 10
La varianza en este caso, no es sinnimo de la medida de las diferencias entre puntuaciones o rango de las puntuaciones entre individuos o grupos, sino se entiende como la variabilidad de los valores de una variable dependiente que se debe o se explica por la presencia de otras variables, llamadas independientes. Si las variables independientes no estuviesen correlacionadas entre s, sera suficiente sumar los porcentajes de la varianza que explican, por separado, cada una de las variables independientes. De esta manera se afirmara que el 49% de la varianza de Y es explicada por X1 X2 y X3. Pero ste no es el caso. Prediccin El anlisis de regresin mltiple es un mtodo estadstico que permite interpretar el fenmeno descrito y conduce a la prediccin de los valores de la variable dependiente. La prediccin es mejor en la medida en que la correlacin entre las variables independientes entre s sea baja, como en el presente caso: correlacin entre X1 y X2 = 0,3; correlacin entre X1 y X3 = 0,8, y correlacin entre X2 y X3 = 0,11. Mediante programas de computadora, se resolvieron las siguientes ecuaciones del modelo estadstico de regresin mltiple para tres variables independientes y una dependiente. Y = a0 n + a1 X1 + a2 X2 + a3 X3 X1 Y = a0 X1 + a1 X12 + a2 X1 X2 + a3 X1X3
163
ELAS MEJA MEJA
X2 Y = a0 X2 + a1 X1 X2 + a2 X22 + a3 X2 X3 X3 Y = a0 X3 + a1 X1 X3 + a2 X2 X3 + a3 X32 Los valores calculados para resolver las ecuaciones fueron los siguientes: n X1 X2 X3 Y X 12 X 22 X 32 Y2 X1 X2 X1 X3 X2 X3 = 145 = 2023,57 = 1663 = 1900 = 2094,71 = 28393,28 = 19939 = 25184 = 30410,96 = 23266,34 = 36570,90 = 21959
a0 = constante a1 = coeficiente de regresin de X1 a2 = coeficiente de regresin de X2 a3 = coeficiente de regresin de X3 Resueltas las ecuaciones del modelo estadstico, se pudo resolver la siguiente ecuacin de prediccin: Y = a0 + X1a1 + X2a2 + X3a3 En donde a0 : Constante = 7,7844 a1 : Coeficiente de regresin de X1 = 0,3421 a2 : Coeficiente de regresin de X2 = 0,0282 a3 : Coeficiente de regresin de X3 = 0,1194 Conociendo el valor de la constante y de los coeficientes de regresin de las variables independientes, es posible predecir el valor de Y, es decir, la puntuacin que obtendra cualquier estudiante al trmino de sus estudios de post grado, siempre y cuando se tengan de l sus puntajes alcanzados en las variables X1, X2 y X3. As, si se seleccionara aleatoriamente a cualquier sujeto de los 145 de la muestra, por ejemplo al N 40, se podra predecir su xito acadmico utilizando la ecuacin de prediccin.
164
del sujeto 40 = 7,7844 + (13,87 x 0,3421) + (13 x 0,0282) + (14 x 0,1194) Y del sujeto 40 = 7,7844 + 4,74927 + 0,3666 + 1,6716 Y del sujeto 40 = 14,57 Y
Y del sujeto 40 = 14,19
y Y = 0,38 Discrepancia entre Y Otro caso: del sujeto 101 = 7,7844 + (15,03 x 0,3421) + (12 x 0,0282) + (14 x 0,1194) Y del sujeto 101 = 7,7844 + 5,141673 + 0,3384 + 1,6716 Y del sujeto 101 = 14,94 Y
Y del sujeto 101 = 14,50
y Y = 0,44 Discrepancia entre Y

Coeficiente de correlacin mltiple
) empleando el Si se obtuvieran todas las puntuaciones predichas ( Y procedimiento descrito, sera posible correlacionarlas con las puntuaciones reales (Y). Este coeficiente de correlacin no es el mismo que el normal, r, que se obtiene correlacionando dos series de puntuaciones reales, sino se denomina Coeficiente de Correlacin Mltiple y su smbolo es R y se obtiene correlacionando las puntuaciones reales de Y con las puntuaciones predichas de Y y expresa la magnitud de la relacin entre la mejor combinacin posible de todas las variables independientes con respecto a la variable dependiente. En el presente caso, el valor de R es:
R = 0,4427 Mediante procesos de computadora se calcularon los valores predichos de Y de todos los 145 sujetos de la muestra, por tanto, el valor de R se ha sido hallado luego de correlacionar la serie de puntuaciones predichas de Y con las puntuaciones reales de Y. Este es el dato ms importante de la investigacin, porque a partir de l se va a adoptar la decisin con respecto a la hiptesis nula. El coeficiente de regresin mltiple, R, elevado al cuadrado, indica la varianza y Y, es decir R2 es el porcentaje de la varianza de Y de la cual compartida entre Y es responsable la concurrencia de las tres variables independientes.
165
ELAS MEJA MEJA
En este caso, dicho valor es: R2 = 0,44272 = 0,1956 Redondeando sera = 0,20 Y en trminos porcentuales sera = 20% Que significa que las tres variables independientes: ndice acadmico, organizacin del tiempo libre y afinidad de la actividad laboral con los estudios, son responsables del 20% de la varianza de Y: xito acadmico en los estudios de post grado. Como es natural, otros factores, no estudiados en esta investigacin, seran los responsables del 80% de la varianza restante. Lo dicho se puede apreciar ms claramente en el siguiente grfico: Varianza de Y
Varianza de Y debida a X1, X2 y X3 20% Varianza de Y que no se debe a X1, X2 Ni a X3 Incluye la varianza de error.
80%
Grfico N 10 Grados de libertad En este estudio, como se ha trabajado con una muestra de 145 estudiantes y con cuatro variables, los grados de libertad se establecen del siguiente modo: K 4 = 145 4 = 141 L1=41=3 Prueba F Para el contraste de la hiptesis, luego de realizar el anlisis de regresin mltiple, se emple la Prueba F, al nivel de significacin de 0,05. Cuando se hace el anlisis de regresin mltiple, la frmula de la prueba F es la siguiente:
166
En donde: R2 = Coeficiente de regresin mltiple elevado al cuadrado. K = Nmero de variables independientes. N = Tamao de la muestra. Al hacer las operaciones se obtiene:
El valor encontrado, luego de reemplazar los trminos de la frmula es 11,4519, superior a 2,60, valor crtico para 141 grados de libertad y tres variables independientes, tal como puede verse en el Cuadro N 13, Distribucin de F, con 95% de confianza. En consecuencia se rechaza la hiptesis nula al nivel de 0,05 que sostiene: El ndice acadmico, la organizacin del tiempo libre y la afinidad de la actividad laboral con los estudios no estn correlacionados con el xito acadmico de estudiantes de post grado de la UNMSM. En cambio, se acepta la hiptesis alterna que sostiene: Existe un coeficiente de correlacin, estadsticamente significativo, al nivel de 0,05, entre las variables ndice acadmico, organizacin del tiempo libre y afinidad de la actividad laboral con los estudios, con respecto al xito acadmico de estudiantes de post grado de la Universidad Nacional Mayor de San Marcos.
9. PRUEBA t DE STUDENT
La Prueba t de Student, llamada tambin prueba de las diferencias de medias, es otra prueba muy usada para contrastar hiptesis. Cuando los investigadores adoptan estrategias de prueba de hiptesis como consecuencia de las cuales se obtienen dos promedios, en cada uno de los grupos, ya sean stos experimental o de control, lo que deben es determinar si la diferencia entre tales promedios hallados se debe a hechos fortuitos o si tal diferencia se ha producido como efecto de la influencia de la variable independiente que se est estudiando. En este caso, el investigador, con los datos que obtiene, realiza las operaciones respectivas. La limitacin de esta prueba es que no funciona con muestras grandes, slo con muestras pequeas. Algunos autores sostienen que el nmero de la muestra no debe pasar de 20.
167
ELAS MEJA MEJA
A continuacin se presenta el estudio realizado por Marco Sanabria Montaez, titulado: Influencia del Seminario y la Clase Magistral en el Rendimiento Acadmico de alumnos de la E. A. P. de Economa de la U. N. M. S. M. Problema: Existen diferencias significativas en el xito acadmico alcanzado por alumnos de la asignatura de Economa General I de la Escuela Acadmico Profesional de Economa de la Universidad Nacional Mayor de San Marcos que realizaron sus estudios con el mtodo de Seminario, con respecto al grupo de alumnos que cursaron con el mtodo de la Clase Magistral? Definicin de trminos bsicos Clase Magistral: Es un tiempo de enseanza ocupado entera o principalmente por la exposicin continua de un conferenciante. Los estudiantes pueden tener la oportunidad de preguntar o participar en una pequea discusin pero, por lo general, no hacen otra cosa que escuchar y tomar nota. Seminario: Es una tcnica didctica en el que se renen un nmero pequeo de miembros que estudian e investigan sistemticamente un tema con el objeto de lograr el conocimiento completo y especfico de una materia. ndice Acadmico: Es el resultado cuantitativo en una escala de valores, que determina el nivel alcanzado en el rendimiento acadmico por un estudiante. Hiptesis general El xito acadmico de los alumnos que desarrollan la asignatura de Economa General I con el mtodo de Seminario, es significativamente diferente al ndice Acadmico de los alumnos que estudian la asignatura de Economa General I con el mtodo de Clase Magistral en la E. A. P. de Economa de la UNMSM Hiptesis especfica 1 El xito acadmico de los alumnos de la E. A. P. de Economa en la UNMSM que desarrollan la asignatura de economa se incrementa significativamente con la aplicacin del mtodo didctico de Seminario. Hiptesis especfica 2 El xito acadmico de los alumnos de la E. A. P. de Economa en la UNMSM que desarrollan la asignatura de economa, no se incrementa significativamente con la aplicacin del mtodo didctico de Clase Magistral.
168
Variables e indicadores Las variables consideradas para la presente investigacin son las siguientes: Variable independiente: Mtodo didctico Variacin: a) Mtodo didctico de Clase Magistral (Z), b) Mtodo didctico de Seminario (X) Variable dependiente: xito Acadmico (O) Variacin: a) xito acadmico alto. b) xito acadmico bajo. Operacionalizacin de la variable ndice acadmico xito acadmico Alto: Cuando el promedio obtenido por la muestra es 12,31 ms. xito acadmico Bajo: Cuando el promedio de la muestra es menor que 12,31. Estos valores se han calculado mediante el mtodo estadstico de estimacin puntual de la diferencia de dos medias, en donde el estimador es . La desviacin estndar del estimador puntual de la diferencia de medias se obtiene mediante la aplicacin de la siguiente frmula:
Para el clculo de la Cota de Error se ha utilizado la frmula:
Con las frmulas mencionadas se han realizado las operaciones correspondientes y se tiene: = 12,8 8,62 = 4,18 = 0,7992
Cota de error = 2 x 0,7992 = 1,5981

169
ELAS MEJA MEJA
El promedio obtenido de ambas muestras es: 10,71, por la operacin de la semisuma de los promedios de las muestras del Seminario y Clase Magistral. A este promedio se adiciona la cota de error, tendremos 10,71 + 1,5981 entonces se obtiene el valor crtico 12,3081 que es el lmite de los xitos acadmicos. Estrategia para la prueba de hiptesis La presente es una investigacin con medicin previa y posterior con grupo de control. Las unidades de anlisis, tanto en el grupo experimental como en el grupo de control, se encuentran asignadas en grupos ya establecidos. El esquema de diseo es cuasi experimental, y se expresa de la siguiente manera: Grupo que desarrolla Seminario: Grupo que desarrolla Clase Magistral: En donde: X: Mtodo de Seminario. Z: Mtodo de Clase Magistral. O1: Medicin del xito Acadmico del grupo que desarrolla el Seminario antes del experimento. O 2: Medicin del xito Acadmico del grupo que desarrolla el Seminario despus del experimento. O3: Medicin del xito Acadmico del grupo de que desarrolla la Clase Magistral antes del experimento. O4: Medicin del xito Acadmico del grupo que desarrolla la Clase Magistral despus del experimento. Anlisis del Pre-Test El empleo del pre test ha tenido como finalidad determinar el nivel de conocimientos con el que inician el experimento el grupo al que se aplica el seminario (O1), y el grupo al que se aplica la Clase Magistral (O3). Para el del clculo del promedio se utiliz la siguiente frmula: O1 O3 X Z O2 O4
O=
0 f
i =1
170
Para el clculo de la desviacin estndar se utiliz la formula:
S0 =
1
f1 0
2 1i
( f o )
1 1i
n 1
Hechas las operaciones, los datos hallados son los siguientes:

Pre Test Estadgrafos Promedio Desviacin Estndar Total Participantes O1 3,800 1,1464 15,000 O3 4,4100 1,1657 37,0000
Cuadro N 15
Estimador puntual de la diferencia de medias Permite identificar un punto crtico al que se le conoce con el nombre de Cota de Error. La decisin se toma en el sentido de que si la Cota de Error es mayor que la diferencia de medias no hay diferencia significativa en los promedios analizados y viceversa. Clculo del Estimador = 0,61
Desviacin estndar de la diferencia de medias obtenidas es
= 0,352628
La cota de error = 0,705
La cota de error: 0,705 es mayor que la diferencia de las medias: 0,61, por lo tanto los promedios obtenidos por los alumnos en el pre test no difieren significativamente.
171
ELAS MEJA MEJA
Anlisis Post Test

Pre Test Estadgrafos Promedio Desviacin Estndar Total Participantes O1 3,800 1,1464 15,000 O3 4,4100 1,1657 37,0000
Cuadro N 16 Contraste de Hiptesis Mason, Lind y Marchal mencionan que existe un procedimiento de cinco pasos que sistematiza la prueba de hiptesis. Al llegar al paso 5, se tiene ya la capacidad de tomar la decisin de rechazar o no la hiptesis1 . Atendiendo este planteamiento que a criterio del autor de esta investigacin es el ms coherente, se desarroll el proceso. Paso 1: Plantear la Hiptesis Nula (HO) y la Hiptesis Alterna (H1):
Hiptesis General
Hiptesis Nula (H0) El xito Acadmico de los alumnos que desarrollan la asignatura de Economa General I con el mtodo de Seminario (O2), no es significativamente diferente al xito Acadmico de los alumnos que estudian la asignatura de Economa General I con el mtodo de Clase Magistral (O4) en la E. A. P. de Economa de la UNMSM. Lo dicho, formalmente se expresa mediante la siguiente ecuacin: H0: O2 = O4 Hiptesis Alterna (H1) El xito Acadmico de los alumnos que desarrollan la asignatura de Economa General I con el mtodo de Seminario (O2), es significativamente diferente del xito Acadmico de los alumnos que estudian la asignatura de Economa General I con el mtodo de Clase Magistral (O4) en la E. A. P. de Economa de la UNMSM. Lo dicho, formalmente se expresa mediante la siguiente inecuacin: H1: O2 > O4
172
Paso 2: Seleccionar el nivel de significacin: = 0.05 Paso 3: Escoger el valor estadstico de prueba:
Z=
O2 O 4 S2 S2 2 + 4 n2 n4
Paso 4: Formular la regla de decisin: Para la Hiptesis General: Rechazar la Hiptesis nula si: Paso 5: Adoptar una decisin:
Post test Estadgrafos Promedio Desviacin Estndar Total Participantes O2 12,8000 2,1112 15,0000 O4 8,620 3,554 37,00
Z > 1,96
Cuadro N 17
Z=
12.8 8.62 4.4571 12.6306 + 15 37
Z = 5,23 (Z calculada) Se rechaza la hiptesis nula y se acepta la hiptesis alterna que es la siguiente: El xito Acadmico de los alumnos que desarrollan la asignatura de Economa General I con el mtodo de Seminario (O2), es significativamente diferente a xito Acadmico de los alumnos que estudian la asignatura de Economa General I con el mtodo de Clase Magistral (O4) en la E. A. P. de Economa de la UNMSM.
173
ELAS MEJA MEJA
Se rechaza la hiptesis nula de la Hiptesis especfica y se acepta la hiptesis: El xito acadmico de los alumnos de la E. A. P. de Economa en la UNMSM que desarrollan la asignatura de economa se incrementa significativamente con la aplicacin del mtodo didctico de Seminario.
Conclusiones
En la presente investigacin se ha llegado a las siguientes conclusiones: 1. Existe evidencia emprica que el xito acadmico que se obtiene aplicando el mtodo didctico de Seminario difiere significativamente al xito acadmico obtenido con la aplicacin del mtodo didctico de Clase Magistral. 2. Los estudiantes a los que se les aplic el mtodo didctico de seminario alcanzaron un xito acadmico alto, mientras que los estudiantes a los que se les aplic el mtodo didctico de Clase Magistral alcanzaron un xito acadmico bajo. DISTRIBUCIN DE
gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 oo 0 ,2 0 3 ,0 8 1 ,8 9 1 ,6 4 1 ,5 3 1 ,4 8 1 ,4 4 1 ,4 2 1 ,4 0 1 ,3 8 1 ,3 7 1 ,3 6 1 ,3 6 1 ,3 5 1 ,3 5 1 ,3 4 1 ,3 4 1 ,3 3 1 ,3 3 1 ,3 3 1 ,3 3 1 ,3 2 1 ,3 2 1 ,2 8 0 ,1 0 6 ,7 1 2 ,9 2 2 ,3 5 2 ,1 3 2 ,0 2 1 ,9 4 1 ,9 0 1 ,8 6 1 ,8 3 1 ,8 1 1 ,8 0 1 ,7 8 1 ,7 7 1 ,7 6 1 ,7 5 1 ,7 5 1 ,7 4 1 ,7 3 1 ,7 3 1 ,7 3 1 ,7 2 1 ,7 2 1 ,6 4 0 ,0 5 1 2 ,7 0 4 ,3 0 3 ,1 8 2 ,7 8 2 ,5 7 2 ,4 5 2 ,3 7 2 ,3 1 2 ,2 6 2 ,2 3 2 ,2 0 2 ,1 8 2 ,1 6 2 ,1 5 2 ,1 3 2 ,1 2 2 ,1 1 2 ,1 0 2 ,0 9 2 ,0 9 2 ,0 8 2 ,0 7 1 ,9 6 0 ,0 2 3 1 ,8 0 6 ,9 7 4 ,5 4 3 ,7 5 3 ,3 7 3 ,1 4 3 ,0 0 2 ,9 0 2 ,8 2 2 ,7 6 2 ,7 2 2 ,6 8 2 ,6 5 2 ,6 2 2 ,6 0 2 ,5 8 2 ,5 7 2 ,5 5 2 ,5 4 2 ,5 3 2 ,5 2 2 ,5 1 2 ,3 3
t
0 ,0 1 6 3 ,6 0 9 ,9 3 5 ,8 4 4 ,6 0 4 ,0 3 3 ,7 1 3 ,5 0 3 ,3 6 3 ,2 5 3 ,1 7 3 ,1 1 3 ,0 6 3 ,0 1 2 ,9 8 2 ,9 5 2 ,9 2 2 ,9 0 2 ,8 8 2 ,8 6 2 ,8 5 2 ,8 3 2 ,8 2 2 ,5 8 0 ,0 0 2 3 1 8 ,3 0 2 2 ,3 0 1 0 ,2 0 7 ,1 7 5 ,8 9 5 ,2 1 4 ,7 9 4 ,5 0 4 ,3 0 4 ,1 4 4 ,0 3 3 ,9 3 3 ,8 5 3 ,7 9 3 ,7 3 3 ,6 9 3 ,6 5 3 ,6 1 3 ,5 8 3 ,5 5 3 ,5 3 3 ,5 1 3 ,0 9
Cuadro N 18
174
LECTURA COMPLEMENTARIA
PRUEBA DE HIPTESIS Y ERROR ESTNDAR

Fred Kerlinger*
El error estndar, como estimacin de las fluctuaciones del azar es la medida en contra de la cual los resultados de los experimentos son probados. Hay alguna diferencia entre las medias de dos grupos experimentales? Si esto sucede, Es la diferencia una diferencia real, o es slo una consecuencia de las muchas diferencias relativamente pequeas que pudieron haber surgido por el azar? Para contestar estas preguntas, se calcula el error estndar de las diferencias entre las medias y la diferencia obtenida se compara con el error estndar. Si es suficientemente ms grande que el error estndar, se dice que es una diferencia significativa. Un razonamiento similar se puede aplicar a cualquier estadstico. Por lo tanto, hay muchos errores estndar: de coeficientes de correlacin, de las diferencias entre las medias, de las medias, de las medianas, de las proporciones, etctera. El propsito en este captulo es examinar la idea general del error estndar y ver cmo se prueban las hiptesis usando el error estndar.
EJEMPLO: DIFERENCIAS ENTRE MEDIAS

Un problema particularmente difcil en la psicologa contempornea se centra en contestar la pregunta de si la conducta es controlada por factores situacionales o ambientales, o por disposiciones del individuo. McGee y Snyder, usando una presunta diferencia entre las personas que le ponan sal a sus alimentos antes de probarlos y aquellas que probaban sus alimentos antes de agregarles sal, elaboraron la hiptesis segn la cual las personas que interpretan su conducta de forma ordenada, le agregaban sal a sus alimentos antes de probarlos, mientras que aquellas personas que interpretaban su conducta en forma situacional probaban sus alimentos antes de agregarles sal.
Tomado de: KERLINGER, Fred N.: Investigacin del comportamiento. Mxico, D.F. McGraw-Hill, 1988. pp. 210-226
177
ELAS MEJA MEJA
Adems, sealaron que las primeras personas adjudicaran ms rasgos a s mismos que las otras personas. Encontraron que los primeros, los que le agregaban sal, se atribuan una media de 14,87 rasgos a s mismos mientras que el segundo grupo, los que prueban antes los alimentos, se atribuan una media de 6,90 rasgos a s mismos. La direccin de la diferencia fue como haba sido esperada por los autores. Es el tamao de la diferencia entre las medias, 7,97, lo suficientemente grande para apoyar el reclamo de los autores de que su hiptesis fue apoyada? Una prueba de significancia estadstica de esta diferencia muestra que sta fue altamente significativa. La idea del presente ejemplo en este contexto es que la diferencia entre las medias fue evaluada para determinar la significancia estadstica, con un error estndar. El error estndar en este caso fue el error estndar de las diferencias entre las dos medias. Se observ que esta diferencia era significativa. Esto quiere decir que las personas que percibieron la conducta como influida por los rasgos individuales, tendieron a agregarle sal a sus alimentos antes de probarlos, mientras que aqullas cuya percepcin est ms orientada de manera ambiental, probaron sus alimentos antes de agregarles sal. (Esta afirmacin es una generalizacin de la original.) Ahora, examine un ejemplo en el cual la diferencia entre las medias no fue significativa. Gates y Taylor, en un estudio inicial muy conocido sobre la transmisin de entrenamiento, organizaron dos grupos de 16 alumnos cada uno. Al grupo experimental se le proporcion una prctica en memoria de dgitos; al control no se le proporcion dicho entrenamiento. La mejora del promedio del grupo experimental inmediatamente despus del periodo de entrenamiento, fue de 2,00; la ganancia media del grupo control fue de ,67, una diferencia media de 1,33. Cuatro a cinco meses ms tarde, los nios de ambos grupos fueron evaluados de nuevo. La media de las calificaciones del grupo experimental fue de 4,71; la media del grupo control fue sorprendentemente de 4,77. El incremento de las medias sobre las pruebas iniciales fue de ,35 y ,36. Las pruebas estadsticas son innecesarias con datos como estos. DIFERENCIAS ABSOLUTAS Y RELATIVAS Como las diferencias entre los estadsticos, especialmente entre las medias, son evaluadas y reportadas en gran parte en la literatura, se deben analizar con detalle los tamaos absoluto y relativo de tales estadsticos. Aunque en la discusin se usan como ejemplos diferencias entre medias, las mismas ideas se aplican a diferencias entre proporciones, coeficientes de correlacin, etctera. En un estudio hecho por Goldberg, Gottesdiner y Abramson, a las mujeres que fueron consideradas como simpatizantes del movimiento de liberacin femenina se
178
les calific como menos atractivas que las consideradas como no simpatizantes del movimiento. Las no simpatizantes tuvieron una media de 2,86 y las simpatizantes 2,75, una diferencia de ,11, la cual fue estadsticamente significativa. Es significativa una diferencia tan pequea? Comprese esta pequea diferencia con aqulla de medias entre los grupos experimental y control obtenida por Mann y Janis en su estudio de los efectos a largo plazo de la simulacin sobre el fumar: 13,50 y 5,20. (stas son medias de los decrementos en los nmeros de cigarrillos fumados cada da; la diferencia es estadsticamente significativa). En realidad aqu hay dos problemas: uno de ellos es del tamao absoluto y relativo de la diferencia y otro de la significancia prctica o real en contraste con la significancia estadstica. La que en apariencia es una diferencia muy pequea puede, bajo un examen minucioso, no serlo tanto. En el estudio de Goldberg y cols., para estar seguros, la diferencia de ,11 es a lo mejor trivial, aunque estadsticamente significativa. El ,11 se deriv de una escala de atraccin de cinco puntos y es, por lo tanto, en realidad pequea. Ahora tmese un ejemplo completamente diferente, de un estudio de Miller y Dicara sobre el condicionamiento instrumental de la secrecin urinaria. Las medias de un grupo de ratas antes y despus del entrenamiento en la secrecin de la orina fueron ,017 y ,028 y la diferencia fue muy estadsticamente significativa. Sin embargo la diferencia fue de slo ,011. No es esta diferencia tan pequea como para prestarle atencin? Sin embargo, la naturaleza de las medidas tiene que tomarse en cuenta. Las pequeas medias de ,017 y ,028 se obtuvieron de medidas de secrecin de las ratas. Cuando se toma en cuenta el tamao de la vejiga de las ratas y que la diferencia de medias de ,011 fue producida a travs del condicionamiento instrumental (recompensa por secrecin urinaria), el significado de la diferencia es dramtica: es inclusive muy grande! No se debera ser demasiado entusiasta por las diferencias de medias como ,20, ,15, ,08, etc., sino que se ha de ser inteligentes respecto a ellas. Supngase que una pequea diferencia se informa como estadsticamente significativa y uno piensa que es algo ridcula. Sin embargo, supngase que dicha diferencia fue la de medias entre los pesos de la corteza cerebral de un grupo de ratas criadas en medios ricos y en medios pobres en los primeros das de vida. El obtener cualquier diferencia en el peso del cerebro debido al tipo de ambiente es un logro extraordinario y, desde luego, un descubrimiento cientfico importante. COEFICIENTES DE CORRELACIN Los coeficientes de correlacin abundan en las publicaciones cientficas. Por lo tanto, se deben plantear preguntas acerca de la significancia de los coeficientes y
179
ELAS MEJA MEJA
de la realidad de las relaciones que estos expresan. Por ejemplo, para que un coeficiente de correlacin calculado entre 30 pares de medidas sea estadsticamente significativo, tiene que andar alrededor de ,31 al nivel de significancia de ,05 y de ,42 al nivel de ,01. Con 100 pares de medidas el problema es menos agudo (la ley de los grandes nmeros entra en juego). En este caso, para satisfacer el nivel ,05, es suficiente una r de ,16; para satisfacer el nivel ,01, basta una r de ,23. Si las r son menores a estos valores se considera que son no significativas. Si se seleccionan, por ejemplo, 30 pares de nmeros de una tabla de nmeros aleatorios y se calcula la correlacin entre ellos, en la teora debera de estar cerca del cero. Resulta claro que debera de haber relaciones cercanas al cero entre los conjuntos de los nmeros aleatorios, pero ocasionalmente los conjuntos de pares pueden producir r estadsticamente significativas y razonablemente altas debidas al azar. De cualquier forma, los coeficientes de correlacin, as como las medias y las diferencias, tienen que ser ponderados para valorar la significancia estadstica mediante su comparacin con los errores estndares. Por fortuna, esto es fcil de hacer, ya que las r para cada nivel de significancia y para tamaos diferentes de la muestra se proporcionan en tablas en la mayor parte de los textos sobre estadstica. Por lo tanto, con las r no es necesario calcular y usar el error estndar de unir. Sin embargo, el razonamiento que subyace a las tablas ha de ser entendido. De los miles de coeficientes de correlacin publicados en la literatura sobre investigacin, una gran parte es de baja magnitud. Qu tan bajo es bajo? En qu punto es un coeficiente de correlacin lo suficientemente bajo para no tratarlo con seriedad? Usualmente, las r menores a ,10 no se deben tomar muy en serio: una r de ,10 significa que slo un 1% (,10) de la varianza de y es compartida con x! Si una r de ,30, por otro lado, es estadsticamente significativa, puede ser importante porque apunta hacia una relacin importante. Las entre ,20 y ,30 hacen el problema un poco ms difcil. (Recurdese que con N grandes, las r entre ,20 y ,30 son estadsticamente significativas.) Para estar seguros, una r de, por ejemplo, ,20 quiere decir que dos variables comparten slo el 4% de sus varianzas, pero una r de 26 comparten un 7% de la varianza o incluso una de ,20 puede ser importante porque puede proporcionar un indicio muy valioso para una teora e investigacin subsecuente. El problema es complejo. En la investigacin bsica, las correlaciones bajas (desde luego que stas deben ser estadsticamente significativas) pueden enriquecer la teora y la investigacin. En la investigacin aplicada, donde las predicciones son importantes, han aumentado los juicios de valor acerca de las correlaciones bajas y las cantidades triviales de la varianza compartida. Sin embargo, en la investigacin bsica el panorama es ms complicado. Una conclusin es razonablemente justa: los coeficientes de correlacin, como otros estadsticos, deben ser evaluados para determinar su significancia estadstica.
180
PRUEBA DE HIPTESIS: HIPTESIS SUSTANTIVA Y NULA El propsito principal en la investigacin de la estadstica inferencial es probar las hiptesis de investigacin a travs de la evaluacin de las hiptesis estadsticas. Hablando en trminos amplios, el cientfico usa dos tipos de hiptesis: sustantivas y estadsticas. Una hiptesis sustantiva es el tipo usual de hiptesis que se coment en el captulo 2, en la cual es expresada, una afirmacin de la relacin entre dos o ms variables, por ejemplo, entre mayor es la cohesin de un grupo, mayor es su influencia sobre sus miembros es una hiptesis sustantiva. La teora de un investigador determina que esta variable est relacionada con la otra. La afirmacin de esta relacin es una hiptesis sustantiva. Estrictamente hablando, una hiptesis sustantiva no es susceptible de ser probada o evaluada. Tiene, primero, que ser traducida a trminos operacionales. Una forma muy til de probarla es mediante una hiptesis estadstica, la cual es una afirmacin, en trminos estadsticos, de las relaciones estadsticas deducidas de las relaciones planteadas en la hiptesis sustantiva. Este es un planteamiento demasiado vago y necesita ser explicado. Una hiptesis estadstica expresa un aspecto de la hiptesis sustantiva original en trminos estadsticos y cuantitativos. MA > MB, la media de A es mayor que la media de B; r > + ,20, el coeficiente de correlacin es mayor que ,20; MA > MB > MC, al nivel de ,01; x2 es significativa al nivel de ,05; etctera. Una hiptesis estadstica es una prediccin de los resultados de los procedimientos estadsticos usados para analizar los datos cuantitativos de un problema de investigacin. Sin embargo, las hiptesis estadsticas deben ser comparadas contra algo. No es posible evaluar simplemente una hiptesis estadstica como est planteada. Esto es, no se evala directamente la proposicin estadstica de MA > MB contra s misma. Se evala comparndola con una proposicin alternativa. Naturalmente, puede haber varias alternativas de MA > MB. La alternativa usualmente seleccionada es la hiptesis nula, la cual fue inventada por Sir Ronald Fisher. La hiptesis nula es una proposicin estadstica en que se plantea, principalmente, que no hay relacin entre las variables (del problema). La hiptesis nula dice, ests en un error, no hay relacin; deschame si puedes. Esto lo dice en trminos estadsticos como MA = MB o MA MB = 0; rxy = 0; la x2 no es significativa; la t no es significativa; etctera. Fisher dice, puede decirse que cada experimento es slo para darle la oportunidad a los hechos de rechazar la hiptesis nula. Dicho eso en una forma ms adecuada, qu es lo que quiere decir? Supngase que se plante una hiptesis acerca de los efectos de algunos mtodos y se dice que el mtodo A es superior al
181
ELAS MEJA MEJA
mtodo B. Si uno resuelve en una forma satisfactoria los problemas de definir lo que se quiere decir con superior, de disear un experimento, etc., ahora debe especificar una hiptesis estadstica. En este caso, se podra decir MA > MB (la media del mtodo A es, o ser mayor que la media del mtodo B en tal y tal medida de criterio). Supngase que despus del experimento las dos medias son 68 y 61, respectivamente. Esto parecera ser que la hiptesis sustantiva es apoyada ya que 68 > 61, o MA es mayor que MB . Sin embargo, como ya se sabe, sto no es suficiente ya que esta diferencia puede ser una de las muchas diferencias posibles debidas al azar. De hecho, se dise una hiptesis que puede ser llamada la hiptesis del azar: MA = MB, o MA MB = O. Estas son hiptesis nulas. Lo que se hace, entonces, es escribir hiptesis. Primero se escriben hiptesis estadsticas que reflejen el significado operacionalexperimental de la hiptesis sustantiva. Despus se escribe la hiptesis nula en contra de la cual se compara el primer tipo de hiptesis. Aqu se presentan dos tipos de hiptesis adecuadamente etiquetadas: H1: MA > MB H 0; MA = M B H1 significa Hiptesis 1. Hay a menudo ms de una de esas hiptesis. Ellas son etiquetadas como H1. H2, H3, etctera. Ho significa Hiptesis nula. Ntese que en este caso la hiptesis nula podra haber sido escrita como: H0: MA MB = 0 Esta forma muestra de donde la hiptesis nula obtuvo su nombre: la diferencia entre M A y M B es igual a cero, pero no es muy manejable en esta forma especialmente cuando se prueban tres o ms medias u otros estadsticos. MA = MB es general y desde luego significa lo mismo que MA MB = 0 y MB MA = O. Ntese que se puede escribir fcilmente MA = MB = MC = ...... = MN. NATURALEZA GENERAL DE UN ERROR ESTNDAR Si ste fuera el mejor de todos los posibles mundos de investigacin, no habra error aleatorio. Y si no hubiera error aleatorio, no habra necesidad de pruebas de significancia estadstica. De hecho, la palabra significancia carecera de sentido. Cualquier tipo de diferencia sera una diferencia real. Lamentablemente este nunca es el caso. Siempre existen errores al azar (y errores sesgados, tambin), y en la investigacin del comportamiento a menudo contribuyen sustancialmente a la varianza total. Los errores estndar son mediciones de este error y se utilizan, como ya se ha mencionado varias veces, a manera de una especie de patrn contra el cual se contrasta la varianza experimental o variable.
182
El error estndar es la desviacin estndar de la distribucin muestral de cualquier medicin dada la media o el coeficiente de correlacin, por ejemplo. En la mayor parte de los casos no es posible conocer los valores del universo o poblacin (parmetros); deben ser estimados a partir de mediciones muestrales, usualmente de muestras sencillas. Supngase que se extrae una muestra aleatoria de 100 nios del octavo grado de un sistema escolarizado determinado. Es difcil o imposible, por decir algo, medir todo el universo de los nios de octavo grado. Se calculan la media y la desviacin estndar a partir de un examen aplicado a los nios y se encuentra que estos estadsticos son M = 110 y SD = 10. Una pregunta importante que debe plantearse es Qu tan exacta es esta media? O, si fuera a extraerse un gran nmero de muestras aleatorias de 100 alumnos de octavo grado con base en esta misma poblacin, las medias de estas muestras sern 110 alrededor de 110? Y, si caen alrededor de 110, con qu aproximacin? Lo que se hace, en efecto, es establecer una distribucin hiptetica de medias de las muestras, todas calculadas a partir de muestras de 100 alumnos, cada una de las cuales se ha extrado de la poblacin original de alumnos del octavo grado. Si pudiera calcularse la media de esta poblacin de medias, o si se conociera cul es, todo sera ms sencillo. Pero no se conoce este valor, y no es posible conocerlo ya que son muchas las posibilidades de extraer muestras diferentes. Lo ms adecuado es estimarla con el valor muestral, o media muestral. Se dice simplemente, en este caso, sea la media muestral igual a la media de las medias de la poblacin y esprese estar en lo cierto. Entonces debe probarse la ecuacin. Se lleva a cabo esto con el error estndar. Se aplica una argumentacin anloga a la desviacin estndar de toda la poblacin (de los puntajes originales). No se conoce y probablemente nunca pueda conocerse. Pero puede estimarse con la desviacin estndar calculada a partir de la muestra. Nuevamente se dice, en efecto, sea la desviacin estndar de la muestra igual a la desviacin estndar de la poblacin. Se sabe que probablemente no tienen el mismo valor, pero tambin se sabe, si el muestreo ha sido aleatorio, que probablemente no difieran mucho. En el captulo 11 se utiliz la desviacin estndar de la muestra como un sustituto de la desviacin estndar de la poblacin, en la frmula para el error estndar de la media:
A esto tambin se le denomina error de muestreo. As como la desviacin estndar es una medida de la dispersin de los puntajes originales, el error estndar de la media es una medida de la dispersin de la distribucin de las medias de las
183
ELAS MEJA MEJA
muestras. No es la desviacin estndar de la poblacin de puntajes individuales si, por ejemplo, pudiera probarse cada miembro de la poblacin y calcular la media y la desviacin estndar de esta poblacin.
UNA DEMOSTRACIN POR EL MTODO DE MONTECARLO Para tener material con el que trabajar, ahora se recurre a la computadora y a lo que se denomina mtodos de Montecarlo. Los mtodos de Montecarlo son mtodos de simulacin manejados por computadora, diseados para obtener soluciones a problemas matemticos, estadsticos, numricos e incluso verbales utilizando procedimientos aleatorios y muestras de nmeros aleatorios. Usualmente asociados con problemas matemticos cuyas soluciones son intratables, los mtodos de Montecarlo se han extendido a la comprobacin de caractersticas estadsticas de muestras de poblaciones grandes. Por ejemplo, las consecuencias de violar las suposiciones detrs de las pruebas estadsticas de significancia pueden estudiarse efectivamente mediante la simulacin de distribuciones estadsticas con nmeros aleatorios y la introduccin de violaciones a las suposiciones en el procedimiento para estudiar las consecuencias. En las ciencias del comportamiento, los procedimientos de Montecarlo son usualmente estudios empricos de modelos estadsticos y de otros tipos que utilizan los nmeros aleatorios generados por la computadora para ayudar a simular los procesos aleatorios necesarios para estudiar los modelos. En cualquier caso, ahora se utiliza una forma elemental de Montecarlo para probar un teorema bastante importante de estadstica y para investigar la variabilidad de medias y la utilizacin del error estndar de la media. Tambin se desea establecer una base para la comprensin de la computadora al estudiar procesos aleatorios. Procedimiento Se escribi un programa de computadora para generar 4,000 nmeros aleatorios uniformemente distribuidos entre 0 y 100 (de tal forma que cada nmero tiene la misma probabilidad de ser extrado en 40 conjuntos de 100 nmeros cada uno, as como para calcular varios estadsticos con los nmeros. Considrese este conjunto de 4,000 nmeros como la poblacin, o U. La media de U es 50,33 (por medio de un clculo real de computadora), y la desviacin estndar es 29,17. Se desea calcular esta media a partir de muestras extradas al azar de U. Por supuesto, en una situacin real usualmente no se conoce la media de la poblacin. Una de las virtudes de los procedimientos de Montecarlo es que puede conocerse lo que usualmente se desconoce.
184
Cinco de los 40 conjuntos de 100 nmeros fueron extrados al azar. (Los conjuntos extrados fueron 5, 7, 8, 16 y 36.Se calcularon las medias y las desviaciones estndar de los cinco conjuntos. Asimismo, se calcularon los cinco errores estndar de la media. En el cuadro 1 se muestran estos estadsticos. Se quiere proporcionar una nocin intuitiva acerca de lo que es el error estndar de la media y posteriormente se quiere mostrar cmo es utilizado.
MEDIAS, DESVIACIONES ESTNDAR Y ERRORES ESTNDAR DE LA MEDIA, CINCO MUESTRAS DE 100 NMEROS ALEATORIOS (DE 0 A 100)A
Muestras 1 M: SD: SE:
A
2 49.64 27.91 2.79
3 51.37 29.83 2.98
4 49.02 26.72 2.67
5 55.51 29.23 2.92
53.21 29.62 2.96
Estadsticos de la poblacin: M = 50,33; SD =29,17; N = 4,000 Figura 1
Primero, se calcula la desviacin estndar de esta muestra de medias. Si simplemente se trata a las cinco medias como puntajes ordinarios y se calcula la media y la desviacin estndar, se obtiene: M1 = 51,75; SD = 2,38. La media de los 4,000 puntajes es 50,33. Cada una de las cinco medias es una estimacin muestral de esta media de la poblacin. Obsrvese que tres de ellas, 49,64, 51,37 y 49,02, se aproximan bastante a la media de la poblacin, y que dos de ellas, 53,21 y 55,51 difieren bastante de la media de la poblacin. As pues, parece que tres de las muestras proporcionan buenos estimadores de la media de la poblacin y que dos no lo hacen, o si? La desviacin estndar de 2,38 es semejante al error estndar de la media. (No es, por supuesto, el error estndar de la media, ya que se ha calculado solamente a partir de cinco medias.) Supngase que solamente se ha extrado una muestra (la primera, con M = 53,21 y SD = 29,62), lo que es la situacin usual en la investigacin, y que se calcul el error estndar de la media:
185
ELAS MEJA MEJA
Este valor es una estimacin de la desviacin estndar de las medias de la poblacin de muchas muestras de 100 casos, cada una de las cuales se ha extrado al azar de la poblacin. La poblacin tiene 40 grupos y por ello 40 medias. (Naturalmente, stas no son muchas medias.) La desviacin estndar de estas medias es realmente 3,10. El SEM calculado con la primera muestra, entonces, se aproxima al valor de esta poblacin: 2,96 como una estimacin de 3,10. En el cuadro 1 se muestran los cinco errores estndar de la media (tercer rengln). Fluctan muy poco, de 2,67 a 2,98, aun cuando las medias de los conjuntos de 100 puntajes varan considerablemente. La desviacin estndar de 2,38 calculada a partir de las cinco medias es solamente una estimacin justa de la desviacin estndar de la poblacin de medias. An as, es una estimacin. La cuestin interesante e importante es que el error estndar de la media, que es una estimacin terica, calculado a partir de los datos de cualquiera de los cinco grupos, es una estimacin exacta de la variabilidad de las medias de muestras de la poblacin. Para reforzar estas ideas, ahora se considerar otra demostracin de Montecarlo de mucha mayor magnitud. El programa de computadora utilizado para producir los 4,000 nmeros aleatorios del ejemplo discutidos anteriormente fue usado para producir 15 conjuntos ms de 4,000 nmeros aleatorios cada uno, uniformemente distribuidos entre 0 y 100. Esto es, se gener un total de 80,000 nmeros aleatorios en 20 conjuntos de 4 000 cada uno. La media terica, de nueva cuenta, de los nmeros entre 0 y 100 es 50. Considrese cada uno de los 20 conjuntos como una muestra de 4,000 nmeros. En el cuadro 2 se muestran las medias de los 20 conjuntos.
MEDIAS DE 20 CONJUNTOS DE 4,000 NMEROS ALEATORIOS GENERADOS POR COMPUTADORA (DE 0 A 100)a
50,3322 50,1170 49,8200 49,8227 49,5875
a
49,9447 49,5960 49,3175 49,9022 50,6180
50,1615 51,0585 49,5822 49,7505 50,0990
50,0995 51,1450 50,6440 49,8437 49,3605
Media de las Medias = 50,0401; desviacin estndar de las medias = 4,956; error estndar de la media, primera muestra = ,4611. Figura 2
Las 20 medias se acumulan muy estrechamente alrededor de 50: la ms baja es 49,3175, la ms alta es 51,1450 y la mayor parte de ellas se aproximan a 50. La media de las veinte medias es 50,0401, claramente muy prxima a la esperanza terica de 50. La desviacin estndar de las veinte medias es ,4956. La desviacin estndar de la primera muestra de 4,000 casos (ver la nota a, al pie del cuadro 1) es
186
29,1653. Si se utiliza esta desviacin estndar para calcular el error estndar de la media, se obtiene: SEM = 29,1653 4000 =,4611. Obsrvese que esta estimacin del error estndar de la media se aproxima a la desviacin estndar calculada de las 20 medias. No se comete error al utilizar esto para evaluar la variabilidad de las medias de muestras de 4,000 nmeros aleatorios. Es claro que las medias de muestras grandes son estadsticos altamente estables y los errores estndar son buenas estimaciones de su variabilidad. Generalizaciones Ahora pueden hacerse tres o cuatro generalizaciones de gran utilidad en la investigacin. Una, las medias de las muestras son estables en el sentido de que son mucho menos variables que las mediciones a partir de las cuales son calculadas. Esto es, por supuesto, verdad por definicin. Las varianzas, desviaciones estndar y los errores estndar de la media son inclusive ms estables; fluctan en mrgenes relativamente estrechos. An cuando las medias de las muestras del ejemplo variaron tanto como cuatro o cinco puntos, los errores estndar fluctuaron en no ms de un punto y medio. Esto significa que puede tenerse considerable fe en el hecho de que las estimaciones de las medias de muestras estarn muy prximas a la media de una poblacin de tales medias. Y la ley de los nmeros grandes afirma que mientras ms grande sea el tamao de la muestra, probablemente los estadsticos estarn ms prximos a los valores de la poblacin. Una pregunta difcil para los investigadores es: Siempre se cumplen estas generalizaciones, especialmente con muestras no aleatorias? La validez de las generalizaciones depende del muestreo aleatorio. Si el muestreo no es aleatorio, en realidad no es posible saber si se cumple la generalizacin. Sin embargo, muchas veces se tiene que actuar como si se pensara que se cumplen, incluso con muestras no aleatorias. Por fortuna, si se es cuidadoso respecto al estudio de los datos para detectar la idiosincrasia sustancial de la muestra, es posible utilizar con provecho la teora. Por ejemplo, las muestras pueden comprobarse para esperanzas fcilmente verificadas. Si se espera ms o menos el mismo nmero de machos que de hembras en una muestra, o proporciones conocidas de jvenes y viejos o de republicanos y demcratas, es sencillo contar tales nmeros. Hay expertos que insisten en el muestreo aleatorio como una condicin para la validez de la teora, y tienen razn. Pero si la teora esta prohibida con muestras no aleatorias, entonces tendran que abandonarse muchas de las utilizaciones de la estadstica e inferencias. La realidad es que aparentemente la estadstica funciona muy bien aun con muestras no aleatorias, suponiendo que el investigador conoce las limitaciones de tales muestras, incluso se tiene ms cuidado que al trabajar con muestras aleatorias y los estudios se efectan dos veces.
187
ELAS MEJA MEJA
Teorema del lmite central Antes de estudiar la utilizacin verdadera del error estndar de la media, debe observarse, aun cuando sea brevemente, una generalizacin extremadamente importante concerniente a las medias: Si las muestras son extradas al azar de una poblacin, las medias de las muestras tendern a distribuirse normalmente. Mientras ms grandes sean las n, ms verdadero ser este hecho. Y la forma y clase de distribucin de la poblacin original no importa. Esto es, la distribucin de la poblacin no tiene que ser normal. Por ejemplo, la distribucin de los 4,000 nmeros aleatorios referidos es rectangular, ya que los nmeros estn distribuidos uniformemente. Si el teorema del lmite central es vlido empricamente, entonces las medias de cada uno de los 40 conjuntos de 100 puntajes deben estar ms o menos distribuidas de manera normal. De ser as, ste es un hecho notable. Y es as, aunque una muestra de 40 muestras difcilmente es suficiente para mostrar muy bien la tendencia. En consecuencia, se generaron en la computadora tres poblaciones ms de 4,000 diferentes nmeros aleatorios distribuidos de manera uniforme, divididos en 40 subconjuntos de 100 nmeros cada uno. Se estimaron las medias calculadas para los 4 x 40 = 160 subconjuntos de 100 nmeros cada uno y se colocaron en una distribucin. En la figura 1 se muestra un polgono de frecuencias de las medias. Puede observarse que las 160 medias se asemejan bastante a la forma acampanada de la curva normal. Aparentemente funciona el teorema del lmite central. Y no olvidarse de que esta distribucin de medias se obtuvo de una distribucin rectangular de nmeros.
55 50 45 40 35 30 25 20 15 10 5
Frecuencia
43.5
45
Figura 3 Por qu tomarse tanta molestia? Por qu es importante mostrar que las distribuciones de medias se aproximan a la normal? Una gran parte del anlisis de datos trata con medias, y si estn distribuidas normalmente, entonces es posible utilizar las propiedades conocidas de la curva normal para interpretar los datos obtenidos en la investigacin. El saber que alrededor del 96% de las medias caern
188
entre dos desviaciones estndar (errores estndar) arriba y abajo de la media es una informacin valiosa, ya que un resultado obtenido puede valorarse contra las propiedades conocidas de la curva normal. ERROR ESTNDAR DE LAS DIFERENCIAS ENTRE MEDIAS Una de las estrategias ms frecuentes y tiles en la investigacin es comparar medias de muestras. A partir de las diferencias en las medias se infieren los efectos de las variables independientes. Tambin cualquier combinacin lineal est regida por el teorema del lmite central. Esto es, dadas muestras lo suficientemente grandes, las diferencias en las medias estarn distribuidas en forma normal. (Una combinacin lineal es cualquier ecuacin de primer grado, p. ej., Y = MI M2. Y = M12 MI no es lineal.) En consecuencia, puede utilizarse la misma teora que se usa con las medias en las diferencias entre medias. Supngase que se han asignado aleatoriamente 200 sujetos a dos grupos, cada uno de 100 sujetos. A un grupo se le muestra una pelcula sobre relaciones intergrupales, por ejemplo, y nada al otro grupo. A continuacin, se aplica a ambos grupos una prueba de actitudes. El puntaje medio del grupo A (que vio la pelcula) es 110 y el puntaje medio del grupo B (que no vio la pelcula) es 100. El problema es: Es la diferencia de 10 unidades una diferencia real, una diferencia estadsticamente significativa? O es una diferencia que pudo haber surgido al azar, ms de cinco veces en 100, por decir algo, o alguna otra cantidad, cuando realmente no existe ninguna diferencia? Si anlogamente se crean muestras dobles de 100 cada una y se calculan las diferencias entre las medias de esas muestras, y se lleva a cabo el mismo procedimiento experimental, se obtendr de manera coherente esta diferencia de 10? De nuevo, se utiliza el error estndar para evaluar las diferencias, pero esta vez se tiene una distribucin muestral de diferencias entre las medias. Es como si se tomara cada Mi. Mj se considerara como una X. Entonces las varias diferencias entre las medias de las muestras se consideran como las X de una nueva distribucin. Para cualquier promedio, la desviacin estndar de esta distribucin muestral es semejante al error estndar. Pero este procedimiento es slo para ilustracin; en la realidad no se hace esto. Aqu, otra vez, se estima el error estndar a partir de los primeros dos grupos, A y B, utilizando la formula:
Donde SEMA2 y SEMB2 son los errores estndar al cuadrado de los grupos A y B, respectivamente, como se haba planteado previamente.
189
ELAS MEJA MEJA
Supngase que el experimento se llev a cabo con cinco dobles grupos, es decir, con 10 grupos, dos cada vez. Las cinco diferencias entre las medias fueron 10, 11, 12, 8, 9. La media de estas diferencias es 10; la desviacin estndar es 1,414. Este 1,414 nuevamente es semejante al error estndar de la distribucin muestral de las diferencias entre las medias, en el mismo sentido que el error estndar de la media en la discusin precedente. Ahora, si se calcula el error estndar de la media para cada grupo (haciendo que las desviaciones estndar para los dos grupos sean SDA = 8 y SDB = 9) se obtiene:
Con la siguiente ecuacin se calcula el error estndar de las diferencias entre las medias:
Ahora que se tiene el 1,20, que se hace con l? Si los puntajes de los dos grupos han sido elegidos de un tabla de nmeros aleatorios y no hubo condiciones experimentales, podra esperarse que no hubiera diferencia entre las medias. Pero se ha aprendido que siempre hay diferencias de pequeez relativa debido a factores fortuitos. Estas diferencias son aleatorias. El error estndar (SE) de las diferencias entre las medias es una estimacin de la dispersin de estas diferencias. Pero es una medicin de estas diferencias que es una estimacin para toda la poblacin de tales diferencias. Por ejemplo, el error estndar de las diferencias entre las medias es 1,20. Esto significa que, solamente por la casualidad, alrededor de la diferencia de 10 entre MA y MB habr fluctuaciones aleatorias, ahora 10, luego 10,2, despus 9,8, etctera. Solamente rara vez las diferencias excedern, por ejemplo, 13 7 (alrededor de tres veces el SE). Otra forma de plantear esto es decir que el error estndar de 1,20 indica los lmites (si se multiplica el 1,20 por el factor apropiado) ms all de los cuales probablemente no pasarn las diferencias muestrales entre las medias. Qu tiene que ver todo esto con el experimento? Es precisamente aqu que se evalan los resultados experimentales. El error estndar de 1,20 fluctuaciones aleatorias estimadas. Ahora, MA MB = 10. Pudo haber surgido esto debido a la casualidad, como resultado de fluctuaciones aleatorias como las recin descritas? Por ahora debe estar casi claro que esto no puede ser, excepto bajo ciertas circunstancias poco comunes. Se evala esta diferencia de 10 comparndolo con la
190
estimacin de las fluctuaciones aleatorias o fortuitas. Es una de ellas? La comparacin se lleva a cabo mediante la razn t, o prueba t.
t=
MA MB 110 100 10 = = = 8,33 EE MA M B 1, 20 1, 20
Esto significa que la diferencia medida entre MA y MB debera estar a 8,33 desviaciones estndar de una media hipottica de cero (diferencia cero, ninguna diferencia entre las dos medias). No se tendra ninguna diferencia, desde el punto de vista terico, si los sujetos fueran totalmente azarosos y si no hubiera manipulacin experimental. Se tendran, en efecto, dos distribuciones de nmeros aleatorios a partir de las cuales podran esperarse slo fluctuaciones fortuitas. Pero aqu se tiene, comparativamente, una gran diferencia de 10, en relacin con una insignificante 1,20 (la estimacin de las desviaciones aleatorias). Es definitivo que algo ms all del azar est sucediendo aqu. Y este algo es en realidad lo que se est buscando. Es, presumiblemente, el efecto de la pelcula, o el efecto de la condicin experimental, otras condiciones que, por supuesto, han sido controladas lo suficiente. Representa una poblacin de diferencias entre medias con una media de cero y una desviacin estndar de 1.20. (La media se fija en cero porque se supone que la media de todas las diferencias de medias es cero.) Dnde debe ubicarse la diferencia de 10 sobre la lnea horizontal del diagrama? Para responder esta pregunta, primero debe convertirse el 10 a unidades de desviacin estndar (o de error estndar).
M=D
1.20
8.33
Figura 4 Esto se lleva a cabo dividiendo entre la desviacin estndar (error estndar), que es 1,20: 10/1,2 = 8,33. Pero esto es lo que se obtuvo cuando se calcul la razn t. Es, entonces, sencillamente la diferencia entre MA y MB, 10, expresada en unidades de desviacin estndar (error estndar). Ahora puede ubicarse en la lnea horizontal del diagrama. Obsrvese el punto que se encuentra alejado a la derecha. Resulta
191
ELAS MEJA MEJA
claro que la diferencia de 10 es una desviacin. Se encuentra tan alejada, de hecho, que a lo mejor no pertenece la poblacin en cuestin. Brevemente, la diferencia entre MA y MB es de significancia estadstica; tan significativa que explica lo que Bernoulli denomin certidumbre moral. Es difcil que una diferencia tan grande, o desviacin de la esperanza casual, pueda atribuirse a la casualidad. En realidad las probabilidades son mayores que un billn a uno. Puede suceder. Pero es mnima la probabilidad de que ocurra. As es el error estndar y su utilizacin. Los errores estndar de otros estadsticos se usan de la misma manera. Una herramienta muy importante y til. Es un instrumento bsico en la investigacin contempornea. Evidentemente, sera difcil imaginar la metodologa moderna de la investigacin, e imposible imaginar la estadstica moderna, sin el error estndar. Como una de las claves de la inferencia estadstica, no puede exagerarse su importancia. Gran parte de la inferencia estadstica cae bajo la familia de fracciones compendiadas por la fraccin: Estadstico Error estndar del estadstico
INFERENCIA ESTADSTICA
Inferir es derivar una conclusin a partir de premisas o de la evidencia. Inferir estadsticamente es derivar conclusiones probabilsticas a partir de premisas probabilsticas. Se concluye probabilsticamente, es decir, a un nivel especificado de significancia. Se infiere, en trminos probabilsticos, si un experimento resulta desviado de la esperanza fortuita, si la hiptesis nula no es verdadera, que est funcionando una influencia real. Si, en los mtodos del experimento, MA > MB y MA MB o H1 es verdadera y Ho no es verdadera, se infiere que el mtodo A es superior al B, siendo superior aceptado en el sentido definido en el experimento. Otra forma de inferencia, comentada a lo largo del captulo sobre muestreo, es aqulla obtenida a partir de una muestra de la poblacin. Ya que, por ejemplo, el 55% de una muestra aleatoria de 2,000 personas en Estados Unidos afirma que votar por un cierto candidato presidencial, se infiere que, si se le preguntara a toda la poblacin del mencionado pas, responder de forma similar. sta es una inferencia muy grande. Uno de los peligros graves en la investigacin, o tal vez debiera decirse de cualquier razonamiento humano, es el salto inferencial a partir de datos muestrales hacia hechos de la poblacin. Constantemente se efectan saltos inferenciales que no son de tamao medio: en poltica, economa, educacin y otras reas de gran importancia. Por ejemplo, si el gobierno reduce los gastos, la inflacin decrecer. Si se utilizan mquinas para ensear, los nios aprendern ms. Pero los cientficos,
192
tambin, efectan saltos inferenciales, a menudo algunos muy grandes, con una diferencia importante. El cientfico es (o debera ser) consciente de que est realizando tales saltos y que siempre son arriesgados. En resumen, puede afirmarse, que la estadstica permite al cientfico probar indirectamente hiptesis sustantivas, capacitndolo para probar de manera directa hiptesis estadsticas (en caso de ser posible probar de esa forma cualquier cosa). En este proceso, se usan las hiptesis nulas, hiptesis escritas por casualidad. Se prueba la verdad de hiptesis sustantivas al someter las hiptesis nulas a pruebas estadsticas con base en el razonamiento probabilstico. Entonces pueden hacerse inferencias apropiadas. Es claro que el objetivo de todas las pruebas estadsticas es probar lo justificable de las inferencias.
193
CAPTULO IV
EL INFORME CIENTFICO
195
ELAS MEJA MEJA
196
EL INFORME CIENTFICO
1. COMUNICACIN DE LA INVESTIGACIN
La investigacin culmina necesariamente con un informe que se debe redactar en cumplimiento de la obligacin que ha asumido el investigador con la comunidad cientfica de dar a conocer los resultados de sus investigaciones y de los hallazgos realizados. Pero dnde se origina esta obligacin? La obligacin de comunicar a la comunidad cientfica se origina en el momento en el que el investigador parte de conocimientos previos para identificar problemas de investigacin. Y estos conocimientos previos son patrimonio de la humanidad, que si bien es cierto estn a disposicin de todos los hombres, han servido de punto de partida para producir nuevos conocimientos. Estos nuevos conocimientos no pertenecen por entero a quien los produjo, sino son el resultado de una cadena de aportes que en el tiempo han venido realizando investigaciones precedentes. Aqu es oportuno recordar lo que deca Newton Yo slo veo parado sobre los hombros de gigantes, con lo que quera demostrar que los nuevos conocimientos en Newton se concatenaban con los conocimientos previos producidos por investigadores que lo antecedieron. Es la confesin de parte de un investigador honesto que atribuye sus xitos en la investigacin a los conocimientos previos acumulados por sus antecesores ante quienes, con humildad, se empequeece. Lo que quera destacar Newton es la concatenacin que existe entre los nuevos conocimientos con los conocimientos previos, con los que describa, con gran acierto, la naturaleza de la ciencia. En efecto, nada nuevo aportan las investigaciones que no hayan sido materia de preocupacin de cientficos que precedieron al investigador en el estudio el tema. Por eso se dice que todo cientfico tiene la obligacin de comunicar sus hallazgos para permitir que avance la ciencia, pues los hallazgos a los que ha llegado tienen su punto de partida en los conocimientos previos que pertenecen a la comunidad cientfica. Pero al mismo tiempo, los hallazgos a los que ha llegado servirn, en el futuro, de antecedentes para las nuevas investigaciones que acometan nuevos hombres de ciencia. Nada nuevo aportan las investigaciones que no hayan sido previamente materia de preocupacin de otros cientficos. Para redactar el informe cientfico, existen algunos criterios bsicos que cumplen una funcin orientadora. En primer lugar se debe preparar un esquema, estructura o modelo segn el cual se debe redactar el informe. Sobre el particular existe una
197
ELAS MEJA MEJA
diversidad de opiniones de los autores sin embargo, subyace en todas ellas, una lgica aceptable que orienta los esfuerzos por redactar un buen informe. En definitiva, el investigador debe asumir un determinado esquema segn el cual debe redactar su informe. Es muy conveniente que el informe comience por un resumen de su contenido, lo que facilita la comprensin de la temtica que aborda. Los investigadores que revisan la literatura, al leer el resumen o abstract se forman una idea acerca del contenido del informe y si lo consideran pertinente, leern todo el informe o lo dejarn para una oportunidad posterior si se enteran, por la lectura del resumen, que el contenido del informe no satisface sus necesidades. Por eso se recomienda que el resumen se redacte, adems de la lengua en que est escrito el informe, en una lengua extranjera, preferentemente el ingls, por ser sta, la que ms difusin tiene en el campo de la ciencia Despus del resumen se redacta la introduccin, que viene a constituir una referencia muy general con respecto al contenido del informe. Muchas veces, cuando la introduccin est bien elaborada, es suficiente para que el lector se forme una idea del contenido de todo el informe. En esta introduccin se debe hacer referencia al contenido de los distintos captulos del informe. El cuerpo del informe est constituido por los captulos que contiene. Un primer captulo debe estar referido al planteamiento del estudio que se llev a cabo. Como su nombre lo dice, en este captulo se debe contextualizar la investigacin y permitir que el lector se ubique y comprenda, en una primera aproximacin, acerca de lo que trata el trabajo. Por eso es preciso que en este primer captulo se plantee y se explique el problema, los objetivos, la hiptesis de la investigacin y, lo que es ms importante, que se identifiquen, con claridad meridiana, las variables que se han estudiado y dar cuenta de la forma cmo han variado, si se las ha considerado como dicotomas o como politomas. Tambin es necesario dar cuenta de los criterios empleados para clasificar las variables. La clasificacin de las variables es muy importante explicarlas porque permite un conocimiento, a mayor profundidad, de su naturaleza y de sus caractersticas. As el lector puede saber si las variables varan en dos, tres o ms valores, si ha sido justificado el uso de mtodos cualitativos o cuantitativos, o si las variables han sido manipuladas o simplemente observadas. La presentacin de la clasificacin de las variables tambin es importante porque ayuda a entender las razones por las que se ha adoptado determinada estrategia para la prueba de hiptesis. Es conveniente incluir en este captulo la justificacin del estudio y sus respectivos alcances y limitaciones. Este primer captulo tiene la virtud de encuadrar el estudio y servir de gua para la comprensin del contenido del resto del informe.
198
Un segundo captulo debe estar dedicado a exponer las bases tericas sobre las que se sustenta la investigacin. Aqu es conveniente iniciar el captulo haciendo un balance del estado en el que se encuentran las investigaciones relacionadas con el tema de estudio. Algunos autores lo denominan estado de la cuestin y en efecto, este captulo se justifica en tanto y en cuanto permite que el autor de la investigacin d cuenta del trabajo de revisin bibliogrfica que ha realizado. La revisin de la literatura para ello es imprescindible el dominio de una segunda lengua es importante porque permite explicar que la investigacin realizada no se encuentra aislada, sino que se entronca con investigaciones previas, referidas al tema. Se debe dar cuenta de las investigaciones precedentes, precisamente para demostrar que el proceso de produccin de nuevos conocimientos es una secuencia concatenada de los trabajos previos con los nuevos. Los antecedentes deben referirse no slo a los estudios previos directamente relacionados con el tema de estudio, sino tambin a estudios afines que tengan alguna vinculacin con el tema. A este respecto cabe mencionar que muchos investigadores noveles afirman que los estudios que han realizado no tienen precedentes en la literatura especializada. Nada ms falso. A estas alturas del avance cientfico tecnolgico alcanzado por la humanidad, no hay, en estricto sentido, nada nuevo bajo el Sol. Es aqu que el investigador se da cuenta que, an de manera tangencial, otros investigadores ya han tocado, de alguna manera, el tema acerca del cual informa. La tarea de ubicar antecedentes de la investigacin es ardua e intensa y debe iniciarse a nivel local, luego generalizarse a nivel nacional, para luego dar cuenta de los antecedentes que tendra el estudio a nivel internacional. En este acpite el investigador afirma que sigue una tradicin que viene de mucho antes y demuestra que tiene respaldo acadmico que le permite reclamar, para su investigacin, el valor que pudiera corresponderle. En otras palabras, con este acpite el investigador demuestra que no ha estado slo al investigar la temtica que expone, sino que existen otros investigadores que tambin se ocupan del tema. Con este acpite, adems, es posible establecer los lmites a los que la investigacin sobre el tema ha llegado. Por eso se dice estado de la cuestin, porque proporciona el balance acerca del progreso del conocimiento, sealando los logros alcanzados e identificando los aspectos que la ciencia an no explica. Por ejemplo, si el investigador ha estudiado la problemtica de la calidad de la formacin profesional universitaria, debe explicar que muchas investigaciones precedentes se han ocupado de esta temtica y reportar que, hasta la fecha, la investigacin sobre el tema ha permitido identificar una cierta cantidad de factores causales que estaran influyendo en el fenmeno que estudia. Este acpite se justifica porque permite al autor de la investigacin dar cuenta de la revisin bibliogrfica que ha realizado.
199
ELAS MEJA MEJA
Como consecuencia de la revisin de la literatura, el investigador ha recolectado mucha informacin valiosa y debe presentarla en forma coherente y ordenada. Por ejemplo si ha revisado informes cientficos a nivel local, nacional o internacional, debe presentar la informacin siguiendo este orden, tratando de organizar sistemticamente la informacin que posee. En este captulo tambin se debe considerar un segundo acpite referido a las bases tericas sobre las cuales se ha realizado la investigacin. Con esto el investigador reporta acerca del soporte terico que ha tenido en cuenta para realizar la investigacin de cuyos resultados informa. Toda investigacin debe tener su respectivo soporte terico que permita entroncar los resultados de la investigacin en el cuerpo de conocimientos previos que han acumulado los cientficos, a lo largo de la historia. La revisin de la literatura permite elaborar una resea de las principales ideas que sirvieron de base terica a la investigacin realizada. Esta resea debe estar ordenada en una estructura jerarquizadas de conceptos por cada variable estudiada. Se debe evitar lo que muchas veces se ha observado: la repeticin o la copia literal de la informacin terica hallada al respecto, sin orden ni coherencia. Aqu, el investigador que redacta el informe tiene la oportunidad de demostrar su erudicin en el tema y no slo eso, debe demostrar su formacin acadmica y el rigor con el que trata la informacin cientfica. En este acpite el investigador debe hacer las citas textuales necesarias, los parafraseos de ideas relevantes o los comentarios sagaces y oportunos, todo ello sustentado en las referencias bibliogrficas que sirven de fuente a las ideas que se est exponiendo. Tambin en este acpite el investigador debe asumir una posicin con respecto a las distintas perspectivas tericas que pudiera haber hallado en sus lecturas y debe manifestar sus discrepancias o coincidencias con las bases tericas que ha revisado y tratar de elaborar un cuerpo terico capaz de sustentar la investigacin realizada. l debe tratar de construir una teora que sustente sus investigaciones ensayando una propuesta coherente que sustente el estudio. Conviene hacer hincapi en este punto, a propsito de que muchas veces, los investigadores noveles lo que hacen es recolectar y repetir la informacin terica al respecto, sin organizar la informacin en forma coherente y ordenada. Y lo que es ms grave, repiten o copian la teora que muchas veces ni se relaciona con el tema. Finalmente, en este captulo, y como consecuencia de lo anteriormente asumido, se deben consignar las definiciones conceptuales de los constructo que le han servido al investigador para asumir una posicin terica al respecto, o bien, redefinir o asumir significaciones particulares de los conceptos que se manejan en el estudio, cuando se usen constructos o terminologa que en el ambiente acadmico se emplea
200
en otro contexto o en otros campos semnticos. En otras palabras, se trata de elaborar un glosario de trminos ah doc a la investigacin que se ha realizado. Por ejemplo, si el investigador, para referirse al trabajo que desempea un profesional, emplea el constructo prctica profesional, debe explicar que esta frase se emplea para referirse al ejercicio profesional que desarrolla todo profesional, es decir, que el investigador emplea esta frase en un contexto distinto al que se emplea en los procesos de formacin profesional, en los que la prctica profesional se refiere a la ejercitacin que debe realizar un estudiante, antes de graduarse, en las tareas propias de su profesin. Un tercer captulo debe estar referido al aspecto metodolgico que ha servido para realizar la investigacin. En este captulo se debe informar acerca de la operacionalizacin de las variables, trabajo importante que debe realizar todo investigador. Luego debe dar cuenta del tipo de investigacin que ha realizado, especificando los criterios que ha empleado para tipificar su investigacin. Tambin en este captulo debe dar cuenta acerca de la poblacin de estudio y para ello el investigador debe explicar todo lo relacionado con la poblacin y con las tcnicas de muestreo que ha utilizado. En este captulo debe explicar tambin la estrategia que ha aplicado para probar la hiptesis, es decir, debe explicar las previsiones adoptadas para poner a prueba las hiptesis con los hechos de la realidad. Aqu debe explicar si su estrategia ha sido experimental o cuasi experimental, si ha trabajado con una o ms variables independientes, y si esta estrategia le ha permitido controlar exitosamente las variables intervinientes. Otro acpite importante de este captulo es el referido a los instrumentos que ha utilizado el investigador para recolectar sus datos. Estos instrumentos pueden haber sido tomados de la literatura, es decir instrumentos elaborados por otros autores y que se han aplicado en esta investigacin o bien dar cuenta del proceso en el que el propio investigador, al no encontrar o no hallarse satisfecho con los resultados que podra obtener recolectando datos con los instrumentos existentes, ha tenido que elaborarlos de modo ex profeso para la investigacin cuyo informe est realizando. El investigador debe explicar que ha aplicado ciertos instrumentos para recolectar datos acerca de cada variable. No es posible que el investigador refiera instrumentos sin hacer alusin a la variable para la cual han servido. En este captulo, tambin debe dar cuenta acerca del proceso de la prueba de hiptesis, lo que por lo general se hace empleando las pruebas estadsticas disponibles, o bien empleando alguna metodologa especfica para el caso de las investigaciones cualitativas que en los ltimos aos se han puesto de moda.
201
ELAS MEJA MEJA
En un captulo final el investigador debe dar cuenta del trabajo de campo realizado. Este captulo tal vez sea el ms importante de todo el informe, porque es aqu donde el investigador presenta sus hallazgos y da cuenta del modo cmo ha arribado a ellos. En este punto el investigador explica las tcnicas que ha utilizado, y en caso que la investigacin se haya realizado empleando el mtodo hipottico deductivo, debe dar cuenta de cmo ha adoptado las decisiones con respecto a la hiptesis nula, es decir, cmo ha tomado las decisiones con el empleo de la metodologa de la prueba inversa. Finalmente, el investigador debe redactar las conclusiones a las que los hechos le han conducido. Las conclusiones deben ser muy precisas y deben estar referidas a las decisiones que el investigador ha adoptado con respecto a las hiptesis. En las conclusiones debe establecer si la hiptesis ha sido aceptada o rechazada y tambin debe precisar acerca de las consecuencias que podran producir las decisiones adoptadas. Como consecuencia de las conclusiones a las que el investigador ha arribado, se generan las respectivas recomendaciones, para que los investigadores, que acometan nuevas investigaciones acerca del tema o pretendan replicarlo, las tengan en cuenta. En pginas finales es conveniente colocar los anexos, que vienen a ser los documentos complementarios al informe y que proporcionan mayores detalles para su mejor comprensin. En los anexos pueden aparecer los instrumentos de acopio de datos, los datos ms puntuales y pertinentes acerca de la estrategia diseada para probar las hiptesis, o bien la informacin complementaria referida al proceso de reduccin de la poblacin a la muestra estudiada, entre otros aspectos. A continuacin se presenta la estructura de un posible informe de investigacin.
ESTRUCTURA DEL INFORME FINAL TTULO SUMARIO RESUMEN INTRODUCCIN CAPTULO I: PLANTEAMIENTO DEL ESTUDIO 1. Fundamentacin y formulacin del problema. 2. Objetivos. 3. Justificacin.
202
4. Alcances. 5. Fundamentacin y formulacin de las hiptesis. 6. Identificacin y clasificacin de las variables. CAPTULO II: MARCO TERICO 1. Antecedentes de la investigacin. 2. Bases tericas. 3. Definicin conceptual de trminos. CAPTULO III: METODOLOGA DE LA INVESTIGACIN 1. Operacionalizacin de las variables. 2. Tipificacin de la investigacin. 3. Estrategia para la prueba de hiptesis. 4. Poblacin y muestra. 5. Instrumentos de recoleccin de datos. CAPTULO IV: TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LA HIPTESIS 1. Presentacin, anlisis e interpretacin de los datos. 2. Proceso de la prueba de hiptesis. 3. Discusin de los resultados. 4. Adopcin de las decisiones. CONCLUSIONES RECOMENDACIONES BIBLIOGRAFA Bibliografa referida al tema. Bibliografa referida a la metodologa de investigacin. ANEXOS Cuadro de consistencia. Instrumentos de recoleccin de datos. Cuadros y grficos. Tablas de interpretacin de datos.
203
ELAS MEJA MEJA
2. EXTENSIN DEL INFORME

Otro aspecto que se debe tener en cuenta al redactar el informe de la investigacin es lo relacionado con su extensin, que tambin tiene que ver con la profundidad o amplitud con la que se redacta dicho informe. En otras palabras, aqu se debe tener en cuenta la extensin del informe. ste debe ser tal, que no sea ni tan escueto, que omita informacin valiosa, ni tan detallada que contenga informacin intrascendente. Un criterio que servira para redactar un buen informe de investigacin, en cuanto a su extensin, es que debe consignar la informacin suficiente y necesaria como para que otro investigador, con el informe que tiene entre manos, pueda replicar la investigacin. Es decir, quien redacta un informe debe redactarlo pensando en proporcionar la informacin que se requiere y que sea relevante como para replicar dicho estudio. La extensin del informe depender, pues, de este criterio. Un informe muy minucioso, que proporciona muchos detalles irrelevantes, distrae la atencin del lector con informacin intrascendente. Por el contrario, un informe muy escueto, no proporciona datos acerca de los grandes aspectos de la investigacin, tales como el problema, las hiptesis, las variables, o la estrategia empleada para probar las hiptesis.
3. ESTILO DE REDACCIN DEL INFORME

El informe cientfico debe redactarse empleando el lenguaje cientfico tcnico, que no es otra cosa que el uso del lenguaje en funcin denotativa. Usar el lenguaje denotativamente es dar cuenta de la realidad haciendo referencia slo a hechos observables, objetivables, demostrables. Al usar denotativamente el lenguaje, el autor no emite sus impresiones personales acerca del fenmeno al que se refiere, ni mucho menos sus opiniones o juicios personales. El investigador debe ser objetivo y slo da cuenta de los hechos, sin emitir sus apreciaciones subjetivas acerca de los hechos. En el aspecto gramatical, el autor debe redactar en modo impersonal, es decir sin hacer referencia a su persona: se hall, se demostr, se encontr, son frmulas recomendables para redactar informes cientficos. Otra alternativa es usar el plural de cortesa, es decir, en vez de decir yo hall, yo encontr, yo demostr, se recomienda usar las formas: hallamos, demostramos, encontramos. Con el plural de cortesa, aun sabiendo que el autor del informe es una persona individual, sta se mimetiza demostrando con ello humildad acadmica al usar el plural aun cuando l solo haya hecho los descubrimientos que reporta.
204
4. REFERENCIAS BIBLIOGRFICAS
Se hallan estandarizados algunos sistemas para realizar las referencias bibliogrficas. No existe, ni debe existir tampoco, predileccin por ninguna de ellas, pero lo que s importa es que el autor, al redactar el informe cientfico, debe adoptar un estilo determinado y emplearlo coherentemente a lo largo de su informe. Es muy recomendable empelar, en todo el informe, un solo estilo con lo que se proporciona uniformidad y calidad acadmica al trabajo. Por ejemplo, si el autor desea hacer referencia a un texto de Piaget, entonces, despus de la cita colocar entre parntesis lo siguiente:
(Piaget, 69: 1978)
69 hace referencia a la pgina de la que se extrajo la cita y 1978 es el ao de edicin del libro citado. Conviene poner, en la bibliografa, el ao de edicin para identificar el ttulo del libro, pues es poco comn que un autor publique ms de un libro por ao. O si se trata de una traduccin o una reimpresin, con el dato del ao se puede deducir el ttulo del libro. Naturalmente, en la bibliografa, debe aparecer el libro referido con su asiento bibliogrfico completo, de este modo, el lector podr identificar el ttulo del libro de Piaget al que se hace referencia con esta frmula. Esta es una forma prctica de hacer la referencia bibliogrfica. Aqu no se necesita hacer citas al pie de pgina y la lectura puede hacerse de corrido y tener la referencia de la bibliografa puesta de modo escueto dentro del texto que se est leyendo. La forma convencional de hacer referencias bibliogrficas es mediante las citas al pie de pgina o al final del texto. En este caso, al final del texto citado, el autor debe colocar, en sper ndice, el nmero correlativo de las citas. En forma correspondiente a los sper ndices, al pie de pgina, y en letras ms pequeas que las del texto, debe aparecer la cita en los siguientes trminos:
1
Salkind, Neil J. (1999): Mtodos de Investigacin. Mxico, Editorial Prentice Hall Hispanoamericana S.A., pg. 87
Como se aprecia en el ejemplo que antecede, se ha colocado una lnea corta, de no ms de dos centmetros de longitud, para indicar que lo que sigue corresponde a las citas al pie de pgina. A rengln seguido aparece el numeral 1, en sper ndice, que corresponde al mismo nmero que aparece en el prrafo que se cita. Es obvio que las citas siguientes sern numeradas en forma correlativa. Es posible, que en una sola pgina aparezcan una o ms citas; esto depende de la necesidad de citar que tiene el redactor del informe.
205
ELAS MEJA MEJA
En seguida aparece el apellido del autor. Los nombres del autor van despus de una coma, algunos autores, con la finalidad de destacar la informacin que proporcionan escriben, en maysculas, el apellido del autor citado. Esta es una prctica muy usada, pero para mantener la uniformidad del texto del informe que escribe, en este caso, el apellido del autor citado debe aparecer en altas y bajas, vale decir, slo la letra inicial del apellido debe ir en maysculas. Algunos libros son escritos por varios autores. En estos casos, si los autores son dos, se consignan los nombres y apellidos de los dos autores, como se puede apreciar en el siguiente ejemplo:
1
JOBERG, Gideon y NETT, Roger, (1980): Metodologa de la investigacin Cientfica. Mxico, Editorial Trillas, pg. 56.
En este ejemplo se puede apreciar una variante en la forma de presentar los apellidos de los autores: van en maysculas y as fcilmente se puede saber que los autores son Sjobereg y Nett. En algunos casos, si los autores son tres, slo se escriben los apellidos de los tres autores, del modo como se indica en seguida:
1
FERRANDEZ, SARRAMONA Y TARIN, (1988): Tecnologa Didctica. Barcelona, Ediciones CEAC., pg. 93.
En otros casos, si los autores son tres o ms de tres se escribe slo el apellido y el nombre del autor principal y se coloca luego la frase y colaboradores para indicar que la obra fue escrita por varios autores, colaboradores del autor principal. Para hacer referencia a los colaboradores tambin se usa la forma latina et al, abreviatura de et alter, como se ilustra en el siguiente ejemplo:
1
ARY, Donald, et al. (1982): Introduccin a la investigacin pedaggica. Mxico, Editorial Interamericana, pg. 109.
Luego de una coma, y entre parntesis, se escribe el ao de publicacin el libro, tal como se puede ver en los ejemplos que se comentan. Antecedido por dos puntos ( : ) va el ttulo del libro, con altas y bajas, si el ttulo es breve; pero si el ttulo es extenso, slo se escribe el maysculas la letra inicial de la primera palabra del ttulo. En seguida, y formando un solo prrafo, se consigna la ciudad en la que se imprimi el libro y, seguido de una coma, el nombre de la editorial. Luego de otra coma, se da cuenta de la pgina de la que se extrajo la cita, empleando la abreviatura pg. Si la cita ha sido extrada de varias pginas, se coloca la abreviatura pp., para referir el intervalo de pginas de la que se extrajo la cita. Por ejemplo:
206

1
Salkind, Neil J., (1999): Mtodos de Investigacin. Mxico, Editorial Prentice Hall Hispanoamericana S.A., pp. 87-93
Todos estos datos conforman un solo prrafo de dos renglones, ms o menos, por lo que es muy recomendable usar una sangra francesa de 4 5 puntos, para destacar los datos que van en el primer rengln, como son el sper ndice correlativo y el apellido del autor. Si no se usara la sangra francesa, y todo el texto apareciera alineado a la izquierda, se hara ms difcil identificar el orden correlativo de las citas y el apellido del autor se perdera en el contenido del prrafo. Esta forma de diagramar las citas al pie de pgina se puede apreciar en los ejemplos que anteceden. Los cientficos utilizan con mucha frecuencia informacin proveniente de publicaciones peridicas, es decir artculos de revistas especializadas. Para citar artculos publicados en revistas u otras fuentes hemerogrficas, la alternativa es la siguiente:
1
Pealosa Ramella, Walter, (2000): El problema de las competencias. En: Revista Peruana de Educacin. Ao I, N 5 Lima, Optimice Editores, pp. 5-28.
Para destacar la fuente, se subraya el nombre de la revista en la que apareci el artculo citado y luego se proporciona el asiento bibliogrfico de la revista, indicando el ao y el nmero de la revista, as como la ciudad y la editorial. Con la aparicin de los medios electrnicos que permiten acceso rpido y variado a la informacin, surge la necesidad de citar la informacin a la que se accede por estos medios. Estos textos tienen sus propios ttulos y sus respectivos autores, de modo que en las referencias bibliogrficas que se hagan se deben consignar estos datos. Es obvio que en la informacin obtenida por estos medios no aparece la editorial o la ciudad, aunque s se puede saber el ao de la publicacin. Sin embargo se observa en recientes informes cientficos que en vez de hacer las referencias bibliogrficas slo se consigna la Pgina web o la direccin electrnica de la que se obtuvo la informacin. Ante estas circunstancias, conviene recomendar la siguiente manera de citar la informacin obtenida por medios electrnicos, sealando que existen diversas alternativas propuestas.
1
Salas, Rubn Daro: Las lites rioplatenses y su representacin en la categora de gobierno desptico. Revista electrnica, Nmero 1, junio de 1999. http://constitucion.rediris.es/revista/hc/uno/diario2.html.Prrafo 3.
Debido a que las pginas de Internet carecen de numeracin, para facilitar la bsqueda, se debe consignar el nmero del prrafo, como se ha hecho en el presente caso.
207
LECTURAS COMPLEMENTARIAS
EL INFORME DE INVESTIGACIN
Orfelio Len *
Si ha tenido la oportunidad de viajar fuera de su pas es probable que haya notado con agrado que casi la totalidad de las seales de trfico son iguales. Visto con los ojos de alguien que llega a la mayora de edad en las postrimeras del siglo XX, sta parece la nica forma razonable de haberlo hecho. Sin embargo, fjese que existen otros contraejemplos: simultneamente, en unas islas europeas, de no poca importancia, en vez de conducir por la derecha lo hacen por la izquierda. Todo lo que parece razonable y eficaz no es siempre asumido culturalmente. Lo que unos ven como facilitacin de las comunicaciones los otros pueden verlo como colonialismo cultural. La normalizacin sacrifica la identidad y la peculiaridad individual en aras de un mejor entendimiento del grupo. En el caso que nos ocupa, la comunicacin cientfica, se aboga por la normalizacin. Las modernas publicaciones peridicas han ido imponiendo unos formatos para los informes de investigacin. Estas normas de publicacin suelen figurar en las contraportadas de las revistas, as que si quiere satisfacer su curiosidad, no tiene ms que pedir una revista cientfica la prxima vez que vaya a la biblioteca de su Facultad. Los formatos a los que estamos aludiendo hacen referencia a qu hay que contar, en qu orden hay que contarlo y qu aspecto debe tener una vez mecanografiado. En Psicologa, tanto en Espaa como en el resto de los pases occidentales, las normas se basan en las acordadas por la Asociacin Americana de Psicologa (APA. Publication Manual, 3.a edicin, 1983). Si alguna vez tiene ocasin de consultar el referido manual, ver que no hay nada dejado al azar. Es incluso posible que se sienta violento ante la rigidez de unas medidas que al ser pensadas originalmente en pulgadas producen unas traducciones con un nivel de detalle de diezmilmetros. En cualquier caso, no se preocupe que no tenemos la intencin de trasladarle el nivel de puntillosidad de la APA a sus trabajos de alumno de primer ciclo. Es suficiente con que ordene los informes de sus prcticas con arreglo a la estructura de los informes de investigacin que le vamos a presentar:
* Tomado de: LEON, Orfelio: Diseo de Investigaciones. Introduccin a la lgica. Madrid, Hill, 1993. pp. 292-300. McGraw-
211
ELAS MEJA MEJA
TTULO RESUMEN INTRODUCCIN MTODO RESULTADOS DISCUSIN REFERENCIAS APNDICES Efectivamente, esta estructura ya la conoce. Es casi la misma que hemos utilizado desde el Captulo 4 para presentar los ejemplos de los experimentos. Y la razn por la que lo hicimos as era para que se fuera familiarizando con ella. Ahora lo que necesitaba saber es que no era una eleccin caprichosa, sino que se trata de la misma estructura que se encontrar en las revistas cientficas. Los comentarios que vamos a realizar a continuacin van dirigidos a ayudarle a redactar cualquier tipo de informe de prctica que tenga que hacer, manteniendo presente el formato comn al que nos acabamos de referir.
Ttulo
Dedique una pgina entera a poner un ttulo, su nombre y filiacin. El ttulo debe describir el trabajo de la manera ms especfica. La filiacin del autor hace referencia a la institucin en la cual trabaja: universidad, instituto o empresa. En su caso puede hacer referencia a la facultad, curso y grupo. Con el objeto de poder identificar todas las pginas del mismo informe, es conveniente que en el pie de la pgina del ttulo aparezca una frase que le resuma. Es recomendable que utilice slo dos o tres palabras. Este resumen se utilizar como encabezamiento en todas las pginas del informe y deber colocarlo junto al nmero de la pgina. Por ejemplo, este texto tiene como ttulo Diseo de investigaciones: Introduccin a la lgica de la investigacin en Psicologa y Educacin, y como encabezamiento: Diseo de investigaciones.
Resumen
Los resmenes aparecen al principio del informe. Deben tener alrededor de 150 palabras. Se debe sealar en ellos lo ms fundamental de los contenidos de la introduccin, mtodo, resultados y discusin. Si se utiliza algn procedimiento, aparato o test novedoso, conviene resaltarlo. El objetivo al hacer un resumen es que sea lo suficientemente claro y atractivo como para que alguien que duda si leer el trabajo,
212
al conocer el resumen, se decida a hacerlo. Se aconseja redactarlo cuando ya se haya completado el resto de los apartados. En las revistas de habla no inglesa, junto al resumen aparece un resumen en ingls (abstract).
Introduccin
En primer lugar mentalcese de que la redaccin de un informe de investigacin no es el lugar ms adecuado para descubrir nuevos valores de la literatura. Procure ser escueto, preciso, simple y por encima de todo: claro. Juan Benet o el ltimo Camilo Jos Cela seran sus peores ejemplos. Azorn o Baroja seran unos excelentes modelos. Comience haciendo una descripcin general del problema que se aborda en su trabajo. Procure utilizar los mismos trminos que usan los autores que ha consultado. No sea original en este aspecto. Consulte los manuales recomendados para las distintas materias. Haga referencia a los antecedentes del problema. En los primeros cursos es suficiente con lo que encontrar en los textos. Justifique por qu tiene sentido hacer el trabajo. Como lo normal en una prctica es replicar algn efecto bien conocido y su sentido puede parecer un poco superfluo, puede justificar, por ejemplo, que no existe suficiente evidencia. Explique cmo va a dar respuesta al problema planteado. La introduccin conviene terminarla con una deduccin lgica desde los planteamientos presentados hacia los resultados que se esperan obtener. Si lo desea, lo puede hacer en forma de hiptesis. Cuando vaya a estudiar ms de una variable independiente, no olvide realizar una prediccin por variable.
Mtodo
El mtodo ha sido el objeto de este texto, as que procure que se vea convenientemente reflejado lo mucho que ha aprendido. Con una correcta descripcin del mtodo otra persona debera poder hacer otro trabajo exactamente igual al suyo, de manera que un posible criterio de validez es dar a leer su mtodo a otro compaero que no haya participado en su trabajo y pedirle que trate de repetirlo. Si se atasca en algn paso es que su redaccin no era todo lo buena que pareca. El mtodo tambin sirve para que evalen la calidad de su trabajo con los baremos cientficos que ya conoce: fiabilidad y validez. Sea cuidadoso.
213
ELAS MEJA MEJA
Existe una convencin para organizar el mtodo en varios subapartados. Siguindolos se asegura que no se le olvida nada de lo fundamental. Se los presentamos a continuacin: Sujetos. En este apartado se debe especificar: quines, cuntos, de qu poblacin, cmo se seleccionaron, cul es el rango de su edad y la composicin por sexos, si se les gratific de alguna manera. En caso de una seleccin previa, puede contarse aqu o en el procedimiento. Diseo. Este subapartado puede ir en solitario o en conjunto con el procedimiento. Nosotros le recomendamos que lo haga siempre aparte, como forma de reflexin sobre el plan de investigacin utilizado. Comience diciendo si ha sido un estudio descriptivo, un experimento o un cuasi experimento. A continuacin si han utilizado grupos o un solo sujeto. Especifique cmo se ha/n operativizado la/s variable/s independiente/s y la dependiente. Despus nombre el diseo especfico utilizado. Diga cmo se ha administrado cada variable respecto a los sujetos (inter-grupos o intra-grupos), cuntos han sido los niveles de la/s VI(s) utilizados y cules los nombres de estos niveles. Aparatos-materiales. Cuando los instrumentos utilizados para llevar a cabo el trabajo tienen algn carcter especial o novedoso, descrbalos de forma independiente. Si no es el caso, si son materiales bien conocidos, integre los aparatos o materiales en la narracin del procedimiento. Procedimiento. El procedimiento parece la parte ms fcil del informe porque consiste simplemente en contar cmo se hicieron las cosas. Sin embargo, es muy difcil hacerlo bien. Por un lado est la tentacin de ser demasiado meticuloso, si se tratase de las instrucciones de funcionamiento de algunos aparatos: para poner en marcha el magnetfono desplace la palanca de la posicin de off a la de on, o justamente la tentacin contraria: darlo todo por sabido, lo que har que el lector quede desconcertado; algo as como la frase: tras presentar los estmulos, medimos la memoria de los sujetos. No espere hacerlo bien en la primera redaccin. Una buena estrategia es la siguiente: haga un borrador, dselo a un amigo y haga que ste le explique a un tercero cmo se hizo el trabajo, estando usted delante. Pasarn un buen rato y podr comprobar cmo lo que ha entendido su amigo difiere de lo que usted realmente hizo.
214
Resultados
En esta seccin se presenta el resumen de los datos obtenidos y los clculos estadsticos que se han hecho con ellos. No olvide que se trata de un resumen de los datos, no tiene que grapar las hojas de respuesta de todos los sujetos, ni siquiera las matrices de sujetos por condiciones o ensayos. Estos seran considerados los datos en bruto. Lo que usted tiene que incluir son los estadsticos que resumen los datos en bruto. Estos estadsticos son, por ejemplo, los ndices de tendencia central y de dispersin. Como no siempre se utilizan los mismos estadsticos, no d por hecho que est claro de qu medidas se trata. Especifique, antes de informar de los valores, qu estadsticos son los que ha utilizado. Por ejemplo: a continuacin presentamos las medias de los dos grupos. El grupo de, choque emocional obtuvo un valor de 10 y el grupo, sin choque emocional, de 15. Despus de presentar los estadsticos descriptivos, presente los estadsticos de contraste. Aunque usted no lo pueda hacer todava, s que deber ser capaz de identificarlos cuando lea un artculo . Por ejemplo: la diferencia de medias fue estadsticamente significativa. Tenga cuidado de no precipitarse al comentar los resultados. Es suficiente con decir en qu condiciones se obtuvieron valores ms altos que en otras. Los comentarios en profundidad de los resultados se deben dejar para la discusin. Por ejemplo: el grupo de choque emocional record peor que el grupo sin choque emocional. Los resultados, a menudo, se presentan en tablas-resmenes y en grficas para mejorar la claridad expositiva.
Discusin
Comience con una frase que resuma lo ms relevante del trabajo no vuelva a repetir exactamente lo mismo que ya dijo en los resultados. Siga conectando los resultados que ha obtenido con los que dijo en la introduccin que esperaba encontrar. Si no coinciden, no se desespere. Eso significa que tiene que aguzar el ingenio y tratar de encontrar una explicacin, normalmente metodolgica, ya que es difcil que en una prctica se puedan mantener los controles de los experimentos originales llevados a cabo por expertos en laboratorios. Recuerde: en caso de encontrar los datos que esperaba, las hiptesis nunca se confirman, simplemente no se rechazan, o si quiere huir de la antiptica frase
215
ELAS MEJA MEJA
con la doble negacin, puede decir que los datos permiten mantener la hiptesis, o que son congruentes con la hiptesis planteada; en caso de no encontrar los datos esperados es ms fcil, las hiptesis se rechazan, sin ms. Despus de ligar los resultados con sus hiptesis, debe conectar este hecho con los datos de las otras investigaciones a la que se haca mencin en la introduccin. Es una buena costumbre criticar algunos de los fallos que usted mismo encuentra en su trabajo, una vez escrito. Una buena autocrtica indicar que usted ha aprendido hacindolo, o sea, ha alcanzado el objetivo de la prctica. En los artculos, es frecuente que los autores indiquen hacia donde se debera dirigir la prxima investigacin. Usted puede indicar cmo mejorar su trabajo, si tuviera que repetirlo.
Referencias
Por referencias se conoce el listado de los autores y sus publicaciones, que se han hecho mencin en el informe. La Bibliografa, sin embargo, es un listado exhaustivo sobre las publicaciones de un tema, independientemente de que se hayan citado en el cuerpo del texto. Los casos ms comunes de referencias son: un libro, un captulo de un libro y un artculo de una revista. Mejor que explicar la forma de hacerlo vamos a poner un ejemplo de cada tipo, usando referencias de las que aparecen en el texto. 1. Libro: Arnau, J. (1984). Diseos experimentales en psicologa y educacin (Vol. II). Mxico D.F., Trillas. 2. Captulo de libro: Diges, M., Rubio, M. E. y Rodrguez, M. C. (1992); Eyewitness memory and time of day. En F. Lsel, T. Bliesener (eds.), Psychology and law (pginas 317-320). Berln: de Gruyter. 3. Artculo: Atkinson, J. W. y Litwin, G. H. (1960). Achievement motive and test anxiety conceived as motive to approach success and motive to avoid failure. Journal of Abnormal and Social Psychology, 60, 52-63. Trillas y de Gruyter son los nombres de las editoriales de los dos primeros ejemplos y Mxico D.F. y Berln las ciudades donde se ubican las editoriales. El nmero que aparece a continuacin del nombre de la revista, en el tercer ejemplo, es el volumen de la misma. Va tambin en cursiva.
216
Apndices
En los apndices se hace figurar informacin que sera muy prolijo situar en el texto. Se utilizan, por ejemplo, para indicar cules fueron las listas de estmulos que se presentaron, nuevos tests, programas de ordenador originales y cruciales para el trabajo, etc. En general los editores desaconsejan utilizarlos, salvo gran necesidad.
Documentacin
Mara Eugenia Romano, una magnfica profesora nuestra, ya fallecida, comenzaba muchas veces sus clases con el siguiente lamento: que tengo yo que emplear la hora de clase en contarles estas cosas que estn magnficamente expuestas en los libros...!. En numerosas ocasiones, aos ms tarde, hemos comprendido su punto de vista. Esta es precisamente una de esas ocasiones, ya que lo mejor que puede hacer usted, si quiere saber cules son las fuentes documentales en Psicologa y cmo se utilizan, es leer el libro de nuestros compaeros Jos Eugenio Ortega y Jos Miguel Fernndez Dols (1980) Fuentes documentales en Psicologa. Es un texto claro, ordenado y perfectamente asequible. Sin embargo, le sorprendera saber que a un alumno de postgrado un poco despistado le recomendaramos el mismo texto. Lgicamente, hay una gran diferencia entre su situacin y la de un alumno ya licenciado, y en consecuencia debe haber formas diferentes de acceder al tema de la documentacin. En el caso del alumno superior se espera que con un perfecto nivel de ingls a nivel de lectura utilice las fuentes documentales, las estudie y sea capaz de asimilar la informacin para poder disear una investigacin. En el caso de un alumno de primer ciclo se espera que reconozca el tipo de fuente documental cuando es nombrada en las clases o cuando es citada en un texto y que tenga un esquema mental de las formas que existen de profundizar tericamente en un tema. Para empezar vamos a resumir los tipos de fuentes documentales que seguro conoce como fruto de trabajar este texto y de estudiar otras materias. Las referencias a autores y aos que ha ido viendo a lo largo de los distintos captulos corresponden casi mayoritariamente a artculos en revistas cientficas (vg: Atkinson y Litwin, 1960) generales o especializadas por temas y a libros (vg: Azorn y SnchezCrespo, 1986). Tambin haba algunas referencias a tesis doctorales (vg: Gil, 1991), memorias de licenciatura (vg: Blanco, 1985) o comunicaciones presentadas a congresos (vg: Montero y Len, 1991) incluso algn documento interno sin publicar (vg: Botella, 1992) o a un manuscrito en preparacin (vg: Senz y Len). Comentamos a continuacin slo los ms importantes.
217
ELAS MEJA MEJA
Dentro de las revistas hay un tipo particular que es de obligatoria consulta una vez que el tema de investigacin est centrado, son las revistas de revisin, como el Annual Review of Psychology, donde un grupo de investigadores revisan lo publicado en un tema desde la ltima revisin, lo ordenan, lo comentan y lo critican desde su punto de vista. Leer una revisin sin formacin previa en el tema es una labor ingrata y frustrante (si no nos cree, haga la prueba). El alumno de primer ciclo debera ser capaz de entender los artculos seleccionados por sus profesores antes de avanzar ms. En cuanto a los libros, se habr dado cuenta que algunos son exclusivamente escolares llamados libros de texto, es decir, son obras pensadas para la formacin curricular y en muchos casos obedecen al desarrollo de los programas oficiales, de las asignaturas. Otros libros, llamados de lecturas, son agrupaciones de escritos de distintos autores, pero aglutinados bajo el criterio de alguien, el compilador que ha perfilado un criterio para cubrir la informacin en un rea determinada. Como usted imagina, hay libros que tratan los temas ms extensamente de lo exigido en los estudios de licenciatura. Estos libros manuales o monografas slo son recomendables en niveles superiores de formacin. Probablemente, el alumno de primer ciclo tiene bastante tarea con asimilar la informacin contenida en los libros de texto recomendados. Antes de comentarle algunas formas de documentacin ms especficas queremos sealarle para el caso de que no las conozca ya la existencia de dos fuentes de gran utilidad, fcil acceso y recomendables para estudiantes noveles: las enciclopedias especializadas y los diccionarios especializados. Las enciclopedias son costosos y voluminosos trabajos dirigidos por profesores de reconocido prestigio y que constituyen una excelente manera de buscar informacin adicional o explorar alguna cuestin que queda fuera del programa. Consulte en su biblioteca sobre las disponibles. Los diccionarios son tiles para fijar el uso de trminos, necesidad que es ms apremiante en las ciencias ms jvenes. Quiz el orden sera asegurarnos primero en el diccionario de que la palabra que conocemos responde a lo que queremos conocer y despus acudir a la enciclopedia. En general, conviene hacer una llamada de atencin sobre las traducciones que no siempre son tan fieles como quisiramos. Presentamos ahora una de las herramientas de mayor utilidad entre los investigadores de Psicologa: Psychological Abstracts. Se trata de una revista de resmenes, elaborada sobre ms de 1000 revistas cientficas de mbito internacional, utilizando los resmenes de los informes de investigacin. En el caso de Psychological Abstracts, sta se publica cada seis meses y contiene, no slo los resmenes de los artculos con los que usted est ya familiarizado, sino informacin
218
de libros, captulos de libros y otros tipos de documentacin escrita. La mayor ventaja de estas revistas de resmenes es poder tomar la decisin de si merece la pena localizar el trabajo original, dada la informacin que proporciona el resumen. Otra ventaja no menos importante es la de disponer de un sistema de ordenacin por reas de conocimiento, reas que permiten focalizar la bsqueda. Asimismo, dispone de dos ndices de descriptores, uno por materias algo as como las pginas amarillas y otro por autores. Los usuarios avanzados cuentan adems con un magnfico complemento: se trata del Thesaurus de la APA. Un tesauro es una especie de diccionario de trminos especializados de una materia. Su objetivo no es definir, sino fijar cules son los trminos que se deben utilizar para facilitar la normalizacin del lenguaje cientfico. En el tesauro citado lgicamente en ingls adems de la relacin de trminos en orden alfabtico, hay una seccin que los agrupa por su proximidad conceptual y otra que indica cules son los trminos equivalentes para realizar bsquedas por ordenador. Recordamos que nadie suele empezar a estudiar un tema buscando artculos en los Psychological Abstracts. Si a alguien se le ocurriese, descubrira que el volumen de lo publicado slo en los ltimos diez aos, sobre el ms especfico de los temas, es tal que no acabara de leerlo todo en el tiempo que tiene previsto para realizar su trabajo, y esto sin suponer que se ha asimilado convenientemente. Para que nos entienda, se le ocurrira tomar su primera clase de windsurfing en mar abierto, con olas de tres metros y vientos fuertes? Y, sin embargo, en estas condiciones es donde mejor se lo pasan los expertos. La posibilidad de almacenar la informacin en soportes magnticos est facilitando la bsqueda de informacin a travs de ordenadores personales. stos, con el uso de programas especficos y conectados a redes, hacen que la bsqueda bibliogrfica sea cada vez ms extensa, ms focalizada y ms rpida. En cualquier caso, es muy probable que en su Facultad o Universidad exista un centro de documentacin donde le puedan informar cuando lo necesite.
219
ELAS MEJA MEJA
220
ANLISIS, INTERPRETACIN Y COMUNICACIN DE LOS RESULTADOS

Donald Ary*
Una vez reunidos los datos el investigador analiza e interpreta cuidadosamente los resultados y por ltimo redacta un informe del estudio. Este captulo contiene una breve exposicin sobre cada una de esas etapas.
Anlisis de los datos

Lo primero que hace el investigador para analizar la informacin es consultar el proyecto para verificar los planes originales referentes a la presentacin de datos y la realizacin del anlisis estadstico. Despus de hacer esto, elabora una estrategia que le permita organizar los datos en bruto y efectuar los clculos necesarios. En la actualidad, los proyectos de investigacin que se refieren a la pedagoga y a otras ciencias del comportamiento se caracterizan por la complejidad y requieren saber trabajar con computadora. Con objeto de lograr precisin y ahorrar tiempo y energa, algunos investigadores aprovechan la computacin electrnica para analizar sus datos. Por ello se ofrece una breve explicacin de las computadoras y de su aplicacin de las mismas y de su aplicacin en el procesamiento de datos. Uso de las computadoras en el procesamiento de datos El acontecimiento ms importante en la historia de la investigacin fue la invencin de la computadora. Este fenmeno ha ensanchado el mbito de la investigacin y ha permitido hacer estudios que de otra manera ni siquiera se intentaran. Dado que las computadoras analizan grandes cantidades de datos con rapidez y eficiencia, se pueden disear estudios sin preocuparse por l nmero de variables ni por la complejidad de los anlisis que se necesitan. Antes de la aparicin de las computadoras, los investigadores se abstenan de realizar estudios que
* Tomado de: ARY, Donald et al: Introduccin a la investigacin pedaggica. Mxico, D.F. Mc GrawHill Interamericana,1989, pp. 356-375.
221
ELAS MEJA MEJA
incluyeran muchas variables y sujetos, porque requera tiempo y esfuerzo tabular y analizar los datos. Las pruebas estadsticas de gran complejidad y los anlisis de multivariables no se efectuaban sino rara vez. La computadora es capaz de procesar grandes cantidades de informacin y hacer intrincados anlisis estadsticos con increble rapidez y eficiencia. Preparacin de los datos para la computadora Para que el dispositivo de entrada acepte los datos, stos deben elaborarse de modo que permitan la tabulacin estadstica, el anlisis y el almacenamiento. El procesamiento de la informacin puede consistir en la conversin de los datos o en darles una forma ms manejable. Esta elaboracin pasa por varias etapas. En la primera se codifican los datos en una forma que resulte apropiada para el anlisis por computadora. La codificacin consiste en cambiar la forma verbal de los datos de las variables y darles la forma numrica que necesita la computadora. Por ejemplo, el sexo de un sujeto no puede colocarse dentro de una computadora mediante el uso de palabras, sino que se aplica un cdigo numrico a la variable, en el que 1 representa a un sujeto de sexo masculino y 2 a uno de sexo femenino. Los cdigos se emplean para datos nominales como sexo, raza, nivel socioeconmico, grado escolar, escolaridad, estado civil, religin, preferencia poltica, lugar de residencia. Los cdigos numricos pueden aplicarse tambin a datos ordinales o de intervalo cuando se desee obtener categoras discretas para el anlisis. Por ejemplo, en vez de usar las edades de los maestros que se incluyen en un estudio se las podra codificar con un 1 para los profesores menores de 25 aos, con un 2 para aqullos cuya edad flucta entre 26 y 30, con un 3 para los de 31 a 35, etc. La figura 1 contiene una serie de datos en que los tres primeros objetos fueron codificados y los restantes constituyen los datos efectivos. En un registro de datos los sujetos aparecen en los renglones y las variables, en columnas.
SERIE DE DATOS REGISTRADOS PARA UN ESTUDIO EXPERIMENTAL
Nmeros de Cdigos de los sujetos 1 1 2 2 Prueba de aptitudes Edad acadmicas verbales 16 450 17 15 18 560 570 620 Prueba de aptitudes acadmicas matemticas 495 460 530 640
Grupo 1 1 2 2
Sexo 1 2 1 2
Grupo escolar 3 4 3 4
Figura 1
222
Los expertos en las tcnicas de programacin pueden escribir sus propios programas. Por fortuna hay numerosos programas ya preparados, que se encuentran en la mayora de los centros de computacin. Se les denomina paquetes y son recomendables para quienes tienen muy poca o ninguna experiencia. Hay diferentes series de programas en paquetes. Una de las ms conocidas es la Serie Biomdica, que fue creada para emplearse en los campos de la medicina y de la biologa. Se dispone de gran nmero de tales programas para diversos anlisis estadsticos. El Paquete Estadstico para las Ciencias Sociales es una de las series ms populares en la investigacin educacional. Contiene muchos de los procedimientos estadsticos de que frecuentemente se valen los socilogos, su lenguaje es fcil de aprender adems no requiere un conocimiento sobre el funcionamiento de las computadoras. Esos programas incluyen, entre otras cosas: Mediciones codescriptivas de la tendencia central y de la dispersin. Distribuciones indiferenciales de frecuencias. Ji cuadrada (x2). Anlisis de correlacin bivariable y diagramas de dispersin. Comparacin de las medias de la muestra: pruebas t. Anlisis de varianza y de covarianza unidireccional con direccin n. Correlacin mltiple y regresin. Correlacin parcial. Valoracin escalar de Guttman. Anlisis factorial. Por supuesto el uso de paquetes de programas no quita al investigador la responsabilidad de entender los principios estadsticos en que se apoyan, pues debe interpretar la salida del programa de computadora o hacer que un estadstico la explique. Si no se cometen errores en la programacin, los resultados pueden recopilarse en el registro de la computadora. Sin embargo, un solo error al disponer las tarjetas, la programacin o al preparar las tarjetas de control impedir que logre realizar la operacin. En ese caso, habr que reconocer y tratar de encontrar el problema que ocasion la falla. Conviene hacer una advertencia. La precisin de los resultados impresos depende totalmente de la informacin con que se alimente a la computadora. Esta no comete errores de clculo, pero si recibe los errores de programacin en que incurre el investigador, obedecer las instrucciones en forma ciega pero eficiente y no producir
223
ELAS MEJA MEJA
ms que basura . Hay dos clases de errores que pueden cometerse en la programacin. Los de lenguaje, entre ellos las instrucciones mal escritas, sern detectados por el aparato y entonces no aceptar la tarea. Pero como s acepta los errores de lgica, tales como las instrucciones incorrectas, se obtendr una produccin muy cara de informacin sin significado. Para terminar queremos hacer dos recomendaciones en relacin con el empleo de las computadoras: 1. Aproveche al mximo las computadoras en el procesamiento de sus datos, pero realice una evaluacin crtica del producto final. Estos aparatos no cometen errores pero tampoco corrigen los errores hechos en la programacin o en la preparacin de los datos para su procesamiento. 2. No utilice ciegamente cualquier programa que encuentre en los manuales. Usted debe decidir el tipo de procedimiento estadstico ms apropiado para los datos que dispone.
PRINCIPIOS DE LA INTERPRETACIN
Una vez recabados los datos de investigacin y terminado el anlisis estadstico, el investigador comienza la fascinante tarea de interpretar los resultados. El principal objetivo de su trabajo es aportar algo nuevo al saber humano. Al llegar a la etapa de la interpretacin, puede demostrar los conocimientos que se han adquirido en el proyecto y cmo encajan dentro del cuerpo general de la ciencia. Cmo el proyecto facilita la interpretacin La base adecuada para interpretar los resultados de un estudio ha de ser puesta sistemticamente a lo largo de las etapas de la realizacin del proyecto, incluso antes de comenzar el estudio. Al efectuarlo el investigador tiene presente en qu consistirn los datos y lo que les pueden decir, de ese modo se preparan para interpretarlos y hacerlos encajar en el acervo de conocimientos, de su disciplina. Se supone que un plan cuidadosamente elaborado y presentado como un proyecto completo, producir resultados cuya interpretacin no ser difcil y aportar informacin significativa si el estudio ha sido organizado de tal manera que las consecuencias de las hiptesis se expresen en observaciones confiables, la interpretacin y el valor de las observaciones ser obvio. Importancia de apegarse al plan original Cuando la propuesta haya sido aceptada y se ponga en marcha el proyecto, el estudio habr de efectuarse sin apartarse en nada de lo planeado. Esta regla tiene consecuencias ticas y prcticas.
224
Para ilustrar el primer tipo de consecuencias supongamos que el seor Williams, un maestro de lengua extranjera, invent con un gasto enorme de tiempo y esfuerzo un sistema para ensear francs que l considera muy superior a los dems. Con el fin de probar la eficacia de su estrategia, establece un grupo experimental al que instruye por su mtodo y un grupo de control que sigue otro. El profesor disea una serie de pruebas semanales de aprovechamiento del francs que fungir de variable dependiente. Imaginemos que durante las primeras semanas descubre que las puntuaciones medias del test son casi idnticas en los dos grupos. Como su mtodo le cost mucho trabajo, le resulta difcil creer que no sea mejor que el otro y decide examinar a los dos grupos para indagar qu sali mal. Descubre que el grupo experimental parece mostrar mayor conocimiento y apreciacin de la vida y la cultura francesa. Deseoso como est por encontrar una diferencia entre las puntuaciones, opta por cambiar su variable dependiente por las puntuaciones obtenidas en las pruebas sobre la vida y la cultura francesas. Este cambio ser una trasgresin de las normas ticas. En dos grupos aleatorios siempre es posible encontrar una superioridad si se los somete a una atenta observacin. Si el grupo experimental no hubiera parecido superior en el inters por la vida y cultura francesa, quiz habra sido superior en gramtica inglesa o latina, en comportamiento o en cualquier otra variable. El maestro de idiomas tiene la obligacin de efectuar el experimento tal como lo plane en vez de modificar su variable dependiente despus de observar una diferencia. Le es lcito anotar en algn lugar de su informe que el grupo experimental pareca superior en la comprensin de la vida y la cultura francesas, y que valdra la pena utilizar esa variable en otro experimento con otro grupo de sujetos. No es tico abandonar las variables independientes o dependientes que no parezcan funcionar, ni agregar algunas nuevas y prometedoras. Tales cambios han de dejarse para futuros estudios. La introduccin de nuevas variables es tambin desaconsejable desde un punto de vista prctico, pues puede confundir los resultados de un estudio y obscurecer su significado. A menudo no siente la tentacin de agregar nuevas variables interesantes que aparecen en el estudio. Pero la base terica para interpretarlas todava no ha sido puesta, por lo cual se aconseja dejarlas para otra ocasin. Interpretacin de los resultados esperados Es comprensible que los investigadores se sientan complacidos cuando los resultados se ajustan a la estructura construida previamente y cuando la interpretacin se efecta segn lo previsto. Se dice entonces que el estudio ha funcionado y que existe concordancia entre lo esperado y los resultados. En tal caso slo habr que atender a unas pocas precauciones.
225
ELAS MEJA MEJA
1. No hacer interpretaciones que excedan a la informacin. Esto puede parecer un precepto obvio, pero los investigadores se emocionan tanto al encontrar los resultados previstos que sacan conclusiones que no tienen una base vlida en los datos. Incluso en las investigaciones publicadas es frecuente tropezarse con ms interpretaciones de las que justifican los datos. 2. No olvidar las limitaciones del estudio. Por supuesto debern de haberse identificado previamente en el estudio las que se deben a una imperfecta confiabilidad y validez de los instrumentos, las ocasionadas por muestreo restringido, los problemas de validez de los instrumentos, es muestreo restringido, los problemas de validez interna, etctera. 3. La tica requiere que el investigador comunique los problemas de validez interna que pudieran explicar los resultados. Si a pesar de que hizo todo lo posible por igualar las condiciones, las variables no experimentales fueron muy favorables para el grupo experimental y las del grupo de control fueron demasiado perjudiciales, debe darlas a conocer y tomarlas en cuenta al interpretar los resultados. (Por ejemplo, a pesar de la asignacin aleatoria los maestros a los grupos, al grupo experimental tal vez le hayan tocado maestros expertos en su gran mayora y al de control, principiantes.) 4. Recurdese que la significacin estadstica slo quiere decir que si hay grados de libertad idneos es poco probable que los resultados dependan de la casualidad. No indica en absoluto que los resultados sean significativos en la acepcin general de la palabra es decir, importantes y significativos o trascendentales. No piense que la significacin estadstica garantice que los resultados son de suma importancia. Supongamos que dos grupos equivalentes fueron sometidos a dos diferentes sistemas de aprendizaje de ortografa durante dos aos. Durante el experimento los sujetos que utilizan el sistema A muestran una ganancia media 2,15 aos de crecimiento en pruebas estandarizadas, mientras que los que en el sistema B presentan una ganancia de 2,20. Si los grupos son grandes o si las diferencias dentro de los grupos son pequeas, las diferencias entre medias tendrn significacin estadstica. Pero una diferencia de medio mes en un periodo de dos aos es relativamente insignificante en trminos prcticos. Si el sistema B requiere ms tiempo por parte del alumno y del maestro o ms materiales, a los profesores no les convendran adoptarlo slo porque segn la estadstica produce una ganancia mayor que el sistema A. Pero si resultara menos costoso tendran a preferirlo ya que en la prctica sus resultados son muy similares a los del otro sistema.
226
La posible importancia o intrascendencia de los resultados debe mencionarse en el proyecto antes de iniciar el estudio. Una investigacin carece de valor si no proporciona informacin importante que enriquezca el saber grande que sea la significacin estadstica de los resultados. Interpretacin de resultados negativos Los investigadores que descubren resultados contrarios a los que sealan las hiptesis suelen percatarse sbitamente de las deficiencias de su trabajo. La interpretacin de los resultados se asemeja a una confesin. Los instrumentos fueron inadecuados para medir las variables; la muestra era demasiado pequea y tena tan poca representatividad que los resultados no pueden generalizarse vlidamente a una poblacin de objetivo extensa, etc. La percepcin retrospectiva revela problemas de validez interna que explican por qu el estudio no corresponde a las expectativas. Cualquiera de esas cosas puede haber ocurrido, pero las deficiencias debern informarse sin importar los resultados. No obstante, la investigacin es siempre una aventura que nos lleva a lo desconocido, de modo que no existe un deber ser absoluto, el investigador predice los resultados de un estudio a partir de la teora, la deduccin y los resultados de anlisis anteriores. Si stos son tan concluyentes que no dejan ninguna duda acerca de los resultados, el estudio ser til. Al emprender un estudio se afirma implcitamente que el resultado es una cuestin de conjetura, no de certidumbre. Al terminar el proyecto se entiende que los investigadores buscarn determinar imparcialmente la situacin verdadera con los mejores instrumentos y procedimientos de que disponen. Por tanto, estn obligados a aceptar e interpretar sus datos sin importar la relacin, que guarda con la hiptesis. Cuando los resultados contradigan lo sostenido por la teora en que se funda el estudio, la discusin del informe deber incluir una reconsideracin de la teora original a la luz de los nuevos descubrimientos. Los investigadores se muestran muy renuentes a presentar e interpretar los datos que se oponen a las investigaciones anteriores o a teoras ya aceptadas. Pero no debe excluir la posibilidad de que los resultados sean correctos y que los de estudios anteriores sean errneos. El progreso de la pedagoga se retrasara si los investigadores se negaran a comunicar los hallazgos que no concuerden con estudios previos. Los resultados contradictorios indican que una cuestin no est resuelta y pueden estimular otros anlisis. La investigacin ulterior o la elaboracin de teoras puede conciliar a la postre a 1os resultados que parezcan contradictorios. La teora es de carcter provisional y no debe disuadir para abstenerse de ofrecer una interpretacin directa de lo que descubri.
227
ELAS MEJA MEJA
La reconsideracin del fundamento terico de un estudio pertenece a la parte de la discusin. No hay por qu retroceder y volver a escribir las secciones del informe dedicadas a la hiptesis y a la literatura sobre el tema del trabajo. Interpretacin de los resultados cuando se retiene la hiptesis de nulidad Una hiptesis nula puede aceptarse por diversas razones, por lo cual la interpretacin de ese hecho puede ser muy difcil. Una hiptesis de nulidad puede retenerse por tres motivos: 1) Realmente es verdadera. Tal vez no hay ninguna relacin entre las variables, es posible que el tratamiento experimental no sea eficaz que el de control. 2) La hiptesis es falsa, pero los problemas de la validez interna contaminan la investigacin a tal grado que no se pueda observar la relacin entre las variables. 3) La hiptesis es falsa, pero la investigacin carece del poder para rechazarla. Cuando el investigador no sabe cul de estas causas es la que interviene, no deber valerse de ninguna de ellas para explicar los resultados. Es incorrecto presentar la retencin de una hiptesis de nulidad como prueba a favor de ausencia de relacin entre las variables, pues se la debe interpretar como falta de pruebas de la veracidad o falsedad de la hiptesis. El comercial de una conocida pasta dental afirma que las pruebas demuestran que un dentfrico particular es insuperable para combatir las caries dentales. Si interpretamos el adjetivo insuperable en el sentido de ninguna diferencia significativa, podemos imaginar una prueba en que particip un pequeo nmero de sujetos o en que hubo numerosos problemas de validez interna. Si lo que se desea en un experimento es retener la hiptesis de nulidad, la obtencin de ese resultado es la cosa ms sencilla. Si se est estudiando una poblacin pequea y es posible realizar un censo completo de la misma, la retencin de una hiptesis de nulidad puede interpretarse legtimamente como una carencia de relacin entre las variables dentro de esa poblacin. Tambin adquiere credibilidad cuando interviene una muestra extensa. Por ejemplo, el informe de Coleman con ms de 600,000 sujetos proporciona una base tan amplia que estamos dispuestos a admitir una falta observada de relaciones entre las variables como prueba de la inexistencia de relaciones. Sin embargo, en la mayora de los estudios la retencin de la hiptesis de nulidad no indica ms que falta de pruebas. Existe el peligro de que los investigadores se enamoran demasiado de sus hiptesis experimentales y cedan a la tentacin de ignorar el hecho de que se retuvo la hiptesis de nulidad. Citan problemas de validez interna y declaran que los resultados habran sido significativos si problemas imprevistos no hubiesen arruinado
228
el experimento. Desde luego necesitan comunicar todos los problemas de validez interna que surjan en un estudio, pero no deben usarlas como pretexto para justificar los resultados decepcionantes. Es preferible sugerir una investigacin ulterior, planeada de manera que evite los problemas de validez interna, pero incluso en tal caso subsiste la obligacin de mencionar que la retencin de la hiptesis indica ausencia de pruebas y nada ms. El poder de un experimento designa la capacidad estadstica de rechazar una hiptesis de nulidad cuando sea falsa. Este poder depende del tamao de la muestra, la heterogeneidad de los sujetos con respecto a la variable dependiente, la confiabilidad de los instrumentos de medicin y la naturaleza de los procedimientos estadsticos empleados para probar la hiptesis. Los investigadores debern tomar en cuenta estos factores al planear un experimento. Algunos textos de estadstica explican cmo planear los experimentos para que las relaciones significativas sean expresadas como observaciones estadsticamente significativas. Al planificar el estudio, hay que tomar en cuenta el poder del experimento; no se le ha de presentar al final para disculpar la carencia de significacin estadstica. Por ejemplo, no es lcito decir: los resultados habran tenido significacin estadstica si la muestra hubiese sido ms grande. Salvo raras excepciones, la nica interpretacin legtima de la retencin de una hiptesis de nulidad es que constituye la prueba a favor de una conclusin que no ha sido observada. Interpretacin de relaciones no contenidas en las hiptesis Se seal antes que el investigador no deber abandonar una hiptesis para seguir otras pistas ms prometedoras que aparezcan durante su estudio. Esto no significa que han de ignorarse las relaciones que no figuren en la hiptesis y que puedan observarse al efectuar el estudio. Por el contrario, registran y analizan con el mismo rigor con que se analizan las contenidas en la hiptesis. No obstante, tales hallazgos debern tomarse con mayor desconfianza que los relacionados directamente con la hiptesis, ya que existe una posibilidad considerable de que en un estudio aparezcan relaciones falsas no contenidas en la hiptesis. Deben figurar en el informe, pero se las juzgar incidentales en relacin con el fin principal de la investigacin. Habrn de ser tema de un estudio diseado especialmente para examinarlas y slo entonces servirn de base a las conclusiones.
229
ELAS MEJA MEJA
EL INFORME DE INVESTIGACIN
Los resultados de un proyecto tienen poco valor si no se puede comunicar a otros. En consecuencia, es indispensable que los investigadores conozcan los procedimientos para redactar un informe. En esta seccin se ofrece gua general para organizarlos y presentarlos. El investigador comunica en su informe los procedimientos y los resultados del estudio, y expone las consecuencias de estas ltimas y su relacin con otros conocimientos sobre el tema. Como los lectores son profesionales muy atareados, el informe debe ser muy conciso y contar con una estructura lgica. Las ancdotas, las descripciones de experiencias personales, las argumentaciones, y recursos ya no tienen cabida en l. Esto no quiere decir que el informe haya de ser aburrido y pedante. El estudio con que se haya abordado el tema se reflejar en la redaccin. El objetivo del informe consiste en presentar la investigacin y no la personalidad del autor; por eso el tono ha de ser impersonal y nunca se emplea la primera persona. No se escribir Asigne aleatoriamente a los sujetos a dos grupos de tratamiento sino Los sujetos fueron asignados aleatoriamente a grupos de tratamiento. A pesar del entusiasmo que produce la importancia de la labor, el autor no deber jactarse de ello sino dejar esta evaluacin en manos de los lectores y de la posteridad. Existe un mtodo formal y uniforme para presentar informes. Aunque a primera vista se piense que eso coacta la libertad, en la prctica cumple una funcin til. Es importante disponer los informes de manera que los lectores sepan exactamente dnde encontrar lo que buscan. En el captulo 3 se recomend que, cuando se vayan a reunir los estudios que tratan del tema, lo primero que se hace es leer el resumen de un artculo de revista. Si el artculo carece de esa seccin, no se puede evitar perder tiempo leyndolo ntegro para saber si es de inters. La existencia de un formato oficial elimina la necesidad de disear el propio. Al ahondar en este tpico se notar que el formato sigue las etapas un proyecto de investigacin delineada en captulos anteriores. Un informe adopta las siguientes modalidades: 1) una tesis o disertacin, 2) un artculo de revista, 3) una conferencia. Cada uno requiere un mtodo propio. Tesis La mayora de las universidades disponen de un manual que describe pormenorizadamente el formato que piden. Una vez elegido un manual, el informe se redacta de acuerdo con sus recomendaciones.
230
A continuacin aparece el orden y los componentes generales descritos en la mayora de los manuales de estilo: I. Pginas preliminares A) Portada B) Pgina de aceptacin C) Prefacio o testimonios de gratitud D) ndice E) Lista de cuadros F) Lista de figuras II. Texto A) Parte introductoria 1. Planteamiento del problema y justificacin del estudio 2. Objetivos 3. Definicin de trminos 4. Literatura sobre el tema B) Parte de los mtodos y los resultados 1. Sujetos 2. Procedimientos 3. Instrumentos 4. Presentacin y anlisis de los datos C) Exposicin de los resultados 1. Interpretacin 2. Consecuencias 3. Aplicaciones D) Conclusiones y resumen 1. Conclusiones 2. Resumen III. Pginas suplementarias A) Bibliografa B) Apndices C) Pequeo resumen autobiogrfico (si se requiere) D) Resumen
231
ELAS MEJA MEJA
I.
Pginas preliminares
Para preparar las pginas preliminares basta seguir fielmente las reglas de los manuales de estilo. No obstante, un aspecto de esas pginas que requiere una explicacin especial es el ttulo del estudio. El ttulo deber describir, con la mayor brevedad posible, la naturaleza especfica del estudio. Por ejemplo, consideremos: a) un estudio sobre nios con desventajas culturales en que se compara la celeridad de lectura de los alumnos que han participado en un programa del Head Start Project (proyecto de ventaja inicial) con los de un grupo apareado de nios sin experiencia preescolar formal, y b) el ttulo Una comparacin de las puntuacin obtenidas en una prueba de celeridad de lectura de nios con desventajas que han asistido a clases de ese programa durante seis semanas o ms y de nios similares con experiencia preescolar. Aunque este ttulo cubre el objetivo del estudio, resulta demasiado largo. Las frases como comparacin de... un estudio de, una investigacin de son a menudo superfluas. Adems, la mayora de los lectores sabrn que el proyecto Head Start es una experiencia cultural diseada para nios con desventajas culturales. Sin embargo, irse al extremo opuesto y ofrecer un ttulo demasiado corto o vago para que cubra la naturaleza del estudio constituye un error mucho ms grave. Los ttulos vagos o demasiado breves hacen necesario revisar el artculo para averiguar de qu se trata. Los ttulos como Ventaja inicial y celeridad o Lectura entre los nios con desventajas ilustran esta deficiencia. El ttulo deber identificar las variables ms importantes y las poblaciones de inters. Las definiciones operacionales de las variables ms importantes y la descripcin de las muestras no necesitan ir en el ttulo. El ttulo correcto asegurar una posicin adecuada en el ndice, por lo cual una estrategia muy til consiste en que los investigadores decidan en primer lugar bajo qu palabras claves desean situar sus estudios, y que a partir de esto lleguen a un ttulo conciso. En el ejemplo las palabras claves seran celeridad de lectura y proyecto de ventaja inicial. Por tanto, un ttulo apropiado podra ser: Celeridad de lectura en nios que participan en el proyecto Head Start y de los que no participan en l. Este ttulo es razonablemente corto y sin embargo da una indicacin vlida al lector sobre la naturaleza del estudio. Los ttulos que llevan una carga emocional como Tenemos que ampliar programas de la ventaja inicial o No permita que los nios con desvenas culturales se conviertan en lectores deficientes, debern evitarse a toda costa. Tales ttulos no ofrecen resultado de investigacin, sino artculos tericos e intentan vender un punto de vista.
232
II. Texto A) Parte introductoria. Incluye todo lo que sucedi al colocar los cimientos de la investigacin. Por lo general consta de materiales ya preparados para el proyecto, con pequeas alteraciones. La formulacin del problema y la justificacin del estudio permanecen iguales, as como la enunciacin de los objetivos, la definicin de los trminos y la revisin de los estudios sobre el tema. No obstante la relacin breve de las fuentes de los datos y de los mtodos se escribe en pretrito en lugar del futuro que se usa en el proyecto original. La revisin de los estudios relacionados con el tema suele presentarse como un captulo independiente de esta parte. B) Mtodos y resultados. Esta parte del informe contiene cuatro categoras de informacin: 1. Sujetos. Deber presentarse una clara descripcin de la muestra, de preferencia al inicio del informe. Esto le permite al lector juzgar la potencial validez externa del estudio. Se define la poblacin de la que se sac la muestra y se especifica el mtodo de muestreo. La clase de informacin que se ofrece en la descripcin de la muestra cambiar de un estudio a otro, pero casi es posible determinar qu poblacin incluir si se muestran las variables que podran influir en las puntuaciones de criterio. 2. Procedimientos. El informe sobre los procedimientos del estudio deber ser lo suficientemente completo para que cualquiera que desee reproducir la investigacin encuentre toda la informacin. Una de las caractersticas del mtodo cientfico es la posibilidad de confirmar los descubrimientos mediante la repeticin de los procedimientos y la informacin observacional que requiere la reproduccin. Esta seccin comprende el diseo del estudio, el nmero de grupos (si el estudio es un experimento), el tratamiento de los sujetos y otra formacin pertinente. 3. Instrumentos. Un informe de investigacin deber especificar todos los instrumentos de medicin y los sistemas de observacin adoptados en la realizacin del estudio. Estas descripciones pueden ser breves cuando se hayan usado mediciones corrientes como los exmenes de qumica del ACSNSTA, puesto que en la bibliografa figurar la informacin pertinente sobre tales instrumentos. Si han sido creados instrumentos especiales para el estudio tiene que proporcionarse una descripcin detallada de stos, as como datos a favor de su confiabilidad y validez y una explicacin de los procedimientos de puntuacin. 4. Presentacin y anlisis de los datos. Una tcnica conveniente para la presentacin y el anlisis estadstico de los datos consiste en organizar la
233
ELAS MEJA MEJA
exposicin a partir de las hiptesis, es decir, volver a enunciar la primera hiptesis en forma modificada y los resultados que se refieren a ella, y este procedimiento se repite en cada hiptesis. Los cuadros y las figuras ayudan a presentar los datos con mayor claridad y precisin de la que sera posible si la misma informacin figurase en el texto. La mayora de los manuales de estilo contienen ejemplos sobre los tipos comunes de cuadros y figuras e instrucciones para su construccin. Un cuadro bien integrado puede darle a1 lector una visin precisa de los datos. Los cuadros elaborados durante un estudio casi nunca pueden incorporarse de modo directo en el informe. Por ejemplo, al finalizar un estudio, hay una lista alfabtica de los sujetos y de sus puntuaciones en las mediciones de criterio. En lugar de insertar esta lista tal como est, convendra construirse un cuadro de la informacin en forma sumaria. Los cuadros de datos bsicos en bruto pueden incluirse en el apndice cuando se piense que contribuye a entenderles mejor. El primer cuadro del informe suele resumir los datos descriptivos como las medias, desviaciones estndar, correlaciones, porcentajes. En cuadros posteriores se muestran los resultados que se obtienen al aplicar a los datos la estadstica inferencial y las pruebas de significacin. Por ejemplo, podra usarse un cuadro sumario para presentar los resultados de un anlisis de varianza. Se aconseja disponer los cuadros en una forma que ilustre la relacin de datos con las hiptesis del estudio. Los principiantes a menudo caen en tentacin de incluir los datos en ambas formas, con lo cual hacen sus informes ms largos y tediosos. Un mtodo mejor consiste en exponer los datos mediante cuadros y figuras acompaadas de un texto que seale los descubrimientos ms importantes e interesantes. Es muy importante relacionar la informacin de los cuadros con las hiptesis. El fundamento estadstico del anlisis de los resultados debe ser expresado con claridad. Es conveniente relacionar el tratamiento estadstico con la presentacin de los datos. C) Exposicin de los resultados. Los resultados vuelven a interpretarse en relacin con las hiptesis (o preguntas), y se comentan las aplicaciones y consecuencias del estudio. 1. Interpretacin de los resultados. Esta parte del informe tal vez sea la ms difcil pero tambin la ms provechosa. La interpretacin que investigador hace sobre los resultados los relaciona con la teora, con los estudios sobre el tema y con los procedimientos de investigacin.
234
2. Consecuencias. En esta parte deber mencionarse tambin la contribucin de los resultados al conocimiento en el campo general de estudio, el investigador explica cmo los resultados modificarn las teoras y sugiere futuros estudios que convendra efectuar. 3. Aplicaciones. Una afirmacin sobre la aplicacin de los resultados ayuda al lector a conocer el grado en que los descubrimientos pueden usarse en la prctica. Las secciones dedicadas a las aplicaciones y consecuencias de los resultados a menudo no se exponen con suficiente amplitud porque se supone que tambin sern tan obvias para el lector. En realidad, durante el estudio el investigador logra una visin ms profunda del problema que la que puedan tener los lectores. Por lo tanto, cabe esperar que sus interpretaciones sean ms significativas que las de los lectores. D) Conclusiones y resumen. Las secciones de las conclusiones y del resumen forman el corolario del informe. 1. Conclusin. La exposicin de las conclusiones deber limitarse a las que tienen un apoyo directo en los datos aportados por la investigacin. Los investigadores tienden a sacar demasiadas conclusiones. Las hiptesis proporcionan una estructura conveniente para hacer conclusiones; es decir, los investigadores debern indicar si los descubrimientos apoyan o no a las hiptesis. Es importante distinguir entre resultados y conclusiones. Un resultado es una observacin directa. Una conclusin es una inferencia basada en los resultados. Por ejemplo, un estudio podra producir la siguiente observacin: las puntuaciones medias en una prueba de ortografa de los estudiantes instruidos con el mtodo A es significativamente ms alta que la media de los que fueron instruidos con el mtodo B. La conclusin de que el mtodo A es ms eficaz que el B no constituye un resultado directo del estudio sino que es una inferencia basada en los resultados. Los investigadores pueden incluir una breve exposicin de sus ideas sobre las consecuencias de sus resultados y dar algunas recomendaciones para las posibles aplicaciones. Tambin pueden sugerir nuevas preguntas de investigacin que emergen de su estudio. 2. Resumen. Como ser ms ledo que otras secciones del informe, su redaccin debe ser muy clara y concisa. El resumen suele incluir otra reformulacin sinttica del problema o problemas, las caractersticas principales de los mtodos y los hallazgos de mayor importancia. Despus de hacer un borrador de esta seccin, el autor deber verificarla cuidadosamente para asegurarse
235
ELAS MEJA MEJA
que el estudio y los resultados estn descritos en forma clara y concisa. Asimismo, ser necesario verificar que no se haya introducido ninguna informacin que no figure en las partes anteriores. Es conveniente que un colega lea esta seccin para tener la seguridad de que se est comunicando lo que se desea. III. Pginas suplementarias A) Bibliografa. Deben comprender todas las fuentes citadas en el texto y las notas a pie de pgina. Algunas universidades insisten en que slo se enumeren stas, pero otras solicitan que se citen adems las obras pertinentes que no hayan sido mencionadas de manera especfica. El manual de estilo seleccionado dar los detalles sobre el mtodo de citar las obras. Es necesario seguir esas reglas al pie de la letra. De hecho, es recomendable aprendrselas de memoria antes de iniciar la bsqueda de la literatura para el proyecto. Si cada obra se cita en la forma correcta tal como aparece, se evita perder tiempo para encontrarlas de nuevo y disponerlas en la bibliografa. Es conveniente transcribir en tarjetas las indicaciones bibliogrficas de manera que puedan colocarse en orden alfabtico. B) Apndices. Los apndices contienen materiales que no son lo suficientemente importantes para ponerlos en el cuerpo del informe, pero que puede tener valor para algunos lectores. Esos materiales abarcan entre otras cosas copias completas de las pruebas o cuestionarios ideados en la localidad, junto con las instrucciones y claves de puntuaciones de tales instrumentos, el anlisis de los datos de las medidas utilizadas, las instrucciones verbales para los sujetos y los cuadros que sean muy extensos o que sean de importancia menor para el estudio. C) Pequeo resumen autobiogrfico de los autores de informes de investigacin; datos acadmicos, experiencia, afiliacin profesional y contribuciones anteriores. D) Resumen. Muchas instituciones solicitan un resumen aparte de la disertacin, el cual debe contener una formulacin definitiva del problema y las descripciones concisas de los mtodos de investigacin, los resultados de mayor importancia, las conclusiones y las consecuencias. El resumen debe tener extensin limitada (por lo general 600 palabras o menos). Las pginas se numeran independientemente y se colocan al comienzo o al final de disertacin. Artculo de revista Al preparar un artculo de investigacin para publicarlo en una revista, un buen primer paso consiste en averiguar qu revistas publican la mayor cantidad de material acerca del tpico que se va a explorar. La informacin sobre el procedimiento para presentar artculos suele encontrarse en la parte interior de la portada de la revista.
236
Algunas especifican el manual de estilo que habr de usarse, por ejemplo el Manual de Publicaciones de la Asociacin Estadounidense de Psicologa o el Manual de Estilo de la Asociacin Nacional de Educacin. Si no se seala ningn manual, el estilo preferido, mtodo de citar obras y otros detalles se escogen consultando artculos del ejemplar reciente de la revista. Un artculo de investigacin sigue las mismas lneas generales que una disertacin, pero debe ser ms corto. La funcin de las tesis o disertaciones es demostrar la competencia de un estudiante, y se requiere una exposicin completa de la investigacin afn, descripcin exhaustiva de los procedimientos, tabulacin ntegra de los resultados y una elaboracin reflexiva. El artculo de revista, en cambio, slo exige que el autor comunique su contribucin al conocimiento. Como la revista dispone de poco espacio y los lectores poco tiempo, el artculo debe ser conciso. La seccin de la literatura sobre el tema contiene slo aquellos resultados y argumentos que forman la base del problema. La formulacin general del problema se da en un prrafo o, de ser posible, se omite. En este ltimo caso el artculo comenzar con la hiptesis. La parte destinada a procedimientos se presenta tambin con gran brevedad, si es posible se incluye toda la informacin necesaria para reproducir el experimento. La seccin de los resultados es la de mayor inters para el lector, en consecuencia ocupar una proporcin mayor del artculo que en una disertacin. Slo los hallazgos ms importantes debern exponerse en detalle. Una breve carta explicativa deber acompaar al manuscrito, junto con sellos de correo para su devolucin si no es aceptado. El editor suele remitirle al autor una tarjeta en que acusa recibo del artculo y hace circular copias del mismo al comit de lectura para que lo revise. Transcurre un considerable lapso de tiempo antes que se informe al autor si su trabajo fue aceptado o rechazado (casi siempre 6 semanas). Si el artculo es aceptado, pasan muchos meses antes que aparezca en la revista. Cuando una revista rechaza un manuscrito, la notificacin suele ir acompaada de una explicacin de las razones. Tal rechazo no quiere decir que no merezca publicarse. La decisin puede depender de muchos factores, a saber: la competencia por el espacio, los cambios de la poltica editorial o los prejuicios de los miembros del comit de lectura. Un artculo rechazado por una revista puede ser revisado y sometido a otra. Muchos artculos recorren diversas revistas hasta encontrar que finalmente son aceptados. No es correcto someter un artculo a varias revistas simultneamente.
237
ELAS MEJA MEJA
Conferencia Algunos investigadores descubren que los ensayos que se leen en convenciones profesionales constituyen una buena manera de mantenerse al da en el campo. Ello se debe a que transcurre un gran lapso entre la terminacin de un proyecto de investigacin y su publicacin. El periodo es a veces tan largo las revistas especializadas han sido motejadas de archiveros. Las ponencias que se presentan en las reuniones profesionales pasan por preparacin muy similar a la de los artculos de revista. No siempre irn de ser informes de investigaciones terminadas, sino que pueden constituir informes sobre los progresos de proyectos en curso. El ensayo es menos formal que un artculo de revista y por lo general puede ajustarse con mayor precisin a su audiencia. Por lo comn se piensa que el auditorio est familiarizado con los detalles de las investigaciones afines y con los mtodos de medicin. La ponencia se organiza en la siguiente forma: 1. Formulacin directa de la hiptesis. 2. Breve descripcin de los procedimientos. 3. Resultados, conclusiones y consecuencias. El tiempo permitido por leer una ponencia suele ser bastante corto, usualmente menos de quince minutos. En consecuencia, deber abordar los aspectos ms importantes del estudio. Un mtodo prctico consiste en asignar de 2 1/2 a 3 minutos por pgina del tamao de carta mecanografiada a doble espacio. Cuando los cuadros y figuras ayuden a la presentacin, conviene distribuirse copias entre la audiencia. Algunos oradores tambin distribuyen copias del texto de su ponencia entre los oyentes pero como la audiencia la lee en silencio con mayor rapidez que el conferenciante, la atencin puede perderse. Es preferible disponer de una descripcin completa del estudio mimeografiada, que se entrega a quienes la soliciten despus de la presentacin de la ponencia.
ERRORES COMUNES EN LOS INFORMES DE INVESTIGACIN

Dvorak estudi cerca de 18,000 informes de educacin comercial y compil una larga lista de deficiencias que nos proporciona una buena lista de verificacin. Los redactores de informes de investigacin harn bien en estudiarla.
Ttulo del informe de investigacin. Demasiado largo. No refleja con exactitud el problema resuelto; es decir, es ms amplio o estrecho que el problema planteado.
238
TCNICAS E INSTRUMENTOS DE INVESTIGACIN El problema. Se omiten la formulacin y el anlisis del problema, las delimitaciones, definiciones y objetivo(s) del estudio. Todo ello se trata, tan a la ligera o est tan esparcido en el informe que resulta dificilsimo determinar el problema que el investigador intenta resolver. La formulacin y el anlisis del problema, las delimitaciones, las definiciones y el objetivo(s) del estudio figuran en el informe de manera organizada pero se observan algunas deficiencias graves en los siguientes aspectos: El problema es demasiado amplio como para que lo solucione una persona con recursos limitados. La importancia del problema es nula o insignificante (se tiene la impresin de que la persona estaba interesada nicamente en satisfacer un requisito del curso y no en obtener una experiencia profesional de valor). La formulacin del problema es ambigua, adolece de un exceso de palabras, demasiado largo y complicado (contiene prrafos que podran incluirse en las delimitaciones) y no est en armona con los descubrimientos que comunica. El anlisis no logra redondear el concepto del problema; no se identifica o no se indica con claridad el acervo de datos necesarios como base para la solucin del problema. La explicacin de un problema bastante difcil de captar est mal escrita o fue omitida. Se pasan por alto las delimitaciones ms importantes que se requieren para fijar claramente el mbito del estudio, no estn colocadas donde beneficiara al lector o no se expresan adecuadamente. Las delimitaciones afines no estn situadas en proximidad una de otra. No hay definiciones de los trminos que se necesitan para una clara comprensin del estudio. Literatura sobre el tema. Falta esta literatura. Aunque hay informe de la literatura afn, pueden observarse ciertas deficiencias. Algunos de los artculos presuntamente relacionados con el tema, en realidad no lo estn en absoluto o slo guardan un nexo remoto. Se tiene la impresin de que esta parte del informe fue rellenada. No hay informe sobre las relaciones de los artculos con el estudio. Casi todo se reduce a una lista de sumarios; esto es, no se capta ninguna norma slida de organizacin. En otras palabras, aunque la clasificacin es posible no se intenta realizarla. El volumen y la pertinencia de la literatura no se indican desde el comienzo; es necesario leer toda la seccin y enjuiciarla uno mismo. 239
ELAS MEJA MEJA No se utiliza el original de un artculo a pesar de que sera relativamente fcil de obtener. Ninguno de los artculos relacionados con el tema se acompaa de su respectiva informacin bibliogrfica. Mtodos de investigacin y el procedimiento. No se informa sobre los mtodos de investigacin ni sobre el procedimiento seguido. Los mtodos de investigacin y el procedimiento estn descritos en forma tan ambigua y esquematizada que la importancia de la investigacin es difcil de captar. Ambos aparecen en el informe, pero pueden observarse serias deficiencias: La adecuacin de los mtodos de investigacin es discutible. Los mtodos de investigacin fueron identificados de modo incorrecto. El procedimiento que se sigui est muy disperso; es decir, una falta de organizacin impide entender la totalidad del plan. La naturaleza de los datos empleados en la solucin del problema no se describe, o la descripcin que constituye no es otra cosa que una repeticin de los elementos del problema. Las fuentes de actos no se nombran o resultan inadecuadas en trminos del problema por resolver. No se da la fecha de los materiales publicados. No existen indicaciones sobre las bases para preparar los instrumentos con que se recabaron los datos: en el informe no figuran copias de ellos. Los instrumentos no se confeccionaron con suficiente cuidado, ninguno de ellos ha pasado por una prueba de ensayo. Resultan inapropiados para recopilar el tipo de datos que se busca. Las bases para la seleccin de los casos no se mencionan. El nmero de casos es muy pequeo o demasiado grande. No se hacen pruebas para precisar el monto, la validez y la confiabilidad de los datos o se aplican otras pruebas injustificables. Hay detalles innecesarios esto es, no se discierne entre lo superfluo y lo importante que hacen tediosa y difcil la lectura del procedimiento y obstaculizan la deteccin de los pasos mas importantes que se dan. Se omiten las etapas para procesar e interpretar los datos y para realizar generalizaciones, o han sido elaboradas en forma tan deficiente que no se puede determinar fcilmente lo que hizo el investigador. Los instrumentos estadsticos se usan de manera incorrecta.
240
TCNICAS E INSTRUMENTOS DE INVESTIGACIN En los estudios experimentales 1os factores, a diferencia de otras, no son controlados con cuidado. Resultados. El informe de los resultados se basa en datos que no se explican en la formulacin ni en el anlisis de problemas ni tampoco en el procedimiento. Aparecen datos sin procesar y la forma que se emplea es demasiado spera para que el lector obtenga el mximo beneficio de los resultados. Puede decirse que los datos no se distinguen de los hallazgos. Los resultados estn incompletos; es decir, no se explican todos los datos de los casos incluidos en el estudio. Los prejuicios del investigador son patentes. Los resultados secundarios reciben demasiada atencin; esto es, no estn enfocados desde la perspectiva adecuada. Los resultados de los subgrupos no se comunican. El formato para la presentacin de los datos bloquea la penetracin. La interpretacin de los datos se confunde con el resumen de los mismos. El resumen es defectuoso en puntos estratgicos. Generalizaciones. No se traza una distincin entre hallazgos y generalizaciones. Por ejemplo, a los resmenes de los resultados se les califica de conclusiones. No se hacen generalizaciones, aunque las bases para efectuarlas estn claras. Se ejecutan generalizaciones ms all de lo que permiten los datos recopilados. Las premisas para sacar la generalizacin son discutibles. Los prejuicios del investigador son patentes. Las generalizaciones estn basadas en la literatura afn y no en los resultados del estudio. No se distingue entre conclusiones y recomendaciones.
RESUMEN
Como casi todas las universidades poseen servicios de computacin electrnica, los investigadores pueden utilizarlas en el procesamiento de sus datos. El uso de las computadoras ahorra tiempo y energa y garantiza un alto grado de precisin en los clculos muy complejos. Para emplear computadoras en el procesamiento de los datos, el investigador necesita traducirlos a una forma que pueda ser leda por ellas e impartirles
241
ELAS MEJA MEJA
instrucciones por medio de un programa adecuado para que acten sobre la informacin. Se requiere un entrenamiento para escribir programas de computacin, pero el investigador puede usar, en el anlisis de sus datos, los programas ya preparados con que se cuenta actualmente. La interpretacin de los resultados de un estudio ser una labor directa si, en el proyecto, el investigador ha puesto un fundamento apropiado pare el estudio. Tnganse presentes estas recomendaciones: 1) la interpretacin habr de basarse estrictamente en los datos derivados del estudio, 2) los problemas de validez interna y externa y otras limitaciones del estudio se tomaran en cuenta, y 3) Las conclusiones deben presentarse como afirmaciones de probabilidad y no como hechos. Los resultados negativos merecen el mismo respeto e interpretacin que los positivos. La retencin de una hiptesis de nulidad no significa que los datos son insuficientes, y nada ms. Los resultados que no se obtengan a partir de la hiptesis deben presentarse como fuentes de futuras hiptesis.
242
BIBLIOGRAFA
ANGERA, Mara Teresa, (1997): Metodologa de la observacin en las ciencias humanas. Madrid, Editorial Ctedra S.A. ARNAU, Jaime, (1978): Mtodos de investigacin en las ciencias humanas. Barcelona, Editorial Omega. ARY, JACOBS y RAZAVIEH, (1982): Introduccin a la investigacin pedaggica. Mxico, Editorial Interamericana. BOOTH, Wayne C. y otros, (2004): Cmo convertirse en un hbil investigador. Barcelona. Editorial Gedisa. BRIONES, Guillermo, (1986): Mtodos y tcnicas de investigacin para las ciencias sociales. Mxico, Editorial Trillas. BRIONES, Guillermo, (1986): Curso avanzado de tcnicas de investigacin social aplicadas a la educacin: Mdulo I.. Santiago de Chile, Editorial IDCR. CALELLO, Hugo y NEUHAUS, Susana, (1999): Mtodo y antimtodo. Buenos Aires, Ediciones Colihue. CASTRO, Luis, (1977): Diseos experimentales sin estadstica. Mxico, Editorial Trillas. CATALDI AMATRIAN, Roberto M., (2001): Los informes cientficos: Cmo elaborar tesis, monografas, artculos para publicar. Buenos Aires, Editorial Lugar. CATENA, Andrs y otros, (2003): Anlisis multivariado: Un manual para investigadores. Madrid, Editorial Biblioteca Nueva. COCHRAN, William y COX, Gertrude, (1985): Diseos experimentales. Mxico, Editorial Trillas. DAY, Robert, (1996): Cmo escribir y publicar trabajos cientficos. Washington. OPS, Publicacin Cientfica N 558.
243
ELAS MEJA MEJA
De KELETE, Jean-Marie, (1995): Metodologa para la recogida de informacin. Madrid, Editorial La Muralla. ECHEVERRA, Javier, (2003): Introduccin a la metodologa de la ciencia: La filosofa de la ciencia en el siglo XX. Madrid, Editorial Ctedra. ELLIOT, Jhon, (2000): La investigacin en Educacin. Madrid, Editorial Morata. ESCOTET, Miguel A., (1980): Diseo multivariado en psicologa y educacin. Barcelona, Editorial CEAC. FESTINGER, Len y KATZ, Daniel, (1992): Los mtodos de investigacin en las ciencias sociales. Madrid, Editorial Paids. FEYERABEND, Paul K., (1981): Contra el mtodo. Barcelona, Editorial Ariel. FOX, David, (1981): El proceso de la investigacin en educacin. Pamplona, Ediciones de la Universidad de Navarra. GLASS y STANLEY, (1985): Mtodos estadsticos aplicados a las Ciencias Sociales. Mxico, Editorial Prentice Hall International. GOODE, William y HATT, Paul, (1975): Mtodos de investigacin social. Mxico, Editorial Trillas. GUTIRREZ PANTOJA, Gabriel, (1980): Metodologa de las ciencias sociales. Mxico, Editorial Harla. HABER, Andr y RUNYON, Richard, (1973): Estadstica general. Mxico, Fondo Educativo Interamericano. HERNNDEZ, FERNNDEZ y BAPTISTA, (1998): Metodologa de la Investigacin. Mxico, Mc Graw-Hill. KERLINGER, Fred, (1975): Investigacin del comportamiento. Mxico, Editorial Interamericana. KERLINGER, Fred, (1981): Enfoque conceptual de la investigacin del comportamiento. Mxico, Editorial Interamericana. KLIMOVSKY, Gregorio, (1997): Las desventuras del conocimiento cientfico. Buenos Aires, AZ Editora. KHUN, Thomas S., (1997): Qu son las revoluciones cientficas y otros ensayos? Barcelona, Editorial Paids. LEN y MONTERO, (1999): Diseo de investigaciones. Madrid, Mc Graw-Hill. LIGHT, Richard y PILLEMER, David, (1984): Revisando investigaciones. Washington, OPS.
244
LUNA CASTILLO, Antonio, (1998): Metodologa de la tesis. Mxico, Editorial Trillas. MARTN, Michael y Mc INTIRE, Lee, editores, (1994): Readings in the philosophy of social science. Cambridge, Publicaciones del Instituto Tecnolgico de Massachussets. Mc. KERNAN, James, (2001): Investigacinaccin y currculo. Madrid, Editorial Morata. MEJA, Elas y REYES, Edith, (1994): Operacionalizacin de Variables Conductuales. Lima, CENIT Editores. MEJA, Elas, (1996): Factores del xito acadmico en estudios de post grado. En: Revista Peruana de Educacin. Ao I Nmero 1. Enero 1996. Lima, Optimice, Divisin Editorial. MEJA, Elas, compilador, (2001): La investigacin cientfica. Lima, Cenit Editores. MELTZOFF, Julin, (2000): Crtica a la investigacin. Psicologa y campos afines. Madrid, Alianza Editorial. MNDEZ, Carlos, (1998): Metodologa, Gua para elaborar diseos de investigacin. Bogot, Mc Graw-Hill. MNDEZ, GUERRERO, MORENO y SOSA, (1998): El protocolo de investigacin. Lineamientos para su elaboracin y anlisis. Mxico, Editorial Trillas. MNDES RAMREZ, Ignacio y otros, (2000): El protocolo de investigacin: Lineamientos para su elaboracin y anlisis. Mxico, Editorial Trillas. MORIN, Edgar, (1999): El mtodo. Madrid, Ediciones Ctedra S. A. MUOZ RAZO, Carlos, (1998): Cmo elaborar y asesorar una investigacin de tesis. Mxico, Editorial Prentice Hall. NAGEL, Ernest, (1961): La estructura de la ciencia. Madrid, Editorial Paids. NAMKFOROOSH, (2003): Metodologa de la investigacin. Mxico, Editorial Limusa. PIERGIORGIO, Cobertta, (2003): Metodologa y tcnicas de la investigacin social. Madrid, Editorial Mc Graw-Hill. POLIT y HUNGLER, (1998): Investigacin cientfica en ciencias de la salud. Mxico, Mc Graw-Hill Interamericana.
245
ELAS MEJA MEJA
POPPER, Karl, (1980): La lgica de la investigacin cientfica. Madrid, Editorial Tecnos. RAMOS, Manuel Miguel y otros, (2004): Manual de mtodos y tcnicas de investigacin en ciencias del comportamiento. Madrid, Editorial Biblioteca Nueva. RODRGUEZ, Aroldo, (1980): Investigacin experimental en psicologa y educacin. Mxico, Editorial Trillas. RODRGUEZ GMEZ, Gregorio y otros; (1996): Metodologa de la investigacin cualitativa. Mlaga, Editorial Aljibe. ROJAS SORIANO, Ral, (1986): El proceso de la investigacin cientfica. Mxico, Editorial Trillas. ROSAS, Luca, (1990): Iniciacin del mtodo cientfico experimental. Mxico, Editorial Trillas. RUIZ LABUENAGA, Jos y otros, (2002): Cmo elaborar un proyecto de investigacin social. Bilbao, Editorial de la Universidad de Deusto. SALKIND, Neil, (1998): Mtodos de investigacin. Mxico, Prentice Hall. SAMAJA, Juan, (1993): Epistemologa y metodologa: Elementos para una teora de la investigacin cientfica. Buenos Aires, Editorial Eudeba. SCOTT, William A. y WERTHEIMER, M., (1981): Introduccin a la investigacin de la Psicologa. Mxico, Editorial El Manual Moderno. SIEGEL y CASTELLAN, (1998): Estadstica no paramtrica. Mxico, Editorial Trillas. SIERRA BRAVO, R., (1986): Tesis doctorales y trabajos de investigacin cientfica. Madrid, Editorial Paraninfo. SIERRA BRAVO, R., (1992): Tcnicas de investigacin social, teora y ejercicios. Madrid, Editorial Paraninfo. TABORGA, Huscar, (1992): Cmo hacer una tesis. Mxico, Editorial Mc Graw-Hill. TAMAYO y TAMAYO, Mario, (2004): El proceso de la investigacin cientfica. Mxico, Editorial Limusa. VALOR YEBENES, Juan A., (2000): Metodologa de la investigacin. Madrid, Editorial Biblioteca nueva. Madrid. ZORRILLA, Santiago y otros, (1997): Metodologa de la investigacin. Mxico, Editorial Mc Graw-Hill. ZORRILLA y TORRES, Xamar, (1992): Gua para elaborar la tesis. Mxico, Editorial Mc Graw-Hill.
246
247
ELAS MEJA MEJA
CEPREDIM
SE TERMIN DE IMPRIMIR
EN EL MES DE NOVIEMBRE DE 2005, EN LOS TALLERES GRFICOS DEL
CENTRO DE PRODUCCIN EDITORIAL E IMPRENTA DE LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS JR. PARURO 119. LIMA 1. TELFONO: 619-7000 ANEXOS: 6009, 6011, 6015 CORREO ELECTRNICO: CEPEDIT@UNMSM.EDU.PE TIRAJE: 1000 EJEMPLARES
248

Tecnica S

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tecnica S

Cargado por

Copyright:

Formatos disponibles

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

Elas Meja Meja

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

UNMSM LIMA - 2005

ELAS MEJA MEJA

FACULTAD DE EDUCACIN UNIDAD DE POST GRADO

Director de la UPG Comit Directivo de la UPG

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

DR. ELAS MEJA MEJA DIRECTOR DE LA UNIDAD DE POST GRADO

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

INSTRUMENTOS DE ACOPIO DE DATOS

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

INSTRUMENTOS DE ACOPIO DE DATOS

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

4. MEDICIN DE VARIABLES CONDUCTUALES

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

5. INSTRUMENTOS DE ACOPIO DE DATOS

ELAS MEJA MEJA

6. INSTRUMENTOS PARA EL ESTUDIO DE VARIABLES CONDUCTUALES

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

FRAGMENTO DE UNA PRUEBA DE ACTITUDES

7. CUALIDADES DE LOS INSTRUMENTOS DE ACOPIO DE DATOS

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

Sean los siguientes datos: n = 18 x = 14,27 = 3,1 Entonces:

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

El resultado 0,57 significa que la prueba tiene bajo ndice de confiabilidad.

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ELAS MEJA MEJA

8. PRINCIPIOS PARA CONSTRUIR PRUEBAS

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

9. TCNICA PARA ELABORAR PRUEBAS

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

ESTRUCTURA DE UNA PRUEBA

ELAS MEJA MEJA

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

10. INDICADORES DE LA CALIDAD DE UNA PRUEBA

ELAS MEJA MEJA

11. GRADO DE DIFICULTAD DE LA PRUEBA

= Grado de dificultad de la prueba. = Promedio de los puntajes obtenidos.

Esta es una prueba relativamente difcil.

TCNICAS E INSTRUMENTOS DE INVESTIGACIN

12. NDICE DE DISCRIMINACIN DE UNA PRUEBA

pms pmi x 100 PM

= ndice de dificultad de la prueba.