Universidad del Valle de Guatemala

Facultad de Educación
Maestría en Educación

Libros de Evaluación

Evaluación de los Aprendizajes
Lic. Fernando Rubio

Amalia Ruballos Carné 01 513

Guatemala, 03 de octubre de 2008

1.

Glaser presenta las características de una prueba referida a criterio. En ese sentido:

a. Características de las Pruebas Referidas a Criterio:

Una prueba referida a criterio es aquella que se construye para presentar resultados directamente interpretables. Es decir, se refiere a los logros de los estudiantes con respecto a las metas (objetivos de aprendizaje) o las competencias que el sistema persigue que éstos alcancen, en este caso los puntajes tienen sentido absoluto en función del dominio que ha sido medido en la prueba. Cuando se usa pruebas referidas a criterio tiene un significado algo diferente con respecto a medidas educativas o psicológicas. Uno de estos usos involucra la noción que anota en un logro que mide el instrumento (X) y se correlacione con los resultados de una segunda situación de la medida (Y). Una segunda interpretación prevaleciente del término criterio en la medida de logro involucra la imposición de una magnitud de los resultados aceptables como un índice de logro. A menudo se aplican ambas concepciones del término criterio a un solo instrumento de la medición: Una prueba puede servir para seleccionar a los estudiantes desde un punteo de corte de acuerdo a los resultados obtenidos. b. Contraponga las pruebas referidas a criterio a las pruebas referidas a normas. Incluya ámbitos de aplicación de cada una (Garvin), ventajas y desventajas de cada una. La principal preocupación es medir el logro de los objetivos educacionales; la medida no es un fin en sí misma; y no se dirige la instrucción sólo para medir su efecto. Así mismo, la instrucción tampoco es un fin, pues el objetivo de toda instrucción es cambiar la probabilidad entre las alternativas de respuesta en un proceso. La diferencia sustancial entre las pruebas referidas a criterio y a norma es que la primera provee información de los conocimientos y aplicación de habilidades específicas y personales mientras que las referidas a norma se

sino la comparación contra un grupo de especificaciones o estándares. Un examen de matemáticas producía un puntaje en un rango del 0 al 100 que probablemente no diría nada explícitamente sobre el nivel de matemática adquirido por el estudiante que obtenía un puntaje de 50. pero no necesariamente tiene que relacionarse. tan sólo dice que él conoce más matemáticas que otros estudiantes que tienen un puntaje de 40. entonces se puede decir que ha pasado la prueba y que se tiene información sobre su habilidad que se puede relacionar. en el cual se requiere un determinado número de habilidades y destrezas y no solamente los conocimientos sino la aplicación de los mismos. Por otro lado. si una persona compara las habilidades entre las personas de un mismo grupo no es la herramienta idónea para certificar un cierto nivel de competencia.limitan a la clasificación dentro de un grupo de personas o bien a la clasificación entre grupos. las pruebas referidas a la norma. La información de las pruebas referidas a norma es valiosa cuando interesa la agrupación de estudiantes en determinados cursos o para dar un rango a los alumnos en algún orden de mérito. Las pruebas referidas a criterio son utilizadas por ejemplo en una prueba de habilidad mecanográfica un estudiante puede escribir 150 palabras en un minuto. es esencialmente cuantitativa. La naturaleza de la información proporcionada por los tests referidos a normas. Otro ejemplo es el reclutamiento de personal. pero menos que un tercero que tuvo un puntaje de 70. pero las cantidades expresadas en términos de los puntajes del test no pueden ser inmediatamente transformados en cantidades de aprendizaje. También pueden usarse para contrastar grupos. . con el rendimiento de otros estudiantes en la misma prueba.

La distinción se encuentra en: a) el propósito para el cual la prueba fue construida b) la manera con la que fue construida c) la especificidad de la información sobre el dominio de tareas pertinentes. si una persona tiene las características idóneas para ejercer un puesto o trabajo enfocado específicamente en lo que la persona puede hacer. diferenciar una prueba de criterio de una prueba referida a norma solamente viéndola puede ser confuso. resúmalas La diferencia entre una prueba referida a norma y una prueba referida a criterio no puede definirse fácilmente por la descripción de un instrumento particular. las pruebas referidas a criterio están orientadas a brindar una información más personal y cualitativa. es decir. d) la generalización de información de actuación de prueba al dominio. Brevemente. c. De hecho una prueba de referida a criterio puede ser usada como referida a norma que se usan para determinar la actuación de una persona en relación a la actuación de otros individuos en el mismo instrumento de la medición. Popham y Husek examinan las implicaciones técnicas de las pruebas referidas a criterio. Las ventajas de la evaluación por criterio se deben a que tienen una mejor interpretación para la toma de decisiones.Sin embargo. No debería hacerse análisis cruzados de norma y criterio. y e) el uso de la información de la prueba obtenida. De allí las pruebas referidas a criterio no solamente asume el reto de resumir la actuación de un estudiante en una prueba. aun cuando su uso no es convencional La Distinción Básica no es posible. Ya que las referidas a norma no toman en cuenta la relativa habilidad. porque el individuo se compara con algún grupo normativo como se describen las tales medidas. sino también cómo asegurar que la prueba se construyó de una manera apropiada a su uso. La mayoría de pruebas estandarizadas pueden ser clasificadas como referidas .

Las pruebas referidas a criterio se emplean para hacer ambas estimaciones. Con las pruebas criterio la variabilidad es no pertinente. Sin embargo. las referías a criterio se usan para determinar el estado de una persona con respecto a algún criterio. Construcción de Items . La variabilidad El problema de variabilidad está en el centro entre una prueba referida a norma y una referida a criterio. El problemas. por lo general. debido a que interesa lo que él puede hacer y no como se compara con los otros. en el caso de decisiones con respecto a los individuos uno podría usar una prueba referida a criterio para determinar si un estudiante había dominado una habilidad que se considera requisito previo para comenzar un nuevo programa. Una característica importante es que la varianza obtenida por estos tests debe ser grande para permitir comparaciones entre individuos. no es sorprendente que su propósito primario sea tomar decisiones individuales. La toma de decisiones con respecto a una persona puede hacerse más fácilmente si sabiendo más sobre las otras personas y cómo él puede compararse. grupales e individuales.a norma. Si en las pruebas referidas a norma se utilizan medidas para facilitar las comparaciones entre individuos. El significado del puntaje no es dependiente en la comparación con otros puntajes. Desde el significado más profundo una prueba referida a norma el puntaje es básicamente dependiente en la posición relativa comparado con otros. mayor variabilidad en los puntajes es mejor. es que estas pruebas no son sensibles a diferencias culturales pudiendo afectar así a muchos alumnos como consecuencia de las decisiones tomadas que consideraron sus diferencias culturales. Para poder ampliar la varianza los evaluadores se valen de ciertas técnicas entre las cuales está el índice de discriminación que permite conocer la relación entre el desempeño de un ítem aislado con el desempeño en el test completo.

Si refleja un atributo importante del criterio. entonces todos los ítems deben ser bastante similares. Difícil o fácil. La validez Las pruebas referidas a criterio son basadas en la relevancia clara de la prueba a las conductas legítimas. lo más importante es hacer que el ítem presente las conductas delimitadas por el criterio. que distingue exactamente o no. se necesita interpretar la prueba apropiadamente para tomar la mejor decisión. Reporte e Interpretación Se han utilizado conceptos de pruebas referidas a norma y pruebas referidas a criterio. Análisis de ítems Por ejemplo. Podría ser que un poco de Las personas que redactan ítem de construcción usualmente se aseguran de definir deficiencias en la instrucción causó el resultado en lugar de cualquier falta del ítem. Todavía. Fiabilidad La prueba debe ser internamente consistente. para tomar decisiones sobre los individuos y tratamientos. Un ítem que no discrimina se elimina.Su regla principal es asegurarse que el ítem sea reflexión exacta de la conducta del criterio. Los ítems que discriminan normalmente son demasiado fáciles. tal ítem debe permanecer en la prueba. Por consiguiente. demasiados duros y/o ambiguos. claramente el dominio. Para pruebas de criterio los índices de discriminación deben modificarse. Si se determina que los ítems se atan a un criterio. Interesa el comportamiento de un individuo respecto a la . Pensando en valor de un ítem identificado como un discriminador negativo. más probablemente es que el ítem sea deficiente. en una prueba de logro un ítem no satisfactorio sería uno que no discrimina entre el mejor y el menor conocedor de los estudiantes.

los ítems en la prueba son una muestra de la potencialidad del grupo que podría generarse de un criterio. En el caso ideal los ítems se atan no sólo al criterio pero. la prueba. además. examine las prácticas de evaluación de aprendizaje usada en nuestro medio. d. Las pruebas de clase son una muestra del total de conocimientos impartidos. sin embargo. pues considero que las pruebas no determinan con exactitud lo que el estudiante es capaz de hacer. los tales índices no son apropiados. Además es importante subrayar que no se pueden considerar de criterio porque los resultados obtenidos son puramente cuantitativos pues no reportan las cualidades del estudiante sino la cantidad en la que se encuentra su conocimiento y la aplicabilidad de éste. Todos los que han conseguido el mismo resultado en una prueba los han conseguido de la misma manera. El otro tipo de prueba es más típico.actuación de otros. el resultado en la prueba no es completamente inequívoco. Si la prueba es homogénea. Popham) . ¿Por qué? No. No es posible medir todos los conocimientos. este tipo de prueba es todavía un sueño. Tipos diferentes de Pruebas referidas a criterio Los dos tipos son un caso ideal y un caso típico. es decir. Esto lleva a centrarse relativamente a una referencia a norma. Usando el punto anterior. Al interpretar los resultados de un individuo frente una prueba referida a criterio. Pueden o no considerase como pruebas referidas a criterio las pruebas usadas rutinariamente en el aula. si nosotros sabemos que un estudiante ganó una nota de 90 por ciento sabemos qué el estudiante fallo un diez por ciento. el nivel de conocimiento no determina que éstos puedan ser llevados a la práctica que es lo más caracteriza a las pruebas de criterio. El significado de un resultado en sí es inequívoco. esto nos dice apropiadamente lo que el estudiante puede hacer. (The true about the testing. Sin embargo.

Dado a la baja calidad de las pruebas de alto impacto actuales. sería una contribución significativa para la calidad de educación que reciben nuestros niños. Kohn. Popham (The truth of testing) y Kohn (The case against standardize testing) debaten sobre el uso de pruebas de alto impacto o altas implicancias (high stakes testing). Considera que este tipo de pruebas no permite que los estudiantes muestren lo que pueden hacer con lo que saben. a.2. si las pruebas que están siendo empleadas actualmente ayudan o entorpecen la calidad de educación que los niños reciben. El utilizar programas de evaluación en donde se incluyan de forma correcta las diversas clases de pruebas de alto impacto. Para él no todas las pruebas son igual de malas. . Popham Las consideraciones más serias en la creación y uso de los programas de pruebas de alto impacto son. los estudiantes se ven más afectados de forma negativa que de forma positiva. El reto consiste en emplear test educativos que cumplan con la función de responsabilidad además de proveer a los maestros objetivos de instrucción adecuados. • Un determinado período de tiempo. actualmente la mayoría de pruebas de alto impacto son mal utilizadas y que su uso afecta la calidad de enseñanza de los estudiantes. Además. b. e incluso los menos útiles o el más perjudicial de los programas de evaluación incluyen: • Una norma de referencia en la que los estudiantes deben contestar. que puede de forma simultánea proveer evidencia de la calidad de las escuelas estatales y ayudar a los maestros a promover en los estudiantes el verdadero dominio de destrezas y conocimientos. • Preguntas de opción múltiple. Además cree que es posible unificar y crear un amplio programa estatal de pruebas de alto impacto.

que estar a la defensiva. Además. los docentes se sienten presionados cuando se les pide que cumplan con estándares y conduce a los mismos a tomar decisiones como: que se copien los estudiantes en las pruebas. renunciar a su trabajo y en el mejor de los casos ser más competitivos. • Lo anterior ha causado que los docentes social y moral de sus estudiantes. • Por otro lado es preocupante que en exámenes la administración de estos los resultados positivos en las pruebas solamente sean no atiendan el desarrollo consecuencia de desarrollar buenas habilidades para tomar exámenes. Menciona que la consecuencia más significativa es que este tipo de pruebas han idealizado que “aprender para la prueba” se convierta en un objetivo prioritario y eso hace que la mayoría de las veces: • Las pruebas se convierten en un currículo. • Los maestros ya no utilizan tácticas utilizan para inspirar a los estudiantes a que se comprometan con el aprendizaje.• Hacerlo repetidamente • Pasarla en los primeros grados Considera que no se ha encontrado mucha evidencia sobre el efecto de las pruebas. • En las escuelas de bajos recursos los estudiantes deben brindarle mayor importancia a la adquisición de mejores punteos y menor importancia a un aprendizaje significativo. • Algunas veces los punteos altos en las pruebas estandarizadas surgen como el resultado de memorizar la información y no por el hecho de entender los conceptos. pero que un hallazgo importante es el hecho de que los niños sean usados como efectos de experimento. Y se preocupan más por perder su trabajo que por los resultados que se obtienen en las pruebas y lo peor. Además es importante reconocer que el tiempo que se utiliza para preparar a los estudiantes para las pruebas es tiempo que se podría . por proveer un aprendizaje auténtico a sus estudiantes.

sí se tomara en cuenta la postura de Popham al decir que las pruebas no están bien elaboradas y que perjudican a los estudiantes a los docentes y a las escuelas en general. Kohn tiene razón al argumentar que las instituciones se preocupan por llevar a cabo una excelente prueba dejando a un lado todos los valores y enseñanzas “útiles” en la vida. y contenidos más desempeño de los estudiantes. ¿Con quien está de acuerdo? ¿Por qué? Si tiene acuerdo parcial con algunos de los argumentos. Con ello los padres destrezas. indíquelo. En él que los estudiantes recopilan lo que han hecho y el progreso que han tenido Incorpora las destrezas y las sub en su aprendizaje. c. Presente y discuta ambas alternativas. creativa y convertirse en pensadores curiosos. cuestión que no es mala si se advierte que una buena prueba puede brindar un panorama claro de la calidad educativa del país. . Tanto Popham como Kohn presentan una alternativa a las pruebas de alto impacto. pueden ver personalmente el desempeño de sus hijos. Popham Kohn Se enfocan en un número limitado de Elaborar portafolios para evaluar el estándares importantes. eficiente y eficaz que brinde a todos los estudiantes las destrezas y habilidades necesarias para la competitividad en el mercado laboral y social. Por lo que considero que es preciso mejorar el Sistema de Evaluación dentro de las instituciones y fuera de ellas para poder realmente medir el aprendizaje de los estudiantes en un país. Sustente su postura. sin embargo. pero todo esto no sería problema. d.usar para enseñarles a pensar de forma crítica. además mejorar la calidad docente. Considero que ambas posturas presentan argumentos a favor y en contra de las pruebas de alto impacto. preocupados por un proceso de enseñanza aprendizaje efectivo.

“Dichas pruebas son el único medio de Hacer la preparación para las pruebas medir la habilidad y el progreso de de manera creativa. Preparar a los docentes sobre como pasar pruebas. universidades que estudiantes” estrés tanto para el docente como para el alumno. siguientes acciones: “Ninguna escuela puede tener idea del Preparar a los estudiantes para las progreso de sus alumnos sin usar pruebas. basado de ejemplos que permitan de los mostrar el evaluación clara y se revisa la calidad en la evaluación y el análisis de educadores para que tenga un efecto aprendizaje positivo en la educación. para ellos se debe hablar con agencias que brindan servicios educativos.Incluye de la una prueba descripción por un de grupo la Recibir un informe del profesor. libre de tensión y alumnos” “Benefician a maestros interesados en obtener los mejores resultados de cada Los docentes deben involucrarse en los niño” “Crean entusiasmo entre eventos relacionados a la toma de decisiones que tienen que ver con los políticas de educación. pero se debe regresar al pruebas estandarizadas” verdadero aprendizaje. . estudiantes. utilizando básicamente dos sistemas para proveer información el record de El tipo correcto de los test de alto aprendizaje y ejercicios realizados. Se debe concientizar a los padres de familia de que las pruebas no reflejan la realidad del proceso de aprendizaje. impacto puede medir y realzar la calidad de la educación de nuestros Además se pueden llevar a cabo las niños.

No deben consistir en pruebas de selección múltiple. . Además se considera como una alternativa para que las pruebas de alto impacto puede realizarse son: No tener limite de tiempo en las pruebas. No debe aplicarse a niños pequeños. es preciso hacer notar que una modalidad presentada como la de Kohn no permite brindar los resultados a nivel nacional. la unimodalidad en evaluación es una panorama muy escaso. No deben tener referencia a normas. Deben estar diseñadas para que los estudiantes entiendan las ideas más que muestren su habilidad de para y memorizar definiciones. los que es importante es que pueden utilizarse ambas estrategias para evaluar a los estudiantes y/o maestros. listas hechos Es importante destacar que son dos posturas totalmente antagónicas. por lo que las pruebas de impacto de Popham son una mejor estrategia.ofrezcan información de cómo pasar las pruebas. por lo que se pueden alternar ambas forma durante el proceso de enseñanza aprendizaje de un estudiante. No deben pasarse con frecuencia. sin embargo. no sólo por el costo sino también por el tiempo. o reportar de esa manera haciendo énfasis en comparar.

no solo avergonzándolo. . La conversación sobre educación se limita. a. Contraponga la postura de Kohn con la presentada por los artículos leídos en Phelps. Lo que produce este sistema de premio o castigo es resentimiento y odio hacia el mismo por otro lado no hay muchos antecedentes que este sistema funcione por lo que se podría decir que nuestros niños y jóvenes están sirviendo de experimento para ver si esto realmente funciona. Lo que resulta es muchas veces una vergüenza pública para los alumnos y/o maestros. Identifique los argumentos presentados en los artículos de Phelps.3. ¿hasta dónde? Por otro lado se ha comprobado que los maestros que se preocupan mucho por las notas son lo que tienen alumnos con notas bajas. ¿Qué pasa cuando los maestros y estudiantes indican que prefieren seguir aprendiendo sin importar las notas. Por otro lado las pruebas estandarizadas también tienen límites que perjudican a los jóvenes. Si se quedan se vuelven a la defensiva y muy competitivos. Provoca sobre especializaciones. Muchas de las pruebas estandarizadas tienen un amplio margen de error y muchas de las decisiones se toman dentro de éste margen de error. la respuesta es el forzar a preocuparse por los resultados. resúmalos brevemente y contrapóngalos a cada argumento esgrimido por Kohn: Kohn: Indica que las pruebas de alto impacto tienen sus errores y todo comienza porque las personas que están de acuerdo con las mismas no son los maestros que son lo que están en las aulas sino los altos funcionarios de gobierno lo que deciden tenerlas. Se puede poner a los maestros en contra de los alumnos. en áreas específicas y no holísticas. en muchos de los casos. Como consecuencias tenemos: • • • • • • Sacar a los buenos maestros y directores de sus profesiones. Se provoca que muchos hagan trampa. no es esto una señal para cambiar las cosas y reevaluar los tests? Sin embargo. Hemos llegado al colmo de premiar al que saca buenos resultados y sobre todo de castigar al que no los saca.

por el resultado de las pruebas. Las pruebas no solo ayudan a los maestros sino también los alumnos tienen buena percepción sobre ellas confirmando que es . Se cae en errores como dar a los alumnos las respuestas o aún peor. Por todo esto no son necesarias las pruebas más que para comparar escuelas o estados. de la cuál se destacan consecuencias enormes que van en contra de los principios básicos de la educación. críticas y consecuencias (Cizek) Las pruebas estandarizadas son un logro y una ayuda inmedible para los maestros y sus resultados como educadores logrando medir el aprendizaje de los alumnos y confirmar que aprenden. Los maestros por estar pendientes de las pruebas dejan a un lado muchos aspectos reales de aprendizaje dentro del aula por cubrir contenidos para la prueba y lo peor de todo es que al utilizar ejemplos se limitan a los que pueden poner en el examen. Pruebas de alto impacto contexto. trabajos individuales. Si se premia con dinero a un buen maestro ¿cómo lo hará una escuela sin mucho fondos por ser de clase pobre? Lo que indica que estas escuelas podrían no tener a los mejores maestros en el área. características. Por lo mismo las pruebas caen en perjudicar a alumnos por su calidad social y económica. catalogar como capaces o no. muchas preguntas envuelven la suposición de un contexto para el alumno en cuál no todos tienen.Lo que provoca una cultura de “Enseñar para la prueba no para el alumno”. grupales etc. Lo cuál nos lleva a que una nota alta no siempre es sinónimo de aprendizaje alto y viceversa. la manera correcta sería en tener una mayor relación con los maestros y los padres para hablar sobre el desarrollo de su hijo por medio de la observación. Se requiere para lograr esto un rol integral por parte del maestro en el aprendizaje del alumno. De este modo lo mismos padres se darán cuenta del aprendizaje de sus hijos por medio de la propia observación de su trabajo. centros educativos y a los estudiantes lo cuál los aleja del aprendizaje real significativo y los envuelve en el hecho de ganar una prueba. i. Todo esto provoca una presión extra tanto a los maestros. ensayos.

con este ejemplo nos damos cuenta que no se puede generalizar ningún sistema. y también puede ser para el maestro con un aumento de sueldo o bonos y también para el colegio o institución catalogándola por su calidad. currículo estrecho. Aunque hay muchos autores en contra como por ejemplo Kohn que era claro al citar que los maestros deberían luchar en contra del monstruo de las pruebas estandarizadas. Se debe observar la utilidad pero también se deben visualizar los problemas que puedan traer las pruebas. por ejemplo una prueba oral debe ser adecuada y se debe conocer al evaluando pues no sería justo si tiene problemas de pronunciación o de algún tipo en la vía oral. trampa y blasfemias. deserción.de suma ayuda par su aprendizaje. Dos terceras partes de los padres indicaron que desearían recibir esos resultados en cada grado. las mismas también provocan muchos síntomas en los niños que son consecuentes de la presión que la misma causa y los cuales no son sanos ni adecuados para un buen sistema de aprendizaje. reducción de tiempo para instrucción. inequidades sociales. Con estos datos muchas críticas concluyen que las pruebas son graves para la educación en el mundo post moderno. educación militarizada.023 padres de familia el 83% ha indicado que las pruebas son un método que los ha ayudado a observar el desarrollo de sus hijos y 9 de cada 10 quisiera poder ver estudios comparativos de sus hijos y las escuelas a las que atienden. esta consecuencia puede ser para el alumno por ejemplo la promoción. Sin embargo estas críticas tienen sus errores. podría ser la parte de atrás de las pruebas. niños pequeños llorando o vomitando. existen reportes como el de Business Roundtable (2001) que los reportes en contra de las pruebas estandarizadas han sido exagerados y también se ha sabido que de 1. sino a confirmar el aprendizaje de los alumnos y sobre todo a catalogar el rendimiento de las instituciones educativas. Así como se puede dar un diploma por aprobar las pruebas. Por otro lado las pruebas estandarizadas ayudan no solo al desenvolvimiento y rendimiento de los maestros. algunos 3 veces al año y otros solo una. En los últimos 80 años se han oído críticas a las pruebas que indican: frustración en maestros. . Las pruebas de alto impacto para empezar son las que SI tienen una consecuencia de acuerdo a los resultados.

Plazas para mejorar la educación a alumnos con necesidades especiales. las instituciones educativas deben buscar la manera de mejorar su calidad y su rendimiento. Beneficios de las pruebas (Phelps) A continuación se presentan 10 consecuencias positivas de las pruebas de alto impacto: 1.ii. Muchas de las concepciones son las mismas al criticar las pruebas de alto impacto. por ejemplo estas pruebas exponen a los estudiantes al fracaso y mucho dinero se invierte y muchos ítems no ayudan a una minoría de la población. Por lo mismo. 2. 3. Luego de analizar la situación se observó que estas críticas provenían de mal entendimientos sobre la conceptualización. Concepciones erróneas acerca evaluaciones masivas (Goodman y Hambleton) Con el (NCLB) Ningún alumnos se queda atrás. 2. Pruebas con calidad. Conocimiento sobre evaluar 4. maestros y escuelas: . implementación y evaluación de las pruebas de alto impacto. Aumento en el aprendizaje de los alumnos. 3. iii. muchos estados han tenido que buscar las herramientas para mejorar la calidad y el rendimiento de sus instituciones. especialmente en lectura y matemática. Cómo respuesta a estas críticas se exponen los siguientes puntos: • Pruebas de alto impacto hechas para el fracaso de estudiantes. por sus consecuencias socioeconómicas y también sus expectativas son muy altas lo que provoca fracaso en muchos estudiantes. 5. Opciones educativas Sistemas más confiables Mejor entendimiento de los maestro con su disciplina. 4. 6.5Colección y uso de la información. diseño. Desarrollo profesional.

Para trabajar en esto se mencionan 6 pasos que se toman . • Las pruebas de alto impacto están llenas de ítems tendenciosos: Los críticos alegan que existen ítems que van en contra o que perjudican a culturas diferentes que viven en USA por ejemplo los negros y los hispanos. Sin embargo la GAO indica que no hay una sobre evaluación en los estudiantes. Por otro lado el tiempo de los maestros es de menos de 6 horas al año.Se critica que una sola prueba no puede medir todo el año y mucho menos indicar si habrá promoción del mismo. • Las pruebas son muy costosas: Los críticos alegan que no solo se invierte mucho tiempo por parte de los alumnos y maestro sino también mucho dinero sin embargo los estudios de la última década nos indican que no se invirtió tanto dinero como ellos indicaron. Es cierto que en los resultados de ACT y SAT los negros e hispanos han salido por debajo de la media. concluyendo que los estudiantes pasan menos de 7 horas al año en actividades relacionadas con los tests estandarizados y no lo que los críticos indican. Se alega que se debe invertir más pero no se he observado que la ley ha indicado que se hagan 17 evaluaciones para el sistema de NCLB en la actualidad. Para cumplir con la ley y luego que mas de 42 estados en un año hallan utilizado este método se puede decir que sí se está evaluando lo que se tiene que aprender. Para explicar esto se debe mencionar la definición de ITEM BIAS que indica que 2 personas con el mismo nivel de competencias pero con diferentes grupos de intereses tendrán diversos resultados. Por ultimo en los estados se da a notar que las pruebas de alto impacto dan el resultado para el que fueron elaboradas. La GAO también indica que los costos no son elevados pues es de aproximadamente $15 por alumno. 40% fue para la administración de las pruebas y menos del 30% para la preparación de los estudiantes para las mismas. Es lógico que no se puede medir todas las áreas del currículo en esta prueba pero si las consideradas más importantes. por otro lado no mide lo importante en los grados de Kinder a 12 vo. los estados se deben apegar a los estándares y trabajar para ellos.

o Todos los tests y los departamentos de los estados encargados de hacerlos. o La recopilación de información valedera para respaldar las funciones de los . En la actualidad existen 3 métodos que muestran eficiencia en este caso sin embargo no sólo se deben juzgar por los resultados sino también se validan por los siguientes puntos: o Las personas que hacen las representaciones de los estándares deben estar muy bien calificadas. Creen que los estándares se sacan del aire mientras que la realidad es que se absorbe información de manuales técnicos para la realización de los mismos. tienen un documento que indica los pasos para no caer en sesgar. o Se ha sacado información que pudiera sesgar a estos grupos. o Los datos e información debe ser clara. o Comités de sensibilización de ítems indican que se debe enfocar en pruebas educacionales y en aspecto que puedan ser un poco injusto para una pequeña minoría. Los críticos no saben que muchos estudiantes están por debajo de los estándares y también que no muchos están por encima de los mismos. o Los revisores de ítems deben revisar e indicar si existen ciertas injusticias hacia grupos minoritarios. • Las funciones de los estándares están muy por encima de lo esperado.rutinariamente por las agencias de los estados de USA para no caer en las BIAS: o Se toma en cuenta a personas de las diversas clases socio culturales para la creación de los materiales. o Al final de la prueba hay comités que evalúan que no haya aspectos que perjudiquen a estos grupos minoritarios. o La sensatez del proceso en que los panelistas usan para las funciones de los estándares. o La relación de confidencialidad que los panelistas tienen durante el proceso.

Al interpretar los resultados los críticos se basan en errores no de las pruebas sino de las personas involucradas al pensar que”estadísticamente significa diferencias. esto incide a no estar de acuerdo con tomar pruebas. Este es uno de los procesos más difíciles por esto es que lleva tantos pasos y supervisión. Sin embargo me he dado cuenta que buenas pruebas se usan para las ocasiones incorrectas. preguntando lo mismo a todos. pues causa una tensión enorme. .estándares. Preguntas más frecuentes sin preguntar (Sireci) Muchas personas critican los tests a otras no les gusta tomarlos. iv. Para entender mejor las cosas se plantean preguntas que se deberían de saber por todos para observar la importancia de las pruebas en la sociedad: ¿Qué es una prueba estandarizada? Las personas culpan a las pruebas estandarizadas de ser injustas y discriminatorias. Muchas personas no solo creen que las pruebas no miden lo que deberían sino que también perjudican a la población minoritaria. y se creó de manera uniforme. educadores y miembros en general del entendimiento de los resultados públicos: Es muy importante entregar los resultados cuantitativos de las pruebas porque éstos indican lo que se ha podido hacer y sobre todo lo que hace falta por hacer. Este autor considera que las pruebas adecuadas. Todos los envueltos deben poder tener acceso a esta información. Lo más importante es que se aplica bajo las mismas condiciones y bajo las mismas reglas. o sea “no es la prueba la mala sino el uso que se le da”. • Fabricantes. grandes diferencias”. Estandarizada significa que el contenido de la prueba es equivalente al contenido y que las condiciones del que toma la prueba es la adecuada y la misma. bajo las medidas y factores adecuados ayudan a que las personas tengan un mejor rendimiento educativo y mantenerlas más cerca de sus propias metas.

a. Argumentos en pro y en contra Para obtener un método de evaluación que proporciona una mejor calidad educativa en el país deben tomarse en cuenta las características propias del país. ¿Por qué? La inversión en la elaboración de las pruebas. . Es importante que las pruebas en sí mismas no sean los ejes de cambio. gane. b.¿Cómo son las notas para ganar incluidas en las pruebas? Para hacerlo se debe pensar siempre en minimizar las posibilidades de que alguien que sabe pierda y que alguien que no sabe. La modalidades de evaluación pueden ser utilizadas para brindar al estudiante la oportunidad de demostrar sus habilidades y destrezas. pues pueden haber notas de 80 que no saben ni la mitad de una nota de 50. ¿cuál de los argumentos le parece más coherente. por ejemplo: • La capacidad del magisterio. enseñar de manera igualitaria con las mismas oportunidades en todos y procurar los mismos aprendizajes. Se dice que se debe saber el 70% del contenido (reflejado en la prueba) para poder aprobar. • Mantenimiento e infraestructura de las instituciones. son las herramientas para proponer soluciones y argumentar el cambio. tanto para mejorar la calidad educativa como para preservarla. así como el tiempo que tome al estudiante resolverla. sin embargo se debe de observar el contexto de la prueba. • Apoyo a las políticas educativas. entonces se debe de tratar de ser justos. es importante destacar que en un país como Guatemala el costo económico es vital. Sin embargo. el costo a nivel nacional de realizar una prueba como la propuesta por Kohn no brinda la posibilidad de evaluar a toda una población por lo que realizar una prueba de alto impacto debe ser realizada de tal manera que el costo sea bajo. • Baja inversión económica.

Por lo que considero que deben existir y cada vez mejorar la implicaciones de las mismas. todas serán pruebas diagnóstico para demostrar que no se ha logrado nada aún. es decir. mejorar la calidad y crear presión para que se mejore. En Guatemala la evaluación de de aprendizajes es incipiente. Está de acuerdo con estas evaluaciones en Guatemala (ambas. si una institución no está teniendo un buen rendimiento puede ser que sus estudiantes no estén acostumbrados a ser evaluados de esa forma por lo que una prueba de bajo riesgo puede ser aplicada al inicio hasta llevarla a las consecuencias de una prueba de alto riesgo. b. • Malas identificaciones de escuelas superiores e inferiores le recomendaría: Modificar sus procesos de enseñanza. Así mismo. 4. ¿Qué recomendaría Ud. ¿Por qué en cada caso? Con las evaluaciones de impacto podemos beneficiar el proceso de enseñanza aprendizaje. evaluación. para evitar o reducir los peligros apuntados por Popham y Kohn? • Presiones malinterpretadas en educadores le recomendaría: Demostrar que la teoría puede ser llevada a la práctica por lo su experiencia debe ser comprobada en su campo laboral. a los alumnos y a las instituciones educativas. el cuerpo docente debe ser sometido frecuentemente a este tipo de pruebas para mantener su actualización y mejorar la calidad. A la luz de lo leído: a. metodología. Para . etc.Las pruebas de alto impacto son tiene una doble implicación. Mientras no se determine una prueba de está magnitud en el país. Hay evaluaciones de bajo riesgo (primaria y secundaria) y de alto riesgo (maestros). alto y bajo riesgo).

• Cuando a los docentes y a los estudiantes los resultados ya les son indiferentes: Alumnos: que la evaluación sea de impacto incidiendo en su nota de promoción. Maestros: que los resultados de sus estudiantes incidan en una forma de promoción salarial. Motivar a su personal docente para que mejoren el proceso de enseñanza aprendizaje. solicitando a los padres de familia y a los alumnos que aporten comentarios o sugerencias constructivas a solucionar los aspectos en los cuales se dio mayor dificultad. c.mejorar su calidad. • Publicar resultados positivos y negativos. los estudiantes así mismo lo son. ¿Por qué este argumento es falaz? ¿Cómo debe hacerse el análisis de los datos para rebatirlo? Pista: examine el concepto de ranking y el concepto de valor agregado . aduciendo que son injustas para los colegios que tienen estudiantes con menos recursos económicos. Por lo que la trampa no es un factor que determine a largo plazo la calidad del plantel o del estudiante. El círculo de empresarios de la educación se ha opuesto a estas pruebas. • Test presionan a la Trampa: Si los docentes y la institución son de calidad. por lo que no se trata de repetir lo mismo todos los años sino mejorar las estrategias para que el aprendizaje sea significativo. Mejorar las estrategias de evaluación puede hacer caer a los mediocres. • Reducción del Curriculum le recomendaría: Si las bases de los conocimientos son fuertes cualquier aprendizaje posterior se facilita.

El análisis de datos debe hacerse por medio de encuestas a docentes y alumnos. defender sus derechos como usuarios de un servicio así mismo involucrarse en el aprendizaje de sus hijos para que no sea la escuela la única formadora. pero si bien la oportunidad de aprendizaje es negada en algunas instituciones las pruebas evalúan “el mínimo” los estándares que todo estudiante debe saber.El argumento no es valido. presionar a las comunidades para que exijan calidad y que no se conformen con docentes que a veces llega y a veces no simplemente porque no quieren. Para evaluarlos adecuadamente es importante difundir los estándares que permitan marcar los aprendizajes “mínimos” que cualquier estudiante debe saber. Pareciera un argumento extremo pero no puede mal formarse a un niño o una niña. aplicación de pruebas de piloto para hacer las comparaciones entre medias y datos estadísticos. Si una institución no cumple con los estándares de funcionamiento debe ser cerrada. no los máximos o destrezas ajenas a la currículo nacional. con el objetivo de verificar que los contenidos del CNB están siendo impartidos en las instituciones públicas y privadas. ellos argumentan que castigan con mayor severidad a los estudiantes con escasos recursos económicos. por no contar con la tecnología y con docentes a diario. El análisis de datos debe hacerse de acuerdo a los contenidos no alcanzados y determinar los puntos a mejora el siguiente año. ya que en base a ellos se están elaborado las pruebas. La comparación sería de acuerdo a este nivel de conveniencia. . pues considero que en cuestión de educación no debe haber medios sino que tiene que ser buena. por lo que la evaluación sería válida. lo que miden son los contenidos.

y malos maestros en escuelas con buenos resultados permanecen y son incentivados. Se debe prestar especial atención al leer los resultados. revisan y devuelven la prueba al estudiante para que revise . como si repetir una y otra vez aumentaría la calificación en una prueba. Algunos de los mayores problemas al realizar las pruebas es que los docentes dirigen al alumno hacia la respuesta correcta. las escuelas con resultados bajos pueden presentar cambios más altos que escuelas con resultados altos. Pero es necesario considerar si la prueba que se realizar ayuda o entorpece la calidad educativa. Discútalo en detalle. La prueba puede ayudar al docente a dar una buena enseñanza. La atención curricular está centranda en aspectos de la evaluación únicamente enseñando lo que se va a evaluar y dejando a un lado lo que no. Actualmente las pruebas son malas y producen malos efectos debido a la consideración de que si se tienen altos resultados la educación es mejor.5. Sea cuidadoso en apoyarse en la literatura al discutirlo. ¿Cuáles son las implicaciones de la propuesta de Popham para la enseñanza y la evaluación en el aula? ¿Qué implicaciones tiene para la formación de maestros o para la capacitación en servicio. además. además desvían la atención del maestro de las decisiones educativas importantes. otorgan más tiempo para que puedan terminarlas. bajas. pero no necesariamente un “mejor” docente o “mejor” escuela. Muchas de las cosas que son evaluadas no son enseñadas en la escuela sino en el hogar. las escuelas con resultados bajos reciben más apoyo (más personal. supervisión o fondos) y son “etiquetadas” (malas. Buenos maestros en escuelas con problema son obligados a cambiar su metodología causa del rendimiento de los estudiantes. si además de ello ni siquiera es una repetición dirigida. Esto implica muchas veces buenos resultados. Por lo que los estudiantes pierden el interés debido a tanta repetición. débiles) esto afecta la moral y autoestima de catedráticos y alumnos.

La prueba no es válida o invalida. .sus errores esto conlleva a que los resultados en las pruebas sean mejores pero su nivel de conocimientos no. las pruebas de clase son una muestra del total de conocimientos impartidos. son las inferencias (calificaciones) que se hacen del alumno. No es posible medir todos los conocimientos. En clase una prueba se utiliza para brindar información y decidir sobre como proceder sobre el nivel de conocimiento de un alumno.

Sign up to vote on this title
UsefulNot useful