Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modelo Especifico Ser Estudiante 2024 Compressed
Modelo Especifico Ser Estudiante 2024 Compressed
EVALUACIÓN
SER ESTUDIANTE
PRESIDENTE DE LA REPÚBLICA
Daniel Roy Gilchrist Noboa Azín
REVISADO POR
Carlos Alberto Cahuasquí Cevallos
DISTRIBUCIÓN GRATUITA
PROHIBIDA SU VENTA
Presentación
El Instituto Nacional de Evaluación Educativa –Ineval– tiene la misión de promover la
calidad de la educación a través de la evaluación integral del Sistema Nacional de
Educación.
En este sentido, el Ineval presenta el Modelo específico de evaluación Ser Estudiante que
proporciona las orientaciones normativas, conceptuales y metodológicas para las
diferentes fases del proceso de evaluación: elaboración de ítems, instrumentación,
calibración, aplicación, calificación y entrega de resultados.
Así mismo, el documento es una herramienta que busca contribuir al debate sobre los
procesos de evaluación estandarizada a gran escala.
Finalmente, para la evaluación del SEST del año 2022, no se consideran las áreas de
Educación Cultural y Artística y Educación Física que se evalúan mediante rúbrica.
Tampoco se evalúa el grupo temático de Comunicación Oral del área de Lengua y
Literatura mediante el instrumento lista de cotejo.
1
Índice de contenidos
Abreviaturas ........................................................................................................................ 5
1. Resumen ejecutivo ...................................................................................................... 6
2. Abstract ........................................................................................................................ 7
3. Antecedentes ............................................................................................................... 8
4. Objetivo ...................................................................................................................... 15
5. Marco normativo ........................................................................................................ 15
6. Marco conceptual ....................................................................................................... 17
6.1. Modelo pedagógico y tipos de saberes ............................................................. 17
6.2. Taxonomía y niveles cognoscitivos ................................................................... 19
6.3. Estándares de Aprendizajes ............................................................................. 22
6.4. Evaluación de los aprendizajes a gran escala .................................................. 24
6.5. Las pruebas estandarizadas ............................................................................. 25
6.5.1. Pruebas de base estructurada .................................................................. 25
6.5.2. Rúbrica ...................................................................................................... 26
6.5.3. Lista de cotejo ........................................................................................... 29
6.6 Encuesta de Factores Asociados .................................................................. 30
6.7 Propuesta para la evaluación de los aprendizajes de SEST ............................ 32
7. Análisis de insumos técnicos ..................................................................................... 33
7.1 Currículo de EGB y bachillerato ........................................................................ 33
7.2 Estándares de Aprendizaje ............................................................................... 34
7.3 Estructuras 2013-2019 ...................................................................................... 35
7.4 Estructuras preliminares realizadas en 2019 .................................................... 35
7.5 Componentes utilizados y no utilizados en la estructura de evaluación ........... 35
7.6 Conclusiones del análisis de insumos técnicos ................................................ 38
7.6.1 Uso de los niveles de logro ........................................................................... 38
7.6.2 Gradación directa del estándar ..................................................................... 40
7.6.3 Uso de la taxonomía de Marzano y Kendall ................................................. 43
8. Contenidos de evaluación .......................................................................................... 45
8.1 Descripción cualitativa de los contenidos de evaluación .................................. 45
8.1.1 Matemática .................................................................................................... 45
8.1.2 Lengua y Literatura ....................................................................................... 46
8.1.3 Ciencias Naturales ........................................................................................ 46
8.1.4 Ciencias Sociales .......................................................................................... 47
8.1.5 Educación Cultural y Artística ....................................................................... 48
8.1.6 Educación Física ........................................................................................... 48
8.2 Descripción cuantitativa de los contenidos de evaluación ................................ 49
8.2.1 Matemática .................................................................................................... 49
8.2.2 Lengua y Literatura ....................................................................................... 50
8.2.3 Ciencias Naturales ........................................................................................ 51
8.2.4 Ciencias Sociales .......................................................................................... 52
8.2.5 Educación Cultural y Artística ....................................................................... 53
8.2.6 Educación Física ........................................................................................... 54
8.3 Consolidado cuantitativo de las áreas de evaluación ....................................... 54
2
8.4 Comparabilidad de los contenidos de evaluación con procesos de evaluación
anteriores ....................................................................................................................... 57
9. Marco metodológico ................................................................................................... 57
9.1 Población objetivo ............................................................................................. 57
9.2 Tipo de evaluación ............................................................................................ 58
9.3 Agente evaluador, aplicador y calificador ......................................................... 58
9.4 Tipos de instrumento ......................................................................................... 58
9.5 Tipo de ítem, indicadores y actividades ............................................................ 59
9.5.1 Tipos de ítems ............................................................................................... 59
9.5.2 Indicadores y actividades .............................................................................. 59
9.6 Tiempo de evaluación ....................................................................................... 60
9.7 Niveles de logro, niveles cognoscitivos y número de ítems para prueba de base
estructurada ................................................................................................................... 61
9.7.1 Diseño de instrumento por bloques .............................................................. 63
9.7.2 Numero de DO e ítems con diseño por bloques ........................................... 65
9.8 Presentación de resultados ............................................................................... 66
9.8.1 Índice Inev por área de conocimiento y subnivel .......................................... 66
9.8.2 Reporte por niveles de desempeño por estándar ......................................... 72
9.9 Consideraciones para la aplicación de la evaluación ....................................... 74
10. Uso de resultados ...................................................................................................... 74
11. Referencias ................................................................................................................ 75
11.1 Bibliografía ........................................................................................................ 75
11.2 Leyes, reglamentos, acuerdos, oficios, memorandos ....................................... 78
Índice de tablas
Tabla 1. Estructura de evaluación de SEST 2013-2020 ................................................... 11
Tabla 2. Tipos de saberes y contenido .......................................................................... 18
Tabla 3. Verbos recomendados para cada nivel cognoscitivo ......................................... 21
Tabla 4. Estructura del Estándar de Aprendizaje ............................................................. 23
Tabla 5. Características de los indicadores de calidad educativa .................................... 23
Tabla 6. Ejemplo de rúbrica analítica ................................................................................ 27
Tabla 7. Tipos de desempeños que se pueden evaluar con rúbricas .............................. 27
Tabla 8. Ejemplo de rúbrica analítica de proceso para Ser Estudiante ............................ 28
Tabla 9. Ejemplo de rúbrica analítica de producto para SEST ......................................... 29
Tabla 10. Ejemplo de lista de cotejo para SEST .............................................................. 30
Tabla 11. Esquema de encuesta de Factores Asociados................................................. 31
Tabla 12. Esquema epistemológico de la evaluación de SEST ....................................... 33
Tabla 13. Áreas del conocimiento del Currículo Nacional ................................................ 34
Tabla 14. Estándares de Aprendizaje para EGB y bachillerato de SEST ........................ 35
Tabla 15. Detalle de los componentes de los insumos utilizados y no utilizados en las
estructuras de evaluación de SEST .................................................................................. 35
Tabla 16. Detalle de los componentes utilizados en cada nivel de desagregación de la
estructura de evaluación para SEST ................................................................................ 38
Tabla 17. Estándar, indicadores y niveles de logro .......................................................... 39
Tabla 18. Estándar y niveles de logro del área de Matemática subnivel elemental ......... 41
3
Tabla 19. Propuesta de gradación directa del estándar para la estructura de evaluación
........................................................................................................................................... 43
Tabla 20. Propuesta de estructura de evaluación para Prueba de base estructurada del
SEST ................................................................................................................................. 44
Tabla 21. Propuesta de estructura de evaluación para Rúbrica del SEST ...................... 45
Tabla 22. Resumen cuantitativo de las estructuras del área de Matemática ................... 49
Tabla 23. Resumen cuantitativo de las estructuras de Lengua y Literatura ..................... 50
Tabla 24. Resumen cuantitativo de las estructuras de Ciencias Naturales...................... 51
Tabla 25. Resumen cuantitativo de las estructuras de Ciencias Sociales ....................... 52
Tabla 26. Resumen cuantitativo de las estructuras de Educación Cultural y Artística ..... 53
Tabla 27. Resumen cuantitativo de las estructuras de Educación Física ........................ 54
Tabla 28. Estructura de evaluación por instrumento de evaluación ................................. 55
Tabla 29. Número de Definiciones Operacionales por niveles, subnivel, instrumentos y
áreas de conocimiento ...................................................................................................... 56
Tabla 30. Resumen de la estructura de evaluación por instrumento de evaluación ........ 56
Tabla 31. Total de Definiciones Operacionales por área e instrumento ........................... 57
Tabla 32. Cálculo del tiempo de evaluación ..................................................................... 60
Tabla 33. Niveles de logro y número de ítems para Prueba de Base Estructurada ......... 62
Tabla 34. Niveles cognoscitivos y número de ítems para Prueba de Base Estructurada 63
Tabla 35. Numero de DO e ítems por asignatura y subnivel a partir del diseño por bloques
........................................................................................................................................... 66
Tabla 36. Rasgos latentes de la evaluación SEST ........................................................... 68
Tabla 37. Niveles de desempeño sobre la base de los estándares de aprendizaje ........ 73
Tabla 38. Tabla de categorización de niveles de desempeño por estándar .................... 73
Índice de figuras
Figura 1. Promedio nota global, según año lectivo ........................................................... 10
Figura 2. Porcentaje de estudiantes con nota global mayor o igual a 700 puntos, según
año lectivo ......................................................................................................................... 10
Figura 3. Niveles de logro, según año lectivo ................................................................... 11
Figura 4. La taxonomía de Marzano y Kendall ................................................................. 20
Figura 5. Diseño ancla ...................................................................................................... 64
Figura 6. Diseño rotado ..................................................................................................... 64
4
Abreviaturas
DAACT: Dirección de Análisis, Aplicación y Cobertura Territorial
DGGI: Dirección de Geomática y Gestión de la Información
DPI: Dirección de Producción de Ítems
DDEE: Dirección de Diseño Estratégico de Evaluaciones Educativas
DO: Definición Operacional
EGB: Educación General Básica
Ineval: Instituto Nacional de Evaluación Educativa
Llece: Laboratorio Latinoamericano de Evaluación de la Calidad de la Educación
LOEI: Ley Orgánica de Educación Intercultural
LSLA: Evaluaciones de los aprendizajes a gran escala
PBE: Prueba de Base Estructurada
Perce: Primer Estudio Regional Comparativo y Evaluativo
RG-LOEI: Reglamento General a la Ley Orgánica de Educación Intercultural
Serce: Segundo Estudio Regional Comparativo y Evaluativo
SEST: Ser Estudiante
SIGE: Sistema Integrado de Gestión de las Evaluaciones
SNE: Sistema Nacional de Educación
Terce: Tercer Estudio Regional Comparativo y Evaluativo
Unesco: Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura
5
Resumen ejecutivo
La evaluación Ser Estudiante –SEST– tiene el objetivo de evaluar los conocimientos,
habilidades y destrezas de las y los estudiantes en los subniveles: elemental, media y
superior de Educación General Básica –EGB– y el nivel de bachillerato.
Los insumos que se utilizan para la evaluación SEST son el Currículo y los Estándares de
Aprendizaje con sus respectivos niveles de logro: 0 (no alcanza lo básico imprescindible),
1 (alcanza lo básico imprescindible) y 2 (alcanza lo básico imprescindible y lo deseable)
de las áreas de Matemática, Lengua y Literatura, Ciencias Naturales, Ciencias Sociales,
Educación Cultural y Artística y Educación Física.
El modelo plantea tres tipos de evaluación: formativa dado que los resultados servirán para
que la Autoridad Educativa Nacional formule políticas para el mejoramiento de la calidad
educativa, externa debido a que el agente evaluador es el Ineval a través de aplicadores
externos a la institución educativa donde estudian los evaluados, criterial debido a que el
diseño de la evaluación parte de los Estándares de Aprendizaje de cada asignatura y
subnivel.
1
Para la evaluación del SEST del año 2022, no se consideran las áreas de Educación Cultural y
Artística y Educación Física que se evalúan mediante rúbrica. Tampoco se evalúa el grupo temático de
Comunicación Oral del área de Lengua y Literatura mediante el instrumento lista de cotejo.
6
Abstract
Ser Estudiante Assessment –SEST– has the objective of assessing the knowledge,
abilities and skills of the students in the elementary, middle and higher sublevels of Basic
General Education and the level of Baccalaureate.
The inputs used for the SEST assessment are the Curriculum and the Learning Standards
with their respective levels of achievement: 0 (no reaches the essential basics), 1 (reaches
the essential basics) and 2 (reaches the essential and desirable basics) of the areas of
Mathematics, Language and Literature, Natural Sciences, Social Sciences, Cultural and
Artistic Education and Physical Education.
The SEST assessment consists of three instruments: structured base test, analytical rubric
and checklist. The structured base test is applied in the areas of Mathematics, Language
and Literature, Natural Sciences and Social Sciences; the analytical rubric in the areas of
Language and Literature (writing), Cultural and Artistic Education, and Physical Education;
and, the checklist in the area of Language and Literature (oral communication).
The model proposes three types of evaluation: formative thus the results will serve the
National Educational Authority to formulate policies for the improvement of educational
quality; external because the assessing agent is Ineval through applicators external to the
educational institution assessed; criterial because the design of the evaluation is based on
the Learning Standards of each areas and sublevel.
7
Antecedentes
Desde finales de la década de los noventa, la Organización de las Naciones Unidas para
la Educación, la Ciencia y la Cultura –Unesco– ha desarrollado de manera periódica las
LSLA en la región de América Latina y el Caribe, a través del Laboratorio Latinoamericano
de Evaluación de la Calidad de la Educación –Llece–. La primera experiencia se llevó a
cabo el año de 1997 y se denominó Primer Estudio Regional Comparativo y Evaluativo –
Perce–; en 2006 se realizó el Segundo Estudio Regional Comparativo y Evaluativo –
Serce–; y, en 2013 el Tercer Estudio Regional Comparativo y Evaluativo –Terce– (Bottani,
2006).
La primera vez que Ecuador participó en un proceso de LSLA a escala regional fue en
1989 a través de un estudio comparado llamado Medición de la Calidad de la Educación,
coordinado por la Unesco (Cabrera, 2010). Posteriormente, participó en las pruebas Serce
y Terce2. En Serce se ubicó en el grupo de países con más bajas puntuaciones en todas
las áreas y en todos los grados evaluados. En Terce se ubicó en el promedio regional en
la mayoría de las materias evaluadas, a excepción de Lectura y Escritura de 6.º grado, en
el que era significativamente menor al promedio regional (Torres, 2015).
En octubre de 2017, Ecuador participó por primera vez en el Programa para la Evaluación
Internacional de Alumnos para el Desarrollo –PISA-D– por sus siglas en inglés-3 donde se
evaluaron 6100 estudiantes de 178 instituciones educativas. Los resultados de PISA-D se
presentan en niveles de desempeño del 1 al 6. El 1 se subdivide en 1a, 1b y 1c. El nivel 2
establece el umbral en el que el estudiantado cuenta con un nivel básico de habilidades
para poder desenvolverse en los ámbitos educativo y social. Los resultados de las pruebas
en Ecuador fueron los siguientes: en desempeño de lectura el 50 % de estudiantes tuvo
un nivel de desempeño inferior al nivel 2 en lectura; en desempeño en matemática el 70
% de estudiantes no alcanzó el nivel básico de habilidades de dominio matemático; en
desempeño en ciencias el 52,7 % de estudiantes no alcanzó el nivel básico de habilidades
(Ineval, 2018a). La variación de resultados por género en el país es la siguiente:
2
En Perce 2016 el Ecuador no participó. En el cuarto estudio regional ERCE 2019, Ecuador sí participó,
se esperan los resultados el presente año.
3
Programme for International Student Assessment. Específicamente, la prueba PISA-D es una
propuesta para los contextos de países de economías pequeñas y medianas, por tanto, se adaptan los
instrumentos, la medición de habilidades y los cuestionarios de contexto (Ineval, 2018a).
8
año 2008, se efectuó la prueba Ser Ecuador, la cual contó con otro tipo de metodología y
además de Matemática y Lenguaje y Comunicación se evaluaron las áreas de Estudios
Sociales y Ciencias Naturales en los años de séptimo y décimo de educación básica y
tercero de bachillerato (Ministerio de Educación, 2008).
9
Figura 1. Promedio nota global, según año lectivo
En la siguiente figura se establece el porcentaje del estudiantado que llega a superar los
700 puntos. Para el año lectivo 2018-2019, apenas el 35,4 % de la población total supera
los 700 puntos. La mayoría de las y los estudiantes no alcanza el nivel mínimo establecido
para aprobar la evaluación.
Figura 2. Porcentaje de estudiantes con nota global mayor o igual a 700 puntos, según
año lectivo
Finalmente, en la Figura 3 se establecen los resultados según los niveles de logro por cada
año lectivo. Entre los años lectivos 2013-2014 y 2015-2016 la mayoría de la población
supera los niveles de logro 1, es decir, los conocimientos básicos o esenciales. Pero, a
partir de los años lectivos 2016-2017 hasta 2018-2019, esta situación se revierte, y la
10
mayoría de la población no logra superar el nivel 1. Es decir, en los últimos años los
resultados de aprendizajes de los estudiantes del SNE han empeorado, como lo evidencia
la Figura 3.4
4
Podrían existir otros aspectos relevantes que influyan en los resultados de aprendizaje de los
estudiantes entre los años 2013-2019, a saber: cambio de aplicación física a digital desde el año 2016; cambios
en las fórmulas y metodologías de cálculo para las notas finales de las pruebas; finalmente, cambios en la
estructura conceptual y en la encuesta de factores asociados. Para corrobora la incidencia de estos factores en
los resultados de aprendizaje de los estudiantes es necesario desarrollar investigaciones que profundicen sobre
estos temas.
5
Para la evaluación del año lectivo 2019-2020 debido a la crisis sanitaria del Covid-19 no se realizaron
las evaluaciones del SEST.
11
Combinaciones simples
Estadística y probabilidad
Diagrama de barra
Comprensión de textos Textos no literarios
Lengua y escritos Textos literarios
Literatura Vocabulario formal y coloquial
Elementos de la lengua
Ortografía
Organización territorial del país
Sociedad y espacio
Características geográficas del Ecuador
geográfico
Regiones naturales del Ecuador
Ciencias Convivencia social y Deberes y derechos de los niños
Sociales desarrollo humano Gobierno
Patrimonio cultural y natural
Construcción histórica de
Diversidad cultural
la sociedad ecuatoriana
Hechos relevantes del Ecuador
Ciclo de la vida
Primeros auxilios
Seres vivos
Cuidado personal
Plantas y animales
Elementos naturales de la Recursos naturales
Ciencias
vida Contaminación y cuidado del medio ambiente
Naturales
Relaciones de los elementos bióticos y
Ecosistema abióticos
Conformación del ambiente natural
Formas de energía natural
Materia y energía
Estados de la materia
Masa
Unidades de medida
Agrarias
Sucesiones numéricas
Relaciones y funciones
Pares ordenados
Relación de orden
Porcentajes
Potenciación y radicación de número naturales
Números
Operaciones aritméticas
Matemática
Magnitudes directas e inversamente
proporcionales
Polígonos regulares e irregulares
Circunferencia y círculo
Geometría
Prismas y pirámides
Posición relativa de rectas
Probabilidad
Estadística y probabilidad
Medidas de tendencia central
Media Comprensión de textos Textos no literarios
escritos Textos literarios
Lengua y
Gramática
Literatura
Elementos de la lengua Ortografía
Vocabulario formal y coloquial
Organización territorial del país
Sociedad y espacio
Características geográficas del Ecuador
geográfico
Regiones naturales del Ecuador
Ciencias Convivencia social y Deberes y derechos de los niños
Sociales desarrollo humano Gobierno
Patrimonio cultural y natural
Construcción histórica de
Diversidad cultural
la sociedad ecuatoriana
Hechos relevantes del Ecuador
Ciclo de la vida
Ciencias Primeros auxilios
Seres vivos
Naturales Cuidado personal
Plantas y animales
12
Elementos naturales de la Recursos naturales
vida Contaminación y cuidado del medio ambiente
Relaciones de los elementos bióticos y
Ecosistema abióticos
Conformación del ambiente natural
Formas de energía natural
Materia y energía
Estados de la materia
Cuerpos geométricos
Geometría
Figuras planas
Razones trigonométricas
Trigonometría
Unidades de medidas angulares
Probabilidad
Estadística y probabilidad
Rango y medidas de tendencia central
Componentes de la función lineal
Matemática Función lineal
Representación de la función lineal
Números racionales e irracionales
Números Noción científica
Operaciones con números reales
Ecuaciones e inecuaciones
Álgebra Sistemas de ecuaciones
Expresiones algebraicas
Comprensión de textos Textos no literarios
escritos Textos literarios
Lengua y
Gramática
Literatura
Elementos de la lengua Ortografía
Vocabulario formal y coloquial
Superior
Construcción histórica de Procesos históricos
la sociedad Identidad cultural
Ciencias Sociedad y espacio Problemas socioeconómicos y ambientales
Sociales geográfico Transformaciones del espacio geográfico
Convivencia social y Derechos y deberes en Ecuador
desarrollo humano Problemas sociales del mundo
Formas de reproducción
Hábitos de vida saludable
Sistemas de vida
Procesos de integración neuroendocrino
Sexualidad humana
Ciclos biogeoquímicos
La tierra como nuestro
Bioregiones
Ciencias hábitat
Litósfera, hidrósfera y atmósfera
Naturales
Cambios físicos y químicos en la materia
Materia y energía Propiedades de los elementos químicos
Transformación de la materia y energía
Interacción entre las especies
Ecosistemas Flujos de energía en la red trófica
Conservación de biomas
Ecuaciones
Sistema de ecuaciones
Matrices
Desigualdades
Álgebra
Sistema de desigualdades
Vectores
Matemática Progresiones aritméticas
Progresiones geométricas
Función lineal
Funciones
Función cuadrática
Elementos
Programación lineal
Aplicaciones
Bachillerato Estadística y Probabilidad Medidas de dispersión
13
Combinaciones
Probabilidad
Parábola
Geometría Elipse
Hipérbola
Comprensión de textos Textos literarios
escritos Textos no literarios
Lengua y
Gramática
Literatura
Elementos de la lengua Ortografía
Vocabulario
Flujos de energía entre los niveles tróficos
Fotosíntesis y respiración celular
Ecosistema Niveles de organización de los seres vivos
Teorías sobre el origen de la vida
Teorías de la evolución de las especies
Conservación de los recursos naturales
La Tierra como nuestro Mecanismos físico-químicos
Ciencias hábitat Origen de la tierra
Naturales Planes de contingencia
Avances científicos y salud
Sistemas de vida Funciones vitales y sistema inmunológico
Procesos metabólicos y homeostáticos
Cambios de la materia y leyes estequiométricas
Transferencia entre materia Efectos de los desechos químicos
y energía Interacción entre los cuerpos
Ley de la conservación de la materia
Construcción histórica de la Identidad cultural
sociedad Sociedades históricas
Derechos y deberes en el Ecuador y el mundo
Estudios
Convivencia social Problemas sociales, ambientales y de la
Sociales
ciudadanía en el Ecuador y el mundo
Relación entre la sociedad Desarrollo territorial
y el espacio geográfico Equilibrio ecológico
6
Hasta el año lectivo 2019-2020 se continuó evaluando con los Estándares de Aprendizaje del año
2012. Si bien a partir del 2018 existieron varias propuestas de estructuras elaboradas con base en los estándares
del 2016, estas no fueron aprobadas oficialmente. Solo hasta el año 2020 se contó con estructuras aprobadas y
validadas tanto por el Ineval y por el Ministerio de Educación, las cuales se aplicarán desde el año 2021.
14
de logro 0, 1 y 2 de los Estándares de Aprendizaje, las razones técnicas para esta
priorización se las desarrolla más adelante en el acápite de análisis de insumos técnicos.
Esta necesaria actualización de SEST contribuye a la innovación de estrategias
metodológicas en el marco de evaluaciones estandarizadas a gran escala en el país, con
el fin de valorar de manera integral los aprendizajes del estudiantado.
Objetivo
Evaluar los aprendizajes de los estudiantes al finalizar los subniveles elemental, medio y
superior de Educación General Básica y del nivel de Bachillerato sobre la base de los
niveles de logro 0, 1 y 2 de los Estándares de Aprendizaje 2016, mediante tres
instrumentos de evaluación estandarizada a gran escala: prueba de base estructurada,
rúbrica analítica y lista de cotejo, a fin de obtener resultados que permitan al Ministerio de
Educación formular políticas públicas que fortalezcan los procesos formativos del Sistema
Nacional de Educación.
Marco normativo
En el marco de la Agenda 2030 para el Desarrollo Sostenible, las Naciones Unidas (2018)
planteó 17 Objetivos de Desarrollo Sostenible, entre los que incluye: eliminar la pobreza
en todas sus formas, combatir al cambio climático, garantizar una educación inclusiva y
de calidad, lograr la igualdad de género, proteger el medio ambiente y construir ciudades
inclusivas, seguras y sostenibles. En relación al ámbito educativo el objetivo cuatro busca
“garantizar una educación inclusiva y equitativa de calidad y promover oportunidades de
aprendizaje permanente para todos” (Naciones Unidas, 2018, p. 27), pues una educación
de calidad es la base para mejorar la calidad de vida de las personas y el desarrollo
sostenible de las sociedades (Naciones Unidas 2018).
15
El Código de la Niñez y Adolescencia también garantiza una educación pública, laica y
gratuita desde la educación básica hasta el bachillerato. En el artículo 37 demanda que el
sistema educativo: “garantice el acceso y permanencia de todo niño y niña a la educación
básica, así como del adolescente hasta el bachillerato o su equivalente”. Sin embargo, en
este marco normativo, la obligatoriedad de la educación se centra únicamente en la EGB
(1.° a 10.° grado).
16
El Plan Decenal de Educación 2016-2025, procura la generación de políticas públicas y
planes en torno a la educación para limitar brechas de desigualdad y garantizar el acceso
a la educación de toda la población infantil y juvenil. El Plan Decenal contempla la calidad
educativa a través de los componentes: docentes, estudiantes e infraestructura, y
vislumbra que la calidad educativa es educar de manera integral para alcanzar la equidad
social y el desarrollo personal. Con el fin de alcanzar dicha calidad educativa, busca: 1)
Garantizar oportunidades de aprendizaje para desarrollar una comunidad educativa justa,
solidaria e innovadora; y, 2) Mejorar los resultados de aprendizaje medidos a través de un
sistema integral de evaluación de la calidad (Red de Maestros & Maestros por la
Revoluación Ciudadana, 2016).
Incrementar del 72,25% al 80% la tasa neta de asistencia ajustada en bachillerato a 2021.
Incrementar del 63% al 65% las personas de 18 a 29 años con bachillerato completo a
2021.
Incrementar del 27,81% al 31,21% la tasa bruta de matrícula en educación superior en
universidades y escuelas politécnicas a 2021.
Sobre esta base normativa, programas, agendas y planes nacionales e internacionales,
se desarrolla la evaluación SEST. También se consideran las características del perfil de
salida del bachiller en sus tres componentes: justicia, innovación y solidaridad. Este perfil
de salida se considera como elemento fundamental para direccionar el objetivo del
proceso evaluativo, en relación con las y los estudiantes que cursan todos los niveles
educativos.
Marco conceptual
17
Lo que se debe resaltar de ambas propuestas es que convierte a las y los estudiantes en
sujetos activos de su propio aprendizaje, tanto de forma individual (intrasubjetiva) como
con su entorno (intersubjetiva):
18
Taxonomía y niveles cognoscitivos
Para enlazar la propuesta constructivista del Currículo Nacional con un modelo de los
procesos cognoscitivos de los aprendizajes que permita dar cuenta de las habilidades, las
destrezas y las actitudes de las y los estudiantes, la evaluación SEST toma los aportes de
la taxonomía de Marzano y Kendall puesto que esta “amplió la concepción del aprendizaje
de un modelo conductista simple y unidimensional a uno que era multidimensional y de
naturaleza más constructivista” (Kendall & Marzano, 2007, p. 8).
7
La estructura de evaluación es una matriz de especificación lógica de contenidos con cuatro niveles
de desagregación: Campo, Grupo Temático, Tópico y DO.
19
a la motivación por aprender (nivel 6). Por otro lado, los dominios de conocimiento son
tres: información, como el conjunto organizado de datos que coadyuvan a la descripción
de manera específica o sintetizada; procedimientos mentales, que corresponde a cómo se
maneja la información para ejecutar acciones de diversa índole; y procedimientos
psicomotores, que están relacionados con la coordinación de movimientos corporales con
diferentes finalidades (Gallardo & Gil, 2011, 2012).
Elaborado por: Marzano y Kendall (2007, adaptado al español por Gallardo, 2009)
Fuente: Gallardo (2009)
Para Marzano y Kendall (2007) los tres sistemas de pensamiento son el corazón de la
nueva taxonomía: sistema cognitivo, sistema metacognitivo y sistema interno. Estos
sistemas se pueden establecer en orden jerárquico, pero, además, los cuatro elementos
que contiene el sistema cognitivo también se pueden ordenar dentro del sistema. Esto
convierte a la nueva taxonomía en una estructura de seis niveles. Si bien existe una
naturaleza jerárquica en la estructura de la nueva taxonomía, esta no tiene que ver con
niveles de dificultad como en Bloom (1956), sino que se basa en un flujo de procesamiento
del conocimiento.
Para las LSLA que desarrolla el Ineval, se utilizan los niveles de procesamiento y no los
dominios de conocimiento, pues estos responden a la operatividad en el planteamiento de
las estructuras de evaluación. Para fines de la evaluación de los objetivos de aprendizaje,
para cada nivel se ha establecido un conjunto de verbos que permiten valorar los
conocimientos, habilidades, destrezas y actitudes en el proceso de aprendizaje de las y
los estudiantes. En la siguiente tabla se mencionan los verbos que recomienda utilizar
Marzano (2001):
20
Tabla 3. Verbos recomendados para cada nivel cognoscitivo
Niveles cognoscitivos Verbos recomendados8
Nivel 1 Recuperación Repetir, registrar, listar, definir, memorizar, rotular,
Se encarga de la activación y la transferencia del nombrar, identificar, relatar, recoger, subrayar,
conocimiento de la memoria permanente a la memoria examinar, enumerar, tabular, enunciar, citar,
de trabajo. Este proceso difiere dependiendo del tipo de recordar, describir, reproducir.
información con la que esté trabajando. Así, se puede
hablar de los procesos de reconocimiento o recuerdo.
Nivel 2 Comprensión Interpretar, predecir, traducir, asociar, reafirmar,
Es el encargado de traducir el conocimiento en las estimar, describir, diferenciar, reconocer, extender,
formas adecuadas para que su almacenaje en la expresar, resumir, informar, discutir, revisar,
memoria permanente se produzca, es decir, que tome contrastar, identificar, distinguir, ordenar, explicar,
la estructura y el formato que se requiere para que la seriar, ilustrar, exponer, parafrasear, comparar.
información clave se preserve. Según la Nueva
Taxonomía, las operaciones mentales que coadyuvan
a lograr la comprensión son la integración y la
simbolización.
Nivel 3 Análisis Distinguir, examinar, analizar, catalogar,
Corresponde a la extensión razonada del diferenciar, inducir, destacar, inferir, experimentar,
conocimiento. En este estadio las personas elaboran a discriminar, probar, subdividir, comparar,
partir del conocimiento que comprenden. Por lo tanto, desmenuzar, contrastar, separar, criticar, ordenar,
se puede afirmar que el análisis va más allá de la discutir, explicar, diagramar, conectar,
identificación de lo esencial versus lo no esencial que inspeccionar, seleccionar, pedir, arreglar, clasificar,
son funciones propias de la comprensión. categorizar, separar.
Nivel 4 Aplicación Aplicar, producir, emplear, resolver, utilizar,
Se presenta cuando la persona se ve en la necesidad ejemplificar, demostrar, comprobar, practicar,
de cumplir con determinadas tareas. Dichas tareas calcular, ilustrar, manipular, operar, completar,
podrían considerarse las avenidas por donde corre el programar, mostrar, dibujar, examinar, esbozar,
conocimiento que se presenta como un elemento útil modificar, convertir, relatar, transformar, clasificar,
para satisfacer las necesidades de la persona. cambiar, descubrir, experimentar, computar, usar,
construir.
Nivel 5 Metacognición Planear, definir, proponer, combinar, diseñar,
Es el responsable del monitoreo, evaluación y reacomodar, formular, compilar, reunir, componer,
regulación de todos los tipos de pensamiento. construir, relacionar, crear, elaborar, establecer,
Es decir, es el responsable del control de ejecución. explicar, organizar, concluir, dirigir, reconstruir,
Este nivel sostiene cuatro funciones: especificar las preparar, idear, deducir, reorganizar, resumir,
metas, monitoreo de los procesos, monitoreo de la reordenar, generalizar, desarrollar, integrar,
claridad y monitoreo de la precisión. reescribe, substituir, generalizar, crear, modificar,
inventar, plantear, plantear hipótesis.
Nivel 6 Autorregulación Juzgar, detectar, evaluar, debatir, clasificar,
Contiene una interrelación entre diversos elementos argumentar, estimar, cuestionar, valorar, decidir,
que intervienen en el proceso de aprendizaje como son: calificar, establecer, gradación, seleccionar,
las actitudes, las creencias y las emociones. Es la probar, medir, descubrir, recomendar, justificar,
interrelación entre estos elementos lo que determina explicar, estructurar, sumar, pronosticar, valorar,
finalmente la motivación y la atención. predecir, criticar, apoyar, discriminar, predecir,
convencer, concluir, establecer rangos.
8
Existen verbos que se encuentran en más de un nivel taxonómico. Por ejemplo: identificar se
encuentra en los niveles 1 y 2; examinar en los niveles 1, 3 y 4. Así, la lista de verbos es referencial para la
elaboración de ítems. Por tanto, la habilidad específica del ítem se planteará en el marco del proceso cognitivo
del nivel taxonómico.
21
La propuesta de la taxonomía de Marzano y Kendall para la evaluación de los aprendizajes
se ha venido implementado en los últimos años. Algunos han llevado la taxonomía a la
evaluación en educación preescolar (Gutiérrez, 2014), en educación secundaria (Tafur,
2015) y en la educación superior (Arroyo, 2017; Gallardo & Gil, 2011, 2012). El mismo
Marzano adelanta algunas propuestas para la evaluación mediante su taxonomía (Kendall
& Marzano, 2008). Sin bien, aún no existe mayor literatura sobre el uso de la taxonomía
de Marzano en procesos de evaluación a gran escala, es importante recordar que esta se
sustenta en la taxonomía de Bloom, la cual ya se la utiliza hace varias décadas para este
tipo de evaluaciones. La taxonomía de Marzano permite a los elaboradores y validadores
de ítems mayor flexibilidad (esto se profundizará en el acápite 6.3.3). Algunos trabajos ya
han empezado a validar con modelos estadísticos la funcionalidad de la taxonomía de
Marzano en evaluaciones a gran escala (Timofte & Siminiciuc, 2018).
Una vez que se ha establecido la relación teórica entre el modelo pedagógico socio-
constructivista del currículo nacional con la propuesta de la taxonomía de Marzano y
Kendall, la evaluación no puede ser desvinculada de los principios y fines de la educación
definidos en la LOEI, la cual rige todos los procesos que se desarrollan en el ámbito
educativo; uno de los elementos clave que plantea la LOEI son los Estándares de Calidad
Educativa, específicamente los Estándares de Aprendizaje.
Estándares de Aprendizajes
22
Tabla 4. Estructura del Estándar de Aprendizaje
Indicadores de calidad educativa
Criterio de Indicadores para la
Estándar No Nivel de Nivel de Nivel de
evaluación evaluación del criterio
alcanzado logro 1 logro 2 logro 3
El estándar a su vez incluye Indicadores de Calidad Educativa que, según el artículo 14,
numeral 2 del RG-LOEI, son enunciados que “señalan qué evidencias se consideran
aceptables para determinar que se hayan cumplido los estándares de calidad educativa”.
Corresponde a las siguientes categorías:
Se debe entender a los Estándares de Aprendizaje como el insumo que especifica los
aprendizajes que se espera adquieran las y los estudiantes, incluyendo principalmente,
aspectos de conocimiento (saber), de habilidad y de destrezas (saber hacer), aunque en
determinados casos también de identidad y de comportamiento (saber ser) a partir del
trabajo que desarrollan en cada una de las áreas de aprendizaje del currículo. Estos
estándares son, por tanto, al igual que los indicadores empleados para la evaluación de
los aprendizajes en el contexto de los procesos de enseñanza y aprendizaje,
especificaciones de los criterios de evaluación que permiten delimitar los resultados de
aprendizaje, y deben ser observables, medibles y evaluables, permitiendo una gradación
de los logros de las y los estudiantes.
Los Estándares de aprendizaje y los indicadores de calidad educativa de cada área son
los insumos principales para la elaboración de las estructuras de evaluación y, por ende,
de los ítems y del instrumento. Precisamente, una de las consideraciones es que no todos
los niveles de logro pueden convertirse en DO, así como tampoco se adaptan a la prueba
de base estructurada. Es decir, la utilización de los indicadores para la elaboración de un
instrumento de evaluación depende de su adaptabilidad.
23
Evaluación de los aprendizajes a gran escala
Las LSLA son un subconjunto concreto de sistemas de evaluación del aprendizaje. Son
evaluaciones a nivel del sistema que proporcionan un resumen de los resultados de
aprendizaje de un grupo de alumnos determinado (basado en la edad o el curso), en un
año académico determinado y en un número limitado de ámbitos. Suelen clasificarse como
evaluaciones nacionales o transnacionales (regionales/ internacionales). Las LSLA son
uniformes y están estandarizadas en términos de contenido, proceso de administración,
fechas y sistemas de puntuación. Por lo general, están basadas en muestreos, si bien un
número cada vez mayor de países ha adoptado a lo largo de los últimos decenios un
enfoque de base censal. (Unesco, 2019, pp. 17-18)
Por lo general, las LSLA tienen tres finalidades: 1) certificación escolar de finalización de
cursos; 2) selección de las y los estudiantes para educación superior; y 3) evaluar el
funcionamiento de los sistemas educativos (Unesco, 2019).
SEST se inscribe en esta última finalidad, pues busca evaluar al SNE y, a partir de
evidencia empírica, enfrentar las problemáticas educativas a través de la política pública.
De este modo, SEST también se inscribe en un enfoque de evaluación de carácter
formativo, puesto que el análisis de los resultados de los logros de aprendizaje garantiza
acciones educativas posteriores. Para garantizar la efectividad de este tipo de evaluación
es necesario que:
Los diferentes actores reciban, comprendan y utilicen los resultados [para ello] se debe
invertir tiempo en el análisis y discusión de los mismos por parte de diversas áreas del
Ministerio de Educación y otros actores relevantes, en la comprensión de los problemas y
deficiencias que los resultados ponen de manifiesto y en la concepción de acciones e
inversiones apropiadas para hacerles frente. (Ravela et al., 2008, p. 53)
Además, siguiendo los lineamientos del Plan Estratégico del Ineval (2018c), la LSLA que
propone SEST también es contextualizada. Precisamente, uno de los objetivos
estratégicos del plan es “incrementar la pertinencia de las evaluaciones de acuerdo a los
contextos y a los estándares” (Ineval, 2018c, p. 32), lo cual implica implementar modelos
de evaluación adaptativa según el contexto, la pertinencia cultural y lingüística.
En resumen, la evaluación SEST que propone el Ineval, al ser una prueba estandarizada
a gran escala tiene un carácter externo (evalúa el sistema educativo como agente externo),
pero a su vez conjuga el carácter criterial (definido por Estándares de Aprendizaje),
contextual (según la pertinencia cultural) y el carácter formativo (definido por la política
24
pública) como un proceso activo que promueve la mejora de los aprendizajes del
estudiantado y la calidad educativa del SNE.
A las LSLA se las asocia con las pruebas estandarizadas, las cuales son los instrumentos
de evaluación externa más utilizadas en la educación a escala nacional e internacional
(Arancibia, 2015). Las pruebas estandarizadas son instrumentos desarrollados,
administrados y calificados de acuerdo con procedimientos uniformes, diseñados para
garantizar resultados consistentes que pueden compararse de manera significativa en una
población (Morris, 2011).
Estos tipos de pruebas deben cumplir tres atributos: objetividad, validez y confiabilidad,
que son fundamentales para el diseño, administración, interpretación y uso de este tipo de
pruebas (Tristán & Pedraza, 2017). En cuanto a la evaluación de aprendizajes mediante
pruebas estandarizadas, cabe decir que:
Lo que trata de hacer es crear herramientas de evaluación que permitan hacer una
inferencia válida sobre los conocimientos y/o las destrezas que posee un estudiante
determinado en un área particular de contenidos. Más precisamente, esa inferencia tiene
que referirse a normas, de manera que los conocimientos y/o las destrezas relativas de un
estudiante puedan ser comparadas con las poseídas por una muestra nacional de
estudiantes de la misma edad o grado escolar. (Popham, 1999, p. 2)
El diseño de las pruebas estandarizadas para SEST debe responder, por un lado, a los
criterios establecidos por el currículo y los Estándares de Aprendizaje; y, por otro lado, a
la propuesta metodológica de taxonomía de Marzano y Kendall. De este modo, se
conjugan dos ámbitos: campo del currículo que determina los contenidos, habilidades y
destrezas; y del campo de la psicometría que permite estimar de forma cuantitativa y/o
cualitativa los aprendizajes a través del rasgo latente, los niveles de desempeño y los
niveles de logro.
Este tipo de pruebas son las que mayor desarrollo han tenido en el ámbito de la LSLA.
Estas se han desarrollado desde la década de los sesenta del siglo anterior hasta la
actualidad. Hoy en día las pruebas de base estructurada “privilegian los procesos
cognitivos de mayor nivel que el simple conocimiento por memorización como en las
25
anteriores pruebas” (Andrade, 2013, p. 4). En este tipo de pruebas, la persona sustentante
“tiene la posibilidad de relacionar los conocimientos aprendidos para llegar a una sola
respuesta; este tipo de pruebas presentan ítems de opción múltiple” (Simbaña & Corina,
2016, p. 8). Además, este instrumento es de fácil aplicación y calificación, por ende, los
costos son menores.
El Manual de elaboración de ítems de opción múltiple que propone el Ineval (2018b) para
pruebas de base estructurada, plantea cinco modelos en la elaboración de ítems de opción
múltiple: simple, ordenamiento, completamiento, elección de elemento y relación de
columnas. Este modelo de pruebas de base estructurada es el que se ha aplicado
históricamente en todas las evaluaciones de SEST.
6.1.2. Rúbrica
Las rúbricas “son guías o escalas de evaluación donde se establecen niveles progresivos
de dominio o pericia relativos al desempeño que una persona muestra respecto de un
proceso o producción determinada” (Martínez, 2008, p. 129). Las rúbricas integran un
amplio rango de criterios, generalmente son escalas ordinales que destacan una
evaluación del desempeño centrada en aspectos cualitativos, pero también es posible el
establecimiento de puntuaciones numéricas. Las rúbricas pueden ser holísticas, es decir,
no separan las partes de una tarea o trabajo; o, pueden ser analíticas, donde se desagrega
en partes de una actividad o un conjunto de actividades (Alsina, 2013).
La rúbrica holística realiza una evaluación integral del desempeño del estudiantado, “se
trata de una valoración general con descriptores correspondientes a niveles de logro sobre
la calidad, comprensión y dominios globales” (Gatica & Uribarren, 2013, p. 62). Esta
demanda menos tiempo en calificar, pero la retroalimentación es limitada.
Por su parte, las rúbricas analíticas se utilizan para “evaluar las partes del desempeño del
estudiante, desglosando sus componentes para obtener una calificación total. Puede
utilizarse para determinar el estado del desempeño, identificar fortalezas, debilidades, y
para permitir que los estudiantes conozcan lo que requieren para mejorar” (Gatica &
Uribarren, 2013, p. 62). La rúbrica analítica establece un conjunto de criterios y parámetros
26
de evaluación de una actividad, y por lo tanto será útil para “aunar criterios, niveles de
logro y descriptores cuando de juzgar o evaluar un aspecto del proceso educativo se trata”
(Martínez, 2008, p. 129). Este tipo de rúbrica será la utilizada en la evaluación SEST. En
este orden, para diseñarla se generan criterios de realización basados en los estándares
e indicadores de logro establecidos por la AEN. A continuación, se presenta un modelo de
rúbrica analítica.
De este modo, para la evaluación SEST se realizará una distinción en la rúbrica analítica
según el tipo de desempeño que busca evaluar cada área: 1) Rúbrica analítica de proceso
27
para las áreas de Educación Cultural y Artística y Educación Física; y, 2) Rúbrica analítica
de producto para Escritura del área Lengua y Literatura.
La rúbrica analítica de proceso se aplicará para las áreas de Educación Cultural y Artística,
y Educación Física. Para su elaboración se recomienda plantear una actividad ligada a un
Grupo Temático que abarque varios Tópicos. Los Tópicos se convierten en los criterios de
evaluación y las DO en los indicadores de niveles de logro. Para el desarrollo de una
actividad específica, la presente propuesta tiene que ser modificada y adaptada según el
contexto de la evaluación. Así, por ejemplo, si la evaluación se desarrolla en la Costa, y la
actividad precisa de la realización de un juego regional, esta necesariamente tiene que
adaptarse al contexto cultural y lingüístico. Se sugiere que la adaptación contextual de la
rúbrica llegue hasta un nivel regional. A continuación, se presenta un ejemplo de rúbrica
analítica de proceso para el área de Educación Física del subnivel media.
28
Nota 2: en la tabla se plantea de manera general la rúbrica analítica de proceso. Esta tiene que ser adaptada
según la actividad recomendada para el subnivel y el contexto regional, por lo que los indicadores
necesariamente cambiarán a un contenido más específico que el propuesto en las estructuras de evaluación.
Nota 3: los niveles de logro también pueden adecuarse según la necesidad del desarrollo del instrumento.
29
Se aplica para el área de Lengua y Literatura en lo que corresponde al Grupo Temático de
Comunicación oral. Consiste en una lista de características o conductas esperadas del
estudiantado en la ejecución o aplicación de un proceso, destreza o actitud. Este
instrumento de verificación es útil para la evaluación a través de la observación, en ella se
enlistan las características, aspectos, cualidades, criterios, etc., cuya presencia (o
ausencia) se busca determinar (Romo-Martínez, 2015; Ruiz, 2007).
Para el área de Lengua y Literatura, como consta en la siguiente tabla, el criterio de la lista
de cotejo está dado por la DO y los indicadores responden a cada criterio dependiendo de
los contendidos y habilidades que estas desarrollen, en algunos casos estos se señalan
en los acotamientos9 de las DO. A continuación, se presenta un ejemplo de lista de cotejo.
Para construir una lista de cotejo es pertinente definir de manera rigurosa los indicadores
que se piensan evaluar con el fin de construir respuestas dicotómicas: si/no, cumple/no
cumple, etc.; por tanto, se descarta el uso de enunciados valorativos intermedios: a veces,
es posible, etc. Es necesario que los indicadores sean observables y verificables,
redactados de forma concisa y que tengan un mismo nivel de exigencia o profundización.
Es conveniente para la construcción de este instrumento realizar un análisis secuencial de
tareas, según el orden en que debe desarrollar la destreza (UDLA, 2015). El agente
evaluador debe ser un/a docente o un/a experto/a en el área. Para información más
específica sobre la utilización del instrumento, remitirse al documento Lineamientos
técnicos y procedimentales para el desarrollo de la evaluación Ser Estudiante: rúbricas y
listas de cotejo.
9
El acotamiento se emplea cuando se requiere aclarar o detallar aspectos que no fueron cubiertos en
la Definición Operacional, con el fin de proveer orientaciones más precisas para la elaboración de ítems
30
último representa un reto ya que se trata de valorar la capacidad de los seres humanos
para interactuar con sus pares desde edades tempranas, pues existe una conexión directa
entre las habilidades sociales y emocionales con la regulación de ambientes de
interacción, identificación de emociones y la realización de objetivos personales. Por lo
tanto, la encuesta de Factores Asociados complementa a los instrumentos de evaluación
del SEST.
Dada la relevancia del Llece para América Latina y el Caribe, el Ineval utiliza como guía el
modelo Contexto, Insumo, Proceso y Producto –CIPP– en las encuestas de Factores
Asociados, pero adaptadas y contextualizadas a la realidad del Ecuador (Ineval, 2020).
Este modelo CIPP se divide en ámbitos, dominios y subdominios como se muestra en la
siguiente tabla.
31
Condiciones laborales
Victimización
Ambiente escolar Expectativas de escolaridad futura
Sentido de pertenencia
Acceso a libros
Disponibilidad de cuadernos
Recursos de aprendizaje
Biblioteca
Computadores
Apoyo y retroalimentación a los docentes
Actividades y distribución del tiempo de
Liderazgo y gestión escolar
directores escolares (liderazgo directivo)
Duración de la jornada escolar
Elaborado por: Dirección de Diseño Estratégico de Evaluaciones Educativas
Fuente: Ineval (2020)
32
Tabla 12. Esquema epistemológico de la evaluación de SEST
MINEDUC e instituciones educativas Ineval
Campo del currículo y la pedagogía Campo de las pruebas
estandarizadas y la psicometría
Tipo de Tipo de Tipo de Niveles Instrumento
saber contenido aprendizaje cognoscitivos de evaluación
Estándares de Aprendizaje
N1 Recuperación
Prueba de
N2 Comprensión
Saber Conceptual Cognitivo Base
N3 Análisis
Estructurada
N4 Aplicación
Rúbrica
Saber N3 Análisis
Procedimental Psicomotor Lista de
hacer N4 Aplicación
cotejo
Rúbrica
N5 Metacognición
Saber ser Actitudinal Afectivo Lista de
N6 Autorregulación
cotejo
Elaborado por: Dirección de Diseño Estratégico de Evaluaciones Educativas
Fuente: Varios (Coll et al., 1994; Fernández, 2017; Kendall & Marzano, 2007; Kutugata, 2017; Ministerio de
Educación, 2017a; Ruiz, 2007; Tobón, 2006)
Este insumo es fundamental para establecer los Campos, Grupos Temático y Tópicos de
la estructura de evaluación. A continuación, se presentan las áreas de conocimiento y sus
asignaturas.
33
Tabla 13. Áreas del conocimiento del Currículo Nacional
Áreas de Conocimiento Asignaturas para EGB Asignaturas para bachillerato
Lengua y Literatura Lengua y Literatura Lengua y Literatura
Lengua Extranjera10 Inglés Inglés
Matemática Matemática Matemática
Química
Ciencias Naturales Ciencias Naturales Biología
Física
Historia
Filosofía
Ciencias Sociales Estudios Sociales
Educación para la
ciudadanía
Educación Física Educación Física Educación Física
Educación Cultural y Educación Cultural y Educación Cultural y
Artística Artística Artística
Elaborado por: Dirección de Diseño Estratégico de Evaluaciones Educativas
Fuente: Ministerio de Educación (2016a)
10
Mediante oficio MINEDUC-SFE-2021-00047-OF del 22 de marzo de 2021, donde el Ministerio de
Educación envía observaciones al modelo Ser Estudiante, se informa que de conformidad al Acuerdo Ministerial
MINEDUC-ME-2016-00107-A de 12 de noviembre de 2016, se indica en el artículo 1 "(…) Los estándares de
aprendizaje serán referentes para la evaluación externa orientada a la medición de logros de aprendizaje de los
estudiantes; los cuales serán empleados por el Instituto Nacional de Evaluación Educativa-INEVAL o por
cualquier otra institución que realice evaluación externa. Los estándares del área de Lengua Extranjera
corresponden a los establecidos en el Marco Común Europeo de Referencia para la enseñanza de las lenguas
(MCER), de acuerdo a los niveles y subniveles contemplados en el Currículo Nacional para cada subnivel de la
EGB y el nivel de BGU". El SEST no evalúa inglés sin embargo, podría definirse otro modelo específico para esta
asignatura ya que tiene consideraciones especiales.
34
Tabla 14. Estándares de Aprendizaje para EGB y bachillerato de SEST
EGB Total
Área Asignatura Bachillerato
Preparatoria Elemental Media Superior áreas
Matemática Matemática 5 5 11 8 11 40
Lengua y
Lengua y Literatura 7 11 8 9 9 44
Literatura
Biología 10
Ciencias Ciencias
Química 5 11 12 14 14 88
Naturales Naturales
Física 22
Historia 21
Ciencias Estudios
Filosofía 6 6 13 11 7 74
Sociales Sociales
Ciudadanía 10
Educación
Educación Cultural y
Cultural y 8 13 16 19 15 71
Artística
Artística
Educación
Educación Física 11 16 14 21 21 83
Física
Total subniveles 42 62 74 82 140 400
Elaborado por: Dirección de Diseño Estratégico de Evaluaciones Educativas
Fuente: Ministerio de Educación (2017a)
Una vez establecidas las características de los dos principales insumos para la elaboración
de los contenidos de las estructuras de evaluación, es importante establecer los criterios
técnicos y normativos para su utilización. A continuación, se presenta una tabla en la que
se detalla el uso de cada insumo técnico y su justificación.
Tabla 15. Detalle de los componentes de los insumos utilizados y no utilizados en las
estructuras de evaluación de SEST
35
Insumo Componente Estado Justificación
Currículo Perfil de salida del Si bien los contenidos de justicia, innovación y
Nacional de bachillerato No solidaridad se encuentran tranversalizados en todas
EGB ecuatoriano utilizado las áreas del currículo, este no se utiliza directamente
en la elaboración de las estructuras de evaluación.
Objetivos generales Contiene información general no aplicable en la
No
del Currículo Nacional estructura de evaluación.
utilizado
para EGB
Destrezas con criterios Este componente es fundamental para la elaboración
de desempeño para de las estructuras de evaluación, sobre todo para
cada área y cada determinar los Campos, Grupos Temáticos y
Utilizado
subnivel, organizadas Tópicos. También son necesarias para el
en bloques acotamiento de la Definición Operacional.
curriculares
Criterios e indicadores Este componente se lo utiliza para la elaboración de
de evaluación por Utilizado los acotamientos de las Definiciones Operacionales.
subnivel
Currículo Perfil de salida del Si bien los contenidos de justicia, innovación y
Nacional de bachiller ecuatoriano No solidaridad se encuentran tranversalizados en todas
bachillerato utilizado las áreas del currículo, este no se utiliza directamente
en la elaboración de las estructuras de evaluación.
Objetivos generales Contiene información general no aplicable en la
No
del Currículo Nacional estructura de evaluación.
utilizado
para EGB
Destrezas con criterio Este componente es fundamental para la elaboración
de desempeño para de las estructuras de evaluación, sobre todo para
cada área y cada determinar los Campos, Grupos Temático y Tópicos.
Utilizado
subnivel, organizadas También son necesarias para el acotamiento de la
en bloques Definición Operacional.
curriculares
Criterios e indicadores Este componente se lo utiliza para la elaboración de
de evaluación por Utilizado los acotamientos de las Definiciones Operacionales.
subnivel
Estándares Es el componente principal para la elaboración de las
de Definiciones Operacionales de la estructura de
Estándar Utilizado
Aprendizaje evaluación, puesto que de este se desagrega los
contenidos fundamentales.
Se consideró que los estándares E.LL.2.11.,
E.LL.3.8., E.LL.4.9., E.LL.5.8. de los subniveles
elemental, media, superior y bachillerato, del Grupo
Temático de Literatura del Tópico Escritura creativa
no se evalúan porque las habilidades y contenidos
están orientados hacia una evaluación de tipo
interna, puesto que propone indagar en aspectos
contextuales y personales de cada estudiante como
Estándares de Lengua No los siguientes: “Recrear textos” (elemental),
y Literatura utilizado “reinventa textos (…) con relación al contexto cultural
propio” (media), “Recrea textos literarios (…)
adecuados a la intención” (superior), “Recrea desde
la experiencia personal” (bachillerato). Estos
aspectos dificultan una evaluación estandarizada a
gran escala. Además, no se evalúan porque la
competencia escrita que busca desarrollar en estos
estándares ya se evalúa en el Grupo Temático de
Escritura.
En mesas de revisión de las estructuras de
2 estándares de evaluación, se consideró que el estándar
No
bachillerato de la E.CN.F.5.16. no se evaluará debido a que el
utilizado
asignatura de Física contenido, magnetismo y electricidad, está
desarrollado dentro del estándar E.CN.F.5.12 y se
36
alinea de mejor manera a la evaluación
estandarizada a gran escala. Así mismo, el estándar
E.CN.F.5.2 no se evaluará debido a que el contenido,
movimiento en dos dimensiones, es desarrollado
dentro del estándar E.CN.F.5.6 y se alinea de mejor
manera a la evaluación estandarizada a gran escala.
En mesas de revisión de las estructuras de
evaluación, se consideró que el estándar E.CS.2.3.
(importancia de la escuela) no puede ser evaluado
1 estándar del subnivel
No con evaluación estandarizada a gran escala, puesto
elemental de EGB de
utilizado que las habilidades y destrezas requeridas
Ciencias Sociales
demandan un proceso evaluativo a mediano y largo
plazo, por lo que su aplicación se centra
eminentemente en el proceso formativo del aula.
En mesas de revisión de las estructuras de
evaluación, se consideró que los estándares
1 estándar del subnivel E.EF.4.3.3. y E.EF.5.2.1. no pueden ser evaluados
media de EGB y 1 bajo la modalidad de evaluación estandarizada a
No
estándar de gran escala, puesto que las habilidades y destrezas
utilizado
bachillerato del área requeridas por los estándares demandan un proceso
de Educación Física evaluativo a mediano y largo plazo, por lo que su
aplicación se centra eminentemente en el proceso
formativo del aula.
El currículo del área de Educación Física consta de
cuatro ejes principales (prácticas lúdicas, los juegos
y el jugar; prácticas gimnásticas; prácticas corporales
expresivo–comunicativas; y prácticas deportivas) y
Estándares de los ejes
No dos ejes transversales (construcción de la identidad
transversales del área
utilizado corporal y relaciones entre prácticas corporales y
de Educación Física.
salud). Puesto que los contenidos de los ejes
transversales ya son abordados de manera implícita
en los ejes principales, se considera que no es
necesaria su evaluación.
En mesas de validación se definió que se utilizarán
Indicadores de calidad únicamente los niveles de logro 0, 1 y 2 del estándar
Utilizado
educativa de manera referencial para construir los indicadores
del Ineval.
No se utiliza el nivel de logro 3 debido a dos motivos:
1. Los contenidos y habilidades propuestos por el
Indicadores de calidad
No nivel de logro 3 sobrepasa al estándar; y 2. Las
educativa (nivel de
utilizado habilidades y destrezas que intenta medir el nivel de
logro 3)
logro 3 responde más a una evaluación interna y no
a una evaluación estandarizada a gran escala.
Estructuras Estas estructuras fueron creadas con los estándares
anteriores Matemática, Lengua y del 2012, por lo que abordaban otros contenidos y
Literatura, Ciencias No valoraban otras destrezas y habilidades. La
Naturales y Ciencias utilizado evaluación SEST del presente año considera nuevas
Sociales estructuras de evaluación de acuerdo con los
estándares del 2016.
Versiones Matemática, Lengua y
borradores Literatura, Ciencias
de las Naturales, Ciencias Las mencionadas estructuras fueron la base
Utilizadas
estructuras Sociales, Educación sustancial para realizar la versión definitiva.
realizadas Cultural y Artística, y
en 2019 Educación Física
37
Una vez definidos los insumos técnicos para la elaboración de las estructuras de
evaluación, se estableció la siguiente composición de estructuras de evaluación para todas
las áreas y subniveles de evaluación de SEST con cada uno de los componentes de los
insumos utilizados.
38
Tabla 17. Estándar, indicadores y niveles de logro
Indicadores de calidad educativa
Estándar
No alcanzado Nivel de logro 1 Nivel de logro 2 Nivel de logro 3
E.CN.4.1. E.CN.4.1.1.a. E.CN.4.1.1.b. E.CN.4.1.1.c. E.CN.4.1.1.d.
Argumenta que los Reconoce los Clasifica a los Argumenta que los Establece la
seres vivos poseen niveles de seres vivos según seres vivos poseen relación entre los
diferentes niveles organización de los niveles de diferentes niveles niveles de
de organización y los seres vivos. organización y de organización y organización de la
diversidad, según grupos diversidad, según materia viva y los
las propiedades y taxonómicos da- las propiedades y procesos
características que dos. características que evolutivos de las
presentan. presentan. especies.
Asimismo, en la tabla anterior se puede observar cómo el nivel de logro 3 sobrepasa los
requerimientos establecidos por el mismo estándar, ya sea en términos de contenido o de
habilidad. Esto sucede con la mayoría de los Estándares de Aprendizaje en todas las
áreas.
Por lo tanto, para la construcción de las estructuras de evaluación del SEST, se plantea
utilizar los tres primeros niveles de logro: nivel de logro no alcanzado, nivel de logro 1 y
nivel de logro 2. El nivel de logro 3 no se utilizará para la elaboración de las estructuras de
evaluación; a continuación, se puede observar los argumentos que surgieron por cada
área en los procesos de validación y mesas de trabajo durante la construcción de las
estructuras de evaluación para la no consideración del nivel de logro 3 del estándar:
39
mayoría estos niveles de logro sobrepasan al estándar y, por lo tanto, a los
contenidos planteados en el currículo de los diferentes subniveles y asignaturas.
En Ciencias Sociales tampoco se evalúa el nivel de logro 3. Este nivel pretende
evaluar habilidades que pertenecen a los niveles 5 y 6 de la taxonomía de Kendal
y Marzano, es decir, a la metacognición y autorregulación. Entre las habilidades a
evaluarse en este nivel encontramos: justifica, argumenta, evalúa, cuestiona,
critica, juzga, construye, etc. Sin embargo, habilidades como las mencionadas no
pueden evaluarse mediante pruebas de base estructurada.
En Educación Cultural y Artística, el nivel de logro 3 sobrepasa lo que establece
el estándar debido a que aborda motivaciones personales para realizar una
actividad con mayor entrega y satisfacción. Además, el proceso de creación que
plantea el currículo a través de los ejes: observación, exploración y expresión,
indagación e investigación, participación y convivencia, se encuentran en el nivel
3 del estándar y da cuenta de una dimensión social de relacionamiento con otros
actores. La mayoría de las acciones del nivel de logro 3 del estándar se enmarcan
en el nivel 6 de la taxonomía de Kendal y Marzano, que corresponde a la
autorregulación (los verbos usados son descubrir, discriminar, argumentar,
recomendar, detectar, evaluar, cuestionar, valorar). Por tanto, su valoración
corresponde a un proceso de evaluación formativa en el aula.
En Educación Física no es pertinente evaluar el nivel de logro 3 debido a que este
sobrepasa los requerimientos establecidos por el estándar tanto en contenido
como en habilidad. El nivel de logro 3 no solo evalúa habilidades y destrezas, sino
actitudes, motivaciones, emociones, liderazgo, capacidad de crear y proponer
actividades, lo cual lo sitúa en el nivel taxonómico 5 y 6. Este estándar podría
evaluarse de mejor manera con evaluación interna, en la que los resultados de
aprendizajes de una habilidad corporal se dan a mediano y largo plazo, lo cual
dificulta evaluar mediante una prueba estandarizada a gran escala.
La segunda conclusión que surgió del análisis de los Estándares de aprendizaje en las
mesas técnicas de trabajo fue que los estándares y los indicadores de calidad educativa
requieren ser acotados para construir la evaluación, puesto que los indicadores del
estándar no permiten discriminar respecto de la progresión o secuencialidad de contenidos
o habilidades.
La siguiente tabla representa un estándar del subnivel elemental del área de Matemática.
En esta se puede observar que el estándar se desagrega en cuatro cadenas de niveles de
logro. Así, para un estándar se tiene 16 niveles de logro con distintos contenidos y
habilidades. Esto se traduce en una estructura de evaluación con 16 DO por cada
estándar. A su vez, por cada DO se generan uno, dos o tres ítems, dependiendo de los
contenidos o habilidades que desarrolla cada DO. Por ejemplo, en la primera cadena de
niveles de logro del estándar, específicamente en el No alcanzado, se establecen tres
habilidades (cuenta, lee y escribe).
40
Tabla 18. Estándar y niveles de logro del área de Matemática subnivel elemental
Indicadores de calidad educativa
Estándar
No alcanzado Nivel de logro 1 Nivel de logro 2 Nivel de logro 3
E.M.2.2. Aplica E.M.2.2.1.a. E.M.2.2.1.b. E.M.2.2.1.c. E.M.2.2.1.d. Propone
estrategias de Cuenta, lee y Cuenta (de 1 en Completa secuencias estrategias de
conteo, la escribe (de 1 uno, de 2 en 2 numéricas conteo y forma
descomposición de en 1 y de 2 en de, 3 en 3, de 5 ascendentes o secuencias
números, las 2), con en 5 o de 10 en descendentes con numéricas con
propiedades de la números 10), lee y números naturales números naturales
suma y naturales del 0 escribe números del 0 al 9 999, del 0 al 9 999,
multiplicación, los al 999 y los naturales del 0 utilizando material utilizando material
procedimientos de representa de al 9 999 y los concreto, concreto,
cálculos de suma, forma concreta representa de simbologías, simbologías,
resta, multiplicación y gráfica (en la forma concreta, estrategias de conteo estrategias de
y división exacta semirrecta simbólica y y la representación conteo y la
con números numérica). gráfica (en la en la semirrecta representación en la
naturales de hasta semirrecta numérica, reconoce semirrecta numérica,
el 9 999, para numérica). números ordinales reconoce números
formular y resolver del primero al ordinales del primero
problemas con vigésimo para al vigésimo para
ejemplos de la vida organizar objetos y organizar objetos y
cotidiana. diferencia los diferencia los
números pares e números pares e
impares por impares por
agrupación y de agrupación y de
manera numérica. manera numérica.
E.M.2.2.2.a. E.M.2.2.2.b. E.M.2.2.2.c. E.M.2.2.2.d. Plantea
Establece Distingue las Establece relaciones y resuelve problemas
relaciones de relaciones de de secuencia y orden con ejemplos de la
orden entre un secuencia y (=, <, >) en un vida cotidiana que
grupo de orden (=, <,>) conjunto de números requieran de la
números entre números naturales de hasta adición, sustracción,
naturales de naturales de cuatro cifras. Aplica relaciones de orden,
hasta tres hasta tres cifras, estrategias de la composición y
cifras. relaciona la descomposición en descomposición de
noción de unidades, decenas, las cifras de números
adición y centenas y unidades de hasta cinco cifras.
sustracción con de mil. Calcula
agregar o quitar adiciones y
objetos a un sustracciones con
conjunto. números hasta el 9
999 con material
concreto,
gráficamente y de
manera numérica.
E.M.2.2.3.a. E.M.2.2.3.b. E.M.2.2.3.c. E.M.2.2.3.d.
Resuelve Resuelve Resuelve y plantea Soluciona problemas
adiciones y problemas problemas matemáticos del
sustracciones matemáticos del matemáticos del entorno realizando
sin entorno que entorno, utilizando la sumas y restas
reagrupación requieran de la adición y sustracción mentalmente con
de números utilización de con números números de hasta
naturales hasta adiciones y naturales hasta el cinco cifras utilizando
el 9 999. sustracciones 9 999 y emplea las las propiedades
sin reagrupación propiedades conmutativa y
de números conmutativa y asociativa de la
naturales hasta asociativa de la adición e interpreta
el 9 999. adición. los resultados
obtenidos.
41
E.M.2.2.4.a. E.M. 2.2.4.b. E.M. 2.2.4.c. E.M. 2.2.4.d.
Resuelve Resuelve Resuelve problemas Formula y resuelve
ejercicios de ejercicios que que requieran del problemas sencillos
multiplicación y requieran del cálculo de productos que requieran del
división uso de la sin reagrupación y cálculo de productos
aplicando multiplicación sin cocientes exactos sin reagrupación y
patrones de reagrupación y (divisor de una cifra), cocientes exactos
sumandos la división con números (divisor de una cifra),
iguales como exacta (divisor naturales hasta 9 al igual que el
una de una cifra) de 999, al igual que el cálculo mental,
multiplicación y naturales hasta cálculo mental, aplica aplica reglas de
la división por el 9 999 y reglas de multiplicación por 10,
reparticiones reconoce la multiplicación por 100 y 1 000 en
iguales. relación entre 10,100 y 1 000 en números de hasta
división y números de hasta dos cifras, las
multiplicación dos cifras, las propiedades
como propiedades conmutativa y
operaciones conmutativa y asociativa de la
inversas. asociativa de la multiplicación y
multiplicación y reconoce mitades y
reconoce mitades y dobles en unidades
dobles en unidades de objetos.
de objetos.
Por otra parte, en función de los contenidos que plantea cada estándar y sus respectivos
niveles de logro, no existe una progresión en términos de dificultad. Por ejemplo, en la
primera cadena de niveles de logro se puede observar que el contenido es acumulativo y,
por lo tanto, repetitivo. El nivel de logro 2 y 3 repite los contenidos de los Niveles de logro
0 y 1. De hecho, los contenidos del nivel de logro 2 y 3 son exactamente iguales, la única
distinción se encuentra en las habilidades (completa y propone).
De esta manera se concluye que los contenidos de la evaluación deben ser acotados
respecto de lo que establecen los estándares y los indicadores de calidad educativa, a fin
de obtener instrumentos pertinentes, objetivos y al enfoque de evaluaciones
estandarizadas con contenidos y habilidades claros. De hecho, la misma elaboración de
los ítems requiere “evaluar sólo un conocimiento, habilidad, actitud o destreza a la vez”
(Ineval, 2018b, p. 26).
Para evitar que los contenidos de los ítems se repitan y se ayuden a responder entre sí y
para obtener los indicadores de calidad de la educación, el modelo propone gradar los
contenidos del estándar de manera directa y utilizar los indicadores de logro como guía
para establecer tres niveles de dificultad por cada estándar, los cuales son representados
en la estructura de evaluación por las letras a, b, c. 11 Esta adaptación que se denomina
gradación directa del estándar se sustenta en el artículo 68 de la LOEI que establece lo
siguiente:
11
Sin embargo, existen dos estándares en las asignaturas de Física y de Ciencias Sociales que
cuentan únicamente con dos niveles de logro, debido a que su contenido no podía ser evaluado en una prueba
de base estructurada.
42
El Instituto […] establecerá los indicadores de la calidad de la educación, que se aplicarán
a través de la evaluación continua […] siempre de acuerdo a los estándares de evaluación
definidos por la Autoridad Educativa Nacional y otros que el Instituto considere
técnicamente pertinentes.
Tabla 19. Propuesta de gradación directa del estándar para la estructura de evaluación
Grupo
Campo Estándar Tópico Definición Operacional
Temático
E.M.2.2. Aplica estrategias de conteo, la 1.1.2-1a Aplicación de
descomposición de números, las secuencias de figuras…
propiedades de la suma y multiplicación, 1.1.2 1.1.2-2b Aplicación de
1. 1.1 Álgebra los procedimientos de cálculos de suma, Patrones secuencias numéricas de…
Matemáticas y funciones resta, multiplicación y división exacta con crecientes o
números naturales de hasta el 9 999, decrecientes 1.1.2-3c Aplicación de
para formular y resolver problemas con secuencias numéricas de…
ejemplos de la vida cotidiana.
12
La primera estructura de evaluación contaba con un total de 1374 Definiciones Operacionales: 1311
para prueba de base estructurada; 33 para rúbrica; y 30 para lista de cotejo, para cuatro áreas: Matemática,
Lengua y Literatura, Ciencias Sociales y Ciencias Naturales. La nueva estructura de evaluación cuenta con un
total de 1187 Definiciones Operacionales: 790 para prueba de base estructurada; 343 para rúbrica; y 54 para
lista de cotejo, además de las cuatro áreas mencionadas, se suman las áreas de Educación Cultural y Artística
y Educación Física.
43
Después de varias mesas de trabajo y un análisis a profundidad sobre la pertinencia
metodológica del uso de la taxonomía de Marzano y Kendal en evaluación a gran escala,
se llegó a la conclusión del uso diferenciado de la taxonomía según la funcionalidad y
naturaleza de los instrumentos de evaluación.
Tabla 20. Propuesta de estructura de evaluación para Prueba de base estructurada del
SEST
Grupo Definición Habilidades posibles para elaboración de
Campo Estándar Tópico
Temático Operacional ítems
Repetir, registrar, listar, definir,
Recuperación
memorizar, rotular, nombrar, identificar,
E.CN.3.2. de información
relatar, recoger, subrayar, examinar,
Argumenta la del proceso
enumerar, tabular, enunciar, citar,
importancia de de…
recordar, describir, reproducir.
los procesos
Interpretar, predecir, traducir, asociar,
de fotosíntesis,
Comprensión reafirmar, estimar, describir, diferenciar,
nutrición,
de la reconocer, extender, expresar, resumir,
respiración, Plantas:
importancia de informar, discutir, revisar, contrastar,
Los seres reproducción y características,
Ciencias los procesos identificar, distinguir, ordenar, explicar,
vivos y su diversidad de funciones, ciclo
Naturales de… seriar, ilustrar, exponer, parafrasear,
ambiente plantas sin reproductivo,
comparar.
semilla de las diversidad
Distinguir, examinar, analizar, catalogar,
regiones
diferenciar, inducir, destacar, inferir,
naturales del
experimentar, discriminar, probar,
Ecuador y la Análisis de la
relación con la subdividir, comparar, desmenuzar,
importancia
contrastar, separar, criticar, ordenar,
humedad del de…
discutir, explicar, diagramar, conectar,
suelo.
inspeccionar, seleccionar, pedir, arreglar,
clasificar, categorizar, separar.
44
Tabla 21. Propuesta de estructura de evaluación para Rúbrica del SEST
Grupo
Campo Tópico Estándar DO
Temático
6.1.2-1a Identifica diferentes
E.EF.2.2.1. Acuerda con sus pares
pautas…
6.2.1. Destrezas pautas de trabajo para participar de
6.1.2-2b Reconoce los
y/o habilidades manera segura al reconocer posibles
cuidados necesarios para…
6.1. motrices básicas riesgos que presentan los juegos en
6.1.2-3c Acuerda con sus pares
6. Prácticas diferentes ambientes.
pautas de…
Educación Lúdicas:
E.EF.2.2.2. Participa en diferentes 6.1.2-2a Participa en
Física Los juegos 6.2.2. Seguridad
juegos colectivos reconociendo las diferentes…
y el jugar en prácticas
características, objetivos, demandas 6.1.2-2b Participa en
gimnásticas y en
y la necesidad de cooperar con pares diferentes…
ejercicios
y tomar las precauciones necesarias 6.1.2-7c Participa en
motrices básicos
antes y durante su participación. diferentes…
Para elaborar las DO correspondiente al instrumento lista de cotejo, al igual que en prueba
de base estructurada se utiliza el nivel cognoscitivo y no la habilidad (verbo conjugado en
imperativo). Además, el instrumento no requiere elaboración de ítems sino de indicadores.
Para información más específica sobre la utilización del instrumento, remitirse al
documento Lineamientos técnicos y procedimentales para el desarrollo de la evaluación
Ser Estudiante: rúbricas y listas de cotejo.
Contenidos de evaluación
A continuación, se presentan los contenidos de evaluación del SEST. En primer lugar, se
presenta un análisis descriptivo de las áreas a evaluar con sus respectivas asignaturas.
En segundo lugar, un resumen cuantitativo de las estructuras de evaluación desagregado
por Campo, Grupo Temático, Tópico y Definiciones Operacionales –DO–.
1.14.1 Matemática
45
investigación y la solución de problemas cotidianos; el aprendizaje es intuitivo, visual y, en
especial, se concreta a través de la manipulación de objetos para obtener las propiedades
matemáticas deseadas e introducir a su vez nuevos conceptos. A partir del subnivel medio
y superior se van complejizando de forma sistemática los contenidos y procesos
matemáticos, las y los estudiantes utilizan definiciones, teoremas y demostraciones lo que
conlleva al desarrollo de un pensamiento reflexivo y lógico que les permite resolver
problemas de la vida real (Ministerio de Educación, 2016a).
El enfoque del área de Lengua y Literatura es comunicativo, por tanto, hace énfasis en el
desarrollo de destrezas más que en el aprendizaje de contenidos conceptuales. El objetivo
de enseñanza es hacer de las y los estudiantes personas competentes en el uso de la
lengua oral y escrita para la comunicación y no unos expertos que conceptualicen y
descifren los diversos componentes lingüísticos. De este modo, la competencia lingüística
queda supeditada a la capacidad comunicativa.
46
En EGB considera cinco bloques para todos los subniveles: los seres vivos y su ambiente;
cuerpo humano y salud; materia y energía; la Tierra y el universo; la ciencia en acción. En
bachillerato se desarrolla a través de las tres asignaturas antes mencionadas los
siguientes aspectos: la visión histórica y epistemológica de la ciencia; la comprensión de
las ciencias; el proceso de investigación científica; y, los usos y aplicaciones en la
tecnología.
En Física se estudian los fenómenos naturales del entorno, por ello, se considera el
razonamiento y la experimentación, la teoría y la práctica, y el pensamiento y la acción,
dando como resultado el poder solventar inquietudes por parte del estudiantado para
conocer y aprender durante toda la vida. Se plantean cinco bloques: movimiento y fuerza;
energía, conservación y transferencia; ondas y radiación electromagnética; la tierra y el
universo; la física de hoy.
En Historia se toma como columna vertebral el tratamiento del concepto tiempo del cual
se derivan una serie de conceptos capitales para su estudio, tales como cambio,
47
continuidad, permanencia, evolución, revolución. De este modo, se abordan cuatro ejes
temáticos: los orígenes y las primeras culturas de la humanidad; la edad media y la
modernidad; América Latina, mestizaje y liberación; economía, trabajo y sociedad.
El enfoque del área de Educación Física es crítico e inclusivo, “centrado en el sujeto, como
constructor de su propio conocimiento sobre cultura corporal y de movimiento que lo rodea,
para participar en ella de manera crítica, autónoma y placentera” (Ministerio de Educación,
2016b, p. 96).
Consta de seis bloques que se desarrollan tanto para EGB como para bachillerato:
prácticas lúdicas, los juegos y el jugar; prácticas gimnásticas; prácticas corporales
expresivo–comunicativas; prácticas deportivas; construcción de la identidad corporal; y
relaciones entre prácticas corporales y salud. Los dos últimos: la construcción de la
identidad corporal y relaciones entre prácticas corporales y salud, operan
transversalmente, por tanto, los saberes en los que hacen énfasis se consideran en todos
los bloques.
48
1.15 Descripción cuantitativa de los contenidos de evaluación
1.15.1 Matemática
49
1.15.2 Lengua y Literatura
50
1.15.3 Ciencias Naturales
51
1.15.4 Ciencias Sociales
52
1.15.5 Educación Cultural y Artística
53
1.15.6 Educación Física
54
Tabla 28. Estructura de evaluación por instrumento de evaluación
Instrumento Campo/asignatura Nivel Subnivel Grupo Temático Tópico DO
Elemental 3 10 37
EGB Media 3 12 49
Matemática
Superior 3 11 41
Bachillerato Bachillerato 3 16 53
Elemental 3 5 19
EGB Media 3 4 15
Lengua y Literatura
Superior 3 5 15
Bachillerato Bachillerato 3 5 22
Elemental 4 14 59
Ciencias
EGB Media 4 14 63
Prueba de base Naturales
Ciencias Superior 4 19 73
estructurada
Naturales Biología 4 8 46
Física Bachillerato Bachillerato 5 18 55
Química 2 9 45
Elemental 2 5 14
Estudios
EGB Media 3 13 39
Sociales
Ciencias Superior 3 11 39
Sociales Historia 4 22 71
Ciudadanía Bachillerato Bachillerato 4 10 30
Filosofía 4 7 21
Total en prueba de base estructurada 67 218 806
Elemental 1 5 15
EGB Media 1 4 12
Lengua y Literatura
Superior 1 3 9
Bachillerato Bachillerato 1 3 9
Elemental 3 13 39
Educación Cultural y EGB Media 3 14 42
Rúbrica Artística Superior 3 19 57
Bachillerato Bachillerato 3 15 45
Elemental 3 7 33
EGB Media 4 10 30
Educación Física
Superior 4 15 45
Bachillerato Bachillerato 4 11 36
Total en rúbrica 31 119 372
Elemental 1 2 6
EGB Media 1 2 6
Lengua y Literatura
Lista de cotejo Superior 1 2 8
Bachillerato Bachillerato 1 2 8
Total en lista de cotejo 4 8 28
TOTAL 102 345 1206
55
Tabla 29. Número de Definiciones Operacionales por niveles, subnivel, instrumentos y
áreas de conocimiento
Subniveles de Educación Nivel
General Básica Bachillerato
Instrumento Área de conocimiento Elemental Media Superior Bachillerato Total DO
Matemática 37 49 41 53 180
Lengua y Literatura 19 15 15 22 71
Biología 46
Ciencias
Física 59 63 73 55 341
Naturales
Prueba de base Química 45
estructurada Historia 71
Ciencias
Ciudadanía 14 39 39 30 214
Sociales
Filosofía 21
Total DO para prueba de
129 166 168 343 806
base
Lengua y Literatura 15 12 9 9 45
Educación Cultural y
39 42 57 45 183
Rúbrica Artística
Educación Física 33 30 45 36 144
Total DO para rúbrica 87 84 111 90 372
Lengua y Literatura 6 6 8 8 28
Lista de cotejo Total DO para lista de
6 6 8 8 28
cotejo
TOTAL DO 222 256 287 441 1206
56
Tabla 31. Total de Definiciones Operacionales por área e instrumento
Educación
Lengua y Ciencias Ciencias Educación
Instrumento Matemática Cultural y Total
literatura Naturales Sociales Física
Artística
Prueba de
base 180 100 % 71 49,31 % 341 100 % 214 100 % - - - - 806 66,83 %
estructurada
Rúbrica - - 45 31,25 % - - - - 183 100% 144 100% 372 30,85 %
Lista de
- - 28 19,44 % - - - - - - - - 28 2,32 %
cotejo
Total 180 100 % 144 100 % 341 100 % 214 100 % 183 100% 144 100% 1206 100 %
Para definir los contenidos de evaluación que tienen comparabilidad con los años
precedentes es necesario un proceso de análisis de contenido de las estructuras de
evaluación anteriores, proceso que demandará un trabajo con un equipo técnico
interdisciplinario. Se deberá definir la metodología de trabajo, cronograma y equipo.
Marco metodológico
La evaluación SEST tiene un carácter muestral bietápico con las instituciones educativas
como unidad primaria de muestreo y con los estudiantes como unidad secundaria de
muestreo y de análisis. La muestra es representativa a escala nacional, por régimen, por
sostenimiento y por área; tiene cincos dominios de estudio 14: sostenimiento (fiscal,
municipal, fiscomisional y particular) y cada uno de los subniveles educativos a los que
compete esta evaluación (4. °, 7. ° y 10. ° grado de EGB y 3° de bachillerato). La muestra
se selecciona de manera proporcional para cada estrato a nivel de institución.
13
El subacápite de población objetivo fue desarrollado por la Dirección de Análisis de la Evaluación
Educativa. Existe un documento ampliado que desarrolla la metodología para obtener la muestra poblacional.
14
Existen algunas exclusiones menores de instituciones educativas de difícil acceso.
57
1.19 Tipo de evaluación
Para SEST se plantean los siguientes tipos de evaluación: formativa, externa y criterial.
Formativa: dado que los resultados servirán como insumos para el diseño de
políticas de mejoramiento de la calidad educativa.
Externa: debido a que el agente evaluador es el Ineval.
Criterial: debido a que el diseño de la evaluación parte de los estándares de
aprendizaje de cada asignatura y subnivel.
SEST es una evaluación de tipo externa por lo que el agente evaluador es el Ineval en
cuanto sujeto institucional (agencia) encargado de diseñar, aplicar, calificar la evaluación
y entregar resultados; el agente evaluador opera a través de sujetos individuales que se
denominan aplicador/a y calificador/a, como se muestra a continuación:
58
1.22 Tipo de ítem, indicadores y actividades
El manual de elaboración plantea el ítem de opción múltiple como aquel que se utiliza para
los instrumentos de evaluación que el Instituto requiere. Los ítems de opción múltiple
pueden elaborarse en uno de los cinco formatos establecidos por el Instituto: simple,
completamiento, elección de elementos, ordenamiento o emparejamiento. También existe
un ítem de contexto, sin embargo, este es transversal para todos los ítems;
específicamente, para el área de Matemática y la asignatura de Física, el contexto puede
entenderse como ecuaciones, funciones, gráficos, tablas, entre otros, siempre que esto se
señale en los acotamientos. Cada elaborador decide el formato más adecuado a utilizar al
momento de elaborar un ítem, de acuerdo con la Definición Operacional –DO– a evaluar,
los criterios de plausibilidad, la población objetivo y su creatividad; se recomienda que, en
el caso de elaborar más de un ítem de determinada DO, se utilice diferente formato para
cada ítem.
15
Este acápite fue desarrollado por Andrea Armijos, directora de Elaboración y Resguardo de Ítems, el
26 de abril de 2021 mediante correo electrónico.
59
Para la lista de cotejo se requiere la elaboración de indicadores dicotómicos. Al igual que
en la rúbrica analítica de proceso y de producto, es importante que el diseño de la actividad
conjugue varios criterios para su evaluación. Para más información revisar el documento
Lineamientos técnicos y procedimentales para el desarrollo de la evaluación Ser
Estudiante: rúbricas y listas de cotejo.
16
Este aparatado fue elaborado por Juan Andrés Núñez, Director de Análisis Psicométrico, y fue
enviado por correo electrónico el 4 de marzo de 2021.
60
desviación_estándar: desviación estándar de los tiempos de respuesta
correspondientes a los ítems. Esta desviación está calculada como una sola para
todos los registros de tiempos de respuesta de los ítems del campo
correspondiente.
máximo: aproximación para el tiempo máximo del ítem. Fue calculado como la
media más una desviación estándar.
#deos: cantidad de definiciones operacionales para cada campo de acuerdo a lo
dispuesto en el modelo del instrumento.
media_campo: el resultado de la variable “media” multiplicado por la cantidad de
definiciones operacionales descritas en el punto anterior.
total_campo: fue calculado como la estimación del valor máximo indicado
anteriormente multiplicado por la cantidad de definiciones operacionales.
media_grado: suma, para cada grado, de los tiempos promedios de sus
respectivos campos.
máximo_grado: Suma, para cada grado, de los tiempos máximos estimados de
sus respectivos campos.
61
Tabla 33. Niveles de logro y número de ítems para Prueba de Base Estructurada
N.° de Ítems
Campo/ N.° de DO por
Total por nivel de Total
Instrumento Asignatura Nivel Subnivel nivel de logro
DO logro Ítems
0 1 2 0 1 2
Elemental 13 13 11 37 13 13 11 37
EGB Media 15 16 18 49 15 16 18 49
Matemática
Superior 12 15 14 41 12 15 14 41
Bachillerato Bachillerato 18 18 17 53 18 18 17 53
Elemental 7 6 6 19 7 6 6 19
EGB Media 5 5 5 15 5 5 5 15
Lengua y Literatura
Superior 5 5 5 15 5 5 5 15
Bachillerato Bachillerato 7 8 7 22 7 8 7 22
Elemental 22 18 19 59 22 18 19 59
Ciencias
Prueba de EGB Media 23 17 23 63 23 17 23 63
Naturales
base Ciencias Superior 28 23 22 73 28 23 22 73
estructurada Naturales Biología 15 13 18 46 15 13 18 46
Física Bachillerato Bachillerato 19 18 18 55 19 18 18 55
Química 16 15 14 45 16 15 14 45
Elemental 5 5 4 14 5 5 4 14
Estudios
EGB Media 13 13 13 39 13 13 13 39
Sociales
Ciencias Superior 13 13 13 39 13 13 13 39
Sociales Historia 24 23 24 71 24 23 24 71
Ciudadanía Bachillerato Bachillerato 10 10 10 30 10 10 10 30
Filosofía 7 7 7 21 7 7 7 21
Total ítems en prueba de base estructurada 277 261 268 806 277 261 268 806
62
Tabla 34. Niveles cognoscitivos y número de ítems para Prueba de Base Estructurada
Para garantizar la comparabilidad de los resultados entre las formas paralelas del test
resulta de utilidad realizar procedimientos de equiparación de dificultades o equating, que
permiten resolver problemas relacionados con variación de la dificultad de las pruebas,
pero no permiten corregir variaciones en su contenido, confiabilidad e, incluso, diferencias
muy grandes de dificultad (Kolen M. J., 2014; Cook & Eignor, 1991).
Para realizar un correcto proceso de equiparación de puntajes entre dos mediciones que
son aplicadas a poblaciones distintas, es necesario contar con ítems comunes a ambas
mediciones, que permitan hacer un puente entre los resultados obtenidos en ambos
17
Este acápite fue desarrollado a partir del Informe de análisis de la evaluación Ser Estudiante (Ineval,
2022)
63
grupos. Es importante que los ítems comunes sean reflejo de las propiedades de las
pruebas a equiparar, tanto en contenido como en sus propiedades estadísticas (Cook &
Eignor, 1991).
En este sentido, los test aplicados deben cumplir con una estructura que favorezca la
equiparación de dificultad a través de los ítems. Estas estructuras pueden ser: bloque
ancla y bloque rotado.
64
Asimismo, para comparar los resultados de dos estudiantes evaluados con formas
diferentes, estas deben tener exactamente la misma dificultad media. En el caso de Ser
Estudiante, puesto que todos los ítems incluidos en el estudio principal se probaron en el
estudio piloto, la Dirección de Administración de Instrumentos, encargada del diseño de
las pruebas, puede asignar los ítems en diferentes formas, teniendo en cuenta sus
parámetros psicométricos. Además, se pueden realizar análisis de las propiedades
estadísticas de ambas formas y se puede verificar que ambas sean unidimensionales.
la media de la puntuación directa debería ser idéntica para las distintas pruebas;
la varianza de las puntuaciones directas de los estudiantes debería también ser
idéntica.
Cada distribución tendrá media cero (𝜇=0) y desviación estándar uno (𝜎=1).
Se sostiene la conversión lineal entre puntajes obtenidos.
18
Para el diseño de la muestra del apartado 9.1. Población objetivo, ya se considera el diseño de la
evaluación por bloques.
65
Tabla 35. Numero de DO e ítems por asignatura y subnivel a partir del diseño por
bloques
Índice Inev por área de conocimiento y subnivel: estos indicadores permiten tener
una perspectiva global del rendimiento de cada subnivel educativo en cada una
de las áreas de conocimiento.
Reporte de niveles de desempeño por estándar: estos indicadores entregan
información del nivel de desempeño del sistema educativo por cada uno de los
estándares.
Las evaluaciones de aprendizaje a gran escala forman parte del campo teórico de la
psicometría, específicamente se enmarcan en las teorías de los test, los cuales construyen
modelos teóricos y metodológicos para la elaboración y el uso de dichos tests (Muñiz,
2010). El primer modelo que se formuló se conoce como la Teoría Clásica de los Test –
TCT–, pero en los últimos años han surgido nuevas teorías y técnicas de medición que
19
Información remitida por Juan Andrés Núñez director de Análisis Psicométrico, el 10 de mayo de
2021, mediante correo electrónico. Actualizado al 4 de enero de 2021, sobre la base del Informe de calificación
del componente cognitivo Ser Estudiante (2021).
66
han superado la perspectiva clásica, si bien existen varios modelos, la Teoría de
Respuesta al Ítem –TRI– es la más reconocida (Attorresi et al., 2009).
La TRI es apropiada para analizar instrumentos como las pruebas estandarizadas. Para
ello, es importante definir el rasgo latente que subyace en la prueba y que se intenta
estimar. El rasgo latente es un constructo teórico de carácter cognitivo, procedimental o
actitudinal que no puede ser medido directamente debido a que no es observable
explícitamente, el cual se estima a través de los indicadores que conforman un instrumento
de evaluación. Para ello, el modelo infiere constructos que permiten medir o estimar las
habilidades latentes en cada componente de los insumos establecidos por la AEN, ya sean
estándares, perfiles profesionales, figuras profesionales u otros.
De este modo, para la evaluación SEST se han establecido seis rasgos latentes que
corresponde a las habilidades de cada campo curricular.
67
Tabla 36. Rasgos latentes de la evaluación SEST
Campo Rasgo Característica
latente
Habilidad Habilidad matemática orientada a la abstracción mediante la
Matemática
matemática resolución de problemas.
Habilidad comunicativa orientada a la capacidad del uso de un
Lengua y Habilidad
conjunto de procesos lingüísticos con la finalidad de demostrar
Literatura comunicativa
ser un usuario competente de la lengua oral y escrita castellana.
Habilidad científica orientada a la comprensión de la realidad a
Ciencias Habilidad
partir de la investigación, el desarrollo del método científico y la
Naturales científica
predicción de la fenomenología en situaciones cotidianas.
Habilidad científica orientada a la comprensión del ser humano y
Habilidad del medio en el que se desenvuelve, mediante el análisis de
Biología científica en sistemas desde el nivel celular hasta ecosistemas;
Biología proporcionando la capacidad de investigación y aplicación en la
ciencia y tecnología.
Habilidad científica orientada a obtener conocimiento de los
Habilidad hechos que ocurren en el mundo y el universo, mediante el
Física científica en razonamiento y la experimentación, tomando en cuenta el
Física método científico para la resolución y comprensión de los
fenómenos naturales.
Habilidad científica orientada a la capacidad de comprender la
Habilidad
estructura y el comportamiento de la materia, su lenguaje y sus
Química científica en
interacciones a través del método científico, así como también su
Química
aplicación en diferentes campos de la vida.
Ciencias Habilidad Habilidad del pensamiento crítico orientada a comprender los
Sociales crítica actores, procesos y contextos que conforman la sociedad.
Habilidad Habilidad del pensamiento crítico orientada a la capacidad de
crítica para comprender el movimiento de la sociedad humana y sus
Historia
comprender transformaciones ligadas al entorno natural, económico, político
la Historia y social.
Habilidad Habilidad del pensamiento crítico orientada al análisis y
Educación
crítica para comprensión del poder, y sus manifestaciones en contraste con
para la
comprender los conceptos de derecho, democracia, Estado, y participación
Ciudadanía
la ciudadanía social.
Habilidad del pensamiento crítico orientada a comprender las
Habilidad
razones del funcionamiento de la naturaleza, la sociedad, y el
crítica para
Filosofía pensamiento. Motiva la capacidad de los estudiantes para pensar
comprender
y pensarse como seres humanos con “sentido común” y como
la Filosofía
sujetos creadores de un “sentido otro”.
Educación Habilidad expresiva orientada a apreciar productos artísticos y
Habilidad
Cultural y culturales, habilidades para expresarse a través de distintos
expresiva
Artística lenguajes.
Habilidad de interacción orientada a reconocerse como sujeto
que construye su identidad mediante la relación con otros y
Educación Habilidad de
relacionar las prácticas corporales (lúdicas, deportivas,
Física interacción
gimnásticas y expresivo-comunicativas) con su salud y
seguridad.
Elaborado: Dirección de Diseño Estratégico de Evaluaciones Educativas
Fuente: Ministerio de Educación (2016a)
68
1.25.1.2 Regla de calificación
Para la calificación del instrumento de Ser Estudiante cada dominio tendrá su índice INEV,
para el cual se calibrarán los ítems de prueba de base estructurada, rúbrica y lista de cotejo
en conjunto para cada uno de los seis rasgos latentes modelados con un modelo logístico
de un parámetro que se desprende de la teoría de respuesta al ítem. A continuación, se
presenta la ecuación de la Curva Característica del Ítem –CCI– para el modelo logístico
de un parámetro de Rasch. La información toma de referencia los resultados del Ser
Estudiante Sierra 2019.
1
𝑃𝑖 𝜃 = 𝑖 = 1,2,3 … , 𝑛 Ec.1
1+𝑒 −(𝜃−𝑏𝑖 )
Donde:
Para el cálculo de los índices INEV, por rasgo latente, se estima la habilidad del evaluado;
con la prueba de base estructurada, se calculará la Curva Característica del Ítem para los
ítems del instrumento con la Ec.1, para la calibración se utilizará el paquete “TAM” del
software estadístico R, y se aplica la función tam.mml aplicando el modelo de Rasch, luego
se estima la habilidad con el método de máxima verosimilitud ponderada aplicando la
función de tam.mml.wle2.
Donde la habilidad toma valores desde el más infinito al menos infinito, 𝜃 =] − ∞; +∞[,
para calcular el índice por campo se seguirán las siguientes reglas.
1.25.1.2.1 Matemática
69
Si, 𝜃 = 0 𝐼𝑁𝐸𝑉𝑚 = 700
𝜃
Si, 𝜃 ] − 3,5; 3,5[ 𝐼𝑁𝐸𝑉𝑚 = ( ) ∗ 300 + 700
3,5
Este dominio se evaluará con la prueba de base estructurada, rúbrica y lista de cotejo, se
calculará la CCI para los ítems de lengua y literatura con la Ec.1, para la calibración se
utilizará el paquete “TAM” del software estadístico R, y se aplica la función tam.mml
aplicando el modelo de crédito parcial “PCM” esto es para la calibración conjunta de los
ítems, luego se calculará la habilidad con el método de máxima verosimilitud ponderada
aplicando la función de tam.mml.wle2.
70
Si, 𝜃 = 0 𝐼𝑁𝐸𝑉𝑐𝑠 = 700
𝜃
Si, 𝜃 ] − 3,5; 3,5[ 𝐼𝑁𝐸𝑉𝑐𝑠 = ( ) ∗ 300 + 700
3,5
Este dominio se evaluará con rúbrica, se calculará la CCI para los ítems de Educación
Cultural y Artística con la Ec.1, para la calibración se utilizará el paquete “TAM” del
software estadístico R, y se aplica la función tam.mml aplicando el modelo de crédito
parcial en Rasch, luego se calculará la habilidad con el método de máxima verosimilitud
ponderada aplicando la función de tam.mml.wle2.
Este dominio se evaluará con rúbrica, se calculará la CCI para los ítems de Educación
Física con la Ec.1, para la calibración se utilizará el paquete “TAM” del software estadístico
R, y se aplica la función tam.mml aplicando el modelo de crédito parcial con Rasch, luego
se calculará la habilidad con el método de máxima verosimilitud ponderada aplicando la
función de tam.mml.wle2.
1.25.1.2.7 INEV
El INEV general se calcula con un promedio de cada uno de los INEVs calculados. A
continuación, se presenta su fórmula de cálculo.
Donde;
𝐼𝑁𝐸𝑉𝑙, es el INEV del dominio de Lengua y Literatura
𝐼𝑁𝐸𝑉𝑚, es el INEV del dominio de Matemática
71
𝐼𝑁𝐸𝑉𝑐𝑛, es el INEV del dominio de Ciencias Naturales
𝐼𝑁𝐸𝑉𝑐𝑠, es el INEV del dominio de Ciencias Sociales
𝐼𝑁𝐸𝑉𝑒𝑐𝑎, es el INEV del dominio de Educación Cultural Artística
𝐼𝑁𝐸𝑉𝑒𝑓, es el INEV del dominio de Educación Física
Para la gradación de dificultad de las DO del SEST 2020 se utilizó directamente el estándar,
y los indicadores (niveles de logro) fueron únicamente una guía. Por esta razón, en algunos
casos no existe un alineamiento directo de los niveles de logro del estándar (N0, N1 y N2)
con los diferentes niveles de dificultad de la DO (a, b y c).
Algunos estándares tienen dos, tres o cuatro cadenas de niveles de logro, lo cual implica
que existan hasta 12 indicadores por cada estándar. No se planteó una DO por cada
indicador porque los contenidos y habilidades de los indicadores son muy parecidas y en
su traslado a DO hubiera provocado que los ítems elaborados se ayuden a responder entre
sí.
Por esta razón, se priorizaron los contenidos de los estándares para que existan
únicamente de 3 o 6 DO por estándar. Así, varios indicadores de los niveles de logro del
estándar no se alinean.
Puesto que los indicadores del estándar tienen una naturaleza aglutinante, en muchos
casos los contenidos se repiten o son muy parecidos, esto puede provocar que una DO se
alinee con varios niveles de logro.
Debido a la gradación directa del estándar, hay temas específicos de los indicadores del
estándar que no se evaluaron debido a la priorización de contenidos para construir las DO.
Existe un alineamiento total de las DO con el estándar; pero, con relación a los indicadores
del estándar no en todos los casos existe alineamiento. En este sentido, el reporte de
resultados debe plantearse por estándar20.
Con este antecedente, y con base en el artículo 68 de la LOEI, el Ineval establece sus
propios indicadores de calidad de la educación, los cuales se representan en niveles de
desempeño (diferentes de los niveles de logro del estándar) y permiten presentar
20
Tomado del Informe de alineamiento entre las estructuras de evaluación de la Encuesta Docente,
Ser Estudiante Refuerza, Ser Estudiante 2020, elaborado por la Dirección de Diseño Estratégico de Evaluaciones
Educativas.
72
resultados por estándar en la evaluación SEST. A continuación, se describen los niveles
de desempeño:
Para categorizar el nivel de desempeño por estándar se utilizará el número de aciertos por
estándar que alcanzó el evaluado. La categorización del nivel de desempeño dependerá
del número de ítems totales en el estándar. El número de ítems varía por estándar en este
sentido se presenta la tabla con los criterios de categorización que considera lo antes
mencionado.
Por ejemplo, si un estándar tiene 1 ítem, y el evaluado acertó el ítem, su nivel desempeño
será de desempeño avanzado. Y así, con el resto de los casos como se muestra en la
tabla precedente.
73
1.26 Consideraciones para la aplicación de la evaluación
Uso de resultados
El uso de los resultados del SEST tiene cuatro consideraciones:
74
Referencias
1.27 Bibliografía
Alsina, J. (2013). ¿Qué es una rúbrica? ¿Por qué y cómo se utiliza? En Rúbricas para la
evaluación de competencias (pp. 7-13). Octaedro.
http://diposit.ub.edu/dspace/bitstream/2445/145046/1/26cuaderno.pdf
Andrade, X. (2013). Guía para la elaboración de pruebas de base estructurada.
Universidad Central del Ecuador / Comisión de evaluación interna.
http://www.utelvt.edu.ec/evaluacion%20estudiantes/informacion%20para%20los
%20estudiantes.pdf
Arancibia, J. (2015). La estandarización de la evaluación. Las pruebas nacionales e
internacionales ¿medición o evaluación? Internacional de la Educación para
América Latina. https://ei-ie-al.org/sites/default/files/docs/evaluacion.pdf
Arroyo, P. (2017). A new taxonomy for examining the multi-role of campus sustainability
assessments in organizational change. Journal of Cleaner Production, 140, 1763-
1774. https://doi.org/10.1016/j.jclepro.2015.08.100
Attorresi, H. F., Lozzia, G. S., Abal, F. J. P., & Galibert, M. S. (2009). Teoría de respuesta
al ítem: Conceptos básicos y aplicaciones para la medición de constructos
psicológicos. Revista Argentina de Clínica Psicológica, XVIII(2), 179-188.
Bloom, B. (1956). Taxonomy of Educational Objectives. Handbook 1: Cognitive Domain.
Longmans.
Bottani, N. (2006). La más bella del reino: El mundo de la educación en alerta con la llegada
de un principe encantador. Revista de educación, 75-90.
Brookhart, S. M. (2013). How to Create and Use Rubrics for Formative Assessment and
Grading. Association for Supervision & Curriculum Development.
http://gen.lib.rus.ec/book/index.php?md5=bdbc57197d3ebdeefcce4c24b9068adc
Cabrera, F. (2010). El pensamiento creativo desde la reforma curricular ecuatoriana:
Estudio en la etapa de las operaciones formales 8vo, 9no y 10mo año de
educación básica [Tesis de maestría, Universidad de Cuenca].
http://dspace.ucuenca.edu.ec/handle/123456789/2795
Coll, C. (2007). Las competencias en la educación escolar: Algo más que una moda y
mucho menos que un remedio. Aula de innovación educativa, 161, 34-39.
Coll, C., Pozo, J. I., Sarabia, B., & Valls, E. (1994). Los contenidos en la reforma:
Enseñanza y aprendizaje de conceptos, procedimientos y actitudes. Santillana,.
Consejo Nacional para la Igualdad Intergeneracional. (2018). Agenda Nacional para la
Igualdad Intergeneracional 2017-2021. https://www.igualdad.gob.ec/wp-
content/uploads/downloads/2018/03/anii2017_2021_1_2_2018.pdf?fbclid=IwAR1
93E7wsTYXSR_hhJinfBD6QA-SLQ51HEzm_GNqHfKfa-_ocmRdn1ntHzg
Fernández, M. (2017). Evaluación y aprendizaje. MarcoELE: Revista de Didáctica Español
Lengua Extranjera, 24, 1-43.
Flacso. (2018). Informe sobre el modelo conceptual y empírico, hipótesis e indicadores de
Factores Asociados. Flacso.
Gallardo, K. (2009). La Nueva Taxonomía de Marzano y Kendall: Una alternativa para
enriquecer el trabajo educativo desde su planeación. Recursos del Primer
Congreso Educativo Formando Formadores «Hay Talento 2009», 1-66.
http://www.cca.org.mx/profesores/congreso_recursos/descargas/kathy_marzano.
pdf
75
Gallardo, K., & Gil, M. (2011). Incorporación de la nueva taxonomía como referente para
el diseño de herramientas de evaluación del aprendizaje conducida en una materia
de posgrado en entornos virtuales. Memorias del XI Congreso Nacional de
Invesfigación Educativa.
http://www.ruv.itesm.mx/convenio/catedra/recursos/material/cn_27.pdf
Gallardo, K., & Gil, M. (2012). Utilización de la nueva taxonomía para evaluar el
aprendizaje en programas de posgrado en línea a distancia. Revista de
Investigación Educativa del Tecnológico de Monterrey, 2(4), 12-18.
Gatica, F., & Uribarren, T. (2013). ¿Cómo elaborar una rúbrica? Investigación en
Educación Médica, 2(1), 61-65. https://doi.org/10.1016/S2007-5057(13)72684-X
Gutiérrez, G. (2014). Diseño, desarrollo y evaluación de una prueba objetiva
fundamentada en la Taxonomía de Marzano y Kendall para medir el aprendizaje
del inglés en preescolares. Revista dim, 1-14.
Ineval. (s. f.-a). Historia | Instituto Nacional de Evaluación Educativa. Recuperado 17 de
mayo de 2020, de https://www.evaluacion.gob.ec/historia/
Ineval. (s. f.-b). ¿Qué es Ser Estudiante? Evaluaciones. Recuperado 13 de mayo de 2020,
de http://www.evaluacion.gob.ec/evaluaciones/que-es-ser-estudiante/
Ineval. (2018a). Educación en Ecuador: Resultados de PISA para el Desarrollo. Ineval.
http://www.evaluacion.gob.ec/evaluaciones/pisa-documentacion/
Ineval. (2018b). Manual de elaboración de ítems de opción múltiple. Dirección de
Elaboración y Resguardo de Ítems. Ineval.
Ineval. (2018c). Plan Estratégico Institucional 2018-2021. Ineval.
http://www.evaluacion.gob.ec/wp-
content/uploads/lotaip/2018/Anexos_Julio_2018/k/Plan_estrat%C3%A9gico_Inev
al_2018_2021.pdf
Ineval. (2019). Manual de fichas metodológicas. Ineval.
http://evaluaciones.evaluacion.gob.ec/BI/manual-de-fichas-metodologicas-2019/
Ineval. (2020). Factores asociados para la evaluación Ser Estudiante: Modelo, estructura
y metodología. Ineval.
Ineval. (2022). Informe de análisis de la evaluación Ser Estudiante. Ineval.
Kendall, J., & Marzano, R. J. (2007). The new taxonomy of educational objectives (2nd
ed.). Corwin Press.
http://gen.lib.rus.ec/book/index.php?md5=7a35e987eff9efd47d6543bec2492034
Kendall, J., & Marzano, R. J. (2008). Designing and assessing educational objectives:
Applying the new taxonomy. Corwin Press.
http://gen.lib.rus.ec/book/index.php?md5=d7713d2c73d0e640e56e971810b2ac7
b
Kutugata, A. (2017). Foros de Discusión: Incrementa el Aprendizaje Cognitivo, Afectivo y
Psicomotor. Revista Daena (International Journal of Good Conscience), 12(2).
Leenen, I. (2014). Virtudes y limitaciones de la teoría de respuesta al ítem para la
evaluación educativa en las ciencias médicas. Investigación en Educación Médica,
3(9), 40-55. https://doi.org/10.1016/S2007-5057(14)72724-3
Martínez, J. (2008). Las rúbricas en la evaluación escolar: Su construcción y su uso.
Avances en Medición, 6, 129-138.
Marzano, R. J. (2001). Designing a new taxonomy of educational objectives. Corwin Press.
Ministerio de Educación. (2008). Resultados pruebas censales Ser Ecuador 2008.
Ministerio de Educación.
http://web.educacion.gob.ec/_upload/resultadoPruebasWEB.pdf
76
Ministerio de Educación. (2016a). Currículo de los Niveles de Educación Obligatoria.
Ministerio de Educación. https://educacion.gob.ec/wp-
content/uploads/downloads/2016/03/Curriculo1.pdf
Ministerio de Educación. (2016b). Currículo del Bachillerato General Unificado. Ministerio
de Educación. https://educacion.gob.ec/wp-
content/uploads/downloads/2016/03/BGU2.pdf
Ministerio de Educación. (2017a). Estándares de aprendizaje. Ministerio de Educación.
https://educacion.gob.ec/wp-
content/uploads/downloads/2017/05/Estandares_de_Aprendizaje.pdf
Ministerio de Educación. (2017b). Guía didáctica de implementación curricular para EGB
y GBU de Ciencias Sociales. Ministerio de Educación.
Morris, A. (2011). Student Standardised Testing. OECD Education Working Papers, 65.
http://disde.minedu.gob.pe/bitstream/handle/123456789/2511/Student%20Stand
ardised%20Testing%20Current%20Practices%20in%20OECD%20Countries%20
and%20a%20Literature%20Review.pdf?sequence=1&isAllowed=y
Muñiz, J. (2010). Las teorías de los tests: Teoría clásica y teoría de respuesta a los ítems.
Consejo General de Colegios Oficiales de Psicólogos, 31(1), 57-66.
Naciones Unidas. (2018). La Agenda 2030 y los Objetivos de Desarrollo Sostenible: Una
oportunidad para América Latina y el Caribe. Naciones Unidas.
https://repositorio.cepal.org/bitstream/handle/11362/40155/24/S1801141_es.pdf
Popham, J. W. (1999). ¿Por qué las pruebas estandarizadas no miden la calidad
educativa? Educational Leadership, 56(6), 2-11.
Ravela, P., Arregui, P., Valverde, G., Wolfe, R., Ferrer, G., Martínez, F., Aylwin, M., & Wolff,
L. (2008). Las evaluaciones educativas en América Latina. Revista
Iberoamericana de Evaluación Educativa, 1(1), 45-63.
Red de Maestros & Maestros por la Revoluación Ciudadana. (2016). Plan Decenal de
Educación 2016-2025. https://educacion.gob.ec/wp-
content/uploads/downloads/2016/03/PLAN-DECENAL-PROPUESTA.pdf
Romo-Martínez, J. E. (2015). La lista de cotejo como herramienta para la lectura crítica de
artículos de investigación publicados. Revista de Enfermería del Instituto
Mexicano del Seguro Social, 23(2), 109-113.
Ruiz, M. (2007). Instrumentos de evaluación de competencias. Santiago: Universidad
Tecnológica de Chile.
Secretaría Nacional de Planificación. (2021). Plan de Creación de Oportunidades 2021-
2025. Secretaría Nacional de Planificación. https://www.planificacion.gob.ec/wp-
content/uploads/2021/09/Plan-de-Creacio%CC%81n-de-Oportunidades-2021-
2025-Aprobado.pdf
Serrano, J., & Pons, R. (2011). El constructivismo hoy: Enfoques constructivistas en
educación. Revista electrónica de investigación educativa, 13(1), 1-27.
Simbaña, F., & Corina, S. (2016). Diseño de la metodología de aplicación de pruebas de
base estructurada en la carrera de Ingeniería Química.
http://www.dspace.uce.edu.ec/handle/25000/6839
Tafur, R. (2015). Evaluación de competencias básicas mediante la nueva taxonomía de
Marzano y Kendall en educación secundaria [Maestría, Universidad San Ignacio
de Loyola]. http://repositorio.usil.edu.pe/bitstream/USIL/2102/2/2015_Tafur.pdf
Timofte, R. S., & Siminiciuc, L. (2018). Utilisation of Rasch Model for the Analysis of an
Instrument Developed by Mapping Items to Cognitive Levels of Marzano
Taxonomy. Acta Didactica Napocensia, 11(2), 71-78.
77
Tobón, S. (2006). Aspectos básicos de la formación basada en competencias. Talca:
Proyecto Mesesup, 1, 1-15.
Torres, R. M. (2015). El Ecuador en las pruebas del LLECE (SERCE y TERCE).
OTRAƎDUCACION. https://otra-educacion.blogspot.com/2015/08/el-ecuador-en-
las-pruebas-llece.html
Tristán, A., & Pedraza, N. (2017). La objetividad en las pruebas estandarizadas. Revista
Iberoamericana de Evaluación Educativa, 10(1), 11-31.
http://dx.doi.org/10.15366/riee2017.10.1.001
UDLA. (2015). Fichas de procedimiento de evaluación educativa UDLA. UDLA.
Unesco. (2019). La promesa de las evaluaciones a gran escala: Reconocer los límites para
generar oportunidades. UNESCO.
78
1