Está en la página 1de 19

Evaluación de la

Prueba de Aspectos
Instrumentales Básicos en
Lenguaje y Matemáticas
E. Infantil (5 años)
1º y 2º E. Primaria

PAIB-1 Renovadoœ
RESUMEN DE LA VALORACIÓN DEL TEST

Descripción general

Característica Descripción

Nombre del test Prueba de Aspectos Instrumentales Básicos en Lenguaje


y Matemáticas (PAIB-1 Renovado):
Educación Infantil 5 años, 1º y 2º de Educación Primaria

Autor José Luis Ramos Sánchez, José Luis Galve Manzano,


Manuel Trallero Sanz y Rosario Martínez Arias

Autor de la adaptación española ---

Variable(s) Competencias instrumentales básicas en lenguaje y


matemáticas

Áreas de aplicación Psicología educativa

Soporte Papel y lápiz, informatizada

en el CET-R

2
Valoración general

Característica Valoración Puntuación

Materiales y documentación Adecuada-Buena 3,5

Fundamentación teórica Adecuada 3

Adaptación --- ---

Análisis de ítems Adecuada-Buena 3,5

A Adecuada, pero con


Validez: contenido 2,5
algunas carencias

Validez: relación con otras


Adecuada 3
variables

Validez: estructura interna No se aporta información ---

Validez: análisis del DIF No se aporta información ---

Fiabilidad: equivalencia No se aporta información ---

Fiabilidad: consistencia interna Excelente 5

Fiabilidad: estabilidad No se aporta información ---

Fiabilidad: TRI No se aporta información ---

Fiabilidad inter-jueces No se aporta información ---

Baremos e interpretación de
Buena 4
puntuaciones

3
Comentarios generales
La Prueba de Aspectos Instrumentales Básicos en Lenguaje y Matemáticas (PAIB-1-
Renovado) evalúa los aspectos instrumentales básicos en la lectura y en la escritura, relacionados
con el currículo escolar vigente y desde la perspectiva de la psicología cognitiva, en estudiantes de
Educación Infantil (5 años) y primeros cursos de Educación Primaria (1º y 2º). Las competencias
evaluadas son relevantes y las tareas consideradas resultan pertinentes y representativas de los
objetivos curriculares en estos niveles. Por tanto, las pruebas pueden resultar de utilidad en el
contexto educativo, tanto para hacer una valoración inicial a principio de curso, como para hacer
una valoración del aprendizaje al finalizar este. El ámbito de aplicación del cuestionario es
eminentemente educativo.

Entre los puntos fuertes de la prueba cabe destacar:

- Materiales: el material resulta atractivo para estudiantes de entre 5 y 7 años, es de fácil


manejo y las instrucciones de aplicación y corrección son claras. El manual es completo,
con amplia justificación teórica y estadística, siendo sus contenidos accesibles para
profesores y orientadores.

- Desarrollo: el procedimiento seguido para la construcción de las pruebas incluye tres


fases que abordan pilotajes cualitativos y cuantitativos como base para la elaboración
del instrumento final. Además, se justifica de forma teórica el dominio de representación
de los diferentes ítems.

- Muestra: aunque la selección es incidental, se ha procurado que exista variabilidad en


cuanto a representación geográfica (p. ej., Castilla-La Mancha, Extremadura, Madrid,
Castilla y León, Andalucía, Aragón y País Vasco), tipología de los centros (público o
privado/concertado) y su ubicación (centros urbanos o rurales). El uso de cuotas pone
cierto control a los sesgos, aunque no permita precisar cuán representativa es la
muestra.

- Consistencia interna: las evidencias de fiabilidad de las puntuaciones (coeficiente alfa


de Cronbach, IC95%, índice de discriminación de los ítems y valor de alfa eliminando
cada uno de los ítems) son satisfactorios. Los coeficientes resultan excelentes para las
puntuaciones globales y buenos para las subescalas.

- Validez: las puntuaciones en las subescalas correlacionan aceptablemente con la


valoración subjetiva de los profesores acerca del rendimiento de sus estudiantes.
Asimismo, existe evidencia de validez convergente en relación con las subescalas de el
BADYG-R. En general, el patrón de correlaciones es satisfactorio.

- Baremos: se valora positivamente que se permita realizar aplicación y corrección tanto


manual como informatizada, estando los baremos disponibles en centiles, puntuaciones
T y decatipos. También el formato de informe de resultados en función de los baremos
propuestos supone uno de los puntos fuertes de la herramienta, puesto que permite
obtener una evaluación normativa tanto cuantitativa (percentiles, puntuaciones T,
Decatipos) como cualitativa (escala ordinal de 7 grados entre Muy Bajo y Muy Alto).
En términos generales, las propiedades psicométricas de la prueba se consideran buenas y
legitiman su uso en el contexto educativo, si bien en futuras ediciones sería deseable tener en
cuenta los siguientes aspectos:

- Sería recomendable incluir referencias más actualizadas y comprobar que exista una
correspondencia exacta entre la lista de referencias y las citas en el texto del manual.
Aunque resulta comprensible que exista una gran concentración de citas de trabajos
de los autores de la prueba (volcados en la investigación en lenguaje y matemáticas
en este campo), también resultaría deseable incluir alguna referencia a trabajos de
otros grupos y otros países.

4
- Dado que se trata de versiones revisadas de las pruebas PAIB publicadas en 2009,
resulta necesario especificarlo en el manual, así como proporcionar detalles acerca de
qué aspectos se han renovado, eliminado o incluido. Del mismo modo, convendría
aclarar si se utiliza en esta versión la misma muestra que en las pruebas originales.

- En los manuales del PAIB-1, PAIB-2 y PAIB-3 coinciden una gran cantidad de páginas,
por lo que parece recomendable aunar todas las pruebas en un mismo manual y
especificar los apartados necesarios cuando sea necesario distinguir entre ellas.

- Resulta recomendable mejorar el rigor en el uso de términos metodológicos y añadir en


el manual datos específicos acerca de los procedimientos que indican haberse
aplicado (p. ej., evidencias de validez de contenido basadas en la consulta a expertos,
modo de selección y participación del profesorado).

- Aunque el análisis de ítems arroja buenos resultados, sería interesante incluir índices de
validez de contenido, pesos factoriales en la estructura latente y evidencias de validez
criterial.

- Ya que varios de los ítems que forman parte de la versión final cuentan con índices
inferiores a valores mínimos aceptables, parece necesario llevar a cabo una
depuración del instrumento eliminando aquellos con capacidad discriminativa
inadecuada,

- Sería interesante, además del alfa de Cronbach, aportar más estimaciones de la


fiabilidad de las puntuaciones y tener en cuenta que los ítems de distintas escalas
reciben distinta ponderación.

- Sería deseable incorporar evidencias de validez basadas en la estructura interna del


PAIB (p. ej., análisis factorial confirmatorio, análisis del método de la varianza común).
También, se sugiere el contraste de una red nomológica que incluya diferentes variables
criterio desde una perspectiva del modelado de ecuaciones estructurales.

- Podrían considerarse evidencias de validez convergente más directas y objetivas, en


relación con otras pruebas específicas, estandarizadas, de competencia curricular. De
hecho, se podría introducir una estrategia de obtención de evidencias de validez de
decisión respecto a una regla de oro acerca de las competencias de Lenguaje y
Matemáticas, y llevar a cabo análisis de curvas ROC, sobre puntuaciones totales o
sobre ítems.

- Sería interesante incluir más información sobre la validez discriminante de las


puntuaciones (p. ej., en qué grado las puntuaciones en las subescalas de Lenguaje y
Matemáticas están diferenciadas como se espera y de forma suficiente para que se
puedan establecer perfiles de competencias, ya que se observa la presencia de un
fuerte factor general).

- Existen erratas e imprecisiones que deben subsanarse en futuras ediciones.

5
ANÁLISIS DETALLADO DE LA PRUEBA

1. DESCRIPCIÓN GENERAL DEL TEST

1.1. Nombre del test:

PAIB-1 Renovado. Prueba de Aspectos Instrumentales Básicos en Lenguaje y Matemáticas. Educación


Infantil 5 años, 1º y 2º de Educación Primaria.

1.2. Nombre del test en su versión original:

PAIB-1. Prueba de Aspectos Instrumentales Básicos en Lenguaje y Matemáticas (Infantil 5 años, 1º y 2º


Educación Primaria).

1.3. Autor/es del test original:

José Luis Ramos Sánchez, Jose Luis Galve Manzano, Manuel Trallero Sanz y Rosario Martinez Arias.

1.4. Autor/es de la adaptación española:

---

1.5. Editor del test en su versión original:

CEPE. Ciencias de la Educación Preescolar y Especial.

1.6. Editor de la adaptación española:

---

1.7. Fecha de publicación del test original:

2009.

1.8. Fecha de publicación del test en su adaptación española:

---

1.9. Fecha de la última revisión del test:

2017.

1.10. Área general de la/s variable/s que pretende medir el test:

Rendimiento académico / competencia curricular.

6
1.11. Breve descripción de la/s variable/s que pretende medir el test:

El PAIB-1 renovado, dirigido a los niveles de Educación Infantil (5 años) y 1º y 2º de Educación


Primaria tiene como objetivo la evaluación de aspectos instrumentales básicos en lenguaje y
matemáticas, relacionadas con el currículo escolar. Basado en la psicología cognitiva, trata de valorar
tanto los procesos cognitivos puestos en marcha como sus productos. Está concebida como una prueba
pedagógica que ayude al profesorado y profesionales de la orientación educativa a determinar el nivel
de desarrollo alcanzado por el alumnado en lenguaje y matemáticas. Dadas las grandes diferencias
existentes en los niveles de desarrollo en estas edades, el PAIB-1 consta de tres versiones, cuya estructura
y contenido se detallan a continuación.

- El PAIB-1 Educación Infantil contiene 4 pruebas de Lenguaje y 1 de matemáticas:

o Lectura (2 pruebas): evalúa el nivel de lectura mediante la lectura de sílabas y


palabras con distintas estructuras silábicas. Se pide señalar correctamente la sílaba o
palabra que se le dice en voz alta y unir cada dibujo con su palabra escrita.
o Escritura (2 pruebas): evalúa el nivel de escritura mediante la escritura de sílabas y
palabras con distintas estructuras silábicas. Se pide que escriban sílabas y palabras
que se le dicen en voz alta.
o Conceptos numéricos (1 prueba): evalúa el nivel de comprensión de conceptos
cuantitativos y numéricos, así como el cálculo de cantidades iguales o inferiores a
una docena. Se pide tachar con una cruz la casilla que corresponda a las
instrucciones o escribir el resultado.

- El PAIB-1 1º Educación Primaria consta de 1 prueba de lectura, 4 pruebas de escritura y 2


pruebas de matemáticas:

o Lectura: evalúa el nivel de comprensión lectora utilizando frases con distinto nivel de
complejidad en su estructura gramatical. Se debe señalar con una cruz la frase
correcta en relación con el dibujo.
o Escritura: evalúa el nivel de escritura mediante tres tipos de tareas que ejemplifican
procesos cognitivos diferentes: dictado de palabras (evaluación de la ortografía y la
escritura de palabras con distintos tipos de estructuras silábicas), dictado de frases
(evaluación del uso de los signos de puntuación y respeto de las unidades léxicas) y
composición de frases (con dos tipos de estímulos: palabras y viñetas). Para ello, se
dictan frases y palabras, se les pide escriban una frase con cada una de las palabras
que aparecen y una frase relacionada con lo que ocurre en cada viñeta.
o Matemáticas: evalúa el nivel en conceptos numéricos, cálculo y resolución de
problemas. Para ello se les piden diversas actividades como escribir número de
objetos que hay en un dibujo, colorear los números mayores y menores, continuar una
serie de números o resolver operaciones.

- El PAIB-1 2º Educación Primaria consta de 2 pruebas de lectura, 4 pruebas de escritura y 2


pruebas de matemáticas:

o Lectura: evalúa la comprensión lectora utilizando frases y un texto narrativo. Para ello,
se pide señalar con un asterisco las frases que se corresponden con un dibujo y
responder a unas preguntas sobre un texto.
o Escritura: evalúa la ortografía (arbitraria y reglada) mediante el dictado de palabras
(procesos léxicos), el respeto de la separación correcta de las palabras y el uso de los
signos de puntuación (procesos sintácticos) mediante el dictado de frases y la
composición de frases con dos tipos de estímulos (procesos de planificación y
sintácticos), pidiendo que invente frases con las palabras proporcionadas y escriba
frases relacionadas con las viñetas presentadas.

7
o Matemáticas: evalúa el nivel en numeración (utilizar y razonar eficazmente con
números naturales hasta las unidades de millar), cálculo (sumas y restas con llevadas
e inicio de la multiplicación) y resolución de problemas (plantear cuantitativamente
y aplicar las operaciones matemáticas adecuadas para resolver problemas propios
de su contexto).

El PAIB-1 presenta una doble utilidad dentro del ámbito educativo, pudiendo ser empleado como
evaluación inicial al principio de cada curso en Educación Primaria o evaluación final, otorgándole una
naturaleza de prueba final de madurez con el ánimo de poder diseñar contenidos curriculares que
permitan al alumnado mejorar el nivel de desarrollo del alumnado pertinente de cara al curso posterior
o los meses que conforman el mismo y prevenir así potenciales dificultades de aprendizaje. Igualmente,
el PAIB-1 presenta la posibilidad de ser aplicado en cualquier momento del curso de cara a valorar el
nivel de aprendizaje del alumno, incluidos aquellos con dificultades de aprendizaje o compensación
educativa.

La prueba está diseñada para llevar a cabo una aplicación colectiva, aunque también es posible
su aplicación de manera individual, requiriendo un total de tres sesiones de 30 minutos, preferiblemente,
en días consecutivos.

1.12. Áreas de aplicación:

Psicología educativa.

1.13. Formato de los ítems:

Respuesta construida y elección múltiple.

1.14. Número de ítems:

El número de ítems varía entre las tres versiones disponibles para los niveles de educativos de educación
infantil, primer curso y segundo curso de educación primaria.

Educación Infantil: 63 ítems en total, distribuidos de la siguiente forma:

Lenguaje= 47 ítems en total.


Lectura de sílabas= 5 ítems
Lectura de palabras= 16 ítems
Escritura de sílabas= 10 ítems
Escritura de palabras= 16 ítems

Matemáticas (conceptos numéricos)= 16 ítems.

1º Educación Primaria: 68 en total, distribuidos en:

Lenguaje= 38 ítems en total.


Lectura comprensiva de frases= 7 ítems
Escritura:
Dictado de palabras (ortografía)= 20 ítems
Dictado de frases= 4 ítems
Composición de frases (palabras)= 3 ítems
Composición de frases (viñetas)= 4 ítems

Matemáticas= 30 ítems en total.


Numeración:
Conceptos numéricos= 10 ítems
Cálculo= 12 ítems
Resolución de problemas= 8 ítems

8
2º Educación Primaria: 95 ítems en total, organizados en:

Lenguaje= 60 ítems en total.


Lectura:
Lectura comprensiva de frases= 10 ítems
Lectura comprensiva de textos= 18 ítems
Escritura:
Dictado de palabras (ortografía)= 24 ítems
Dictado de frases= 6 ítems
Composición de frases (palabras)= 4 ítems
Composición de frases (viñetas)= 4 ítems

Matemáticas= 35 ítems en total.


Numeración:
Conceptos numéricos= 15 ítems
Cálculo= 12 ítems

Resolución de problemas= 8 ítems

1.15. Soporte:

Papel y lápiz. Informatizado.

Corrección manual o por internet.

1.16. Cualificación requerida para el uso del test de acuerdo con la documentación aportada:

Nivel A.

En el manual se indica que las pruebas pueden ser aplicadas por el profesorado de Lenguaje y
Matemáticas, de apoyo, psicólogos, psicopedagogos, pedagogos y orientadores, familiarizados con el
enfoque cognitivo.

1.17. Descripción de las poblaciones a las que el test es aplicable:

Alumnos de educación Infantil (5 años), 1º y 2º de Primaria (6-7 años).

No se aporta información específica sobre su aplicación a poblaciones específicas o minoritarias.

1.18. Existencia o no de diferentes formas del test y sus características:

El PAIB-1 Renovado consta de un total de tres versiones, una dirigida a Educación infantil (5 años), otra
para 1º de Primaria y otra para 2º de Primaria, con cuadernos de trabajo y baremos específicos para
cada grupo.

Dispone de versión en lápiz y papel (con posibilidad de corrección informatizada a través de la web del
editor) y versión informatizada (con aplicación online a través de la web del editor). No requiere
hardware o software específico ya que se administra y puede corregirse en una plataforma de
corrección on-line (paib.cepeonline.es).

Ha de tenerse en cuenta que existen también con el mismo nombre el PAIB-2 (3º y 4º de Educación
Primaria) y el PAIB-3 (5º y 6º de Educación Primaria y 1º de ESO), siendo estas versiones renovadas de las
pruebas originales publicadas en 2009.

9
1.19. Procedimiento de corrección:

La corrección puede realizarse tanto de forma manual como de forma automatizada, mediante una
plataforma de corrección on-line.

1.20. Puntuaciones:

En todos los casos los ítems están planteado de manera positiva, indicando un acierto una mayor
puntúación en la variable evaluada. Las puntuaciones directas se obtienen mediante la suma de los
aciertos obtenidos en cada uno de los apartados. Se calcula una puntuación directa total para cada
uno de los bloques incluidos en las pruebas: lectura, escritura y matemáticas.

Resulta posible obtener un informe individual y colectivo, obteniendo puntuaciones en diversas escalas
normalizadas y no normalizadas (centiles, T y decatipos), así como una interpretación cualitativa
ordenada por rangos.

El manual ofrece información clara y detallada en cuanto a la otorgación de puntuaciones por acierto
tanto en pruebas relativamente sencillas de valorar (e.g., se dará un punto por cada palabra unida
correctamente por su dibujo) como en aquellas que presentan una mayor dificultad (e.g., aquellas que
implican la escritura por parte del participantes). Se desconoce, ya que no se especifica en el manual,
la posibilidad de tener en cuenta potenciales aciertos debidos al azar.

Las puntuaciones pueden obtenerse de manera manual, en la versión papel y lápiz, o bien mediante la
corrección automatizada del instrumento, estando, por tanto, este procedimiento completamente
automatizado.

1.21. Escalas utilizadas:

Centiles, decatipos, puntuaciones T (M=50; DT=10) y estaninos.

1.22. Posibilidad de obtener informes automatizados:

Sí. El programa informatizado on-line proporciona los resultados en forma de perfil individual y registro
grupal. El informe automatizado que genera el PAIB-1 consiste en tres tablas independientes que recogen
las puntuaciones (una para centiles, otra para puntuaciones T y otra con decatipos) de las subescalas
(lectura, escritura y matemáticas) y global de la prueba. Para cada prueba se describe brevemente la
competencia evaluada y se clasifica el rendimiento en "Muy bajo", "Bajo", "Medio", "Alto" y "Muy alto". Las
gráficas de perfil son monocromas, claras, muy visuales y fácilmente interpretables, recordando el área
evaluada por cada prueba e indicando gráficamente la posición de la persona con respecto a la
población.

1.23. Tiempo estimado para la aplicación del test:

Tanto en aplicación individual como colectiva, el tiempo estimado para la aplicación es


aproximadamente de 1 hora 20 minutos. Se recomiendan tres sesiones de 30 minutos cada una
(preferiblemente desarrolladas en días distintos o con 30 minutos de descanso entre las pruebas en caso
de que deban realizarse en el mismo día).

1.24. Documentación aportada por el editor:

Manual y cuadernos de trabajo del alumno.

Licencia para aplicación y corrección online.

10
1.25. Precio de un juego completo de la prueba:

41,10 euros (Manual).

1.26. Precio y número de ejemplares del paquete de cuadernillos:

1,33 euros cada cuaderno de trabajo de la versión para educación infantil.

1,33 euros cada cuaderno de trabajo de la versión para 1º de educación primaria.

2,33 euros cada cuaderno de trabajo de la versión para 2º de educación primaria.

1.27. Precio y número de ejemplares del paquete de hojas de respuesta:

--

1.28. Precio de la administración y/o corrección, y/o elaboración de informes por parte del editor:

49,95 euros (licencia on-line).

24,95 euros (renovación de 50 usos).

11
2. VALORACIÓN DE LAS CARACTERÍSTICAS DEL TEST

2.1. Aspectos generales:

Contenido Valoración Puntuación

2.1. Calidad de los materiales del test Buena 4

2.2. Calidad de la documentación aportada Adecuada 3

2.3. Fundamentación teórica Adecuada 3

2.4. Adaptación del test --- ---

2.5. Desarrollo de los ítems del test Adecuada 3

2.6. Calidad de las instrucciones para el


Buena 4
participante

2.7. Calidad de las instrucciones


Buena-Excelente 4,5
(administración, puntuación, interpretación)

2.8. Facilidad para registrar las respuestas Excelente 5

Adecuada, pero con


2.9. Bibliografía del manual 2
algunas carencias

2.10. Datos sobre el análisis de los ítems Adecuada-Buena 3,5

12
2.11. Validez:

2.11.1. Evidencias de validez de contenido:

Contenido Valoración Puntuación

2.11.1.1. Calidad de la representación del


Adecuada 3
contenido o dominio

Se ha consultado de
manera informal a un
2.11.1.2. Consultas a expertos 2
pequeño número de
expertos

2.11.2. Evidencias de validez basadas en la relación entre las puntuaciones del test y otras variables:
2.11.2.1. Evidencias de validez basadas en la relación entre las puntuaciones del test y otras variables:

Contenido Valoración Puntuación

2.11.2.1.1. Diseños empleados Correlaciones con otros tests

Varios estudios con


2.11.2.1.2. Tamaño de las muestras muestras de tamaño 4
moderado

2.11.2.1.3. Procedimiento de selección de las


Incidental
muestras

2.11.2.1.4. Calidad de los tests empleados


Adecuada 3
como criterio o marcador

2.11.2.1.5. Promedio de las correlaciones con Adecuada, pero con


2
otros tests que miden constructos similares algunas carencias

2.11.2.1.6. Promedio de las correlaciones con


otros tests que miden constructos no No se aporta ---
relacionados

2.11.2.1.7. Resultados de la matriz multirrasgo-


No se aporta ---
multimétodo

2.11.2.1.8. Resultados de las diferencias


No se aporta ---
intergrupo

13
2.11.2.2. Evidencias de validez basadas en la relación entre las puntuaciones del test y un criterio:

Contenido Valoración Puntuación

Correlación con valoración subjetiva del


profesorado sobre el rendimiento escolar en
2.11.2.2.1. Criterios empleados
lengua (escala de 1=no supera los objetivos
previstos a 4=sobrepasa los objetivos previstos)

Adecuada, pero con


2.11.2.2.2. Calidad de los criterios empleados 2
algunas carencias

2.11.2.2.3. Relación temporal entre test y


Concurrente
criterio

Varios estudios con


2.11.2.2.4. Tamaño de las muestras 5
muestras grandes

2.11.2.2.5. Procedimiento de selección de las


Incidental
muestras

2.11.2.2.6. Promedio de las correlaciones del


Adecuada 3
test con los criterios

2.11.3. Evidencias de validez basadas en la estructura interna:

Contenido Valoración Puntuación

2.11.3.1. Resultados del análisis factorial --- ---

2.11.3.2. Funcionamiento diferencial de los


--- ---
ítems

2.11.4. Acomodaciones en la administración del test:

Contenido Valoración Puntuación

2.11.4. El manual del test informa sobre las


No
acomodaciones en la administración del test

14
2.11.5. Comentarios generales sobre evidencias de validez:
En el manual se incluyen apartados de validez centrados en la relación con otro test (BADYG-
R) y con un criterio externo (criterio subjetivo de dos profesores sobre el rendimiento de los estudiantes
en lenguaje), validez de contenido y validez estructural. Aunque en algunos casos los autores utilizan la
expresión “evidencias de validez”, no utilizan una concepción de validez unitaria (cfr. AERA, APA y
NCME, 2014).
Las evidencias de validez aportadas resultan en términos generales adecuadas, pero para
futuras ediciones de la prueba se recomienda:
- Aportar evidencias específicas basadas en el contenido: número de expertos consultados,
procedimiento de selección, procedimiento, análisis y resultados obtenidos sobre el grado de
coincidencia, etc. También se recomienda revisar aquellos ítems con correlaciones ítem-total por
debajo de .200.
- Proporcionar evidencias de validez basadas en la estructura interna adicionales: el manual incluye
un breve apartado referido a “validez estructural” que se limita a presentar las correlaciones entre
las distintas escalas, utilizándose esta información para justificar que existe una “habilidad
subyacente” a todas las pruebas. Sin embargo, resulta fundamental aportar datos relativos a otros
procedimientos que no sólo indiquen la relación entre las variables, sino su aportación a cada
factor y su ajuste al modelo dimensional que subyace al instrumento. Sería recomendable la
utilización de análisis factorial confirmatorio para justificar las puntuaciones proporcionadas por el
instrumento en las escalas y subescalas.
- Complementar las evidencias basadas en un criterio externo pues se emplea como criterio la
valoración subjetiva de “al menos dos profesores” sobre el nivel de aprendizaje en el área de
Lenguaje en una escala de 1 (no supera los objetivos previstos) a 4 (supera los objetivos previstos).
Además de que se trata de un criterio subjetivo que puede estar sesgado, se desconocen las
características y número de los respondientes, los criterios que utilizaron para realizar tal valoración
y la fiabilidad interjueces. Los análisis se limitan a correlaciones (aunque se indica en el manual que
también se realiza regresión lineal múltiple, los datos de esta no se encuentran en el mismo) entre
las valoraciones subjetivas de los profesores y las diferentes subescalas y puntuaciones globales.
Sería interesante utilizar procedimientos para la estimación de tales relaciones considerando el error
de medida y utilizar una potencial "regla de oro" para posibilitar un análisis de validez de decisión
de las puntuaciones obtenidas. Cabe subrayar también que los tamaños de las muestras utilizadas
no concuerdan con lo descrito en el apartado de participantes, por lo que parece que existen
datos perdidos de los que no se informa.
- En cuanto a las evidencias de validez basadas en la relación con otros tests, se proporcionan las
correlaciones con la Batería de Aptitudes Diferenciales y Generales (BADYG-R), obteniéndose
valores satisfactorios que muestran que existe relación entre las dimensiones evaluadas en ambas
pruebas. Sin embargo, seria conveniente incluir una justificación sobre los motivos para elegir esta
prueba. Para valorar la validez convergente y discriminante de las pruebas de forma más
específica sería recomendable aplicar otras pruebas estandarizadas de rendimiento escolar.
- Se sugiere realizar análisis de posibles diferencias estadísticamente significativas entre grupos de
interés y análisis del funcionamiento diferencial de los ítems.

15
2.12. Fiabilidad:

Contenido Valoración Puntuación

Un único coeficiente de fiabilidad para cada


2.12.1. Datos aportados sobre fiabilidad
escala o subescala

2.12.2. Equivalencia formas paralelas:

Contenido Valoración Puntuación

2.12.2.1. Tamaño de las muestras --- ---

2.12.2.2. Puesta a prueba de los supuestos de


--- ---
paralelismo

2.12.2.3. Promedio de coeficientes de


--- ---
equivalencia

2.12.3. Consistencia interna:

Contenido Valoración Puntuación

Varios estudios con


2.12.3.1. Tamaño de las muestras 5
muestras grandes

2.12.3.2. Coeficientes de consistencia interna


Coeficiente alfa o KR-20
presentados

2.12.3.3. Promedio de coeficientes de


Excelente 5
consistencia

2.12.4. Estabilidad (test-retest):

Contenido Valoración Puntuación

2.12.4.1. Tamaño de las muestras --- ---

2.12.4.2. Coeficientes de estabilidad --- ---

16
2.12.5. Cuantificación de la precisión mediante TRI:

Contenido Valoración Puntuación

2.12.5.1. Tamaño de las muestras --- ---

2.12.5.2. Coeficientes proporcionados ---

2.12.5.3. Tamaño de los coeficientes --- ---

2.12.6. Fiabilidad inter-jueces:

Contenido Valoración Puntuación

2.12.6.1. Tipos de coeficientes presentados ---

2.12.6.2. Promedio de los coeficientes --- ---

2.12.7. Comentarios generales sobre evidencias de fiabilidad:


Las muestras utilizadas para analizar la fiabilidad de las puntuaciones se consideran
adecuadas en cuanto a número (n>500 en cada uno de los tres niveles educativos) y a la
heterogeneidad existente en términos de sexo, distribución geográfica y titularidad de los colegios a
los que pertenecen los participantes.
Se informa de un coeficiente de fiabilidad, el coeficiente alfa de Cronbach, que indica
consistencia interna, para cada escala, subescala y puntuación global en cada uno de los subgrupos
poblacionales (e. infantil, 1º e. primaria y 2º e. primaria). Junto con los coeficientes alfa de Cronbach
se presentan sus intervalos de confianzas, media y desviación típica, los índices de discriminación de
los ítems (homogeneidad corregida) y el valor de alfa eliminando cada uno de los ítems. En futuras
ediciones del test, sería interesante utilizar otro tipo de estimadores que consideren tanto la información
de cada una de las subpruebas como el número de elementos que conforman las mismas.
Los resultados de consistencia interna se consideran excelentes en términos generales (se
supera el valor .80 en la mayoría de los casos e, incluso, se obtienen valores en torno a .95 en algunas
de las escalas). No obstante, debieran revisarse aquellas subescalas en las que se obtienen índices de
discriminación inferiores a .20. pues la eliminación de ítems con índices de discriminación cercanos a
0,1 supondría una ganancia en la fiabilidad de la escala. También sería interesante llevar a cabo análisis
de fiabilidad con Teoría de Respuesta a los Ítems (TRI), por ejemplo, con el modelo de Rasch.

17
2.13. Baremación e interpretación de las puntuaciones:

2.13.1. Interpretación normativa de las puntuaciones:

Contenido Valoración Puntuación

Varios baremos dirigidos


2.13.1.1. Calidad de las normas a diversos estratos 4
poblacionales

2.13.1.2. Tamaño de las muestras Moderado 3

2.13.1.3. Aplicación de estrategia de


No
tipificación continua

2.12.1.4. Procedimiento de selección de las


Incidental
muestras

2.12.1.5. Actualización de baremos Excelente 5

2.13.2. Interpretación referida a criterio:

Contenido Valoración Puntuación

2.13.2.1. Adecuación del establecimiento de


--- ---
los puntos de corte

2.13.2.2. Procedimiento empleado para fijar


---
los puntos de corte

2.13.2.3. Procedimiento de obtención del


---
acuerdo inter-jueces

2.13.2.4. Valor del coeficiente de acuerdo


--- ---
inter-jueces

18
2.13.3. Comentarios generales sobre baremación e interpretación de las puntuaciones:
Las muestras empleadas se pueden considerar adecuadas en cuanto a tamaño y
composición (muestreo por cuotas). El manual presenta un conjunto de baremos divididos según nivel
educativo y momento de evaluación (i.e. inicio o final de curso), aportando, además diferentes escalas
normalizadas y no normalizadas (puntuaciones centiles, T y decatipos).
La estructura de baremos que presenta es la misma en todos los casos (i.e., final de E. Infantil
5 años - inicio de 1º de E. Primaria; final de 1º de E. Primaria – inicio de 2º de E. Primaria; final de 2º de E.
Primaria – inicio de 3º de E. Primaria).
- Tabla de puntuaciones directas y sus correspondientes percentiles para las subescalas de
competencias en Lenguaje y en Matemáticas, y para las puntuaciones globales. La tabla
también incluye la media y la desviación estándar de las puntuaciones directas (si bien
no se indica expresamente que son la M y la DT de las puntuaciones directas y los valores
indicados difieren ligeramente con los proporcionados en el análisis de fiabilidad).
- Tabla de puntuaciones directas y sus correspondientes puntuaciones T para las
subescalas de Lenguaje y Matemáticas y las puntuaciones globales, más la media y la
desviación estándar de las puntuaciones directas.
- Tabla de puntuaciones directas y sus correspondientes puntuaciones eneatipo
(estaninos) y decatipo, tanto para las subescalas de Lenguaje y Matemáticas como para
las puntuaciones globales.
Los baremos permiten valorar la situación específica del alumno en cada una de las pruebas
respecto a su grupo normativo, tanto a nivel cuantitativo como a nivel cualitativo, con una escala
ordinal de siete niveles basada en el criterio estadístico de desviación típica: Muy bajo (P<10, T<30,
DEC<=2), Bajo (P entre 11-24, T entre 30-39, DEC=3), Medio-Bajo (P entre 25-39, T entre 40-44, DEC=4),
Medio (P entre 40-60, T entre 45-55, DEC=5), Medio-alto (P entre 61-75, T entre 56-60, DEC=6), Alto (P
entre 76-89, T entre 61-70, DEC=7) y Muy alto (P>89, T>70, DEC>7).
Sería recomendable realizar estudios de diferencias intergrupos para comprobar si resulta
necesario contar con baremos específicos para diferentes muestras dentro de cada estrato educativo
(p. ej., en función del sexo u otras variables relevantes).
Se valora muy positivamente el proporcionar la posibilidad de realizar la aplicación y
corrección de la prueba tanto de forma manual como de forma informatizada, considerándose como
punto fuerte la inclusión de los baremos en el manual.

19

También podría gustarte