Está en la página 1de 12

ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

ADAPTACION DE TEST A OTRAS CULTURAS


1.1 Objetivo:

Aplicar el proceso de adaptación de un test psicológico.

1.2 Por qué adaptar un test:

El uso de un test en un contexto cultural diferente al original genera diversas


dificultades como el idioma, familiaridad con los estímulos del test y diferentes
características de la muestra de estandarización. Los sesgos en un test pueden
conducir a obtener resultados gravemente erróneos.
En el VIII Congreso Internacional de Psicología organizado por el Colegio de
Psicólogos del Perú llevado a cabo en octubre del 2016 en la UNMSM el profesor
Omar Clemente (Catedrático de la Universidad de Piura) explico que las
evaluaciones son importantes porque permiten tener una medida más o menos
exacta del fenómeno que se desea conocer. Además, dijo, ayudan a comparar
y generalizar resultados desde el punto de vista científico. “Considerando que la
mayoría de pruebas psicológicas provienen de Estados Unidos y Europa, la
adaptación de ellas al contexto local se convierte en un quehacer necesario en
la práctica profesional”.
En ese sentido, el profesor señaló que el proceso de adaptación es complejo,
pues implica una serie de pasos estructurados del investigador. Según el experto
estos pasos son: equivalencia del constructo, adaptación idiomática,
establecimiento de la validez y confiabilidad, y establecimiento de los puntos de
corte para la interpretación.
Clemente indicó que la equivalencia del constructo se logra a través de la
revisión de antecedentes e involucra elementos de tipo conceptual, cultural,
lingüístico y de medida. Sobre la adaptación idiomática, el profesor Clemente
explicó: “incluso si el idioma es el mismo, las características idiomáticas y
lingüísticas pueden variar sustancialmente; y, aunque se utilicen exactamente
las mismas palabras, el significado y la interpretación pueden ser muy distintos”.
En este paso se deben elegir adecuadamente los traductores, buscar la máxima
concordancia entre palabras y usar términos de uso frecuente en la cultura de
adaptación.
El tercer paso (establecimiento de la validez y confiabilidad) es un aspecto
básicamente psicométrico, pues debe incluir indicadores de validez (jueces
expertos, cantidad de ítems) y confiabilidad (análisis de consistencia interna),
refiere el docente. En cuanto a los puntos de corte para la interpretación,
Clemente señaló que permiten establecer las categorías de interpretación de los
puntajes. Por ejemplo, en un test de inteligencia, permite saber si se habla de
un coeficiente intelectual alto, medio o bajo.

pág. 1
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

1.3 Fuentes de Sesgo

Si deseamos usar las pruebas para predecir resultados en alguna situación


futura como por ejemplo en el desempeño de un aspirante a la universidad,
necesitamos instrumentos con alta validez predictiva del criterio particular. Este
requisito suele descuidarse en el desarrollo de las llamadas “pruebas libres de
influencia cultural”. En un esfuerzo por incluir en esas pruebas solo las funciones
comunes a diferentes culturas o subculturas, puede elegirse un contenido que
tenga poca relevancia para el criterio que se pretenda predecir. Una mejor
solución es elegir un contenido relevante para el criterio e investigar luego las
posibles diferencias poblacionales de la efectividad de la prueba para el
propósito pretendido.
Desde mediados de la década de los setenta se ha observado una rápida
acumulación de investigaciones sobre problemas de sesgo de la prueba. En este
contexto, el término “sesgo” se emplea en su bien establecido sentido
estadístico, para desganar un error constante o sistemático en contraste con uno
que se debe al azar. Las principales preguntas que se han planteado con
respecto al sesgo de la prueba tienen que ver con el coeficiente de validez (sesgo
de la pendiente) y la relación entre las medias del grupo en la prueba y en el
criterio (sesgo de intersección). Si una prueba produce un coeficiente de validez
significativamente diferente en dos grupos, la diferencia se describe como sesgo
de la pendiente y esta clase de diferencia entre grupos se conoce como “validez
diferencial”. Una prueba exhibe sesgo de intersección si sistemáticamente
subpredice o sobrepredice una ejecución del criterio para un grupo particular.
El problema del sesgo de la intersección se relaciona más con lo que ha sido
llamado “equidad de la prueba”. Aunque los términos “equidad” y “sesgo” de la
prueba a veces se usan indistintamente para cubrir todos los aspectos del uso
del instrumento con minorías culturales.
Modelos de decisión para el uso justo de las pruebas:
Gradualmente empezó a cambiar el interés de la investigación en la evaluación
del sesgo de las pruebas al diseño de estrategias de selección para su uso justo
con minorías culturales. Entre las metas por reconciliar están las de proporcionar
iguales oportunidades a todos los individuos , elevar al máximo la tasa del éxito
y la productividad, incrementar la mezcla demográfica y la representatividad y
extender el tratamiento preferencial a grupos desfavorecidos por inequidades
anteriores.
Van de Vijver y Tanzer (1997) identificaron diferentes fuentes de sesgo, que a
continuación se explicitan:

1.3.1 Sesgo de constructo


Este tipo de sesgo se da “cuando el constructo medido no es idéntico a través
de los grupos culturales...” (p.p. 264, Van de Vijver y Tanzer, 1997). La
importancia que cada cultura otorga a ciertas conductas se encuentra en esta
categoría. Conductas de ética y civismo que en algunas sociedades pueden ser

pág. 2
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

normales en otras pueden constituir un verdadero rasgo de rigidez y asemejarse


a una conducta obsesivo compulsivo.

1.3.2 Sesgo metodológico


Este sesgo reconoce tres formas.
El sesgo de muestra: que se da cuando las muestras son incomparables entre
sí. La cantidad de años de escolaridad que poseen los sujetos de una muestra
es una variable determinante en el desempeño del mismo en un test
determinado, especialmente si se trata de un test de habilidad. El nivel
sociocultural, la motivación, la composición por género y edad de los sujetos son
otras variables que pueden hacer incomparables a dos muestras que pueden
mostrar resultados muy diferentes en un test determinado.
El sesgo en el instrumento: que puede provenir de las características del
instrumento. La familiaridad que los sujetos tienen con los estímulos presentados
tiene una gran importancia. Algunos estímulos tales como objetos, dibujos,
figuras u otros elementos utilizados en algunas culturas no existen en otras o son
irrelevantes. El ítem de ejemplo en el Sub. Test de Ordenamiento de lámina
WISC III que muestra a una mujer frente a una máquina expendedora de latas
de gaseosa tiene muy poco valor en culturas árabes, por ejemplo, o en zonas
rurales de nuestro país. El idioma es otra fuente de sesgo de instrumento. La
traducción de un idioma a otro frecuentemente subestimada, es un problema
importante que requiere una metodología específica a seguir. Los problemas son
mayores cuantas más diferencias hay entre idiomas como entre el inglés y el
chino o el árabe, idiomas cuya lectura se realiza de izquierda a derecha a
diferencia del de derecha a izquierda. También la disposición del texto tiene
importancia en el completamiento de frases o de interpretación de textos, mayor
es el problema cuando implican conectar letras y números siguiendo un orden
alfabético o numérico y los caracteres de idiomas como el español, ruso, griego.
Árabe, hebreo o chino son tan diferentes. También entre los idiomas occidentales
existen diferencias como que en ingles no existe la “ñ” que el alfabeto sueco
contiene más vocales, y en portugués existen distintos tipo de a. Los métodos
de respuesta constituyen otra fuente de sesgo del instrumento. Las láminas de
respuestas del Test de Matrices
Progresivas de Raven que implica completar una secuencia lógica con una figura
opcional, incluyen la figura faltante al final de la segunda fila, con lo que asume
una lectura de izquierda a derecha. Este hecho fue demostrado por Carpenter,
Just y Shell (1990) en un muy preciso estudio que implica una serie de
desventajas para los sujetos de las culturas árabes quienes involuntariamente
van a intentar resolver la prueba de derecha a izquierda, forma en que se lee su
idioma.
El sesgo de administración: incluye problemas tales como dificultades en la
comunicación, es decir, dificultades para que el entrevistado entienda las
instrucciones del entrevistador ya sea por la dificultad de las palabras utilizadas,
el modo de explicación de las instrucciones o un inadecuado manejo del idioma

pág. 3
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

de alguna de las partes. También se incluyen las alteraciones en la manera de


administrar las pruebas.
Normalmente los manuales incluyen instrucciones de administración que en
muchos casos no son adecuadas para la población a aplicar. Los
administradores del Test entonces adaptan esas instrucciones según su criterio
personal. Otro punto importante es el uso de cronómetros que produce serias
alteraciones en los resultados. Sesgo de ítem: Se produce cuando el mismo tiene
diferentes significados en distintas culturas. Ciertos grupos culturales pueden
obtener puntajes significativamente distintos en un ítem determinado a pesar de
obtener un puntaje total similar. La deseabilidad social o la relevancia cultural,
entre otros factores, pueden producir el sesgo de ítem. Tanzer (1995) demostró
que aunque la estructura factorial de un Test de auto concepto académico era
similar cuando se lo aplico a estudiantes australianos y singaporeanos, existían
diferencias sustanciales entre estas muestras cuando se compararon algún ítem
específicamente. Este tipo de sesgos también actúa en test neuropsicológicos.

1.4 La influencia del lenguaje:

El lenguaje es otro factor que afecta el desempeño en la evaluación transcultural


que utiliza test psicológicos. El idioma puede producir diferencias en el
rendimiento en un test determinado, y por ende inconvenientes al utilizar
baremos extranjeros.
La investigación demuestra claramente como el idioma que se habla puede
producir diferencias en el desempeño en una determinada prueba. Hay sujetos
que por hablar un determinado idioma natal mostrarían una mayor aptitud en
algunas pruebas que otros que hablan un idioma distinto. Existe aquí una
diferencia real en la capacidad de ambos sujetos, por lo tanto no puede atribuirse
esta diferencia a algún error o sesgo en los instrumentos de medición.

1.5 Métodos de Adaptación de los Tests:

Actualmente se reconoce que la adaptación de un Test es un proceso mucho


más complejo que la mera traducción de ese test en un idioma diferente. Una
adaptación implica considerar no sólo las palabras utilizadas al traducir la
prueba, sino también las variables culturales involucradas. La traducción del
inglés al español del siguiente ítem del NEO PIR “I wouldn´t enjoy vacationing
in Las Vegas “por “No disfrutaría tomando vacaciones en Las Vegas” es correcta.
Sin embargo, este ítem probablemente tenga un significado distinto para muchas
personas en Argentina que para los estadounidenses y, probablemente, el
significado sea mucho más diferente en culturas no occidentales. Así una
correcta traducción no asegura un significado unívoco. Van de Vijver y Leung
(1997) establecieron tres niveles de adaptación de las pruebas psicológicas.
El primero corresponde al de la aplicación, este es, la simple y llana traducción
de un test de un idioma a otro. Este método asume la equivalencia de constructo.

pág. 4
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

Desafortunadamente, es el método más común y más utilizado en todo el mundo.


Como se indicara anteriormente la sola traducción de una prueba no nos indica
ningún nivel de equivalencia entre ambas versiones de la misma.
La segunda alternativa es la adaptación. En este caso a la traducción se agrega
la transformación, adición o substracción de algunos ítems de la escala original.
Como se explicó, algunos ítems pueden cambiar su significado a través de las
culturas y, por lo tanto, necesitan modificaciones o ser eliminados. Así mismo
ítems que no existen en la versión original del test pueden representar mejor al
constructo en la población en la cual se administrará la nueva versión. Baldo
(2000) al realizar una baremización del WISC III en Córdoba encontró que el
nivel de dificultad original de los ítems pertenecientes a los sub test
Comprensión, Vocabulario e Información no eran aplicables a la población
Argentina, por lo que propuso un nuevo ordenamiento de los ítems. Este es un
ejemplo de adaptación sin adición o substracción de ítems.
Finalmente, la opción ensamble puede emerger al momento de adaptar un
instrumento de evaluación psicológica. En este caso el instrumento original ha
sido modificado tan profundamente que prácticamente se ha transformado en un
nuevo instrumento original con los nuevos elementos. Esto ocurre cuando
muchos de los ítems del test original son evidentemente inadecuados para
representar el constructo a medir. Esto sucede en test de denominación
confrontacional, utilizados en neuropsicología, donde se utilizan láminas con
dibujos de objetos que el evaluado debe nombrar. Estos objetos tienen distinta
frecuencia de observación en la vida diaria de un sujeto y por ello van a variar
considerablemente de una cultura a otra. Es el caso de la adaptación Argentina
del Test de Denominación de Boston (Allegri et. Al 1997). En la versión original
la figura de una bellota está ubicada en el lugar número 32 mientras que en la
versión Argentina tal lámina se encuentra sobre el final en el número 50. El
ensamble también se da cuando el constructo no está representado de forma
adecuada por la versión original en la cultura a la que se quiere adaptar la
prueba. Los abordajes indigenistas de la medición de la personalidad, por
ejemplo, han promovido el diseño de test distintos para abarcar aspectos de la
personalidad no contemplados en las teorías occidentales. Tal es el caso del
Inventario Chino de Evaluación de la Personalidad, que contiene dimensiones
indigenistas de la personalidad tales como “armonía”.

1.6 Técnicas de Traducción

El proceso de traducción es complejo e implica más que la traducción literal de


las palabras escritas a un nuevo lenguaje. Existen 2 métodos fundamentales
 La traducción directa (for-ward translation)
 Inversa (backward translation)

pág. 5
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

1.6.1 Método de traducción directa


En este método un traductor o preferentemente un grupo de traductores,
traducen el test desde el idioma original al nuevo. Luego otro grupo de
traductores juzga la equivalencia entre las dos versiones. De este modo pueden
realizarse las correcciones pertinentes a las dificultades o errores identificados.
Psicología indigenista es el estudio de la conducta humana y los procesos
mentales dentro de un contexto cultural que descansa sobre los valores,
conceptos, sistemas de creencia y otros recursos del grupo étnico o cultural que
se investiga.

1.6.2 Método de traducción inversa


El método más utilizado, un grupo de traductores realiza una traducción desde
el idioma original al nuevo idioma; luego un segundo grupo de traductores toma
el test traducido (en el nuevo idioma) y vuelve a traducirlo al idioma original.
Seguidamente se realizan las comparaciones entre la versión original y la versión
retraducida al idioma original para determinar su equivalencia.

1.7 Diseños experimentales para verificar la equivalencia de test e ítems

Una vez que se ha traducido adecuadamente el test es necesario establecer si


esta versión traducida es equivalente a la original, para ello se requiere un diseño
experimental y el análisis de los datos obtenidos a través de este diseño.

Existen básicamente tres métodos:

1.7.1 Administración del test original y traducido a individuos bilingües


En este caso se les administra ambas versiones del test (la original y la traducida
al nuevo idioma) a personas que hablen ambos idiomas. Este método posee
ventajas y limitaciones:
Ventajas: Permite controlar las diferencias de los participantes en el test, puesto
que ambas versiones del test son administradas a la misma persona.
Desventajas: La primera es que este diseño está basado en la premisa de que
los individuos son igualmente competentes en ambos idiomas, lo cual es difícil
de sostener, es probable entonces que puedan observarse diferencias entre los
resultados de ambas versiones debido de una menor capacidad de algunas
personas para entender los ítems en alguna de las dos lenguas.
La segunda es que no puede asegurarse que los bilingües posean el mismo nivel
de competencia que la población general, por el hecho de conocer otro idioma,
es probable que se trate de personas con una mayor capacidad intelectual o
mejor educación.

1.7.2 Administración de la versión original del test y su traducción inversa


a monolingües en el idioma original.

pág. 6
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

Se les administra la versión original del test de inteligencia en inglés y la versión


obtenida por traducción inversa a personas cuyo idioma natal es el inglés, la
equivalencia entre los ítems se determinaría comparando el desempeño de cada
individuo en ambas versiones.
Ventaja: Este diseño está en el control de las diferencias en las características
de los participantes una limitación es que no permite obtener datos de la versión
en el idioma meta del test (español).
Desventaja: Reside en la posible falta de independencia entre los puntajes
obtenidos, puesto que es probable que exista un efecto de aprendizaje luego de
la administración de la primera versión de la prueba especialmente si es la
original. La administración al azar de una de las versiones en primer lugar puede
atenuar la influencia de la variable, aprendizaje.

1.7.3 Administración de la versión original a monolingües que hablan el


idioma original y de la versión traducida a monolingües que hablan
el idioma al que ha sido traducido el test.
En este caso se administraría la versión en inglés del test a sujetos cuya lengua
materna es el inglés y se administraría la versión en español a personas cuya
lengua materna es el español. Una posible dificultad de esta diseño reside en
asumir que los sujetos que ambas muestras poseen una inteligencia (u otro
rasgo medido) comparable sin embargo este obstáculo puede subsanarse si los
análisis son desarrollados en el contexto de la teoría de respuesta al ítems.
-Una vez obtenido los datos por medio de estos diseños de investigación existen
varias posibilidades de análisis estadístico. Básicamente el análisis estará
destinado a identificar que las propiedades psicométricas esenciales
(confiabilidad, validez) del test original se mantengan en la versión adaptada.
Para ello es necesario replicar esos estudios psicométricos del test original en la
población meta de adaptación.
También es importante verificar la posible existencia de funcionamiento
diferencial del ítem s decir corroborar que las propiedades psicométricas de los
ítems, no varíen en las diferentes muestras. El FDI es una aplicación importante
de la teoría de respuesta del ítem.

1.8 Métodos para establecer la Equivalencia entre Test

Una vez que se ha traducido convenientemente una prueba es necesario realizar


un estudio para establecer si esta traducción en la prueba es equivalente a la
original.
Para ello habrá de implementarse un diseño experimental y un análisis de datos
obtenidos a través de ese diseño. Hambleton (200) señala que existen
básicamente 3 métodos.

1.8.1 Administración de la prueba en el idioma original y de la prueba


traducida a sujetos bilingües

pág. 7
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

En este caso se le administrara ambas versiones de la prueba (la original y su


traducción al nuevo idioma) a sujetos que hablan ambos idiomas. Si por ejemplo,
deseamos traducir el test de Inteligencia de Wechsler para Adultos, Versión III
desde el inglés al Español, administraremos la versión en Inglés y la versión en
Español a los evaluados que hablen ambos idiomas. Este método según
Hambleton, posee ventajas y desventajas. Entre las primeras se pueden
mencionar que pueden controlarse las diferencias de las características de los
participantes en el test (por ejemplo su habilidad) ya que ambas pruebas son
administradas a la misma persona. Entre las desventajas, este autor que este
diseño está basado en la premisa de que los sujetos son igualmente
competentes en ambos idiomas, lo cual es difícil de sostener. Es probable,
entonces, que puedan observarse diferencias entre ambas versiones debido a
una menor capacidad de algunas personas para entender los ítems en alguno
de los dos idiomas. La segunda gran desventaja de este diseño es que no puede
asegurarse que los bilingües posean el mismo nivel de competencia que la
población general. Por el hecho de conocer otro idioma es probable que se trate
de personas con una mayor capacidad intelectual o mejor educación.
Hambleton, también señala una variación de este método que conserva las
mismas ventajas y desventajas pero que es más fácil de implementar. La misma
consiste en administrar al azar una (no ambas) de las versiones del test (en
español o en inglés) a los participantes bilingües.

1.8.2 Administración de la versión original y su traducción inversa a


monolingües en el idioma original
Siguiendo nuestro ejemplo anterior, planteado por las autoras (Tornimbeni et.
Al. 2004) se le administraría la versión original del WAIS – III y la versión obtenida
de la traducción inversa a sujetos cuyo idioma natal es el inglés. La equivalencia
de los ítems se determina comparando el desempeño de cada sujeto en cada
ítem de ambas versiones. Nuevamente, la ventaja está en el control de las
diferencias en las características de los participantes. La primera gran
desventaja está en que este diseño no permite obtener datos con la versión en
el idioma meta (target) del test (español en el ejemplo). De esta manera no es
posible obtener puntajes de sujetos que hablen el idioma al que se intenta
traducir el test. La segunda gran desventaja de este diseño reside en el hecho
de la posible falta de independencia entre los puntajes obtenidos ya que es
probable que exista un efecto de aprendizaje luego de la administración de la
primera versión de la prueba, especialmente si la primera es la original. La
administración al azar de una de las versiones en el primer lugar puede reducir
la importancia del efecto de aprendizaje.
1.8.3 Administración de la versión original a monolingües que hablan el
idioma original y de la versión traducida a monolingües que hablan
el idioma al que ha sido traducida la prueba
Siguiendo con el ejemplo enunciado por Tornimbeni et. Al (2004), se
administraría la versión en inglés del WAIS – III a evaluados cuyo idioma natal

pág. 8
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

es el Español. Una posible dificultad reside en asumir que los sujetos de ambas
muestras poseen una habilidad comparable. Sin embargo, Hambleton sugiere
que tal obstáculo puede superarse si los análisis son desarrollados con la Teoría
De Respuesta al Ítem, en la cual se asume que utilizando distintos conjuntos de
ítem pueden obtenerse las mismas estimaciones de aptitud. Igualmente,
administrando esos ítem a distintas muestras de examinados las estimaciones
de parámetros obtenidas serán iguales.
Una vez obtenidos los datos por medio de los diseños revisados existen varias
posibilidades estadísticas para su análisis. Básicamente el análisis estará
destinado a identificar la existencia de Funcionamiento Diferencial de items (FDI)
es decir, ítem que se comportan en forma diferente a través de las diversas
muestras transculturales. Por ejemplo, en las investigaciones citadas de Tanzer
(1995)) en donde el investigador le administro dos cuestionarios sobre auto
concepto académico de lectura y matemáticas. En los resultados pudo
observarse que a pesar de que la prueba mostraba la misma estructura factorial
para ambos grupos culturales, cuando las escalas de los ítems de competencia/
facilidad se trabajaban en forma individual podían observarse grandes
diferencias entre ambos grupos culturales. El autor especulo con que tal
diferencia se debía a un factor cultural de modestia, la cual es una virtud
deseable dentro de la cultura de Singapur, fuertemente influenciada por la cultura
china. Así, los singaporeanos eran más renuentes a mostrar una actitud
autoelogio o jactancia. Esta investigación además, de ser un ejemplo de FDI,
muestra también la insuficiencia de comparar las estructuras factoriales de las
pruebas cuando son aplicadas transculturalmente. Como puede observarse en
estos resultados, es necesario siempre realizar un análisis de (FDI) ya que a
pesar de conservar una misma estructura factorial un grupo puede mostrar
valores mucho más bajos que otro en determinados ítem.
Existen diversos métodos en los que se puede analizar el comportamiento de los
ítems. Algunos métodos dentro de la TCT tales como los métodos de suma de
chicuadrado o el de Mantel y Haenzel que fuera adaptado para el FDI por Holland
y Thayer ( 1988) y que es en la actualidad él más utilizado a estos fines. El
análisis puede desarrollarse dentro de la TRI en donde el mismo se centrara en
las probabilidades que tiene una persona con un determinado nivel de habilidad
de contestar un ítem en forma correcta. El modelo de Rasch, de un solo
parámetro es el más popular.

1.9 Ejemplo de adaptación de un test

Adaptación del Inventario de Estilos de Personalidad de Millon en una


población universitaria peruana.

El uso de inventarios de personalidad es una práctica común entre los psicólogos


peruanos para llevar a cabo evaluaciones clínicas o de selección de personal.
Sin embargo, se siguen utilizando versiones de instrumentos psicológicos que

pág. 9
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

no se encuentran adaptados a la realidad, resultando escasos los estudios de


estandarización y baremación de pruebas psicológicas. El uso de pruebas no
adaptadas suscita una serie de dificultades en la interpretación de resultados,
produciéndose muchas veces sesgos negativos, dado que se trata de materiales
creados dentro de contextos culturales diferentes. Por lo tanto, no basta contar
con los instrumentos en castellano, sino que también deben ser adaptados y
probados en una población con el objeto de determinar su validez y confiabilidad.
El Inventario de Estilos de Personalidad de Millon (MIPS) fue elaborado por
Theodore Millon en 1994 para evaluar la personalidad desde una perspectiva de
normalidad y no de patología. La prueba busca medir toda la gama del
funcionamiento normal y se basa en el modelo de personalidad desarrollado por
Millon. Se trata de un modelo que es integrador en la medida que propone una
serie de estilos y prototipos que son esencialmente nomotéticos, al cual
incorpora el concepto de polaridad. Añade, asimismo, un rango de subtipos de
personalidad que tiende a ser un estudio más específico o ideográfico. El
instrumento resulta de particular interés dado que su estructura interna da cuenta
del esfuerzo por operativizar una concepción teórica de la personalidad desde
una perspectiva dinámica. En este sentido, el modelo propuesto por Millon
representa a la personalidad como un conjunto de disposiciones en interacción
dinámica que, al combinarse, dan origen a las diversas configuraciones
denominadas estilos de personalidad.
El modelo está representado en la prueba por 24 escalas de personalidad
agrupadas en 12 pares, cada una de las cuales incluye dos escalas yuxtapuestas
que simbolizan las polaridades. Estas se encuentran distribuidas en tres grandes
áreas: metas motivacionales, modos cognitivos y conductas interpersonales.
Asimismo, contiene tres índices de control que son la impresión positiva, la
impresión negativa y la consistencia que se refiere al índice de control de la
sinceridad.
El cuestionario está dirigido a personas con educación secundaria y de más de
18 años. Está compuesto por 180 ítems con afirmaciones de verdadero o falso
que pueden ser respondidas en aproximadamente 30 minutos.
El presente estudio ha tenido como objetivo la adaptación del MIPS a una
población de estudiantes universitarios peruanos.
Los participantes fueron un grupo de estudiantes provenientes de tres facultades
de una universidad privada de Lima (Estudios Generales Letras, Letras y
Ciencias Humanas, y Ciencias e Ingeniería). Se realizó un muestreo al azar
dentro de las facultades a las cuales se les aplicaría la prueba. El grupo final
estuvo conformado por 390 estudiantes universitarios, de los cuales 188 eran
hombres (48.2%) y 202 mujeres (51.8%).
La edad de los estudiantes oscilaba entre los 16 y los 40 años, siendo el
promedio de 20 años.
El instrumento utilizado fue el Inventario de Estilos de Personalidadde Millon -
adaptación peruana. Para poder realizar la adecuación lingüística del MIPS al
castellano hablado en el Perú se llevó a cabo una revisión exhaustiva del

pág. 10
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

contenido del inventario en inglés (Millon, 1994) y sus adaptaciones al castellano


para la población argentina (Millon, 1997) y española (Millon, 2001). Cuatro
profesionales familiarizados con la teoría que sostiene la estructura y el
contenido del instrumento participaron en la elaboración de la primera versión
que sirvió de piloto. Esta versión fue aplicada a un grupo de diez estudiantes
universitarios, solicitándoseles que anotasen aquellos ítems poco claros o frente
a los cuales tuvieran dudas respecto a su significado. Aquellos ítems que
presentaron dificultades fueron analizados nuevamente por el grupo de expertos
y rediseñados de modo que no hubiese discrepancias respecto a sus significados
hasta alcanzar un consenso entre los miembros del equipo de investigación.
Se calcularon las diferencias entre los promedios en cada una de las escalas del
MIPS, entre la muestra universitaria peruana y la muestra norteamericana y
española, contrastando la significación poblacional de estas diferencias a través
de la prueba t de Student. Se incluyó además el análisis del tamaño del efecto
siguiendo las recomendaciones de Cohen (1988) como una medida de la
potencia estadística.
El tamaño del efecto es definido, en el contexto de una prueba de significación,
como el grado en que la hipótesis nula es falsa (Cohen).
Los universitarios norteamericanos tienden a ser más extrovertidos y muestran
una mayor tendencia a apoyarse en los demás como fuente de estimulación y
aliento, mientras que los peruanos están más orientados a acercarse al mundo
y procesar los conocimientos por medio de la lógica y el razonamiento analítico,
basando sus decisiones en juicios impersonales y objetivos y no en emociones
subjetivas. En el área Relaciones Interpersonales, observamos discrepancias en
las escalas de Firmeza y Control. Los peruanos tienden a percibirse como más
competentes y talentosos que quienes los rodean, manifestando seguridad y
confianza en sí mismos (Firmeza) así como un mayor autodominio, alta fuerza
del yo y control sobre los demás en su estilo de relación interpersonal (Control).
Hallamos así diferencias con tamaño de efecto moderados en las tres áreas que
componen el inventario. En el área de Metas Motivacionales, encontramos que
los estudiantes peruanos están más orientados a modificar activamente su
entorno y los sucesos de su vida (Modificación), siendo menos proteccionistas y
preocupándose menos por las necesidades de los demás (Individualismo) que
sus pares españoles. En el área de los Modos Cognitivos, aparecen como más
reflexivos, basando sus decisiones en juicios objetivos más que en emociones
(Reflexión), estando más prontos a modificar y reordenar creativamente
cualquier cosa que signifique un obstáculo y transformar lo dado produciendo
consecuencias nuevas e imprevistas (Innovación).Como estilo de relación
interpersonal, los peruanos tienden a buscar mayor estimulación, excitación y
atención (Comunicatividad), se muestran más confiados y seguros de sí mismos
(Firmeza),están más dispuestos a seguir pautas y normas sociales
(Conformismo),manifiestan un mayor control y autodominio en la relación con los
demás (Control), tendiendo a establecer vínculos afectivos y lealtades muy
fuertes (Concordancia).

pág. 11
ADAPTACIÓN DE TEST A OTRAS CULTURAS | UPLA

Si bien existen versiones en castellano del Inventario de Estilos de Personalidad


de Millon, las investigaciones realizadas en Argentina, España y Perú
demuestran que es necesario adaptar el contenido del mismo al castellano
particular de cada país. En este sentido, encontramos que la adaptación
lingüística realizada cumple con los requisitos necesarios para ser utilizada en
población universitaria peruana.
En cuanto a la confiabilidad promedio del MIPS encontramos que ésta es
semejante a la hallada en la población española y ligeramente inferior a la
registrada por Millon en población norteamericana.
Evaluando las escalas de modo particular, la mayoría presenta niveles de
consistencia interna aceptables; sin embargo, es necesario evaluar con mayor
profundidad el comportamiento del área Modos Cognitivos pues contiene las
escalas con las más bajas confiabilidades. El instrumento presenta validez
interna estructural, lo cual demuestra que las escalas del MIPS están diseñadas
para representar plenamente un conjunto de estilos de personalidad
concordantes con la teoría, multidimensionales e intercorrelacionados.
La comparación con las muestras norteamericana y española indica que existen
mayores diferencias con los universitarios españoles. Resulta de interés
establecer comparaciones con poblaciones con contextos culturales más
cercanos como la argentina, en donde ya se han desarrollado estudios de
adaptación y estandarización del MIPS.
Asimismo, cabe señalar que los participantes de este estudio provienen de una
sola universidad, que tiene características propias y que no necesariamente es
representativa de una población universitaria peruana típica.

pág. 12