Está en la página 1de 5

GUÍA DE CLASE 4: Análisis del corpus textual con IRaMuTeQ

Contenidos mínimos: Tipos de análisis: Método Reinert (CDH), Análisis de


similitud (ADS) y Nube de palabras. Interpretación y lectura de los resultados.

SEMANA Nª 4 (Desde el 22/09 al 28/09) 1

Durante la Semana 4 nos abocaremos específicamente al análisis del Corpus


Textual. Recuerden que nos referimos con el término corpus al conjunto de textos
que se han introducido al programa para que éste los procese, siguiendo una serie
de criterios y con un fin determinado.

¿Qué tipo de análisis nos permite realizar el programa, en base al corpus? Además
de las estadísticas de los textos o lexicografía básica que hemos realizado en la
unidad 3, nos permite hacer tres tipos de análisis diferentes. Ellos son:

- Análisis de especificidades: Mediante este análisis se crea una tabla de


contingencia entre formas (los términos presentes) y modalidades de la
variable seleccionada. Permite identificar frecuencias atípicas de uso de
ciertas formas a lo largo de las distintas modalidades de la variable nominal
sometida a indagación. Por atípico se entiende una frecuencia de
asociación muy distinta de lo esperado por simple contingencia azarosa. El
desvío respecto de lo esperado bajo el supuesto de independencia (o no
asociación) entre formas y modalidades, puede ser por sobre-uso de una
forma dentro de una modalidad, o por oposición, déficit u omisión. El cálculo
del coeficiente de especificidad surge del logaritmo base 10 de la
probabilidad hipergeométrica de observar una forma f veces dentro de una
modalidad que posee t ocurrencias de formas y en un contexto global de
corpus donde la forma diana es mencionada F veces en su totalidad y el
número total de ocurrencias asciende al gran total de T conteos. Como se
puede comprobar, también aparece “El signo +” el cual significa que la
forma se menciona más en ese grupo de la variable categorial que los otros.
Del mismo modo, “El signo – “, implica que esa forma se utiliza menos en ese
grupo que en los restantes. Tras demandar a IRaMuTeQ este análisis,
cliqueando sobre el ícono respectivo, se generan múltiples pestañas, para
destacar: (i) las tablas de especificidades por forma y tipo, (ii) las tablas de
frecuencia absoluta y relativa también de formas y tipos. La frecuencia
relativa es dada en tantos por mil. Para más detalles, consultar el trabajo
detallado de Lafon (1980).

- Análisis factorial de correspondencia (AFC): Tras solicitar el análisis de


especificidades, al mismo tiempo se implementa un AFC cuyo gráfico se
despliega en la pestaña homónima. El análisis de correspondencias es una
técnica gráfica multivariada diseñada para explorar las relaciones entre
variables categóricas (Benzécri & Coll, 1973; Greenacre, 1984). El resultado de
este tipo de análisis es una representación gráfica de las filas y columnas de
una tabla de contingencia. Permite la visualización de las relaciones salientes
entre los niveles de las variables estudiadas en un espacio de baja
dimensionalidad, típicamente bidimensional. Tal representación revela un
panorama más global de las relaciones de similitud entre los perfiles de
frecuencias relativas de los pares de columnas (y también, entre los pares de
filas) que no sería detectable de otra forma mediante una mera 2
comparación apareada entre perfiles por separado. Cuando se inspecciona
la distribución de los puntos en un plano factorial, debe tenerse en cuenta lo
siguiente: 1) si la distancia de separación entre puntos (filas o columnas) es
corta, entonces sus perfiles de frecuencias relativas son similares y ameritan
ser agrupadas en una misma clase (de formas o modalidades), 2) cuanto
más se acerque un punto de observación al origen del sistema de ejes del
gráfico AFC, mayor será el parecido de su perfil de frecuencias relativas con
respecto al perfil promedio global de todos los datos (o sea, al perfil
correspondiente a los totales marginales), y 3) lo importante es ver la
separación de los puntos (filas y columnas, por separado) hacia los dominios
opuestos de los ejes (o sea, hacia el lado positivo o negativo), e indagar la
mutua “correspondencia” entre los patrones de segregación. Cuando se
analizan textos dentro de un corpus, esto último significa poder identificar
conjuntos de palabras empleadas en escenarios contextuales diferentes y
ligarlas con aquellas modalidades de una variable con las cuales se asocian.

- Método Reinert: El Método de Clasificación Jerárquica Descendiente (CDH),


parte de la premisa de que las palabras no son independientes unas de otras,
sino que reflejan temas subyacentes. La tesis principal de Reinert (1987, 1998,
2003) es que todo discurso se expresa a partir de un conjunto de palabras
que constituyen unidades de significado de manera independiente a su
construcción sintáctica. Estas unidades de significado evocan una forma de
pensar sobre el objeto del que se habla, un campo de pensamiento, pues es
a partir de ellas que los enunciados adquieren sentido. La redundancia de
sucesiones de palabras, o la concatenación de palabras que componen un
discurso determinado, permite localizar los “mundos lexicales” evocados por
los enunciadores.

- Análisis de similitud (ADS): El ADS contempla el corpus de una manera


completamente diferente a la CDH. El enfoque se basa en las propiedades
de conexión del corpus completo, sin tener en cuenta las Unidades de
Contexto Específicas, ni los sujetos. Este tipo de análisis considera que a
mayor número de sujetos trate dos elementos de la misma manera, éstos
serán más próximos en la estructura representacional sobre el objeto al que
se refieren. Para ello, identifica las coocurrencias entre las palabras según sus
conexiones en el texto, ayudando a identificar la estructura del contenido del
corpus textual gracias a su visualización en forma de gráfico (Ratinaud &
Marchand, 2012). Por tanto, el análisis permite definir la identidad de los
núcleos representacionales de los sujetos, ya que el programa identifica
núcleos semánticos detectados por coocurrencias de palabras (Camargo &
Justo, 2013).

- Nube de palabras: Agrupa las palabras y las organiza gráficamente en


función de su frecuencia. Es un análisis lexical simple, interesante y atrayente
a nivel gráfico.

Los gráficos arrojados y los resultados obtenidos sólo tienen sentido a la luz de las
interpretaciones y lecturas que sobre ellos realicemos, con lo cual es muy 3
importante contextualizarlos y determinar a qué objetivos responden.

Actividad: Obligatoria

Modalidad de trabajo: Individual

1. A partir de la tarea realizada en la Semana 3, ya cuentan con el material


preparado y listo para su análisis (sus propias bases o la base propuesta por el
equipo, en este caso particular, la de narrativa docente). Recuerden revisar
nuevamente el corpus para evitar que contenga algunos elementos que
puedan arrojar resultados no deseados o que impida al programa una
lectura poco clara.

No olvidar: corregir errores tipográficos, suprimir el material textual producido


por el investigador, como por ejemplo las preguntas realizadas en el marco
de una entrevista, no justificar el texto; no resaltar ninguna palabra con
negritas, cursiva, subrayado o similar; no utilizar caracteres especiales, como
comillas, apóstrofes, símbolos y asteriscos dentro del texto, entre otras.

Una vez revisado y, siguiendo los pasos sugeridos en el material bibliográfico


disponible (Molina Neira, 2017), realice los análisis mencionados
anteriormente: 1) Análisis de especificidad, 2) Análisis AFC, 3) Método Reinert,
4) Análisis de Similitud y 5) Nube de palabras. Realice todos ellos, o los que el
software le permita procesar, en función de su corpus textual.

Para quienes se animan y, han armado los corpus con diversas variables,
modalidades o temáticas, pueden ensayar análisis diferenciales con sub-
corpus de textos. Quienes han trabajado sobre la base de las narrativas
docentes, ya lo tienen. Podrían considerar en análisis según diversas variables
socio-demográficas; por ejemplo, antigüedad, sexo, institución, provincia.

¡Importante!
El software IRaMuTeQ trabaja mejor cuando contamos con la mayor cantidad de
información posible. Principalmente, el método Reinert requiere de un corpus importante de
datos para que pueda efectuarse este análisis.
¿Qué deberán enviar como evidencia?
➢ En un archivo en formato Word deben compartir: la explicitación de un
objetivo que ustedes consideran ha movilizado recabar los datos existentes y,
en función del mismo, arrojar posibles lecturas sobre los resultados obtenidos.
La presentación debe contar con los gráficos pertinentes para cada tipo de
análisis, cada uno con su título correspondiente y, a continuación, su
interpretación. 4

➢ Nombrar dicho archivo de la siguiente manera: “Apellido_nombre_semana 4_IRaMuTeQ”


Bibliografía Obligatoria

¡Importante!
Los texto sugeridos ya han sido descargados en la Unidad N° 1

Dos Santos, D. (2019). Análisis de especificidades con software IRaMuTeQ. Recuperado de:
https://youtu.be/kWcyMDjKzAY
Dos Santos, D. (2019). Análisis factorial de correspondencia (AFC) con software IRaMuTeQ. Recuperado
de: https://youtu.be/EmRS1W-XaLk
Dos Santos, D. (2019). Análisis de similitud y red de co-ocurrencias con software IRaMuTeQ. Recuperado
de: https://youtu.be/FR2ZaozNDho
Dos Santos, D. (2019). Clasificación Jerárquica Descendente con software IRaMuTeQ. Recuperado de:
https://youtu.be/pt9dSeqEpGs
Molina Neira, J. (2017). Tutorial para el análisis de textos con el software IRAMUTEQ. Recuperado a partir
de
https://www.researchgate.net/publication/315696508_Tutorial_para_el_analisis_de_textos_con_
el_software_IRAMUTEQ
Tutorial en donde se explica el modo de descargar el programa, se introducen conceptos
básicos a tener en cuenta (corpus, textos, ocurrencias, hápax). Tipos de análisis que
permite realizar el software. Se explica el modo de generar las bases de datos para su
posterior análisis, entre otras cuestiones.
Ruiz Bueno, A. (2017). Trabajar con Iramuteq: Pautas. Recuperado a partir de
http://diposit.ub.edu/dspace/handle/2445/113063
Un manual similar al anterior, en donde se trabajan las mismas cuestiones (instalación del
software, preparación de los corpus textuales, tipos de análisis, etc.), pero además
introduce elementos conceptuales sobre el sustrato estadístico de los diversos análisis que
se pueden llevar a cabo con dicho software.

Referencias Bibliográficas de la Clase:


Benzécri, J.P. & Coll. (1973). L'analyse des données. II L'analyse des correspondances, Bordas, Paris. 1–
620.
Camargo, B. V., y Justo, A. M. (2013). IRAMUTEQ: un software libre para el análisis de datos textuales.
Temas em Psicologia, 21(2), 513-518. http://dx.doi.org/10.9788/TP2013.2-16
Greenacre, M. J. (1984). Theory and applications of correspondence analysis, Academic Press, London.
Lafon P. (1980) Sur la variabilit\'e de la fr\'e quence des formes dans un corpus, Mots, 1, pp. 127–165.
http://www.persee.fr/web/revues/home/prescript/article/mots_0243-6450_1980_num_1_1_1008
Ratinaud, P., & Marchand, P. (2012). Application de la méthode ALCESTE à de “gros” corpus et stabilité
des “mondes lexicaux” : analyse du “CableGate” avec IraMuTeQ. En: Actes des 11eme
Journées internationales d’Analyse statistique des Données Textuelles (835–844). JADT 2012.
Recuperado de: http://lexicometrica.univ-
paris3.fr/jadt/jadt2012/Communications/Ratinaud,%20Pierre%20et%20al.%20-
%20Application%20de%20la%20methode%20Alceste.pdf
Reinert, M. (1987). Système A.L.C.E.S.T.E.: une méthodologie d'analyse des données textuelles présentée
à l'aide d'une application. Université de Toulouse-Le Mirail. Recuperado de:
https://docplayer.fr/163661569-Systeme-a-l-c-e-s-t-e-une-methodologie-d-analyse-des-
donnees-textuelles-presentee-a-l-aide-d-une-application.html
Reinert, M. (1998). Quel objet pour une analyse statistique du discours ? Quelques réflexions à propos de 5
la réponse Alceste. Université de Toulouse-Le Mirail. Recuperado de: http://lexicometrica.univ-
paris3.fr/jadt/jadt1998/reinert.htm
Reinert, M. (2003). La Méthode informatisée d’analyse de discours «Alceste». Application aux Rêveries
du promeneur solitaire. Centre national de la recherche scientifique. Université de Versailles.

Cómo citar este material:


Carreras, P.; Dos Santos, D.; Torres Stöckl, C. y Bossolasco, M. (2020). Guía de Clase 4: Análisis del Corpus Textual con
IRaMuTeQ. Curso IRaMuTeQ. Un software para el análisis estadístico de corpus textuales cualitativos.
Facultad de Ciencias Naturales e IML. Universidad Nacional de Tucumán.

El texto “Guía de Clase 4: Análisis del Corpus Textual con IRaMuTeQ.” se encuentra bajo
Licencia:
licencia Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0
Internacional

También podría gustarte