Está en la página 1de 6

GUÍA DE CLASE 3: Bases de datos.

Preparación, captura y análisis


generales.
Contenidos mínimos: Preparación y elaboración de la base de datos para el
análisis de la matriz y del corpus textual. Formato de los archivos. Línea
comando. Captura del archivo para su análisis. Análisis del corpus: frecuencias,
lematización, propiedades de palabras. Pestañas de resumen, de formas
activas, de formas suplementarias, pestaña total, pestaña de formas hápax.
1
An

SEMANA Nª 3 (Desde el 15 al 21 de septiembre)

¡Bienvenidos a la 3º Semana del curso! Durante estos días trabajaremos,


fundamentalmente, sobre el armado, preparación y captura del archivo en el
programa. También realizaremos los análisis generales que el IRAMUTEQ nos permite
realizar.

Ya habrán advertido, quienes han instalado el programa y estuvieron explorando,


que el software IRaMuTeQ permite trabajar sobre dos tipos de bases de datos: 1) una
matriz y 2) un corpus textual.

El análisis de la matriz o análisis matricial, tiene por objetivo principal trabajar con
evocaciones de los sujetos (por ejemplo, “palabras asociadas a la política”); esta
modalidad de relevamiento de datos se inserta en el marco de la Teoría de las
Representaciones Sociales, desde una línea estructural (aspectos que los
desarrollaremos específicamente en la última semana). Esta información se prepara
generalmente en una planilla Excel para su posterior procesamiento.

En cambio, el corpus textual puede estar conformado por documentos, artículos


periodísticos, respuestas obtenidas a preguntas abiertas en una entrevista, cartas,
entre otras; se trabaja en Word y luego, esa información se traslada a un bloc de
notas; desde el cual se le puede dar formato de archivo *txt, que es el formato de
archivo que lee el programa.

Sobre cada uno de estos archivos, podremos hacer análisis comunes y análisis
diferenciales. Durante esta semana, nos focalizaremos en las generalidades; en las
semanas subsiguientes, lo haremos con las especificidades de cada una de las bases
de datos. Es decir, en la Semana 4 veremos análisis del corpus y en la Semana 5 los
análisis de matrices.

Las bases de datos requieren ciertas particularidades y decisiones que como


investigadores tendremos que ir tomando a la luz de los objetivos que nos
proponemos en cada uno de nuestros trabajos.
Es muy importante tener en cuenta cómo hemos relevado los datos y, de acuerdo a
ello, serán las posibilidades de análisis. Por ejemplo, el programa nos permite realizar
análisis diferenciales según ciertas variables socio-demográficas para corpus
textuales, pero es condición sine qua non haber relevado esos datos y poder
identificar cada cuerpo textual con los mismos.

El cuidado, la organización y la prolijidad en la construcción de las bases, marcarán


el rumbo de los análisis. Una misma palabra acentuada o no, escrita con mayúscula
o minúscula, una palabra con un pequeño error de tipeo, por ejemplo; será leída por
2
el programa como palabras diferentes.

Otra cuestión, es decidir si palabras sinónimas (por ejemplo, alumnos – estudiantes)


serán unificadas o no. Para ello se recomienda realizar una primera pasada de los
datos para ver cuál es el listado de formas identificadas por el software y allí analizar
y definir qué vamos a considerar como formas activas o formas suplementarias y qué
estatus le daremos a los hápax en ese análisis. Hemos preparado un ejemplo en
donde les mostramos cómo estas decisiones, pueden modificar los resultados.

¡Algunas recomendaciones para la construcción de las bases!


Si bien el programa, antes de procesar, tiene la opción de “limpiar” el texto, es preferible no
usar párrafos, ni itálicas, puntos suspensivos, diminutivos, abreviaciones, símbolos (comillas,
porcentaje, pesos), pasar a minúsculas siglas, se pueden usar números y, para palabras
compuestas usar guion bajo (por ejemplo; buen_alumno)

Abriremos un espacio de foro para que, si surgen dudas en el armado de sus propias
bases, podamos ir despejándola.

Optativa
Actividad: (Es insumo necesario para actividad de
Semana 4)
Modalidad de trabajo: Individual

1. La propuesta que les hacemos es que, a partir de la información brindada por


alguno de los manuales del IRaMuTeQ junto con el material producido a los
fines de esta unidad, preparen las bases de datos para su posterior análisis en
las unidades siguientes. Pueden comentarnos en el foro, cuál es
específicamente el material con el que cuentan (quienes tienen el mismo)
para organizar mejor la disposición de esos datos.

Trabajaremos sobre esas bases que ustedes han armado o bien, si no cuentan
con bases propias; con datos recogidos por nuestros equipos de investigación,
para mostrar el paso a paso del proceso.

Entre las bases de datos sugeridas, encontrarán dos:


❖ Archivo de excel “Representaciones_POLITICA”. Son una serie de palabras que los
adolescentes han evocado ante el termino inductor “política”. Esta base es el
resultado de una investigación que se ha realizado en el año 2015 que tenía como
objetivo indagar las representaciones sociales sobre la política en estudiantes
adolescentes de San Miguel de Tucumán (Cátedra Problemas Sociológicos en
Psicología, Facultad de Psicología de la UNT). Se obtuvo utilizando como
instrumento, el test de evocación jerarquizada; en el marco de la Teoría de las
Representaciones Sociales. Sobre este tema se ahondará en la Semana 5.

❖ Archivo en word “Base de datos cartas”. El segundo corpus, consiste en narrativas


sobre trabajo docente, cartas escritas por maestros/as y profesores/as de todos
los niveles educativos destinadas a un docente extranjero, en las que describen su
quehacer docente. Esta base de datos es resultado de una investigación
realizada en el marco Proyecto: “PIUNT Bienestar – Malestar en torno al trabajo
docente. Aportes para la construcción y validación de un instrumento para su
evaluación (Secretaria de Ciencia, Arte e Innovación Tecnológica de la
Universidad Nacional de Tucumán)”.

¡Importante!
Las bases de datos son resultado de investigaciones que aún se encuentran en proceso de
ejecución y son realizadas por diferentes equipos. Se solicita mantener reserva de las
mismas y que su uso sea limitado a los fines únicamente de este curso.

Instrucciones para el armado de la matriz y del corpus


El procedimiento que se describe a continuación es el procedimiento para las bases
propuestas por nosotros como ejemplo. Si ustedes resuelven trabajar en sus propias
bases, van siguiendo esta secuencia, con sus propios datos.

La descripción de este procedimiento también lo encontrarán en un video tutorial,


ya que entendemos que ese formato puede resultarles más práctico para visualizar
el paso a paso del proceso.
Pasos a seguir para el armado de la matriz a partir del archivo de Excel:
“Representaciones_POLITICA”:

1. Generar un archivo Excel con la extensión correspondiente (Tipo: CSV


delimitado por comas). Guardarlo en una carpeta que destinen para el curso.
2. Agregar una primera columna con la cantidad de casos (1 a N casos). Esa
columna llamarla “casos”.
3. A cada una de las columnas que contienen listas de palabras, agregar en la
4
fila 1 el nombre del encabezado: “palabra 1”, “palabra 2” y así sucesivamente.
Deberían quedar 4 columnas, cada una de ellas con el encabezado “palabra
1”, “palabra 2”, “palabra 3” y “palabra 4”.
4. A la derecha de cada columna de palabras agregar una nueva columna que
definirá el rango, es decir, el orden en que esa palabra fue mencionada por el
sujeto. ¿Cómo proceder? A la izquierda de la columna que contiene la
“palabra 1”, crear una nueva columna y llamarla “rango 1”. Completar todas
las casillas que contengan palabras con el número 1 en la columna “rango 1”.
Proceder de la misma manera con el resto de las columnas.
5. Chequear que todas las palabras estén correctamente escritas. Si son palabras
acentuadas, revisar que estén escritas todas con tilde, también controlar la
uniformidad en la escritura, deben estar todas escritas o con mayúsculas o con
minúsculas. (Este procedimiento también puede realizarse desde el menú
“limpieza”, una vez que abren la base en el programa)
6. Cerrar el archivo.
7. Abrir el programa IRaMuTeQ.
8. En el menú “Archivo”, elegir la opción “Subir una matriz”.
9. Buscar el archivo en la PC a través de la ventana emergente, seleccionarlo y
abrirlo.
10. Tildar en la ventana emergente que “la primera columna es un encabezado”
y que “la primera columna es un identificador”.
11. ¡Importante! En el caso de las matrices, dejar la codificación que sale por
defecto: “cp1252 – Western Europe” (No cambiar a UTF-8 all Lenguages”.
12. Dar “OK” y una vez que cuenten con la base cargada en el sistema realizar
una captura de pantalla.

Pasos a seguir para el armado del corpus a partir del archivo de word: “Base de datos
cartas”.

1. Abrir el archivo de Word y hacer una primera lectura del material, recordando
que es importante limpiar expresiones no relevantes para el análisis posterior
como, por ejemplo: “estimado colega”, “querido docente”, “me despido
atentamente”; salvo que se vayan a analizar de manera específica los estilos
de introducción y saludo en una carta entre docentes. Así mismo, no usar
marcadores de párrafos, ni itálicas, como así tampoco puntos suspensivos,
diminutivos, abreviaciones, símbolos -comillas, porcentaje, pesos-. Pasar a
minúsculas las siglas. Se pueden usar números. Para generar las palabras
compuestas, usar guion bajo (por ejemplo, “buen_docente”). Pueden
considerar reemplazar y unificar palabras que ustedes entiendan como
sinónimo (por ejemplo, alumno por estudiante)
5
2. Una vez revisado el material, crear la línea de comando, considerando las
variables relevadas. En el caso de la base con la que trabajaremos
consideraremos las variables: edad, sexo, institución, antigüedad y provincia.
Si trabajan con sus bases, deberán generar la línea de comando conforme a
las variables por ustedes relevadas (esto es muy importante si quieren
considerar estudios diferenciales según variables).

Ejemplo de línea de comando de la carta Nº 1:

**** *cart_01 *ed_1 *sex_2 *inst_1 *ant_1 *prov_1

¡Importante!
Entre los materiales de esta semana encontrarán tutoriales con
instrucciones para crear las líneas de comando.

3. Debajo de cada línea de comando, añadir el texto de la carta


correspondiente.
4. Guardar el archivo y abrir un bloc de notas.
5. En el bloc de notas, copiar la información producida en el archivo con formato
word y guardar con la extensión correspondiente (Codificación UTF-8).
6. Guardar el archivo en una carpeta que destinen para el curso.
7. Abrir el programa IRaMuTeQ.
8. En el menú “Archivo”, elegir la opción “abrir un corpus textual”.
9. Definir los parámetros necesarios (lenguaje y codificación) y ejecutar el
programa.
10. Realizar una captura de pantalla con la información brindada.
11. En un archivo de word describir brevemente la información obtenida en el
cuadro emergente.
12. Ingresar al menú de formas activas, por ejemplo, seleccionar una ocurrencia
hacer clic con el botón derecho del mouse y ver en qué contexto aparece
esa palabra (concordancia) y cuáles son las formas asociadas a esa palabra.
13. Pararse en los hápax y revisar en qué contexto fue mencionado.
14. Hacer el ejercicio y pensar cuál será la utilidad de estos dos últimos
procedimientos que mencionamos, es decir ¿para qué serviría hacerlo?.

¿Qué deberán enviar como evidencia?


➢ Un archivo en formato Word con las capturas de pantalla de la lectura de la
matriz y del corpus textual.
➢ Además, hacer una revisión del archivo del corpus textual sobre las formas
activas, suplementarias, hápax… y describir qué decisiones tomarían para
modificar o continuar limpiando la base de datos a la luz de esta primera
lectura.
Bibliografía Obligatoria

¡Importante! 6
Revisar ya que varios de los materiales sugeridos ya han sido descargados en la Unidad N° 1

Video Tutorial: Armado de matrices para su posterior lectura en el software IRaMuTeQ. (2019). Disponible
en: https://youtu.be/y_PYqUBc4kE
Video Tutorial: ¿Cómo generar líneas de comando para el procesamiento de Corpus Textuales?. (2019).
Disponible en: https://youtu.be/t-rkMtYG7Qg
Video Explicativo: Creación de corpus de textos y exploración de sus formas (Activas, suplementarias,
hápax). (2019). Disponible en: https://youtu.be/3n_BLqazDcU
Molina Neira, J. (2017). Tutorial para el análisis de textos con el software IRAMUTEQ. Recuperado a partir
de
https://www.researchgate.net/publication/315696508_Tutorial_para_el_analisis_de_textos_con_
el_software_IRAMUTEQ
Tutorial en donde se explica el modo de descargar el programa, se introducen conceptos básicos a
tener en cuenta (corpus, textos, ocurrencias, hápax). Tipos de análisis que permite realizar el software.
Se explica el modo de generar las bases de datos para su posterior análisis, entre otras cuestiones.

Ruiz Bueno, A. (2017). Trabajar con Iramuteq: Pautas. Recuperado de


http://diposit.ub.edu/dspace/handle/2445/113063
Un manual similar al anterior, en donde se trabajan las mismas cuestiones (instalación del software,
preparación de los corpus textuales, tipos de análisis, etc.), pero además introduce elementos
conceptuales sobre el sustrato estadístico de los diversos análisis que se pueden llevar a cabo con
dicho software.

Cómo citar este material:


Carreras, P.; Bossolasco, M. y Dos Santos, D. (2019). Guía de Clase 3: Bases de datos. Preparación, captura y análisis
generales. Curso Introductorio al Programa IRAMUTEQ para el análisis de datos cualitativos. Facultad de
Ciencias Naturales e IML. Universidad Nacional de Tucumán.

Licencia: El texto “Guía de Clase 3: Bases de datos. Preparación, capturas y análisis generales.” se
encuentra bajo licencia Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0
Internacional

También podría gustarte