Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin
El presente trabajo se enmarca dentro del curso Produccin y Tratamiento de Datos en
Investigacin, perteneciente al Doctorado en Desarrollo Territorial (UNRC1) y tiene por
finalidad ser una primera aproximacin al anlisis de los datos obtenidos en una encuesta online
realizada a los estudiantes que cursaron la asignatura Anlisis Matemtico I (AMI) durante el
primer cuatrimestre del ao 2016 en la Facultad de Ciencias Econmicas (FCE) de la UNRC. La
misma, ha sido diseada e implementada por los miembros del proyecto de investigacin, titulado:
Anlisis de los factores asociados a la desercin y de las estrategias institucionales que
promueven la permanencia en las asignaturas del rea matemtica en el primer ao de los tres
planes de estudio de la FCE. Si bien esta Unidad Acadmica cuenta con investigaciones
desarrolladas que hacen referencia a esta problemtica, se espera que el anlisis estadstico
permita conocer e identificar las caractersticas que definen a los estudiantes para que en etapas
posteriores se pueda determinar las causas que impactan negativamente en su permanencia,
contribuyendo as a definir polticas y acciones encaminadas a solucionar los problemas de
desercin en pos de la retencin estudiantil y la calidad educativa.
Palabras Claves
Estudiantes AMI AFCM Clasificacin Factores.
Objetivo General
Como objetivo general del presente trabajo se plantea el siguiente:
1. Identificar aquellas variables que caracterizan a los estudiantes de la asignatura AMI en el
primer cuatrimestre del ao 2016 de la FCE de la UNRC, a travs de un anlisis
exploratorio multivariado, realizando un Anlisis Factorial de Correspondencias Mltiples
(AFCM) y diferentes procedimientos de Anlisis de Conglomerados (Clasificacin).
Objetivos especficos
Como objetivos especficos del presente trabajo se plantean los siguientes:
1. Seleccionar las variables incluidas dentro de los factores individuales, acadmicos,
institucionales y socioculturales, definidos en la encuesta online, que permitan caracterizar
a la poblacin bajo estudio.
1
Universidad Nacional de Ro Cuarto.
1
Produccin y Tratamiento de Datos en Investigacin
Metodologa
En el proyecto prev utilizar un enfoque mixto para recolectar, analizar y vincular datos
cuantitativos y cualitativos, a travs de cuestionarios semi-estructurados, revisin documental,
entrevistas en profundidad y observacin participante y no participante, mientras que el enfoque
metodolgico optado en este trabajo es el llamado estudio de caso cuantitativo. Mertens (2005
en Hernndez, Fernndez y Baptista, 2008) define al estudio de caso como una investigacin
sobre un individuo, grupo, organizacin, comunidad o sociedad; que es visto y analizado como
una entidad y el enfoque cuantitativo tiene, entre otros, por objetivo usar la recoleccin de datos
para establecer patrones de comportamiento. En nuestro caso, se trata de los estudiantes de AMI,
correspondientes al primer cuatrimestre de 2016, en las dos modalidades de cursado, presencial
y educacin a distancia (EaD).
2
Produccin y Tratamiento de Datos en Investigacin
Transversal. Se miden una sola vez las caractersticas de uno o ms grupos de unidades en
un momento dado, sin pretender evaluar la evolucin de esas unidades, esto es, no se mantiene la
identidad de cada unidad observacional, que es lo que se ha hecho en este caso. Ahora bien, si las
variables se midieran en ms de una ocasin en cada unidad observacional, si se hara seguimiento
y mantendra la identidad de los elementos, se tratara de un estudio longitudinal.
De acuerdo con la comparacin de las poblaciones, el estudio es:
Descriptivo. Estudio que slo cuenta con una poblacin, la cual se pretende describir en
funcin de un grupo de variables y respecto de la cual no existen hiptesis centrales. Quiz se
tiene un grupo de hiptesis que se refieran a la bsqueda sistemtica de asociaciones entre varias
variables dentro de la misma poblacin. Aqu, dado que se describen caractersticas, se calculan
frecuencias, se buscan asociaciones entre las variables de la poblacin en estudio, resulta
Descriptivo.
De acuerdo con la interferencia o control del investigador en el fenmeno que se
analiza, el estudio es:
Observacional. El investigador slo puede describir o medir el fenmeno estudiado; por
tanto, no puede modificar a voluntad propia ninguno de los factores que intervienen en el proceso.
En este caso, como no se controlan, ni manipulan las variables de estudio, sino que stas se dan
independientes de la voluntad del investigador, se trata de un estudio observacional sobre la
poblacin objetivo.
Poblacin Objetivo
La poblacin objetivo la constituyen 667 estudiantes inscriptos en la asignatura Anlisis
Matemtico I, durante este primer cuatrimestre de 2016, en la modalidad presencial y EaD,
correspondiente al Ciclo Bsico de las tres carreras que se dictan en la FCE.
3
Produccin y Tratamiento de Datos en Investigacin
Procedimiento
Se analizaron las clasificaciones ofrecidas por los autores arriba mencionados, con las
categoras y variables, para luego seleccionar las propias y elaborar las preguntas a ser incluidas
en la encuesta online. Los cuatro grupos de factores presentados por dichos autores, coinciden
con los que se van a considerar como determinantes de la desercin dentro del presente proyecto.
Posteriormente, se consideraron las siguientes operaciones: Se prepararon las preguntas y
posibles respuestas en funcin de las variables y categoras a estudiar. Se analiz el tiempo,
espacio y poblacin a encuestar para definir el instrumento a utilizar, su formato y aplicacin.
De esta manera, se procedi a la recopilacin de informacin primaria utilizando como
instrumento de medicin un cuestionario, que contiene preguntas cerradas para lograr la
estandarizacin de la informacin y algunas preguntas abiertas que sern cuantificadas en anlisis
posteriores. Antes de aplicar este cuestionario, para poder utilizar la modalidad online como canal
de respuesta, se lo llev a formato electrnico, de esta manera, es el encuestado quien responde
el cuestionario sin ayuda de un encuestador.
Lic. En Economa.
Presencial.
Modalidad Modalidad
Distancia.
Maana.
Tarde.
Horario de Cursado Horario de Cursado
Soy alumno de la modalidad de
educacin a distancia.
[18-20]
[21-25]
Edad [26-35] Edad
[36-45]
Mayor de 45
Masculino.
Gnero Gnero
Femenino.
Soltero
Estado Civil Casado o Conviviente Estado Civil
Viudo o Divorciado
S.
Tienes Hijos Hijos
No.
2
Cada alumno fue identificado con el nmero de documento de identidad. Pero esta variable
nicamente se utiliz para realizar correcciones a las respuestas obtenidas y no ser expuesta en
los resultados finales.
4
Produccin y Tratamiento de Datos en Investigacin
Factores Personales
Departamento Ro Cuarto
Otros Departamentos de
Lugar Del Que
Crdoba Lugar del que Provienes
Provienes
Procedencia y tipo de vivienda La Pampa - Santa Fe - San Luis
Resto del Pas
Con integrantes de tu familia.
Slo.
Con Quin Vives? Con quin Vives?
Con otras personas incluido
Vivienda
otros estudiantes
Alquilada
Propia
Tipo De Vivienda Residencia Universitaria / Otro Tipo de Vivienda
tipo de vivienda (Prestada o
compartida sin gastos)
Soy alumno de la modalidad de Minutos Para Llegar a la
Cuntos minutos
educacin a distancia. UNRC
tardos para llegar a la
Menos de 20 Minutos.
Universidad,
Entre 20 y 40.
diariamente?
Ms de 40 minutos.
Has padecido de algn
infortunio familiar o
Infortunios
Familiares
alguna enfermedad
S.
personal que haya Infortunio Familiar
No.
influido en tus estudios,
durante el cursado de la
asignatura?
Factores Acadmicos
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
Tipo de Colegio del que Pblico.
Tipo de Colegio
provienes Privado.
Econmica.
Escuela Secundaria
Cunto tiempo ha
Menos de 5 aos.
transcurrido desde que Aos desde Egreso
De 5 a 10 aos.
egresaste del colegio Secundario
Ms de 10 aos.
secundario?
5
Produccin y Tratamiento de Datos en Investigacin
Factores Acadmicos
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
Terico (Cabrera) - Prctico docentes de modalidad
(Lardone) de educacin a distancia).
Tutora Cassano
Tutora Curti
Tutora Lardone
Tutora Mussolini
Tutora Scattolini
Condicin Final
(La condicin libre
Qu condicin Promocin. incluye a todos los
alcanzaste en la Regular. alumnos que quedaron
materia? Libre. libre por faltas, libre por
parcial y libre nunca ha
empezado).
Cuntas horas Menos de 4 horas semanales.
dedicaste al estudio de Entre 4 y 6 horas semanales. Horas de Estudio
esta materia? Ms de 6 horas semanales.
Entre todos los das de la
Las horas semanales de semana. Distribucin de Horas de
estudio son distribuidas: Algunos das de la semana. Estudio
Slo los sbados y domingos.
Cuando el docente de Cuando el docente de
Casi nada.
Anlisis Matemtico Anlisis Matemtico
Slo algunas cosas.
explica una temtica, explica una temtica,
Casi todo.
entiendes entiendes.
Asistes a Profesores
Particulares para que te S
Profesores Particulares
expliquen alguna No
temtica de la materia?
Asistes a clase de S
Clase de Consulta
consulta? No
Ingresas semanalmente
S
al aula virtual disponible Ingreso Semanal al SIAT
No
en la plataforma SIAT?
La variable TIC ha sido
creada considerando un
total de 11 preguntas
relativas al uso de las
Cmo calificaras tu Tecnologas de
nivel de dominio de las Informacin y
TIC3 y de soportes Alto Comunicacin, cada una
multimedios (imgenes, Medio de ellas con 4 categoras
audios, videos) Bajo (Alto, Medio, Bajo y
aplicadas a la Nulo Nulo). Para cada
educacin? (Variable individuo se cuenta la
resumen) cantidad de veces que ha
seleccionado cada
categora y se le asigna la
categora que ms veces
se ha repetido4.
Factores Socio-econmicos
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
S
Trabajas?
Dependen
Trabajas?
No
cia
3
Tecnologas de la Informacin y Comunicacin.
4
Se observa que ningn individuo ha contestado dos modalidades la misma cantidad de veces, por lo
que no es necesario tomar una metodologa a aplicar en caso de empate entre categoras.
6
Produccin y Tratamiento de Datos en Investigacin
Factores Socio-econmicos
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
posibilidad de que Vestimenta;
puedas estudiar o5 no? Apuntes;
Otros Gastos
Tienes beca S
Beca Universitaria.
Universitaria? No
Menos de $10.000
En qu intervalo de
$10.001 $20.000
ingresos totales
$20.001 $40.000 Ingresos Familiares.
mensuales, se encuentra
$40.001 $60.000
tu familia?
Ms de $60.000
Primario Incompleto
Primario Completo con
Tu padre que nivel Secundario incompleto
Nivel Mximo de Estudio
mximo de estudios Secundario Completo con
Padre.
Estudios Padres
o es propietario?
Relacin de dependencia
Tu madre trabaja en Mi padre no trabaja Tu madre trabaja en
relacin de dependencia Propietario relacin de dependencia
o es propietario? Relacin de dependencia o es propietaria?
Factores Institucionales
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
Participas en
actividades deportivas, S Deporte o Actividades
culturales u otras dentro No Culturales en UNRC
Relacin con
compaeros
de la Universidad?
Participas en el centro
S
de estudiantes de la Centro de Estudiantes
No
facultad?
Tienes grupos de S
Grupo de Estudio
estudios? No
La Facultad o la
Universidad te ha
Oferta Institucional
S
brindado la suficiente Rgimen De Alumnos
No
informacin respecto al
rgimen de alumnos
La Facultad o la
Universidad te ha
S
brindado la suficiente Rgimen De Becas
No
informacin respecto al
rgimen de becas
Tabla N1: Factores y Variables considerados para el anlisis
5
Sistema Informtico de Apoyo a la Teleformacin desarrollado desde hace 13 aos por el Programa
Informtica Regin Centro (IRC), dependiente de la Secretara de Extensin y Desarrollo de la UNRC. El
SIAT constituye la plataforma de educacin a distancia de la FCE.
7
Produccin y Tratamiento de Datos en Investigacin
6
Sistema Integral de Alumnos (SIAL): la versin para web del SIAL permite que los estudiantes se inscriban
por esta va para rendir y para cursar sus materias, y que realicen varias consultas sobre sus datos
personales y acadmicos. Los docentes, por su parte, pueden asignar la condicin a sus estudiantes,
consultar los tribunales de examen en que se encuentran, consultar los estudiantes inscriptos para cursar
y para rendir las materias en que son responsables, subir materiales, anuncios.
8
Produccin y Tratamiento de Datos en Investigacin
9
Produccin y Tratamiento de Datos en Investigacin
Tu padre
Anos desde Asistes a
Alumno Beca Centro de trabaja en
Egreso clase de CARRERA TIC
Recursante Universitaria Estudiantes relacin de
Secundario consulta
dependencia
Asistes a
No Se No No No No
clase de Significativa Significativa Significativa
Compara Significativa Significativa Significativa Significativa
consulta
Beca No No No No Se No No No No
Universitaria Significativa Significativa Significativa Compara Significativa Significativa Significativa Significativa
No No No No No Se No No No
CARRERA
Significativa Significativa Significativa Significativa Compara Significativa Significativa Significativa
Centro de No No No No No No Se No No
Estudiantes Significativa Significativa Significativa Significativa Significativa Compara Significativa Significativa
No No No No No No No Se No
TIC
Significativa Significativa Significativa Significativa Significativa Significativa Compara Significativa
Tu padre
trabaja en No No No No No No Se
Significativa Significativa
relacin de Significativa Significativa Significativa Significativa Significativa Compara
dependencia
Tabla N2: Test Chi-Cuadrado para el Conjunto de Variables Objeto de Estudio
De comprobar la cantidad de veces que cada variable ha resultado significativa, en al menos
una de las pruebas realizadas, se detecta que las variables Centro de Estudiantes y TIC son
independientes del resto de las variables (siempre ha dado no significativa la comparacin). Por
tal motivo se decide eliminarlas como variables activas a ser utilizadas en el Anlisis Factorial de
Correspondencias Mltiples 7.
7
Primer conjunto de variables ilustrativas: Centro de estudiantes y TIC.
8
R es un entorno de software libre para computacin y grficos estadsticos. Compila y ejecuta en una
amplia variedad de plataformas como UNIX, Windows y MacOS.
9
Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez L., Tablada M., Robledo C.W. InfoStat versin 2016.
Grupo InfoStat, FCA, Universidad Nacional de Crdoba, Argentina. URL http://www.infostat.com.ar
10
Produccin y Tratamiento de Datos en Investigacin
Puede observarse que, a partir de la tercera dimensin, hay una cada de la capacidad
predictiva, es por ello que se decide trabajar en primera instancia con los primeros 3 ejes
factoriales.
Luego, se realiza la representacin grfica del % de varianza acumulada para los ejes
factoriales (Fig. 2).
11
Produccin y Tratamiento de Datos en Investigacin
Fig. 2.: Representacin grfica del % de varianza acumulado para los ejes factoriales
10
Aunque en el proceso de reduccin de variables no se hubiera realizado el Test de Independencia de
Chi Cuadrado, igualmente las variables Centro de Estudiantes y TIC hubieran sido eliminadas en la
primera reduccin (Reduccin 1)
12
Produccin y Tratamiento de Datos en Investigacin
Las variables ms relevantes para el primer eje factorial son Modalidad (Contribucin
12,02), Horario de Cursado (12,03), Edad (11,02), Minutos Para llegar a la UNRC (12,02),
Aos Desde Egreso Secundario (10,71) y Docente (12,16). Estas variables son las que ms
peso ejercen sobre el primer eje factorial y es donde se concentra la mayor cantidad de inercia.
Las variables ms relevantes para el segundo eje factorial son Horario de Cursado
(14,63), Con Quin Vives? (13,20), Tipo de Vivienda (18,50), Gastos de Mayor
Relevancia (19,83) y nuevamente aparece la variable Docente (16,85).
13
Produccin y Tratamiento de Datos en Investigacin
Distancia 2,8024 1,7449 1,26 -0,01 -0,14 -0,10 -0,09 7,64 0,00 0,37 0,22 0,20 0,91 0,00 0,01 0,01 0,01
Presencial 4,8899 0,5731 -0,72 0,01 0,08 0,06 0,05 4,38 0,00 0,21 0,12 0,11 0,91 0,00 0,01 0,01 0,01
Maana 2,4307 2,1647 -0,75 -0,79 0,46 -0,77 0,19 2,33 7,23 3,20 10,47 0,68 0,26 0,29 0,10 0,28 0,02
Horario de
Soy alumno de
Cursado
la modalidad
2,8024 1,7449 1,26 -0,01 -0,14 -0,10 -0,09 7,64 0,00 0,37 0,22 0,20 0,91 0,00 0,01 0,01 0,01
de educacin a
distancia
Tarde 2,4593 2,1279 -0,70 0,80 -0,29 0,88 -0,08 2,06 7,40 1,27 13,79 0,12 0,23 0,30 0,04 0,37 0,00
[18-20] 4,9471 0,5549 -0,64 -0,02 0,13 0,03 0,03 3,43 0,01 0,52 0,03 0,03 0,73 0,00 0,03 0,00 0,00
[21-25] 0,9151 7,4062 0,39 -0,19 -1,45 0,06 -0,34 0,24 0,15 12,23 0,02 0,82 0,02 0,01 0,28 0,00 0,02
Edad
[26-35] 1,3154 4,8478 1,45 0,21 -0,28 -0,61 -0,10 4,72 0,27 0,66 3,58 0,10 0,43 0,01 0,02 0,08 0,00
[36-45] 0,2574 28,8889 1,60 -0,13 1,49 0,57 0,21 1,12 0,02 3,62 0,60 0,09 0,09 0,00 0,08 0,01 0,00
Mayor de 45 0,2574 28,8889 1,85 0,02 2,63 1,84 0,99 1,51 0,00 11,32 6,31 1,98 0,12 0,00 0,24 0,12 0,03
Casado o
Hijos Estado Civil
1,2868 4,9778 1,56 0,17 0,14 -0,26 0,06 5,33 0,18 0,16 0,64 0,04 0,49 0,01 0,00 0,01 0,00
Conviviente
Soltero 6,2911 0,2227 -0,35 -0,03 -0,09 0,00 -0,05 1,33 0,02 0,30 0,00 0,14 0,55 0,00 0,03 0,00 0,01
Viudo o
0,1144 66,25 1,84 -0,36 3,20 2,96 2,21 0,66 0,07 7,48 7,24 4,38 0,05 0,00 0,16 0,13 0,07
Divorciado
No 6,4055 0,2009 -0,32 -0,01 -0,17 -0,06 -0,03 1,09 0,01 1,17 0,18 0,04 0,49 0,00 0,14 0,02 0,00
S 1,2868 4,9778 1,57 0,07 0,84 0,31 0,14 5,43 0,03 5,81 0,90 0,21 0,49 0,00 0,14 0,02 0,00
La Pampa -
Lugar Del Que
Santa Fe - San 1,2296 5,2558 0,88 0,49 0,19 0,03 0,23 1,65 1,40 0,28 0,01 0,49 0,15 0,05 0,01 0,00 0,01
Provienes
Luis
Otros Dpto de
2,0303 2,7887 0,03 0,62 0,01 -0,10 0,26 0,00 3,71 0,00 0,16 1,04 0,00 0,14 0,00 0,00 0,02
Crdoba
Resto del Pas 0,5719 12,45 0,44 0,19 0,30 0,13 -0,02 0,19 0,09 0,32 0,06 0,00 0,02 0,00 0,01 0,00 0,00
Ro Cuarto 3,8605 0,9926 -0,36 -0,51 -0,11 0,03 -0,20 0,86 4,76 0,28 0,02 1,25 0,13 0,26 0,01 0,00 0,04
Con
Con Quin Vives?
integrantes de 5,6906 0,3518 0,16 -0,36 -0,01 0,18 -0,11 0,25 3,43 0,00 1,38 0,53 0,07 0,36 0,00 0,10 0,03
tu familia
Otras personas
/Otros 0,8007 8,6071 -0,34 1,01 -0,73 -0,35 1,23 0,16 3,88 2,70 0,70 9,40 0,01 0,12 0,06 0,01 0,17
estudiantes
Solo/a 1,201 5,4048 -0,53 1,02 0,53 -0,64 -0,30 0,58 5,88 2,13 3,52 0,86 0,05 0,19 0,05 0,08 0,02
Alquilada 3,2599 1,3596 -0,18 0,79 0,23 -0,38 -0,26 0,17 9,54 1,13 3,32 1,67 0,02 0,46 0,04 0,10 0,05
Vivienda
Aos desde Minutos Para Llegar a la Tipo De
Propia 3,9176 0,9635 0,11 -0,69 -0,05 0,32 -0,11 0,08 8,79 0,07 2,80 0,34 0,01 0,49 0,00 0,10 0,01
Res. Univ. /
0,5147 13,9444 0,29 0,26 -1,08 -0,02 2,42 0,08 0,16 3,85 0,00 23,59 0,01 0,01 0,08 0,00 0,42
Otro tipo
Entre 20 y 40 2,8882 1,6634 -0,73 0,39 0,22 -0,07 -0,41 2,64 2,03 0,90 0,12 3,84 0,32 0,09 0,03 0,00 0,10
Ms de 40
0,6577 10,6957 -0,69 -1,07 -0,30 1,19 -0,12 0,54 3,56 0,37 6,70 0,07 0,05 0,11 0,01 0,13 0,00
minutos
Menos de 20
UNRC
1,344 4,7234 -0,72 -0,28 -0,03 -0,21 1,14 1,20 0,50 0,01 0,41 13,65 0,11 0,02 0,00 0,01 0,28
Minutos
Soy alumno de
la modalidad
2,8024 1,7449 1,26 -0,01 -0,14 -0,10 -0,09 7,64 0,00 0,37 0,22 0,20 0,91 0,00 0,01 0,01 0,01
de educacin a
distancia
De 5 a 10 aos 0,7149 9,76 1,17 0,02 -1,69 -0,65 0,14 1,69 0,00 12,98 2,20 0,11 0,14 0,00 0,29 0,04 0,00
Secundario
Ms de 10
Egreso
1,4012 4,4898 1,60 0,13 0,90 0,16 0,12 6,12 0,11 7,23 0,25 0,15 0,57 0,00 0,18 0,01 0,00
aos
Menos de 5
5,5762 0,3795 -0,55 -0,04 -0,01 0,04 -0,05 2,91 0,03 0,00 0,08 0,10 0,80 0,00 0,00 0,01 0,01
aos
T Butigu-
Scattolini - P
0,3432 21,4167 -0,64 1,33 -0,46 0,33 1,13 0,24 2,86 0,47 0,27 3,42 0,02 0,08 0,01 0,01 0,06
Curti-Cassano-
Bissio
Docente
T Butigu-
Scattolini - P 0,9437 7,1515 -0,72 0,52 -0,43 1,16 0,48 0,83 1,22 1,13 9,23 1,71 0,07 0,04 0,03 0,19 0,03
Herrera
T Cabrera - P
Curti-Cassano- 0,4289 16,9333 -0,63 0,51 -0,37 1,25 -1,09 0,29 0,52 0,38 4,85 4,02 0,02 0,02 0,01 0,09 0,07
Bissio
14
Produccin y Tratamiento de Datos en Investigacin
Alquiler 2,4878 2,092 -0,35 0,98 0,18 -0,36 -0,15 0,52 11,24 0,51 2,35 0,43 0,06 0,46 0,02 0,06 0,01
Relevancia
Apuntes 1,5442 3,9815 -0,48 -1,01 -0,11 0,29 -0,44 0,60 7,41 0,12 0,93 2,32 0,06 0,26 0,00 0,02 0,05
Otros Gastos 0,8865 7,6774 0,56 -0,16 0,87 -0,13 -0,29 0,48 0,11 4,31 0,10 0,56 0,04 0,00 0,10 0,00 0,01
Transporte 1,2296 5,2558 1,08 -0,14 -0,21 0,20 0,07 2,44 0,12 0,34 0,37 0,05 0,22 0,00 0,01 0,01 0,00
Vestimenta 0,2002 37,4286 0,54 -0,36 -1,37 0,30 -0,60 0,10 0,13 2,39 0,13 0,57 0,01 0,00 0,05 0,00 0,01
Trabajas?
No 4,8899 0,5731 -0,59 0,03 0,13 -0,04 0,07 2,88 0,02 0,54 0,05 0,20 0,60 0,00 0,03 0,00 0,01
S 2,8024 1,7449 1,02 -0,05 -0,23 0,07 -0,13 5,02 0,03 0,94 0,09 0,36 0,60 0,00 0,03 0,00 0,01
15
Produccin y Tratamiento de Datos en Investigacin
forma aleatoria. Igual conclusin se arriba si se fija un = 0,01. Los valores test de todas las
categoras para los primeros 5 ejes factoriales pueden ser consultados en el Anexo N1.
Se realiza ahora la representacin de las modalidades activas para el primer plano factorial:
Fig. 3.: Representacin Grfica de las modalidades activas en el Primer Eje Factorial
16
Produccin y Tratamiento de Datos en Investigacin
Fig. 4.: Representacin Grfica de las modalidades activas y algunas modalidades ilustrativas en el Primer Eje Factorial
Por ltimo, de la proyeccin conjunta de las categoras y de los individuos se observa que
existen dos grupos bien diferenciados de estudiantes, dicha diferenciacin se debe a que el primer
eje factorial ha dividido a las unidades de observacin por modalidad presencial y distancia.
Fig. 5.: Representacin Grfica de las modalidades, individuos y superficie en el Primer Eje Factorial
17
Produccin y Tratamiento de Datos en Investigacin
Clasificacin11
El proceso de clasificacin tiene por objetivo agrupar elementos en clusters homogneos
en funcin de las similitudes entre ellos. Luego de haber realizado el AFCM se procede a agrupar
las observaciones a travs de un anlisis de conglomerados utilizando las coordenadas factoriales
de los estudiantes, sin estandarizar, correspondientes a los primeros 10 ejes factoriales (Cantidad
de ejes a mantener).
Para clasificar a los individuos, se decide aplicar un algoritmo de agrupacin no
jerrquico12 y dos algoritmos jerrquicos de aglomeracin 13. Estos anlisis se han programado en
el lenguaje de R utilizando los paquetes pvclust, dendextend, RcmdrMisc y se ha
sintetizado para el presente trabajo.
11
El presente anlisis fue estructurado siguiendo los lineamientos propuestos por Daniel Pea en su
libro Anlisis de Datos Multivariantes.
12
Se asignan a los individuos a una cantidad prefijada de grupos.
13
Se parte de los elementos individuales (unidades de observacin o variables) y se los va agregando por
grupos. Los elementos son sucesivamente asignados a los grupos y una vez hecha la asignacin, la misma
es irrevocable.
14
Criterio emprico sugerido por John A. Hartigan (1975).
18
Produccin y Tratamiento de Datos en Investigacin
19
Produccin y Tratamiento de Datos en Investigacin
20
Produccin y Tratamiento de Datos en Investigacin
Fig. 6.: Dendrograma del Mtodo del Vecino Ms Cercano (Distancia Eucldea)
= ( ). ( )
=1 =1
Donde es el nmero de individuos del grupo y es la media del grupo .
Al iniciar el proceso de aglomeracin cada individuo forma un grupo por lo tanto = ,
= 1 y = 0. Posteriormente en cada etapa se plantean todas las posibilidades de
agrupamiento y se eligen aquellos dos clusters que producen el menor incremento en , esto es
equivalente a plantear que se seleccione aquella combinacin que produzca la menor suma de
cuadrados dentro de cada grupo. Si en una etapa los grupos y (individuos o grupos de
individuos) se unen, entonces deben verificar que:
.
[ . ( ). ( )]
+
La Tabla N10 muestra el proceso de clasificacin obtenido por el mtodo de Ward.
Adicionalmente se expone el ndice de la unin y la cantidad de individuos que se agrupan en
cada etapa.
Cantidad Cantidad
Primero ltimo ndice de Primero ltimo ndice de
Individuos Individuos
1 -51 -221 0 2 259 250 258 10,82 45
2 -72 -181 0 2 260 257 259 11,38 79
3 -193 2 0 3 261 233 260 11,52 91
4 -78 -179 0 2 262 240 246 12,9 26
5 -80 -167 0 2 263 255 262 13,26 62
6 -240 5 0 3 264 251 261 13,55 101
7 -82 -262 0 2 265 249 253 15,36 80
266 247 263 15,56 88
257 237 244 9,34 34 267 265 266 27,53 168
258 235 256 10,17 24 268 264 267 65,28 269
Tabla N10: Clasificacin De La Nube De Puntos Por El Mtodo De Ward
21
Produccin y Tratamiento de Datos en Investigacin
En la Fig. 8 se observa que, para las primeras iteraciones del algoritmo de Ward, las
distancias de los individuos son cercanas a cero, produciendo valores pequeos del ndice de
agrupamiento, mientras que en las ltimas 3 etapas el incremento es ms brusco. Esto determina
la necesidad de fijar 3 cortes en el dendograma a efectos de realizar el agrupamiento de la nube
de puntos; los mismos se efectan a un valor ndice de 65,28 27,53 15,56 observando que
la muestra se particiona en 2, 3 y 5 grupos respectivamente.
En el Anexo N2, se presenta cada particin de la nube de puntos, informando la cantidad
de individuos que integran cada clase, la suma de cuadrados dentro y la distancia de los 10
individuos ms caractersticos a su centro de gravedad.
Al observar todas las clasificaciones realizadas sobre la nube de puntos, se detecta que un
total de 16 estudiantes son caractersticos en cada particin (siempre aparecen
22
Produccin y Tratamiento de Datos en Investigacin
Fig. 9.: Dendrograma del Mtodo de Ward (Identificando Modalidad y Horario de Cursado)
15
La variable Modalidad de Cursado, est fuertemente ligada a Horario de Cursado por lo que
solamente se representa esta ltima.
23
Produccin y Tratamiento de Datos en Investigacin
la maana se dividen en alumnos de que cursan con Panella Mussolini (Clase 1) y en alumnos
que cursan con Panella Gallardo (Clase 4), mientras que las comisiones de la tarde, dividen a
Cabrera Lardone del Resto de los docentes que dictan clase en el turno tarde (todas las otras
categoras no enunciadas).
Por ltimo, puede observarse que existen dentro del grupo Resto de Docentes Turno
Tarde, un total de 4 alumnos que pertenecen a las comisiones del turno Maana (Panella
Mussolini y Panella Gallardo) que entre sus caractersticas presentan la modalidad Residencia
Universitaria como lugar de vivienda. sta caracterstica los ha diferenciado del resto de sus
compaeros y los ha trasladado a los grupos del turno Tarde.
Conclusin
Este trabajo se presenta como una primera aproximacin para el anlisis de una encuesta
realizada a los estudiantes de AMI, que cursaron durante el primer cuatrimestre del ao 2016 en
la FCE (UNRC), en las modalidades de educacin presencial y educacin a distancia. Los factores
de desercin definidos permiten obtener informacin que abarca desde las caractersticas
individuales del alumno hasta lo percibido por el mismo, en lo relativo al marco institucional,
pero para comprender el gran volumen de datos es necesario realizar un estudio exploratorio
multivariado que haga posible observar simultneamente una amplia variedad de caractersticas
las que deben ser analizadas con una visin de conjunto.
Para dar respuesta a esta necesidad, se plantea en primer lugar un anlisis descriptivo sobre
la totalidad variables obtenidas (41 variables), posteriormente se determina el conjunto que mejor
explica a los datos en cuestin y que mejora la representacin de los datos en los primeros planos
factoriales quedndonos as con un total de 13 variables. Cabe destacar que producto del proceso
de seleccin, las variables definidas como Factores Institucionales han sido descartadas.
Luego se analiza el conjunto de variables activas por medio de un AFCM y se detecta que
las variables Modalidad de Cursado, Horario de Cursado, Docente y Minutos que tardan
para llegar a la UNRC son relevantes a efectos de poder explicar la variabilidad de la nube de
24
Produccin y Tratamiento de Datos en Investigacin
puntos oponiendo en el primer plano factorial a los alumnos de Modalidad Presencial en ambos
Horarios de Cursado versus los de Modalidad EaD.
Con las coordenadas factoriales de los estudiantes del AFCM, se realizan 3 procesos de
clasificacin (Algoritmo de - medias, encadenamiento simple y Mtodo de Ward) y se presentan
las principales conclusiones. El algoritmo de -medias permiti encontrar 8 grupos bien
diferenciados. Por su parte el mtodo por encadenamiento simple (Vecino ms Cercano) ha sido
sensible a individuos atpicos, principalmente estudiantes mayores de 45 aos, viudos o
divorciados, con hijos y con trabajo. Por ltimo, el mtodo de Ward ha sido el que mejores
particiones ha producido, donde se ha podido identificar que las variables Modalidad de
Cursado, Horario de Cursado y Docente son determinantes en la formacin de grupos. Como
puede observarse los 3 mtodos han sido capaces de detectar a aquellos individuos atpicos.
Debido al gran volumen de informacin que se dispone, a la alta variabilidad y que ya se
tiene un primera aproximacin a efectos de entender a la muestra en cuestin, se decide continuar
con el anlisis de los datos combinando variables que pueden llegar a explicar la misma
variabilidad, como por ejemplo Modalidad de Cursado y Horario de Cursado y probar otros
algoritmos de clasificacin para determinar aquella particin que permita explicar de la mejor
manera posible a todos los factores que caracterizan a la muestra de estudiantes obtenida.
25
Produccin y Tratamiento de Datos en Investigacin
Bibliografa
Baronio, A. M., & Vianco, A. M. (2015). Anlisis de la Informacin - PIE 5. En A. M. Baronio, & A. M.
Vianco, Cuadernos de Econometra (Primera ed., pgs. 1-193). Villa Mara.
Castao, E., Galln, S., Gmez, K., & Vsquez, J. (2004). Desercin estudiantil universitaria: una
aplicacin de modelos de duracin. Lecturas de Economa, 60(60), 39-65.
Castao, E., Galln, S., Gmez, K., & Vsquez, J. (2007). Anlisis de los factores asociados a la
desercin y graduacin estudiantil universitaria. Lecturas de Economa, 65(65), 9-36.
Daz Peralta, C. (2008). Modelo Conceptual Para La Desercin Estudiantil. Estudios pedaggicos,
34(2), 65-86.
Hernndez Sampieri, R., Fernndez Collado, C., & Baptista, L. (2008). Metodologa de la Investigacin.
La Habana: Flix Varela.
Montes Gutirrez, I. C., Almonacid Hurtado, P. M., Gmez Cardona, S., Zuluaga Daz, F. I., & Tamayo
Zea, E. (2010). Anlisis de la desercin estudiantil en los programas de pregrado de la
Universidad EAFIT. (C. Direccin de Investigacin y Docencia Universidad EAFIT Medelln,
Ed.) Medelln: Serie Cuadernos de Investigacin.
Vsquez Velsquez, J., Castao, E., Galln Gmez, S., & Gmez Portilla, K. (2003). Determinantes de
la desercin estudiantil en la Universidad de Antioquia. (4), 1-38.
26
Produccin y Tratamiento de Datos en Investigacin
Anexos
ANEXO N1: Valores test de todas las modalidades para los primeros 5 ejes factoriales.
Coordenadas Coordenadas
Variables Modalidades Variables Modalidades
1 2 3 4 5 1 2 3 4 5
Modalidad
la UNRC
Menos de 20
Maana -8,32 -8,84 5,06 -8,59 2,11 -5,43 -2,11 -0,23 -1,55 8,59
Minutos
Horario de
Cursado
Aos desde
Secundario
De 5 a 10 aos 6,15 0,10 -8,84 -3,42 0,72
Egreso
[18-20] -13,98 -0,33 2,83 0,60 0,57
Ms de 10 aos 12,33 1,00 6,95 1,22 0,91
[21-25] 2,35 -1,12 -8,71 0,34 -2,04
Edad
[26-35] 10,76 1,55 -2,09 -4,56 -0,72 Menos de 5 aos -14,65 -0,93 -0,26 1,17 -1,25
[36-45] 4,86 -0,40 4,53 1,73 0,65 T Butigu-
Mayor de 45 5,63 0,06 8,00 5,61 3,02 Scattolini - P
-2,27 4,70 -1,63 1,16 4,00
Casado o Curti-Cassano-
Estado Civil
S 11,51 0,48 6,18 2,28 1,06 Curti-Cassano- -2,51 2,02 -1,48 4,97 -4,35
La Pampa - Santa
Docente Bissio
6,31 3,51 1,34 0,21 1,62
Lugar Del Que
de tu familia
Vives?
Propia 1,79 -11,51 -0,86 5,25 -1,76 Alquiler -3,96 11,08 2,03 -4,09 -1,67
Relevancia
Distancia al Distancia al
Individuos Individuos
Nmero Centroide Nmero Centroide
Clase 1 Clase 2
Identificador Gravedad de Identificador Gravedad de
(2-1) (2-2)
Su Clase Su Clase
1 45 2,04 1 18 2,55
2 79 1,79 2 49 2,52
3 81 1,74 3 60 2,29
4 157 1,74 4 90 2,87
27
Produccin y Tratamiento de Datos en Investigacin
Distancia al Distancia al
Individuos Individuos
Nmero Centroide Nmero Centroide
Clase 1 Clase 2
Identificador Gravedad de Identificador Gravedad de
(2-1) (2-2)
Su Clase Su Clase
5 209 1,77 5 119 2,91
6 215 1,75 6 127 3,06
7 216 2,01 7 208 2,34
8 219 1,75 8 232 2,33
9 257 1,81 9 237 2,11
10 268 2,39 10 252 3,05
16
Puede observarse que para calcular el valor se requiere particiona de la nube de puntos en 4 y 5
grupos, a pesar de ello, cabe destacar que no es posible realizar una particin en 4 grupos por medio de
un corte en el dendograma, por lo tanto, el lenguaje R determina aquellas particiones que minimicen la
Suma de Cuadrados dentro de cada Clase.
28
Produccin y Tratamiento de Datos en Investigacin
Distancia al Distancia al
Individuos Individuos
Nmero Centroide Nmero Centroide
Clase 4 Clase 5
Identificador Gravedad de Identificador Gravedad de
(5-4) (5-5)
Su Clase Su Clase
1 52 1,14 1 127 3,06
2 120 1,14 2 252 3,05
3 118 1,09 3 119 2,91
4 151 1,09 4 90 2,87
5 12 1,04 5 18 2,55
6 51 1,04 6 49 2,52
7 149 1,04 7 208 2,34
8 175 1,04 8 232 2,33
9 186 1,04 9 60 2,29
10 221 1,04 10 237 2,11
29