Está en la página 1de 29

Produccin y Tratamiento de Datos en Investigacin

Factores que caracterizan a los estudiantes de la asignatura Anlisis


Matemtico I Ao 2016 de la FCE de la UNRC
Gallardo Juan Manuel
juanmagallardo2009@gmail.com

Introduccin
El presente trabajo se enmarca dentro del curso Produccin y Tratamiento de Datos en
Investigacin, perteneciente al Doctorado en Desarrollo Territorial (UNRC1) y tiene por
finalidad ser una primera aproximacin al anlisis de los datos obtenidos en una encuesta online
realizada a los estudiantes que cursaron la asignatura Anlisis Matemtico I (AMI) durante el
primer cuatrimestre del ao 2016 en la Facultad de Ciencias Econmicas (FCE) de la UNRC. La
misma, ha sido diseada e implementada por los miembros del proyecto de investigacin, titulado:
Anlisis de los factores asociados a la desercin y de las estrategias institucionales que
promueven la permanencia en las asignaturas del rea matemtica en el primer ao de los tres
planes de estudio de la FCE. Si bien esta Unidad Acadmica cuenta con investigaciones
desarrolladas que hacen referencia a esta problemtica, se espera que el anlisis estadstico
permita conocer e identificar las caractersticas que definen a los estudiantes para que en etapas
posteriores se pueda determinar las causas que impactan negativamente en su permanencia,
contribuyendo as a definir polticas y acciones encaminadas a solucionar los problemas de
desercin en pos de la retencin estudiantil y la calidad educativa.

Palabras Claves
Estudiantes AMI AFCM Clasificacin Factores.

Objetivo General
Como objetivo general del presente trabajo se plantea el siguiente:
1. Identificar aquellas variables que caracterizan a los estudiantes de la asignatura AMI en el
primer cuatrimestre del ao 2016 de la FCE de la UNRC, a travs de un anlisis
exploratorio multivariado, realizando un Anlisis Factorial de Correspondencias Mltiples
(AFCM) y diferentes procedimientos de Anlisis de Conglomerados (Clasificacin).

Objetivos especficos
Como objetivos especficos del presente trabajo se plantean los siguientes:
1. Seleccionar las variables incluidas dentro de los factores individuales, acadmicos,
institucionales y socioculturales, definidos en la encuesta online, que permitan caracterizar
a la poblacin bajo estudio.

1
Universidad Nacional de Ro Cuarto.
1
Produccin y Tratamiento de Datos en Investigacin

2. Realizar un proceso secuencial de reduccin de variables que permitan conservar aqul


conjunto que mejor expliquen a los datos cuestin y que mejore la representacin de los
mismos en los primeros planos factoriales.
3. Analizar diferentes mtodos de clasificacin para encontrar similitudes entre los
individuos.

Metodologa
En el proyecto prev utilizar un enfoque mixto para recolectar, analizar y vincular datos
cuantitativos y cualitativos, a travs de cuestionarios semi-estructurados, revisin documental,
entrevistas en profundidad y observacin participante y no participante, mientras que el enfoque
metodolgico optado en este trabajo es el llamado estudio de caso cuantitativo. Mertens (2005
en Hernndez, Fernndez y Baptista, 2008) define al estudio de caso como una investigacin
sobre un individuo, grupo, organizacin, comunidad o sociedad; que es visto y analizado como
una entidad y el enfoque cuantitativo tiene, entre otros, por objetivo usar la recoleccin de datos
para establecer patrones de comportamiento. En nuestro caso, se trata de los estudiantes de AMI,
correspondientes al primer cuatrimestre de 2016, en las dos modalidades de cursado, presencial
y educacin a distancia (EaD).

Estructura del Estudio


En funcin del problema que se quiere abordar, de los objetivos de este trabajo y de los
recursos disponibles, el tipo de estudio que se realiza es Prospectivo, Descriptivo, Transversal y
Observacional, de acuerdo a los criterios de clasificacin de los protocolos de investigacin que
proponen los autores Mndez Ramrez, Namihira, Moreno y Sosa en su libro "El protocolo de
investigacin: lineamientos para su elaboracin y anlisis", segn se detalla a continuacin.
Dichos criterios se definen teniendo en cuenta el perodo en que se capta la informacin,
(prospectivo o retrospectivo); la evolucin del fenmeno estudiado, (transversal o longitudinal);
la comparacin de poblaciones (descriptivo o explicativo) y la interferencia del investigador en el
fenmeno que se analiza, (observacional o experimental).
De acuerdo con el perodo en que se capta la informacin, el estudio es:
Prospectivo. Toda la informacin se recoger, de acuerdo con los criterios del investigador
y para los fines especficos de la investigacin, despus de la planeacin de sta. En este caso,
dado que la informacin ha sido captada utilizando como instrumento de medicin un
cuestionario, se trata de un estudio prospectivo. En el caso de que la informacin se hubiera
obtenido de otras fuentes, como ser registros del rea de EaD, legajos de estudiantes aportados
por el Registro de Alumnos de la FCE, de las condiciones finales de los estudiantes aportados por
la Responsable de Ctedra, se tratara de un estudio retrospectivo.
Segn la evolucin del fenmeno estudiado, el estudio es:

2
Produccin y Tratamiento de Datos en Investigacin

Transversal. Se miden una sola vez las caractersticas de uno o ms grupos de unidades en
un momento dado, sin pretender evaluar la evolucin de esas unidades, esto es, no se mantiene la
identidad de cada unidad observacional, que es lo que se ha hecho en este caso. Ahora bien, si las
variables se midieran en ms de una ocasin en cada unidad observacional, si se hara seguimiento
y mantendra la identidad de los elementos, se tratara de un estudio longitudinal.
De acuerdo con la comparacin de las poblaciones, el estudio es:
Descriptivo. Estudio que slo cuenta con una poblacin, la cual se pretende describir en
funcin de un grupo de variables y respecto de la cual no existen hiptesis centrales. Quiz se
tiene un grupo de hiptesis que se refieran a la bsqueda sistemtica de asociaciones entre varias
variables dentro de la misma poblacin. Aqu, dado que se describen caractersticas, se calculan
frecuencias, se buscan asociaciones entre las variables de la poblacin en estudio, resulta
Descriptivo.
De acuerdo con la interferencia o control del investigador en el fenmeno que se
analiza, el estudio es:
Observacional. El investigador slo puede describir o medir el fenmeno estudiado; por
tanto, no puede modificar a voluntad propia ninguno de los factores que intervienen en el proceso.
En este caso, como no se controlan, ni manipulan las variables de estudio, sino que stas se dan
independientes de la voluntad del investigador, se trata de un estudio observacional sobre la
poblacin objetivo.

Poblacin Objetivo
La poblacin objetivo la constituyen 667 estudiantes inscriptos en la asignatura Anlisis
Matemtico I, durante este primer cuatrimestre de 2016, en la modalidad presencial y EaD,
correspondiente al Ciclo Bsico de las tres carreras que se dictan en la FCE.

Tcnica cuantitativa: Encuesta online


En esta etapa, se utiliz como tcnica cuantitativa la encuesta, para tener informacin sobre
las variables incluidas dentro de los diferentes factores que inciden en la desercin estudiantil de
los estudiantes que cursan AMI durante el primer ao de las carreras que ofrece la FCE, segn la
clasificacin de Daz Peralta (2008, 65-86); se consideraron sus cuatro categoras: Factores
individuales, acadmicos, institucionales y socioculturales. Esta clasificacin se encuentra
tambin en ICFES (2002, en Montes Gutirrez, 2010, 26-27), en Castao, Galln, Gmez y
Vsquez (2004 y 2007), as como en Vsquez et al. (2003).
La encuesta online fue diseada utilizando la herramienta Formularios de Google y se
envi a la totalidad de las unidades que constituyen la poblacin objetivo, alumnos inscriptos en
AMI.

3
Produccin y Tratamiento de Datos en Investigacin

Procedimiento
Se analizaron las clasificaciones ofrecidas por los autores arriba mencionados, con las
categoras y variables, para luego seleccionar las propias y elaborar las preguntas a ser incluidas
en la encuesta online. Los cuatro grupos de factores presentados por dichos autores, coinciden
con los que se van a considerar como determinantes de la desercin dentro del presente proyecto.
Posteriormente, se consideraron las siguientes operaciones: Se prepararon las preguntas y
posibles respuestas en funcin de las variables y categoras a estudiar. Se analiz el tiempo,
espacio y poblacin a encuestar para definir el instrumento a utilizar, su formato y aplicacin.
De esta manera, se procedi a la recopilacin de informacin primaria utilizando como
instrumento de medicin un cuestionario, que contiene preguntas cerradas para lograr la
estandarizacin de la informacin y algunas preguntas abiertas que sern cuantificadas en anlisis
posteriores. Antes de aplicar este cuestionario, para poder utilizar la modalidad online como canal
de respuesta, se lo llev a formato electrnico, de esta manera, es el encuestado quien responde
el cuestionario sin ayuda de un encuestador.

Especificacin de Factores, variables y preguntas para el cuestionario


Antes de traspasar el cuestionario a formato electrnico, se organiz en una tabla, cada uno
de los factores a considerar, con sus 41 variables y las preguntas a realizar, como se muestra en
los siguientes cuadros:
Factores Personales2
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
Contador Pblico.
Carrera Lic. En Administracin. Carrera
Identificacin Del Individuo Y Datos Generales

Lic. En Economa.
Presencial.
Modalidad Modalidad
Distancia.
Maana.
Tarde.
Horario de Cursado Horario de Cursado
Soy alumno de la modalidad de
educacin a distancia.
[18-20]
[21-25]
Edad [26-35] Edad
[36-45]
Mayor de 45
Masculino.
Gnero Gnero
Femenino.
Soltero
Estado Civil Casado o Conviviente Estado Civil
Viudo o Divorciado
S.
Tienes Hijos Hijos
No.

2
Cada alumno fue identificado con el nmero de documento de identidad. Pero esta variable
nicamente se utiliz para realizar correcciones a las respuestas obtenidas y no ser expuesta en
los resultados finales.
4
Produccin y Tratamiento de Datos en Investigacin

Factores Personales
Departamento Ro Cuarto
Otros Departamentos de
Lugar Del Que
Crdoba Lugar del que Provienes
Provienes
Procedencia y tipo de vivienda La Pampa - Santa Fe - San Luis
Resto del Pas
Con integrantes de tu familia.
Slo.
Con Quin Vives? Con quin Vives?
Con otras personas incluido
Vivienda

otros estudiantes
Alquilada
Propia
Tipo De Vivienda Residencia Universitaria / Otro Tipo de Vivienda
tipo de vivienda (Prestada o
compartida sin gastos)
Soy alumno de la modalidad de Minutos Para Llegar a la
Cuntos minutos
educacin a distancia. UNRC
tardos para llegar a la
Menos de 20 Minutos.
Universidad,
Entre 20 y 40.
diariamente?
Ms de 40 minutos.
Has padecido de algn
infortunio familiar o
Infortunios
Familiares

alguna enfermedad
S.
personal que haya Infortunio Familiar
No.
influido en tus estudios,
durante el cursado de la
asignatura?

Factores Acadmicos
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
Tipo de Colegio del que Pblico.
Tipo de Colegio
provienes Privado.
Econmica.
Escuela Secundaria

Con qu orientacin te Social.


Orientacin Secundario
recibiste? Natural.
Otras Orientaciones

Cunto tiempo ha
Menos de 5 aos.
transcurrido desde que Aos desde Egreso
De 5 a 10 aos.
egresaste del colegio Secundario
Ms de 10 aos.
secundario?

Pensaste alguna vez en Pensaste alguna vez en


S.
Carrera Universitaria

dejar los estudios en la dejar los estudios en la


No.
universidad? universidad?
Te sientes satisfecho Te sientes satisfecho con
S.
con tus estudios tus estudios
No.
universitarios? universitarios?
Si se te presenta una
buena oportunidad de S Dejar Los Estudios Por
trabajo dejaras tus No Trabajo
estudios universitarios?
Recursas este ao S
Alumno Recursante
Anlisis Matemtico I? No
Terico (Panella) - Prctico Docente (Al estar
Anlisis Matemtico I

(Gallardo) presente alumnos de


Terico (Panella) - Prctico ambas modalidades de
(Mussolini) cursado, la combinacin
Terico (Butigu - Scattolini)
de profesores de
Docentes Prctico (Curti - Cassano-
terico y prctico
Bissio)
Terico (Butigu - Scattolini) - estn asociadas a la
Prctico (Herrera) modalidad presencial,
Terico (Cabrera) - Prctico mientras que tutora
(Curti- Cassano - Bissio) hacer referencia a

5
Produccin y Tratamiento de Datos en Investigacin

Factores Acadmicos
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
Terico (Cabrera) - Prctico docentes de modalidad
(Lardone) de educacin a distancia).
Tutora Cassano
Tutora Curti
Tutora Lardone
Tutora Mussolini
Tutora Scattolini
Condicin Final
(La condicin libre
Qu condicin Promocin. incluye a todos los
alcanzaste en la Regular. alumnos que quedaron
materia? Libre. libre por faltas, libre por
parcial y libre nunca ha
empezado).
Cuntas horas Menos de 4 horas semanales.
dedicaste al estudio de Entre 4 y 6 horas semanales. Horas de Estudio
esta materia? Ms de 6 horas semanales.
Entre todos los das de la
Las horas semanales de semana. Distribucin de Horas de
estudio son distribuidas: Algunos das de la semana. Estudio
Slo los sbados y domingos.
Cuando el docente de Cuando el docente de
Casi nada.
Anlisis Matemtico Anlisis Matemtico
Slo algunas cosas.
explica una temtica, explica una temtica,
Casi todo.
entiendes entiendes.
Asistes a Profesores
Particulares para que te S
Profesores Particulares
expliquen alguna No
temtica de la materia?
Asistes a clase de S
Clase de Consulta
consulta? No
Ingresas semanalmente
S
al aula virtual disponible Ingreso Semanal al SIAT
No
en la plataforma SIAT?
La variable TIC ha sido
creada considerando un
total de 11 preguntas
relativas al uso de las
Cmo calificaras tu Tecnologas de
nivel de dominio de las Informacin y
TIC3 y de soportes Alto Comunicacin, cada una
multimedios (imgenes, Medio de ellas con 4 categoras
audios, videos) Bajo (Alto, Medio, Bajo y
aplicadas a la Nulo Nulo). Para cada
educacin? (Variable individuo se cuenta la
resumen) cantidad de veces que ha
seleccionado cada
categora y se le asigna la
categora que ms veces
se ha repetido4.

Factores Socio-econmicos
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
S
Trabajas?
Dependen

Trabajas?
No
cia

Cul de los siguientes Alquiler;


Gastos de Mayor
gastos es el de mayor Alimentacin;
Relevancia.
relevancia en la Transporte;

3
Tecnologas de la Informacin y Comunicacin.
4
Se observa que ningn individuo ha contestado dos modalidades la misma cantidad de veces, por lo
que no es necesario tomar una metodologa a aplicar en caso de empate entre categoras.
6
Produccin y Tratamiento de Datos en Investigacin

Factores Socio-econmicos
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
posibilidad de que Vestimenta;
puedas estudiar o5 no? Apuntes;
Otros Gastos
Tienes beca S
Beca Universitaria.
Universitaria? No
Menos de $10.000
En qu intervalo de
$10.001 $20.000
ingresos totales
$20.001 $40.000 Ingresos Familiares.
mensuales, se encuentra
$40.001 $60.000
tu familia?
Ms de $60.000
Primario Incompleto
Primario Completo con
Tu padre que nivel Secundario incompleto
Nivel Mximo de Estudio
mximo de estudios Secundario Completo con
Padre.
Estudios Padres

poseen: Terciario o Universitario


incompleto
Universitario Completo
Primario Incompleto
Primario Completo con
Tu madre que nivel Secundario incompleto Tu padre trabaja en
mximo de estudios Secundario Completo con relacin de dependencia
poseen: Terciario o Universitario o es propietario?
incompleto
Universitario Completo
Mi padre no trabaja Nivel Mximo de Estudio
Tu padre trabaja en

Empleo de los

Propietario (Autnomo y Madre


relacin de dependencia
Cuenta propia)
Padres

o es propietario?
Relacin de dependencia
Tu madre trabaja en Mi padre no trabaja Tu madre trabaja en
relacin de dependencia Propietario relacin de dependencia
o es propietario? Relacin de dependencia o es propietaria?

Factores Institucionales
Bloque de Nombre de la Variable /
Variable Modalidades
variable Descripcin
Participas en
actividades deportivas, S Deporte o Actividades
culturales u otras dentro No Culturales en UNRC
Relacin con
compaeros

de la Universidad?
Participas en el centro
S
de estudiantes de la Centro de Estudiantes
No
facultad?
Tienes grupos de S
Grupo de Estudio
estudios? No
La Facultad o la
Universidad te ha

Oferta Institucional

S
brindado la suficiente Rgimen De Alumnos
No
informacin respecto al
rgimen de alumnos
La Facultad o la
Universidad te ha
S
brindado la suficiente Rgimen De Becas
No
informacin respecto al
rgimen de becas
Tabla N1: Factores y Variables considerados para el anlisis

5
Sistema Informtico de Apoyo a la Teleformacin desarrollado desde hace 13 aos por el Programa
Informtica Regin Centro (IRC), dependiente de la Secretara de Extensin y Desarrollo de la UNRC. El
SIAT constituye la plataforma de educacin a distancia de la FCE.
7
Produccin y Tratamiento de Datos en Investigacin

Procedimiento de contacto con los encuestados


Con el objetivo de poder contactar a todos los alumnos e invitarlos a participar de la
encuesta, se procedi a realizar un envo de correo electrnico masivo, con una carta de invitacin
para responder el cuestionario, que contena el mensaje que iban a encontrar en la misma encuesta
online. Fue posible el envo a estos correos, ya que se contaba con el dato en las plataformas SIAT
y SIAL6. Adems, se les realiz una invitacin, con el mismo mensaje colocado en NOTICIAS,
que es una de las herramientas de la plataforma SIAT, donde se les insert el link para que puedan
acceder.
El perodo de diseo e implementacin de la encuesta coincidi con el llamado a los turnos
de exmenes correspondientes a julio agosto de este ao acadmico, lo cual hizo que se extienda
el perodo de respuesta hasta una semana despus de culminar el ltimo llamado de agosto.
Unos das antes de la fecha de trmino del perodo estipulado para responder la encuesta,
se procedi a hacer un envo nuevamente de la carta de invitacin en forma masiva a todos
aquellos encuestados que hasta esa fecha no haban respondido, recordndoles el plazo de las
respuestas y la importancia de contar con su participacin.
Debido al bajo nivel de respuesta observado, principalmente en la modalidad de educacin
a distancia, a aquellos alumnos que no contestaron en tiempo la encuesta, se lo trat de contactar
va telefnica, con la finalidad de consultar las razones por las cuales no la hicieron e invitarlos,
a travs de un nuevo plazo, a que participen de la misma. Para aquellos alumnos que cursan en
modalidad presencial, los docentes de Anlisis Matemtico II se encargaron de recordarles la
importancia de su respuesta, una vez iniciado el ciclo lectivo correspondiente al segundo
cuatrimestre de primer ao. Todo esto gener la necesidad de apertura de un nuevo perodo el que
se extendi hasta los primeros das del mes de octubre de 2016. Finalizado el mismo se alcanz
un total de 269 encuestas.

Anlisis Exploratorio Multivariado


En este trabajo, a efectos de analizar estadsticamente la muestra obtenida, en primer lugar
se realiza un anlisis descriptivo de las 41 variables seleccionadas, posteriormente se determina
que variables son estadsticamente independientes a travs del test de independencia de chi-
cuadrado, luego se determina la semejanza entre las unidades de observacin, a travs de los
atributos seleccionados mediante un Anlisis Factorial de Correspondencias Mltiples (AFCM)
y por ltimo, se clasifica a los individuos teniendo en cuenta los factores obtenidos en el AFCM.

6
Sistema Integral de Alumnos (SIAL): la versin para web del SIAL permite que los estudiantes se inscriban
por esta va para rendir y para cursar sus materias, y que realicen varias consultas sobre sus datos
personales y acadmicos. Los docentes, por su parte, pueden asignar la condicin a sus estudiantes,
consultar los tribunales de examen en que se encuentran, consultar los estudiantes inscriptos para cursar
y para rendir las materias en que son responsables, subir materiales, anuncios.
8
Produccin y Tratamiento de Datos en Investigacin

Anlisis descriptivo de la muestra obtenida


De un total de 269 alumnos que han respondido la encuesta online, el 63.57% pertenecen
a la modalidad presencial, el 33,46% son del gnero masculino, el 64,31% se encuentra por debajo
de los 21 aos, el 65,80% cursa la carrera Contador pblico y el 26,77% la de Licenciatura en
Administracin, el 26,77% ha alcanzado la condicin final de promocin mientras que el 39,03%
la de regular, el 81,72% es soltero y 16,73% posee la modalidad casado o conviviente, el 63,57%
no trabaja, el 52,04% ha estudiado en colegios pblicos y se observa una predominancia de
economa como orientacin del colegio secundario.
Analizando la variable resumen TIC puede observarse que el 65,06% poseen un alto
nivel de uso de las Tecnologas de Informacin y Comunicacin, el 24,16% un nivel medio, el
7,43% un nivel bajo y 3,35% un nivel nulo.
Por otra parte, se observa que solamente uno de los encuestados participa activamente del
Centro de Estudiantes.

Prueba de (Chi cuadrado) para independencia de variables


A efectos de realizar esta prueba, se seleccionan dos variables con modalidades
mutuamente excluyentes, y se construye la tabla de frecuencias observadas que rene la totalidad
de coocurrencias que presenta la muestra. Posteriormente se calcula el estadstico chi-cuadrado
y se realiza la prueba de independencia de 2 .
Baronio y Vianco (2015) expresan que la hiptesis nula asociada con el estadstico muestral
chi-cuadrado, establece que las dos variables cualitativas son estadsticamente independientes, es
por ello que valores pequeos adoptar el estadstico muestral si las variables son estadsticamente
independientes.
Dado que la finalidad de este trabajo es aplicar un Anlisis Factorial de Correspondencia
Mltiples a la problemtica planteada, es posible trabajar con la totalidad de las variables o aplicar
el anlisis slo a aquellas variables que resulten estadsticamente significativas en al menos una
de las pruebas de independencia realizadas. Se decide trabajar con la ltima metodologa y
realizar todas las pruebas necesarias para comparar a cada variable respecto de las otras,
determinando que son estadsticamente significativas si su es inferior a un nivel de
significacin = 0,01.
La Tabla N1 resume las 1640 pruebas de independencia realizadas:
Tu padre
Anos desde Asistes a
Alumno Beca Centro de trabaja en
Egreso clase de CARRERA TIC
Recursante Universitaria Estudiantes relacin de
Secundario consulta
dependencia
Alumno No Se No No No No No
Significativa Significativa
Recursante Compara Significativa Significativa Significativa Significativa Significativa
Aos desde
No Se No No No No
Egreso Significativa Significativa Significativa
Compara Significativa Significativa Significativa Significativa
Secundario

9
Produccin y Tratamiento de Datos en Investigacin

Tu padre
Anos desde Asistes a
Alumno Beca Centro de trabaja en
Egreso clase de CARRERA TIC
Recursante Universitaria Estudiantes relacin de
Secundario consulta
dependencia
Asistes a
No Se No No No No
clase de Significativa Significativa Significativa
Compara Significativa Significativa Significativa Significativa
consulta
Beca No No No No Se No No No No

Universitaria Significativa Significativa Significativa Compara Significativa Significativa Significativa Significativa
No No No No No Se No No No
CARRERA
Significativa Significativa Significativa Significativa Compara Significativa Significativa Significativa
Centro de No No No No No No Se No No

Estudiantes Significativa Significativa Significativa Significativa Significativa Compara Significativa Significativa

No No No No No No No Se No
TIC
Significativa Significativa Significativa Significativa Significativa Significativa Compara Significativa

Tu padre
trabaja en No No No No No No Se
Significativa Significativa
relacin de Significativa Significativa Significativa Significativa Significativa Compara
dependencia
Tabla N2: Test Chi-Cuadrado para el Conjunto de Variables Objeto de Estudio
De comprobar la cantidad de veces que cada variable ha resultado significativa, en al menos
una de las pruebas realizadas, se detecta que las variables Centro de Estudiantes y TIC son
independientes del resto de las variables (siempre ha dado no significativa la comparacin). Por
tal motivo se decide eliminarlas como variables activas a ser utilizadas en el Anlisis Factorial de
Correspondencias Mltiples 7.

Anlisis Factorial de Correspondencias Mltiples


El Anlisis Factorial de Correspondencias Mltiples (AFCM), es una tcnica de anlisis
multivariado que se utiliza para el estudio y la interpretacin de las correlaciones existentes entre
un grupo de variables con el objeto de descubrir los posibles factores que son comunes a todas
ellas. El AFCM y la Tabla de Burt asociada a l, permite determinar semejanza entre las unidades
de observacin permitiendo sintetizar las variables en estudio, en un nuevo referencial de
representacin (un nuevo sistema de coordenadas que permita una mejor representacin de la
tabla de datos).
Los factores obtenidos en dicho anlisis, no son variables explcitas, sino es el resultado de
diagonalizar la matriz de inercia y por lo tanto sus valores numricos deben ser interpretados a
fin de darles un nombre apropiado que represente al problema en cuestin.
A efectos de definir las variables que mejor explican a la muestra, se decide realizar, en
primer lugar, un AFCM con las 39 variables cualitativas restantes.
El presente anlisis se programa en el lenguaje de R8, enlazado a la interface de InfoStat9 y
se utilizan los paquetes FactoMineR, ggplot2. Los resultados obtenidos han sido sintetizados

7
Primer conjunto de variables ilustrativas: Centro de estudiantes y TIC.
8
R es un entorno de software libre para computacin y grficos estadsticos. Compila y ejecuta en una
amplia variedad de plataformas como UNIX, Windows y MacOS.
9
Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez L., Tablada M., Robledo C.W. InfoStat versin 2016.
Grupo InfoStat, FCA, Universidad Nacional de Crdoba, Argentina. URL http://www.infostat.com.ar
10
Produccin y Tratamiento de Datos en Investigacin

a efectos de este trabajo.


La Tabla N3 muestra los valores propios obtenidos y los porcentajes de varianza, donde
se observa que los 3 primeros ejes factoriales explican el 20,01% de la variabilidad total, mientras
que los 10 primeros ejes renen el 37,96%.
% de % de
% de % de
Dimensin Autovalores Varianza Dimensin Autovalores Varianza
Varianza Varianza
(Acumulado) (Acumulado)
Dim 1 0,26 12,46 12,46 Dim 25 0,03 1,40 63,80
Dim 2 0,08 3,94 16,40 Dim 26 0,03 1,38 65,18
Dim 3 0,07 3,61 20,01 Dim 27 0,03 1,35 66,53
Dim 4 0,06 3,04 23,05 Dim 28 0,03 1,31 67,84
Dim 5 0,06 2,83 25,88 Dim 29 0,03 1,28 69,12
Dim 6 0,06 2,71 28,59
Dim 7 0,05 2,51 31,10 Dim 75 0,00 0,18 99,81
Dim 8 0,05 2,41 33,52 Dim 76 0,00 0,15 99,96
Dim 9 0,05 2,27 35,78 Dim 77 0,00 0,04 100,00
Dim 10 0,05 2,18 37,96 Dim 78 0,00 0,00 100,00
Dim 11 0,04 2,12 40,08 Dim 79 0,00 0,00 100,00
Dim 80 0,00 0,00 100,00
Dim 24 0,03 1,44 62,40 Dim 81 0,00 0,00 100,00
Tabla N3: Autovalores y Porcentajes de Varianza
Tomando como criterio que, la cantidad de ejes factoriales a conservar en el AFCM viene
dado por el cociente entre la Inercia Total y el Total de Autovalores necesarios para alcanzar el
100% de varianza acumulada, se deduce que debe conservarse un total de 28 ejes factoriales para
alcanzar un 67,84% de varianza acumulada.
A continuacin, se realiza en primer lugar la representacin grfica de los valores propios
(Fig. 1) por cada eje factorial.

Fig. 1.: Grfico de Codo de valores propios

Puede observarse que, a partir de la tercera dimensin, hay una cada de la capacidad
predictiva, es por ello que se decide trabajar en primera instancia con los primeros 3 ejes
factoriales.
Luego, se realiza la representacin grfica del % de varianza acumulada para los ejes
factoriales (Fig. 2).

11
Produccin y Tratamiento de Datos en Investigacin

Fig. 2.: Representacin grfica del % de varianza acumulado para los ejes factoriales

Debido a que la cantidad de ejes factoriales a conservar es un nmero muy elevado, se


realiza un procedimiento secuencial de reduccin de variables a efectos de conservar aqul
conjunto que mejor expliquen a la muestra en cuestin y que permita mejorar la representacin
de la tabla de datos en el primer plano factorial (las coordenadas de los dos primeros ejes).
La Tabla N4 describe la secuencia de eliminacin de las variables con el fin de incrementar
el % de varianza acumulada en los primeros ejes factoriales y de minimizar la cantidad de ejes a
mantener:
Criterio para Reducir N de % Varianza de
Variable a eliminar que se convierten en Cantidad de Ejes
Reduccin Variables activas en el variables los 10 Primeros
ilustrativas10 Necesarios
AFCM activas Ejes
No se ha
Test Independencia Centro de Estudiantes No se ha Realizado
0 41 Realizado un
Chi Cuadrado TIC un AFCM
AFCM
Alumno Recursante
1% en al menos uno de los
Distribucin de Horas de Estudio 67,84%
1 primeros 3 ejes 39 37,96%
Deporte o Actividades Culturales en (28 ejes)
Factoriales
UNRC
Gnero
Infortunio Familiar
Horas de Estudio
Rgimen de Alumnos
2% en al menos uno de los Profesores Particulares 65,26 %
2 36 39,21%
primeros 3 ejes factoriales Tu padre trabaja en relacin de (25 ejes)
dependencia o es propietario?
Tu madre trabaja en relacin de
dependencia o es propietaria?
Rgimen de Becas
3% en al menos uno de los
Ingreso Semanal al SIAT 65,83 %
3 primeros 3 ejes 28 42,80%
Beca Universitaria (22 ejes)
factoriales
Orientacin Secundario
Cuando el docente de Anlisis
4% en al menos uno de los
Matemtico explica una temtica, 65,77 %
4 primeros 3 ejes 26 43,91%
entiendes (21 ejes)
factoriales
Grupo de Estudio
Clases de Consulta
Tipo de Colegio
5% en al menos uno de los Pensaste alguna vez en dejar los
62,16 %
5 primeros 3 ejes 22 estudios en la universidad? 46,55%
(17 ejes)
factoriales Te sientes satisfecho con tus
estudios universitarios?

10
Aunque en el proceso de reduccin de variables no se hubiera realizado el Test de Independencia de
Chi Cuadrado, igualmente las variables Centro de Estudiantes y TIC hubieran sido eliminadas en la
primera reduccin (Reduccin 1)
12
Produccin y Tratamiento de Datos en Investigacin

Criterio para Reducir N de % Varianza de


Variable a eliminar que se convierten en Cantidad de Ejes
Reduccin Variables activas en el variables los 10 Primeros
ilustrativas10 Necesarios
AFCM activas Ejes
Dejar Los Estudios Por Trabajo
Condicin Final
Carrera
5% en al menos uno de los
Ingresos Familiares 63,28%
6 primeros 2 ejes 17 49,01%
Nivel Mximo de Estudio Padre (16 ejes)
factoriales
Nivel Mximo de Estudio Madre
No se requiere realizar una nueva 58,69%
7 13 58,69%
reduccin. (10 ejes)
Tabla N4: Proceso Secuencia De Eliminacin De Las Variables

Se decide finalizar el proceso secuencial de reduccin cuando la cantidad de ejes factoriales


a conservar coincide con los 10 primeros ejes factoriales ya que un 58,69% de varianza explicada
se cree razonable a efectos del anlisis. La Tabla N5 muestra los valores propios obtenidos y los
porcentajes de varianza para los primeros 10 ejes factoriales, donde se observa que el primer plano
factorial explica el 27,20% de la variabilidad total, mientras que los 10 primeros ejes renen el
58,69%.
% de % de
% de % de
Dimensin Autovalores Varianza Dimensin Autovalores Varianza
Varianza Varianza
(Acumulado) (Acumulado)
Dim 1 0,58 19,95 19,95 Dim 6 0,11 3,83 45,51
Dim 2 0,21 7,26 27,20 Dim 7 0,11 3,61 49,12
Dim 3 0,16 5,37 32,57 Dim 8 0,10 3,38 52,50
Dim 4 0,14 4,73 37,31 Dim 9 0,09 3,13 55,63
Dim 5 0,13 4,38 41,68 Dim 10 0,09 3,06 58,69
Tabla N5: Autovalores y Porcentajes de Varianza
Los resultados del AFCM N7 se muestran a continuacin, donde se observa las variables
que ms contribuyen a la formacin de cada eje factorial:
Variables Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
Modalidad 12,02 0,00 0,59 0,34 0,31
Horario de Cursado 12,03 14,63 4,85 24,47 1,00
Edad 11,02 0,44 28,37 10,54 3,01
Estado Civil 7,33 0,27 7,93 7,88 4,55
Hijos 6,52 0,03 6,98 1,08 0,25
Lugar del que Provienes 2,70 9,97 0,88 0,25 2,78
Con quin Vives? 0,99 13,20 4,83 5,60 10,78
Tipo de Vivienda 0,32 18,50 5,04 6,12 25,60
Minutos Para Llegar a la UNRC 12,02 6,09 1,65 7,44 17,76
Aos Desde Egreso Secundario 10,71 0,14 20,21 2,53 0,35
Docente 12,16 16,85 8,22 29,39 18,84
Gastos de Mayor Relevancia 4,27 19,83 8,97 4,23 14,21
Trabajas 7,90 0,05 1,48 0,13 0,56
Tabla N6: Contribucin de las Variables en los Ejes Factoriales

Las variables ms relevantes para el primer eje factorial son Modalidad (Contribucin
12,02), Horario de Cursado (12,03), Edad (11,02), Minutos Para llegar a la UNRC (12,02),
Aos Desde Egreso Secundario (10,71) y Docente (12,16). Estas variables son las que ms
peso ejercen sobre el primer eje factorial y es donde se concentra la mayor cantidad de inercia.
Las variables ms relevantes para el segundo eje factorial son Horario de Cursado
(14,63), Con Quin Vives? (13,20), Tipo de Vivienda (18,50), Gastos de Mayor
Relevancia (19,83) y nuevamente aparece la variable Docente (16,85).

13
Produccin y Tratamiento de Datos en Investigacin

Peso Distancia Coordenadas Contribucin Coseno Cuadrado


Variables Modalidades Relativo Centro
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Modalidad Gravedad
Modalidad

Distancia 2,8024 1,7449 1,26 -0,01 -0,14 -0,10 -0,09 7,64 0,00 0,37 0,22 0,20 0,91 0,00 0,01 0,01 0,01

Presencial 4,8899 0,5731 -0,72 0,01 0,08 0,06 0,05 4,38 0,00 0,21 0,12 0,11 0,91 0,00 0,01 0,01 0,01
Maana 2,4307 2,1647 -0,75 -0,79 0,46 -0,77 0,19 2,33 7,23 3,20 10,47 0,68 0,26 0,29 0,10 0,28 0,02
Horario de

Soy alumno de
Cursado

la modalidad
2,8024 1,7449 1,26 -0,01 -0,14 -0,10 -0,09 7,64 0,00 0,37 0,22 0,20 0,91 0,00 0,01 0,01 0,01
de educacin a
distancia
Tarde 2,4593 2,1279 -0,70 0,80 -0,29 0,88 -0,08 2,06 7,40 1,27 13,79 0,12 0,23 0,30 0,04 0,37 0,00
[18-20] 4,9471 0,5549 -0,64 -0,02 0,13 0,03 0,03 3,43 0,01 0,52 0,03 0,03 0,73 0,00 0,03 0,00 0,00
[21-25] 0,9151 7,4062 0,39 -0,19 -1,45 0,06 -0,34 0,24 0,15 12,23 0,02 0,82 0,02 0,01 0,28 0,00 0,02
Edad

[26-35] 1,3154 4,8478 1,45 0,21 -0,28 -0,61 -0,10 4,72 0,27 0,66 3,58 0,10 0,43 0,01 0,02 0,08 0,00
[36-45] 0,2574 28,8889 1,60 -0,13 1,49 0,57 0,21 1,12 0,02 3,62 0,60 0,09 0,09 0,00 0,08 0,01 0,00
Mayor de 45 0,2574 28,8889 1,85 0,02 2,63 1,84 0,99 1,51 0,00 11,32 6,31 1,98 0,12 0,00 0,24 0,12 0,03
Casado o
Hijos Estado Civil

1,2868 4,9778 1,56 0,17 0,14 -0,26 0,06 5,33 0,18 0,16 0,64 0,04 0,49 0,01 0,00 0,01 0,00
Conviviente
Soltero 6,2911 0,2227 -0,35 -0,03 -0,09 0,00 -0,05 1,33 0,02 0,30 0,00 0,14 0,55 0,00 0,03 0,00 0,01
Viudo o
0,1144 66,25 1,84 -0,36 3,20 2,96 2,21 0,66 0,07 7,48 7,24 4,38 0,05 0,00 0,16 0,13 0,07
Divorciado
No 6,4055 0,2009 -0,32 -0,01 -0,17 -0,06 -0,03 1,09 0,01 1,17 0,18 0,04 0,49 0,00 0,14 0,02 0,00
S 1,2868 4,9778 1,57 0,07 0,84 0,31 0,14 5,43 0,03 5,81 0,90 0,21 0,49 0,00 0,14 0,02 0,00
La Pampa -
Lugar Del Que

Santa Fe - San 1,2296 5,2558 0,88 0,49 0,19 0,03 0,23 1,65 1,40 0,28 0,01 0,49 0,15 0,05 0,01 0,00 0,01
Provienes

Luis
Otros Dpto de
2,0303 2,7887 0,03 0,62 0,01 -0,10 0,26 0,00 3,71 0,00 0,16 1,04 0,00 0,14 0,00 0,00 0,02
Crdoba
Resto del Pas 0,5719 12,45 0,44 0,19 0,30 0,13 -0,02 0,19 0,09 0,32 0,06 0,00 0,02 0,00 0,01 0,00 0,00
Ro Cuarto 3,8605 0,9926 -0,36 -0,51 -0,11 0,03 -0,20 0,86 4,76 0,28 0,02 1,25 0,13 0,26 0,01 0,00 0,04
Con
Con Quin Vives?

integrantes de 5,6906 0,3518 0,16 -0,36 -0,01 0,18 -0,11 0,25 3,43 0,00 1,38 0,53 0,07 0,36 0,00 0,10 0,03
tu familia
Otras personas
/Otros 0,8007 8,6071 -0,34 1,01 -0,73 -0,35 1,23 0,16 3,88 2,70 0,70 9,40 0,01 0,12 0,06 0,01 0,17
estudiantes

Solo/a 1,201 5,4048 -0,53 1,02 0,53 -0,64 -0,30 0,58 5,88 2,13 3,52 0,86 0,05 0,19 0,05 0,08 0,02
Alquilada 3,2599 1,3596 -0,18 0,79 0,23 -0,38 -0,26 0,17 9,54 1,13 3,32 1,67 0,02 0,46 0,04 0,10 0,05
Vivienda
Aos desde Minutos Para Llegar a la Tipo De

Propia 3,9176 0,9635 0,11 -0,69 -0,05 0,32 -0,11 0,08 8,79 0,07 2,80 0,34 0,01 0,49 0,00 0,10 0,01
Res. Univ. /
0,5147 13,9444 0,29 0,26 -1,08 -0,02 2,42 0,08 0,16 3,85 0,00 23,59 0,01 0,01 0,08 0,00 0,42
Otro tipo
Entre 20 y 40 2,8882 1,6634 -0,73 0,39 0,22 -0,07 -0,41 2,64 2,03 0,90 0,12 3,84 0,32 0,09 0,03 0,00 0,10
Ms de 40
0,6577 10,6957 -0,69 -1,07 -0,30 1,19 -0,12 0,54 3,56 0,37 6,70 0,07 0,05 0,11 0,01 0,13 0,00
minutos
Menos de 20
UNRC

1,344 4,7234 -0,72 -0,28 -0,03 -0,21 1,14 1,20 0,50 0,01 0,41 13,65 0,11 0,02 0,00 0,01 0,28
Minutos
Soy alumno de
la modalidad
2,8024 1,7449 1,26 -0,01 -0,14 -0,10 -0,09 7,64 0,00 0,37 0,22 0,20 0,91 0,00 0,01 0,01 0,01
de educacin a
distancia
De 5 a 10 aos 0,7149 9,76 1,17 0,02 -1,69 -0,65 0,14 1,69 0,00 12,98 2,20 0,11 0,14 0,00 0,29 0,04 0,00
Secundario

Ms de 10
Egreso

1,4012 4,4898 1,60 0,13 0,90 0,16 0,12 6,12 0,11 7,23 0,25 0,15 0,57 0,00 0,18 0,01 0,00
aos
Menos de 5
5,5762 0,3795 -0,55 -0,04 -0,01 0,04 -0,05 2,91 0,03 0,00 0,08 0,10 0,80 0,00 0,00 0,01 0,01
aos
T Butigu-
Scattolini - P
0,3432 21,4167 -0,64 1,33 -0,46 0,33 1,13 0,24 2,86 0,47 0,27 3,42 0,02 0,08 0,01 0,01 0,06
Curti-Cassano-
Bissio
Docente

T Butigu-
Scattolini - P 0,9437 7,1515 -0,72 0,52 -0,43 1,16 0,48 0,83 1,22 1,13 9,23 1,71 0,07 0,04 0,03 0,19 0,03
Herrera
T Cabrera - P
Curti-Cassano- 0,4289 16,9333 -0,63 0,51 -0,37 1,25 -1,09 0,29 0,52 0,38 4,85 4,02 0,02 0,02 0,01 0,09 0,07
Bissio

14
Produccin y Tratamiento de Datos en Investigacin

Peso Distancia Coordenadas Contribucin Coseno Cuadrado


Variables Modalidades Relativo Centro
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Modalidad Gravedad
T Cabrera - P
0,7435 9,3462 -0,74 1,07 0,03 0,57 -0,76 0,69 4,03 0,01 1,71 3,39 0,06 0,12 0,00 0,03 0,06
Lardone
T Panella - P
1,3154 4,8478 -0,77 -0,85 0,45 -0,74 0,34 1,34 4,50 1,71 5,18 1,19 0,12 0,15 0,04 0,11 0,02
Gallardo
T Panella - P
1,1152 5,8974 -0,72 -0,73 0,46 -0,81 0,01 0,99 2,77 1,50 5,32 0,00 0,09 0,09 0,04 0,11 0,00
Mussolini
TUT Cassano 0,3717 19,6923 0,96 0,37 -0,47 -0,80 -0,34 0,59 0,24 0,53 1,73 0,34 0,05 0,01 0,01 0,03 0,01
TUT Curti 0,4289 16,9333 1,17 -0,26 -0,02 0,50 -0,56 1,01 0,14 0,00 0,77 1,06 0,08 0,00 0,00 0,02 0,02
TUT Lardone 0,5719 12,45 1,39 0,01 -0,07 -0,20 0,60 1,91 0,00 0,02 0,16 1,60 0,16 0,00 0,00 0,00 0,03
TUT Mussolini 0,6863 10,2083 1,18 -0,35 -0,66 -0,18 -0,59 1,65 0,39 1,89 0,17 1,84 0,14 0,01 0,04 0,00 0,03
TUT Scattolini 0,7435 9,3462 1,43 0,23 0,36 0,05 0,22 2,61 0,19 0,61 0,01 0,28 0,22 0,01 0,01 0,00 0,01
Alimentacin 1,344 4,7234 -0,24 -0,36 -0,39 0,19 0,99 0,13 0,83 1,30 0,34 10,29 0,01 0,03 0,03 0,01 0,21
Gastos De Mayor

Alquiler 2,4878 2,092 -0,35 0,98 0,18 -0,36 -0,15 0,52 11,24 0,51 2,35 0,43 0,06 0,46 0,02 0,06 0,01
Relevancia

Apuntes 1,5442 3,9815 -0,48 -1,01 -0,11 0,29 -0,44 0,60 7,41 0,12 0,93 2,32 0,06 0,26 0,00 0,02 0,05
Otros Gastos 0,8865 7,6774 0,56 -0,16 0,87 -0,13 -0,29 0,48 0,11 4,31 0,10 0,56 0,04 0,00 0,10 0,00 0,01
Transporte 1,2296 5,2558 1,08 -0,14 -0,21 0,20 0,07 2,44 0,12 0,34 0,37 0,05 0,22 0,00 0,01 0,01 0,00
Vestimenta 0,2002 37,4286 0,54 -0,36 -1,37 0,30 -0,60 0,10 0,13 2,39 0,13 0,57 0,01 0,00 0,05 0,00 0,01
Trabajas?

No 4,8899 0,5731 -0,59 0,03 0,13 -0,04 0,07 2,88 0,02 0,54 0,05 0,20 0,60 0,00 0,03 0,00 0,01

S 2,8024 1,7449 1,02 -0,05 -0,23 0,07 -0,13 5,02 0,03 0,94 0,09 0,36 0,60 0,00 0,03 0,00 0,01

Tabla N7: Coordenadas, Contribuciones y Cosenos Cuadrados de las Modalidades Activas


Las categoras de mayor peso dentro de cada variable, oponen en el primer eje factorial a
los alumnos que cursan en la modalidad presencial en el semieje negativo respecto de los que
cursan bajo la modalidad distancia en el semieje positivo. Ello puede apreciarse tanto en la
variable Modalidad, Docente, Horario de Cursado, Minutos que tarda en llegar a la
UNRC y en la Edad que diferencia a alumnos entre 18 y 20 aos contra mayores de 26 aos.
El primer eje que rene el 19,95% de la inercia total de la nube de puntos ser denominado
Alumnos de Presencial Vs Distancia.
El Segundo eje factorial rene el 7,26% de la inercia total de la nube de puntos y opone a
los alumnos que alquilan su vivienda y que tardan entre 20 y 40 minutos en llegar a la UNRC, en
el semieje positivo, respecto de los que tienen vivienda propia y que tardan ms de 40 minutos en
llegar a su lugar de estudio en el semieje negativo, adicionalmente opone a los alumnos de
presencial que cursan durante la maana, en el semieje negativo, respecto de los alumnos que
cursan a la tarde, en el semieje positivo. Esto es visible tanto en la variable Horario de Cursado
como en Docente. Por lo tanto, este eje ser denominado Alumnos de la Maana Vs Tarde.
La calidad de representacin de las modalidades correspondientes a los Aos desde Egreso
Secundario y a Trabajas? son nulas en el segundo eje factorial, esto est indicando que su
posicin sobre ese eje est mal explicada. Las modalidades de la variable citadas estn mejor
representadas sobre el primer eje.
Al analizar los valores test (Anexo N1) correspondientes a las categoras que adopta la
variable Modalidad en el primer eje factorial, es posible apreciar que a un nivel de
significatividad = 0,05 se rechaza la hiptesis nula (:Aleatoriedad en la construccin del eje
factorial), por lo que las proyecciones de las categoras en el primer eje no se han realizado de

15
Produccin y Tratamiento de Datos en Investigacin

forma aleatoria. Igual conclusin se arriba si se fija un = 0,01. Los valores test de todas las
categoras para los primeros 5 ejes factoriales pueden ser consultados en el Anexo N1.
Se realiza ahora la representacin de las modalidades activas para el primer plano factorial:

Fig. 3.: Representacin Grfica de las modalidades activas en el Primer Eje Factorial

A efectos de brindar una explicacin ms detallada, se decide incorporar como variables


suplementarias a Gnero, Condicin Final, Carrera. La Fig. 4 muestra la incorporacin de
estas variables ilustrativas en el primer plano factorial y permite observa que la categora
promocin est fuertemente ligada a los alumnos que cursan la modalidad presencial turno
maana, regulares a los que cursan la modalidad presencial turno tarde y libre a los de la
modalidad distancia que es donde se ha detectado el mayor nmero de alumnos que han
abandonado la materia.

16
Produccin y Tratamiento de Datos en Investigacin

Fig. 4.: Representacin Grfica de las modalidades activas y algunas modalidades ilustrativas en el Primer Eje Factorial

Por ltimo, de la proyeccin conjunta de las categoras y de los individuos se observa que
existen dos grupos bien diferenciados de estudiantes, dicha diferenciacin se debe a que el primer
eje factorial ha dividido a las unidades de observacin por modalidad presencial y distancia.

Fig. 5.: Representacin Grfica de las modalidades, individuos y superficie en el Primer Eje Factorial

17
Produccin y Tratamiento de Datos en Investigacin

Clasificacin11
El proceso de clasificacin tiene por objetivo agrupar elementos en clusters homogneos
en funcin de las similitudes entre ellos. Luego de haber realizado el AFCM se procede a agrupar
las observaciones a travs de un anlisis de conglomerados utilizando las coordenadas factoriales
de los estudiantes, sin estandarizar, correspondientes a los primeros 10 ejes factoriales (Cantidad
de ejes a mantener).
Para clasificar a los individuos, se decide aplicar un algoritmo de agrupacin no
jerrquico12 y dos algoritmos jerrquicos de aglomeracin 13. Estos anlisis se han programado en
el lenguaje de R utilizando los paquetes pvclust, dendextend, RcmdrMisc y se ha
sintetizado para el presente trabajo.

Clasificacin por Algoritmo No Jerrquico


Se calcula el algoritmo no jerrquico de -medias asumiendo que el nmero final de
clusters es conocido. El proceso consiste en asignar a cada individuo a un grupo prefijado con el
objetivo de minimizar la suma de cuadrados dentro de los -grupos (()) para todas las
variables dadas. Este criterio es equivalente a minimizar las sumas ponderadas de las varianzas
de las variables de los -grupos prefijados, esto es as ya que la varianza es una medida de la
heterogeneidad originada en la clasificacin de los individuos.

2 2
[] = [ ( ) ] = [ . ]
=1 =1 =1 =1 =1

Donde es el valor de la variable para el individuo del grupo , es la media de


2
la variable del grupo , es el nmero de individuos del grupo y es la varianza de la
variable en dicho grupo.
Minimizar la SCDG requiere encontrar particiones ptimas en las que en cada iteracin
solamente se permita mover a un individuo de un grupo a otro.
Por ltimo, se determina el nmero de grupos realizando un test de reduccin de
variabilidad y comparando la con grupos respecto a la con + 1 grupos. Bajo
este criterio, se decide incorporar un grupo ms si el valor es cercano a 10 14.
() ( + 1)
=
( + 1)
( ( + 1) 1)

11
El presente anlisis fue estructurado siguiendo los lineamientos propuestos por Daniel Pea en su
libro Anlisis de Datos Multivariantes.
12
Se asignan a los individuos a una cantidad prefijada de grupos.
13
Se parte de los elementos individuales (unidades de observacin o variables) y se los va agregando por
grupos. Los elementos son sucesivamente asignados a los grupos y una vez hecha la asignacin, la misma
es irrevocable.
14
Criterio emprico sugerido por John A. Hartigan (1975).
18
Produccin y Tratamiento de Datos en Investigacin

Con las coordenadas factoriales se realiza el algoritmo de -medias predefiniendo


particiones desde 2 a 10 grupos. Posteriormente se determina el nmero de grupos por medio del
estadstico .
Nmero Nmero
de Clases Tamao () de Clases Tamao ()
Grupos Grupos
1 171 300,58 1 46 43,04
2 583,33 144,72 728,05
2 98 282,75 2 33 63,94
1 98 282,75 3 28 47,20
3 2 86 156,74 538,54 189,51 728,05 22,04 4 58 89,82
8 422,49 305,55 728,05 9,86
3 85 99,04 5 39 34,57
1 61 142,16 6 9 20,39
2 85 99,04 7 47 104,96
4 505,48 222,57 728,05 17,27
3 37 107,53 8 9 18,58
4 86 156,74 1 35 81,16
1 86 156,74 2 25 54,39
2 42 101,37 3 46 43,04
5 3 4 9,16 481,96 246,09 728,05 12,83 4 15 16,79
4 85 99,04 9 5 39 34,57 397,34 330,71 728,05 16,40
5 52 115,66 6 38 56,26
1 53 119,91 7 33 38,99
2 46 43,04 8 34 62,99
3 74 120,66 9 4 9,16
6 462,40 265,65 728,05 11,09
4 45 130,39 1 45 92,61
5 12 13,84 2 26 20,51
6 39 34,57 3 15 16,79
1 59 82,25 4 18 12,06
2 39 34,57 5 12 13,84
10 386,45 341,60 728,05 7,27
3 46 43,04 6 18 62,77
7 4 49 108,17 438,51 289,53 728,05 14,21 7 39 35,01
5 10 28,73 8 33 38,99
6 27 53,22 9 35 71,81
7 39 88,54 10 28 22,07
Tabla N8: Tabla para la seleccin del nmero de grupos por el algoritmo de -medias

Bajo el criterio de seleccin citado, se decide seleccionar 8 grupos ya que = 9,86 es


cercano a 10. Las variables ms caractersticas que definen a cada grupo son:
Grupo 1: Alumnos de modalidad presencial, turno maana, entre 18 y 20 aos, solteros,
sin hijos, que no trabajan y que cursan con los docentes Panella-Gallardo.
Grupo 6: Alumnos de modalidad presencial, turno maana, entre 18 y 20 aos, solteros,
sin hijos que cursan con las docentes Panella-Mussolini.
Grupo 2: Alumnos de modalidad presencial, turno tarde, entre 18 y 20 aos, solteros, sin
hijos que cursan con las docentes Butigu-Scattolini-Herrera.
Grupo 5: Alumnos de modalidad presencial, turno tarde, entre 18 y 20 aos, solteros, sin
hijos que cursan son los docentes Cabrera -Curti-Cassano-Bissio.
Grupo 4: Alumnos de modalidad presencial, turno tarde, entre 18 y 25 aos, solteros, sin
hijos que cursan con el resto de los docentes no enunciados.
Grupo 3: Alumnos de modalidad distancia, menores a 25 aos.
Grupo 7: Alumnos de modalidad distancia, mayores a 25 aos y en su mayora menores
a 45 aos.

19
Produccin y Tratamiento de Datos en Investigacin

Grupo 8: Alumnos de modalidad distancia, mayores a 45 aos, viudos o divorciados, con


hijos y con trabajo.
La cantidad de individuos que presentan las modalidades (Panella-Gallardo = 46,
Panella-Mussolini = 39 y Butigu-Scattolini-Herrera = 33) de la variable docente,
coinciden con el tamao de los grupos 1,6,2 respectivamente por lo que dichas modalidades tienen
un peso muy importante en la construccin de los grupos en el algoritmo de -medias.

Clasificacin por Algoritmos Jerrquicos


A efectos se realizar la clasificacin de los individuos por medio de algoritmos jerrquicos,
se calcula el mtodo de encadenamiento simple (vecino ms cercano) y el mtodo de Ward.

Clasificacin por Mtodo de Encadenamiento Simple (Vecino ms Cercano)


Es un algoritmo de aglomeracin donde es necesario calcular una matriz de distancias entre
las unidades de observacin. Para anlisis en cuestin, la distancia utilizada es la eucldea. Si la
distancia entre dos individuos o grupos de individuos tiende a cero, entonces stos individuos
tienen similitud, por lo que deben unirse formando nudos que sern agrupados posteriormente
hasta conseguir que todos los individuos se encuentren en un nico grupo.
La Tabla N9 muestra el proceso de clasificacin donde se asigna coordenadas negativas a
individuos que se agrupan en cada iteracin y coordenadas positivas a nudos obtenidos del
proceso de clasificacin. Adicionalmente se expone el ndice de la unin y la cantidad de
elementos que se agrupan en cada etapa.
Cantidad Cantidad
Primero ltimo ndice de Primero ltimo ndice de
Elementos Elementos
1 -51 -221 0 2 259 -216 257 1,75 255
2 -72 -181 0 2 260 256 259 1,76 257
3 -193 2 0 3 261 -49 260 1,78 258
4 -78 -179 0 2 262 258 261 1,82 261
5 -80 -167 0 2 263 -127 174 1,85 3
6 -240 5 0 3 264 70 262 1,85 263
7 -82 -262 0 2 265 -116 264 1,86 264
266 -232 265 1,93 265
257 253 255 1,63 254 267 263 266 2,34 268
258 -60 254 1,63 3 268 -252 267 2,34 269
Tabla N9: Clasificacin De La Nube De Puntos Por El Mtodo De Encadenamiento Simple
Analizando el dendrograma obtenido de la clasificacin por el mtodo del vecino ms
cercano, no es posible determinar una buena particin debido a que hay individuos que son muy
diferentes al resto lo que generan que el algoritmo los agrupe en las ltimas instancias del proceso
de clasificacin. Del anlisis de estos individuos (N252, N232, N116, N127 y N49) se
observan que muchos de ellos pertenecen al Grupo 8 definido en el algoritmo de -medias
(Alumnos de modalidad distancia, mayores a 45 aos, viudos o divorciados, con hijos y con
trabajo).
Por ltimo, se presenta el dendrograma correspondiente a este algoritmo de clasificacin.

20
Produccin y Tratamiento de Datos en Investigacin

Fig. 6.: Dendrograma del Mtodo del Vecino Ms Cercano (Distancia Eucldea)

Clasificacin por Mtodo de Ward


A diferencia del mtodo jerrquico anterior, este mtodo no requiere una matriz de
distancia, pero es necesario definir una medida global de heterogeneidad () a efectos de
particionar a los individuos en grupos. La medida se define como:

= ( ). ( )
=1 =1
Donde es el nmero de individuos del grupo y es la media del grupo .
Al iniciar el proceso de aglomeracin cada individuo forma un grupo por lo tanto = ,
= 1 y = 0. Posteriormente en cada etapa se plantean todas las posibilidades de
agrupamiento y se eligen aquellos dos clusters que producen el menor incremento en , esto es
equivalente a plantear que se seleccione aquella combinacin que produzca la menor suma de
cuadrados dentro de cada grupo. Si en una etapa los grupos y (individuos o grupos de
individuos) se unen, entonces deben verificar que:
.
[ . ( ). ( )]
+
La Tabla N10 muestra el proceso de clasificacin obtenido por el mtodo de Ward.
Adicionalmente se expone el ndice de la unin y la cantidad de individuos que se agrupan en
cada etapa.
Cantidad Cantidad
Primero ltimo ndice de Primero ltimo ndice de
Individuos Individuos
1 -51 -221 0 2 259 250 258 10,82 45
2 -72 -181 0 2 260 257 259 11,38 79
3 -193 2 0 3 261 233 260 11,52 91
4 -78 -179 0 2 262 240 246 12,9 26
5 -80 -167 0 2 263 255 262 13,26 62
6 -240 5 0 3 264 251 261 13,55 101
7 -82 -262 0 2 265 249 253 15,36 80
266 247 263 15,56 88
257 237 244 9,34 34 267 265 266 27,53 168
258 235 256 10,17 24 268 264 267 65,28 269
Tabla N10: Clasificacin De La Nube De Puntos Por El Mtodo De Ward

21
Produccin y Tratamiento de Datos en Investigacin

A continuacin, se presenta el dendrograma correspondiente a este algoritmo de


clasificacin (Fig. 7) y un grfico donde se presentan los 268 pasos del algoritmo con su ndice
asociado (Fig. 8).

Fig. 7.: Dendrograma del Mtodo de Ward

Fig. 8.: Pasos del algoritmo e ndice de agrupamiento

En la Fig. 8 se observa que, para las primeras iteraciones del algoritmo de Ward, las
distancias de los individuos son cercanas a cero, produciendo valores pequeos del ndice de
agrupamiento, mientras que en las ltimas 3 etapas el incremento es ms brusco. Esto determina
la necesidad de fijar 3 cortes en el dendograma a efectos de realizar el agrupamiento de la nube
de puntos; los mismos se efectan a un valor ndice de 65,28 27,53 15,56 observando que
la muestra se particiona en 2, 3 y 5 grupos respectivamente.
En el Anexo N2, se presenta cada particin de la nube de puntos, informando la cantidad
de individuos que integran cada clase, la suma de cuadrados dentro y la distancia de los 10
individuos ms caractersticos a su centro de gravedad.
Al observar todas las clasificaciones realizadas sobre la nube de puntos, se detecta que un
total de 16 estudiantes son caractersticos en cada particin (siempre aparecen

22
Produccin y Tratamiento de Datos en Investigacin

independientemente de la cantidad de grupos que se quiera dividir la nube de puntos). A


continuacin, se exponen esos individuos informando tambin la clase donde se han identificado
como caractersticos y las modalidades principales que presentan.
Clases Donde
Individuos Caractersticos Modalidades comunes que presentan
Aparecen
Alumnos de Modalidad Presencial, Solteros y
45, 79, 157, 216, 257, 268 2-1, 3-2 y 5-3
Sin Hijos.
Principalmente son alumnos de la Modalidad
Distancia, viudo o divorciado, salvo 2
individuos (49-18) que son de la Modalidad
18,49, 60, 90, 119, 127, 208, Presencial, turno tarde, uno de ellos trabaja y
2-2, 3-3 y 5-5
232, 237, 252 tiene hijos y el otro viven en la Residencia
Universitaria. Nuevamente se observan que
hay individuos que han sido incorporados al
Grupo 8 definido en el algoritmo de -medias.
De la particin de la nube de puntos en 3 grupos, se identifica que las clases formadas
corresponden principalmente a individuos de la modalidad de EaD, presencial turno maana y
presencial turno tarde, por lo que se detecta que las Modalidades de Cursado y el Horario de
Cursado son relevantes para la formacin de grupos. Este resultado era esperable debido a que
esas variables son las que mayor peso ejercen sobre el primer eje factorial y es donde se concentra
la mayor cantidad de inercia. La Fig. 9 presenta al dendograma obtenido por el mtodo de Ward
y resalta la variable Horario de Cursado 15.

Fig. 9.: Dendrograma del Mtodo de Ward (Identificando Modalidad y Horario de Cursado)

Con la particin de la nube de puntos en 5 grupos, el anlisis se enriquece debido a que


puede observarse que junto a los alumnos de la Modalidad de Educacin a Distancia, aparecen
los individuos 18, 49 y 208 ya detectados como caractersticos. Por su parte, al analizar a la
Modalidad Presencial, una variable que toma relevancia es Docente ya que las comisiones de

15
La variable Modalidad de Cursado, est fuertemente ligada a Horario de Cursado por lo que
solamente se representa esta ltima.
23
Produccin y Tratamiento de Datos en Investigacin

la maana se dividen en alumnos de que cursan con Panella Mussolini (Clase 1) y en alumnos
que cursan con Panella Gallardo (Clase 4), mientras que las comisiones de la tarde, dividen a
Cabrera Lardone del Resto de los docentes que dictan clase en el turno tarde (todas las otras
categoras no enunciadas).

Fig. 10.: Dendrograma del Mtodo de Ward (Docentes Modalidad Presencial)

Por ltimo, puede observarse que existen dentro del grupo Resto de Docentes Turno
Tarde, un total de 4 alumnos que pertenecen a las comisiones del turno Maana (Panella
Mussolini y Panella Gallardo) que entre sus caractersticas presentan la modalidad Residencia
Universitaria como lugar de vivienda. sta caracterstica los ha diferenciado del resto de sus
compaeros y los ha trasladado a los grupos del turno Tarde.

Conclusin
Este trabajo se presenta como una primera aproximacin para el anlisis de una encuesta
realizada a los estudiantes de AMI, que cursaron durante el primer cuatrimestre del ao 2016 en
la FCE (UNRC), en las modalidades de educacin presencial y educacin a distancia. Los factores
de desercin definidos permiten obtener informacin que abarca desde las caractersticas
individuales del alumno hasta lo percibido por el mismo, en lo relativo al marco institucional,
pero para comprender el gran volumen de datos es necesario realizar un estudio exploratorio
multivariado que haga posible observar simultneamente una amplia variedad de caractersticas
las que deben ser analizadas con una visin de conjunto.
Para dar respuesta a esta necesidad, se plantea en primer lugar un anlisis descriptivo sobre
la totalidad variables obtenidas (41 variables), posteriormente se determina el conjunto que mejor
explica a los datos en cuestin y que mejora la representacin de los datos en los primeros planos
factoriales quedndonos as con un total de 13 variables. Cabe destacar que producto del proceso
de seleccin, las variables definidas como Factores Institucionales han sido descartadas.
Luego se analiza el conjunto de variables activas por medio de un AFCM y se detecta que
las variables Modalidad de Cursado, Horario de Cursado, Docente y Minutos que tardan
para llegar a la UNRC son relevantes a efectos de poder explicar la variabilidad de la nube de

24
Produccin y Tratamiento de Datos en Investigacin

puntos oponiendo en el primer plano factorial a los alumnos de Modalidad Presencial en ambos
Horarios de Cursado versus los de Modalidad EaD.
Con las coordenadas factoriales de los estudiantes del AFCM, se realizan 3 procesos de
clasificacin (Algoritmo de - medias, encadenamiento simple y Mtodo de Ward) y se presentan
las principales conclusiones. El algoritmo de -medias permiti encontrar 8 grupos bien
diferenciados. Por su parte el mtodo por encadenamiento simple (Vecino ms Cercano) ha sido
sensible a individuos atpicos, principalmente estudiantes mayores de 45 aos, viudos o
divorciados, con hijos y con trabajo. Por ltimo, el mtodo de Ward ha sido el que mejores
particiones ha producido, donde se ha podido identificar que las variables Modalidad de
Cursado, Horario de Cursado y Docente son determinantes en la formacin de grupos. Como
puede observarse los 3 mtodos han sido capaces de detectar a aquellos individuos atpicos.
Debido al gran volumen de informacin que se dispone, a la alta variabilidad y que ya se
tiene un primera aproximacin a efectos de entender a la muestra en cuestin, se decide continuar
con el anlisis de los datos combinando variables que pueden llegar a explicar la misma
variabilidad, como por ejemplo Modalidad de Cursado y Horario de Cursado y probar otros
algoritmos de clasificacin para determinar aquella particin que permita explicar de la mejor
manera posible a todos los factores que caracterizan a la muestra de estudiantes obtenida.

25
Produccin y Tratamiento de Datos en Investigacin

Bibliografa
Baronio, A. M., & Vianco, A. M. (2015). Anlisis de la Informacin - PIE 5. En A. M. Baronio, & A. M.
Vianco, Cuadernos de Econometra (Primera ed., pgs. 1-193). Villa Mara.

Castao, E., Galln, S., Gmez, K., & Vsquez, J. (2004). Desercin estudiantil universitaria: una
aplicacin de modelos de duracin. Lecturas de Economa, 60(60), 39-65.

Castao, E., Galln, S., Gmez, K., & Vsquez, J. (2007). Anlisis de los factores asociados a la
desercin y graduacin estudiantil universitaria. Lecturas de Economa, 65(65), 9-36.

Daz Peralta, C. (2008). Modelo Conceptual Para La Desercin Estudiantil. Estudios pedaggicos,
34(2), 65-86.

Hernndez Sampieri, R., Fernndez Collado, C., & Baptista, L. (2008). Metodologa de la Investigacin.
La Habana: Flix Varela.

Montes Gutirrez, I. C., Almonacid Hurtado, P. M., Gmez Cardona, S., Zuluaga Daz, F. I., & Tamayo
Zea, E. (2010). Anlisis de la desercin estudiantil en los programas de pregrado de la
Universidad EAFIT. (C. Direccin de Investigacin y Docencia Universidad EAFIT Medelln,
Ed.) Medelln: Serie Cuadernos de Investigacin.

Pea, D. (2002). Anlisis de Datos Multivariantes. Madrid: McGraw-Hill.

Vsquez Velsquez, J., Castao, E., Galln Gmez, S., & Gmez Portilla, K. (2003). Determinantes de
la desercin estudiantil en la Universidad de Antioquia. (4), 1-38.

26
Produccin y Tratamiento de Datos en Investigacin

Anexos
ANEXO N1: Valores test de todas las modalidades para los primeros 5 ejes factoriales.

Coordenadas Coordenadas
Variables Modalidades Variables Modalidades
1 2 3 4 5 1 2 3 4 5
Modalidad

Entre 20 y 40 -9,27 4,90 2,81 -0,94 -5,24

Minutos Para Llegar a


Distancia 15,63 -0,15 -1,79 -1,28 -1,17
Ms de 40
-3,46 -5,37 -1,48 5,94 -0,58
Presencial -15,63 0,15 1,79 1,28 1,17 minutos

la UNRC
Menos de 20
Maana -8,32 -8,84 5,06 -8,59 2,11 -5,43 -2,11 -0,23 -1,55 8,59
Minutos
Horario de
Cursado

Soy alumno de la Soy alumno de la


modalidad de 15,63 -0,15 -1,79 -1,28 -1,17 modalidad de 15,63 -0,15 -1,79 -1,28 -1,17
EaD EaD
Tarde -7,83 8,97 -3,20 9,88 -0,90

Aos desde

Secundario
De 5 a 10 aos 6,15 0,10 -8,84 -3,42 0,72

Egreso
[18-20] -13,98 -0,33 2,83 0,60 0,57
Ms de 10 aos 12,33 1,00 6,95 1,22 0,91
[21-25] 2,35 -1,12 -8,71 0,34 -2,04
Edad

[26-35] 10,76 1,55 -2,09 -4,56 -0,72 Menos de 5 aos -14,65 -0,93 -0,26 1,17 -1,25
[36-45] 4,86 -0,40 4,53 1,73 0,65 T Butigu-
Mayor de 45 5,63 0,06 8,00 5,61 3,02 Scattolini - P
-2,27 4,70 -1,63 1,16 4,00
Casado o Curti-Cassano-
Estado Civil

11,41 1,26 1,01 -1,93 0,44


Conviviente Bissio
Soltero -12,19 -0,99 -2,99 -0,01 -1,82 T Butigu-
Viudo o Scattolini - P -4,39 3,20 -2,65 7,12 2,94
3,69 -0,73 6,44 5,95 4,45
Divorciado Herrera
No -11,51 -0,48 -6,18 -2,28 -1,06 T Cabrera - P
Hijos

S 11,51 0,48 6,18 2,28 1,06 Curti-Cassano- -2,51 2,02 -1,48 4,97 -4,35
La Pampa - Santa
Docente Bissio
6,31 3,51 1,34 0,21 1,62
Lugar Del Que

Fe - San Luis T Cabrera - P


Provienes

-3,95 5,74 0,18 3,02 -4,09


Otros Dpto de Lardone
0,28 6,10 0,07 -1,01 2,51
Crdoba T Panella - P
-5,74 -6,34 3,35 -5,49 2,53
Resto del Pas 2,03 0,87 1,37 0,58 -0,11 Gallardo
Ro Cuarto -5,94 -8,41 -1,76 0,44 -3,34 T Panella - P
-4,85 -4,89 3,09 -5,48 0,08
Con integrantes Mussolini
4,40 -9,87 -0,25 5,06 -3,00 TUT Cassano 3,55 1,35 -1,75 -2,96 -1,25
Con Quin

de tu familia
Vives?

Otras personas TUT Curti 4,66 -1,03 -0,07 1,99 -2,24


/Otros -1,88 5,66 -4,06 -1,94 6,84 TUT Lardone 6,47 0,05 -0,30 -0,92 2,78
estudiantes TUT Mussolini 6,07 -1,78 -3,37 -0,94 -3,00
Solo/a -3,74 7,17 3,72 -4,49 -2,13 TUT Scattolini 7,66 1,25 1,92 0,25 1,17
Alquilada -2,46 11,06 3,27 -5,27 -3,59 Alimentacin -1,80 -2,72 -2,93 1,42 7,45
Gastos De Mayor
Vivienda
Tipo De

Propia 1,79 -11,51 -0,86 5,25 -1,76 Alquiler -3,96 11,08 2,03 -4,09 -1,67
Relevancia

Res. Univ. / Otro Apuntes -3,92 -8,28 -0,89 2,37 -3,60


1,29 1,14 -4,75 -0,07 10,62
tipo Otros Gastos 3,33 -0,95 5,16 -0,74 -1,69
Transporte 7,68 -1,02 -1,49 1,46 0,51
Vestimenta 1,43 -0,97 -3,66 0,81 -1,61
Trabajas?

No -12,67 0,61 2,85 -0,80 1,58

S 12,67 -0,61 -2,85 0,80 -1,58

ANEXO N2: Particin de la nube de puntos e individuos caractersticos.

1. Particin de la nube de puntos en 2 clases (ndice = , )


Nmero
de Clases Tamao ()
Grupos
1 168 286,77
2 588,35
2 101 301,58

Distancia al Distancia al
Individuos Individuos
Nmero Centroide Nmero Centroide
Clase 1 Clase 2
Identificador Gravedad de Identificador Gravedad de
(2-1) (2-2)
Su Clase Su Clase
1 45 2,04 1 18 2,55
2 79 1,79 2 49 2,52
3 81 1,74 3 60 2,29
4 157 1,74 4 90 2,87

27
Produccin y Tratamiento de Datos en Investigacin

Distancia al Distancia al
Individuos Individuos
Nmero Centroide Nmero Centroide
Clase 1 Clase 2
Identificador Gravedad de Identificador Gravedad de
(2-1) (2-2)
Su Clase Su Clase
5 209 1,77 5 119 2,91
6 215 1,75 6 127 3,06
7 216 2,01 7 208 2,34
8 219 1,75 8 232 2,33
9 257 1,81 9 237 2,11
10 268 2,39 10 252 3,05

2. Particin de la nube de puntos en 3 clases (ndice = , )


Nmero
de Clases Tamao ()
Grupos
1 80 84,01
3 2 88 161,35 546,93 20,06
3 101 301,58

Distancia al Distancia al Distancia al


Individuos Individuos Individuos
Nmero Centroide Nmero Centroide Nmero Centroide
Clase 1 Clase 2 Clase 3
Identificador Gravedad de Identificador Gravedad Identificador Gravedad
(3-1) (3-2) (3-3)
Su Clase de Su Clase de Su Clase
1 3 1,68 1 268 2,29 1 127 3,06
2 147 1,41 2 79 1,96 2 252 3,05
3 9 1,32 3 45 1,93 3 119 2,91
4 71 1,28 4 216 1,89 4 90 2,87
5 33 1,27 5 191 1,85 5 18 2,55
6 211 1,25 6 180 1,83 6 49 2,52
7 25 1,24 7 39 1,82 7 208 2,34
8 120 1,24 8 257 1,78 8 232 2,33
9 203 1,24 9 157 1,71 9 60 2,29
10 52 1,22 10 220 1,70 10 237 2,11

3. Particin de la nube de puntos en 5 clases (ndice = , )


Nmero
de Clases Tamao () 16
Grupos
1 39 34,09
2 26 20,51
5 3 62 118,63 505,80 9,84
4 41 30,98
5 101 301,58

Distancia al Distancia al Distancia al


Individuos Individuos Individuos
Nmero Centroide Nmero Centroide Nmero Centroide
Clase 1 Clase 2 Clase 3
Identificador Gravedad Identificador Gravedad Identificador Gravedad
(5-1) (5-2) (5-3)
de Su Clase de Su Clase de Su Clase
1 147 1,57 1 126 1,28 1 268 2,21
2 3 1,52 2 200 1,23 2 79 1,94
3 33 1,47 3 53 1,17 3 45 1,85
4 71 1,19 4 24 1,15 4 216 1,82
5 203 1,18 5 165 1,15 5 180 1,81
6 211 1,16 6 201 1,02 6 191 1,81
7 9 1,14 7 20 0,98 7 39 1,79
8 54 1,1 8 190 0,98 8 257 1,73
9 25 1,05 9 98 0,93 9 157 1,67
10 251 1,03 10 230 0,92 10 31 1,65

16
Puede observarse que para calcular el valor se requiere particiona de la nube de puntos en 4 y 5
grupos, a pesar de ello, cabe destacar que no es posible realizar una particin en 4 grupos por medio de
un corte en el dendograma, por lo tanto, el lenguaje R determina aquellas particiones que minimicen la
Suma de Cuadrados dentro de cada Clase.
28
Produccin y Tratamiento de Datos en Investigacin

Distancia al Distancia al
Individuos Individuos
Nmero Centroide Nmero Centroide
Clase 4 Clase 5
Identificador Gravedad de Identificador Gravedad de
(5-4) (5-5)
Su Clase Su Clase
1 52 1,14 1 127 3,06
2 120 1,14 2 252 3,05
3 118 1,09 3 119 2,91
4 151 1,09 4 90 2,87
5 12 1,04 5 18 2,55
6 51 1,04 6 49 2,52
7 149 1,04 7 208 2,34
8 175 1,04 8 232 2,33
9 186 1,04 9 60 2,29
10 221 1,04 10 237 2,11

29

También podría gustarte