Está en la página 1de 7

Regresión Factorial Correspondencias Conglomerados Discriminante

Objetivos Determinar cuáles son los 1.determinar el tipo de AF a.Examina y representa la El objetivo es clasificar objetivo fundamental es
objetivos específicos del que se va a utilizar de asociación entre una muestra de entidades predecir el valor que
estudio y qué conjunto de acuerdo con el categorías de columna o en un número más adquirirá un caso en una
variables pueden ofrecer conocimiento previo o no fila. pequeño de grupos variable criterio a partir
una explicación suficiente del campo de estudio: mutuamente excluyentes del conocimiento de las
-Valorar la naturaleza y la Exploratorio o a partir de las similitudes puntuaciones que
dirección e la relación confirmatorio. entre ellas. adquiere en un conjunto
entre una variable 2.Después, se trata de 1.Desarrollar una de variables predictivas.
(dependiente) y un decidir si se van a agrupar tipología o clasificación. 1º Determinar si existen
conjunto de variables las variables o los casos. 2.Investigación de diferencias significativas
(independientes 3. Establecer con claridad esquemas conceptuales entre los perfiles
multivariantes de dos o más
2.Predecir los valores de los objetivos concretos útiles para agrupar
grupos (descriptivo).
una variable (criterio) a que se persiguen tipo q entidades.
2º El análisis discriminante
partir del conocimiento tipo r 3.Generar hipótesis trata de establecer el
de los valores de otras condiciones mediante la exploración conjunto de variables que
variables (predictoras). de datos. expliquen las diferencias en
4.Probar hipótesis, o los perfiles entre los grupos
intentar determinar si los (d).
grupos definidos 3º Usar el conjunto de
mediante otros variables para desarrollar
una función que represente
procedimientos están de
la máxima separación o
hecho presentes en los
discriminación entre los
datos. grupos (d).
5.Reducir datos..
4º Establecer reglas de
clasificación de nuevos casos
a los grupos a partir de sus
puntuaciones (predictivo).
Los objetivos tienen que ver
con la discriminacion y la
clasificacion.
Diseño asegurar la eficacia del Condiciones previas: Se trata de delimitar las 1-Selección de variables: Seleccionar variables:
análisis 1. La calidad del análisis condiciones relativas a las (No incluir variables muy Establecer si las variables
-mediante un adecuado depende de la calidad de variables y al tamaño de correlacionadas) que van a tomarse en
tamaño de la muestra (15 los datos. la muestra. 2-Estandarización de cuenta cumplen una serie
y 20.casos por variable) 2.Las variables del AF variables: (tipificar) de condiciones previas.
normalmente son es necesario que en la 3-Detección de outliers V. depe=categorica
métricas tabla de contingencia no 4- Determinación de la V. inde=metrica
Muestra: Debe exista ninguna celdilla medida
minimizarse el número de con pocos casos.Tampoco - Tamaño de la muestra:
variables incluidas. debería haber una gran tamaño adecuado de la
Debería haber al menos diferencia en el número muestra para que los
50 casos. La ratio entre de casos de unas celdillas resulta-dos sean estables
casos y variables debería y de otras. y extrapolables.
ser al menor de 5 a 1. Es conveniente que exista
una relacion adecuada
entre el tamaño de la
muestra y el nº de
variables predictivas.

- División de la muestra:
Elaborar muestras de
análisis y de validación
para llevar a cabo una
validación cruzada.
Supuestos Linealidad: la relación El principal supuesto previo El análisis de Al igual que en análisis 1)Normalidad: La función
entre las variables se es que exista suficiente correspondencias carece factorial, el discriminante minimiza la
ajusta a una línea recta. correlación significativa de supuestos previos conglomerados carece de probabilidad de errores
entre las entidades a
Normalidad: los residuos es conveniente que las supuestos previos rígidos. en la clasificación de los
factorializar.
se distribuyen de una categorías de las casos si las variables
Se debe valorar:
forma que se ajusta a una -Matriz de correlación: Para variables sean 2 condiciones: presentan una
curva normal que esta matriz sea exhaustivas y Representatividad: Los distribución normal.
Homocedasticidad: la adecuada, ser superiores a excluyentes, y casos seleccionados
distribución de residuos 0,30. directamente representan a grupos 2)Matriz de covarianzas:
es similar para diferentes Det. matriz(-)=correl (+) comparables. “reales” en la La probabilidad de
valores pronosticados.la población. errores en la clasificación
varianza es constante -Prueba de KMO: determina será menor si la matriz
si la medida de la muestra es
Independencia de los Multicolinealidad: Se han de varianza-covarianza es
adecuada para llevar a cabo
residuos: los residuos no eliminado variables que equivalente en todos los
un análisis factorial.
se encuentran KMO (-)= AF (-) sólo aportan información grupos. Para comprobar
correlacionados entre sí. siguiendo el baremo de redundante. lo más habitual es M de
(Durbin-watson >0.90excelente y <0.50 Box.
inaceptable.
3)Multicolinealidad:
-Test de esfericidad de consiste en que dos o
Bartlett: Se usa para más variables
comprobar la hipótesis de
independientes están
que la matriz de
altamente
correlaciones es una matriz
identidad (aquella en la que correlacionadas, por lo
no hay relación entre una que una variable puede
variable y todas las demás). venir muy bien explicada
Se basa en el cálculo de un o predica por otras
valor chi-cuadrado. variables y, por ello,
-Correlación anti-imagen: Es añadir poca capacidad
la inversa de la suma de las explicativa al conjunto
correlaciones de cada
completo.
variable con todas las demás.
cor. anti (+)= malo
Extracción -Seleccionar un método Se trata de determinar el - Discretizar aquellas 1 -Método de Se trata de estimar las
de extracción más número adecuado de variables que no conglomeración: seleccionar funciones discriminantes
adecuado. (introducir, factores a retener como contengan valores un método de y evaluar la exactitud
resultado del AF. conglomeración.(si se
selección hacia delante, discretos. predictiva mediante la
CRITERIOS: desconoce Nº de
hacia atrás, paso a paso) -Definir un tratamiento matriz de clasificación.
-Varianza común conglo=jerárquico; si se
-Valorar la significación explicada:el conjunto de para las categorías sin conoce= no jerárquico)
estadística. factores extraídos no ningún valor conocido -Método de cálculo:
-Estimar la capacidad de debería suponer una gran (perdidas). 2- Determinar las distancias: introducir todas las
las variables pérdida de información - Definir el método de valorar las distancias que variables o elegir un
pronosticadoras para -criterios de raíz latente:Se normalización. existen entre las entidades método de selección
predecir la variable debería mantener sólo - Determinar si se (matriz de distancias, cuanto “paso a paso”.
criterio (capacidad aquellos factores que emplearán variables y/o más pequeña sea la - Significación: valorar en
tengan un autovalor distancia más proximidad).
explicativa). categorías qué medida cada una de
superior a 1.
-Determinar si cualquiera suplementarias. las variables establece
- Criterio de contraste de 3- Determinar el número de
de las observaciones caida: Examina el gráfico de - Decidir el número de conglomerados: establecer diferencias entre las
ejerce una influencia sedimentos que representa dimensiones que se van a el número de medias de los grupos.
indebida en los el autovalor de cada uno de extraer. conglomerados que van a (+)Wilks= (+) diferencias.
resultados. los factores unidos por una La principal tarea de esta formar parte de la solución
línea. El paso del autovalor fase tiene que ver con la final. Funciones: determinar la
de un factor al del siguiente decisión de cuántas El historial de capacidad discriminante
es alto en los primeros dimensiones es adecuado conglomerados, el diagrama de cada función y
factores y bajo en los de témpanos y el
retener, conservando los determinar el número de
últimos. Se trata de dendograma ayudan a
principios de funciones discriminantes
encontrar el punto de tomar la decisión.
inflexión, allí donde la línea interpretabilidad y que es adecuado retener.
empieza a sedimentar. Se parsimonia. 4- Replanteamiento de la Para esto se usa
forman tantos factores solución: Examinar la autovalor, varianza
como haya antes de ese estructura de cada explicada y correlacion
punto conglomerado y decidir si canonica.
hay o no que replantear la
-Heterogeneidad de la solución.
muestra
-Criterio establecido a priori.
Interpretación -Interpretar la ecuación determinar el contenido a)Analizar la asociación 1. Asignación a -Evaluación de las
de regresión: valorar en específico de cada uno de los entre las categorías. conglomerados: asignar funciones: establecer la
qué medida varían los factores extraídos. las entidades a cada uno contribución específica
valores de la variable b)Determinar el de los conglomerados de cada variable
-Saturaciones o cargas
criterio por cada variación contenido sustantivo de de la solución final. (Ponderaciones
factoriales: Correlación entre
unitaria de las variables cada una de las variables cada una de las discriminantes) a cada
pronosticadoras originales y cada uno de los dimensiones, hasta llegar 2. Denominación de los función y el contenido
factores extraídos. a denominarlas. conglomerados: Hay que sustantivo de éstas
-Se trata de valorar cuál es determinar cuál es el .(ponderaciones de
la aportación específica -Rotación de factores: Varía c)Determinar grupos de contenido estructura)
de cada una de las la posición de los ejes categorías. sustantivo de cada uno
variables pronosticadoras (factores), pero no la de los de los conglomerados y, a -Capacidad predictiva:
puntos (variables).
d)Establecer la partir de ahí, asignarles .valorar en qué medida
puntuación de cada caso un nombre las funciones consiguen
-Valoración de las
comunalidades: Las variables en las dimensiones (diagrama de perfiles). predecir la pertenencia a
con baja comunalidad extraídas. los grupos. Para ello, se
presentan bajas puede analizar la matriz
correlaciones con el de clasificación
conjunto de las demás
variables (comunalidad sirve -Discriminación entre
para determinar en qué grupos: deducir los rasgos
medida cada variable aporta
específicos de cada grupo
información a la solución
a partir de sus
factorial).
puntuaciones
-Puntuaciones factoriales: discriminantes en las
Valor que adquiere cada uno funciones.
de los casos en cada uno de
los factores finalmente
extraídos. Se expresa en
puntuaciones Z
Validación Submuestreo Validar los resultados En la fase de validación se Se trata de valorar en qué -Dividir los grupos
mediante la repetición trata de replicar la medida los resultados aleatoriamente en la
1. Probar con otras del análisis en otra dispersión de las obtenidos son muestra de análisis y en
variables alternativas muestra o mediante un categorías en el espacio generalizables a la una ampliación de la
submuestreo. perceptual. población y si los grupos muestra.
2. excluyendo aquellos Una forma de validar es formados son
casos O mediante: aplicar el mismo análisis representativos. -Utilizando los perfiles de
-Generalización (valorar si de correspondencias a los dos grupos en cada
3.Utilizar diversos los resultados son una submuestra. Métodos disponibles: variable para garantizar
procedimientos de aplicables a muestras que se corresponden con
selección diferentes). Otra forma de validar es a)Utilizar una muestra la definición de los
modificar alguna de las diferente y compararla grupos.
4. Obtener muestras -Influencia de los casos condiciones del diseño y con la original
adicionales (en qué medida los la extracción de las
resultados se ven dimensiones. b)Dividir la muestra en
influidos por casos El objetivo es evaluar si el dos mitades y analizar
concretos). análisis es dependiente cada una por separado
de sólo unos pocos
-Replicación (los resultados objetivos y/o atributos. c)Determinar los
deberían ser similares a los centroides de los grupos
que se obtendrían en otras y utilizarlos para
investigaciones). redefinirlos
-Estabilidad (la estructura
factorial debería ser estable
de unos análisis a otros).

-Impacto de los outliers


(impacto que tienen los
casos extremos, mediante
su inclusión y su exclusión
en el análisis).
Regresión Es una extensión del análisis de correlaciones, pues trata de determinar en qué medida los cambios en los valores de una variable/s
están asociados a cambios en los valores de otra.
-Pretende descubrir qué variable o qué variables pueden predecir mejor los valores que adquirirá otra variable.
-La variable predictiva se denomina criterio, mientras que la variable o variables que sirven para predecir se llaman
pronosticadoras. Técnica de dependencia
-Criterio de mínimos cuadrados
-Errores de predicción
-Capacidad predictiva
-Colinealidad y multicolinealidad (reduce poder predictivo)
Factorial Técnica de análisis que trata de determinar si es posible reducir un conjunto de datos a otro significativamente menor.
-Técnica de interdependencia en la que todas las variables se consideran a la vez, sin variables indepen. O depen.
-Solo se toma en cuenta la varianza común tratando de evitar la específica la de error.
-Diferencias con el análisis de componente principales
-Limitaciones del análisis
Datos originales --> Matriz de correlaciones--> Matriz factorial
Correspondencias Extensión de las tablas de contingencia y del análisis factorial pero con datos categóricos
-Su propósito es tratar de convertir los valores de las variables categóricas en valores métricos.
-Y representar la posición relativa de cada una de las categorías en un espacio de unas pocas dimensiones
- tabla cruzada de frecuencias esperadas->chi cuadrado fi->v de cramer->reducción dimensional(tipos y normalización)->gráficos
-ventajas
Conglomerados Tiene como objetivo formar grupos de objetos, que se basa en alguna medida de similitud entre ellos. El objetivo es clasificar una
muestra de entidades en un número más pequeño de grupos (mutuamente excluyentes, homogéneos y heterogéneos entre sí) a
partir de similitudes.
-Técnica interdependiente
-Matriz de similitudes(tipos)-->Método de conglomeración(jerárquico-no jerárquico)
-Limitaciones: carga heurística, diversidad de origen, indeterminación, imposición de estructura
Discriminante Se trata de analizar cuáles son las variables que contribuyen en mayor medida a discriminar a los sujetos en los diferentes grupos.
-Técnica que asigna un individuo a un grupo definido en función de sus características
-Técnica de dependencia: Variable que define grupo=dependiente / Variable que define caract. del individuo= inde
Perfiles multivariantes->selección de variables discriminantes->funciones discriminantes->reclasificación

También podría gustarte