Está en la página 1de 18

C/ República del Salvador 29 2D

Santiago de Compostela
659149284 / 881939440

TEMA 1: EL ANALISIS MULTIVARIANTE EN PSICOLOGIA

1.- INTRODUCCION:

La ciencia no es la única preocupada en la adquisición de conocimiento. Científicos y no científicos


intentan conocer. Lo que caracteriza al científico no es tanto lo que hace sino como lo hace, a través
del método científico.
El psicólogo es un científico socia que debe desligarse de lo meramente especulativo. Debe
transformar especulaciones, cábalas e hipótesis en verdades probables (uso de la estadística).

2.- MÉTODO CIENTÍFICO:

 Definición y características:
Es el procedimiento mediante el cual podemos alcanzar un conocimiento riguroso y objetivo de la
realidad. Es un conjunto de reglas para investigar. Se trata de una herramienta para conocer la
realidad objetivamente que tiene dos características fundamentales:
 Carácter empírico: basado en la experiencia, la observación y el control.
 Carácter replicable: sus pasos y elementos pueden repetirse idénticamente.

 Supuestos o principios:
 La naturaleza es comprensible. Se estructura u organiza siguiendo algún tipo de leyes. Es
posible detectar ciertas regularidades.
 La naturaleza es universal/uniforme. La existencia de las regularidades encontradas (y sus
explicaciones) tienen carácter universal y uniforme. Sin embargo, este principio no resulta
del todo asumible para las ciencias sociales ya que existe una variabilidad intrínseca al
comportamiento humano que hace necesario el uso de la estadística para elaborar modelos
del comportamiento (variables aleatorias vs. deterministas)
 La naturaleza tiene una causalidad finita. Los agentes que pueden estar originando un
determinado fenómeno no sólo son conocibles, sino que además son limitados, finitos. El
Principio de Parsimonia nos lleva a elegir siempre la explicación más simple para dar
cuenta del problema

 Marco conceptual para la investigación empírica:


El Proceso General de una Investigación se sustenta en tres pilares metodológicos, íntimamente
relacionados con 4 formas de validez de la investigación (Shadis, Cook y Campbell, 2002)

 El Diseño: Validez Interna y Externa


El diseño es un plan que proporciona una estructura para integrar todos los elementos de un
estudio empírico y que todos los elementos sean CREÍBLES, LIBRES DE SESGO Y
GENERALIZABLES (Daniels, 2010)
- Partiendo de un problema, el DISEÑO se encarga de:
•Selección y asignación de los participantes
•Control de las variables extrañas potenciales
- Tipos de Validez que determinan la calidad de un DISEÑO:
•Validez Interna: capacidad de controlar el efecto de terceras variables que pueden ser
causas alternativas a la causa investigada
•Validez Externa: capacidad de generalizar los resultados a otros participantes, a otros
contextos y a otros momentos temporales
- El equilibrio óptimo entre “ambas” es uno de los objetivos más deseables de un buen diseño.
•Los estudios manipulativos o experimentales priman la interna
•Los descriptivos o correlacionales priman la externa
1
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

 La Medida: Validez de Constructo


Consiste en la identificación, definición y medición de las variables observables y no
observables
•Medición: es la generación de valores numéricos o datos que son la entrada de los
procedimientos del Análisis Estadístico (Martínez Arias, 1995)
- Los datos deben de poseer un alto grado de Fiabilidad (que el error aleatorio se haya
minimizado)
- La validez relacionada con la medida es la Validez de Constructo o la capacidad de definir y
operativizar apropiadamente el constructo (variables) de la investigación

 El Análisis: Validez de Conclusión Estadística


Consiste en la estimación de parámetros y prueba de hipótesis acerca del objetivo de
investigación con los procedimientos estadísticos más apropiados
- Actualmente se demanda mayor énfasis en la exactitud de la estimación de parámetros que
en la prueba de hipótesis (Maxwell, Kelley y Raush, 2008)
•Valorando aspectos como el tamaño del efecto y la significación práctica y clínica de los
resultados (Thompson, 2002)
- El tipo de validez relacionada con el análisis es la Validez de la Conclusión Estadística (si el
valor de las estimaciones se aproxima al de la población)

Aunque se utilicen técnicas estadísticas sofisticadas los resultados no mejoran si el diseño es


incorrecto o no se utilizan las medidas apropiadas.

3.- IMPORTANCIA DE LOS MODELOS


Nadie duda de que el comportamiento humano y el comportamiento de los grupos o de las
organizaciones sea algo complejo y sobre el que confluyen multitud de factores.
Con un objeto así, la Psicología como ciencia parece tenerlo un poco difícil. La solución es el
método.
Los científicos sociales son conscientes de que gran parte de los fenómenos se explican por la
intervención de múltiples variables.
 Los investigadores deben dotarse de herramientas estadísticas para poder comprobar cómo
distintas variables se combinan para explicar los comportamientos objeto de estudio (Análisis
multivariante).
 La mejor forma de representar el conocimiento que poseemos de la realidad y de las leyes que
la rigen es la elaboración de modelos.
 Su “relativa” uniformidad hace que dichos modelos, cuando se trata de explicar el
comportamiento humano, tengan que ser Modelos Estadísticos.
 Además, dado el carácter finito de la causalidad, el científico debe esforzarse siempre en el
desarrollo de modelos lo más parsimoniosos posible

4.- MODELOS
Representación formal, estructurada, concisa y clara de la realidad que permite recoger y explicar
sus propiedades y las leyes que la rigen, posibilitando la realización de predicciones. Podemos tener
varios tipos de modelos:
 Icónicos: imágenes físicas, tridimensionales y a escala. Ej. Maquetas.
 Analógicos: dibujos que reproducen la estructura de un elemento. Ej. Gráficas.
 Teoréticos: Organización de ideas o estructura de un fenómeno en base a un lenguaje
determinado (matemáticas, lógica,…) que ayudan a explicar el comportamiento o los
fenómenos investigados. Pueden ser de 2 tipos:
o Informáticos: expresados en lenguaje de programación.
2
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

o Matemáticos: expresados en lenguaje matemático y permiten realizar PREDICCIONES. Son


los que nos interesan a nosotros. Los modelos estadísticos son un subtipo de modelos
matemáticos.
Hay que diferenciar modelos de métodos, de técnicas y de análisis.

MODELOS ESTADÍSTICOS
Tienen dos partes, la combinación de estas debe ofrecer un resultado sobre el objeto de la
investigación.

Y=S+A: forma lineal más básica, sumando componentes:


 Aleatoria (A): Lo que no podemos explicar, Término Error (E).
 Sistemática (S): Lo que permite entender porque se produce Y. Es un conjunto de variables
combinadas de forma sistemática.

Es normal trabajar con una combinación de variables explicativas de Y=f(x)+E, donde:


f(x)=β0+β1X1+β2X2. Por ejemplo:
Motivación=X1
Horas de estudio=X2

MODELO LINEAL GENERAL


Y= β0+β1X1+β2X2+…+βnXn+E
Objeto de la investigación (VD): Y
Variables independientes (VI): X1,X2
Peso, efecto o importancia de cada variable específica en el modelo: β1,β2
Término corrector del desfase en la escala entre variables o entre la parte explicada (Y) y la parte
explicativa (S)= β0
Error, parte aleatoria=E

ELECCIÓN DEL MODELO


Es lo más difícil e importante de la investigación.
Tratar de adaptarse a lo que queremos explicar.
Debe ser lo más simple posible. Intentar usar un modelo lineal, si no es posible escoger otro más
complejo, logarítmico, exponencial, etc.
Debe ser parsimonioso, intentar explicar el fenómeno con el menor número posible de variables.

5.- ETAPAS DE UNA INVESTIGACIÓN


1. PLANTEAMIENTO DEL PROBLEMA
El problema es una pregunta para la que no tenemos respuesta. Es por tanto el punto de partida de la
investigación que condiciona los métodos concretos (tipo de diseño y metodología) y técnicas
particulares (herramientas estadísticas, análisis de datos) a aplicar para llegar a una respuesta válida.
Requisitos que debe cumplir:
 Resoluble.
 Contrastable empíricamente: si las relaciones son indemostrables no tiene carácter científico.
 Formulable operativamente.
 Expresar una relación entre variables
 Claro: sin ambigüedades.

2. FORMULACIÓN DE OBJETIVOS Y PLANTEMIENTO DE HIPÓTESIS


Las hipótesis son posibles explicaciones al problema que permiten comprender y solucionar el
mismo. Proponer una posible explicación del problema exige pensar qué variables pueden estar
interviniendo. De ahí surgen los objetivos de la investigación que para formularlos tienen que:
3
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

 Ser contrastables empíricamente mediante la estadística: hipótesis nula y alternativa.


 Establecer una relación entre dos o más variables.
Su función es delimitar el problema a investigar. El objetivo último de toda investigación es
comprobar o rechazar la hipótesis elaborada.

3. DISEÑO DE LA INVESTIGACIÓN
Es un plan estructurado de acción para solucionar el problema. Es el plan a seguir por el
investigador para abordar los objetivos planteados y someter a contraste las hipótesis.
 Diferentes sistemas de clasificación (Montero y León, 2007). Optaremos por la reciente de M.
Ato, López y Benavente (2013):
a) Investigación teórica: no requieren emplear datos empíricos originales y proceden de
estudios primarios (incluye el meta-análisis o revisión)
b) Investigación instrumental: analizan las propiedades psicométricas de instrumentos de
medida psicológicos. Validación de test.
c) Investigación metodológica: trabajos con nuevas metodologías en el diseño, medida y
análisis, así como los estudios de simulación.
d) Investigación empírica: para dar respuesta a problemas que se plantean en Psicología
pueden utilizarse diferentes estrategias de investigación:
o ESTRATEGIA MANIPULATIVA (experimental): analizar la relación causal (hipótesis
causales) entre dos o más variables. Tres tipos:
i. Experimental: Al menos una variables debe ser manipulada y los participantes se
asignan al azar a los tratamientos
ii. Cuasiexperimental: Una variable debe ser manipulada pero no se exige asignación al
azar a los grupos
iii. Caso único, en contextos aplicados
o ESTRATEGIA ASOCIATIVA O CORRELACIONAL (no experimental): explorar la
relación funcional existente entre variables (hipótesis de covariación). Tres tipos:
i. Comparación de grupos
ii. Predicción de comportamiento
iii. Clasificación de grupos o probar modelos teóricos
o ESTRATEGIA DESCRIPTIVA (no experimental): describir cosas tal y como ocurren, sin
manipulación de variables, ni comparación de grupos, ni predicción de comportamientos, ni
prueba de modelos. Dos tipos: Observacional y Selectivo o Encuesta
 Aspectos que intervienen: objetivos, naturaleza del problema y de las hipótesis, variables,
unidades de muestreo, etc.
 Debe especificar la estrategias científica de partida: de mayor a menor control tendrías
experimental, cuasiexperimental, selectivo o de encuesta y observacional.

4. ELABORACION DE CUESTIONARIO Y PROCEDIMIENTO DE ADMINISTRACION


 Las variables de la etapa anterior deben permitirnos responder, como mínimo, a tres
objetivos:
o Estimar magnitudes
o Describir a la población
o Verificar las hipótesis planteadas
 Formas de Administración: personal, telefónico, postal
 Utilizar diferentes tipos de preguntas (abiertas, cerradas, múltiples, etc.) que permitan
diferentes tipos de análisis de datos

4
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

5. DISEÑO DE LA MUESTRA
 Identificación de la población o universo (target)
 Selección de informantes (muestra representativa) mediante procedimientos de la teoría
muestral
 La elaboración previa del cuestionario que responda a los objetivos de la investigación, es
clave para determinar la necesaria representación de diferentes submuestras o segmentos, y
no tener que recurrir, posteriormente, a la ponderación del fichero de datos

6. SELECCIÓN DE LOS ENTREVISTADORES


 Evitamos sesgos en la administración del cuestionario si los entrevistadores trabajan de
acuerdo con un protocolo que garantice la máxima homogeneidad inter-entrevistadores.
 La importancia de un buen briefing o instrucciones
PRE-TEST DEL CUESTIONARIO o prueba piloto
o Para conocer su adecuación a los objetivos de la investigación
o Si el orden es lógico, el lenguaje apropiado al target
o Probar con diferentes versiones de cuestionarios
o Comprobar la idoneidad de la selección muestral
o Estimar el porcentaje de no-respuesta
o Duración, etc.

7. TRABAJO DE CAMPO Y SUPERVISION


Tres tareas clave:
 Incidencias en la recogida de los datos: hablar con los jefes de zona y equipo para posibles
incidencias
 Comprobación de las rutas aleatorias: comprobación de las unidades últimas del muestreo
(completarlo adecuadamente)
 Revisión de los cuestionarios: datos de identificación, % respuestas, codificación preguntas,
omisión preguntas, calidad respuestas, seguimiento preguntas filtro, amabilidad de la
entrevista, etc.

8. CODIFICACION DE PREGUNTAS Y DEPURACION DE LA INFORMACION


 En el centro de la investigación: categorización y codificación de preguntas abiertas y
considerar posibles re-clasificaciones (ej. preguntas métricas en no métricas)
 Creación fichero de datos y grabación: buscar inconsistencias, valores fuera de rango,
respuestas de las preguntas filtro, transformación de variables, cuantificar la no-respuesta,
etc…… “análisis preliminar de los datos”
9. ANALISIS DE DATOS O USO DE LA ESTADISTICA (ANALISIS MULTIVARIANTE)
El análisis de los datos implica:
 Conocer detalladamente cada una de las variables utilizadas en la investigación:
distribuciones de frecuencias, estadísticos univariantes y representaciones gráficas
 El análisis de las relaciones bivariantes o relaciones entre variables. Existen diferentes
técnicas en función de la escala en la que se ha medido cada variable (nominal, ordinal,
intervalo, razón): diferencias de porcentajes, diferencia de medias, relación significativa
entre variables,….)
 El Análisis Multivariante. Analizar conjuntamente más de 2 variables
En otras palabras, la estadística se puede utilizar como un cuadro de herramientas o tres niveles
de análisis:
o Nivel 1: DESCRIPTIVO-UNIVARIADO. Resumir e ilustrar la información contenida en
una matriz de datos
o Nivel 2: INFERENCIAL-BIVARIADO. Estimar parámetros, contrastar hipótesis, comparar
5
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

el comportamiento de dos o más grupos o analizar la relación entre pares de variables


o Nivel 3: MODELIZACIÓN-MULTIVARIANTE. Elaborar modelos, ecuaciones o funciones
que permitan explicar unas variables a partir de otras o identificar variables latentes para
resumir la información
10. REDACCION DEL INFORME
Presentación de los hallazgos de la investigación: Título, Resumen, Antecedentes y Objetivos,
Metodología y Procedimiento (el proceso de la investigación, métodos y técnicas utilizadas…) así
como la Discusión o Conclusiones. Sin olvidarse de las referencias bibliográficas (oportunidad de
replicación)
Los resultados deben integrarse en un marco teórico, al tiempo que resaltar posibles lagunas y
nuevos interrogantes. Existe una tendencia a comunicar sólo los resultados que confirman la
hipótesis
Código deontológico ESOMAR: Antecedentes, Muestra (descripción universo, tamaño muestral,
sustitución y distribución geográfica proyectada y conseguida, método de ponderación, tasas de
respuesta y posibles sesgos de la no respuesta, etc.), Recogida de los Datos (procedimiento del
campo, personal, instrucciones, control de calidad, reclutamiento e incentivos, fecha, etc.) y
Presentación de los Resultados (bases de porcentajes, margen error estadístico, medias significación
de las diferencias, etc.)

VARIABLES
Variable es toda característica de un objeto o sujeto que puede adoptar distintos valores o nombres.
Tipos:
1. Según nivel de medida (Stevens).
a. NOMINALES: los números no expresan cantidad sino cualidad, representan categorías
y carecen de propiedades aritméticas, tiene una función identificadora. Ej. Sexo, estado
civil, etc.
b. ORDINALES: los números expresan orden además de igualdad-desigualdad, sin existir
una unidad de medida y pudiéndose establecer relaciones de orden. Ej. Satisfacción del 1
al 10.
c. INTERVALO: tienen unidad de medida, no hay cero absoluto, no hay ausencia de
variable, no hay origen en el 0, el punto de origen es arbitrario. Ej. Temperatura, C.I.
d. RAZÓN: tienen unidad de medida, existe el cero absoluto. Ej. Ingresos.
2. Según papel en la investigación.
a. INDEPENDIENTES: predictores.
b. DEPENDIENTES: criterio.
3. Según características de los datos.
a. CUALITATIVAS: (nominales) sin escala de medida y expresan cualidad. Pueden ser:
i. Dicotómicas: solo adoptan 2 categorías. Ej. Sexo.
ii. Politómicas: adoptan más categorías. Ej. raza.
b. CUASICUANTITATIVAS: (ordinales) expresan orden por lo que los distintos niveles
de la variable indican mayor o menor grado de igualdad. Pueden ser:
i. Cuantitativas: tienen un nº amplio de respuestas posibles. Ej. grado de
satisfacción del 1 al 20
ii. Cualitativas: si tienen un nº reducido de respuestas. Ej. gusto de una comida, si-
no-a veces.
c. CUANTITATIVAS: expresan cantidad. Pueden ser de dos tipos:
i. Discretas: Entre dos valores adyacentes no puede haber valores intermedios. Ej.
Nº hijos.
ii. Continuas: Entre dos valores adyacentes pueden existir infinitos valores
intermedios. Ej. Peso.

6
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

MATRICES
Son conjuntos de nº reales ordenados en filas (sujetos) y columnas (variables) que agrupan los datos
de la investigación. La información de una investigación se recoge en distintos tipos de matrices.

6.- ANÁLISIS MULTIVARIANTE


La Complejidad de los fenómenos sociales obliga a recoger gran cantidad de medidas. Se necesita
una visión conjunta e integrada de la realidad: Análisis Multivariante
Por lo tanto, surge como una forma de hacer comprensible una gran cantidad de datos o MATRIZ
que represente la realidad Útil porque permite descubrir estructuras, establecer relaciones entre
variables o contrastar hipótesis, reflejando los mecanismos que actúan para determinar la conducta
humana, ya que ésta está multideterminada.
Diferentes definiciones:
 KENDALL lo define como “una extensión del análisis univariable y bivariable al análisis
simultáneo de más de dos variables en un muestreo de observaciones
 Sheth: Métodos estadísticos que se preocupan por el análisis de las múltiples medidas que
se han hecho sobre un cierto número de objetos
 Cuadras: Una rama de la estadística que estudia, interpreta y elabora el material estadístico
sobre la base de un conjunto de n>1 variables, que pueden ser de tipo cuantitativo,
cualitativo o una mezcla de ambos
 Hair: Todos los métodos estadísticos que analizan simultáneamente medidas múltiples de
cada individuo u objeto sometido a investigación
 Definición: técnicas estadísticas que nos permiten analizar un conjunto de variables, así
como poner a prueba distintos modelos para explicar las relaciones entre ellas:
o Análisis multivariable: psicología, sociología y economía.
o Análisis multivariante: bioestadística y biología.
o Análisis multivariado: educación.

Razones de la expansión:
1. Necesidades de investigación: existencia de fenómenos cada vez más complejos.
2. Desarrollo de informática y ordenadores.
3. Útil en muchos campos.
4. Abundante bibliografía aplicada.
5. Proliferación de las investigaciones de mercado y de los estudios de opinión.

Clasificación:
Los primeros desarrollos surgen en el ámbito de la Psicología con Spearman sobre el Análisis
Factorial, aunque, posteriormente, fue en el Marketing donde más se utilizaron
La primera clasificación surge en el Journal of Marketing (Kinnear y Taylor; Sheth)
Dos criterios para clasificar las técnicas multivariantes:
 En función de los objetivos de la investigación:
o DESCRIPTIVAS. Las que tratan de DESCRIBIR y/o EXPLORAR la realidad:
Acercamiento a la realidad sin hipótesis previas. Analizar la interdependencia entre todas
las variables con el fin de reducir el número y así describir la realidad observada
(principio de parsimonia)Ejemplos: Análisis factorial exploratorio, Análisis de
Correspondencias, Escalamiento Multidimensional y el Análisis de Conglomerados
o EXPLICATIVAS o Predictivas. su fin es EXPLICAR la realidad. Parten de hipótesis
extraídas de un marco teórico y, mediante investigación se intenta validarlas
empíricamente. Son PREDICTIVAS porque ayudan a comprender y explicar un
fenómeno. Se parte de una situación a predecir (VD) y de un grupo de variables
intervinientes o criterio (VI) cuya influencia se desea mantener bajo control y observar su
efecto
7
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

Ejemplos: Análisis de la varianza y covarianza, regresión múltiple, regresión logística,


análisis discriminante, modelos log-lineales,…
 En función de la relación entre las variables:
SHETH se hace dos preguntas referidas a la relación entre las variables:
o Existencia o ausencia de variables dependientes e independientes: ¿Unas variables dependen
de otras?
 Técnicas de dependencia: se usan cuando unas variables dependen de otras. Detectan
las relaciones de dependencia entre una (o varias) V.D y una (o varias) V.I.
elaborando una hipótesis que se intenta validar empíricamente: Técnicas
Explicativas o Predictivas. Ejemplos: Análisis de Regresión, Medición Conjunta,
Análisis Discriminante, Análisis de Varianza
 Técnicas de interdependencia: se usan cuando unas variables no dependen de otras.
Se acercan a la realidad sin hipótesis específicas y tratan de describir la realidad
sintetizando la información relevante: Técnicas Descriptivas o Reductivas.
Ejemplos: Análisis Factorial, Análisis de Conglomerados, Escalamiento
Multidimensional
o Acerca de la escala de medida de cada variable. Variables cuantitativas (métricas) y
cualitativos (no-métricas). ¿Cuáles son las propiedades de los datos?

Problemas y peligros del análisis multivariante:

 Peligros:
o Fácil estimación y difícil interpretación.
o Incluir demasiadas variables (vs. Parsimonia)
o Olvido de la teoría (modelizar por modelizar)
 Problemas:
o Incumplimiento de supuestos.
o Requiere un tamaño muestral elevado.
o Casos anómalos.
o Relevancia conceptual y significación estadística.

7.- ALGUNOS EJEMPLOS DE TECNICAS MULTIVARIANTES

 Regresión lineal múltiple:

 Objetivo: permite explicar o predecir una variable (Criterio) a partir de una o varias
variables independientes (predictoras).
Y=a+b1X1+… +bnXn (ec. recta)
 Analiza la naturaleza de las relaciones entre un conjunto de variables con el objetivo de
hacer predicciones. Trata de conocer la influencia que una serie de VI´s ejercen sobre la
VD.
 Busca predecir los cambios en la VD cuantitativa en función de los cambios en varias
VI cuantitativas. Esta relación no implica que una sea causa de otras. Los coeficientes
calculados solo aportan información sobre el grado en que varias variables están
asociadas, y no es posible extraer de ellos leyes de causalidad.
 Características VI: uno a más siempre cuantitativas (métricas).
 Características VD: una y cuantitativa (métrica).
 Tipos:
o Simple: con una sola VI.
o Múltiple: con varias VI.

8
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

 Ejemplo: predecir las la cuota de mercado en función de las preferencias de los


consumidores y la inversión en publicidad, minutos de emisión deportiva, minutos de
informativos, etc. Predecir el gasto en cine en función de la edad, ingresos, etc.
 Características:
o Es muy básica.
o Solo permite establecer una relación lineal.
o En el caso de predictores categóricos (VI cualitativa) se pueden utilizar variables
ficticias (DUMMY: son variables binarias que se obtienen convirtiendo los
niveles de una variable cualitativa, el valor 1 indica presencia de una categoría y
el valor 0 indica ausencia).

 Análisis discriminante:

 Objetivo: permite identificar funciones capaces de separar dos o más grupos de


individuos según sus puntuaciones en una serie de variables (VI), con el fin de localizar
las variables (VI) que contribuyen en mayor grado a discriminar a los sujetos de los
diferentes grupos establecidos a priori. Es una técnica de clasificación.

Y1 (no métrica, categórica) =X1+X2+X3+… XN (métricas, cuantitativas)


Obtener una función discriminante del tipo:
Zjk=a+W1X1+… +WjXk (func. discriminante)

 Su fin es localizar funciones capaces de separar dos o más grupos de individuos a partir
de sus respuestas en una serie de variables, con el fin de localizar las variables que más
contribuyen a discriminar a los sujetos en los diferentes grupos establecidos por la
variable dependiente.
o Clasificar si un niño puede desarrollar un cuadro depresivo o no.
o En que se diferencian los consumidores que respondieron a una campaña de
marketing de aquellos que no lo han hecho.
o Estimar si un nuevo producto tendrá éxito en el mercado considerando la inversión
en publicidad, precio, etc.
 Características VI: uno a más siempre cuantitativas.
 Características VD: una y categórica (cualitativa).
 Tipos:
 Simple: cuando la VD es dicotómica.
 Múltiple: cuando la VD es politómica.
 Ejemplo: predecir el voto a partir de la edad, los ingresos económicos, etc.
 Características:
 Los grupos están establecidos a priori.

 Regresión logística:

 Objetivo: Predecir o explicar la pertenencia de los sujetos a un grupo de la VD no


métrica, a partir de sus puntuaciones en una serie de variables predictoras o VI´s
(métricas o no métricas). Estima probabilidad de que se dé un evento. El principal
objetivo es la predicción pero con una VD cualitativa.
 Se trata de un caso particular de la regresión múltiple en el que la VD es cualitativa y las
VI´s pueden ser cuantitativas o cualitativas.
 Características VI: más de una, métricas o no métricas (cualitativas o cuantitativas).
 Características VD: una categórica (cualitativa).

9
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

 Tipos:
 Binaria: cuando la VD es dicotómica.
 Múltinomial: cuando la VD es politómica.
 Ejemplo: saber si ciertas características socioeconómicas (estado civil, ingresos, nivel de
estudios, etc.) influyen en que un individuo compre un determinado coche, conocer las
características demográficas de los clientes habituales y de los ocasionales, etc.
 Ventaja de esta técnica: tiene pocas restricciones sobre la distribución de las VI´s,
estando más libre de supuestos restrictivos que la regresión múltiple y el análisis
discriminante.

 Análisis conjunto:

 Objetivo: permite entender como conforman los individuos sus preferencias hacia los
objetos, estimando la importancia relativa que le conceden a cada uno de los atributos o
características de éste.
 Características VI: uno a más categóricas (cualitativa). Atributos.
 Características VD: una y ordinal (cualitativa). Preferencia.
 Ejemplo: explicar las preferencias de las amas de casa hacia las distintas marcas de
leche envasada (envase, marca, tapón, precio, procedencia, etc.).
 Tarea experimental: se solicita la opinión de un grupo de consumidores que deberán
valorar los productos resultantes de la combinación de sus características objeto de
análisis.
 Resultados: el investigador es capaz de valorar la importancia de todos los atributos y
los niveles de cada uno de ellos, mientras que los consumidores valoran únicamente los
perfiles de unos pocos productos. Esto se hace descomponiendo preferencias
manifestadas por los productos en utilidades o importancias por atributo (y nivel).
 Pasos:
o Identificar y seleccionar de los atributos relevantes para esa categoría de producto o
servicio.
o Definición de niveles u opciones para cada atributo.
o Selección de la combinación de atributos a ser evaluada con el fin de determinar cuál
de todas es la preferida por los consumidores.
o Recogida de datos o evaluación de los estímulos se puede realizar de diferentes
maneras:
 Alternativas de a pares, pidiendo que elija entre dos productos.
 Ordenando los productos en un ranking, pidiendo que los clasifique por orden
de preferencia.
 Valorando los productos en una escala de 0 a 10.
o Selección del método para calcular los valores de utilidad. Hay que elegir un método
para cuantificar los valores de utilidad percibida de cada combinación de atributos.
También es conveniente integrar los valores de utilidad con un análisis costo-
beneficio porque muchas veces la opinión más valorada no es la más rentable.
 Características:
 Tiene alta VALIDEZ ECOLÓGICA ya que reproduce el contexto real.
 La recogida de datos es flexible.
 Útil en marketing para el diseño de nuevos productos, test de envases, etc.

 Análisis de supervivencia:

 Objetivo: permite predecir o modelizar el tiempo que transcurre hasta que ocurre un
evento (RIESGO).
10
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

 Características VI: al menos 3:


 De respuesta: tiempo de registro o seguimiento, cuantitativa.
 De censura: ocurrencia o no del evento, cualitativa dicotómica.
 Explicativa: cuantitativa o cualitativa. Edad, tratamiento, etc.
 Características VD: una y cuantitativa (tiempo).
 Ejemplo: saber la probabilidad de supervivencia de pacientes de una patología a partir
de: edad, tratamiento, etc.
 Características:
 Aprovecha la información de todos los sujetos.
 Útil para predecir recaídas, altas.

 Análisis de varianza:

 Objetivo: permite determinar en qué medida una VD está influenciada por 1 o + VI´s.
Comprobar si existe un efecto significativo de un “tratamiento”.
 Características VI: una o más, categórica (factores).
 Características VD: una o más y cuantitativa.
 Tipos:
 SIMPLE (una vía oneway): una sola VI (factorial).
 ANOVA (factorial): análisis de varianza con una VD.
 MANOVA: (análisis multivariante de la varianza): varias VD.
 Ejemplo: Ver si hay efecto del consumo de alcohol sobre la atención (VD). (VI)Grupos:
1=4 cervezas, 2=6 cervezas, 3=8 cervezas. (VD)Tarea de rendimiento en 1 ordenador.
 Características:
 Es ideal para experimentos.
 Una o varias vías (VI): ONEWAY o ANOVA (Diseños factoriales).
 MANOVA (análisis multivariante de la varianza: varias VD.

 Análisis factorial:

 Objetivo: Reducción de datos (variables métricas). A partir de la relación entre variables


observadas identificar un número menor de variables resumen, FACTORES o variables
latentes que resultan después de eliminar las redundancias existentes entre el conjunto
inicial de variables observadas.
 Características variables: cuantitativas.
 Tipos:
 Exploratorio (AFE): si no conocemos los factores a emplear o no hay teorías
sobre el tema.
 Confirmatorio (AFC): para validar una escala, ver si tiene validez de constructo,
es decir, si una escala mide lo que dice medir. LISREL, AMOS
 Ejemplo: Agrupar ítems de una escala y etiquetarlos bajo una misma dimensión o factor
de evaluación
 Características:
 Exploratorio: no precisa especificar el número de factores ni las relaciones entre
ellos.
 Confirmatorio: requiere especificar el número de factores, las relaciones entre las
variables y los factores latentes.

11
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

 Análisis de correspondencias:

 Objetivo: permite la reducción de datos (variables no métricas). A partir de la relación


entre las variables observadas identifica DIMENSIONES (o variables latentes).
Profundiza en las relaciones que se establecen entre dos o más variables categóricas.
 Características variables: cualitativas.
 Tipos:
 Simple: entre las categorías de dos variables.
 Múltiple: más de dos variables.
 Ejemplo: Crear un mapa de los países turísticos europeos, identificando las dimensiones
subyacentes.
 Características:
 Es un subtipo del Análisis factorial.
 Ideal para recogida de datos rápida.
 Representa los datos en tablas de contingencias (asociación) y compara
frecuencias.
 Muy utilizado en marketing.

 Análisis de conglomerados (CLUSTER):

 Objetivo: Identifica grupos homogéneos de sujetos u objetos a partir de la puntuación en


una serie de variables. Estos grupos a su vez deben ser muy diferentes entre sí. Alta
homogeneidad interna y elevada heterogeneidad entre los grupos.
 Características variables: medidas en la misma escala. Cuantitativas o cualitativas
 Ejemplo: Identificar segmentos de jóvenes en función de sus hábitos de consumo. Es
decir, permite clasificar una población en el menor número posible de grupos
mutuamente exclusivos y exhaustivos, basándose en la similitud entre los casos.
 Características:
 Las variables tienen que estar medidas en la misma escala (o todas cuantitativas,
o todas cualitativas).
 Es una técnica de clasificación.
 Los grupos no están definidos de antemano (diferencia del análisis
discriminante).

 Escalamiento multidimensional:

 Objetivo: Explora las dimensiones subyacentes en la percepción de objetos y


preferencias para hacer una representación espacial de los mismos a partir de las
proximidades entre dichos objetos.
 Características variables: ordinales (cualitativas) y cuantitativas.
 Ejemplo: Representación espacial del mercado de cerveza en Galicia a partir de la
ordenación por preferencias (coches, deportes,...), con el fin de conocer el
posicionamiento relativo de cada una de ellas.
 Características:
 Fácil recogida de datos (versátil).
 Útil en marketing e investigación social.
 Transforma los juicios de los consumidores, respecto a similitudes o preferencias
en distancias representadas en un espacio multidimensional.

12
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

 Otras técnicas:

 Correlación canónica: análisis de relaciones entre un grupo de variables independientes


y otro de dependientes.
 Las variables suelen ser cuantitativas.
 Por ejemplo: Saber la relación entre un conjunto de variables de personalidad y
un conjunto de resultados de test.
 Modelos de ecuaciones estructurales o de estructuras de covarianza: permite comprobar
en qué medida un modelo teórico se ajusta a los datos empíricos. En ocasiones se le
llama Path Analysis.
 Las VI pueden ser una o más y cuantitativas o cualitativas
 La VD es cuantitativa.
 Programas estadísticos: LISREL y AMOS.
 Modelos Log-Lineales: permite poner a prueba modelos que postulan distinto tipo de
relaciones entre dos o más variables categóricas.
 Variables: cualitativas.
 Ejemplo: Comparar la exactitud de un modelo que estima una relación entre
motivación y autoestima (y horas de estudio con menor influencia) para el
rendimiento escolar modelos al estimar con la de otro que estima horas
estudiadas en relación a motivación (con menor peso para autoestima).

13
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

PREGUNTAS VERDADERO-FALSO.

1. El método científico tiene dos características principales: carácter empírico y carácter


replicable.
2. Los modelos matemáticos son una representación formal y estructurada de la realidad, son
complejos y extensos.
3. Los modelos matemáticos únicamente explican propiedades y leyes de la realidad.
4. Existen tres tipos de modelos: Icónicos, analógicos y matemáticos.
5. Una maqueta a escala podría considerarse un modelo icónico.
6. Los modelos teoréticos son aquellos que organizan las ideas o estructura del objeto de
investigación en base a un tipo de lenguaje determinado.
7. Los modelos analógicos se clasifican en informáticos y matemáticos.
8. Los modelos matemáticos se expresan en lenguaje matemático y permiten hacer predicciones.
9. Los modelos estadísticos son un subtipo de modelos matemáticos y tienen dos partes: una
sistemática y otra aleatoria.
10. La parte sistemática de un modelo se denomina también Término de Error.
11. La parte aleatoria de un modelo constituye una estimación de aquello que no podemos
explicar en la investigación.
12. La parte sistemática es un conjunto de componentes que representan el efecto de varias
variables combinadas.
13. Y= ß0+ ß1X1+ ß2X2+…+E sería la expresión lineal general de un modelo estadístico.
14. ß0 equivale al peso o importancia específica de cada variable específica en el modelo.
15. Los componentes ß1 y ß2 son términos que sirven para corregir el desfase de escala entre
valores o entre la parte explicativa y la parte explica del modelo.
16. En el modelo Y= f(x)+E; Y es la parte explicativa o el objeto de investigación.
17. A la hora de construir un modelo resulta importante introducir el mayor número de variables
posibles.
18. A la hora de diseñar un modelo debemos tender a escoger el más complejo posible, y si no es
posible, reducirlo a uno más simple.
19. No es necesario que el problema sea formulable operativamente para comenzar una
investigación.
20. En las investigaciones experimentales el investigador no provoca la aparición del fenómeno
objeto de estudio.
21. A la hora de interpretar los resultados se intenta aceptar o rechazar la hipótesis de trabajo.
22. Los resultados de una investigación se expresan en términos absolutos.
23. La validez externa está relacionada con la posibilidad de generalizar los resultados de un
contexto a la población.
24. La validez ecológica está relacionada con la posibilidad de generalizar los resultados a otros
contenidos, otras variables, otras situaciones experimentales y otras muestras, entre otros.
25. La elaboración del informe comienza por el título y acaba con la relación de resultados
obtenidos.
26. Según el papel en la investigación las variables se clasifican en: cualitativas y cuantitativas.
27. Según el nivel de medida las variables pueden ser: nominales, ordinales, de intervalo y de
razón.
28. La distinción entre variables de intervalo y de razón radica en que las primeras no contemplan
la posibilidad de que exista cero absoluto entre los valores que adoptan los datos, mientras
que en las segundas si existe esa posibilidad.
29. En las variables discretas, entre dos valores adyacentes pueden existir infinitos valores
intermedios.
30. El número de hijos de una persona se considera una variable continua.
31. Las variables nominales equivaldrían a las cualitativas, las cuasi –cuantitativas a las ordinales
14
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

y las cuantitativas a las de intervalo y de razón.


32. Las variables cuantitativas son de dos tipos: discretas y continuas.
33. Una variable es una característica de un objeto de estudio susceptible de adoptar únicamente
dos valores distintos (0 y 1: ausencia y presencia de variable).
34. Las variables nominales expresan cualidad, pero también cantidad.
35. En las variables de intervalo no hay un punto de origen en el 0, el origen es arbitrario.
36. Los datos recogidos se ordenan en matrices. Filas=sujetos y Columnas =variables.
37. Existen dos niveles de análisis estadístico: el descriptivo univariado y el de modelización o
multivariante.
38. El nivel descriptivo trata de resumir e ilustrar la información en una matriz de datos.
39. En el nivel inferencial bivariado se trata de comparar dos variables o pares de variables.
40. La modelización permite elaborar modelos explicativos y predictores, pero solo comparando
variables dos a dos.
41. El nivel de modelización o multivariante no permite detectar variables latentes.
42. El análisis multivariante es una extensión del análisis univariado y bivariado al análisis
simultaneo de dos o más variables.
43. En el análisis multivariado los estadísticos se clasifican según: técnicas de dependencia y
técnicas de independencia.
44. El análisis multivariante es útil para descubrir relaciones entre variables pero no para
contrastar hipótesis globales.
45. El análisis multivariante refleja la cantidad de datos existente en la realidad, sintetizando los
aspectos más importantes y perdiendo el mínimo de información.
46. Uno de los peligros principales del análisis multivariado es la fácil estimación de los
resultados en contraste con la difícil interpretación de estos.
47. Los casos anómalos no suponen un problema grave para las técnicas multivariantes, ya que
estas no se ven afectadas por este tipo de datos.
48. Un peligro a tener en cuenta al usar técnicas multivariantes es la inclusión de demasiadas
variables explicativas en el modelo.
49. Las técnicas multivariantes son herramientas estadísticas.
50. Las técnicas multivariantes solo permiten analizar un conjunto de variables simultáneamente.
51. Según Sheth las técnicas multivariantes pueden clasificarse en función de las variables pero
no de las propiedades de los datos.
52. Los métodos de dependencia son aquellos en los que se especifica una variable como
pronosticada a partir de otras.
53. En los métodos de Interdependencia las VI’s son independientes entre sí.
54. El hecho de que unas variables dependan de otras en un modelo, hace necesaria la utilización
de un método de interdependencia para el análisis de los datos.
55. Si los datos son cuantitativos debemos usar un método métrico de análisis.
56. El hecho de que tengamos datos cuantitativos, cualitativos o ambos condiciona el tipo de
técnica de análisis a utilizar.
57. Los pasos en la Modelización serían las etapas a seguir cuando queremos aplicar una técnica
multivariante sobre unos datos recogidos.
58. La estimación de parámetros es el primer paso en la modelización.
59. La estimación de parámetros consiste en obtener los valores constantes, de peso de las
variables, etc. en el modelo.
60. La especificación del modelo debe realizarse matemáticamente para que este tenga utilidad.
61. En el paso de evaluación del ajuste solo tratamos de comprobar si el modelo es el más
apropiado para los datos.
62. El hecho de que los parámetros se ajusten correctamente a la ecuación determina que el
modelo será capaz de realizar buenas predicciones.
63. Si el modelo es óptimo y realiza buenas predicciones la modelización terminaría con una re
15
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

especificación del modelo que hemos conseguido.


64. La interpretación de los coeficientes consiste exclusivamente en hacer una interpretación del
modelo general y explicar su utilidad.
65. La regresión lineal solo permite trabajar con datos cualitativos.
66. Hay dos tipos de regresión lineal: Simple (usa una sola VD) y Múltiple (usa varias VD).
67. La regresión lineal permite predecir la relación entre VD y una o varias VI (esta relación solo
puede ser lineal).
68. Existe una excepción en la regresión lineal, las VI pueden ser cualitativas si utilizamos
Variables ficticias o DUMMY.
69. Son técnicas dependientes: Regresión lineal, Análisis discriminante, Regresión logística,
Análisis de varianza, Análisis conjunto y Análisis de conglomerados.
70. Si intentamos predecir la conducta de voto a partir de ingresos, edad, etc. tendríamos que
utilizar la regresión lineal.
71. El análisis discriminante utiliza como VD variables cualitativas y como VI variables
cuantitativas.
72. El análisis discriminante trata de clasificar en grupos según las puntuaciones en las VI’s.
73. La representación matemática de la regresión lineal general sería la ecuación de la recta.
74. El análisis discriminante utiliza varias VI’s y una VD que debe ser cualitativa y politómica.
75. En el análisis discriminante los grupos están establecidos a priori.
76. La regresión logística determina en qué grado una VD está influenciada por varias VI’s.
77. Las VI’s en la regresión logística pueden ser tanto cualitativas como cuantitativas.
78. La VD debe ser cuantitativa en la regresión logística.
79. La regresión logística puede ser de dos tipos: Simple (VD dicotómica) y Múltiple (VD
politómica).
80. La regresión logística se podría usar para predecir si un sujeto aprobará o no en función de:
horas de estudio, CI, motivación, etc.
81. La regresión logística es un caso particular de la regresión lineal múltiple.
82. El análisis de varianza se divide en anova (solo está presente una VD) y manova (análisis en
relación a varias VD).
83. El análisis de varianza requiere que las VI sean cuantitativas, al igual que las VD’s.
84. El análisis de varianza determina en qué medida una VD (o varias) está influenciada por una
VI (o varias).
85. El análisis conjunto es una técnica de interdependencia.
86. El análisis conjunto comprueba en qué medida un modelo teórico se ajusta a los datos
obtenidos.
87. El análisis conjunto permite explicar las preferencias de las amas de casa hacia las distintas
marcas de leche.
88. La recogida de datos estructurada y restringida para estudios de marketing sería una
característica de aplicación de análisis conjunto.
89. Según la recogida de datos, el análisis conjunto permite tres posibilidades de estudio con el
SPSS: Orthoplan, Plancards y Conjoint.
90. Estimar la importancia de cada atributo de un objeto sería una de las utilidades del análisis
conjunto.
91. En el análisis conjunto las VI deben ser categóricas puesto que representan atributos y las VD
deben ser ordinales, dado que representan preferencia.
92. El análisis de supervivencia es útil para predecir el riesgo.
93. En el análisis de supervivencia tanto las VI como las VD son cuantitativas.
94. El análisis de supervivencia requiere al menos del uso de 3 VI: De respuesta (tiempo de
registro-cualitativa), De censura (cualitativa) y Explicativa (cualitativa o cuantitativa).
95. La variable de censura en el análisis de supervivencia es cualitativa politómica puesto que
define el grado en que el evento tendrá lugar.
16
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

96. Para saber si un grupo de pacientes de una patología sobrevivirá a partir de: tratamiento, edad,
recaídas, etc. podemos usar el análisis de supervivencia.
97. La VD del análisis de supervivencia debe ser cuantitativa puesto que representa el tiempo que
transcurre hasta la ocurrencia del evento.
98. En los modelos de ecuaciones estructurales las VI son cualitativas y la VD es cuantitativa.
99. El Path analysis de los modelos de ecuaciones estructurales permite probar relaciones entre
variables a distintos niveles.
100. Los modelos de ecuaciones estructurales son útiles para predecir recaídas.
101. Para comprobar si se ajusta un modelo teórico a los datos podemos usar la subtécnica AMOS
(un gráfico en el que observar la similaridad de los modelos teóricos y sus datos).
102. La subtécnica LISREL se puede usar solo con variables cualitativas en las ecuaciones de
modelos estructurales.
103. La correlación canónica utiliza VI y VD ambas cuantitativas.
104. La correlación canónica permite hacer grupos entre un conjunto de VI’s y otro de VD’s.
105. La técnica Overals permite el análisis de conjuntos de variables mezcladas de VD y VI, por
un lado, y de VD’s por otro.
106. Para conocer la relación entre un grupo de variables de personalidad y un conjunto de
resultados de test podemos utilizar la correlación canónica.
107. El análisis discriminante es una técnica que clasifica los datos.
108. La autoría de la técnica de análisis de varianza es atribuida a Pearson.
109. El análisis factorial se utiliza para reducir datos, identifica factores o variables latentes.
110. Para poder utilizar el análisis factorial las variables deben estar en escala de intervalo o de
razón.
111. Existen dos tipos de análisis factorial: simple y múltiple.
112. El análisis factorial exploratorio requiere especificar el número de factores que queremos
obtener.
113. El análisis de correspondencias utiliza variables cualitativas y cuantitativas para sus cálculos.
114. A través del análisis de correspondencias podemos reducir los datos, obteniendo dimensiones
o variables latentes.
115. El análisis de correspondencias simple utiliza más de dos variables en sus cálculos.
116. El análisis de correspondencias es un subtipo del análisis factorial.
117. Agrupar ítems de una escala y etiquetarlos (clasificarlos) en dos dimensiones de evaluación
(memoria verbal y memoria numérica) sería una posible aplicación del análisis de
correspondencias.
118. El análisis de conglomerados, al igual que el factorial y el de correspondencias, agrupa
variables para reducir los datos.
119. El Cluster análisis trata de que los grupos tengan alta homogeneidad dentro de ellos y alta
heterogeneidad entre ellos.
120. En el análisis cluster se trata de encontrar el menor nº de grupos posibles, excluyentes y
exhaustivos.
121. Una aplicación del Cluster sería identificar grupos de jóvenes en base a sus horas de estudio y
el nº de revistas que compran.
122. El análisis de correspondencias permite utilizar tanto datos cuantitativos como cualitativos.
123. La diferencia del Cluster con el análisis discriminante es que en el primero los grupos está
definidos previamente, mientras que en el segundo no.
124. El escalamiento multidimensional reduce datos, agrupando variables que estudian las
preferencias de los sujetos.
125. Una de las ventajas del escalamiento multidimensional es la versatilidad en la recogida de
datos.
126. El escalamiento multidimensional permite realizar representaciones espaciales de los sujetos
en relación a sus preferencias.
17
C/ República del Salvador 29 2D
Santiago de Compostela
659149284 / 881939440

127. En el análisis log-linear las variables son cuantitativas.


128. Un ejemplo de utilización del análisis log-linear seria el estudio de las dimensiones
subyacentes que utilizan los sujetos a la hora de afiliarse a un equipo de futbol.
129. Las técnicas de dependencia también pueden considerarse técnicas de explicación o
predicción.

Preguntas Cortas.
1. ¿Qué es un modelo matemático?
2. ¿Cómo define Kendall el análisis multivariante? ¿Cuál es la definición alternativa?
3. Problemas y peligros del análisis multivariante.
4. Tipos de variables según Stevens. Ejemplos.
5. Diferencias entre validez interna, externa y ecológica.
6. Diferencias y semejanzas entre análisis de regresión y análisis discriminante.
7. Tres características de la regresión múltiple.
8. ¿De qué depende la selección de la técnica de dependencia adecuada?
9. En qué consisten los métodos de dependencia y pon un ejemplo.
10. Diferencias y semejanzas entre regresión lineal y logística y tipos de variables que se utilizan
en cada una.
11. Semejanzas y diferencias entre análisis de conglomerados y el análisis discriminante.
12. Objetivo, condiciones de aplicación y ejemplo del análisis de correspondencia.
13. Tipos de regresión logística que conoces. ¿Cuáles son las diferencias entre ambos?

18

También podría gustarte