Está en la página 1de 12

Universidad Nacional Mayor de San Marcos

Facultad de Ciencias Matemáticas


Escuela Profesional de Estadística

ESCALAMIENTO
MULTIDIMENSIONAL

Estudiantes:

Carhuallay Cervantes, Yohn

Espíritu Victorio, Jorge

Paucar Chuco, Claudia

Tamayo Saavedra, Edgar

2022
ESCALAMIENTO MULTIDIMENSIONAL

El escalamiento multidimensional, más conocido como MultiDimensional Scaling (MDS), tiene


sus orígenes a principios de siglo XX en el campo de la Psicología. Surge cuando se pretendía
estudiar la relación que existía entre la intensidad física de ciertos estímulos con su intensidad
subjetiva. Es una técnica de representación espacial que trata de visualizar sobre un mapa un
conjunto de estímulos (firmas, productos, candidatos políticos, ideas u otros artículos) cuya
posición relativa se desea analizar. El propósito del MDS es transformar los juicios de similitud
o preferencia llevados a cabo por una serie de individuos sobre un conjunto de objetos o
estímulos en distancias susceptibles de ser representadas en un espacio multidimensional. El
MDS está basado en la comparación de objetos o de estímulos, de forma que si un individuo
juzga a los objetos A y B como los más similares entonces las técnicas de MDS colocarán a los
objetos A y B en el gráfico de forma que la distancia entre ellos sea más pequeña que la
distancia entre cualquier otro par de objetos.

El MDS puede ser apto para gran cantidad de tipos diferentes de datos de entrada (tablas de
contingencia, matrices de proximidad, datos de perfil, correlaciones, etc.).

El MDS puede ayudar a determinar:

• qué dimensiones utilizan los encuestados a la hora de evaluar a los objetos.


• cuántas dimensiones utilizan.
• la importancia relativa de cada dimensión.
• cómo se relacionan perceptualmente los objetos.

Entonces podemos decir que el MDS es una técnica multivariante que crea un gráfico
aproximado a partir de las similitudes o preferencias de un conjunto de objetos.

2. MODELO GENERAL DE ESCALAMIENTO MULTIDIMENSIONAL.


De modo general podemos decir que el MDS toma como entrada una matriz de proximidades,
∆∈M𝑛𝑥𝑚 , donde n es el número de estímulos. Cada elemento δ𝑖𝑗 de ∆ representa la
proximidad entre el estímulo i y el estímulo j.
A partir de esta matriz de proximidades el MDS nos proporciona como salida una matriz
cuadrada de orden M (X∈M𝑛𝑥𝑚 ) donde n, al igual que antes, es el número de estímulos, y m
es el número de dimensiones. Cada valor x𝑖𝑗 representa la coordenada del estímulo i en la
dimensión j (más adelante veremos el procedimiento para obtener esta matriz).

A partir de esta matriz X se puede calcular la distancia existente entre dos estímulos
cualesquiera i y j, simplemente aplicando la fórmula general de la distancia de Minkowski:

donde p puede ser un valor entre 1 e infinito. A partir de estas distancias podemos obtener
una matriz de distancias que denominamos D∈Mnxn:

La solución proporcionada por el MDS debe ser de tal modo que haya la máxima
correspondencia entre la matriz de proximidades inicial ∆ y la matriz de distancias obtenidas
D. Para que exista la máxima correspondencia MDS proporciona varias medidas

3. MODELOS DE ESCALAMIENTO MULTIDIMENSIONAL.


Existen dos modelos básicos de MDS que son: el modelo de escalamiento métrico (se
fundamenta en variables cuantitativas) y el modelo de escalamiento no métrico ( se
fundamenta en variables cualitativas). En el primero de ellos consideramos que los datos están
medidos en escala de razón o en escala de intervalo y en el segundo consideramos que los
datos están medidos en escala ordinal.
Modelo de escalamiento métrico

El escalamiento multidimensional fue desarrollado por Torgeson en 1952 es un método


utilizado para crear comparaciones entre cosas que son difíciles de comparar. El resultado final
de este proceso es generalmente una tabla de dos dimensiones que muestra un nivel de
similitud entre diferentes elementos, todo con relación a otro.

Entre estos modelos básicos de MDS tenemos: el modelo de escalamiento métrico y el modelo
de escalamiento no métrico.

Modelo de Escalamiento Multidimensional Métrico

Este método parte de una matriz de distancia D={dij} entre objetos. Usando las entradas de D
se construye una nueva matriz Q con entradas qij.

Medidas de bondad del ajuste

Stress

Este indicador de la bondad de ajuste, fue desarrollado por kruskal (1964). El valor del stress
deberá de ser tan pequeño como sea posible. Una mejor representación es aquella en la que el
stress está muy próxima al cero.

Consideremos como un buen ajuste a aquellos valores de stress que sean iguales a 0,1 y más
próximos a 0. Cabe resaltar, que el stress arroja un valor entre 0 y 1

Stress por punto

Se obtiene una gráfica que nos va mostrar que tan mal está representado ese punto medido
en una escala del o al 100%, es decir, con este indicador se puede identificar a los objetos que
están representados en la gráfica.

RSQ coeficiente de determinación

Es otro indicador de la bondad del ajuste de la representación gráfica (mapa perceptual), está
en el rango 0 a 1; cuanto más cerca está a 1, el modelo será considerado como “bueno o
perfecto”, mientras más próximo a cero, el modelo es “malo”.

Numero de estímulos (objetos) recomendados para aplicar EMM


Schiffman(1981) sugiere hasta 12 estímulos para una grafica de 2 dimensiones y hasta 16
estímulos para una gráfica de 3 dimensi9ones .

Kruskal y wish(1978) sugiere hasta 9 estímulos para una grafica de 2 dimensiones; hasta 13
estímulos para graficas de 3 dimensiones y hasta 17 estímulos para graficas de 4 dimensiones.

Si no cumplen con estos criterios, la representación grafica mapa perceptual perderá su


capacidad objetivo (ya no representará en forma efectiva la segmentación o posicionamiento)

EJEMPLO 1

Stress

El modelo presenta buen ajuste entonces es válido para tomar decisiones

Tenemos que identificar los que tiene porcentaje mayor estos son el casco viejo
25,37% y el remanso 26.38% estos son los peores representados, pero igual la gráfica es válida
para tomar decisiones.

RSQ= coeficiente de determinación =0.9702 Muy buen ajuste del modelo ya bque esta muy
cerca al 1
Mapa perceptual

• Segmento 1: Plan 3000, La Colorada, Villa 1° de mayo, Los lotes y El bajío


• Segmento 2: Urbari, Equipetrol
• Segmento 3: El remanso
• Segmento 4: Casco viejo
Modelo de Escalamiento Multidimensional No Métrico:

A diferencia del escalamiento métrico, este modelo no supone una relación lineal entre las
proximidades y las distancias, si no que establece una relación monótona creciente entre
ambas. Shepard (1962) demostró que es posible obtener soluciones métricas asumiendo
únicamente la relación ordinal entre proximidades y distancias; luego Kruskal (1964) mejoró el
modelo. El procedimiento sigue los siguientes apartados:

- Transformación de la matriz de proximidades en una matriz de rangos, desde


1 hasta (n (n - 1))/2
- Obtención de una matriz X ∈ Μnxm de coordenadas aleatorias, que nos da la
distancia entre los estímulos.
- Comparación de las proximidades con las distancias, obteniéndose las
disparidades (ďij).
- Definición del Stress.
- Minimización del Stress.

Como medida que nos informa de la bondad del modelo podemos utilizar el Stress que Kruskal
define como:

Kruskal sugiere las siguientes interpretaciones:

- 0.2: Pobre
- 0.1: Aceptable
- 0.05: Bueno
- 0.025: Aceptable
- 0.0: Excelente

También se puede utilizar otra medida que es el coeficiente de correlación al cuadrado (RSQ)
que brinda información de la proporción de variabilidad de los datos de partida que es
explicada por el modelo.

Los valores que toma oscilan entre 0 y 1, siendo que los valores cercanos a 1 indican que el
modelo es bueno y los valores cercanos a 0 indican que el modelo es malo.
EJEMPLO 2

Se tiene una serie de datos constituida por 251 personas, entre hombres y mujeres, en edades
comprendidas entre 24 y 44 años residentes en la ciudad de Riobamba, la variable procede de
la valoración que las personas han asignado a cada atributo, de acuerdo con cada uno de los
ítems de la Tabla sobre “atributos que influyen en la decisión de compra de productos
lácteos”. Las respuestas se establecen con una escala de Likert de 5 puntos (desde 1: “NO ES
IMPORTANTE”, hasta 5: “MUY IMPORTANTE”).

Ítem Atributo
1 Precio
2 Marca
3 Calidad
4 Sabor

5 Valor
nutricional

Se crea una de tabla con los datos aplicados en la encuesta, donde las filas representan el
número de encuestados con el valor de la escala de Likert que cada uno ha seleccionado y las
columnas representan las variables de estudio, como se muestra en la tabla, una parte de los
datos.

Lo primero que se realiza es instalar el paquete SMACOF de R, y se proporciona la matriz de


distancias.
#MATRIZ DE DISTANCIAS EUCLIDEAS

MDS no métrico por medio de la función smacof, se obtiene la salida del escalamiento
multidimensional no métrico ordinal en dos dimensiones, ya que en este caso se trabaja con
datos ordinales.

Se observa las coordenadas de cada atributo en ambas dimensiones, coordenadas cuya


representación gráfica se da en el gráfico siguiente.

> plot(modelo)

En la gráfica, se aprecia que los atributos calidad y sabor se encuentran cerca entre si y a su vez
ambos atributos se encuentran lejos de marca, del mismo modo que precio se encuentra
alejado de valor nutricional.
0.8266888, resulta de tomar las distancias euclídeas, para la distancia entre marca y precio.

Se observa que el punto peor representado será la marca, por considerar el .50% del total del
stress.

La proporción de variabilidad de los datos de partida que es explicada por el modelo es


99.99899%. El ajuste es bueno ya que se puede observar el RSQ> 0.6, siendo casi cercano al 1.

En la figura del diagrama de Shepard muestra las disimilaridades frente a las distancias
transformadas (disparidades).

Como el stress = 0.001 se encuentra entre 0.00 y 0.01, siendo que se acerca a 0, se puede decir
que presenta un ajuste perfecto.
SINTAXIS DEL EJERCICIO 1

#cargando base de datos

datos<-read.delim("clipboard")

datos

#Normalizando

datos_ch<-scale(datos[2:6],center=T,scale=T)

datos_ch<-as.data.frame(datos_ch)

#Matriz de distancias euclideanas

distancia_euc<-dist(datos_ch,method="euclidian",diag = T,upper = T)

#Asignar nombre a los objetos

m<-as.matrix(distancia_euc)

rownames(m)<-paste(datos$ZONA)#cambiar nombres a filas

colnames(m)<-paste(datos$ZONA)#cambiar nombre a columnas

euclideas<-as.dist(m)

#algoritmo escalamiento multi

install.packages("smacof")

library(smacof)

aemm<-mds(delta=euclideas,ndim=2,type="ratio")

#stress

print(aemm$stress)

#stress por punto

print(aemm$spp)

#RSQ

dist<-cbind(c(aemm$dhat))

dism<-cbind(c(aemm$confdist))

summary(lm(dist~dism))

#Mapa perceptual

plot(aemm$conf,pch=7,xlim=range(aemm$conf),repel=T)
#Dar nombres para que aparezca la grafica

ZONAS<-c("Plan 3000","villa1 de mayo","Los lotes","La colorada",

"El Remanso","El Bajio","Casco viejo","Equipetrol","Urbari")

text(aemm$conf,pos=1,labels = ZONAS)

SINTAXIS DEL EJERCICIO 2

library(smacof)
# Introducción de la matriz de datos
datos <- matrix(c(0.00, 19.24, 23.11, 25.83, 26.21,
19.24, 0.00, 24.00, 26.10, 25.51,
23.11, 24.00, 0.00, 14.25, 17.46,
25.83, 26.10, 14.25, 0.00, 17.44,
26.21, 25.51, 17.46, 17.44, 0.00),
ncol=5, byrow=T,
dimnames =list(c("precio","marca","calidad","sabor","valor_nutricional")))

modelo<-mds(delta=datos, ndim=3,type="ordinal")

# coordenadas
print(modelo$conf)
plot(modelo)

# Disparidades
print (modelo$dhat)
# Distancias entre configuraciones
print(modelo$confdist)

# Stress por punto


print(modelo$spp)

# RSQ
print (1-modelo$rss)

# Gráfico de Shepard
plot(modelo, plot.type="Shepard",
plot.dim=c(1,3))

# medida de Streess
print(modelo$stress)

También podría gustarte