Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Entregable Final
Entregable Final
Grupo (103)
Resumen 3
Palabras clave 3
Introducción 4
Metodología 5
Resultados 14
Conclusiones 15
Bibliografía 16
1
ABSTRACT
Indicators are very important in a company since they help to establish certain classifications
to each employee, in that way. companies can be aware of all its employee’s work records,
absences, or any other classification.
The purpose of the study is to obtain a new indicator, that can helps us conclude
which employee turns out to be the most outstanding within the company, therefore the
triggering question to solve this problem is: how can the three different indicators combine
with the aim of obtaining a new one that allows us to visualize the “most outstanding”
employee in a simpler way?
Key words
[eigenvectors, eigenvalues, indicators, linear combination, eigenvalues, variance, covariance].
2
Resumen
Los indicadores son muy importantes en una empresa ya que ayudan a establecer ciertas
clasificaciones a cada empleado, de esa forma, las empresas pueden conocer todos los
registros de trabajo, ausencias o cualquier otra clasificación de sus empleados.
Con esto en mente, una compañía mediana desea establecer una clasificación entre
sus empleados, para ello cuenta con tres indicadores numéricos, sin embargo no tiene noción
de qué información proporciona cada uno de ellos, debido a que el gerente de recursos
humanos no lo especificó al momento de salir de la empresa.
El propósito de estudio es obtener un nuevo indicador, que nos ayude a concluir qué
empleado resulta ser el más destacado dentro de la empresa, por lo tanto la pregunta
detonadora a la resolución de este problema es ¿de qué manera se pueden combinar los tres
diferentes indicadores con el objetivo de obtener uno nuevo que nos permita visualizar de una
forma más sencilla al empleado “más destacado”?.
Palabras clave
[vectores propios, valores propios, indicadores, combinación lineal, varianza, covarianza].
3
Introducción
Una compañía tiene registrados tres indicadores para sus empleados que establecen una
clasificación sobre cada uno, actualmente la compañía cuenta con un archivo de datos con las
clasificaciones de los tres indicadores por cada empleado, pero se desconoce qué representa
cada indicador. En este trabajo investigaremos por medio de diferentes metodologías y
procedimientos la manera de determinar una posible solución para resolver el problema de la
compañía.
Cabe destacar que otra área de suma importancia para la resolución de este problema
y de muchos otros en nuestra vida diaria, es el uso y la aplicación de la estadística,
específicamente para esta situación, la estadística multivariable, que nos da oportunidad de
analizar la conducta de nuestros datos bajo análisis, haciendo notar la dispersión que llegan a
tener, además de si las variables de entrada (los indicadores de la empresa) se relacionan o
qué efecto tienen sobre la variable de respuesta (“rendimiento del empleado más destacado”)
y tener una idea visual mediante gráficas sobre qué información nos proporcionan los
conceptos de álgebra lineal.
4
medio de los eigenvalores y eigenvectores, también llamados valores propios y vectores
propios de la matriz de varianzas y covarianzas, nos permitirá conocer cuál es la dirección en
donde el conjunto de datos tiene la máxima varianza, lo que nos ayuda a crear una
combinación lineal de los indicadores y a su vez nos dice cuál tiene un mayor peso en el
“rendimiento” de cada empleado, es decir, con dicha combinación nos dice el empleado que
ha destacado más, debido a que se muestra una mayor varianza entre los indicadores.
Metodología
Se analizó la base de datos proporcionada por la empresa, de manera que con ayuda
del software MATLAB, se realizó y graficó una matriz que engloba la información
proporcionada, el motivo del empleo de MATLAB, es debido a que tiene total control en
cuestiones matriciales lo que nos facilitó las operaciones y análisis.
a=xlsread("ma1034-datos-sitprb3D.xlsx");
scatter3(a(:,1),a(:,2),a(:,3),".")
xlabel("indicador 1")
5
ylabel("indicador 2")
zlabel("indicador 3")
scatter3(data(:,1),data(:,2),data(:,3),".")
6
xlabel("indicador 1")
ylabel("indicador 2")
zlabel("indicador 3")
scatter3(matrizprom(:,1),matrizprom(:,2),matrizprom(:,3),".")
xlabel("indicador 1-promedio")
ylabel("indicador 2-promedio")
zlabel("indicador 3-promedio")
7
Visualizamos la diferencia entre el valor de cada indicador y su promedio, de manera
que los puntos más alejados del origen son los que más resaltan, lo que podría significar el
empleado que más se diferencía.
Aunado a esto la covarianza nos ayudó a entender cómo se relacionan las variables
entre sí, es decir, si una variable muestra un cambio, en qué proporción afecta a la otra. Con
todo esto en mente es posible generar una matriz de varianzas y covarianzas, dónde la
diagonal es la varianza de cada indicador, y los elementos fuera de esta, las covarianzas entre
cada pareja de indicadores posible, quedando de la siguiente manera:
data=xlsread("ma1034-datos-sitprb3D.xlsx");
scatter3(data(:,1),data(:,2),data(:,3),".")
xlabel("indicador 1")
ylabel("indicador 2")
zlabel("indicador 3")
scatter3(matrizprom(:,1),matrizprom(:,2),matrizprom(:,3),".")
xlabel("indicador 1-promedio")
ylabel("indicador 2-promedio")
zlabel("indicador 3-promedio")
8
covar = 3×3
De igual manera, los vectores propios tienen un papel vital, destacando el vector
propio asociado al mayor valor propio que nos indica la dirección en la cuál la varianza es
mayor.
data=xlsread("ma1034-datos-sitprb3D.xlsx");
scatter3(data(:,1),data(:,2),data(:,3),".")
xlabel("indicador 1")
ylabel("indicador 2")
zlabel("indicador 3")
9
scatter3(matrizprom(:,1),matrizprom(:,2),matrizprom(:,3),".")
xlabel("indicador 1-promedio")
ylabel("indicador 2-promedio")
zlabel("indicador 3-promedio")
Figura 6. Código de MATLAB para obtener los valores y vectores propios de la matriz
varianza-covarianza
10
Siguiendo el razonamiento del paso anterior, donde puntuamos que el vector propio asociado
al valor propio mayor, nos señala la dirección de máxima varianza, tenemos que:
Una vez localizado este vector, lo podemos interpretar como un nuevo indicador que
da pie a realizar una combinación lineal de los 3 indicadores iniciales.
Retomando el vector anterior, es posible formar una combinación lineal con respecto a los 3
indicadores iniciales y con la matriz de datos centrados, de la siguiente manera:
Ecuación 1
La cuál tiene una proporción de 0.885, 0.3363, 0.322 para el indicador 1, indicador 2
e indicador 3, respectivamente, en otras palabras, el indicador 1 es el que tiene un mayor peso
al momento de establecer el nuevo indicador, seguido por el indicador 2 y finalmente el 3,
esto se puede explicar, ya que el indicador 1 es el que cuenta con una mayor varianza entre
los tres, entonces es lógico pensar que la mayor varianza recaiga en este indicador.
Contando con esta combinación lineal, resulta factible multiplicarla por la matriz de
datos centrados, para obtener el valor de cada empleado con el nuevo indicador.
data=xlsread("ma1034-datos-sitprb3D.xlsx");
scatter3(data(:,1),data(:,2),data(:,3),".")
xlabel("indicador 1")
ylabel("indicador 2")
zlabel("indicador 3")
11
matrizprom=data-prom; %matriz datos centrados
scatter3(matrizprom(:,1),matrizprom(:,2),matrizprom(:,3),".")
xlabel("indicador 1-promedio")
ylabel("indicador 2-promedio")
zlabel("indicador 3-promedio")
val2([1,3])=val([1,1]);
val2([1,2])=val([1,5]);
val2([1,1])=val([1,9]);
nuevoind=matrizprom*vectmayor
x=1:200
scatter(x,nuevoind,"filled")
xlabel("# empleado")
ylabel("indicador nuevo")
scatter(x,nuevoind2,"filled")
xlabel("# empleado")
ylabel("indicador nuevo")
12
Gráfica 3. Gráfica de los valores del nuevo indicador para cada empleado
Ahora ordenamos los valores del indicador nuevo para encontrar el empleado más destacado.
Gráfica 4. Gráfica de los valores del nuevo indicador para cada empleado de mayor a menor
Observamos que mediante esta gráfica podemos señalar que el empleado más
destacado, resulta ser el que cuenta con una valor de 8.3747 de acuerdo con el nuevo
indicador obtenido mediante una combinación lineal de los tres indicadores originales.
13
Resultados
Se obtuvo la combinación lineal planteada en un inicio, la cuál relaciona a los tres
indicadores, por medio de sus varianzas y covarianzas, eligiendo estos conceptos, con la idea
de que un empleado destacado será alguno que presente un comportamiento atípico en
relación con los demás.
Dónde destaca que el indicador 1 tiene una mayor importancia en el indicador nuevo,
ya que tiene el coeficiente mayor, proveniente del vector de la matriz de
varianzas-covarianzas, lo que significa que este indicador tiene una mayor varianza con
respecto a los demás y por lo tanto los empleados que tengan valores lejanos a la media en
este, son más destacables debido a que siguen la dirección de máxima varianza.
En base a esta gráfica en donde estan ordenados los valores del indicador nuevo de
mayor a menor, se puede ver claramente que el empleado con un puntaje de 8.3747 es el que
presenta el valor más grande, es decir el que más destaca sobre los demás, en consideración al
nuevo indicador.
14
Conclusiones
Finalmente se llegó a la resolución de la problemática planteada al comienzo de este reporte,
dándole respuesta a la empresa sobre la manera en que pueden clasificar a sus empleados
incluso sin saber qué miden los tres indicadores con los que cuentan, proporcionándoles una
combinación lineal de estos (ecuación 1) en base a la aplicación de conceptos estadísticos y
de álgebra lineal, en dónde destacan el empleo de valores y vectores propios de la matriz de
varianzas-covarianzas, que nos permitieron saber la dirección en dónde la varianza es
máxima, lo que detona que el empleado en dicha dirección estará alejado de la mayoría, y así
sabemos que dicho empleado se distingue más.
Así fue como conseguimos valores para el nuevo indicador, y sustituyendo los datos
de cada empleado en la combinación lineal obtenida, se logró concluir que el empleado con el
valor en el indicador nuevo de 8.37469 resulta ser el que más destaca.
15
Bibliografía
● The Math Works, Inc. MATLAB . Versión 2020a, The Math Works, Inc., 2020.
Software informático. www.mathworks.com/.
● Rodrigo, J. A. (2017, junio). Análisis de Componentes Principales (Principal
https://www.cienciadedatos.net/documentos/35_principal_component_analysis
https://support.minitab.com/es-mx/minitab/20/help-and-how-to/statistical-modeling/a
nova/supporting-topics/anova-statistics/what-is-the-variance-covariance-matrix/#:%7
E:text=Suele%20utilizarse%20para%20calcular%20los,los%20pares%20posibles%20
de%20coeficientes.
(uam.mx)
16