Está en la página 1de 10

Análisis de datos de una nómina de empleados

Leidy Yakelin Gonzalez Ramirez

Fundación Universitaria del

Área Andina Análisis de datos

Docente

Milton Angulo

23 de mayo de 2022
1. Elabore el análisis de correlación tomando la variable Sueldo con cada

una de las demás variables de la tabla y estableciendo con cuál de ellas

se presenta una

mayor correlación.

COEFICIENTE DE CORELACION

Seguridad social 1

Horas extras -0.551524602

Retención en la fuente 0.999960994

Ahorro -0.487091116

Análisis de Sueldo - Seguridad Social

Se comprobó que la correlación entre salario y seguridad es mayor a cero, esto

quiere decir que es positiva. La correlación se da de forma positiva si las variables

se relacionan directamente, cuando la variable sueldo es alto el valor de la variable

seguridad social también.

Análisis de Sueldo - Horas extras

Se analizó que la correlación de la variable sueldo y horas extras presenta un

resultado de - 0.55, donde en la gráfica se visualiza un porcentaje lineal

agrupado y otro disperso.


Análisis de Sueldo - Retención en la fuente<

Se comparó el resultado de correlación positiva perfecta entre el sueldo y la

retención en la fuente con un valor de 1, lo que nos indica que las variables se

mueven en la misma dirección de forma ascendente.

Análisis de Sueldo - Ahorro

Se identificó que la correlación entre las variables sueldo y ahorro son una

correlación negativa, es decir si la variable sueldo aumenta la variable ahorro

disminuye. En la tabla se evidencia que el valor fue de -0,48.


2. Calcule el Coeficiente de Determinación R2 e indique el ajuste de

cada par de Variables

Análisis Coeficiente de Determinación R2 sueldo - seguridad social

Se observa un coeficiente de determinación igual a 1, es decir, 100%, lo que nos demuestra

que no hay variabilidad entre el sueldo y la seguridad social, puesto que el porcentaje de

descuento es igual para todos los empleados.

SUELDO . SEG SOCIAL


8000000
7000000
f(x) = 0.2385 x
6000000 R² = 1
5000000
4000000
3000000
2000000
1000000
0
0 5000000 10000000 15000000 20000000 25000000 30000000 35000000

Análisis Coeficiente de Determinación R2 sueldo - horas extras

Se evidencio que el resultado de coeficiente es del 0.30 es decir, 30%, lo que indica

que existe una alta variabilidad entre el sueldo y las horas extras, ya que las horas

extras presentan un comportamiento diferente en cada empleado según la base del

salario.

SUELDO . HORAS EXTRAS


450000
400000
350000
300000
250000
200000
150000
f(x) = − 0.00652092978626625 x + 162646.150526556
100000 R² = 0.304179387083189
50000
0
0 5000000 10000000 15000000 20000000 25000000 30000000 35000000
Análisis Coeficiente de Determinación R2 sueldo - retención en la fuente

Al examinar el coeficiente de determinación igual a 1, este equivale al 100%, lo

que muestra que no existe variabilidad entre el sueldo y la retención en la fuente,

puesto que el porcentaje de descuento es el mismo para todos los empleados.

Sueldo - Ret. en la Fuente


6000000
f(x) = 0.185340524097997 x − 6319.8881763583
5000000 R² = 0.999921988932052
4000000

3000000

2000000

1000000
Análisis
0
0 5000000 10000000 15000000 20000000 25000000 30000000 35000000
Coeficiente de Determinación R2 sueldo - ahorro

Se analizó un coeficiente bajo ya que arrojó un resultado de 0.23 es decir, 23%, lo

que revela una alta variabilidad entre el sueldo y el ahorro, ya que el ahorro

demuestra un cambio diferente en cada empleado.

Sueldo - Ahorro
450000
400000
350000
300000
250000
200000
f(x) = − 0.00464161883295895 x + 198584.103384932
150000 R² = 0.23725775502697
100000
50000
0
0 5000000 10000000 15000000 20000000 25000000 30000000 35000000
3. Elabore un cuadro de resumen estadístico con el cálculo de los 12

indicadores, explicando cada uno.


Media

Se encontró en el salario un promedio de $6.636.500, seguridad social $1.582.805, en horas extras

$119.370, en retención en la fuente $1.223.693 del valor descontado, en ahorro $167.780, lo que

nos muestra que fueron los promedios de valores pagados y descontados a los trabajadores.

Mediana

Se logró identificar que el valor que ocupa en la posición central de los datos

estudiados son, en sueldo $2.190.000, seguridad social $522.315, en Horas Extras

$85.500, Retención en la fuente $405.150 y ahorro $157.500.

Moda

Se consideró, que, dentro de los 50 datos de empleados, encontramos que los valores que

más se repiten en el estudio estadístico fueron, en sueldo $950.000 de los valores pagados,

seguridad social $226.575 de los valores descontados, Horas Extras $100.000 de los valores

pagados, retención en la fuente de los $125.000 de los valores descontados en los salarios,

ahorro $200.000 de todos los datos de ahorro que hacen los trabajadores.

Desviación estándar: En este indicador se pudo determinar que la desviación

estándar arrojó un resultado de $8.317.610 que es la distancia que existe con base

al promedio.

Varianza de la muestra: Muestra un resultado de varianza según la desviación

estándar al cuadrado, lo que nos indica la dispersión que tiene los datos alrededor

de la muestra entre cada variable.


Curtosis

Entre todas las variables la curva que muestra en la gráfica es leptocúrtico, lo que

indica que existen una gran cantidad de valores concentrados alrededor del promedio

de todas las muestras.

Coeficiente de asimetría

Se observa una distribución positiva en todas las variables estudiadas, ya que los

datos que arroja son superiores a 0, esto hace que la tenga una mayor de

distribución a la derecha.

Rango

En la base de los 50 empleados se encuentra que los rangos encontrados en las variables

fueron, sueldo $29.375.000, seguridad social $7.005.938, Horas Extras $394.500,

Retención en la fuente $5.485.125, y ahorro $377.000.

Mínimo

Se evidencia en los valores mínimos de cada columna a fueron, sueldo

$950.000, seguridad social $226.575, Horas Extras $ 5.500, Retención en la

fuente $125.000, ahorro $48.000.

Máximo

Los valores en cada columna fueron, sueldo $30.325.000, seguridad social $

7.232.513, Horas extras $400.000, retención en la fuente $5.610.125, ahorro

$425.000.

Suma
Los valores totales encontrados en cada variable manejada en la nómina fueron,

salario $ 331.825.000, seguridad social $79.140.263, Horas extras $ 5.968.500,

Retención en la fuente $61.184.625, ahorro $ 8.389.000.

Cantidad

La cantidad de empleados según estudiado en cada una de las columnas fue un total de 50.

4. Construya un informe con el resumen estadístico

El análisis estadístico da a conocer que entre 50 empleados que existen en la nómina,

los sueldos varían según los cargos entre $30.325.000 y $950.000 y que el total a

pagar de todos los empleados es de $331.825.000 a su vez el promedio de valores

está entre $6.636.500 con una desviación estándar de $8.317.610, lo que nos da a

entender que la mayoría de los empleados ganan más de un salario mínimo. De esta

manera la curtosis el resultado nos arroja que es pico leptocúrtico, lo que nos indica

que existen una gran cantidad de valores concentrados alrededor del promedio de

salario ($6.636.500).
En las gráficas de correlación y coeficiente R2 muestran lo siguiente: la comparación

entre salario, seguridad social y retención en la fuente revelaron gráficas lineales

positivas, esto se debe a que los descuentos que se realizaron a todos los empleados

es de igual porcentaje y esto hace que no haya dispersión en los puntos; la

comparación que hay entre salario, horas extras y ahorro, la gráfica muestra una

dispersión más notable, esto se debe a que los valores no se manejan de la misma

manera entre los empleados ya que varía según el salario base que devengue cada

uno ellos y el total de horas que haya realizado.

También podría gustarte