Está en la página 1de 27

ESTUDIO ESTADÍSTICO SOBRE LA INFLUENCIA DE LAS VARIABLES

CUALITATIVAS Y CUANTITATIVAS EN LA INVERSIÓN DE LA FIESTA DE


ANIVERSARIO DE LOS EMPLEADOS DE LA EMPRESA ARRENDAMIENTOS
NUTIBARA

Introducción
De la empresa Arrendamientos Nutibara dedicada a la compra, venta, el arriendo y el
avalúo de propiedades raíz, se cuenta con la base de datos de los empleados en la cual están
consignados por trabajador, el nombre, la edad, el número de hijos, ciudad de residencia y
el cargo que ocupa dentro de la empresa. A partir de dichos datos se propone realizar una
síntesis y un análisis estadístico riguroso con el fin de optimizar la dinámica en la base de
datos; además, de permitir llevar el control de las cuatro variables anteriormente citadas
entorno al personal.
1. Planteamiento del problema
El personal de recursos humanos desea obtener información sobre el número de hijos que
hay en la familia de cada trabajador, esto con el fin de saber cuántas personas serán
invitadas a la celebración de los sesenta (60) años de la empresa y se desea saber la
distribución de su personal en el Valle de Aburrá con el fin de establecer el lugar más
conveniente para la realización de la fiesta. Para esto, se toma una muestra de cuarenta
personas.
2. Objetivo general: establecer la distribución del número de hijos por edades de los
trabajadores y la de los cargos en las diferentes ciudades.

3. Objetivos específicos:
 Analizar la distribución de las edades dentro de la empresa.
 Relacionar el número de hijos dentro del personal de la empresa.
 Exponer la distribución de las ciudades de residencia del personal de la empresa.
 Analizar los cargos dentro de la empresa y su distribución.
 Identificar qué tipo de relación existe entre las variables edad y número de hijos.
 Calcular correlaciones o correspondencias entre las variables ciudad de residencia y
cargo.

4. Definición de variables:
Las variables estadísticas se pueden clasificar según medición de la siguiente manera:
cualitativas, cuando toma valores de cualidades o categorías y, cuantitativas cuando toma
valores numéricos.
A razón de lo anterior dentro del trabajo en cuestión se tiene que:
 Cargo: variable cualitativa nominal.
 Ciudad de residencia: cualitativa nominal.
 Edad: variable cualitativa continua.
 Número de hijos: variable cualitativa discreta.

5. Metodología para el desarrollo del trabajo:


Fuente de datos: Los datos se obtuvieron de una fuente secundaria. La base de datos que
suministró esta información registra los datos básicos del empleado, como lo son: la edad,
número de hijos, lugar de residencia.
 Análisis Descriptivo de Datos
5.1 Tabla de entrada de datos
Tabla 1: datos básicos de los empleados de Arrendamientos Nutibara
# DE CIUDAD DE
NOMBRE EDAD CARGO
HIJOS RESIDENCIA

CLAUDIA GOMEZ 42 2 Medellín Contadora


NELSON TEJADA 45 5 Medellín Asesor Interno
CARLOS ARTURO HERNANDEZ 33 0 Medellín Conductor
RICARDO DAVILA 46 2 Medellín Auxiliar Servicios
JAIME ARANGO 38 3 Prado Auxiliar Servicios
ARGIRO GOMEZ CIFUENTES 51 2 Medellín Jefe admón.
VIKY ARBOLEDAD 43 1 Medellín Auxiliar admón.
JOHANA PALACIOS 29 0 Bello Auxiliar contable
LUCERO PALACIOS 38 1 Medellín Auxiliar contable
LILIANA CASTRILLON 42 0 Medellín Auxiliar Caja
BEATRIZ CASTAÑO 43 1 Copacabana Auxiliar Caja
EDELMIRA DAZA 57 2 Medellín Jefe Caja
ANGELA MENA 35 0 Medellín Auxiliar Servicios
GUILLERMO BLANDON 33 1 Medellín Auxiliar Sistemas
JORGE GARCIA 40 2 Medellín Auxiliar Sistemas
DIEGO MONTOYA 47 0 Itagüí Jefe Sistemas
MARIA EUGENIA PEREZ 43 1 Itagüí Auxiliar contable
WILMAR SEPULVEDAD 31 2 Caldas Asesor externo
RICHAR GIRALDO 26 1 Medellín Asesor Interno
EMANUEL MUÑOZ 25 0 Estrella Asesor externo
JUAN DAVID CORTEZ 25 0 Medellín Asesor externo
JORGE MONTOYA 22 1 Caldas Asesor externo
NILSON ROJAS 48 3 Medellín Asesor Interno
FREDDY GIL GIRALDO 28 1 Prado Asesor Interno
DIEGO DUQUE DUQUE 31 2 Medellín Auxiliar Servicios
DIANA MARIA CASTAÑO 43 3 Estrella Auxiliar Caja
ALVARO GONZALEZ 48 0 Medellín Jefe Crédito
MANOGLIA SEPULVEDAD 41 2 Prado Auxiliar Crédito
PAOLA DUQUE VERA 41 0 Medellín Auxiliar Crédito
JAHANA MONTOYA 33 1 Estrella Auxiliar Crédito
TERESA DE JESUS ORTIZ 39 0 Medellín Secretaria Gerencia
TATIANA ZAPATA 38 1 Envigado Auxiliar Arrendamientos
ERIKA MARIA GIRALDO 23 0 Medellín Auxiliar arrendamientos
BEATRIZ GOMEZ 45 0 Medellín Jefe Ventas
EDISON VALENCIA 38 2 Medellín Auxiliar ventas
JOHAN CAMILO RAMIREZ 36 1 Medellín Abogado
CRISTIAN GONZALEZ 22 0 Prado Asesor externo
MONICA PULGARIN 39 1 Medellín Recesionista
SOYAIDA VILLADA 44 1 Medellín Relaciones publicas
ADRIANA ARENAS 44 1 Medellín Jefe Cartera

La tabla 1 alimentará la tabla de entra de datos o contingencia de las cuatro variables.


Tabla 2 de contingencia variables cualitativas.
Número de hijos

Edad 0 1 2 3 4 5 Total

22-27 4 2 0 0 0 0 6

27-32 1 1 2 0 0 0 4

32-37 2 5 1 1 0 0 9

37-42 3 1 3 0 0 0 7

42-47 2 5 1 1 0 1 10

47-52 1 0 1 1 0 0 3

52-57 0 0 1 0 0 0 1

Total 13 14 9 3 0 1 40
Tabla 3 de contingencia variables cuantitativas.
Ciudad de residencia

Medellí Bell Cald Estrell Envigad Pra


Cargo Total
n o Copa Itagüí as a o do

Contador 1 0 0 0 0 0 0 0 1
Asesor Interno 3 0 0 0 0 0 0 1 4
Conductor 1 0 0 0 0 0 0 0 1
Auxiliar Servicios 3 0 0 0 0 0 0 1 4
Jefe admón. 1 0 0 0 0 0 0 0 1
Auxiliar contable 1 1 0 1 0 0 0 0 3
Auxiliar caja 1 0 1 0 0 1 0 0 3
Jefe caja 1 0 0 0 0 0 0 0 1
Auxiliar de
2 0 0 0 0 0 0 0 2
sistemas
Jefe sistemas 0 0 0 1 0 0 0 0 1
Asesor externo 1 0 0 0 2 1 0 1 5
Jefe Crédito 1 0 0 0 0 0 0 0 1
Auxiliar crédito 1 0 0 0 0 1 0 1 3
Secretaria gerencia 1 0 0 0 0 0 0 0 1
Auxiliar
1 0 0 0 0 0 1 0 2
Arrendamientos
Jefe de ventas 1 0 0 0 0 0 0 0 1
Auxiliar ventas 1 0 0 0 0 0 0 0 1
Abogado 1 0 0 0 0 0 0 0 1
Recepcionista 1 0 0 0 0 0 0 0 1
Relaciones
1 0 0 0 0 0 0 0 1
publicas
Jefe de cartera 1 0 0 0 0 0 0 0 1
Auxiliar admón. 1 0 0 0 0 0 0 0 1

Total 26 1 1 2 2 3 1 4 40

 Análisis Univariado para cada una de las variables


A continuación, se realizará el estudio por separado de las variables que actúan en estudio
estadístico.
5.2 Variables cualitativas con su respectiva interpretación
Ciudad de residencia de los empleados de arrendamientos Nutibara
De la tabla 1 se elaboró la tabla de frecuencias para la variable cualitativa ciudad de
residencia:
Tabla 4 tabla de frecuencias variable ciudad de residencia.
Ciudad f n F N

Medellín 26 65 26 0.65
Bello 4 10 30 0.75
Copacabana 1 2.5 31 0.775
Itagüí 1 2.5 32 0.8
Caldas 2 5 34 0.85
Estrella 2 5 36 0.9
Envigado 3 7.5 39 0.975
Prado 1 2.5 40 1

Total 40      

Con la tabla 4 se elaboraron las siguientes graficas para el análisis univariado:

Envigado Prado
CIUDAD
Estrella 8% DE3%RESIDENCIA
70.0000 5% Gráfica 1-2. diagrama de barras y
60.0000 Caldas circular variable ciudad de residencia.
5%
Itagui
50.0000
Copacabana
3%
40.0000
3% De las gráficas 1 y 2 se puede notar
30.0000
20.0000
claramente como los empleados de la
Bello
10.0000 empresa están muy concentrados en la
10% Medellín
0.0000 65% ciudad de Medellín con un 65% seguido
lí n llo a ui da
s l la o o
el Be an g l re ad ad de bello, 10% y envigado con un 8%, la
d a b Ita Ca t i g Pr
e c Es En
v
M
Co
pa ciudad con menos trabajadores
residiendo son dos, Itagüí y Copacabana
con 2%.
Cargo de los empleados de arrendamientos Nutibara
De la tabla 1 se elaboró la tabla de frecuencias para la variable cualitativa cargo:
Tabla 5 frecuencias variable cargo
Cargo f n F N

12.500
Contador 5.0000 0 5.0000 0.1250
10.000
Asesor Interno 4.0000 0 9.0000 0.2250
10.000
Conductor 4.0000 0 13.0000 0.3250
Auxiliar Servicios 3.0000 7.5000 16.0000 0.4000
Jefe admón. 3.0000 7.5000 19.0000 0.4750
Auxiliar contable 3.0000 7.5000 22.0000 0.5500
Auxiliar caja 2.0000 5.0000 24.0000 0.6000
Jefe caja 2.0000 5.0000 26.0000 0.6500
Auxiliar de sistemas 1.0000 2.5000 27.0000 0.6750
Jefe sistemas 1.0000 2.5000 28.0000 0.7000
Asesor externo 1.0000 2.5000 29.0000 0.7250
Jefe Crédito 1.0000 2.5000 30.0000 0.7500
Auxiliar crédito 1.0000 2.5000 31.0000 0.7750
Secretaria gerencia 1.0000 2.5000 32.0000 0.8000
Auxiliar
Arrendamientos 1.0000 2.5000 33.0000 0.8250
Jefe de ventas 1.0000 2.5000 34.0000 0.8500
Auxiliar ventas 1.0000 2.5000 35.0000 0.8750
Abogado 1.0000 2.5000 36.0000 0.9000
Recepcionista 1.0000 2.5000 37.0000 0.9250
Relaciones publicas 1.0000 2.5000 38.0000 0.9500
Jefe de cartera 1.0000 2.5000 39.0000 0.9750
Auxiliar admón. 1.0000 2.5000 40.000 1.0000

40.000
 
Total 0    

Con la tabla 5 se elaboraron las siguientes graficas para el análisis univariado:

14 Cargo empleados arrendamientos nutibara


12
10
8
6
4
2
0
or no or os on le ja ja as as no ito ito ia s as as do ta as ra on
tad ter uct vici dm tab r ca e ca em em ter red red renc ento ent ent oga onis blic arte dm
n In d r a n a f t t x C c i v v i u c a
Co or Con r S e fe r co xili Je sis sis or e fe iar a ge am de liar Ab epc s p de iar
e s i a J e i a Au e f e
d Je s e s J e i
x arl i d e
f ux i c e e i l
As xil xil ar A Au ret Arre Je A
n Re cion Jef Aux
Au Au xi li c l a
Au S e li ar Re
uxi
A

Grafica 3. Diagrama de barras variable cargo.


Jefe sistemas
CARGO 3%
Asesor externo
3%
Jefe Credito
3%
Jefe caja Auxiliar de sistemas Auxiliar credito
5% 3% 3%
Auxiliar caja
5% Secretaria gerencia
Auxiliar contable 3%
8% Auxiliar Arrendamientos
Jefe admon Jefe de3%ventas
8% 3% ventas
Auxiliar
Abogado 3%
3%
Auxiliar Servicios
8%

Recepcionista
3% publicas
Relaciones
Conductor 3%
Jefe de cartera
10% Contador
13% 3%
Auxiliar admon
3%

Asesor Interno
10%

Gráfica 4. diagrama circular variable cargo.


De las gráficas 3 y 4 se aprecia como el cargo que más tiene la empresa es el de contador
con un 13%, el 10% de los cargos para asesor interno y conductores, 8% para auxiliar de
servicios, jefe de administración y auxiliar contable, con el 5% auxiliar de caja y jefe de
caja y los restantes puestos todos con 3%.
5.3 Variables Cuantitativas con su respectiva interpretación
Para las variables cuantitativas, es necesario saber para la variable continua si es normal.
Para ello, Se hacen tres pruebas para saber si los datos presentan un comportamiento
normal:
 Parámetros de la medida de tendencia central, las cuales deben estar en valores
muy cercanos con lo cual nos indicaría el comportamiento de la normalidad de los
datos, medidas de dispersión, curtosis, asimetría:

Con los datos de la tabla 1, de la variable edad se calcularon mediante las funciones de
Excel los siguientes parámetros.
Tabla 6 parámetros estadísticos de la variable edad
Media 38
Moda 38
Mediana 39

Desviación 8
Curtosis -0.4
Asimetría -0.2
Coeficiente
V 70

De la primera serie de datos generados en la tabla 6, se puede notar que las tres medidas de
tendencia central están muy cercanas entre sí; para la curtosis se tiene que un valor de 0 o
cercano a cero nos da una inferencia de datos normales.[2], el valor de -0.4 es muy cercano
a 0 de lo cual estos datos tienden a ser datos normales; para la asimetría se presenta un
análisis similar a la de curtosis de acuerdo con esto el valor es cercano a 0.

 Prueba de pp-plot
Se graficaron los datos de edad para ver su tendencia de tal forma que al generar una
gráfica lineal este pase muy equidistante a todos los puntos.

EDAD
60

f(x) = 0.71 x + 23.41


45 R² = 0.95

30

15
0 5 10 15 20 25 30 35 40 45

Gráfica 5. PP-plot variable edad.


De la gráfica 5 se puede ver como la línea está equidistante a casi todos los puntos,
concluyendo que estos datos tienen tendencia normal.
 Curva de normalidad
Con la función DISTR.NORM. N de Excel en conjunto con los parámetros de la tabla 6 y
los datos de edad de la tabla 1 se generó la gráfica de distribución:
Dist.Nor.Edad
0.050
0.045
0.040
0.035
0.030
0.025
0.020
0.015
0.010
0.005
0.000
20 25 30 35 40 45 50 55

Gráfica 6. Distribución normal para la variable edad empleados arriendos Nutibara.


Ahora bien, con las tres anteriores pruebas se puede concluir que los datos presentan alta
correspondencia con el comportamiento de una variable normal.
5.3 Análisis univariado para la variable edad empleados arriendos Nutibara.
Para construir la tabla de frecuencias se siguieron los siguientes pasos:
 Se determina la cantidad de intervalos
 Se usa la regla empírica de sturges K=1+3.3log(n)
Donde K es el número de intervalos el cual debe ser un numero entero y n el número de
datos.
 Cálculo del rango R de los datos.
Este es el número de unidades de variación presentes en los datos suministrados en la
tabla 1 calculado como la diferencia entre el dato más grande con el dato más pequeño
R= edadMax-edadMin.
 Anchura de cada intervalo A.
Se calcula como R/K
 Construcción de los intervalos.

Los datos de los numerales anteriores se consignaron en la tabla 7:


Li Ls

n= 40.0 22 27
Tabla 7 K≥ 6.3 datos para generar la tabla de 27 32 frecuencias. Tabla 8
intervalos para la variable edad
K= 7.0 32 37
Xmax= 57.0 37 42
Xmin= 22.0 42 47
R= 35.0 47 52
A= 5.0 52 57
Ya con los datos de la tabla 8 se pueden generar la marca de clase de cada intervalo que es
el promedio, la frecuencia absoluta fi, la cual se calcula en conjunto con la tabla 1 y tabla 8
contando cuantos datos se tiene en cada intervalo, la frecuencia absoluta acumulada Fi, la
cual se genera de la siguiente manera: la el primer valor no se acumula y corresponde al
primer valor de fi, las restantes se calculan como Fi-1+fi, la frecuencia relativa hi se calcula
como el cociente entre fi/n y la frecuencia relativa acumulada Hi de manera análoga a Fi
pero con los datos de hi.

Tabla 9. frecuencias para la variable edad


Li Ls mi fi Fi hi Hi

22.00 27.00 25.00 6.00 6.00 0.15 0.15


27.00 32.00 30.00 4.00 10.00 0.10 0.25
32.00 37.00 35.00 5.00 15.00 0.13 0.38
37.00 42.00 40.00 11.00 26.00 0.28 0.65
42.00 47.00 45.00 10.00 36.00 0.25 0.90
47.00 52.00 50.00 3.00 39.00 0.08 0.98
52.00 57.00 55.00 1.00 40.00 0.03 1.00

Con los datos generados en la


Distribución de clientes segun su edad
eDAD TRABAJADORES tabla 9 se generaron las
11.0
12.00 siguientes graficas:
numero de trabajadores

10.0
10.00
8.00
personas

6.06.00
5.0
4.00
4.0
2.00 3.0
0.00
22-27 27-32 32-37 37-42 42-47 1.0 47-52 52-57
0.0
Rango de edades
23.000025.000030.000035.000040.000045.0000 50.000055.0000
edades
Gráfica 7-8. Polígono de frecuencias
ojiva
Distribución de las edades y diagrama de barras edades
28% 40
36
39 trabajadores arrendamientos
Nutibara.
numero de personase

13%
26
25% Gráfica 9-10. Ojiva y diagrama de
10% pastel edades personal
15
10
arrendamientos Nutibara.
6 15% 8%
3% De las gráficas 7 a 10 se deja en
0
22.0000 27.0000 32.0000 37.0000 42.0000 47.0000 52.0000 57.0000 evidencia como en la empresa la el
22-27 27-32 32-37 edad
37-42 42-47 47-52 52-57 53% del personal está entre los 37-47
años, el 25% está entre los 22-32.
5.4 Métodos Numéricos
5.4.1 Medidas de tendencia central con interpretación
Se realizarán los cálculos de las medidas de tendencia central para datos agrupados a la
variable cuantitativa continua:
El cálculo de la moda, media, mediana, medidas de tendencia central y la varianza,
desviación típica y coeficiente de variación, medidas todas estas de variación, se usaron los
datos consignados en la tabla 9 en conjunto con las siguientes ecuaciones.
Para la media: Mediana: Moda:

Para saber que fi. Fi y que Linf usar se debe escoger la fila
que sea igual o mayor a n/2=40/2=20 para Fi. en la tabla 9 se encuentra resaltada dicha
fila.
Tabla 10. Medidas de tendencia central para la variable edad
Moda (Mo) 41.2857

M.T. Central Media(X) 38.5000

Mediana (Me) 39.2727

5.4.2. Análisis de simetría


Para este análisis se usarán las medidas de tendencia central, las cuales cuando las tres
medidas de tendencia central coinciden se dice que los datos muestran un comportamiento
simétrico, pero cuando la media es menor que la mediana, los datos muestran asimetría
hacia la izquierda y cuando la mediana es mayor que la media los datos tienen un
comportamiento asimétrico hacia la derecha, ver grafica 11.

Gráfica 11. Asimetría de variables continuas

0.0510
Dist.Nor.Edad
0.0460

0.0410

0.0360

0.0310

0.0260

0.0210

0.0160

0.0110

0.0060

0.0010
202122 232425262728293031 323334353637383940414243444546474849505152535455565758

Tabla 11 análisis de simetría con MTC


Análisis de simetría

X=Me=Me simétrica FALSO


X>Me Asimetría (+) FALSO
X<Me Asimetría (-) VERDADERO

Gráfica 12. Análisis de simetría.


De la tabla 11 y gráfica 12, se puede observar que la curva es asimétrica negativa o hacia la
izquierda.
5.4.3 Medidas de Variación con interpretación
Estos parámetros estadísticos nos dejan en evidencia la distancia que existe entre los datos
y la media aritmética.
 Varianza:
Es el promedio del cuadrado de las distancias entra cada observación y la media del
conjunto de datos, lo cual nos refleja si los datos están agrupados de forma cerrada o
dispersa entorno a la variable de tendencia central.
Donde xi es la marca de clase
fa es la frecuencia absoluta.
 Desviación estándar:
Esta medida nos indica que tan homogéneas son las desviaciones respecto a la medida de
tendencia central y es la raíz cuadrad de la varianza.
 Coeficiente de variación C.V
Es una medida que se usa para comparar las distribuciones, se calcula como el cociente
entre la desviación estándar y la media aritmética.
De lo anterior, se recopilaron los cálculos en la tabla 12.
Tabla 12. Medidas de variación para la variable edad.
Varianza 66.2534

Variación Desv.Tipica S 8.1396

Cv 0.2073

De la tabla 12 se observa que la desviación de las edades de los empleados respecto a el


promedio es de 8.1396 años.
5.4.4 Análisis de regla empírica
Esta regla establece que:
 Cerca del 68% del área bajo la curva normal se encuentra a una desviación estándar
de la media
 Cerca del 95% del área bajo la curva normal se encuentra a dos desviaciones
estándar de la media
 Cerca del 99% del área bajo la curva normal se encuentra a tres desviaciones
estándar de la media
Tabla 13. Resultados de la tabla empírica
Regla empírica

68% 67.5000

֊σ 30.3604
X 38.5000
σ 46.6396

99.50
% 97.5000

֊2σ 22.2208
X 38.5000
2σ 54.7792

99.70
% 100.0000

֊3σ 14.0811
X 38.5000
3σ 62.9189

En consecuencia se puede asegurar que las edades entre los 30 y 47 años están en el rango
de los 68% de los datos, que el 97,5 % de los datos están entre edades de 22.2 y 55 años, y
que el 100% de los datos están entre 22 y 57 años.
5.4.5 . Medidas de Posición
Estas medidas dividen al conjunto de datos en grupos con el mismo número de datos.
Cuartiles: Son tres valores que corresponden al 25%, 50% y 75% de los datos. Se calcula
con la siguiente ecuación:

Tabla 14. Cálculo de los cuartiles a la variable edad


Q1 31.5000
Q2 39.0000
Q3 43.7500

De la tabla 14 se tiene que:


 El 25% de los trabajadores tienen edades menores a 31 años
 El 50% de los trabajadores tienen edades menores tienen edades menores a 39 años
 El 75% de los trabajadores tienen edades menores a 44 años.
Para la variable cuantitativa discreta número de hijos, se realizará de manera análoga a la
variable edad la tabla de frecuencias y las medidas de tendencia central y de variación, pero
para datos no agrupados.
Tabla 15. Frecuencias para la variable número de hijos
# DE
HIJOS fi Fi hi hi% Hi xi*fi xi^2*fi

13.000 0.325 0.325


0.0000
13.0000 0 0 33% 0 0.0000 0.0000
27.000 0.350 0.675 14.000
1.0000
14.0000 0 0 35% 0 0 14.0000
36.000 0.225 0.900 18.000
2.0000
9.0000 0 0 23% 0 0 36.0000
39.000 0.075 0.975
3.0000
3.0000 0 0 8% 0 9.0000 27.0000
40.000 0.025 1.000
5.0000
1.0000 0 0 3% 0 5.0000 25.0000

1.000 46.000
total 40.0000   0     0 102.0000

Con los datos de la tabla 15 se calcularon los parámetros estadísticos siguientes.


Tabla 16. Medidas de tendencia central y de variación para la variable número de hijos
Moda (Mo) 1.0000

M.T. Central Media (x) 1.1500

Mediana (Me) 1.0000

Varianza segun1.2275
Distribucion de Clientes numero de
hijosM.variación Desv.Tipica 1.1079

40% Cv 0.9634
33%
35% 35%
% de trabajadores

30%
25%
23%
20%
15%
10%
8%
5%
3%
0%
0 1 2 3 4 5
Numero de Hijos
Gráfica 12. Diagrama de bastones para la variable número de hijos
Finalmente, las medidas de posición
Tabla 17. Medidas de posición para la variable número de hijos
Q1 0.0000
Q2 1.0000
Q3 2.0000

De la tabla 17. Se pude concluir que:


El 25% de los trabajadores tienen menos de 0 hijos
El 50% de los trabajadores tienen menos de 1 hijo
El 75% de los trabajadores tienen menos de 2 hijos.

 Análisis Bivariado
5.5 Variables Cualitativas con su respectiva Interpretación
En variables cualitativas se hace el análisis bivariado amparado a la prueba de chi
cuadrado, la cual en primer lugar verifica si las dos variables son dependientes o
independientes, si determina la dependencia posteriormente determina que tan intensa es
esa dependencia.
Se plantean las hipótesis:
H0=variables son independientes (hipótesis nula)
Ha=las variables son dependientes (hipótesis alternativa)
De la tabla 3 de contingencia se calculará la tabla de valores esperados con la siguiente
formula

ni=valor de la frecuencia total de las fijas


nj=valor de las frecuencias totales de las columnas
n=suma de todas las frecuencias.
Con la cual se generan los siguientes valores.
Tabla 18 matriz de frecuencias esperadas
Ciudad de residencia (valores esperados)

Medel Bel Copacaba Itag Cald Estre Enviga Pra


cargo total
lín lo na üí as lla do do

Contador 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Asesor Interno 2.600 0.100 0.100 0.200 0.200 0.300 0.100 0.400 4.000
Conductor 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Auxiliar Servicios 2.600 0.100 0.100 0.200 0.200 0.300 0.100 0.400 4.000
Jefe admón. 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Auxiliar contable 1.950 0.075 0.075 0.150 0.150 0.225 0.075 0.300 3.000
Auxiliar caja 1.950 0.075 0.075 0.150 0.150 0.225 0.075 0.300 3.000
Jefe caja 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Auxiliar de
1.300 0.050 0.050 0.100 0.100 0.150 0.050 0.200 2.000
sistemas
Jefe sistemas 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Asesor externo 3.250 0.125 0.125 0.250 0.250 0.375 0.125 0.500 5.000
Jefe Crédito 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Auxiliar crédito 1.950 0.075 0.075 0.150 0.150 0.225 0.075 0.300 3.000
Secretaria gerencia 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Auxiliar
1.300 0.050 0.050 0.100 0.100 0.150 0.050 0.200 2.000
Arrendamientos
Jefe de ventas 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Auxiliar ventas 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Abogado 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Recepcionista 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Relaciones publicas 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Jefe de cartera 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
Auxiliar admón. 0.650 0.025 0.025 0.050 0.050 0.075 0.025 0.100 1.000
40.00
total 26.000 1.000 1.000 2.000 2.000 3.000 1.000 4.000 0
Paso seguido se calculará el valor de chicuadrado calculado con la siguiente ecuación:

Donde ei es el dato de cada casilla en la matriz de valores esperados.

χ 2 obs=0.9973
Para poder hacer el contraste con la hipótesis nula se debe calcular el χ 2 teo usando los
grados de libertad y las tablas de chi cuadrado, para este caso se necesitó hacer uso de
interpolación lineal.
Grados de libertad= (número de filas-1) (número de columnas-1).[3]
Grados de libertad= (22-1) (8-1) =147.
Asumiendo un Alpha de 0.01 entramos a la tabla 19.

Interpolando:

χ 2 teo=189.8405
Teniendo en cuenta las siguientes consideraciones:
χ 2 teo> χ 2 obs.
Por esta razón Ho es aceptada dándonos como conclusión que las variables ciudad de
residencia y cargo desempañado en la empresa arrendamientos Nutibara no son
dependientes si no independientes.
5.6 Variables Cuantitativas Regresión lineal
Se tiene para este ítem las siguientes variables
Variable independiente: Edad
Variable dependiente: Número de hijos
Esta categorización se da ya que edad es una variable temporal y está siempre será
independiente en cualquier fenomenología estudiada sumado a que la capacidad del número
de hijos está ligada solo a cierta etapa temporal en la vida de los humanos, y la dependiente
por lógica consecuente el número de hijos es la dependiente.
Se realizará el diagrama de dispersión para edad vs número de hijos:

grafico de dispersión
6

4
n° de hijos

0
20 25 30 35 40 45 50 55 60
edad
Gráfica 13. Gráfico de dispersión para las variables edad
número de hijos
Desde la teoría se tiene las siguientes interpretaciones.[4]:
Comparando la figura que se muestra a la derecha con la gráfica
13 se puede intuir que las variables tienen una relación débil
positiva y una fuerza de correlación muy débil.
Determinación de los coeficientes de regresión.

Tabla 19. Parámetros necesarios para los cálculos de los


parámetros de regresión lineal simple
hijo
edad
s x*y X^2 y^2 xi-x (xi-x)^2 (yi-y) (xi-x)(yi-y)

42 2 84.0000 1764.0000 4.0000 4.1250 17.0156 0.8500 3.5063


45 5 225.0000 2025.0000 25.0000 7.1250 50.7656 3.8500 27.4313
-
33 0
0.0000 1089.0000 0.0000 -4.8750 23.7656 1.1500 5.6063
46 2 92.0000 2116.0000 4.0000 8.1250 66.0156 0.8500 6.9063
38 3 114.0000 1444.0000 9.0000 0.1250 0.0156 1.8500 0.2313
51 2 102.0000 2601.0000 4.0000 13.1250 172.2656 0.8500 11.1563
-
43 1
43.0000 1849.0000 1.0000 5.1250 26.2656 0.1500 -0.7688
-
29 0
0.0000 841.0000 0.0000 -8.8750 78.7656 1.1500 10.2063
-
38 1
38.0000 1444.0000 1.0000 0.1250 0.0156 0.1500 -0.0188
-
42 0
0.0000 1764.0000 0.0000 4.1250 17.0156 1.1500 -4.7438
-
43 1
43.0000 1849.0000 1.0000 5.1250 26.2656 0.1500 -0.7688
57 2 114.0000 3249.0000 4.0000 19.1250 365.7656 0.8500 16.2563
-
35 0
0.0000 1225.0000 0.0000 -2.8750 8.2656 1.1500 3.3063
-
33 1
33.0000 1089.0000 1.0000 -4.8750 23.7656 0.1500 0.7313
40 2 80.0000 1600.0000 4.0000 2.1250 4.5156 0.8500 1.8063
-
47 0
0.0000 2209.0000 0.0000 9.1250 83.2656 1.1500 -10.4938
-
43 1
43.0000 1849.0000 1.0000 5.1250 26.2656 0.1500 -0.7688
31 2 62.0000 961.0000 4.0000 -6.8750 47.2656 0.8500 -5.8438
-
26 1
26.0000 676.0000 1.0000 -11.8750 141.0156 0.1500 1.7813
-
25 0
0.0000 625.0000 0.0000 -12.8750 165.7656 1.1500 14.8063
-
25 0
0.0000 625.0000 0.0000 -12.8750 165.7656 1.1500 14.8063
-
22 1
22.0000 484.0000 1.0000 -15.8750 252.0156 0.1500 2.3813
48 3 144.0000 2304.0000 9.0000 10.1250 102.5156 1.8500 18.7313
-
28 1
28.0000 784.0000 1.0000 -9.8750 97.5156 0.1500 1.4813
31 2 62.0000 961.0000 4.0000 -6.8750 47.2656 0.8500 -5.8438
43 3 129.0000 1849.0000 9.0000 5.1250 26.2656 1.8500 9.4813
-
48 0
0.0000 2304.0000 0.0000 10.1250 102.5156 1.1500 -11.6438
41 2 82.0000 1681.0000 4.0000 3.1250 9.7656 0.8500 2.6563
-
41 0
0.0000 1681.0000 0.0000 3.1250 9.7656 1.1500 -3.5938
-
33 1
33.0000 1089.0000 1.0000 -4.8750 23.7656 0.1500 0.7313
-
39 0
0.0000 1521.0000 0.0000 1.1250 1.2656 1.1500 -1.2938
-
38 1
38.0000 1444.0000 1.0000 0.1250 0.0156 0.1500 -0.0188
-
23 0
0.0000 529.0000 0.0000 -14.8750 221.2656 1.1500 17.1063
-
45 0
0.0000 2025.0000 0.0000 7.1250 50.7656 1.1500 -8.1938
38 2 76.0000 1444.0000 4.0000 0.1250 0.0156 0.8500 0.1063
-
36 1
36.0000 1296.0000 1.0000 -1.8750 3.5156 0.1500 0.2813
-
22 0
0.0000 484.0000 0.0000 -15.8750 252.0156 1.1500 18.2563
39 1 39.0000 1521.0000 1.0000 1.1250 1.2656 - -0.1688
0.1500
-
44 1
44.0000 1936.0000 1.0000 6.1250 37.5156 0.1500 -0.9188
-
44 1
44.0000 1936.0000 1.0000 6.1250 37.5156 0.1500 -0.9188

60167.000 2786.375
1515 46 1876.0000 0 102.0000 0.0000 0 0.0000 133.7500

Usando las siguientes ecuaciones:

Aplicando las anteriores ecuaciones:


Tabla 20. Valores de los parámetros de la regresión lineal.
X 37.8750
Ȳ 1.1500
b 0.0480
a -0.6681

Para finalmente obtener la siguiente ecuación que “representa” los datos:


Y =0.0480 X−0.6681
n ° de hijos=0.0480 edad−0.6681
De la cual b es la
modelo lineal pendiente lo cual se nos
6 corrobora con el análisis
5 intuitivo la cual nos
4 daba positiva y por ser
n° de hijos

3 un número pequeño esta


2 relación es débil.
f(x) = 0.05 x − 0.67
1 R² = 0.13
0
20 25 30 35 40 45 50 55 60
edad
Ahora se calcularán el coeficiente de determinación r^2 el cual nos da que tan fuerte es la
relación entre las variables o que tan bien representan los datos la ecuación generada con
los valores de la tabla 20.

Con la ecuación anterior y el uso de la tabla 19 se generaron los siguientes datos:


Tabla 21 cálculo del coeficiente de correlación para las variables edades vs n° de hijos
Covarianza 3.3438
r 0.3616
r^2 0.1308

De la tabla 21. Se puede verificar que la representación de la recta de los datos es muy débil
ya que el coeficiente r^2 es muy cercano a 0 y este modelo lineal no es un buen modelo que
represente la relación de los datos.
5.6 Aplicación de la Teoría de Probabilidad
para determinar si dos eventos son dependientes o independientes se tiene que:
P ( A|B )=P ( A )
P ( A ∩B)
=P ( A )
P(B)
P ( A ∩ B )=P ( A )∗P ( B )
Si se cumple la ecuación anterior los eventos son independientes de lo contrario son
dependientes:
Sea
A= edad entre 22-27
B= número de hijos 0
Se va a calcular por separado cada igualdad usando los datos de la tabla 22.
P (( edad entre 22−27)∩(número de hijos 0) )=0.1

P ( edad entre 22−27 )∗P ( número de hijos 0 )=0.15∗0.3250=0.04875

Por lo tanto 0.1≠0.04875


Por esta razón se concluye que los eventos edad y numero de hijos son eventos
dependientes.
Usando la tabla 2 de contingencia y aplicando la probabilidad de Laplace casos favorables /
casos totales se elaboró la tabla de probabilidades siguiente:
Tabla 22. Probabilidades de la tabla 2 de contingencia
edad P(0) P(1) P(2) P(3) P(4) P(5) total
22- 0.000
0.1000 0.0500 0.0000 0.0000 0.0000 0.1500
27 0
27- 0.000
0.0250 0.0250 0.0500 0.0000 0.0000 0.1000
32 0
32- 0.025
0.0500 0.1250 0.0250 0.0000 0.0000 0.2250
37 0
37- 0.000
0.0750 0.0250 0.0750 0.0000 0.0000 0.1750
42 0
42- 0.025
0.0500 0.1250 0.0250 0.0000 0.0250 0.2500
47 0
47- 0.025
0.0250 0.0000 0.0250 0.0000 0.0000 0.0750
52 0
52- 0.000
0.0000 0.0000 0.0250 0.0000 0.0000 0.0250
57 0
0.075
0.3250 0.3500 0.2250 0.0000 0.0250 1.0000
total 0

A continuación, se aplicarán las reglas de la probabilidad a la tabla 22.


Dado que nuestros eventos son no mutuamente excluyentes o sé que pueden ocurrir ambos
sucesos se tiene:
 Regla de la suma:
A= 0 n° hijos B=edad entre [37-42]

P ( AoB ) =0.3250+0.1500−0.3250∗0.1500=0.4263

 Regla de la multiplicación

P ( AB ) =0.3250∗0.1500=0.0488
 Teorema de bayes
0.3250∗0.1500
P ( A∨B )= =0.3250
0.1500

Conclusiones
A partir del análisis estadístico riguroso que se llevó acabo con la base de datos del
personal de Arrendamientos Nutibara, se logró sintetizar de forma precisa y exacta la
variación de cada una de las cuatro variables que eran objeto de estudio. Los métodos
anteriormente empleados sirvieron como herramienta matemática para estimar la
desviación estadística de las variables cuantitativas que eran de nuestro interés.
Inicialmente, las variables cualitativas nominales como lo son el cargo y la ciudad de
residencia fueron sintetizadas mediante una tabla de frecuencia estándar y posteriormente
graficadas en diagramas de barra y circular.
A partir de estos resultados se concluye que el 65% del personal de la empresa es residente
de la ciudad de Medellín, el 10% reside en Bello, el 8% en envigado, el 5% en Caldas y la
Estrella, el 3% en Prado y el 2% en Itagüí y Copacabana. Frente a este se arroja una mayor
favorabilidad de realizar el encuentro social en la ciudad de Medellín.
Posteriormente para la segunda variable cualitativa: cargo laboral. Se registró un mayor
número de contadores en la empresa en total unos cinco. Seguido a esto, se cuenta con 4
contadores y conductores. Tres personas ocupan cargos de auxiliares de servicios, jefe de
administración y auxiliar contable. Dos personas son auxiliares de caja y jefe de caja; y por
última una persona por cargo para los cargos restantes (aux. de sistemas, jefe de sistemas,
asesor externo, jefe crédito, aux. de crédito y secretaría de gerencia). En pocas palabras el
cargo más dominante es el correspondiente al contador ocupando un 13% de la totalidad,
seguido de los contadores y conductores que representan el 10% cada uno del total del
personal.
Es importante resaltar que, mediante la prueba de chi-student se concluye que las dos
variables anteriormente descritas son totalmente independientes.
Por otro lado, para el tratamiento de las variables cuantitativas se emplearon los métodos
reportados, lo cual permitió analizar la tendencia y desviación de las variables sujetas a
análisis matemático.
Para la cantidad de número de hijos se puede concluir a partir de las Medidas de Tendencia
Central que la edad promedio dentro del personal es de 38 años, esto nos indica que el 50%
de los trabajadores tienen 39,27 años o menos y el otro 50% tienen 39,27 años o más.
El dato de moda fue de 41.28 la edad que representa la edad más común de 41 años. Esta
inferencia es bastante precisa y certera debido a que los cálculos de parámetros como la
curtosis y asimetría dieron muy cercanos a cero. Mediante la tabla de frecuencias y las
ilustraciones de los resultados se concluye que el intervalo de edades más común es entre
37 y 42 años de edad que representa el 28% del total. A este dato le sigue el rango de edad
entre 42 a 47 años con un 25%.
Por otro lado, para la variable número de hijos, se realizó el mismo tratamiento que la
variable edad. Se obtuvo que la media de hijos dentro del personal es uno (1). Mediante el
diagrama de bastones se observa que el 33% de los empleados no tienen hijos, el 35%
tienen un hijo, y el 23% poseen dos hijos.
Seguido a esto, se realizó un análisis de interdependencia de esta variable con la variable
edad. La dependencia de ambas variables fue una consideración necesaria debido a la
ligada relación que existe biológicamente entre los humanos.
Sin embargo, a pesar de existir una relación entre ambas variables, no representan una
función correctamente modelada. Esto se concluye a partir del bajo coeficiente de
correlación R de la tabla 21.

REFERENCIAS.
[1]. (2020). Recuperado el 18 de Abril 2020, de:
http://www.fuenterrebollo.com/Aeronautica2016/contingencia.pdf

[2]. Curtosis. (2020). Recuperado el 18 Abril 2020, de:


https://www.universoformulas.com/estadistica/descriptiva/curtosis/
[3]. (2020). Recuperado el 18 Abril 2020, de
http://www.fuenterrebollo.com/Aeronautica2016/contingencia.pdf
[4]. Diagrama de Dispersión. (2020). Recuperado el 18 Abril 2020, de:
https://datavizcatalogue.com/ES/metodos/diagrama_de_dispersion.html

También podría gustarte