Está en la página 1de 18

UNIVERSIDAD TECNOLÓGICA DE PANAMÁ SEDE CENTRAL PANAMÁ

FACULTAD INGENIERÍA INDUSTRIAL

LICENCIATURA EN RECURSOS HUMANOS Y GESTIÓN DE LA


PRODUCTIVIDAD

Integrantes:
Gil Rodríguez 3-750-415
Mariangel Espinoza 8-997-963
María Ricaurte 8-1004-742
Kathleen Muñiz 8-984-1293
Bryani Rodríguez 20-53-75
Liam Ortega 8-1010-2336

Grupo:
1RH121

Profesora:
Gabriela de la Guardia

Tema:
Proyecto Final

Materia:
Estadística 1

Año lectivo:
2023
Índice

Introducción...................................................................................................................................3
Contenido........................................................................................................................................4
Marco del problema..................................................................................................................4
Sobre el problema.....................................................................................................................4
¿Sobre qué vamos a analizar?...............................................................................................4
Los tipos y cantidad de variables.........................................................................................4
Definición de la muestra..........................................................................................................4
Recolección y ordenamiento de los datos..........................................................................5
Instrumento para recolección de datos...............................................................................5
Archivos originales cargados................................................................................................5
Metodología utilizada...............................................................................................................5
Tamaño de la muestra..............................................................................................................5
Aplicación del instrumento.....................................................................................................6
Tabulación de los datos..............................................................................................................6
Gráfica de datos........................................................................................................................6
Aplicación y análisis de las medidas descriptivas...........................................................7
Análisis de relación entre las variables...............................................................................8
Analisis de Correlación............................................................................................................8
Correlación entre las variables del estudio........................................................................9
Analisis de Regresión Lineal................................................................................................10
Probabilidad.............................................................................................................................10
Planteamiento hipotético.......................................................................................................14
Distribuciones de probabilidad............................................................................................14
Conclusiones...............................................................................................................................15
Las dificultades en la realización del trabajo en forma colaborativa.........................16
Las lecciones aprendidas en la realización de este proyecto......................................16
Bibliografía....................................................................................................................................17
Introducción

El análisis de regresión y correlación es una técnica estadística que se utiliza para


examinar la relación entre variables y comprender cómo una variable puede influir
en otra. Esta herramienta es ampliamente utilizada en diversos campos, desde la
economía y la psicología hasta la investigación científica y la ingeniería.

La regresión es un método que permite modelar y predecir el comportamiento de


una variable dependiente a partir de una o más variables independientes. Su
objetivo principal es establecer una relación funcional entre las variables, lo que
implica determinar cómo los cambios en una variable se asocian con los cambios
en otra variable. En otras palabras, la regresión busca identificar la tendencia o
patrón subyacente en los datos y utilizarlo para predecir valores futuros.

La correlación, por otro lado, se centra en medir la fuerza y la dirección de la


relación entre dos variables. La correlación puede ser positiva, cuando ambas
variables varían en la misma dirección, o negativa, cuando varían en direcciones
opuestas. La medida más común para evaluar la correlación es el coeficiente de
correlación de Pearson, que varía entre -1 y 1. Un valor cercano a 1 indica una
correlación positiva fuerte, mientras que un valor cercano a -1 indica una
correlación negativa fuerte. Un valor cercano a 0 indica una correlación débil o
inexistente.

El análisis de regresión y correlación proporciona una forma sistemática de


cuantificar y comprender la relación entre las variables. A través de técnicas
estadísticas, como la regresión lineal, se pueden obtener ecuaciones que
describan cómo una o más variables independientes afectan a una variable
dependiente. Estas ecuaciones pueden utilizarse para realizar predicciones y
tomar decisiones fundamentadas en función de los valores de las variables
independientes.

El análisis de regresión y correlación también permite evaluar la importancia


relativa de diferentes variables independientes y determinar cuáles tienen un
mayor impacto en la variable dependiente. Además, puede ayudar a identificar
valores atípicos o influencias externas que puedan afectar la relación entre las
variables.

Contenido

Marco del problema


Contexto: la institución Pública IFARHU otorga el pago de viáticos de transporte,
alojamiento y alimentación a nivel nacional, se busca realizar un análisis sobre
estos datos para sacar de duda sobre: ¿Por qué que no se está repartiendo de
forma equitativa los fondos de la institución por provincia?

Sobre el problema
Problema: la problemática radica en que hay contantes quejas de provincias como
los santos y las comarcas que afirman que los viáticos a Chiriquí son bastante
altos, por lo que vamos a realizar un estudio de regresión y probabilidad para el
análisis.

Y así comprobar si es cierto que a Chiriquí se les está dando más de lo normal en
los viáticos y si hay provincias a que no se le está dando lo correspondido.

¿Sobre qué vamos a analizar?


Sobre los datos obtenidos de forma publica en la página oficial del IFARHU

Los tipos y cantidad de variables


En este caso vamos a analizar sobre 2 tipos de variable tipo número variable Y
(Viáticos) y variable X (Prioridad), para el caso de la probabilidad vamos a utilizar
un campo tipo fecha para cuantificar las cantidades mensualmente
Definición de la muestra
La muestra en este caso es representativa ya que tiene un alto porcentaje de
correlación entre las variables definidas por lo que podemos decir a simple vista
que según la prioridad así es el monto asignado de viáticos, pero no nos
adelantemos a los hechos y vamos a estudiarlo.

Recolección y ordenamiento de los datos


Como mencionamos antes se recolectaron los datos por medio de la página oficial
del IFARHU desde el link: IFARHU - Viáticos de transporte, alojamiento y
alimentación -2023 - Conjunto de datos - Datos Abiertos de Panamá

Instrumento para recolección de datos


En este caso se utiliza la herramienta de Microsoft Access que utilizamos como
base de datos para consolidar todos los Excel recolectados.

Archivos originales cargados

Metodología utilizada
Se realizo una limpieza de los datos para que fueran agrupados por provincia ya
que tenían muchos destinos el cual complicaba un poco el análisis, el Access se
encarga de realizar la consulta que logramos leer por medio de Excel.

Tamaño de la muestra
¿Son Cantidad de Suma de Monto de
Administrativos? Registros viático
NO 1,560 477,478.50
SI 911 234,901.00
Total, general 2,471 712,379.50

Aplicación del instrumento


El instrumento nos da la muestra que vamos a analizar que representa el 63% de
la muestra total de los datos

Tabulación de los datos


Los Datos
¿Son Cantidad de Suma de Monto de % de
Administrativos? Registros viático registros
NO 1,560 477,478.50 63%
SI 911 234,901.00 33%
Total, general 2,471 712,379.50 100%

Gráfica de datos
Aplicación y análisis de las medidas descriptivas
Utilizamos medidas de tendencia central, por el tipo de información que estamos
analizando es este caso.
Medidas de tendencia central

Esto nos dice que:

 El promedio de los viáticos que se otorga a las personas es de 306.08.


 Moda: lo más común, es decir, el que más se repite de los viáticos es
620.00
 Mediana: la mediana de los viáticos (valor que esta justo en la mitad) es
202.00

Medidas de
forma

Coeficiente de Asimetría
3.4256

Análisis de relación entre las variables

Disperción de Datos correlativos


90,000.00
80,000.00
70,000.00
60,000.00
50,000.00
40,000.00
30,000.00
20,000.00
10,000.00
0.00
0 2 4 6 8 10 12 14

Esto nos indica que los datos tienen correlación entre si ya que la información
va ascendiendo en escalerilla ósea que los datos se pueden analizar con
regresión de datos porque es una información medible, en caso de que los
datos no vallan con una línea de tendencia ascendente o descendente y todos
los puntos estén dispersos significa que la información no tiene relación con lo
que se complica un análisis de los datos

Análisis de Correlación
Admin NO

PRIORIDA Cuenta de VIATICO Diferenci


Destino D Nombre S as
81,443.4
CHIRIQUÍ 1 237 2 0.00
COLÓN 2 125 70,315.6 -
0 11,127.8
2
-
47,985.3 22,330.2
DARIEN 3 68 7 3
38,766.3
PANAMÁ OESTE 4 202 0 -9,219.07
COMARCA NGABE 37,328.6
BUGLE 5 53 7 -1,437.63
35,930.5
VERAGUAS 6 133 0 -1,398.17
33,887.0
BOCAS DEL TORO 7 97 7 -2,043.43
32,370.6
PANAMÁ 8 187 3 -1,516.43
24,248.3
COCLÉ 9 151 3 -8,122.30
23,609.6
HERRERA 10 136 3 -638.70
COMARCA EMBERA 19,032.1
WOUNAAN 11 40 7 -4,577.47
COMARCA GUNA 17,593.0
YALA 12 43 2 -1,439.15
14,967.8
LOS SANTOS 13 88 0 -2,625.22
477,478.
Total, general 1560 0 -5,113.51

Correlación entre las variables del estudio


Fácilmente vimos con el grafico de dispersión como los datos tienen correlación,
pero también podemos determinarlo con una formula en Excel o con otra
herramienta de coeficiente de correlación bajo las funciones de análisis de datos

Coeficiente de Correlación-92% <-- como saco un porcentaje negativo significa


que la variable de Y (viáticos) tiende a disminuir mientras que la variable de X
(Prioridad) incrementa

En este caso utilizamos la formula COEF.DE.CORREL para determinar la


correlación en caso de que no queramos utilizar el grafico de dispersión, esto lo
hacemos antes de realizar el análisis de regresión

ya que en caso de que los datos no tengan correlación es inútil realizar un análisis
de regresión para determinar los resultados esperados, pues nuestro análisis no
tendrá mucha significancia.

Análisis de Regresión Lineal


Analisis de Regresión Lineal
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple92% <-- hay un 92% de correlaccion entre las variables de prioridad y viaticos
Coeficiente de determinación R^2 84% <-- hay una varianza de 84% con lo que el modelo esta bien ajustado
R^2 ajustado 0.824960559
Error típico 8338.872306
Observaciones 13

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 4002257998 4.002E+09 57.5559775 0.00 <-- el modelo tiene una significanza mayor a 0.5
Residuos 11 764904704.7 69536791 lo que nos dice que los datos tienen significado
Total 12 4767162702

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercepción 69,554.88 4,906.16 14.177045 0.00 58,756.49 80,353.27 58,756.49 80,353.27
PRIORIDAD -4,689.40 618.12 -7.586566 0.00 -6,049.86 -3,328.93 -6,049.86 -3,328.93

Probabilidad
Algunos análisis en función de los datos
En este ejemplo colocamos un rango de 15 mil y 28 mil dólares.
En este ejemplo colocamos un rango de 7 mil y 28 mil dólares.
En este ejemplo colocamos un rango de 7 mil y 15 mil dólares.
Planteamiento hipotético
Tomando como ejemplo el ultimo análisis hipotéticamente podríamos decir que el
próximo mes los viáticos a Panama Oeste tienen una probabilidad alta de un 0.75
que este en un rango de entre 7 mil a 15 mil dólares, aunque ha ido bajando
desde abril por lo que probablemente debemos ajustar nuestro rango de monto
para tener una probabilidad más alta de predicción.

Distribuciones de probabilidad
La distribución de la probabilidad en este caso se basa en los meses que tienen
movimientos calculando del total obtenido por la suma total de todos los meses vs
el monto de viáticos correspondiente al mes.
Conclusiones
¿Qué información válida se puede obtener basada en la información analizada de
los datos?

La información válida que se pudo obtener de los análisis es que las conjeturas
que teníamos, lo cual, planteamos en el problema eran afirmativas, es decir, que a
Chiriquí se le están otorgando más viáticos que a otras provincias, también
logramos observar que aparte de Chiriquí, Colón y Darién tienen montos de
viáticos bastante altos.

¿Qué se puede entender a partir de la ecuación de regresión encontrada?

Se entiende que hay una desviación bastante alta entre los viáticos otorgados a
las provincias de Chiriquí, se le están otorgando 16 mil dólares de más según el
cálculo del modelo en el caso de Colón son 10 mil de más y observamos que
Darién esta utiliza 7 mil dólares menos de lo que debería de utilizar en viáticos.

. ¿Qué puede concluir a partir del análisis de probabilidad presentado?

Concluimos en que los montos mensuales otorgados a las Provincias con más
volumen de viáticos rondan entre los 7 mil y 28 mil dólares mensuales que en el
caso de Chiriquí que tiene el rango de montos más alto afecta el presupuesto
general y por ende las otras provincias tendrían un impacto negativo.

Liste las dificultades en la ejecución de la actividad a partir del problema planteado

 Eran varios archivos de datos para analizar (esto complico un poco el


análisis porque eran bastantes archivos separados, pero se solucionó
unificando los datos).
 Al inicio había un listado demasiado extenso de distritos y corregimiento (se
agruparon en provincias).
 La correlación de los datos sin la prioridad que tiene cada provincia hace
que los datos no tienen significancia.
 No entendíamos al inicio como partir de los datos para llegar al fin
esperado.

Las dificultades en la realización del trabajo en forma colaborativa


 Fue complicado descubrir las fortalezas individuales
 Se complico cuando teníamos que armar toda la actividad con los miles de
datos, pero se soluciono cuando adjuntamos los viáticos por provincia.
 Al principio hubo falta de comunicación

Las lecciones aprendidas en la realización de este proyecto

1. Organización: es mejor llevar el control de todo el flujo del análisis para


hacer las cosas en el orden correcto, repetimos muchas veces el análisis de
regresión porque a los que a algunos compañeros les toco la parte de
correlación y ni sabíamos que los datos que analizábamos tenían o no
correlación.
2. Comunicación: no fue hasta que empezamos a tener las reuniones en las
noches que nos estábamos ahogando en un vaso de agua, la comunicación
es importante cuando analizamos datos entre varias personas.
3. Funciones: la separación de funciones es fundamental para no tener a 2
personas haciendo lo mismo, nos paso al principio que 2 personas se
encargaros de la muestra de los datos y ambos estaban haciendo
exactamente lo mismo.
4. Prioridad: según el orden debemos establecer prioridades para avanzar de
forma más eficiente el análisis.
5. Lógica: aprendimos que durante el análisis de los datos nos encontramos
mucho con el pensamiento lógico que se encarga de darle sentido a los
datos.
6. Proyección: al principio no sabíamos que por medio de los análisis de
probabilidad podíamos generar proyecciones en los datos.
7. Modelo: por último, aprendimos que podíamos ajustar el modelo de
regresión estadístico aún si la dispersión de los datos es excesiva.

Bibliografía

Álvarez, J. (1979). Análisis y probabilidad. Boletín de Matemáticas, 13(01), 1-50.

Obtenido de:
https://revistas.unal.edu.co/index.php/bolma/article/download/34964/35223

Dagnino, J. (2014). Regresión lineal. Revista chilena de anestesia, 43(2), 143-149.

Obtenido de: 54e63943b5d69_14_regresion-2-2014_edit.pdf (sachile.cl)

Granados, R. M. (2016). Modelos de regresión lineal múltiple. Granada, España:


Departamento de Economía Aplicada, Universidad de Granada.

Obtenido de: regresion_lineal.pdf (ugr.es)

Leandro, G. T. (2018). Análisis exploratorio de datos: Una introducción a la


estadística descriptiva y probabilidad. Editorial Tadeo Lozano.

Obtenido de: Análisis exploratoria de datos: Una introducción a la estadística ... - Leandro,
González Támara - Google Libros

Peláez, I. M. (2016). Modelos de regresión: lineal simple y regresión logística.


Revista Seden, 14, 195-214.

Obtenido de: 14-cap 14.pdf (revistaseden.org)

También podría gustarte