Está en la página 1de 24

TRABAJO COLABORATIVO

Unidad 3: Pasó 4. Descripción de la información

Estudiantes

Ena Raquel de la Ossa

Tatiana del Carmen Percy

Janelle Figueroa

Mónica Patricia Jiménez

Claudia Patricia Cadena

Grupo del Curso

140

Presentado a

Astrid Segura

Fecha

28 de Noviembre de 2018
Introducción

La regresión es una técnica estadística utilizada para simular la relación existente entre dos o

más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el

comportamiento de una variable dada.

La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se hace de

mala forma, por lo cual es necesario realizar una selección adecuada de las variables que van a

construir las ecuaciones de la regresión, ya que tomar variables que no tengan relación en la

práctica, nos arrojará un modelo carente de sentido, es decir ilógico.

Sin embargo obtener el modelo de regresión no es suficiente para establecer la regresión, ya

que es necesario evaluar que tan adecuado es el modelo de regresión obtenido. Para esto se hace

uso del coeficiente de correlación R, el cual mide el grado de relación existente entre las

variables.

Por lo tanto el análisis de regresión es una herramienta estadística que permite analizar y

predecir o estimar observaciones futuras de dos o más variables relacionadas entre sí, es decir

una herramienta útil para la planeación.

Es frecuente que estudiemos sobre una misma población los valores de dos variables

estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los

cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las

variables están correlacionadas o bien que hay correlación entre ellas.


La apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro,

llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta

es fuerte o débil, positiva o negativa.

Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de

alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si

así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.

Estos conceptos estadísticos, son aplicados a las variables cuantitativas encontradas en la

base de datos del caso de estudio, en el servicio de urgencias del hospital Federico Lleras de

Ibagué.
Justificación

En innumerables situaciones de nuestra vida, encontramos problemas en los cuales existe una

relación entre dos o más variables y es necesario encontrar la naturaleza de esta relación.

En este trabajo encontramos una situación real del servicio de urgencias en el hospital Federico

Lleras de Ibagué donde se tienen los ingresos de pacientes con sus respectivos detalles y datos,

los cuales conforman variables cualitativas y cuantitativas para el respectivo estudio estadístico.

Para esto se hizo uso de la técnica de Regresión y Correlación, la cual resulta una herramienta

muy útil a la hora de analizar el comportamiento de dos o más variables relacionadas.

Se pretende entonces establecer mediante una regresión la relación entre dichos datos y

pronosticar comportamientos en las variables suministradas.


Objetivos

General

Destacar la importancia y la utilidad de la Regresión y Correlación lineal simple para

modelar e investigar la relación entre dos variables a partir de la base de datos “Calidad en el

servicio de urgencias 2018-16-4 del hospital Federico lleras (Ibagué)”

Específicos.

Aplicar la técnica de correlación y regresión lineal simple a las variables suministradas a

través de la información obtenida de la base de datos “Calidad en el servicio de urgencias 2018-

16-4 del hospital Federico lleras (Ibagué)”.

Realizar el diagrama de dispersión de las dos variables seleccionada.

Determinar el tipo de asociación entre las variables.

Construir el modelo matemático que más se ajuste a la serie de datos recolectados.

Determinar el grado de relación de las dos variables.

Analizar la relación entre las dos variables cuantitativas seleccionadas.


Regresión y Correlación Lineal Simple

Estudiante 1: Ena Raquel de la Ossa

Variable Y: Estatura (M)

Variable X: Peso (Kg)

Diagrama de Dispersión

Tipo de asociación de las variables Relación directa


Modelo matemático Y=,0136X+0,7524
R2 0,8645
R 9297915%
Confiabilidad Es confiable
% de explicación 86,45%
Grado de relación Fuerte

Análisis e interpretación de resultados


Existe una relación directa entre las variables peso y estatura del 9297915%, su dirección es

positiva y la fuerza o intensidad de esta correlación es fuerte.

El modelo matemático es confiable, debido a que R2= 86,45%

Teniendo en cuenta los datos suministrados de la sala de urgencias del Hospital Federico

Lleras se relacionaron las variables peso y estatura, identificamos que cuando la variable peso

aumenta también aumenta el valor de la variable estatura, tienen relación directa, su dirección es

positiva, la fuerza y densidad de esta correlación es fuerte, el modelo matemático es confiable.

Estudiante 2: Tatiana del Carmen Percy

Variable Y: Estatura

Variable X: Peso

Diagrama de Dispersión

EDAD VS ESTATURA
2.5
y = 0.0084x + 1.2276
2
R² = 0.3417
1.5
Estatura

0.5

0
0 20 40 60 80 100
Edad
Tipo de asociación de las variables Relación directa
Modelo matemático Y=1.2276+0.0084X
R2 0,3417
R 0,5845
Confiabilidad No es confiable
% de explicación 34,16%
Grado de relación Regular

Análisis e interpretación de resultados

La relación entre las variables de edad (m) y peso (kg) es directamente proporcional dado que

la pendiente (m=0,00837) es positiva, lo cual indica que por cada incremento en la edad, también

aumenta la estatura,

Dado un Coeficiente de Determinación igual a 34.16% se puede decir que la variabilidad de

la recta está dada en su mayoría por los errores, por ello no es un modelo muy bueno o confiable.

A partir de la información otorgada de la sala de urgencias del Hospital Federico Lleras de

Ibagué, se relacionaron las variables Edad vs Estatura, dando así la una recta de regresión que

nos indica que por cada aumento en la edad, aumenta también la estatura. Sin embargo, la recta

de regresión no es muy buena, por esto los pronósticos no serán eficientes, dado su correlación

regular y la variabilidad de errores.

Estudiante 3: Janelle Figueroa Peñaranda

Variable Y: Estatura (M)

Variable X: Peso (Kg)


Diagrama de Dispersión

Tipo de asociación de las variables Relación directa


Modelo matemático y = 0,0136x + 0,7524
R2 0,8645
R 9297915%
Confiabilidad Es confiable
% de explicación 85,45%
Grado de relación Excelente

Análisis e interpretación de resultados

Existe una correlación entre la variable peso y estatura, el peso depende de la estatura.

Este modelo es confiable en un 86.45%

El grado de relación de las dos variables estatura (M) y peso (kg) es de 9,297

A través de la información anterior de las variables peso y estatura podemos decir que existe

una relación ya que a mayor estatura mayor peso. El peso depende de la estatura.
Estudiante 4: Mónica Patricia Jiménez

Variable Y: Tiempo para Triage (min)

Variable X: Cantidad de Visitas en el Ultimo Trimestre

Diagrama de Dispersión

400
Tiempo de espera para triage (min)

350

300

250

200 y = 2.955x + 174.87


R² = 0.0005
150

100

50

0
0 0.5 1 1.5 2 2.5 3 3.5
Cantidad de Visitas en el ultimo trimestre

Tipo de asociación de las variables Incorreción


Modelo matemático y = 2,955x + 174,87
R2 0,0005
R 0,02199052
Confiabilidad Nada confiable.
% de explicación 0,5%
Grado de relación No hay correlación
Análisis e interpretación de resultados

En la figura se observa que la variable independiente (número de visitas en el último

trimestre) es discreta (solo tiene tres valores) pues no es posible hacer visitas a medias, a cambio

la variable dependiente es continua.

La asociación en las dos variables cantidad de visitas en el último trimestre y tiempo de

espera para el triage tiene una incorrelación, los valores son altos o bajos.

Este modelo no es nada confiable, pues no representa los datos de dispersión, que son dados

al azar y no a una correlación propiamente dicha

No hay una correlación entre las variables escogidas, son totalmente independientes.

Estudiante 5: Claudia Patricia Cadena

Variable Y: Peso (kg)

Variable X: Edad

Diagrama de Dispersión
EL HOSPITAL FEDERICO LLERAS DE IBAGUE
EDAD vs PESO (Kg)
100.00
y = 0.6007x + 35.544
90.00 R² = 0.3749
80.00
70.00
Peso (Kg)

60.00
50.00
40.00
30.00
20.00
10.00
0.00
0 20 40 60 80 100
Edad

Tipo de asociación de las variables Relación directa


Modelo matemático Y=35,544+0,6007x
R2 0,3749
R 0,61226305
Confiabilidad No es confiable
% de explicación 37,49%
Grado de relación Regular

Análisis e interpretación de resultados.

La Asociación de las variables Edad y Peso (kg) es directamente proporcional, esto es

debido a que la pendiente de la ecuación es positiva, esto indica que a medida que aumenta el

valor la variable Edad aumenta también el valor de la variable peso (Kg).

El modelo matemático no es muy confiable debido a que el Coeficiente de Determinación R2

en este caso es de 37,49%.


El porcentaje de explicación del modelo se define a partir del Coeficiente de Determinación R2

en este caso es de 37,49% y el grado de relación de las dos variables es establecido por el

Coeficiente de Correlación R en este caso el grado de correlación de las dos variables Edad y

Peso (Kg) es de 0,61263305.

A partir de los datos suministrado de la sala de urgencias del Hospital Federico Lleras de la

ciudad de Ibagué se relacionaron las variables Edad y Peso Kg, donde se identificó que a medida

que la variable Edad aumenta también aumenta el valor de la variable Peso Kg, teniendo un

relación directa, el modelo matemático no es muy eficiente y la correlación lineal es regular.


Conclusiones

Se interpreto la problemática utilizando la correlación y relación lineal simple, a partir de la

base de datos “Calidad en el servicio de urgencias 2018-16-4 del hospital Federico lleras

(Ibagué)”, con dos variables cuantitativas.

Se realizó el diagrama de dispersión de las dos variables seleccionada.

Se determinó el tipo de asociación entre las variables.

Se construyó el modelo matemático que más se ajuste a la serie de datos recolectados.

Se determinó el grado de relación de las dos variables.

Se analizó la relación entre las dos variables cuantitativas seleccionadas.


Referencias Bibliográficas

Bolívar M. (Monibolivar). Monografía Estadística. Recuperado de

https://www.monografias.com/trabajos14/estadistica/estadistica.shtml

Centro de Escritura Javeriano. (2018). Normas APA sexta edición. Recuperado de

https://drive.google.com/file/d/18vu0JpyQ1tGiN2TfZPjYbD_UATdJHDIY/view

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. Mexico City:

Cengage Learning. Páginas 675 – 686. Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&p=G

VRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados. Mexico

City: Cengage Learning. Páginas 686 – 695. Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r&p=G

VRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

Matus, R., Hernández, Martha, and García, E.. Estadística. México, D.F., MX: Instituto

Politécnico Nacional, 2010. ProQuest ebrary. Web. 1 July 2016. Recuperado

de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=10365616&p00=co

nceptos+generales+estad%C3%ADstica+descriptiva&ppg=12
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 –

172. Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=G

VRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

Montero, J.M. (2007). Regresión y Correlación Múltiple. Madrid: Paraninfo. Páginas 191 –

225. Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&it=r&p=G

VRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico

Nacional. Recuperado

de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=10436604

Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1.

Distrito Federal, MÉXICO: Grupo Editorial Patria. Recuperado

de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=11230886&p00=c

onceptos+generales+estad%C3%ADstica+descriptiva&ppg=6

Pava, M.F. (2014). OVA. Regresión y Correlación. Recuperado de

http://www.unadzsurlab.com/ovas_ibague/regresion/pagina4.htm

Pava, M.F. (2014). Laboratorio y Correlación Lineal – Excel. Recuperado de

https://issuu.com/riyis/docs/lab_regresion_correlacion_lineal_cead_ibague?layout=http%253A%

252F%252Fskin.issuu.com%252Fv%252Flight%252Flayout.xml&showFlipBtn=true
Anexo

Laboratorio de Regresión y Correlación Lineal

2.1. El rendimiento del producto de un proceso químico está relacionado con la temperatura de

operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno

producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en

un proceso de destilación, de acuerdo con los siguientes datos:


Diagrama de Dispersión

Proceso de Destilación en el Condensador


Principal
% Hidrocarburos y Pureza
102
100
98 y = 14.947x + 74.283
96 R² = 0.8774
Pureza

94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% de Hidrocarburos

La Asociación de las variables % hidrocarburos y pureza es directamente proporcional, esto

es debido a que la pendiente de la ecuación es positiva, esto indica que a medida que aumenta el

valor la variable % hidrocarburos aumenta también el valor de la variable pureza.

Tipo de asociación de las variables Relación directa


Modelo matemático y = 14,947x + 74,283
R2 0,8774
R 0,93671538
Confiabilidad Es confiable
% de explicación 87,74%
Grado de relación Excelente

El modelo matemático es confiable debido a que el Coeficiente de Determinación R2 en este

caso es de 87,74%, se acerca a 1.


El porcentaje de explicación del modelo se define a partir del Coeficiente de Determinación

R2 en este caso es de 87,74% y el grado de relación de las dos variables es establecido por el

Coeficiente de Correlación R en este caso el grado de correlación de las dos variables % de

Hidrocarburo y pureza es de 0,93671538.

Análisis:

Con los resultados obtenidos se puede verificar que la ecuación de la recta tiene una excelente

relación entre las dos variables, es directa o positiva. Coeficiente de Determinación R² nos

asegura además que el modelo explica el 87,74 de la información siendo este confiable y el

Coeficiente de Correlación lineal confirma el grado de relación (0,93671538) entre las dos

variables % de hidrocarburo y Pureza

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

R/

y= 91,3
x= ?
y = 14,947x + 74,283
91,3=14,947x + 74,283
91,3-74,283 = 14,947x
17,02/14947 = x
x = 1,13

El porcentaje de hidrocarburo es 1,13% cuando la pureza del oxígeno es igual a 91,3.

2.2 El número de libras de vapor (y) consumidas mensualmente por una planta

Química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se

registraron los siguientes valores de temperatura y consumo anual:


Diagrama de Dispersión

Consumo Mensual Para Una Planta Química


Temperatura (oF) y Consumo de Vapor (Lb)
800
700 y = 9.2087x - 6.3184
Consumo de vapor (Lb)

R² = 0.9999
600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
Temperatura (oF)

La Asociación de las variables Temperatura (oF) y Consumo de Vapor (Lb) es directamente

proporcional, esto es debido a que la pendiente de la ecuación es positiva, esto indica que a

medida que aumenta el valor la variable Temperatura (oF) aumenta también el valor de la

variable Consumo de Vapor (Lb).


Tipo de asociación de las variables Relación directa.
Modelo matemático y = 9,2087x - 6,3184
R2 0,9999
R 0,99993193
Confiabilidad Es confiable
% de explicación 99,99%
Grado de relación Excelente

El modelo matemático es confiable debido a que el Coeficiente de Determinación R2 en este

caso es de 99,99%, se acerca a 1.

El porcentaje de explicación del modelo se define a partir del Coeficiente de Determinación R2

en este caso es de 99,99% y el grado de relación de las dos variables es establecido por el

Coeficiente de Correlación R en este caso el grado de correlación de las dos variables

Temperatura (oF) y Consumo de Vapor (Lb) es de 0,99993193.

Análisis:

Con los resultados obtenidos se puede verificar que la ecuación de la recta tiene una excelente

relación entre las dos variables, es directa o positiva. Coeficiente de Determinación R² nos

asegura además que el modelo explica el 99,99% de la información siendo este confiable y el

Coeficiente de Correlación lineal confirma el grado de relación (0,99993193) entre las dos

variables Temperatura (oF) y Consumo de Vapor (Lb).

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?

R/

y= ?
x= 70

y = 9,2087x - 6,3184

y= 638,2906
El consumo de vapor es 638,2906 cuando la temperatura es de 70 oF.

2.3 Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual

al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se

mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación

de punzada. Obsérvese que ambas, X e Y, son variables aleatorias:


Diagrama de Dispersión

Porcentaje de Sobrepeso y Umbral de reflejo de


flexión nociceptiva
Umbral de Reflejo de flexión nociceptiva

16
14
12
10
8
6 y = -0.0629x + 11.642
4 R² = 0.1115

2
0
0 20 40 60 80 100
Porcentaje de sobrepeso

La Asociación de las variables Porcentaje de Sobrepeso y Umbral de Reflejo de Flexión

Nociceptiva es leve e indirecta, esto es debido a que la pendiente de la ecuación es negativo, esto

indica que a medida que aumenta el valor la variable Porcentaje de Sobrepeso disminuye el valor

de la variable Umbral de Reflejo de Flexión Nociceptiva.

Tipo de asociación de las variables Relación inversa


Modelo matemático y = -0,0629x + 11,642
R2 0,1115
R -0,33390799
Confiabilidad No confiable
% de explicación 11,15%
Grado de relación Mínima

El modelo matemático no es muy confiable debido a que el Coeficiente de Determinación R2

en este caso es de 11,15%, se acerca a 0.

El porcentaje de explicación del modelo se define a partir del Coeficiente de Determinación R2

en este caso es de 11,15% y el grado de relación de las dos variables es establecido por el
Coeficiente de Correlación R en este caso el grado de correlación de las dos variables porcentaje

de sobrepeso y Umbral de Reflejo de Flexión Nociceptiva es de -0,333908.

Análisis:

Con los resultados obtenidos se puede verificar que la ecuación de la recta tiene una correlación

negativa o inversa, es decir una misma dirección descendiente, la relación de las dos variables es

leve. Coeficiente de Determinación R² nos asegura que el porcentaje del umbral de reflexión

nociceptiva del individuo es de 11,15 que se ven afectados por la variable de % de peso, y el

Coeficiente de Correlación Lineal es mínima o débil (-0,333908) entre las dos variables.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de sobrepeso,


de 40?
R/
y= ?
x= 40

y = -0,0629(40) + 11,642

y= 9,126

El umbral de reflexión de flexión nociceptiva es de 9,126, cuando hay un porcentaje de

sobrepeso de 40.