Está en la página 1de 11

Título del trabajo: Laboratorio de Medidas Bivariantes y Correlación Simple

Nombre estudiante: Carlos Alberto Cuartas Velasco

Numero de cedula: 94´297.163

Tutor (a): EDWARD FERNANDO TORO

Numero de grupo: 262

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

ESCUELA: ECBTI

PROGRAMA: Ingeniería Electrónica

UDR Cali, Noviembre 28 de 201


Introducción

La correlación y regresión son conceptos estadísticos fundamentales, pues extienden la idea

de dependencia funcional, y se relacionan con muchos otros como los de variación,

distribución, centralización o dispersión. Otra razón que justifica el interés de este tema es

que el razonamiento sobre la correlación y regresión se vincula a la toma de decisiones en

ambiente de incertidumbre Igualmente en el siguiente trabajo se muestra la relación entre

dos variables inscritas en la situación específica a partir del análisis de regresión

correlación lineal simple, al igual que las medidas bivariantes las cuales se aplicó al

laboratorio entregado y la base de datos del hospital Federico Lleras


Objetivos

OBJETIVO GENERAL:

El presente trabajo tiene como objetivo general el estudio de los fundamentos teóricos y las

aplicaciones de la estadística en problemas comunes del mundo laboral, investigativo,

académico etc. Así mismo se utilizan las herramientas del curso con el apoyo de los

fundamentos de regresión y correlación que se encuentran en la estadística descriptiva,

igualmente este desarrollo tiene como objetivo específico los siguientes puntos:

 Potencializar las habilidades para identificar una situación mediante el análisis de

las medidas estadísticas bivariantes.

 Calcular e demostrar adecuadamente las medidas estadísticas bivariantes,

relacionadas a una situación específica.

 Dar respuesta a las preguntas base que suscitan la problemática.

 Mostrar en el desarrollo de este trabajo la recolección, orden y análisis de

la encuestas, así como la representación de los datos obtenidos con ayuda de los

diagramas, para representar apropiadamente las características y resultados

alcanzados.
Justificación

En la actualidad vivimos en un entorno donde se presentan diferentes incertidumbres con

los procesos del mundo laboral, investigativo y académico entre otros. Por ello el presente

trabajo muestra formas de poder identificar la relación de una variable sobre la otra, al

igual que, la situación que se presenta.

Es complejo la toma de decisiones sin tener una gran profundidad sobre un proceso donde

impliquen más de una variable, por ello el presente desarrollo pretende ejercitar mediante

planteamiento posibles en un mundo real con instrucciones de regresión y correlación

simple, la realización de diagramas de dispersión y la determinación el tipo de asociación

entre variables y el desarrollo de destreza en modelos matemáticos que permiten predecir el

efecto de una variable sobre otra. Así pues de acuerdo con lo anterior y mediante la

adiestramiento con los problemas planteados en este documento se podrá tomar un punto de

inicio para la toma de decisiones en un problema.


Ejercicio Nº1.1

Sal-Tensión. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una
serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión
arterial un tiempo después.

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables
Hospital Federico Lleras
X (sal) Y (Tensión) y = 6,1062x + 88,128
Independiente dependiente 200 R² = 0,987

Tensión
1,6 98 100
2,3 102 0
3,3 109 0 1 2 3 4 5 6
4,2 113 Consumo de Sal
4,6 115
5 120
El tipo de asociación de las variables según el diagrama de dispersión corresponde a
una tendencia lineal en forma directa o positiva (Creciente).

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?
El modelo matemático que permite predecir el efecto de una variable sobre la otra es la
ecuación de tendencia de la línea, la cual atañe: y = 6,1062x + 88,128. Según su coeficiente
de determinación; R² = 0,987 se observa que por ser cercano a 1 o multiplicar R² *100 =
0,987*100 se diría que el modelo matemático entre las dos variables tiene una confiabilidad
del 98,7% . Es decir que es confiable.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
El porcentaje de explicación del modelo está dado por la representación porcentual
del coeficiente de determinación de la siguiente forma R²*100% = 0,987 *100% =
98,7%. El grado de correlación de las dos variables está dado por la raíz cuadrada del
coeficiente de determinación R², de esta forma; √R² = √0,987= 0,9934, lo que se diría que
hay un grado correlación excelente y su representación porcentual sería; 0,9934*100% =
95,37%, lo cual indica que las dos variables (Tensión y Sal) se encuentran
correlacionadas entre sí con un 99,34%
d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión arterial
esperada?
y = 6,1062*(5,6)+88,128
y = 122,32
Por lo anterior se demuestra que la tensión arterial del paciente estará en 122,32
Se concluye que las personas con mayor consumo de sal presentaran una tensión arterial
alta.
Ejercicio Nº1.5

Tem-Vapor. El número de libras de vapor (y) consumidas mensualmente por una planta
química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se
registraron los siguientes valores de temperatura y consumo anual.
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

Temperatura (F) Consumo de vapor


Mes
Independiente (Lb)Dependiente
Ene. 21 185,79 Consumo de vapor (Lb)Dependiente
Feb. 24 214,47
Mar. 32 288,03 800 y = 9,2087x - 6,3184

Temperatura en grados
Abr. 47 424,84 600 R² = 0,9999
May. 50 455 400
Jun. 59 539
200
Jul. 68 621,55

ºF
Ago. 74 675,06 0
Sep. 62 562,03 0 20 40 60 80
Oct. 50 452,93 Cosumo de vapor
Nov. 41 369,95
Dic. 30 273,98

El tipo de asociación de las variables según el diagrama de dispersión corresponde a


una tendencia lineal en forma directa o positiva (Creciente).

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?
El modelo matemático que permite predecir el efecto de una variable sobre la otra es la
ecuación de tendencia de la línea, la cual atañe: y = 9,2087x + 6,3184. Según su coeficiente
de determinación; R² = 0,9999 observa que por ser cercano a 1 o multiplicar R² *100 =
0,9999*100 se diría que el modelo matemático entre las dos variables tiene una
confiabilidad del 99,9% . Es decir que es confiable.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
El porcentaje de explicación del modelo está dado por la representación porcentual
del coeficiente de determinación de la siguiente forma R²*100% = 0,9999*100% =
99,9%. El grado de correlación de las dos variables está dado por la raíz cuadrada del
coeficiente de determinación R², de esta forma; √R² = √ 0,9999= 0,9999, lo que se diría que
hay un grado correlación excelente y su representación porcentual sería; 0,9999*100% =
99,9%, lo cual indica que las dos variables (consumo de vapor y la temperatura) se
encuentran correlacionadas entre sí con un 99,34%
d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 ºF?
y = 9,2087x *(70)+ 6,3184
y = 650,93
Por lo anterior se demuestra que el consumo de vapor necesario para llegar a una
temperatura de 70 ºF será de 650,93 Lb
Se concluye a mayor temperatura mayor será el consumo de vapor en cada mes
Ejercicio Nº1.7
PIB-Ventas. Una compañía multinacional del servicio de telecomunicaciones en Colombia,
como medio de planeación estratégica para la toma de decisiones, solicita a su
departamento financiero, hacer predicciones económicas del valor anual de sus ventas
totales, versus el PIB nacional de las últimas dos décadas, para la toma de decisiones para
la apertura de nuevos mercados. Realice el diagrama de dispersión y determine el tipo de
asociación entre las variables.
a. Ajuste un modelo matemático que permita predecir el efecto de una variable
sobre la otra. ¿Es confiable?

Año PIB Ventas Empresa de Telecomnicaciones


2001 1,7 $ 339 $ 375
2002 2,5 $ 363 $ 370
y = 1,1509x + 345,1
2003 3,9 $ 360 $ 365 R² = 0,0288
2004 5,3 $ 337
$ 360
2005 4,7 $ 339
PIB Nacional

$ 355
2006 6,7 $ 348
2007 6,9 $ 372 $ 350

2008 3,5 $ 359 $ 345


2009 1,7 $ 338 $ 340
2010 4 $ 357 $ 335
2011 6,6 $ 342
$ 330
2012 4 $ 328
$ 325
2013 4,9 $ 362 0 1 2 3 4 5 6 7 8
2014 4,4 $ 349
ventas de la compañia
2015 3,1 $ 354
2016 2 $ 355
2017 1,8 $ 342
Se observa un distanciamiento del 1 en el coeficiente de determinación, lo cual indiaca
que el médelo matemático es poco confiable
b. Determine el porcentaje de explicación del modelo y el grado de relación de las
dos variables.

Ecuación matemática
y = 1,1509x+ 345,1

Coeficiente de correlación = √
= 0,1697
= 16,97%
= Hay una relación demasiado débil se
podría decir que no hay una correlación lineal
c. ¿Cuál podría ser la proyección de ventas para el año 2018 si se espera que el
PIB nacional sea del 3,1?
R/ La proyección de ventas con el PIB 3,1 que se podría obtener para el año 2018
es 348,66
ESTATURA vs PESO
0,65 12,50 1,73 60,60 0,57 3,10 1,10 16,90
1,74 60,00 1,68 85,00 1,80 85,00 1,86 85,80
1,58 72,50 1,58 57,30 1,56 60,80 1,71 67,20
1,59 58,00 1,65 67,90 1,62 55,90 1,59 63,20
1,00 16,50 0,45 2,60 1,67 70,00 0,82 9,40
1,65 57,60 1,78 75,30 1,80 73,80 1,76 72,90
1,70 78,60 1,50 45,20 1,75 78,50 0,47 3,90
0,73 5,20 1,64 50,20 1,65 67,20 1,62 63,80
1,62 53,80 1,16 23,00 1,72 67,20 1,40 30,50
1,53 45,80 1,52 45,00 1,59 58,80 1,51 52,60
1,65 60,20 1,58 65,70 1,63 62,30 1,81 85,90
1,18 19,70 0,98 16,70 1,65 70,20 1,66 67,90
1,69 62,70 1,65 60,50 1,52 54,90 1,60 58,20
1,58 78,60 1,59 57,80 1,72 78,10 1,63 55,00
1,53 52,70 1,61 60,30 1,63 62,90 1,58 60,50
0,85 8,90 1,79 78,50 1,86 65,00 1,67 87,50
1,64 70,00 0,96 15,30 1,63 62,90 1,72 55,20
1,75 80,90 1,67 65,20 1,75 72,90 1,65 70,00
1,60 78,90 1,70 65,60 1,57 61,60 1,56 45,90
1,03 15,90 1,68 78,40 0,76 9,70 1,63 54,00
1,55 56,00 1,62 57,90 1,78 64,30 1,67 60,80
1,58 52,90 0,53 3,40 1,62 58,90 1,64 65,80
1,78 78,50 1,59 58,30 1,06 18,30 1,61 70,80
1,66 85,80 1,56 56,80 1,68 56,90 1,68 78,60
1,70 65,20 1,65 60,00 0,57 3,10 1,80 87,20
1,79 60,00 1,68 72,00 1,51 45,80 1,72 79,50
1,72 67,20 1,56 58,60 1,76 68,90 1,75 72,90
1,68 85,00 0,96 14,20 0,86 11,90 1,67 67,50
1,03 24,50 1,67 65,70 1,62 65,90 1,55 58,20
1,63 65,40 1,61 60,80 1,71 78,00 1,72 64,30

Hospital Federico Lleras


100,00 y = 63,656x - 40,308
R² = 0,8645
80,00

60,00
Estatura

40,00

20,00

0,00
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2
-20,00
Peso

Relación directa porque se observa que en la mayoría de los pacientes a mayor estatura
aumenta el peso.
b. Encuentre el modelo matemático que permite predecir el efecto de
una variable sobre la otra. Es confiable?
El modelo matemático que permite predecir el efecto de una variable sobre la otra
es la ecuación de tendencia de la línea, la cual atañe: y = 63,656x - 40,308. Según su
coeficiente de determinación; R² = 0,8645 observa que por ser cercano a 1 o
multiplicar R² *100 = 0,8645 *100 se diría que el modelo matemático entre las dos
variables tiene una confiabilidad del 86,45% . Es decir que es confiable.

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.
El porcentaje de explicación del modelo está dado por la representación
porcentual del coeficiente de determinación de la siguiente forma R²*100% =
0,8645 *100% = 86,45%. El grado de correlación de las dos variables está dado
por la raíz cuadrada del coeficiente de determinación R², de esta forma; √R² =
√0,8645 = 0,9297, lo que se diría que hay un grado correlación excelente y su
representación porcentual sería; 0,8645 *100% = 86,45%, lo cual indica que
las dos variables (Peso y estatura) se encuentran correlacionadas entre sí con un
86,45%

Igualmente se concluye que en la mayoría de los pacientes que ingresaron al


hospital Federico Lleras que a mayor estatura su masa será mayor.
Conclusión

Las sistemáticas de regresión y correlación cuantifican la agrupación estadística

entre dos o más variables. La regresión lineal simple expresa la relación entre una

variable dependiente (y) y una variable independiente (x), en términos de la

pendiente y la intersección de la línea que mejor se ajuste a las variables.

La correlación simple expresa el grado o la cercanía de la relación entre las dos

variables en términos de un coeficiente de correlación que proporciona una medida

indirecta de la variabilidad de los puntos alrededor de la mejor línea de ajuste.


Bibliografías

 García, M.S.(2004).Introducción a la estadística económica y empresarial.

Paraninfo.

 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo.

 Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple.

Mexico City: Cengage Learning

 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de

mercados. Mexico City: Cengage Learning.

 Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo.

(pp.191–225)

 Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto

Politécnico Nacional.

 Matus, R., Hernández, Martha, and García, E (2010). Estadística. México,

D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary.

 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y

estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria.