Está en la página 1de 20

ESTADISTICA DESCRIPTIVA

100105A_612

Paso 4 Descripción de la información.


Organización y Presentación

Entregado Por

Harold Amílcar Vera Villamizar


Código: 88224452

Nombre tutor
Edgar Gabriel Diaz M

Universidad Nacional Abierta y a Distancia

Julio 02 de 2019
Introducción

Parte de la estadística corresponde a la estadística inferencial y dentro de ella los capítulos

de correlación y regresión son muy usados en la investigación científica, una herramienta

muy útil cuando se trata de relacionar 2 o más variables, relacionados entre sí, la

correlación implica el grado de dependencia de una variable respecto a la otra y la regresión

arroja una ecuación que presenta una relación matemática.


l

Justificación

El desarrollo de esta actividad tiene una finalidad muy clara que es la de puntualizar las

justificaciones que sirven para probar el análisis de la correlación y regresión a través de las

soluciones dada a cada interrogante y con la indagación referente a la correlación y

regresión.

Al trabajar con las dos variables cuantitativas nos percatamos de la relación que existen por

medio de la correlación y regresión.


Objetivo

Identificar el conocimiento adquirido a través de la aplicación e interpretación de datos

suministrados por medio de cada situación y al analizar y dar solución a cada problemática

para esta forma de ser proyectos a a partir de ecuaciones.


Actividad 1. Mapa mental

Actividad 2. Definición de conceptos


 Diagrama de dispersión.
Es una herramienta gráfica que permite demostrar la relación existente entre dos clases de
datos y cuantificar la intensidad de dicha relación.
Se utiliza para conocer si efectivamente existe una correlación entre dos magnitudes o
parámetros de un problema y, en caso positivo, de qué tipo es la correlación.
 Correlación lineal simple.
La correlación lineal simple son métodos estadísticos que estudian a la relación lineal que
tienen dos variables continuas, es necesario colocar parámetros que permitan cuantificar
dicha relación, uno de esta es la covarianza que la encargada de indicar el grado de
variación conjunta de dos variables al azar.
 Coeficiente de determinación R2.
Es un término utilizado en estadística, que tiene como función principal predecir el
resultado de hipótesis, el coeficiente determina la calidad de la guía para replicar los
resultados y proporcionar variaciones de los resultados que puedan explicarse.

 Correlación positiva.
Es una relación entre dos variables que muestra que ambas aumentan o disminuyen
simultáneamente sea perfectamente lineal y directa, de tal manera que un cambio en una
variable permite predecir perfectamente el cambio de la otra. Las dos variables se mueven
en la misma dirección.

 Correlación negativa.

En la correlación negativa la relación entre variables es opuesta, cuando una variable


cambia, la otra lo hace de forma contraria, por lo tanto esta la hace inversamente
proporcional. Entonces, cuando una posee valores altos, la otra posee valores bajos y
mientras este valor esté más cerca de -1, más evidente será esta covariación.

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?


Es una medida de regresión que pretende cuantificar el grado de variación conjunta entre
dos variables. Por lo tanto, es una medida estadística que cuantifica la dependencia lineal
entre dos variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el
conjunto de puntos representados se aproxima a una recta.
Nos ayuda a medir el grado de intensidad y el sentido de la relación entre dos variables.
Actividad 3. Desarrollo del laboratorio
1. Cada estudiante deberá resolver tres ejercicios según las opciones ofrecidas en la
siguiente tabla, para ello deberán compartir su elección en el foro del entorno de
aprendizaje Colaborativo Paso 4 Descripción de la Información, identificándolos de
la siguiente tabla, donde anexará su nombre a la opción de grupo de ejercicios escogido:

Opció Ejercicio 1 Ejercicio 2 Ejercicio 3 Estudiante


n
1 1.1. Sal-Tensión 1.4. X - Y 1.9. Sobrepeso-R
2 1.2. CH-Pureza. 1.4. X - Y 1.7. PIB-Ventas
3 1.1. Sal-Tensión 1.5. Tema-Vapor 1.7. PIB-Ventas Harol Vera V
4 1.3. Peso-Altura. 1.6. Estatura-Peso 1.8. %-Umbral
5 1.2. CH-Pureza. 1.5. Tema-Vapor 1.8. %-Umbral

2. Posteriormente cada estudiante debe enviar la solución de los tres ejercicios


elegidos:
EJERCICIOS

1.1. Sal-Tensión. Se quiere estudiar la asociación entre consumo de sal y tensión


arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta
y se mide su tensión arterial un tiempo después.

X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

 a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables
140

120

100
Y (Tensión)

80

60 Y (Tensión)
Linear (Y (Tensión) )
40

20

0
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
X (Sal)

Tipo de asociación entre las variables del diagrama de dispersión: Lineal.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es:

Y= aba
Y = 6.1062x + 88.128
R2 = 0.987

Se puede asegurar que la ecuación de la recta es confiable porque el R2 está cerca de 1 y


tiene un grado alto de confiabilidad.

c. Determine el grado de relación de las dos variables.

El R2 afirma además que el modelo explica el 98.70% de la información y el valor de r


coeficiente de correlación lineal es excelente porque el 0.987 está muy cercano al extremo
1 positivo que es la correlación excelente o perfecta positiva.

d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión arterial


esperada?

Para hallar el valor de la tensión arterial esperada para una dosis de sal de 5.6 debemos
reemplazar este valor en la formula hallada.
Y = ( 6.1062∗5.6 ) +88.128
Y =122.32
Según lo anterior para dicha dosis de sal la tensión arterial esperada es de 121.

1.2. Tema-Vapor. El número de libras de vapor (y) consumidas mensualmente por una
planta química, se relaciona con la temperatura ambiental promedio (en o F). Para el
año 2014, se registraron los siguientes valores de temperatura y consumo anual.

2014 registros de temperatura y consumos de


vapor.

Temperatura Consumo de vapor


Mes
(F) (Lb)

Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
800
700
600

Consumo de vapor (Lb)


500
400
Consumo de vapor (Lb)
300 Linear (Consumo de vapor
(Lb))
200
100
0
0 2 4 6 8 10 12 14
Temperatura (F)

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. ¿Es confiable?

El modelo matemático el cual nos permite predecir una variable sobre la otra es la ecuación
de la tendencia de la línea, la cual, corresponde a:
 Y =9.2087 x−6.3184
Según su coeficiente de determinación R2 = 0.9999 se analiza que por ser cercano a 1, se
afirma que el modelo matemático obtenido el cual relaciona las variables de porcentaje da
respuesta a que la temperatura y consumo a vapor es confiable.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

R2 x 100% = 0.9999 x 100% está dado por la raíz cuadrada del coeficiente de
determinación, así: √R2 = √0.9999 = 0.9999499987, cuya representación porcentual seria:
0.9999 x 100% = 99.99%, lo cual señala que las dos variables de porcentaje de
temperatura y consumo a vapor, están relacionadas entre sí, con un 99.99%. Su relación
excelente.
d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 o?

Y =9.2087 x−6.3184

La fórmula queda así:

Y =9.2087 ( 70 )−6.3184

Y =644.609−6.3184

Y =638.2906

Se concluye que el consumo de vapor cuando la temperatura es de 70ºF es de 638.2906.

1.3. PIB-Ventas. Una compañía multinacional del servicio de telecomunicaciones en


Colombia, como medio de planeación estratégica para la toma de decisiones,
solicita a su departamento financiero, hacer predicciones económicas del valor
anual de sus ventas totales, versus el PIB nacional de las últimas dos décadas, para

la toma de decisiones para la apertura de nuevos mercados. Realice el diagrama de


dispersión y determine el tipo de asociación entre las variables.

Ventas de la
Año PIB Nación
compañía
2001 1,70 339,43
2002 2,50 363,02
2003 3,90 359,75
2004 5,30 336,90
2005 4,70 339,38
2006 6,70 348,40
2007 6,90 372,00
2008 3,50 358,79
2009 1,70 337,94
2010 4,00 357,32
2011 6,60 342,14
2012 4,00 327,84
2013 4,90 362,06
2014 4,40 348,80
2015 3,10 353,52
2016 2,00 355,40
2017 1,80 342,00

a. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. ¿Es confiable?
Teniendo en cuenta que si los valores están más o menos dispersos.
Covarianza
ρ=
σx∗σxy
Covarianza=∑ X 1∗Yi/n
23729.65
Covarianza= =1395.86
17
2
σx= √∑ ( Xi−ux ) /n
σx=9329.77

2
σy= √∑ ( Yi−uy ) /n
σy=80653.13
1395.86
ρ=
49329.77∗80653.13
ρ=3.5∗10−7
Como el coeficiente de variación tiene un grado de asociación menor a 0.09 su asociación
es nula, esto quiere decir que las variables no están asociadas.
 Parámetro a:

a=n ∑ XiYi−
∑ Xi∗∑ Yi −( Xi)2
n ∑ Xi 2

67.7∗5944.85
a=17∗23729.65− −(67.7)2
17∗317.95
a=1.15
 Parámetro b:
b=μy−aμy
b=349.7−(1.15∗3.98)
b=345.12
 Ecuación de regresión:
Y =1.1509 x +345.12
b. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
El R2 afirma además que el modelo explica un porcentaje casi nulo de la información y
el valor de r coeficiente de correlación lineal es de 0.0288, un porcentaje específico de
2.88%. Por lo tanto, no existe correlación.
Observándolo desde el gráfico de dispersión se da a notar que no es para nada lineal.
380
370
360
Ventas de la compañía

350
340
330
Linear ()
320
310
300
1 2 3 4 5 6 7 8
PIB Nación

c. ¿Cuál podría ser la proyección de ventas para el año 2018 si se espera que el PIB
nacional sea del 3,1?
De acuerdo con la ecuación de regresión
Y =1.1509 (3.1)+345.12
Y =3.56779+ 345.12
Y =348.68
Actividad 4. Regresión y Correlación lineal a partir de la tabla de Excel
 Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas e identificar la variable dependiente e independiente.
Variables cuantitativas a usar: Estatura (m) y Peso (kg)
Datos:
Estatura Peso
(M) (kg)
1,32 33,2
1,22 25,0
1,26 26,2
1,39 34,1
1,25 23,2
1,43 39,5
1,45 47,9
1,34 30,2
1,20 23,1
1,40 36,2
1,26 26,4
1,25 24,0
1,42 39,4
1,27 25,6
1,35 34,1
1,35 36,5
1,42 33,5
1,20 22,6
1,41 39,2
1,26 25,0
1,25 24,9
1,40 39,2
1,31 30,2
1,32 30,4
1,32 30,6
1,39 34,9
1,24 23,9
1,45 39,2
1,26 24,9
1,26 25,0
1,35 30,1
1,27 26,3
1,45 39,8
1,38 35,2
1,33 30,1
1,20 22,1
1,50 48,0
1,21 19,9
1,22 20,2
1,30 27,2
1,23 22,9
1,37 35,2
1,45 40,1
1,35 32,5
1,20 24,1
1,38 35,2
1,27 27,2
1,26 24,9
1,37 34,2
1,32 30,2
1,37 35,1
1,32 31,0
1,36 34,2
1,30 29,5
1,38 35,0
1,25 26,0
1,24 23,5
1,24 24,5
1,25 25,8
1,38 37,0
1,27 26,3
1,37 35,2
1,39 36,8
1,40 38,3
1,26 26,1
1,35 33,6
1,36 32,1
1,26 27,2
1,32 30,5
1,33 30,1
1,35 34,0
1,27 25,8
1,45 39,5
1,26 26,1
1,20 23,5
1,30 30,1
1,21 25,0
1,32 30,5
1,38 35,4
1,45 40,2
1,25 26,3
1,37 35,2
1,40 35,2
1,45 39,2
1,35 33,9
1,33 30,8
1,33 30,6
1,42 39,7
1,37 35,2
1,31 29,6
1,30 29,0
1,28 28,5
1,31 30,5
1,32 30,6
1,32 31,2
1,36 35,2
1,43 40,1
1,45 40,7
1,33 30,2
1,33 31,2
1,26 27,0
1,32 31,0
1,42 40,2
1,27 25,2
1,34 32,0

 Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


relación entre las variables.
60.0

50.0

40.0
Peso (Kg)

30.0
Peso (kg)
20.0 Linear (Peso (kg))

10.0

0.0
1.15 1.20 1.25 1.30 1.35 1.40 1.45 1.50 1.55
Estatura (m)

 Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es:
Y =a+bX
Y =78.7457 x +72.829
R2=0.9331

Se puede asegurar que la ecuación de la recta es confiable porque el R2 está cerca de 1 y


tiene un grado alto de confiabilidad.

 Determine el grado de correlación de las dos variables.

El R2 afirma además que el modelo explica el 93.31% de la información y el valor de r


coeficiente de correlación lineal es excelente porque el 0.9331 está muy cercano al extremo
1 positivo que es la correlación excelente o perfecta positiva.

 Relacionar la información obtenida con el problema.

Teniendo en cuenta los resultados obtenidos y relacionados con el problema se puede decir
que la estatura en la mayoría de casos es directamente proporcional con el peso,
ciertamente en lo cotidiano influye mucho y tiene que ver con los intervalos necesarios para
el peso debido a la estatura prevista que tenga una persona, por lo tanto, el nivel de
confiabilidad en cuanto a lo matemático lo hace confiable por lo mismo, por su alta eficacia
en cuanto a mediciones.
Conclusiones

Las técnicas de regresión y correlación certifican la asociación estadística entre 2 o más

variables. la regresión lineal simple expresa la relación entre una variable dependiente Y y

una variable independiente X, en términos de pendiente y intersección d la línea que mejor

se juste a las variables.

La correlación simple expresa el grado o cercanía de la relación entre 2 variables en

termino de un coeficiente de correlación que proporciona una media indirecta de la

variabilidad de los puntos alrededor de la mejor línea de ajuste.

La regresión y la correlación no arroja pruebas de relación causa efecto.


Bibliografía

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical


Descriptive.   Cengage Learning Paraninfo, S.A. (pp 41-50).

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 – 158).

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:


Cengage Learning. (pp 675–686).

También podría gustarte