Está en la página 1de 13

ESTADISTICA DESCRIPTIVA

PRESENTADO A: LADY JOHANNA ROSERO (TUTORA)

ESTUDIANTE: JHEISON DIAZ LOPEZ

CÓDIGO:1094949915

GRUPO ASIGNATURA: 100105_280

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD


ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
INGENIERÍA ELECTRÓNICA
ARMENIA, QUINDIO
5 de mayo de 2020
INTRODUCCIÓN

En el presente trabajo se abordará el concepto de estadística bivariante


mediante la noción de regresión lineal, coeficiente de correlación y
determinación entre dos variables dadas. En primera medida se darán
definiciones de los conceptos, reconociendo su importancia y aplicación
en un estudio estadístico para luego desarrollar diversos ejercicios
planteados.
Actividad 1. Mapa Mental
Descripción de la Actividad Individual:
Resumir mediante un mapa mental las medidas estadísticas Bivariantes
de regresión y correlación.

Actividad 2. Definición de Conceptos.


Descripción de la Actividad Individual:
Definir brevemente los conceptos básicos asociados a Regresión y
Correlación como:

-Diagrama de dispersión.
-Correlación lineal simple.
-Coeficiente de determinación R2
-Correlación positiva y correlación negativa
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
Solución:
Diagrama de dispersión
Un diagrama de dispersión es un gráfico de dos variables donde se
describen los datos obtenidos para cada variable en el mismo plano,
esto con el fin de describir una nube de puntos que relacionan a las
variables. Por ejemplo para dos variables X , Y el diagrama de dispersión
estará dado por

Tomado de Wackerly (2010, pág 564)


En este grafico de dispersión se muestra relacionan los datos obtenidos
en X con los datos obtenidos para la variable Y mediante puntos, y así,
ver como es conjunto se podría modelar matemáticamente.
Correlación lineal simple
Se dice que entre dos variables hay una correlación lineal simple,
cuando se puede describir mediante una recta de regresión al conjunto
de datos, esto es, ajustar la nube de punto del diagrama de dispersión a
una recta que describa los datos.
El método más usado para esta correlación es el de mínimos cuadrados
donde se busca mediante la covarianza de las variables X,Y y la varianza
de la variable independiente que siempre reconocemos como X.
A partir de este modelo se encuentra el coeficiente de corrleación el cual
determina el tipo de correlación entre las variables
Coeficiente de determinación R2
El coeficiente de determinación es el cuadrado del coeficiente de
correlación, este coeficiente determina el grado de confiabilidad en el
modelo.
Este coeficiente varía entre 0 y 1, donde entre más cercano a 1, más
confiable es el modelo, es decir, que es capaz de predecir un mayor
porcentaje de datos de la variable Y respecto a la variable X.
Correlación positiva y correlación negativa
Cuando se habla de una correlación positiva, se tiene un coeficiente de
correlación que es mayor a 0, definiendo así que la relación entre las
variables es directamente proporcional, esto es, a valores más grandes
de X, se obtienen valores más grandes de Y. Este coeficiente también
indica que el coeficiente de regresión, o la pendiente de la recta de
regresión, es positiva, es decir, creciente.
Cuando se tiene una correlación negativa, se tiene un coeficiente de
correlación menor a 0, definiendo así que la relación entre las variables
es inversamente proporcional, esto es, a valores más grandes de X, se
obtienen valores más pequeños en Y. Este coeficiente indica que el
coeficiente de regresión, o la pendiente de la recta de regresión es
negativa, es decir, decreciente.
¿Qué es el coeficiente de correlación lineal y qué nos ayuda a
medir?
Este coeficiente nos ayuda a medir el grado de correlación existente
entre las variables, determinando si estas se relacionan de manera
positiva, negativa o no tienen correlación entre ellas.
Este coeficiente también permite ver la fiabilidad del modelo puesto que
a partir de este se tiene el coeficiente de determinación.

Actividad 3. Realizar el laboratorio de regresión y correlación


lineal
Desarrollar el Laboratorio denominado Regresión y Correlación lineal, el
cual se encuentra en el Entorno de aprendizaje práctico, en la carpeta
Guía para el uso de recursos educativos. El laboratorio lo puede
desarrollar con el programa Infostat o Excel.

De optar por el uso del programa Infostat, lo podrá descargar en el


entorno de aprendizaje practico, carpeta: Laboratorios Estadística
Descriptiva: Infostat tutoriales, enlace descarga del Infostat.

Cada estudiante en el orden de participación escogerá un paquete de


ejercicios y socializará a sus compañeros en el foro la elección;
posteriormente al desarrollo, deberá subirlo al foro paso 4– Descripción
de la información, en un archivo en Word utilizando el siguiente
protocolo para nombrar el archivo: Nombre Apellido_lab_Regresión y
Correlación Lineal.

Socializar las respuestas en el foro paso 4. Descripción de la


Información.
Solución
Ejercicio 1.3
Edad – Masa Muscular.
Una nutricionista desea estudiar la relación entre la edad y la masa
muscular de las personas, y para realizar el estudio seleccionó un grupo
de mujeres con características semejantes, con edades diferentes y
midió su masa muscular. La nutricionista registró los datos de edad y
masa muscular en las siguientes tablas:
Edad Masa muscular
57 98
75 83
70 90
62 98
41 67
44 90
66 80
55 69
72 74
67 79
53 100
57 60
75 84
64 110
44 70

a) Realice el diagrama de dispersión y determine el tipo de


asociación entre las variables.

Se presenta el diagrama de dispersión de las variables dadas.


Gráfico de Dispersión
120

100

80
Masa Muscular

60

40

20

0
35 40 45 50 55 60 65 70 75 80
Edad

Por el diagrama de dispersión, se puede tener una una correlación


positiva dado que vemos que a mayor edad se puede presentar mayor
masa muscular

b) Encuentre el modelo matemático que permite predecir el efecto de


una variable sobre la otra. ¿Es confiable?

El modelo matemático esta dado por una regresión lineal simple dada
por la recta

y=0,2512 x +68,361

Para el cual se tiene el coeficiente de correlación

ρ=0,1986

Y coeficiente de determinación

R2=0,0394

El modelo no es muy confiable debido a que el valor de correlación es


muy bajo, podría asegurarse que la relación entre edad y masa
muscular es mínima.

Dado el coeficiente de determinación de 0,0394, se puede asegurar que


el modelo no es confiable.
c) Determine el porcentaje de explicación del modelo y el grado de
relación de las dos variables.

El porcentaje de explicación del modelo es apenas del 3, 94%, es decir,


el modelo solo predice un 3,94% de los datos de la variable Masa
muscular.

El grado de correlación entre las variables es positiva, sin embargo es


muy bajo siendo apenas de 0,1986.
d) ¿Cuál sería la masa muscular esperada de una persona de 40 años?
Para una persona de 40 años, seguidos por el modelo se tendría una
masa muscular de

y=0,2512 ( 40 )+ 68,361=78,409

Por lo tanto, para una persona de 40 años se esperaría una masa


muscular de 78,409. Sin embargo esta predicción no es muy fiable.

Ejercicio 1.6

Estatura-Peso.

Una Nutricionista de un hogar infantil desea encontrar un modelo


matemático que permita determinar la relación entre el peso y la
estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las
mediciones respectivas.
A continuación, se presentan los resultados:

Estatura (cm) 120 124 107 118 112 110 115 104
110 116
Peso (kg) 24 23 19 24 21 19 22 16
20 23

a. Identifique la variable dependiente (y) y la variable


independiente (x), realice el diagrama de dispersión y
determine el tipo de asociación entre las variables
En este caso la variable independiente (x) es la estatura mientras que la
variable dependiente es (y) es el peso. Se presenta el diagrama de
dispersión

Diagrama de Dispersión
30

25

20
Peso (kg)

15

10

0
100 105 110 115 120 125 130
Estatura (cm)

Se puede ver que las variables tienen una relación lineal positiva en su
mayoría, mostrando que a mayor estatura, mayor peso en los
individuos.

b. Encuentre el modelo matemático que permite predecir el


efecto de una variable sobre la otra. ¿Es confiable?

El modelo matemático esta dado por una regresión lineal simple dada
por la recta

y=0,386 x −22,751

Para el cual se tiene el coeficiente de correlación

ρ=0,9126

Y coeficiente de determinación

R2=0,8329

El modelo es muy confiable debido a que el valor de correlación es muy


alto, asegurando así una alta correlación entre las variables estatura y
peso
Dado el coeficiente de determinación de 0,8329, se puede asegurar que
el modelo es confiable.
c. Determine el grado de correlación de las dos variables.

El porcentaje de explicación del modelo es s del 83,29%, es decir, el


modelo predice un 83,29% de los datos de la variable Peso.

El grado de correlación entre las variables es positivo y de 0,9126, un


valor muy alto, cercano a uno, por lo que se puede asegurar que las
variables presentan una correlación positiva casi perfecta
d. ¿Cuál es el peso que debería tener un estudiante que mida 114
cm?

Reemplazando en la ecuación para el valor x=144 se tiene

y=0,386 (144 )−22,751=32,833

Por lo tanto, una persona que mida 114 cm, pesará aproximadamente
32,833 kg.
Ejercicio 1.8
PIB – Consumo de electricidad
Una compañía multinacional del servicio de telecomunicaciones en
Colombia, como medio de planeación estratégica para la toma de
decisiones, solicita a su departamento financiero, hacer predicciones
económicas del valor anual de sus ventas totales, versus el PIB nacional
de las últimas dos décadas, para la toma de decisiones para la apertura
de nuevos mercados. Realice el diagrama de dispersión y determine el
tipo de asociación entre las variables.

Consumo
PIB de
de
Año la
electricidad
Nación
en MWh
2008 2,069 429,4
2009 2,066 427,2
2010 2,221 465,9
2011 2,309 482,2
2012 2,353 499,6
2013 2,424 517,4
2014 2,436 533,8
2015 2,35 525,8
2016 2,269 521,2

a. Ajuste un modelo matemático que permita predecir el efecto de


una variable sobre la otra. ¿Es confiable?
Para el problema se tiene que la variable independiente será PIB de la
nación y la dependiente será Consumo de Electricidad en Mwh. El
modelo matemático esta dado por una regresión lineal dada por la
ecuación
y=273,62 x−134
El modelo tiene un coeficiente de correlación
ρ=0,92
Y un coeficiente de determinación de
R2=0,8465
El modelo es confiable dado que el coeficiente de determinación es muy
cercano a 1
b. Determine el porcentaje de explicación del modelo y el grado de
relación de las dos variables.

El porcentaje de explicación del modelo es del 84,65%, es decir, el


modelo predice un 84,65% de los datos de consumo de electricidad.

El grado de correlación entre las variables es positivo y de 0,92, un


valor muy alto, cercano a uno, por lo que se puede asegurar que las
variables presentan una correlación positiva casi perfecta

c. ¿Cuál podría ser la proyección de PIB para el año 2021 si se


espera que el PIB nacional sea del 3,7
Para el año 2021 se espera que el PIB sea de 3,7, reemplazando este
valor en la regresión lineal se tiene
y=273,62 ( 3,7 ) −134=878,394
Por lo tanto, para el año 2021 se espera que el consumo de energía sea
de 878,394 Mwh.

BIBLIOGRAFÍA

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:


Paraninfo. Paginas. 151 – 158.
 Churchill, G.A. (2009). Análisis de Correlación y de Regresión
Simple. México City: Cengage Learning. Páginas 675 – 686

 Wackerly, D. D., Muñoz, R., & Humbertotr, J. (2010). Estadística


matemática con aplicaciones (No. 519.5 W3).

También podría gustarte