Está en la página 1de 18

Fase 4- Descripción de la Información

Actividad Individual

Nombre del estudiante:

Elkin Ortiz Vásquez


CC. 91.528.027

Universidad Nacional Abierta y a Distancia - UNAD


Escuela de Ciencias Básicas, Tecnología e Ingeniería
Estadística Descriptiva
2020
Introducción

A continuación, estudiaremos dicho grado de relación entre dos variables en


lo que llamaremos análisis de correlación. Para representar esta relación
utilizaremos una representación gráfica llamada diagrama de dispersión y,
finalmente, estudiaremos un modelo matemático para estimar el valor de
una variable basándonos en el valor de otra, en lo que llamaremos análisis
de regresión.
Tabla de contenido

Introducción.....................................................................................................................................2
Objetivo General..............................................................................................................................4
ACTIVIDAD 1. MAPA MENTAL LAS MEDIDAS ESTADÍSTICAS BIVARIANTES DE REGRESIÓN Y
CORRELACIÓN..................................................................................................................................5
ACTIVIDAD 2 DEFINICIÓN DE CONCEPTOS......................................................................................6
a) Diagrama de dispersión:................................................................................................6
b) Correlación lineal simple:..............................................................................................7
c) Coeficiente de determinación R2:....................................................................................7
d) Correlación positiva y correlación negativa:.................................................................7
e) ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?.......................8
ACTIVIDAD 3. REALIZAR EL LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL VARIABLE
CONTINUA: PROMEDIO GENERAL...................................................................................................8
Conclusiones..................................................................................................................................17
Referencias Bibliográficas..............................................................................................................18
Objetivo General

Aplicar las medidas bivariantes, en función de la problemática de estudio.

Objetivo Específicos.
 Identificar, calculará e interpretará las medidas bivariantes, en función
de la descripción de la problemática, a partir del trabajo realizado con
variables cuantitativas, de la base de datos denominada: Pruebas
SABER 11 - 200 estudiantes 2020 (16-2)
 Realizar el laboratorio Denominado Regresión y Correlación lineal
 Aprender a calcular la correlación entre dos variables
 Saber dibujar un diagrama de dispersión
 Representar la recta que define la relación lineal entre dos variables
 Saber estimar la recta de regresión por el método de mínimos
cuadrados e interpretar su ajuste.
 Realizar inferencia sobre los parámetros de la recta de regresión
 Construir e interpretar intervalos de confianza e intervalos de
predicción para la variable dependiente
 Realizar una prueba de hipótesis para determinar si el coeficiente de
correlación es distinto de cero
ACTIVIDAD 1. MAPA MENTAL LAS MEDIDAS ESTADÍSTICAS BIVARIANTES DE REGRESIÓN Y CORRELACIÓN
ACTIVIDAD 2 DEFINICIÓN DE CONCEPTOS.

a) Diagrama de dispersión:

El diagrama de dispersión es una herramienta de análisis la cual representa


en forma gráfica la relación existente entre dos variables pudiendo observar
la dependencia o influencia que tiene una variable sobre la otra, permitiendo
visualizar de forma gráfica su posible correlación. Conocidos también como
gráficos XY es una herramienta de análisis utilizado generalmente en el área
de la gestión de calidad con el objeto de encontrar las relaciones de las
causas que producen un efecto.

Tal y como hemos citado en la definición anterior el diagrama de dispersión


nos indica la relación existente entre dos variables, y por lo tanto si
traducimos estas dos variables a grupos de datos, podemos relacionar
grupos de datos con el objeto de verificar o averiguar que existe una
relación entre ambos y como es esta relación de forma aproximada.

Los diagramas de dispersión se emplean para:

 Observar el grado de intensidad en la relación entre dos variables, esta


relación puede ser entre un efecto y una de las supuestas causas que
lo producen o para ver la relación entre dos causas que provocan un
mismo efecto.

 Visualizar rápidamente cambios anómalos.

 Analizar determinadas cuestiones mediante comparaciones.

 Modo de aplicación

 Los pasos a seguir para construir un diagrama de dispersión son:

 Seleccionar las 2 variables que se van relacionar.

 Establecer una hipótesis de la posible relación entre ambas.

 Construir una tabla que nos relacione los valores de ambas variables
por parejas. Si no disponemos de dichos datos será necesario realizar
una toma.
 Dibujar el diagrama poniendo una variable en cada uno de los ejes
cartesianos (x,y) con una escala de valores que se ajuste a los datos
que se dispone.

 Representar en el gráfico cada par de valores por un punto.

 Encontrar la correlación analizando la tendencia de la nube de puntos


y la correlación entre las variables.

Hoy en día gracias a la informática disponemos de programas basados en


hojas de cálculo como Excel, Numbers o Calc que te permiten realizar
rápidamente un diagrama de dispersión con solo introducir los datos de las
variables.

b) Correlación lineal simple:

Nos permite comprobar si las variables cuantitativas están asociadas entre


ellas o no. Así mismo, busca una relación estadísticamente significativa entre
las dos variables que intervienen en una distribución bidimensional.

c) Coeficiente de determinación R2:

El coeficiente de determinación r2 es la proporción de la variación total en la


variable dependiente Y que se explica por, o se debe a, la variación en la
variable dependiente X; también podemos decir que r2 es el cuadrado de r
el coeficiente de correlación

d) Correlación positiva y correlación negativa:

Correlación positiva - Se observa como la nube de puntos obtenida adquiere


una forma de recta creciente, cuando los puntos de la nube se encuentra
próximos a la recta se le conoce como fuerte, en el caso que se encuentren
distantes a la recta es conocida como débil. Por ejemplo la relación existente
entre la altura y el peso de una persona es positiva a mayor altura mayor
peso.

Correlación negativa - Al contrario del caso anterior se observa como la nube


de puntos obtenida adquiere una forma de recta decreciente, cuando los
puntos de la nube se encuentra próximos a la recta se le conoce como
fuerte, en el caso que se encuentren distantes a la recta es conocida como
débil. Por ejemplo la relación existente para los fumadores entre el número
de paquetes de tabaco al mes y los años de vida es negativa dado que a
mayor cantidad de tabaco fumado menor esperanza de vida.

e) ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a


medir?

Estudia la dependencia entre dos variables. La correlación indica la fuerza y


la dirección de una relación lineal entre dos variables aleatorias. Existe
correlación si al aumentar los valores de A lo hacen también los de B y
viceversa. Visto gráficamente, la nube de puntos se aproxima a una recta

ACTIVIDAD 3. REALIZAR EL LABORATORIO DE REGRESIÓN Y


CORRELACIÓN LINEAL VARIABLE CONTINUA: PROMEDIO
GENERAL

Descripción de la Actividad Individual:

Desarrollar el Laboratorio denominado Regresión y Correlación lineal, el cual


se encuentra en el Entorno de aprendizaje práctico, en la carpeta Guía
para el uso de recursos educativos. El laboratorio lo puede desarrollar con el
programa Infostat o Excel.

De optar por el uso del programa Infostat, lo podrá descargar en el entorno


de aprendizaje practico, carpeta: Laboratorios Estadística Descriptiva:
Infostat tutoriales, enlace descarga del Infostat.

Cada estudiante en el orden de participación escogerá un paquete de


ejercicios y socializará a sus compañeros en el foro la elección;
posteriormente al desarrollo, deberá subirlo al foro paso 4– Descripción de la
información, en un archivo en Word utilizando el siguiente protocolo para
nombrar el archivo: Nombre Apellido_lab_Regresión y Correlación Lineal.
4 1.3 Edad – Masa 1.6 Estatura-Peso 1.8 PIB – Consumo de
Muscular. electricidad

1.3 Edad – Masa Muscular.


Una nutricionista desea estudiar la relación entre la edad y la masa
muscular de las personas, y para realizar el estudio seleccionó un
grupo de mujeres con características semejantes, con edades
diferentes y midió su masa muscular. La nutricionista registró los
datos de edad y masa muscular en las siguientes tablas:

Edad Masa muscular


57 98
75 83
70 90
62 98
41 67
44 90
66 80
55 69
72 74
67 79
53 100
57 60
75 84
64 110
44 70

a) Realice el diagrama de dispersión y determine el tipo de


asociación entre las variables.

Diagrama de dispersión Edad (años) vrs Masa Muscular (kg)


Edad vrs Masa Muscular
120

100
Masa Muscular (kg)
80 R² ==0.04
f(x) 0.25 x + 68.36

60

40

20

0
30 35 40 45 50 55 60 65 70 75 80
Edad (años)

Fuente: Elaboración propia

- La asociación entre las variables es lineal creciente.

b) Encuentre el modelo matemático que permite predecir el efecto


de una variable sobre la otra. ¿Es confiable?

y = 0,2512x + 68,361 [Kg] Modelo Matemático

Confiable en un 3.95%

¿Es confiable?, es poco confiable ya que la masa no depende


necesariamente únicamente de la edad.

c) Determine el porcentaje de explicación del modelo y el grado


de relación de las dos variables.

- Con los resultados obtenidos podemos asegurar que la ecuación de la


recta es estimación de la relación entre las dos variables, con un grado
de confianza muy bajo.
- El grado de relación entre la Edad y la Masa muscular es muy baja
con valor de r=0.2

d) ¿Cuál sería la masa muscular esperada de una persona de 40


años?

y = 0,2512x + 68,361

x=40 entonces

y = 0,2512*40 + 68,361

y = 78.40 la masa esperada para una persona e 40 años sería de 78,40


kg

1.6 Estatura-Peso.

Una Nutricionista de un hogar infantil desea encontrar un modelo


matemático que permita determinar la relación entre el peso y la
estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las
mediciones respectivas.

A continuación, se presentan los resultados:

Estatura (cm) 120 124 107 118 112 110 115 104 110 116
Peso (kg) 24 23 19 24 21 19 22 16 20 23

a. Identifique la variable dependiente (y) y la variable independiente (x),


realice el diagrama de dispersión y determine el tipo de asociación entre
las variables

- El peso depende de la estatura por eso el peso será la variable dependiente


y la estatura la variable independiente.
Diagrama de dispersión Estatura (cm) vrs Peso (kg)

Estatura (cm) vrs Peso (kg)


30

25
f(x) = 0.39 x − 22.75
20 R² = 0.83
Peso (kg)

15

10

0
100 105 110 115 120 125 130
Estatura (cm)

Fuente: Elaboración propia

- La asociación entre las variables es lineal creciente.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y = 0,386x - 22,751 [Kg]


R² = 0,8329

83,29% de relación Muy ALTA ya que el peso depende directamente de la


edad.
Si es confiable.

c. Determine el grado de correlación de las dos variables.

- El grado de relación entre la Estatura (cm) y el Peso (kg) es Muy Alta


con valor de r=0.91

d. ¿Cuál es el peso que debería tener un estudiante que mida 114 cm?

y = 0,386x - 22,751 entonces x=114 y=21,25 kg con 114 cm el peso debería ser 21.25kg.
1.8 PIB – Consumo de electricidad
Una compañía multinacional del servicio de telecomunicaciones en
Colombia, como medio de planeación estratégica para la toma de
decisiones, solicita a su departamento financiero, hacer predicciones
económicas del valor anual de sus ventas totales, versus el PIB
nacional de las últimas dos décadas, para la toma de decisiones para
la apertura de nuevos mercados. Realice el diagrama de dispersión y
determine el tipo de asociación entre las variables.

Consumo
PIB de
de
Año la
electricidad
Nación
en MWh
2008 2,069 429,4
2009 2,066 427,2
2010 2,221 465,9
2011 2,309 482,2
2012 2,353 499,6
2013 2,424 517,4
2014 2,436 533,8
2015 2,35 525,8
2016 2,269 521,2

1.8.1 Ajuste un modelo matemático que permita predecir el efecto de


una variable sobre la otra. ¿Es confiable?

Fuente Elaboración Propia


- La asociación entre las variables es lineal creciente.

Modelo y = 273,62x – 134 (Mwh)


Es 84,65 de confiable.

1.8.2 Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.
1. El grado de relación entre las dos variable es muy alta con
un valor de 9,2. Lo que nos indica que el consumo de
electricidad está directamente relacionado con el PIB

1.8.3 ¿Cuál podría ser el consumo de electricidad para el año 2021 si


se espera que el PIB nacional sea del 3,7
1.8.4
De acuerdo a nuestro modelo matemático y = 273,62x – 134 (Mwh)
el consumo de electricidad para el año 2021 si se espera que el PIB nacional
sea del 3.7 y = 273,62*3.7 – 134 (Mwh)= 878,394 MwH

para el 2021 con un PIB de 3.7 el consumo de electricidad será de 878,394 MwH
ACTIVIDAD 4. REGRESIÓN Y CORRELACIÓN LINEAL.

Descripción de la Actividad Individual:

A partir de la base de datos suministrada: Pruebas SABER 11 - 200


estudiantes 2020 (16-2), cada estudiante, deberá:

J
 Identificar dos variables cuantitativas de la situación estudiada
que puedan estar relacionadas e identificar la variable
dependiente e independiente.

Se escogen las Variables Horas dedicadas a la Lectura y Puntuación


Lectura Crítica siendo la Variable Horas dedicadas a la lectura la
variable independiente, se escogen estas variables con el fin de
determinar si la cantidad invertida para la lectura está o no está
relacionada con las calificaciones de lectura Crítica.

 Realizar el diagrama de dispersión de dichas variables y


determinar el tipo de relación entre las variables.

 Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y = -1,1535x + 60,797 ,

R² = 0,008, con una confianza del 0,8%


 Determine el grado de correlación de las dos variables.
r=0,08
correlacion muy baja, prácticamente nula

 Relacionar la información obtenida con el problema.

- La horas dedicadas a la lectura no está relacionado directamente a


la puntuación Lectura Crítica
Conclusiones

 Es importante determinar que variable será la dependiente y la


independiente al momento de realizar el análisis de las mismas.

 La confianza en los modelos juega un papel muy importante para la


toma de decisiones, un ejemplo claro es la situación que está viviendo
actualmente el país con respecto a la pandemia del COVID19.

 "El modelo que existe para la Nación, pero también para los
departamentos y para los municipios, ha permitido entender cuáles
serán los casos o los números máximos que Colombia podría llegar a
tener, cuáles serían las fechas y cuáles serían además los momentos
críticos", indicó la directora del INS, precisando que sobre esto se
tomó la decisión de la extensión de la cuarentena, sumado a las
demás medidas del Gobierno.
Referencias Bibliográficas.

 Montero, J. M. (2007). Características de Una Distribución de


Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A.
(pp 41-50). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99fe
ba20c3312cbea60961107ffc27a0

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:


Paraninfo. (pp 151 – 158). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c
81e98fcc1361e1929abe203c8219

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.


México City: Cengage Learning. (pp 675–686). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558
184ed89e57d11ede116134cfce41

 Matus, R., Hernández, Martha, and García, E (2010). Estadística.


México, D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest
ebrary. (pp 95-109). Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?
ppg=12&docID=10365616&tm=1471981556569

 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y


estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. (pp 99-
109) Recuperado de http://site.ebrary.com/lib/unadsp/reader.action?
ppg=6&docID=11230886&tm=1471982022168

 Ministerio de Salud Colombia. (20 abril 2020). Modelo matemático


para covid-19 ha permitido tomar las mejores decisiones.
https://www.minsalud.gov.co/Paginas/Modelo-matematico-para-covid-
19-ha-permitido-tomar-las-mejores-decisiones.aspx

También podría gustarte