Está en la página 1de 16

Paso 4.

Descripción de la información

Presentado por:

Yasbleidy Mileth Trujillo Beltrán.

Grupo

202107095_247

Presentado a: Adrián Reinaldo Valencia

Universidad Nacional Abierta y a Distancia – UNAD

Escuela de Ciencias Sociales, Artes y Humanidades – ECSAH

Estadística

Mayo de 2021
1

Tabla de contenido

Introducción.........................................................................................................................2

Justificación.........................................................................................................................3

Objetivos..............................................................................................................................4

Objetivo general:..............................................................................................................4

Objetivos específicos:......................................................................................................4

Desarrollo.............................................................................................................................5

Actividad 1. Mapa mental – Regresión y Correlación.....................................................5

Actividad 2. Definición de Conceptos.............................................................................6

Actividad 3. Ejercicio práctico........................................................................................7

Actividad 4. Regresión y Correlación Lineal Simple....................................................10

Actividad 5. Regresión y Correlación Múltiple.............................................................12

Conclusiones......................................................................................................................14

Referencias.........................................................................................................................15
2

Introducción

El presente trabajo fue desarrollado en el curso de “Estadística” para la carrera de

Psicología de la Universidad Nacional Abierta y a Distancia UNAD. Tuvo como propósito

aplicar y comprender aspectos importantes de la estadística bivariante, por medio del cálculo e

interpretación de los resultados utilizando herramientas como Excel en función de una

problemática objeto de estudio.

Primeramente, la actividad requería realizar un mapa mental a partir de los aspectos más

importantes en relación a las medidas bivariantes (Regresión y Correlación). Seguidamente,

definir conceptos básicos de la temática actual y socializarla en el foro de discusión.

Posterior a ello realizar un ejercicio práctico para identificar la relación entre dos

variables cuantitativas aplicando estadística bivariante, de los cuales me correspondió Peso(kg)

vs Altura(cm).

Finalmente realizar otro ejercicio aplicando medidas bivariantes, pero en esta ocasión

utilizando datos reales de una problemática objeto de estudio.


3

Justificación

Con la realización de este trabajo se desea lograr la adquisición de los conocimientos y

capacidades necesarias para la realización de investigación bajo el uso de la estadística bivariante

y sus diferentes medidas aplicadas a la investigación y estudio de problemas de la vida real.

También se espera que a partir de la realización de todas las actividades pueda estar en la

capacidad de dar un paso adelante en el entendimiento del resto de componentes y elementos que

comprenden este tipo de temática, todo con el fin de avanzar en mi formación.

El trabajo propone la identificación de conceptos, el entendimiento y realización de

actividades relacionadas con la estadística bivariante, específicamente las medidas de Regresión

y Correlación. Medidas que a su vez requieren la realización de diagramas de dispersión y por

ende el cálculo de los coeficientes de Correlación y Determinación, entre otros.


4

Objetivos

Objetivo general:

Aplicar y entender las medidas estadísticas bivariantes, a través del cálculo e

interpretación mediante herramientas software para el procesamiento y presentación de los datos

en función de una problemática de estudio.

Objetivos específicos:

 Identificar los aspectos más importantes en relación a las medidas estadísticas

Bivariantes mediante la realización de un mapa mental.

 Definir brevemente los conceptos básicos asociados al tema de Regresión y

Correlación.

 Realizar un ejercicio práctico para identificar la relación entre dos variables

cuantitativas aplicando estadística bivariante.

 Realizar ejercicio aplicando medidas bivariantes, utilizando datos reales de una

problemática objeto de estudio.

 Interpretar los resultados en cada objetivo, asociarlos con el ejercicio propuesto o

la problemática de estudio y realizar conclusiones.


5

Desarrollo

Actividad 1. Mapa mental – Regresión y Correlación

Link: https://www.goconqr.com/es-ES/mindmap/30826244/Regresi-n-y-Correlaci-n-Simple
6

Actividad 2. Definición de Conceptos

 Diagrama de dispersión

El diagrama de dispersión es una representación gráfica de nube de puntos, con relación a

dos variables y que por medio de dichos puntos nos muestran la relación que existe entre las dos

variables.

 Correlación lineal Simple

El coeficiente de correlación lineal simple es un método estadístico que mide el grado de

relación lineal que existe entre dos variables que varían conjuntamente.

 Coeficiente de determinación R^2

Es un término utilizado en el análisis de regresión para denotar la proporción relativa de

la variación total en la variable de criterio que puede explicarse mediante la ecuación de

regresión ajustada.

 Correlación positiva y correlación negativa

C. positiva: Se da cuando hay una relación proporcional entre ambas variables; es decir,

las dos disminuyen o aumentan a la vez.

C. negativa: Se produce cuando el comportamiento de una variable es diferente a la otra.

Por ejemplo, mientras una aumenta, la otra disminuye.

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

Es una medida de regresión que pretende cuantificar el grado de variación conjunta entre

dos variables. Es decir, si se representan en un diagrama de dispersión los valores que toman dos

variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos

representados se aproxima a una recta. De esta manera, el coeficiente nos ayuda a medir el grado

de intensidad y el sentido de la relación entre dos variables.


7

Actividad 3. Ejercicio práctico

3.3 Peso - Altura: Peso-Altura. Un colegio del distrito de Bogotá desea realizar un

estudio de crecimiento dentro de su población estudiantil, para lo que se ha construido desde una

muestra la siguiente de información del peso (en kg.) y la altura (en cm.) de 15 jóvenes:

PESO (Kg) ALTURA(Cm)


61 150
63 143
60 146
74 160
58 143
63 145
64 149
74 158
74 150
66 150
63 153
61 151
64 151
69 147
64 142

a. Diagrama de dispersión y tipo de asociación entre variables:

Diagrama de dispersión
165
160
155
Altura (Cm)

150
145
140
135
130
55 57 59 61 63 65 67 69 71 73 75
Peso (Kg)
8

Tipo de asociación entre variables: Correlación media positiva. El valor de “X”, que es

el Peso en (Kg) aumenta ligeramente a medida que aumenta el valor de “Y” o Altura (Cm).

b. Coeficiente de determinación y correlación:

PESO (Kg) ALTURA(Cm)


n Xi Yi Xi * Y i Xi2 Y i2
1 61 150 9150 3721 22500
2 63 143 9009 3969 20449
3 60 146 8760 3600 21316
4 74 160 11840 5476 25600
5 58 143 8294 3364 20449
6 63 145 9135 3969 21025
7 64 149 9536 4096 22201
8 74 158 11692 5476 24964
9 74 150 11100 5476 22500
10 66 150 9900 4356 22500
11 63 153 9639 3969 23409
12 61 151 9211 3721 22801
13 64 151 9664 4096 22801
14 69 147 10143 4761 21609
15 64 142 9088 4096 20164
Total 978 2238 146161 64146 334288

Hallamos las medias aritméticas:

978 2238
x= =65,2 y= =149,2
15 15

Calculamos la covarianza:

146161
σxy = −65,2∗149,2=16,23
15

Calculamos las desviaciones típicas:

σx=
√ 64146
15
−(65,2)2=5,03 σy =
√334288
15
−(149,2)2=5,02
9

Hallamos el coeficiente de correlación:

16,23
r= =0,64
5,03∗5,02

Interpretación: Como el valor del coeficiente de correlación es positivo, entonces la

correlación es una correlación positiva directa. Lo que significa que a mayor Peso

mayor es la Altura de la persona.

Hallamos el coeficiente de determinación:

R2= ( 0,64 )2=0,41

Interpretación: El 41% de la variabilidad de la Altura, es explicado por el Peso de la

persona.

c. Modelo matemático ¿es confiable?:

y=0,6399 x +107,48

Este modelo es medianamente confiable porque si observamos R2 no es muy cercano a 1,

lo que quiere decir que su confiabilidad es media.


2
R =0,41

d. Grado de correlación de las dos variables:


10

Como lo había mencionado anteriormente el 41% de la variabilidad de la Altura, es

explicado por el Peso. Lo que demuestra que ambas variables poseen un nivel medio de

correlación.

Actividad 4. Regresión y Correlación Lineal Simple

 Variables Cuantitativas – (Nacidos Vivos Hospital Manuel Uribe)

- Variable dependiente (Y): TALLA (Cm)

- Variable independiente (X): PESO (g)

 Diagrama de dispersión y tipo de relación entre las variables

Diagrama de dispersion - Peso y Talla, Nacidos Vivios Hospi-


tal Manuel Uribe
60

55
Talla en Centimetros

50

45

40

35
1000 1500 2000 2500 3000 3500 4000 4500

Peso en gramos
11

Tipo de asociación entre variables: Alta correlación positiva. El valor de “X”, que es el

Peso en (gramos) aumenta proporcionalmente a medida que aumenta el valor de “Y” o Altura

(Cm).

 Coeficiente de determinación y Coeficiente de correlación

Concepto Valor

Coeficiente de Correlación (r) 0,755856579

Coeficiente de Determinación (R2) 0,571319169

Interpretación Coeficiente de Correlación: Como el valor del coeficiente de correlación

es positivo, entonces la correlación es una correlación positiva directa. Lo que significa que a

mayor Peso mayor es la Altura de la persona.

Interpretación Coeficiente de Determinación: Aproximadamente el 60% de la

variabilidad de la Altura, es explicado por el Peso de la persona.

 Modelo matemático ¿es confiable?:

y=0,004 x+36,86

Este modelo es altamente confiable porque si observamos R2 está por encima de la

media, estando más cerca de 1, lo que quiere decir que su confiabilidad es alta, prueba de ello

es tomar datos de la variable X y reemplazarlos en el modelo para obtener Y.

R2=0,57
2
R 0 , ≈ 0,6
12

 Grado de correlación de las dos variables:

Como lo había mencionado anteriormente el 60% de la variabilidad de la Altura, es

explicado por el Peso. Lo que demuestra que ambas variables poseen un nivel alto de

correlación.

Actividad 5. Regresión y Correlación Múltiple

a. Identificación de variables

Variable dependiente (Y): NÚMERO DE ABORTOS

Variable independiente (X): EDAD DE LA MADRE (años)

Variable independiente (X): NÚMERO TOTAL EMBARAZOS

b. Diagrama de dispersión

Diagrama de dispersión Múltiple


Talla vs Peso Tiempo Gestacion vs Peso
4500

4000

3500

3000
Peso (g)

2500

2000

1500

1000
30 35 40 45 50 55 60

Tiempo de gestación (días) & Talla (cm)


13

c. Calcular rectas de regresión y coeficientes de correlación.

Diagrama de dispersión Múltiple


Talla vs Peso Linear (Talla vs Peso)
Tiempo Gestacion vs Peso Linear (Tiempo Gestacion vs Peso)
4500

4000 f(x) = 144.502489665143 x − 3996.22564228294


R² = 0.571319168587247
3500
f(x) = 178.98291567717 x − 3796.49478963598
3000 R² = 0.418105805061546
Peso (g)

2500

2000

1500

1000
30 35 40 45 50 55 60
Tiempo de gestación (días) & Talla (cm)

Tiempo de gestación(días) vs Peso(g) Talla(cm) vs Peso(g)


Coef. Correlación 0,64661102 Coef. Correlación 0,75585658
Coef. Determinación 0,41810581 Coef. Determinación 0,57131917
14

Conclusiones

Mediante la realización de este trabajo, logré identificar y comprender aspectos

importantes de la estadística bivariante, especialmente de las medidas de Regresión y

Correlación.

Aprendí a realizar diagramas de dispersión en Excel y a determinar el tipo de asociación

entre las variables, haciendo uso de variables cuantitativas de una problemática de estudio.

También aprendí a calcular los coeficientes de Correlación y Determinación para conocer

si la correlación entre las dos variables y saber si era positiva y directa.

Finalmente, entendí como determinar y hallar el modelo matemático que permitía

predecir el efecto de una variable sobre la otra. Y saber si el modelo era confiable.

Debo expresar que ha sido muy gratificante para mi formación el poder aprender estos

temas que me permitirán tener las capacidades necesarias para desarrollar investigación en una

futura eventualidad dentro de mi carrera.


15

Referencias

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City. Biblioteca

UNAD: https://link.gale.com/apps/doc/CX4058900232/GVRL?

u=unad&sid=GVRL&xid=a2479593

Montero, J. M. (2007). Características de una distribución de frecuencias. Madrid. Biblioteca

UNAD:https://link.gale.com/apps/doc/CX4052100007/GVRL?

u=unad&sid=GVRL&xid=24d3aa51

También podría gustarte