Está en la página 1de 23

Presentado por

Blesy Leonela García noguera

Grupo

202107095_280

Tutor

Alvaro huertas

Escuela de ciencia sociales de artes humanidades

Universidad nacional abierta y distancia


Fecha 22/11/2023

Actividad 1. Mapa mental


Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de
Aprendizaje - Contenidos y referentes bibliográficos (Unidad 3), las siguientes referencias:

Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y


muestreo, 13a ed. [Online]. Ecoe Ediciones. (pp 590 – 677).

Martínez, E. (2020) Estadística. ed. Santiago de los Caballeros: Universidad Abierta


para Adultos (UAPA). (pp 106-138).

 Descripción de la actividad 1 (Individual):


Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y
correlación, la información que se incluya en el mapa conceptual debe ser en lengua
extranjera inglés.

Actividad 2. Definición de Conceptos.


Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de
Aprendizaje - Contenidos y referentes bibliográficos (Unidad 3), las siguientes referencias:

Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y


muestreo, 13a ed. [Online]. Ecoe Ediciones. (pp 590 – 677).

Martínez, E. (2020) Estadística. ed. Santiago de los Caballeros: Universidad Abierta


para Adultos (UAPA). (pp 106-138).

Churchill, Gilbert6 A., Jr. (2022) "Análisis de Correlación y de Regresión Simple."


Investigación de mercados, 4th ed. (pp. 675-686).

Descripción de la Actividad Individual:


Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

 Diagrama de dispersión.
Un diagrama de dispersión o gráfica de dispersión o gráfico de burbujas es un tipo de
diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de
dos variables para un conjunto de dato. En algunos casos el diagrama de dispersión puede
sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza
determinado.

La correlación puede ser positiva (aumento), negativa (descenso), o nula (las variables no
están correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea de
tendencia") con el fin de estudiar la correlación entre las variables. Una ecuación para la
correlación entre las variables puede ser determinada por procedimientos de ajuste. Para
una correlación lineal, el procedimiento de ajuste es conocido como regresión lineal y
garantiza una solución correcta en un tiempo finito.

Ejemplo
 Correlación lineal simple.
El coeficiente de correlación lineal es una medida de regresión que sirve para establecer
una relación lineal entre dos variables. De esta manera, su cálculo permite conocer con
exactitud el grado de dispersión de los valores de una variable en relación con una media
para dicha variable.

Ejemplo: Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy
posible que exista relación entre ambas variables: mientras más alto sea el alumno, mayor
será su peso. El coeficiente de correlación lineal mide el grado de intensidad de esta posible
relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir
entre las variables es lineal (es decir, si representáramos en un gráfico los pares de valores
de las dos variables la nube de puntos se aproximaría a una recta).

puede que exista una relación que no sea lineal, sino exponencial, parabólica, etc. En estos
casos, el coeficiente de correlación lineal mediría mal la intensidad de la relación las
variables, por lo que convendría utilizar otro tipo de coeficiente más apropiado.

 Correlación lineal múltiple


La regresión lineal múltiple trata de ajustar modelos lineales o linealizables entre una
variable dependiente y más de unas variables independientes. En este tipo de modelos es
importante testar la heterocedasticidad, la multicolinealidad y la especificación. En los
modelos lineales múltiples los predictores deben ser independientes, no debe de haber
colinialidad entre ellos.

La colinialidad ocurre cuando un predictor está linealmente relacionado con uno o varios de
los otros predictores del modelo o cuando es la combinación lineal de otros predictores.
Como consecuencia de la colinialidad no se puede identificar de forma precisa el efecto
individual que tiene cada una de las variables colineales sobre la variable respuesta, lo que
se traduce en un incremento de la varianza de los coeficientes de regresión estimados hasta
el punto de que resulta prácticamente imposible establecer su significancia estadística.

Sin embargo, la predicción de una variable (Y) a partir del conocimiento de otra única
puede resultar un análisis extremadamente simple de la realidad en la cual existen múltiples
factores que afectan a cualquier fenómeno que pretenda explicarse. En Psicología diremos
que la conducta de los sujetos, en sus diversas manifestaciones, constituye función de
múltiples variables que la condicionan y/o determinan. Por ejemplo, el comportamiento de
un sujeto en una situación conflictiva puede depender de su temperamento, del nivel de
conflictividad de la situación, de su experiencia en situaciones de este tipo por las que haya
pasado previamente, etc... Es importante, pues, estudiar con un modelo de análisis más
complejo que el de la regresión simple, de qué manera se producen estas relaciones entre la
conducta y una serie más o menos numerosa de factores que la condicionan. El modelo de
la regresión múltiple va a permitirnos acometer esta tarea

 Coeficiente de determinación R2.


El coeficiente de determinación es una medida estadística que examina cómo las
diferencias en una variable pueden ser explicadas por la diferencia en una segunda variable,
al predecir el resultado de un evento determinado. En otras palabras, este coeficiente, que
se conoce más comúnmente como R-cuadrado (o R2), evalúa la fuerza de la relación lineal
entre dos variables, y es muy utilizado por los investigadores cuando realizan análisis de
tendencias. Por citar un ejemplo de su aplicación, este coeficiente puede contemplar la
siguiente pregunta: si una mujer se queda embarazada un día determinado, ¿cuál es la
probabilidad de que dé a luz en una fecha concreta en el futuro? En este escenario, esta
métrica pretende calcular la correlación entre dos acontecimientos relacionados: la
concepción y el nacimiento.

 Interpretación del coeficiente de determinación o R2


El coeficiente de determinación es una medida utilizada para explicar cuánta variabilidad
de un factor puede ser causada por su relación con otro factor relacionado. Esta correlación,
conocida como "bondad de ajuste", se representa como un valor entre 0,0 y 1,0. Un valor de
1,0 indica un ajuste perfecto y, por tanto, un modelo muy fiable para las previsiones futuras,
mientras que un valor de 0,0 indicaría que el cálculo no logra modelar los datos con
precisión en absoluto. Pero un valor de 0,20, por ejemplo, sugiere que el 20% de la variable
dependiente es predicha por la variable independiente, mientras que un valor de 0,50
sugiere que el 50% de la variable dependiente es predicha por la variable independiente, y
así sucesivamente.

En un gráfico, la bondad del ajuste mide la distancia entre una línea ajustada y todos los
puntos de datos que están dispersos en el diagrama. El conjunto de datos ajustado tendrá
una línea de regresión que se acerca a los puntos y tiene un alto nivel de ajuste, lo que
significa que la distancia entre la línea y los datos es pequeña. Aunque un buen ajuste tiene
un R2 cercano a 1,0, este número por sí solo no puede determinar si los puntos de datos o
las predicciones están sesgados. Tampoco indica a los analistas si el valor del coeficiente de
determinación es intrínsecamente bueno o malo. Queda a discreción del usuario evaluar el
significado de esta correlación, y cómo puede aplicarse en el contexto de futuros análisis de
tendencias.

 Correlación positiva y correlación negativa.


Una correlación positiva indica que dos variables evolucionan en el mismo sentido; una
correlación negativa indica que las variables se mueven en direcciones opuestas, y una
correlación cercana a cero indica que no hay una relación lineal entre ellos. Un ejemplo de
poder interpretar estas correlaciones es la siguiente:

Si los sujetos más altos pesan más y los más bajitos pesan menos, entre peso y altura
tendremos una correlación positiva: a mayor altura, mayor peso. Si los de más edad corren
más despacio y los más jóvenes corren más deprisa, entre edad y velocidad tendremos una
correlación negativa; a mayor edad, menor velocidad.

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

El coeficiente de correlación es la medida específica que cuantifica la intensidad de la


relación lineal entre dos variables en un análisis de correlación. En los informes de
correlación, este coeficiente se simboliza con la r.

En palabras sencillas, el coeficiente de correlación de Pearson calcula el efecto del cambio


en una variable cuando la otra variable cambia. Por ejemplo: Hasta una cierta edad, (en la
mayoría de los casos) la estatura de un niño seguirá incrementando a medida que su edad
aumente.

El coeficiente de autocorrelación es un indicador de la posible existencia de tendencias o


ciclos. En la investigación de caso único los datos pueden ser evaluados a través de la
inspección visual, análisis estadísticos o ambos.

Actividad 3. Ejercicio práctico.

En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a continuación;
posterior a ello compartirá su elección en el foro del entorno de Aprendizaje Foro de discusión
Unidad 3- Paso 4 Descripción de la Información. En cada ejercicio deberá responder los siguientes
interrogantes:

a) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


b) Encuentre el coeficiente de determinación y correlación.
c) Determine el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?
d) Determine el grado de relación de las dos variables.

 Biomasa-Pureza.
El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (Y) del
acetato de octilo producido y el porcentaje de biomasa (x) que está presente en el
condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:

X (g. de Biomasa vegetal) Y (Pureza acetato octilo)


0,98 91,01
1,02 89,41
1,07 91,43
1,29 95,76
1,31 91,71
1,38 91,45
0,86 85,6
1,21 95,23
1,58 96,58
1,49 92,35
1,19 91,52
1,53 92,77
0,93 92,5
1,07 85,44
1,15 88,88
1,28 91,32
1,35 93,25
1,28 94,47
1,49 95,22
0,87 81,13

 Diagrama de dispersión y determine el tipo de asociación entre las variables.


100

Y (Pureza acetato octilo) 95

90

85
Series2
80 Linear (Series2)

75

70
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7

X (g. de Biomasavegetal)

Con el anterior gráfico, podemos corroborar que si existe una correlación entre las dos
variables evaluadas. También se observa que existe una correlación con dirección positiva,
Así mismo, la línea de tendencia, que representa la correlación línea entre las variables nos
esta indicando que la fuerza o intensidad de la correlación es fuerte.

 b) Encuentre el coeficiente de determinación y correlación.


Cálculo del coeficiente de correlación
 Coef correlación r = 0,702848854
Existe una mediana correlación directa positiva entre la variable gr de biomasa vegetal y la
pureza del acetato de octilo.
Cálculo del coeficiente de determinación
 Coef Determinación R2= 0,493996511
Significa que el 49% de la variabilidad de la pureza del acetato de octilo, esta determinado
por la cantidad de gramos de biomasa vegetal.

 c) Determine el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es Y= a+
bxpara este caso se tiene que
Y= mx+b
Y = 12,207*x + 76,501

X (g. de Biomasa Y (Pureza acetato octilo) Y=m*x+b


vegetal)
0,98 91,01 88,46
1,02 89,41 88,94
1,07 91,43 89,55
1,29 95,76 92,24
1,31 91,71 92,48
1,38 91,45 93,34
0,86 85,6 86,99
1,21 95,23 91,26
1,58 96,58 95,78
1,49 92,35 94,68
1,19 91,52 91,02
1,53 92,77 95,17
0,93 92,5 87,85
1,07 85,44 89,55
1,15 88,88 90,53
1,28 91,32 92,12
1,35 93,25 92,97
1,28 94,47 92,12
1,49 95,22 94,68
0,87 81,13 87,11

Grafica del modelo matematico predictivo


100

95
f(x) = 12.2 x + 76.5
90

85

80

75

70
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7

Y (Pureza acetato octilo) Y=m*x+b


Linear (Y=m*x+b)

Esto nos permite predecir el efecto de una variable sobre la otra, teniendo en cuenta que
R2= 0,49 no es tan cercano a 1 se puede determinar que es medianamente confiable

 d) Determine el grado de relación de las dos variables.


El grado de relación se encargade valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como evaluación. Dicho es calculo el primer paso para
determinar la relación entre las variables. También, la predicción de una variable dado un
valor determinado de la otra precisa de la regresión lineales la cuantificación de la fuerza de
la relación lineal entre dos variables cuantitativas, se estudia por medio del cálculo del
coeficiente de evaluación de Pearson. Dicho coeficiente oscila entre –1 y +1. Un valor de –
1 indica una relación lineal o línea recta positiva perfecta. Una activación próxima a cero
indica que no hay relación lineal entre las dos variables.
De acuerdo con los resultados de la gráfica, el coeficiente de terminación R2 nos muestra
que la variable dependiente “Pureza acetato octilo” esta explicada en un 49% por el efecto
de la variable “gramos de biomasa vegetal” por lo tanto coeficiente de evaluación R nos
confirma que el grado de relación entre las estas variables es del 70%.

Actividad 4. Regresión y correlación Lineal Simple.

Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de


Aprendizaje - Contenidos y referentes bibliográficos (Unidad 3), las siguientes referencias:

 Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y


muestreo, 13a ed. [Online]. Ecoe Ediciones. (pp 590 –677).

 Martínez, E. (2020) Estadística. ed. Santiago de los Caballeros: Universidad Abierta


para Adultos (UAPA). (pp 106-138).

 Descripción de la Actividad Individual:

A partir de la base de datos suministrad: Anexo 1. Caracterización del embarazo


adolescente, en el Departamento de Caldas entre el año 2014 y 2021, cada estudiante,
deberá:

1. Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente.
2. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de
relación entre las variables.
3. Determine el coeficiente de determinación y de correlación de las dos variables.
Interprete los resultados.
4. Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
5. Determine el tipo de correlación de las dos variables.
6. Relacionar la información obtenida con el problema.

1. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas e identificar la variable dependiente e independiente.
R/. Variable independiente = Tiempo de gestación de la madre al tener el bebé
(semanas)
R/ Variable dependiente = peso recién nacido (en kg)

2. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


relación entre las variables.

En el siguiente gráfico, podemos corroborar que si existe una correlación entre las dos
variables evaluadas. También se observa que existe una correlación dirección positiva, Así
mismo, la línea de tendencia, que representa la correlación lineal entre las variables nos esta
indicando que la fuerza o intensidad de la correlación es media.
Diagrama de dispercion para las variables
4.50
4.00
3.50
3.00
2.50
2.00
1.50
1.00
0.50
-
24 26 28 30 32 34 36 38 40 42 44

3. Determine el coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados.

Cálculo del coeficiente de correlación


 Coef correlación r = 0,70
Existe una mediana correlación directa positiva entre la variable Tiempo de
gestación de la madre al tener el bebé (semanas) y peso recién nacido (en kg)

Cálculo del coeficiente de determinación


 Coef Determinación R2= 0,40
Significa que el 40% de la variabilidad en los datos del peso recién nacido (en kg), está
determinado por la cantidad de Tiempo de gestación de la madre al tener el bebé (semanas).

4. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es Y= a+
bx para este caso se tiene que
Y= mx+b
Y = 0,16*x + 3,0
Chart Title
4.50
4.00
3.50
3.00
2.50
2.00
1.50
1.00
0.50
-
24 26 28 30 32 34 36 38 40 42 44

PESO RECIEN NACIDO (en kg) Y=m*x+b


Esto nos permite predecir el efecto de una variable sobre la otra, teniendo en cuenta que
R2= 0,40 no es tan cercano a 1 se puede determinar que es medianamente confiable

5. Determine el tipo de correlación de las dos variables.

El grado de relación se encarga de valorar la asociación entre dos variables cuantitativas


estudiando el método conocido como evaluación. Dicho es calculo el primer paso para
determinar la relación entre las variables. También, la predicción de una variable dado un
valor determinado de la otra precisa de la regresión lineales la cuantificación de la fuerza de
la relación lineal entre dos variables cuantitativas, se estudia por medio del cálculo del
coeficiente de evaluación de Pearson. Dicho coeficiente oscila entre –1 y +1. Un valor de –
1 indica una relación lineal o línea recta positiva perfecta. Una activación próxima a cero
indica que no hay relación lineal entre las dos variables.

De acuerdo con los resultados de la gráfica, el coeficiente de terminación R2 nos muestra


que la variable dependiente “Peso recién nacido” esta explicada en un 40% por el efecto de
la variable “Tiempo de gestación de la madre al tener el bebé” por lo tanto, el coeficiente de
evaluación R nos confirma que el grado de relación entre las estas variables es del 70%

6. Relacionar la información obtenida con el problema.

TIEMPO DE GESTACIÓN DE LA
PESO RECIEN
MADRE AL TENER EL BEBÉ Y=m*x+b
NACIDO (en kg)
( semanas)

39,4 3,04 3,49


40 3,80 3,61
34 4,00 3,64
34,3 2,40 3,38
36 2,30 3,37
41,2 3,45 3,55
33 2,30 3,37
38 3,52 3,56
39,5 3,50 3,56
40 3,09 3,49
36 3,61 3,58
38,9 3,60 3,58
38 3,00 3,48
40 3,00 3,48
39 3,00 3,48
40 3,28 3,52
33,4 3,50 3,56
40 3,10 3,50
39 3,20 3,51
38 3,00 3,48
34,5 2,20 3,35
34 2,40 3,38
37 3,78 3,60
33 2,40 3,38
33,6 2,40 3,38
34 2,30 3,37
39 3,56 3,57
39 3,75 3,60
39 3,52 3,56
33 2,20 3,35
38 4,00 3,64
35 2,20 3,35
40,2 3,50 3,56
40 3,60 3,58
39 3,00 3,48
35 2,40 3,38
34,6 2,40 3,38
34 2,40 3,38
38 3,50 3,56
37 3,50 3,56
36,3 2,10 3,34
39 3,50 3,56
38 3,50 3,56
38 3,65 3,58
41 3,20 3,51
35 2,30 3,37
36 2,20 3,35
39 3,70 3,59
40,2 3,60 3,58
40 3,40 3,54
39 3,11 3,50
39 3,40 3,54
40 3,60 3,58
40 3,00 3,48
40 3,42 3,55
40 3,41 3,55
38 3,80 3,61
35,4 2,40 3,38
33 2,30 3,37
38 3,50 3,56
39 3,00 3,48
35 2,40 3,38
39 3,53 3,56
38,2 3,23 3,52
34 2,30 3,37
34 2,20 3,35
40 3,80 3,61
40 3,42 3,55
39 3,28 3,52
41 4,15 3,66
42 3,39 3,54
38,3 3,26 3,52
37 3,50 3,56
40 3,20 3,51
39 4,00 3,64
33 1,90 3,30
35 2,20 3,35
34 2,30 3,37
35,1 2,20 3,35
39 3,00 3,48
36 2,30 3,37
39 3,25 3,52
38 3,08 3,49
36 2,10 3,34
41 2,90 3,46
37 3,00 3,48
36,3 2,40 3,38
39 3,30 3,53
41 3,71 3,59
36 2,40 3,38
41 3,75 3,60
39 2,86 3,46
34,4 2,30 3,37
36 2,10 3,34
35 2,20 3,35
39 2,79 3,45
41 2,80 3,45
39 3,78 3,60
39 3,27 3,52
39 3,42 3,55
35,3 3,00 3,48
40 3,36 3,54
37 4,00 3,64
35,5 2,40 3,38
38 3,30 3,53
38 3,16 3,50
39 3,10 3,50
39 3,00 3,48
38 3,70 3,59
39 3,10 3,50
39 3,27 3,52
39 3,65 3,58
40 3,53 3,56
39 3,60 3,58
33,3 2,20 3,35
36 2,90 3,46
41 3,21 3,51
38 3,11 3,50
41 3,87 3,62
33 2,36 3,38
34 2,30 3,37
34 2,10 3,34
28 3,50 3,56
39 3,50 3,56
39 3,79 3,61
39 3,53 3,56
39 2,85 3,46
38 3,50 3,56
33,4 2,20 3,35
37 3,00 3,48
38 2,60 3,42
38 3,00 3,48
37 3,25 3,52
34,3 2,10 3,34
40 3,45 3,55
39 3,04 3,49
40 3,45 3,55
39 3,32 3,53
39 3,40 3,54
40 3,44 3,55
38 3,20 3,51
38 3,36 3,54
39 3,20 3,51
40 3,80 3,61
38 3,22 3,52
40 3,18 3,51
36,4 2,20 3,35
36 2,20 3,35
39 3,42 3,55
40 3,60 3,58
36 2,40 3,38
33,3 2,10 3,34
40 3,00 3,48
41 2,60 3,42
39 3,90 3,62
42 3,15 3,50
37 3,50 3,56
40 3,11 3,50
39,4 3,00 3,48
37 4,00 3,64
39 3,37 3,54
39 3,20 3,51
36 2,30 3,37
40 3,00 3,48
38 2,92 3,47
41 3,30 3,53
38,2 3,62 3,58
38 3,32 3,53
41 3,27 3,52
34 1,90 3,30
39 3,55 3,57
39 3,50 3,56
33 2,00 3,32
38 3,16 3,51
36 1,67 3,27
40 3,00 3,48
37,6 2,80 3,45
38 3,04 3,49
38 3,63 3,58
39 3,18 3,51
36 2,30 3,37
39 3,00 3,48
41,2 3,18 3,51
35 2,00 3,32
38 3,10 3,50
38 3,00 3,48
33 1,90 3,30
38 3,20 3,51
34 2,20 3,35
39 2,81 3,45
33,4 2,40 3,38
34 2,20 3,35
41 3,20 3,51
39 3,54 3,57
35 2,30 3,37
35 2,10 3,34
35 2,40 3,38
34 2,40 3,38
39 3,86 3,62
38,3 3,17 3,51
38 3,40 3,54
39 2,90 3,46
38 2,80 3,45
38 2,95 3,47
38 3,54 3,57
40 3,50 3,56
40 3,37 3,54
36,3 1,95 3,31
37 3,20 3,51
34 3,00 3,48
39 3,20 3,51
36 4,00 3,64
39 3,06 3,49
34 2,30 3,37
34 2,20 3,35
39 3,20 3,51
38 3,00 3,48
36 3,09 3,49
37,2 3,30 3,53
37 2,83 3,45
38 3,48 3,56
34,1 2,20 3,35
35 2,20 3,35
39 3,54 3,57
40 3,00 3,48
40 3,12 3,50
38 3,50 3,56
36 2,40 3,38
40 2,90 3,46
38,2 4,00 3,64
40 3,32 3,53
40 3,32 3,53
35 2,30 3,37
36,4 3,50 3,56
40 2,93 3,47
38 3,32 3,53
37 3,00 3,48
36 2,81 3,45
35 2,60 3,42
35 2,69 3,43
34 2,10 3,34
38 3,00 3,48
33 2,40 3,38
40 2,84 3,45
40 3,19 3,51
39 2,86 3,46
33 2,40 3,38
34 2,40 3,38
34,2 3,40 3,54
40 3,40 3,54
38 3,00 3,48
37 3,00 3,48
33 2,20 3,35
40 2,72 3,44
34,3 2,40 3,38
36 2,89 3,46
39 3,00 3,48
40 3,49 3,56
35,3 1,90 3,30
38 3,69 3,59
39 3,55 3,57
34 2,20 3,35
40 3,26 3,52
41 3,22 3,52
39 3,21 3,51
37 3,00 3,48
40 3,00 3,48
40 3,07 3,49
37 3,60 3,58
38,5 3,20 3,51
38 2,85 3,46
40 3,14 3,50
39 3,17 3,51
38 3,25 3,52
40 3,00 3,48
34 2,20 3,35
35 2,00 3,32
34 2,00 3,32
33,7 2,00 3,32
38 3,00 3,48
35 2,00 3,32
39 3,09 3,49
41 2,87 3,46
38 3,11 3,50
35 2,00 3,32
39 3,00 3,48
40 2,88 3,46
33,4 2,40 3,38
34 2,00 3,32
35 2,00 3,32
40 3,61 3,58
39 3,20 3,51
33 2,00 3,32
38 3,00 3,48
35,5 2,00 3,32
38 3,00 3,48
40 3,20 3,51
39 3,77 3,60
26,3 0,73 3,12
33 2,40 3,38

Actividad 5. Regresión y Correlación Múltiple.

Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de


conocimiento (Unidad 3), la siguiente referencia:

Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y


muestreo, 13a ed. [Online]. Ecoe Ediciones. (pp 590 –677).

Martínez, E. (2020) Estadística. ed. Santiago de los Caballeros: Universidad Abierta


para Adultos (UAPA). (pp 106-138).

Descripción de la Actividad:
A partir de la base de datos suministrada Anexo 1. Caracterización del embarazo
adolescente, en el Departamento de Caldas entre el año 2014 y 2021, cada estudiante
deberá:

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas


independientes del estudio de investigación.
b. Realizar el diagrama de dispersión de dichas variables.
c. Calcular la recta de regresión y el coeficiente de correlación para probar
estadísticamente su relación.
d. Relacionar la información obtenida con el problema.

a. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas e identificar la variable dependiente e independiente.

R/. Variable independiente = Edad de la madre


R/ Variable dependiente = Talla recién nacido (cm), Edad de inicio de relaciones
sexuales.

b. Realizar el diagrama de dispersión de dichas variables

En el siguiente gráfico, podemos corroborar que si existe una correlación entre las dos
variables evaluadas. También se observa que existe una correlación dirección positiva, Así
mismo, la línea de tendencia, que representa la correlación lineal entre las variables nos esta
indicando que la fuerza o intensidad de la correlación es media.

Grafico de dispersion entre la variable edad de la madre sobre talla


recien nacido
20
18
16
14
12
10
8
6
4
2
0
12 13 14 15 16 17 18 19
Grafico dispersion entre la variable Edad de la madre y edad de
inicio de relaciones sexuales
54
53
52
51
50
49
48
47
46
45
12 13 14 15 16 17 18 19

c. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

Cálculo del coeficiente de correlación

 Coef correlación para las variables edad de las madres y sobre talla de recién
nacido r = 0,18

El coeficiente de correlación nos esta indicando que no existe una correlación fuerte entre
las variables, en otras palabras, el efecto de la variable dependiente no esta influenciado por
la variable independiente.

Interpretando los resultados al caso, el coeficiente de correlación r= 0,18 esta indicando que
la variable que la talla de los recién nacidos, no esta fuertemente relacionada con la edad de
la madre.

 Coef correlación de la variable edad de la madre sobre edad inicio de


relaciones sexuales r = 0,51

El coeficiente de correlación nos está indicando que existe una correlación media entre las
variables, en otras palabras, el efecto de la variable dependiente esta medianamente
influenciado por la variable independiente.

Interpretando los resultados al caso, el coeficiente de correlación r= 0,50 está indicando que
la variable edad de inicio de relaciones sexuales, esta medianamente influenciado o
relacionada con la edad de la madre.

d. Cálculo de la recta de regresión


Calculo de la recta de regresion para las variables seleccionadas en este es-
tudio
60

50
f(x) = 0.254813328324832 x + 45.722056560757

40

30

20

f(x) = 0.708483861452786 x + 2.70540621793528


10

0
12 13 14 15 16 17 18 19

e. Relacionar la información obtenida con el problema.

Con base en todo lo anterior, podemos predecir las siguientes consultas:

 ¿Cuál sería el tallaje de un bebe recién nacido si la madre tiene una edad de 25
años?
Para este caso hacemos uso de la formula
Y= mx+b
Y= (0,25* 25) + 45,722
Y = 51.9
Lo anterior significa que la probabilidad de talla de un bebe recién nacido si la madre tiene
una edad de 25 años puede ser de 51.9 cm

 ¿Cuál sería la edad estimada de inicio de relaciones sexuales de una mujer, si la


edad actual es de 25 años?
Para este caso hacemos uso de la formula
Y= mx+b
Y= (0,70 * 25) + 2,70
Y = 20.2 años,
Significa que las probabilidades de que la persona haya iniciado sus relaciones sexuales
esta seria desde los 20 años.

Bibliografía

Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y


muestreo, 13a ed. [Online]. Ecoe Ediciones. (pp 590 –677).
Martínez, E. (2020) Estadística. ed. Santiago de los Caballeros: Universidad Abierta
para Adultos (UAPA). (pp 106-138).

También podría gustarte