Está en la página 1de 25

1

Paso 4

Descripción de la Información

Elaborado por:

XXXXXXXXXXXXXXXX

Director/Tutor:

XXXXXXXXXXXXXXX

Grupo:

XXXXXXXXXXXXXXXXX

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

ESTADISTICA DESCRIPTIVA

Fecha: 26 Noviembre, 2022


2

Introducción

En el presente trabajo desarrollamos los ejercicios del paso 4 denominado descripción de

la información que tiene como objeto la aplicación de las medidas estadísticas bivariantes, por

medio del cálculo e interpretación de un software estadístico, en función de la problemática objeto

de estudio.

Los ejercicios del paso cuatro se desarrollaron en 5 momentos; la primera consistió en la

construcción de un cuadro sinóptico donde se evidencie los conceptos y/o definiciones y sus

aplicaciones de las medidas estadísticas Bivariantes de regresión y correlación. El segundo

momento se realizó la aplicación de regresión y correlación a partir de una articulo académico o

científico. El tercer momento se desarrolló ejercicios prácticos de aplicación sobre la temática, el

cuarto momento se realizaron el ejercicio sobre la Regresión y correlación Lineal Simple, a partir

de la base de datos suministrada del Anexo 1 sobre los Indicadores de violencia contra la mujer en

Colombia para el periodo 2010 a 2021 (16-4) y el quinto momento correspondió a la aplicación de

la Regresión y correlación múltiple, para identificar una variable cuantitativa dependiente e

independientes del estudio de investigación, en realizar un diagrama de dispersión de dichas

variables, en calcular la recta de regresión y el coeficiente de correlación para probar

estadísticamente su relación y finalmente poder relacionar toda la información obtenidas en los

resultados con el problema objeto de estudio.


3

Justificación.

El presente trabajo tiene como propósito desarrollar los ejercicios planteados en este paso

4 descripción de la información, a partir de los conocimientos previos sobre los contenidos de la

unidad tres de regresión y determinación, para poderlos aplicar de manera teórico practico en el

caso objeto de estudio suministrado en la base de datos del Anexo 1 sobre los indicadores de

violencia contra la mujer en Colombia para el periodo 2010 a 2021 (16-4).

En ese sentido la aplicación de la temática vista en la unidad se lograron determinar la

relación entre una variable dependiente y variables independientes y si es posible predecir el valor

de una de ellas en función de la otra. En ese sentido podemos decir que el análisis de correlación

y de regresión son de uso frecuente en una investigación sobre una población para poder estudiar

la relación entre dos o más variables y medir la cercanía de relación entre las variables.

De igual forma, es indispensable entender que la variable dependiente e independiente

son dos variables que se pueden utilizar en cualquier experimento o investigación y pueden ser

vistas como la causa, la variable independiente y el efecto, la variable dependiente.


4

Objetivos.

General

 Aplicar las medidas estadísticas bivariantes, por medio del cálculo e interpretación del

software estadístico, en función de la problemática objeto de estudio.

Específicos

 Revisar en el Entorno de Aprendizaje - Contenidos y referentes bibliográficos (Unidad 3)

 Calcular e interpretar la correlación lineal múltiple de las variables cuantitativas


5

Cuadro Sinóptico:
6

Actividad 2. Aplicación de Regresión y Correlación

STATISTICAL ESTIMATION OF THE RELATIONSHIP BETWEEN ADVERTISING EXPENSES AND

THEIR IMPACT ON FINANCIAL PERFORMANCE

In this investigation, information from the Superintendence of Industry and Commerce was used to analyze

the impact of advertising spending on the financial performance of 10 Colombian companies with

information on the level of liabilities, total income and advertising, with which we worked using the method

multiple linear regression (dependent, independent variable) to determine the effect of these variables on

the ROA. In the results it was determined that there is a statistical relationship with a confidence level of

95%. It is concluded that Advertising does have a significant impact on the financial performance of the

companies studied.
7

Actividad 3. Ejercicio Práctico

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

b. Encuentre el coeficiente de determinación y correlación.

c. Determine el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es

confiable?

d. Determine el grado de relación de las dos variables.

3.3. Edad en años – Peso en kilogramos

Un nutricionista realizó un estudio donde desea encontrar un modelo matemático que permita determinar

la relación entre el Peso ideal en kilogramos y la Edad en años de un grupo de niños pertenecientes a una

EPS colombiana, para ello tomó una muestra al azar de 14 individuos, los resultados del estudio se

ilustran en la siguiente tabla:

a). Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Variable (X) Variable (Y)

Edad en años Pesos en kilogramos

10 40

14 55

12 45

8 39

9 45

7 35
8

8 38

10 42

12 43

11 42

10 39

6 29

5 25

7 38

Diagrama de Dispersión

Pesos en kilogramos en funcion a la edad en


años
60

50 f(x) = 2.54953429297206 x + 16.1507197290432


Pesos en kilogramos

R² = 0.816925375772998
40

30

20

10

0
4 6 8 10 12 14 16
Edad en años
9

b). Encuentre el coeficiente de determinación y correlación.

Coeficiente de Determinación 0,816925376

Coeficiente de Correlación 0,903839242

c). Determine el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es

confiable?

Modelo Matemático y = 2,5495x + 16,151

Confiabilidad R² * 100% = 82%

¿Es confiable?

El modelo matemático es y = 2,5495x + 16,151 y el coeficiente de determinación nos proporciona una

confiabilidad del 82%. Conforme a la tabla del grado de correlación lineal, establece que, cuando el

resultado es; 0,80<r<0,90, la correlación es aceptable. Lo cual, se interpreta que este modelo matemático

sí, es confiable.

d). Determine el grado de relación de las dos variables.

Grado de Relación: 0,903839242

La Relación entre las dos variables es una correlación lineal


10

positiva

Conforme al grado de correlación lineal encontrado en la tabla, se observa que el coeficiente de

correlación se determina como una correlación excelente, cuando: 0,90<r<1, lo cual se entiende que este

modelo matemático es confiable.

Actividad 4. Regresión y correlación Lineal Simple

Descripción de la Actividad:

A partir de la base de datos suministrada: Anexo 1- Indicadores de violencia contra la mujer en Colombia

para el periodo 2010 a 2021 (16-4), cada estudiante, deberá:

 Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas e identificar la variable dependiente e independiente.

 Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación

entre las variables.

 Determine al coeficiente de determinación y de correlación de las dos variables. Interprete

los resultados

 Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

 Determine el tipo de correlación de las dos variables.

 Relacionar la información obtenida con el problema.


11

Desarrollo del Ejercicio

a). Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e

identificar la variable dependiente e independiente.

 Identificación de las dos variables cuantitativas.

 Personas por hogar

 Edad

 Identificación de la variable dependiente e independiente.

Deseamos predecir la cantidad de personas por hogar en función a las edades

VARIABLE (X)   VARIABLE (Y)

INDEPENDIENTE DEPENDIENTE

PERSONAS POR HOGAR EDAD

4 5 3 3 8 5 27 24 45 54 41 21

5 4 4 5 5 5 10 45 43 26 43 18

3 4 3 5 9 3 30 34 28 19 24 46

4 3 6 6 10 4 32 34 24 10 44 57

4 4 3 12 4 3 26 26 22 28 14 59

4 5 4 1 7 5 34 35 25 10 56 14
12

5 6 3 2 4 6 23 14 42 56 65 55

4 6 5 4 5 3 24 28 34 15 57 43

6 7 6 4 6 4 25 29 55 34 34 25

3 8 6 5 4 2 20 19 19 25 27 26

4 8 3 9 7 3 54 32 52 32 20 67

5 5 4 4 5 4 43 15 51 37 18 25

4 4 4 3 6 4 78 34 26 39 54 24

3 5 3 6 4 5 55 43 55 22 27 42

4 3 7 4 7 6 26 27 25 40 19 65

7 5 6 4 3 5 43 45 30 46 53 13

4 3 2 8 5 3 15 18 47 23 35 23

5 6 4 5 4 4 20 22 50 13 28 18

2 6 5 4 3 4 44 56 56 48 17 20

4 7 6 7 6 5 42 27 55 22 36 75

5 5 3 5 5 6 41 55 23 20 20 43

4 4 3 6 6 5 28 35 54 13 27 43

3 4 5 4 6 4 16 17 34 26 14 22

6 6 5 3 4 6 49 37 18 48 39 45

7 4 4 6 8 7 18 65 44 43 32 22

4 7 5 5 5 4 76 22 18 49 50 56

5 5 7 8 6 4 28 27 33 68 24 54

9 4 5 5 7 5 44 19 64 18 45 43

3 7 4 6 3 3 43 39 34 56 43 25
13

4 8 6 7 7 6 54 26 12 54 12 45

b). Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las

variables.

Diagrama de dispersión

PERSONAS POR HOGAR EN FUNCION A LA EDAD


90

80

70

60

50
Edad

40
f(x) = − 0.382587425258199 x + 36.7733737996014
30 R² = 0.00168827541271199
20

10

0
0 2 4 6 8 10 12 14
Personas por hogar

c). Determine al coeficiente de determinación y de correlación de las dos variables. Interprete los

resultados

Coeficiente de Determinación R² = 0.0017


14

Coeficiente de Correlación R= 0,0411

Interpretación de los resultados

El resultado del coeficiente de determinación es de: 0,0017 en donde se interpreta que sí, aumenta las

personas por hogar, aumenta la edad. De igual manera, podemos decir que si, disminuye las personas por

hogar, disminuye la edad por personas en el hogar. En donde se determina que X y Y tienen una relación

directa.

El resultado del coeficiente de correlación es 0,0411, indica que es positivo, esto significa que la variable X

y Y están relacionados directamente. Por lo tanto, se interpreta que, personas por hogar (X) y la edad (Y)

se encuentran directamente asociados.

d). Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es

confiable?

Modelo Matemático y = -0,3826x + 36,773

Confiabilidad R² * 100% = 0,17%

¿Es confiable?

Se determina una proporción de confiabilidad de la investigación respecto al coeficiente de determinación

del 0,0017 * 100 = 0.17%. Es decir que, es confiable para predecir el efecto de una variable sobre la otra.
15

e). Determine el tipo de correlación de las dos variables.

La correlación entre las dos variables (personas por hogar y edad), es una correlación lineal negativa

directa, aunque el valor del modelo matemático y = -0,3826x + 36,773 es negativa, en función de la entre

las dos variables, de muestra una Correlación Mínima, porque el resultado del coeficiente de correlación

es del 0,0411.

f). Relacionar la información obtenida con el problema.

Se relaciona la información obtenida con el problema de estudio, en donde se determina una correlación

Mínima, porque el resultado del coeficiente de correlación es del 0,0411. Y según la tabla del grado de

correlación lineal, indica que, cuando el resultado de una investigación está entre: 0,30<r<0,60, es una

correlación minina. Por lo tanto, este modelo matemático y = -0,3826x + 36,773, se puede decir que es

confiable, por lo que, se puede hacer predicciones a futuras con estas dos variables.
16

Actividad 5. Regresión y correlación múltiple.

Descripción de la Actividad:

A partir de la base de datos suministrada “Anexo 1- Indicadores de violencia contra la mujer en Colombia

para el periodo 2010 a 2021 (16-4)”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del

estudio de investigación.

b. Realizar el diagrama de dispersión de dichas variables.

c. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación.

d. Relacionar la información obtenida con el problema.

Desarrollo del ejercicio.

a). Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del

estudio de investigación.

Independiente   Independiente   Dependiente

VARIABLE (X1) VARIABLE (X2) VARIABLE (Y)

CANTIDAD DE SERVICIOS TOTAL_VICTIMAS AÑO_DENUNCIA

PUBLICOS DISPONIBLES

EN EL HOGAR

4 6 0 5 13 2 1 648 201 2011 2012 2016

5 5 4 6 3 235 12 7 201 2015 2010 2015


17

7 0 7 6 12 192 19 2 202 2013 2015 2019

5 5 7 6 1 3 1 1 202 2015 2018 2010

4 5 7 5 839 5 36 17 201 2012 2016 2019

4 2 7 6 44 1 46 4 201 2016 2014 2021

4 3 7 6 1 33 60 1 201 2010 2016 2016

3 6 6 5 404 1 1 57 201 2018 2020 2018

2 2 5 5 239 539 2 14 201 2016 2021 2021

2 2 6 6 41 1 932 2 201 2014 2019 2019

4 1 7 6 12 347 6 3 201 2011 2017 2021

5 1 6 7 1 1 1 56 201 2017 2012 2021

4 2 7 6 1 30 2 644 201 2019 2011 2018

4
18

1 2 5 4 29 1 25 1 201 2016 2017 2021

7 2 7 4 215 5 2 1 201 2020 2020 2017

3 2 3 5 871 53 11 1 201 2013 2019 2015

0 7 7 5 16 5 199 19 201 2019 2021 2011

4 3 2 5 104 7 8 2 201 2019 2021 2018

3 2 6 5 1 869 11 1 201 2019 2018 2017

3 6 7 5 3 33 34 1 202 2015 2019 2014

3 2 7 1 273 343 5 102 201 2011 2021 2017

1 5 4 3 1 2 33 58 201 2014 2016 2016

6 2 2 0 2 2 2 25 201 2014 2012 2014

3 2 0 6 1 44 158 3 201 2019 2017 2017

5 5 7 5 1,041 6 1 6 201 2019 2011 2021


19

3 2 3 7 12 5 287 234 201 2020 2014 2015

2 2 2 5 4 2 1 9 202 2019 2017 2018

1 1 7 6 19 88 1 4 201 2020 2014 2016

4 2 6 5 9 6 175 152 201 2019 2021 2012

3 1 6 6 2 1 1 1 201 2015 2021 2013

3 1 4   41 12 4   201 2021 2016  

2 7 3 310 639 33 202 2021 2013

2 3 6 9 9 90 201 2017 2011

5 2 7 2 122 1 201 2018 2013

5 2 0 21 2 39 201 2010 2014

4 3 5 1 53 3 201 2011 2010

8
20

3 1 6 8 102 1 201 2018 2021

2 2 6 12 5 3 201 2021 2019

7 5 5 1 3 1 201 2018 2015

3 5 7 1 85 21 201 2020 2012

0 4 4 1 1 47 201 2017 2017

3 2 6 10 37 2 202 2020 2017

1 2 7 66 8 13 202 2019 2015

5 3 5 103 6 42 201 2015 2014

4 3 5 7 1 6 201 2020 2020

4 3 7 1 23 95 201 2013 2021

5 6 4 89 1 4 202 2016 2020

3 5 5 2 17 868 201 2014 2014


21

4 2 7 2 117 41 201 2012 2021

2 3 6 180 160 1 1 180 201 2019 2018 180

b). Realizar el diagrama de dispersión de dichas variables.

Diagrama de dispersión

Gráfico de probabilidad normal


2025
2020
2015
Y

2010
2005
2000
0 20 40 60 80 100 120
Muestra percentil

c). Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación.

Cálculo de la Recta de regresión  Coeficientes

Intercepción 2015,640366

Variable X 1 0,162321798

Variable X 2 -0,000445839
22

Y = 0,1623*X1-0,00044*X2+2015,64

Coeficiente de Correlación

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,100595205

Coeficiente de determinación R^2 0,010119395

R^2 ajustado -0,001065696

Error típico 3,359146045

Observaciones 180

d). Relacionar la información obtenida con el problema.

El análisis en función de la problemática objeto de estudio sobre los Indicadores de violencia contra la

mujer en Colombia para el periodo 2010 a 2021, en este contexto se encontraron que la variable X1,

Cantidad de servicios públicos disponibles en el hogar y la variable X2, total víctimas son las variables

independientes y estas variables están asociadas con los años de denuncia que es la variable Y.

Entonces podemos pronosticar para valores futuros teniendo en cuenta los años de denuncia, cuanto

aumentaran el total de víctimas, como también cuanto aumentaran la cantidad de servicios públicos

disponibles en el hogar en esta población de objeto de estudio.


23

Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o situación estudiada.

Los análisis de los resultados se realizaron a partir de la base de datos suministrada en el anexo 1 sobre

los indicadores de violencia contra la mujer en Colombia para el periodo 2010 a 2021. En donde se

identificaron dos variables cuantitativas para determinar la relación entre dos variables cuantitativa y se

encontró que la correlación es mínima, porque el resultado del coeficiente de correlación fue del 0,0411.

que, según la tabla del grado de correlación lineal, estipula que, cuando el resultado de una investigación

está entre: 0,30<r<0,60, la correlación es minina. por lo tanto, entre el número de personas por hogar y la

edad si hay relación, pero es mínima.

Por otro lado, la aplicación de Regresión y correlación múltiple al objeto de estudio, se identificaron las

variables para hallar las posibles relación ente la variable dependiente (año de denuncia) y las variables

independientes (cantidad de servicios públicos disponibles en el hogar y el total de víctimas) y se

determinó que si existe una relación estadísticamente significativa con un nivel de confianza del 90,0%, es

decir que las variables independientes “cantidad de servicios públicos disponibles en el hogar y el total de

víctimas” están asociadas con la variable dependiente “años de denuncia” y tienen mucha incidencia sobre

la violencia contra la mujer en Colombia, que si afecta de manera directa estas variables con el problema

identificado, en la cual podemos determinar que si aumentan la cantidad de servicios públicos en el hogar

y el total de víctimas aumentan los años de denuncia contra la mujer en Colombia para el periodo 2010 a

2021.
24

Conclusiones

En un primer momento podemos decir que se llegó al 100% del cumplimiento sobre el

desarrollo de los ejercicios planteados en la guía de actividades del paso 4 descripción de la

información del curso de estadística descriptiva.

Por otro lado, podemos decir que se aprendieron los conocimientos suficientes sobre

como poder aplicar y calcular las medidas estadísticas bivariantes y determinar el análisis de

correlación lineal simple y la correlación lineal múltiple de las variables seleccionada en el objeto

de estudio y a su vez poder hacer la interpretación o la predicción futura, si existe o no una

relación entre una o dos variables.


25

Referencias Bibliográficas.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:

Cengage Learning. (pp-675–686).

https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/131880

https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722

https://link.gale.com/apps/doc/CX4058900232/GVRL?u=unad&sid=GVRL&xid=a2479593

Martínez, C. (2013). Capítulo 12. Regresión y Correlación. En: Estadística y muestreo, 13a

ed. [Online] Bogotá: Ecoe Ediciones. (pp 570 – 582).

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico

Nacional. (pp 21-29).

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 130 – 158).

https://link.gale.com/apps/doc/CX4052100011/GVRL?u=unad&sid=GVRL&xid=696103db

Ortegón Pava, M. (2020). OVI. Medidas Bivariantes - Regresión lineal Múltiple.

https://repository.unad.edu.co/handle/10596/35464

También podría gustarte