Está en la página 1de 25

1

ESTADISTICA DESCRIPTIVA

Paso 4

Descripción de la Información

Elaborado por:

Liliana Contreras González

Código: 1143124486

Director/Tutor:

José Fernando Velandia Tacuma

Grupo: 204040_25

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

Fecha: noviembre, 2022


2

Introducción

En el presente trabajo desarrollamos los ejercicios del paso 4 denominado

descripción de la información que tiene como objeto la aplicación de las medidas

estadísticas bivariantes, por medio del cálculo e interpretación de un software estadístico,

en función de la problemática objeto de estudio.

Los ejercicios del paso cuatro se desarrollaron en 5 momentos; la primera

consistió en la construcción de un cuadro sinóptico donde se evidencie los conceptos y/o

definiciones y sus aplicaciones de las medidas estadísticas Bivariantes de regresión y

correlación. El segundo momento se realizó la aplicación de regresión y correlación a

partir de una articulo académico o científico. El tercer momento se desarrolló ejercicios

prácticos de aplicación sobre la temática, el cuarto momento se realizaron el ejercicio

sobre la Regresión y correlación Lineal Simple, a partir de la base de datos suministrada

del Anexo 1 sobre los Indicadores de violencia contra la mujer en Colombia para el

periodo 2010 a 2021 (16-4) y el quinto momento correspondió a la aplicación de la

Regresión y correlación múltiple, para identificar una variable cuantitativa dependiente e

independientes del estudio de investigación, en realizar un diagrama de dispersión de

dichas variables, en calcular la recta de regresión y el coeficiente de correlación para

probar estadísticamente su relación y finalmente poder relacionar toda la información

obtenidas en los resultados con el problema objeto de estudio.


3

Justificación.

El presente trabajo tiene como propósito desarrollar los ejercicios planteados en

este paso 4 descripción de la información, a partir de los conocimientos previos sobre los

contenidos de la unidad tres de regresión y determinación, para poderlos aplicar de

manera teórico practico en el caso objeto de estudio suministrado en la base de datos del

Anexo 1 sobre los indicadores de violencia contra la mujer en Colombia para el periodo

2010 a 2021 (16-4).

En ese sentido la aplicación de la temática vista en la unidad se lograron

determinar la relación entre una variable dependiente y variables independientes y si es

posible predecir el valor de una de ellas en función de la otra. En ese sentido podemos

decir que el análisis de correlación y de regresión son de uso frecuente en una

investigación sobre una población para poder estudiar la relación entre dos o más

variables y medir la cercanía de relación entre las variables.

De igual forma, es indispensable entender que la variable dependiente e

independiente son dos variables que se pueden utilizar en cualquier experimento o

investigación y pueden ser vistas como la causa, la variable independiente y el efecto, la

variable dependiente.
4

Objetivos.

General

➢ Aplicar técnicas y herramientas de estadísticas para identificar variables

dependiente e independiente, a partir de las medias estadísticas bivariantes de

regresión y correlación para caso de estudio.

Específicos

➢ Determinar la relación entre dos variables cuantitativa

➢ Hallar e interpretar la correlación lineal simple de las dos variables cuantitativas

➢ Calcular e interpretar la correlación lineal múltiple de las variables cuantitativas


5

Cuadro Sinóptico:
6

Actividad 2. Aplicación de Regresión y Correlación

Descripción de la Actividad:

A partir de la lectura de un artículo internacional (académico o científico), en el cual se implemente

un modelo de regresión o análisis de correlación, el estudiante deberá realizar un breve resumen

compuesto por mínimo 100 palabras en inglés, donde destaque, objetivos, resultados y

conclusiones del artículo.

STATISTICAL ESTIMATION OF THE RELATIONSHIP BETWEEN ADVERTISING

EXPENSES AND THEIR IMPACT ON FINANCIAL PERFORMANCE

In this investigation, information from the Superintendence of Industry and Commerce was used

to analyze the impact of advertising spending on the financial performance of 10 Colombian

companies with information on the level of liabilities, total income and advertising, with which we

worked using the method multiple linear regression (dependent, independent variable) to

determine the effect of these variables on the ROA. In the results it was determined that there is a

statistical relationship with a confidence level of 95%. It is concluded that Advertising does have

a significant impact on the financial performance of the companies studied.


7

Actividad 3. Ejercicio Práctico

En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a continuación;

posterior a ello compartirá su elección en el foro del entorno de Aprendizaje Foro de discusión

Unidad 3- Paso 4 Descripción de la Información. En cada ejercicio deberá responder los siguientes

interrogantes:

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

b. Encuentre el coeficiente de determinación y correlación.

c. Determine el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

d. Determine el grado de relación de las dos variables.

3.3. Edad en años – Peso en kilogramos

Un nutricionista realizó un estudio donde desea encontrar un modelo matemático que permita

determinar la relación entre el Peso ideal en kilogramos y la Edad en años de un grupo de niños

pertenecientes a una EPS colombiana, para ello tomó una muestra al azar de 14 individuos, los

resultados del estudio se ilustran en la siguiente tabla:


8

a). Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Variable (X) Variable (Y)

Edad en años Pesos en kilogramos

10 40

14 55

12 45

8 39

9 45

7 35

8 38

10 42

12 43

11 42

10 39

6 29

5 25

7 38
9

Diagrama de Dispersión

PESOS EN KILOGRAMOS EN FUNCION A


LA EDAD EN AÑOS
60
y = 2,5495x + 16,151
50
Pesos en kilogramos

R² = 0,8169
40

30

20

10

0
0 2 4 6 8 10 12 14 16
Edad en años

b). Encuentre el coeficiente de determinación y correlación.

Coeficiente de Determinación 0,816925376

Coeficiente de Correlación 0,903839242

c). Determine el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

Modelo Matemático y = 2,5495x + 16,151


10

Confiabilidad R² * 100% = 82%

¿Es confiable?

El modelo matemático es y = 2,5495x + 16,151 y el coeficiente de determinación nos proporciona

una confiabilidad del 82%. Conforme a la tabla del grado de correlación lineal, establece que,

cuando el resultado es; 0,80<r<0,90, la correlación es aceptable. Lo cual, se interpreta que este

modelo matemático sí, es confiable.

d). Determine el grado de relación de las dos variables.

Grado de Relación: 0,903839242

La Relación entre las dos variables es una correlación

lineal positiva

Conforme al grado de correlación lineal encontrado en la tabla, se observa que el coeficiente de

correlación se determina como una correlación excelente, cuando: 0,90<r<1, lo cual se entiende

que este modelo matemático es confiable.


11

Actividad 4. Regresión y correlación Lineal Simple

Descripción de la Actividad:

A partir de la base de datos suministrada: Anexo 1- Indicadores de violencia contra la mujer en

Colombia para el periodo 2010 a 2021 (16-4), cada estudiante, deberá:

➢ Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas e identificar la variable dependiente e independiente.

➢ Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación

entre las variables.

➢ Determine al coeficiente de determinación y de correlación de las dos variables.

Interprete los resultados

➢ Encuentre el modelo matemático que permite predecir el efecto de una variable sobre

la otra. ¿Es confiable?

➢ Determine el tipo de correlación de las dos variables.

➢ Relacionar la información obtenida con el problema.


12

Desarrollo del Ejercicio

a). Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas e identificar la variable dependiente e independiente.

❖ Identificación de las dos variables cuantitativas.

− Personas por hogar

− Edad

❖ Identificación de la variable dependiente e independiente.

Deseamos predecir la cantidad de personas por hogar en función a las edades

VARIABLE (X) VARIABLE (Y)

INDEPENDIENTE DEPENDIENTE

PERSONAS POR HOGAR EDAD

4 5 3 3 8 5 27 24 45 54 41 21

5 4 4 5 5 5 10 45 43 26 43 18

3 4 3 5 9 3 30 34 28 19 24 46

4 3 6 6 10 4 32 34 24 10 44 57

4 4 3 12 4 3 26 26 22 28 14 59

4 5 4 1 7 5 34 35 25 10 56 14

5 6 3 2 4 6 23 14 42 56 65 55
13

4 6 5 4 5 3 24 28 34 15 57 43

6 7 6 4 6 4 25 29 55 34 34 25

3 8 6 5 4 2 20 19 19 25 27 26

4 8 3 9 7 3 54 32 52 32 20 67

5 5 4 4 5 4 43 15 51 37 18 25

4 4 4 3 6 4 78 34 26 39 54 24

3 5 3 6 4 5 55 43 55 22 27 42

4 3 7 4 7 6 26 27 25 40 19 65

7 5 6 4 3 5 43 45 30 46 53 13

4 3 2 8 5 3 15 18 47 23 35 23

5 6 4 5 4 4 20 22 50 13 28 18

2 6 5 4 3 4 44 56 56 48 17 20

4 7 6 7 6 5 42 27 55 22 36 75

5 5 3 5 5 6 41 55 23 20 20 43

4 4 3 6 6 5 28 35 54 13 27 43

3 4 5 4 6 4 16 17 34 26 14 22

6 6 5 3 4 6 49 37 18 48 39 45

7 4 4 6 8 7 18 65 44 43 32 22

4 7 5 5 5 4 76 22 18 49 50 56

5 5 7 8 6 4 28 27 33 68 24 54

9 4 5 5 7 5 44 19 64 18 45 43

3 7 4 6 3 3 43 39 34 56 43 25

4 8 6 7 7 6 54 26 12 54 12 45
14

b). Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación

entre las variables.

Diagrama de dispersión

PERSONAS POR HOGAR EN FUNCION A LA


EDAD
90

80

70

60

50 y = -0,3826x + 36,773
Edad

40 R² = 0,0017

30

20

10

0
0 2 4 6 8 10 12 14
Personas por hogar

c). Determine al coeficiente de determinación y de correlación de las dos variables. Interprete

los resultados

Coeficiente de Determinación R² = 0.0017


15

Coeficiente de Correlación R= 0,0411

Interpretación de los resultados

El resultado del coeficiente de determinación es de: 0,0017 en donde se interpreta que sí, aumenta

las personas por hogar, aumenta la edad. De igual manera, podemos decir que si, disminuye las

personas por hogar, disminuye la edad por personas en el hogar. En donde se determina que X y

Y tienen una relación directa.

El resultado del coeficiente de correlación es 0,0411, indica que es positivo, esto significa que la

variable X y Y están relacionados directamente. Por lo tanto, se interpreta que, personas por hogar

(X) y la edad (Y) se encuentran directamente asociados.

d). Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

Modelo Matemático y = -0,3826x + 36,773

Confiabilidad R² * 100% = 0,17%

¿Es confiable?

Se determina una proporción de confiabilidad de la investigación respecto al coeficiente de

determinación del 0,0017 * 100 = 0.17%. Es decir que, es confiable para predecir el efecto de una

variable sobre la otra.


16

e). Determine el tipo de correlación de las dos variables.

La correlación entre las dos variables (personas por hogar y edad), es una correlación lineal

negativa directa, aunque el valor del modelo matemático y = -0,3826x + 36,773 es negativa, en

función de la entre las dos variables, de muestra una Correlación Mínima, porque el resultado del

coeficiente de correlación es del 0,0411.

f). Relacionar la información obtenida con el problema.

Se relaciona la información obtenida con el problema de estudio, en donde se determina una

correlación Mínima, porque el resultado del coeficiente de correlación es del 0,0411. Y según la

tabla del grado de correlación lineal, indica que, cuando el resultado de una investigación está

entre: 0,30<r<0,60, es una correlación minina. Por lo tanto, este modelo matemático y = -0,3826x

+ 36,773, se puede decir que es confiable, por lo que, se puede hacer predicciones a futuras con

estas dos variables.


17

Actividad 5. Regresión y correlación múltiple.

Descripción de la Actividad:

A partir de la base de datos suministrada “Anexo 1- Indicadores de violencia contra la mujer en

Colombia para el periodo 2010 a 2021 (16-4)”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes

del estudio de investigación.

b. Realizar el diagrama de dispersión de dichas variables.

c. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su

relación.

d. Relacionar la información obtenida con el problema.

Desarrollo del ejercicio.

a). Identificar una variable cuantitativa dependiente y varias variables cuantitativas

independientes del estudio de investigación.

Independiente Independiente Dependiente

VARIABLE (X1) VARIABLE (X2) VARIABLE (Y)

CANTIDAD DE TOTAL_VICTIMAS AÑO_DENUNCIA

SERVICIOS

PUBLICOS
18

DISPONIBLES EN EL

HOGAR

4 6 0 5 13 2 1 648 2010 2011 2012 2016

5 5 4 6 3 235 12 7 2011 2015 2010 2015

7 0 7 6 12 192 19 2 2021 2013 2015 2019

5 5 7 6 1 3 1 1 2020 2015 2018 2010

4 5 7 5 839 5 36 17 2011 2012 2016 2019

4 2 7 6 44 1 46 4 2015 2016 2014 2021

4 3 7 6 1 33 60 1 2014 2010 2016 2016

3 6 6 5 404 1 1 57 2019 2018 2020 2018

2 2 5 5 239 539 2 14 2017 2016 2021 2021

2 2 6 6 41 1 932 2 2012 2014 2019 2019

4 1 7 6 12 347 6 3 2014 2011 2017 2021

5 1 6 7 1 1 1 56 2012 2017 2012 2021

4 2 7 6 1 30 2 644 2014 2019 2011 2018

1 2 5 4 29 1 25 1 2016 2016 2017 2021

7 2 7 4 215 5 2 1 2019 2020 2020 2017

3 2 3 5 871 53 11 1 2014 2013 2019 2015

0 7 7 5 16 5 199 19 2017 2019 2021 2011

4 3 2 5 104 7 8 2 2012 2019 2021 2018

3 2 6 5 1 869 11 1 2014 2019 2018 2017

3 6 7 5 3 33 34 1 2021 2015 2019 2014

3 2 7 1 273 343 5 102 2012 2011 2021 2017


19

1 5 4 3 1 2 33 58 2012 2014 2016 2016

6 2 2 0 2 2 2 25 2014 2014 2012 2014

3 2 0 6 1 44 158 3 2016 2019 2017 2017

5 5 7 5 1,041 6 1 6 2019 2019 2011 2021

3 2 3 7 12 5 287 234 2019 2020 2014 2015

2 2 2 5 4 2 1 9 2021 2019 2017 2018

1 1 7 6 19 88 1 4 2015 2020 2014 2016

4 2 6 5 9 6 175 152 2014 2019 2021 2012

3 1 6 6 2 1 1 1 2012 2015 2021 2013

3 1 4 41 12 4 2016 2021 2016

2 7 3 310 639 33 2021 2021 2013

2 3 6 9 9 90 2019 2017 2011

5 2 7 2 122 1 2019 2018 2013

5 2 0 21 2 39 2019 2010 2014

4 3 5 1 53 3 2018 2011 2010

3 1 6 8 102 1 2011 2018 2021

2 2 6 12 5 3 2017 2021 2019

7 5 5 1 3 1 2012 2018 2015

3 5 7 1 85 21 2016 2020 2012

0 4 4 1 1 47 2011 2017 2017

3 2 6 10 37 2 2021 2020 2017

1 2 7 66 8 13 2021 2019 2015

5 3 5 103 6 42 2010 2015 2014


20

4 3 5 7 1 6 2015 2020 2020

4 3 7 1 23 95 2017 2013 2021

5 6 4 89 1 4 2020 2016 2020

3 5 5 2 17 868 2014 2014 2014

4 2 7 2 117 41 2019 2012 2021

2 3 6 180 160 1 1 180 2011 2019 2018 180

b). Realizar el diagrama de dispersión de dichas variables.

Diagrama de dispersión

GRÁFICO DE PROBABILIDAD NORMAL


2025

2020

2015
Y

2010

2005
0 20 40 60 80 100 120
Muestra percentil
21

c). Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente

su relación.

Cálculo de la Recta de regresión Coeficientes

Intercepción 2015,640366

Variable X 1 0,162321798

Variable X 2 -0,000445839

Y = 0,1623*X1-0,00044*X2+2015,64

Coeficiente de Correlación

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,100595205

Coeficiente de determinación R^2 0,010119395

R^2 ajustado -0,001065696

Error típico 3,359146045

Observaciones 180
22

d). Relacionar la información obtenida con el problema.

El análisis en función de la problemática objeto de estudio sobre los Indicadores de violencia

contra la mujer en Colombia para el periodo 2010 a 2021, en este contexto se encontraron que la

variable X1, Cantidad de servicios públicos disponibles en el hogar y la variable X2, total víctimas

son las variables independientes y estas variables están asociadas con los años de denuncia que es

la variable Y.

Entonces podemos pronosticar para valores futuros teniendo en cuenta los años de denuncia,

cuanto aumentaran el total de víctimas, como también cuanto aumentaran la cantidad de servicios

públicos disponibles en el hogar en esta población de objeto de estudio.


23

Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o

situación estudiada.

Los análisis de los resultados se realizaron a partir de la base de datos suministrada en el anexo 1

sobre los indicadores de violencia contra la mujer en Colombia para el periodo 2010 a 2021. En

donde se identificaron dos variables cuantitativas para determinar la relación entre dos variables

cuantitativa y se encontró que la correlación es mínima, porque el resultado del coeficiente de

correlación fue del 0,0411. que, según la tabla del grado de correlación lineal, estipula que, cuando

el resultado de una investigación está entre: 0,30<r<0,60, la correlación es minina. por lo tanto,

entre el número de personas por hogar y la edad si hay relación, pero es mínima.

Por otro lado, la aplicación de Regresión y correlación múltiple al objeto de estudio, se

identificaron las variables para hallar las posibles relación ente la variable dependiente (año de

denuncia) y las variables independientes (cantidad de servicios públicos disponibles en el hogar y

el total de víctimas) y se determinó que si existe una relación estadísticamente significativa con un

nivel de confianza del 90,0%, es decir que las variables independientes “cantidad de servicios

públicos disponibles en el hogar y el total de víctimas” están asociadas con la variable dependiente

“años de denuncia” y tienen mucha incidencia sobre la violencia contra la mujer en Colombia, que

si afecta de manera directa estas variables con el problema identificado, en la cual podemos

determinar que si aumentan la cantidad de servicios públicos en el hogar y el total de víctimas

aumentan los años de denuncia contra la mujer en Colombia para el periodo 2010 a 2021.
24

Conclusiones

En un primer momento podemos decir que se llegó al 100% del cumplimiento

sobre el desarrollo de los ejercicios planteados en la guía de actividades del paso 4

descripción de la información del curso de estadística descriptiva.

Por otro lado, podemos decir que se aprendieron los conocimientos suficientes

sobre como poder aplicar y calcular las medidas estadísticas bivariantes y determinar el

análisis de correlación lineal simple y la correlación lineal múltiple de las variables

seleccionada en el objeto de estudio y a su vez poder hacer la interpretación o la

predicción futura, si existe o no una relación entre una o dos variables.


25

Referencias Bibliográficas.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México

City: Cengage Learning. (pp-675–686).

https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/131880

https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722

https://link.gale.com/apps/doc/CX4058900232/GVRL?u=unad&sid=GVRL&xid=

a2479593

Martínez, C. (2013). Capítulo 12. Regresión y Correlación. En: Estadística y

muestreo, 13a ed. [Online] Bogotá: Ecoe Ediciones. (pp 570 – 582).

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto

Politécnico Nacional. (pp 21-29).

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp

130 – 158).

https://link.gale.com/apps/doc/CX4052100011/GVRL?u=unad&sid=GVRL&xid=69610

3db

Ortegón Pava, M. (2020). OVI. Medidas Bivariantes - Regresión lineal Múltiple.

https://repository.unad.edu.co/handle/10596/35464

También podría gustarte