Está en la página 1de 20

Paso 4 Descripción de la Información

Shaira Carolina Borrego Santiago

Cod: 1003123477

202107095- Estadística Descriptiva

Tutor: Betsy Josefina Rodríguez Rivera

Universidad Nacional Abierta y a Distancia – UNAD

Escuela de Ciencias Sociales Artes y Humanidades - ECSAH

2023
Introducción
En el siguiente trabajo el lector podrá adentrarse en el desarrollo de las medidas de

estadística descriptiva para el desenlace de resolver el paso 4; descripción de la información, la

estadística ha jugado un papel importante al momento de la implementación de la recolección de

datos para diversos fines, como podría ser estudios, análisis y demás para artículos científicos,

revistas o datos varios de información, ordenar o recoger datos, etc.

De manera que para resolver esta parte de la actividad fue de suma importancia poder

comprender la estadística por sus medidas bivariantes de regresión y correlación, en el siguiente

trabajo se representará sus medidas en un mapa conceptual, se definirán conceptos para la mayor

obtención de información de lo que se va a realizar en este trabajo, se presentarán diagramas de

dispersión ilustrando la información obtenida, se obtendrán el coeficiente de determinación,

correlación, se obtendrá el modelo matemático y la relación que hay entre ellas.


Justificación

Este trabajo es de mayor importancia porque nos permite reconocer las medidas bivariantes en

estadística descriptiva, sacar de dicha información un montón de datos valiosos para poder dar

una posible conclusión sobre el resultado de la información sobre cual estamos trabajando. Nos

permite comprender y describir las características de una variable proporcionándonos

información valiosa para la toma de decisiones y la interpretación de los resultados.


Objetivos

Objetivo General

Entender, analizar y recolectar datos mediante un conjunto de información utilizando diferentes

medidas y técnicas estadísticas bivariantes de regresión y correlación.

Objetivos específicos

 Analizar el resultado obtenido por medio de diagramas de dispersión.

 Identificar los conceptos básicos de las medidas bivariantes.

 Calcular el coeficiente de regresión y correlación.


Actividades

Actividad 1. Mapa mental

Figura 1

https://www.canva.com/design/DAF1beHairc/xILPBrvSPoikvjonacucDQ/edit?
utm_content=DAF1beHairc&utm_campaign=designshare&utm_medium=link2&utm_source=sha
rebutton
Actividad 2. Definición de conceptos

Tabla 1

Definición de conceptos básicos de medidas bivariantes

Conceptos Valor

Interpretación

El diagrama de dispersión permite analizar si existe algún tipo de

relación entre dos variables. Por ejemplo, puede ocurrir que dos

variables estén relacionadas de manera que, al aumentar el valor de

una, se incremente el de la otra. En este caso hablaríamos de la


Diagrama de
existencia de una correlación positiva.
dispersión
También puede ocurrir que al producirse una en un sentido, la otra

derive en el sentido contrario; por ejemplo, al aumentar el valor de la

variable x, se reduzca el de la variable y. Entonces, se estaría ante una

correlación negativa. Si los valores de ambas variables se revelan

independientes entre sí, se afirmaría que no existe correlación.

La correlación simple indica el grado o la cercanía de la relación entre


Correlación lineal
las dos variables, expresado en términos de un coeficiente de
simple
correlación que aporta una medida indirecta de la variabilidad de los

puntos en torno de la mejor línea de ajuste.


Es un modelo estadístico versátil para evaluar las relaciones entre un

destino continuo y los predictores.

Los predictores pueden ser campos continuos, categóricos o derivados,

Correlación lineal de modo que las relaciones no lineales también estén soportadas. El

múltiple modelo es lineal porque consiste en términos de aditivos en los que

cada término es un predictor que se multiplica por un coeficiente

estimado. El término de constante (intercepción) también se añade

normalmente al modelo.

La regresión lineal se utiliza para generar conocimientos para los

gráficos que contienen al menos dos campos continuos con uno

identificado como el destino y el otro como un predictor.

Es la proporción de la varianza total de la variable explicada por la

regresión. Es también denominado R cuadrado y sirve para reflejar la

bondad del ajuste de un modelo a la variable que se pretende explicar.

Coeficiente de El coeficiente de determinación puede adquirir resultados que oscilan

determinación (R2) entre 0 y 1. Así, cuando adquiere resultados más cercanos a 1, mayor

resultará el ajuste del modelo a la variable que se pretende aplicar para

el caso en concreto. Por el contrario, cuando adquiere resultados que se

acercan al valor 0, menor será el ajuste del modelo a la variable que se

pretende aplicar y, justo por eso, resultará dicho modelo menos fiable.
Aparte de la correlación positiva, en estadística dos variables también

pueden tener una correlación negativa o nula. Así pues, en este

apartado veremos en qué se distinguen estos tres tipos de correlación.

Correlación positiva: una variable aumenta cuando la otra también

aumenta. El valor del coeficiente de correlación está entre 0 (no

incluido) y 1 (incluido).

Correlación positiva Correlación negativa: cuando una variable aumenta la otra disminuye, y

y negativa al revés, si una variable disminuye la otra aumenta. El valor del

coeficiente de correlación está entre -1 (incluido) y 0 (no incluido).

El coeficiente de correlación lineal es una medida de regresión que

sirve para establecer una relación lineal entre dos variables. De esta
Coeficiente de
manera, su cálculo permite conocer con exactitud el grado de
correlación lineal
dispersión de los valores de una variable en relación con una media

para dicha variable.

Fuente. Autor
Actividad 3. Ejercicio práctico

Enunciado del ejercicio 3.x.

Figura 2

Diagrama de dispersión para Azúcar-Glicemia

Variable dependiente: Y Glicemia

Variedad independiente: X Azúcar

X (Azúcar) Y (Glicemia)

(mg/L) (mg/dL)

1,5 81

2,3 88

3,5 89

4,1 105

4,4 110

4,6 121

4,9 149
Tipo de asociación entre las variables:

El tipo de asociación que encontramos es directo porque cuando una magnitud aumenta esta

también aumenta, o cuando está disminuyendo esta también disminuye, en este caso está

aumentando porque a medida que aumenta el azúcar la glicemia también.

Coeficiente de determinación y correlación:

R cuadrado coeficiente de determinación es: 90%

Coeficiente de correlación: R2: 0.9085: 0.95

Modelo matemático y confiabilidad:

Y: 10.393x+64.571

R2: 0.9085
Se puede decir que como el valor de R es 0.9085 se acerca a uno, el modelo es confiable y este

valor se multiplicaría por 100 para que, del resultado de fiabilidad en este caso, 0.90*100: 90%;

el resultado de fiabilidad es de 90%.

Grado de relación entre las dos variables:

Tiene una relación lineal positiva

Calcular cuál será la correlación de las lecturas de glicemia respecto a la ingesta de azúcar:

Coeficiente correlación es un valor que se mueve entre menos uno y uno, y este dio 0,90 la cual

podemos determinar que hay una correlación excelente entre la glicemia y el azúcar para los 7

voluntarios que se presenta.


Actividad 4. Regresión y Correlación Lineal Simple

Problemática de estudio

Caracterización del embarazo adolescente, en el Departamento de Caldas entre el año 2014 y

2021

Variables cuantitativas (2) que tengan relación _Talla y peso

Variable dependiente: Peso

Variable independiente: Talla

Figura 3

Diagrama de dispersión para las variables talla y peso


Tipo de asociación entre las variables:

En este caso el tipo de asociación entre las variables es directo ya que a medida que aumenta la

talla del recién nacido también aumenta el peso.

Coeficiente de determinación y correlación:

Coeficiente de determinación es de 6%

Coeficiente de correlación: R2 0.06: 0.24

Modelo matemático y confiabilidad:

Y: 0.10x-1.79

R2: 0.06
Se puede decir que como el valor de R es 0,06 no se acerca a uno por lo que el modelo no es

confiable y ese valor se multiplicaría por 100 que daría un 6% de fiabilidad

Grado de relación entre las dos variables:

Relación lineal positiva

Relación de la información obtenida con la problemática abordada:

Si hay relación porque el resultado es menos que 0,05. Al principio obviamente sabíamos que

entre esas dos variables había mucha relación, pero estadísticamente se comprueba que no hay

correlación entre las variables y el modelo matemático no es nada confiable porque solo esta

reflejando el 6% de lo que realmente pasa con todos esos datos.


Actividad 5. Regresión y Correlación Lineal Múltiple

Problemática de estudio

Caracterización del embarazo adolescente, en el Departamento de Caldas entre el año 2014 y

2021.

Variables cuantitativas (3) que tengan relación Talla, peso y número de hijos vivos

Variable dependiente (1) peso

Variables independientes (2) talla e hijos vivos

Figura 4

Diagrama de dispersión para las variables hijos vivos y talla


Tipo de asociación entre las variables

Tipo de Estos datos se comportan de manera normal, aunque haya datos afuera de la líneas

inferior y superior la mayoría estaba dentro.

Coeficiente de determinación y correlación:

Coeficiente de determinación: 7%

Coeficiente de correlación: R2: 0,07: 0.26

Modelo matemático y confiabilidad

Y: 0.25x1+0.09x2-1.94
R2: 0.07, 7%

Se puede decir que el valor R es 0,07 lo cual está super lejos de llegar a uno por lo que no tiene

correlación, para encontrar la fiabilidad se multiplicó 0,07 por 100 y el resultado dio un 7% de

fiabilidad.

Grado de relación entre las dos variables:

Lineal positiva

Relación de la información obtenida con la problemática abordada:

A partir de la regresión múltiple encontramos que, si existe una relación entre la talla con los

hijos nacidos con el peso de bebes nacidos, el modelo matemático es ese, es confiable tal por

ciento del coeficiente encontramos que es excelente el p afirma que si hay relación.

A partir de esa información se concluyó, se escogieron esas 3 variantes en cuanto a la

problemática estudiada, dos de ellas son independiente es la talla y los hijos vivos y una es

dependiente que es el peso.


Análisis

De acuerdo con el análisis estadístico realizado en el punto 3 ejercicio práctico, en donde nos

presentaron dos variables cuantitativas las cuales una de ella es dependiente (Glicemia) y la otra

independiente (Azúcar) pudimos ver que el coeficiente de relación entre estas dos variables fue

0,90 lo cual se encuentra en una correlación excelente, por lo tanto, si es confiable.

En el punto 4 realizamos un análisis de regresión y correlación lineal simple, en la cual

escogimos una variable cuantitativa independiente (Talla) y una dependiente (Peso) de el anexo

con el que hemos venido trabajando “. Caracterización del embarazo adolescente, en el

Departamento de Caldas entre el año 2014 y 2021”. El cual estadísticamente pudimos encontrar

que en estas dos variables no hay correlación por lo tanto el modelo matemático es poco fiable

pero estas variables si tienen mucha relación entre sí.

En el punto 5 realizamos análisis de regresión y correlación múltiple en donde escogimos una

variante dependiente (Peso) y dos independientes (Talla e hijos vivos) la cual se pudo concluir

que los hijos vivos influyen mucho más en el resultado final que la talla, y dio poca correlación

y una fiabilidad no confiable, pero al final si hubo relación entre estas variables.
Conclusiones

Podemos concluir que la estadística desarrolla una labor imprescindible ene le área de la

investigación, por lo tanto, es muy importante analizar, entender, comprender y llevara nuestro

día a día las amplias comprensiones que desarrollamos a diario.

En el anterior estudio pudimos observar que las medidas bivariantes de la tasa de adolescentes

embarazadas en el departamento de Cali en el año 2014 y 2021. Este trabajo fue de suma

importancia para aprender sobre las medidas bivariantes, diferenciarlas y ponerlas en práctica

con esos ejercicios, poder realizar gráficas, sacar información valiosa de esos datos obtenidos y

poder dar conclusiones nos hace desarrollar mejor las habilidades cognitivas.
Referencias

Consultores, A. (2023, 26 octubre). Diagrama de dispersión: relación entre variables. Aiteco

Consultores. https://www.aiteco.com/diagrama-de-dispersion/

IBM documentation. (s. f.). https://www.ibm.com/docs/es/cognos analytics/11.1.0?topic=tests-

múltiple-linear-regression

Software DELSOL. (2019, 3 junio). ▷ Coeficiente de determinación ¿Qué es? Software del Sol.
https://www.sdelso
l.com/glosario/coeficiente-de-determinacion/

Software DELSOL. (2021, 21 septiembre). ▷ Coeficiente de correlación lineal ¿Qué es?

Software del Sol.

https://www.sdelsol.com/glosario/coeficiente-de-correlacion-

lineal/#:~:text=El%20coeficiente%20de%20correlaci%C3%B3n%20lineal%20es%20una%20me

dida%20de%20regresi%C3%B3n,una%20media%20para%20dicha%20variable

También podría gustarte