Está en la página 1de 9

lOMoARcPSD|13838149

Paso4 Rafael Granados

estadística descriptiva (Universidad Nacional Abierta y a Distancia)

Studocu is not sponsored or endorsed by any college or university


Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)
lOMoARcPSD|13838149

PASO 4: Descripción de la información

PRESENTADO POR:
RAFAEL ANDRES GRANADOS
CC: 1.110.560.090

GRUPO No. 100105_30

Director de Curso:
Melissa Carolina Patiño

Universidad Nacional Abierta y a Distancia – UNAD


Escuela Ciencias básicas, tecnología e ingeniería
Programa Ingeniería de Sistemas
Periodo 16-02
Colombia
2022

Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)


lOMoARcPSD|13838149

Introducción

El siguiente trabajo consiste en un análisis de regresión y correlación lineal para


encontrar la relación que existe entre dos variables cuantitativas seleccionadas, teniendo en
cuenta la información de la base de datos que hemos venido manejando en actividades
anteriores. Asimismo, se describen conceptos relacionados con el tema en estudio: ej: ¿qué es
un coeficiente lineal y qué nos puede ayudar a medir? ¿O cuál es el coeficiente de determinación
R2? Entre otros conceptos importantes, nos permiten desarrollar temas apropiados, practicarlos,
comprenderlos y analizarlos.

Justificación
Esta actividad es realizada en orden de cumplir con los lineamientos establecidos en el
plan de estudios del presente curso y es necesario para adquirir las nociones fundamentales de
los conceptos que serán tratados en el desarrollo del curso.

Objetivos

• Entender los conceptos básicos de Regresión y Correlación lineal.


• Realizar el diagrama de dispersión y determine el tipo de asociación entre las variables.
• Encontrar el coeficiente de determinación y correlación.
• Determinar el grado de relación entre dos variables.
• Determine el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)


lOMoARcPSD|13838149

Actividad 1.
Mapa Mental

Link mapa mental: https://mm.tt/2298624507?t=1x79y7icp9

Actividad 2. Definición de conceptos

Diagrama de dispersión:

Un diagrama de dispersión o gráfica de dispersión o gráfico de burbujas es un tipo de


diagrama matemático que utiliza las coordenadas cartesianas para mostrar los
valores de dos variables para un conjunto de datos. Se emplea cuando una o
varias variables está bajo el control del experimentador. Si existe un parámetro
que se incrementa o disminuye de forma sistemática por el experimentador, se le
denomina parámetro de control o variable independiente y habitualmente se representa a
lo largo del eje horizontal (eje de las abscisas). La variable medida o
dependiente usualmente se representa a lo largo del eje vertical (eje delas ordenadas).
Si no existe una variable dependiente, cualquier variable se puede representar en
cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad)
entre las dos variables.

Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)


lOMoARcPSD|13838149

Correlación lineal simple:

Consiste en expresar cuantitativamente el grado de relación que existe entre las variables
de estudio. Si entre dos variables cuantitativas existe una relación lineal, el análisis de
correlación lineal simple se usa para determinar la dirección y la magnitud de dicha
relación. La dirección de la relación se refiere a si ésta es positiva o negativa.

Coeficiente de determinación R2:

Es un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito


es predecir futuros resultados o probar una hipótesis. El coeficiente determina la
calidad del modelo para replicarlos resultados, y la proporción de variación de los
resultados que puede explicarse por el modelo. El R² es simplemente el cuadrado
del coeficiente de correlación de Pearson, lo cual es sólo cierto para la regresión
lineal simple. Si existen varios resultados para una única variable, es decir, para una X
existe una Y, Z.… el coeficiente de determinación resulta del cuadrado del
coeficiente de determinación múltiple. En ambos casos el R² adquiere valores entre 0 y 1.
Existen casos dentro de la definición computacional de R² donde este valor puede tomar
valores negativos.

Correlación positiva y correlación negativa


Una relación positiva entre las variables X y Y indica que existe una relación directa entre
ellas, es decir, los valores menores de X están asociados con los valores menores de Y y
los valores mayores de X están asociados con los valores mayores de Y. Existe
una relación positiva entre las variables X y Y si al aumentar los valores de X los valores
de Y tienden a aumentar.

Una relación negativa entre las variables X y Y indica que existe una relación inversa entre
ellas, es decir, los valores menores de X están asociados con los valores mayores de Y y
los valores mayores de X están asociados con los valores menores de Y. Si existe una
relación negativa entre las variables X y Y, entonces al aumentar los valores de X los
valores de Y tienden a disminuir y viceversa.

Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)


lOMoARcPSD|13838149

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?


La correlación, también conocida como coeficiente de correlación lineal(de Pearson), es
una medida de regresión que pretende cuantificar el grado de variación conjunta
entre dos variables. Por tanto, es una medida estadística que cuantifica la
dependencia lineal entre dos variables, es decir, si se representan en un diagrama de
dispersión los valores que toman dos variables, el coeficiente de correlación lineal
señalará lo bien o lo mal que el conjunto de puntos representados se aproxima a una
recta. La podemos definir como el número que mide el grado de intensidad y el sentido de
la relación entre dos variables.

Actividad 3. Ejercicio práctico.


Enunciado del ejercicio seleccionado:
3.5 Temperatura – Enfermedad respiratoria. En una investigación realizada durante el
mes de noviembre en un hospital pediátrico respecto a la relación de la temperatura
ambiente media y los casos de enfermedad registrados se obtuvieron los siguientes datos.

Tipo de asociación entre las variables:


a. Diagrama de dispersión

b. Coeficiente de determinación y correlación.


Inversa, el coeficiente de correlación es de 0,99, es una correlación excelente.

c. Modelo matemático y confiabilidad.


y = -1,1459x + 39,004
Este modelo es confiable en un 98.95%

Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)


lOMoARcPSD|13838149

d. Grado de relación entre las dos variables.

R² = 0,9109
El grado de relación es alto o máximo, donde R² = 1, por ende, esta relación es del
100%, entonces, este grado de relación permite determinar una estimación muy
consistente que permite predecir el comportamiento de una variable con relación a las
modificaciones o cambios surgidos en la otra.

Actividad 4. Regresión y correlación Lineal.

Variables cuantitativas que pueden relacionarse: Número de integrantes del


Personas del núcleo familiar que contrajeron covid-19 columna J Y Promedio de
dinero invertido en las personas que contrajeron Covid-19 obtuvieron alguna
afectación de salud. columna K.

Variable dependiente: Promedio de dinero invertido en las personas que contrajeron


Covid-19 o tuvieron alguna afectación de salud. columna K.

Variable independiente: Número de integrantes del Personas del núcleo familiar que
contrajeron covid-19 columna J.

a. Diagrama de dispersión

b. Coeficiente de determinación y correlación.

c. Modelo matemático y confiabilidad.

Y=25455.96X+50237.16
Confiabilidad 7%

d. Tipo de correlación de las dos variables.


NO HAY Correlación entre el numero personas contagiadas y el promedio de
dinero invertido.

Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)


lOMoARcPSD|13838149

Conclusión
Hemos aprendido a través del desarrollo de este trabajo que puedo concluir que se pueden
aprender e identificar conceptos importantes como diagramas de dispersión, correlaciones
lineales, coeficientes de determinación, correlaciones positivas y negativas, que son cruciales en
la clasificación, selección e identificación. Esto nos permite simplificar la interpretación de los datos
recopilados de una manera rápida y eficiente. El enfoque utilizado para realizar los ejercicios de la
Unidad 3 nos ayudó a practicar los conceptos mencionados anteriormente y nos dio una
comprensión clara de la gestión de información a través de Excel. A través de este trabajo,
podemos aprender a verificar estadísticamente que existe una relación entre una o más variables,
porque intuitivamente podemos inferir que una variable depende de otra, pero cuando hacemos
estadísticas, podemos darnos cuenta de que existe un sexo y una relación confiables. las
relaciones están mucho en el medio.

Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)


lOMoARcPSD|13838149

Bibliografía

-Romero, R. E. (2016). Estadística para todos: análisis de datos: estadística descriptiva,


teoría de la probabilidad e inferencia. Madrid, ESPAÑA: Larousse - Ediciones Pirámide.
Pp. 269 -298. Recuperado de https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/49136?page=270

-Matus, R., Hernández, M., & García, E. (2010). Estadística. México, D.F., MX: Instituto
Politécnico Nacional. Pp. 27-37. Recuperado dehttps://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/76119?page=38

Montero, J. M. (2007). Conceptos Generales Estadística descriptiva.


Madrid: Paraninfo. Página 3 – 1

Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y muestreo,


13a ed. [Online].Ecoe Ediciones. (pp 570 – 582).

Montero, J.M. (2007). Regresión y Correlación Simple.Paraninfo. (pp 130 – 158).

Downloaded by Yeiner Zabala (yeinerzabala2020@gmail.com)

También podría gustarte