Estadística - Paso 4

También podría gustarte

Está en la página 1de 15

Paso 4 – Descripción de la información

Estadística

Presentado a:

JESUS ANTONIO PEÑA RUEDA

Estudiante:

VICTOR ALFONSO LOBO

Código: 78, 545, 002

Grupo: 153

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA

30 DE NOVIEMBRE DE 2020
INTRODUCCIÓN

Las medidas estadísticas bivariantes estudian el comportamiento de dos variables, a fin

de determinar si existe alguna relación entre sí y de cuantificar dicho grado de relación,

donde se desarrollan los conceptos de regresión y correlación de dos variables y el

concepto y usos de los números índices.

En este documento se encuentra el desarrollo de la actividad propuesta en el curso de

estadística donde se estudia la base de datos Pruebas SABER 11 - 160 estudiantes y

se aplican medidas estadística bivariantes para determinar el grado de relación entre

dos variables haciendo uso de los diagramas de dispersión, el coeficiente de

determinación y el coeficiente de correlación.


JUSTIFICACIÓN

La utilidad del coeficiente de correlación lineal consiste en corroborar que existe una

fuerte relación lineal, que nos sirva de apoyo para establecer nuestro modelo de

regresión lineal y con ello podamos predecir el comportamiento de la variable objetivo a

partir de la variable independiente. Lo cual no significa que una sea el origen de la otra,

sino que ambas variables están estrechamente relacionadas y dado ese

comportamiento podemos obtener información de utilidad.

Es por ello que es de gran importancia desarrollar la actividad propuesta puesto que

con ella será posible que adquiramos los conceptos básicos acerca de las medidas

estadísticas univariantes y de esta forma poder obtener información de utilidad de un

grupo de datos.
OBJETIVOS

Objetivo general:

Aplicar las medidas estadísticas bivariantes en función de la problemática objeto de

estudio.

Objetivos específicos:

 Comprender y aplicar los conceptos de regresión y correlación.

 Realizar el diagrama de dispersión de dos variables.

 Determinar el grado de relación entre dos variables.


DESARROLLO DE LAS ACTIVIDADES

Actividad 1. Mapa mental

Resumir mediante un mapa mental las medidas estadísticas bivariantes de regresión y

correlación.

Actividad 2. Definición de Conceptos.

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

 Diagrama de dispersión

El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos

asociados de datos que aparecen en pares (por ejemplo, (𝑥, 𝑦), uno de cada

conjunto). El diagrama muestra estos pares como una nube de puntos.

 Correlación lineal simple

Es la comparación de dos variables ajustada por una línea recta de regresión, a

través de la covarianza de las variables con el método de mínimos cuadrados.

 Coeficiente de determinación R2
el coeficiente de correlación, el cual determina el grado de confiabilidad en el modelo de regresión, dicho coeficiente varía ent

es cercano a 0 implica que el modelo es de menor confiablidad y por el contrario

entre más próximo sea a 1, el modelo será más confiable.

 Correlación positiva y correlación negativa

La correlación positiva ocurre cuando al aumentar o disminuir los valores de la

variable independiente aumenta o disminuyen los de la variable dependiente y la

correlación negativa ocurre cuando al aumentar los valores de la variable

independiente disminuyen los valores de la variable dependiente, o viceversa.

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La correlación, también conocida como coeficiente de correlación lineal (de

Pearson), es una medida de regresión que pretende cuantificar el grado de

variación conjunta entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos

variables, es decir, si se representan en un diagrama de dispersión los valores que

toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal

que el conjunto de puntos representados se aproxima a una recta.

Actividad 3. Ejercicio práctico

En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a

continuación; posterior a ello compartirá su elección en el foro del entorno de

Aprendizaje Foro de discusión Unidad 3- Paso 4 Descripción de la Información. En

cada ejercicio deberá responder los siguientes interrogantes:


a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

b. Encuentre el coeficiente de determinación y correlación.

c. Determine el modelo matemático que permite predecir el efecto de una variable

sobre la otra. ¿Es confiable?

d. Determine el grado de relación de las dos variables.

Ejercicio seleccionado:

1.1. Temperatura – Consumo de gas.

En una ciudad del norte de la costa colombiana fue registrada la temperatura media del

día y la cantidad de gas consumida en algunas de las residencias. Los datos están

representados en la siguiente tabla. Para estudiar la relación entre la temperatura y el

consumo de gas

1. Temperatura media
2. Volumen de gas
en grados
consumido - 𝑐𝑚3 (y)
centígrados (x)
3 7
6 5
3 8
1 8
5 7
7 5
9 4

a. Realice el diagrama de dispersión y determine el tipo de asociación entre

las variables.
Consumo de Gas vs temperatura
media
9
8
7
6
5
4
3
2
1
0

0 2 4 6 8 10

El comportamiento de entre las variables es de tipo inversamente proporcional

ya que a medida que aumenta la temperatura media, se evidencia un menor

consumo en el gas.

b. Encuentre el coeficiente de determinación y correlación.

El coeficiente de determinación es:

𝑅2 = 0,8825

El coeficiente de correlación es:

𝑟 = −0,939440765

c. Determine el modelo matemático que permite predecir el efecto de una

variable sobre la otra. ¿Es confiable?

Realizando una regresión lineal se tiene que:


Consumo de Gas vs temperatura
media
9
8
7
y = -0,551x + 8,9618
6
R² = 0,8825
5
4
3
2
1
0

0 2 4 6 8 10

Por lo que el modelo matemático está dado por la siguiente ecuación:

𝑦 = −0.551𝑥 + 8.9618

Sí, el modelo es confiable y esto lo podemos saber porque el modelo es lineal y

por el coeficiente de determinación.

d. Determine el grado de relación de las dos variables.

Para responder a esta pregunta se tendrá en cuenta el coeficiente de

determinación:

𝑟 = −0,939440765

Como 𝑟 se acerca a −1 se puede afirmar que la relación lineal es perfecta entre

las dos variables.

Actividad 4. Regresión y correlación lineal simple.

A partir de la base de datos suministrada: Anexo 1- Pruebas SABER 11 - 160

estudiantes 2020 (16-4), cada estudiante, deberá:


dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e identificar la variable dependiente e inde

Variables cuantitativas seleccionadas: Horas de dedicación a la lectura y puntaje

de lectura crítica.

 Realizar el diagrama de dispersión de dichas variables y determinar el tipo de

relación entre las variables.

y = 0,0305x + 59,131
Diagrama de dispersión R² = 5E-06
90
80
70
60
50
40
30
20
10
0

0 0,5 1 1,5 2 2,5 3 3,5 4

Debido a que el coeficiente de determinación es un valor muy cercano a 0 se

observa que las dos variables no se relacionan como se pensaba inicialmente.

 Determine al coeficiente de determinación y de correlación de las dos variables.

Interprete los resultados

El coeficiente de determinación es:

𝑅2 = 5 × 10−6

El coeficiente de correlación es:

𝑟 = 0,002152
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

El modelo matemático está dado por la siguiente ecuación:

𝑦 = 0.0305𝑥 + 59.131

No, el modelo no es confiable y esto lo sabemos por el coeficiente de determinación.

 Determine el tipo de correlación de las dos variables.

Para responder a esta pregunta se tendrá en cuenta el coeficiente de determinación:

𝑟 = 0,002152

Como 𝑟 se acerca a 0 se puede afirmar que las dos variables son incorreladas.

 Relacionar la información obtenida con el problema.

Se puede observar con los resultados obtenidos que las variables horas de

dedicación a la lectura y puntaje de lectura crítica no se relacionan, lo que quiere

decir que el numero de horas de dedicación a la lectura no influye significativamente

con los puntajes obtenidos en lectura crítica.

Actividad 5. Regresión y correlación múltiple.

A partir de la base de datos suministrada “Anexo 1- Pruebas SABER 11 - 160

estudiantes 2020 (16-4)”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas

independientes del estudio de investigación.

Variable cuantitativa dependiente: Promedio general

Variables cuantitativas independientes: Puntaje lectura crítica, puntaje

matemáticas y puntaje ciencias naturales.


b. Realizar el diagrama de dispersión de dichas variables.

Diagrama de dispersión
120

100

80

60

40

20

0 0 10 20 30 40 50 60 70 80 90

Puntaje lectura crítica Puntaje matemáticas Puntaje ciencias naturales

c. Calcular la recta de regresión y el coeficiente de correlación para probar

estadísticamente su relación.

Con ayuda de Excel se obtuvieron los siguientes coeficientes:

Coeficientes
Intercepción -2,841351531
Variable X 1 0,39694543
Variable X 2 0,287608387
Variable X 3 0,375306878

Por lo tanto, la recta de regresión está dada por:

𝑦 = −2.8413 + 0.3969𝑥1 + 0.2876𝑥2 + 0.3753𝑥3

Y el coeficiente de correlación múltiple esta dado por:

𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑚𝑢𝑙𝑡𝑖𝑝𝑙𝑒 = 0.985279

Como el coeficiente de relación múltiple se acerca a 1 se puede afirmar que la

relación lineal es perfecta entre las variables.

d. Relacionar la información obtenida con el problema.


var con los resultados obtenidos las variables promedio general puntaje lectura crítica, puntaje matemáticas y puntaje ciencia

relacionadas, y a medida que aumenta el puntaje de lectura crítica, puntaje

matemáticas y puntaje ciencias naturales aumenta el promedio general.


CONCLUSIONES

 Durante el desarrollo de la actividad se logró observar que es posible con un grupo

de datos aparentemente aleatorios, encontrar un modelo matemático que permita

predecirlos con un grado de confianza que varía dependiendo de la correlación

que pueda existir entre las variables independientes y dependientes.

 Por medio del desarrollo de las actividades propuestas fue posible interiorizar de

una mejor forma los conceptos de correlación lineal, diagramas de dispersión

coeficientes de determinación y de correlación.

 La herramienta Excel fue de gran importancia y utilidad durante el desarrollo de

las actividades ya que con ella es posible realizar todos los cálculos de una forma

organizada y mucho más rápida que si fuera a mano.


REFERENCIAS BIBLIOGRÁFICAS

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130

– 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:

Cengage Learning. Páginas 675 – 686

También podría gustarte