Está en la página 1de 16

ESTADISTICA DESCRIPTIVA

PASO 4 - DESCRIPCIÓN DE LA INFORMACIÓN

TUTOR: CAMPO RIANO

EMILCEN SIERRA MELO CC 52.447.112

GRUPO: 100105_19

UNAD UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

CEAD JOSÉ ACEVEDO Y GÓMEZ

BOGOTÁ D.C 2020


INTRODUCCION

Para esta etapa de desarrollo se descifrara y estudiara las diferentes regresiónes y correlaciones en
el cual lograremos entender, identificar y calcular resolviendo los diferentes problemas y ejercicios
presentados por el tutor, a lo cual el primer paso será un mapa mental el cual resume la actividad
general para este ejercicio, luego una serie de ejercicios los cuales nos ayudaran a realizar
diagramas de dispersión y dar una serie de conclusiones sobre las pruebas saber 2011.
JUSTIFICACION

Con el presente trabajo queremos demostrar que las regresiones y correlaciones son parte
integral de la estadística la cual nos ayudara a resolver problemas sobre regresión lineal,
coeficiente de determinación lineal, coeficiente de correlación, análisis de correlación, regresión
simple y diagramas de dispersión, las cuales estan agrupadas en las medidas estadísticas
bivariantes, por lo tanto la relación entre dos variables cuantitativas de las pruebas saber 2011, se
lograra determinar la relación entre una variable dependiente y variables independientes, así
podemos calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente
su relación.
OBJETIVOS

• Estudiar y practicar los diferentes tipos de regresiones lineales.

• Repasar y entender el coeficiente de determinación lineal.

• Entender los resultados del coefiente de correlación.

• Determinar relación entre variable dependiente e independiente.

• Realizar los diagramas de dispersión.

• Dar conclusiones específicas sobre cada uno de los temas y ejercicios entregados por el
tutor.
MARCO REFERENCIAL

El estado colombiano a determinado hacer unas pruebas antes de que los estudiantes salgan del
grado 11, para prepararlos antes de presentar el examen del ICFES el cual es de carácter
obligatorio, para ello ha realizado estudios estadísticos para identificar los principales factores que
influyen en los resultados de las pruebas SABER 11 en estudiantes de Instituciones públicas y
privadas de Colombia, para verificar los factores que intervienen en los resultados de los
estudiantes de Instituciones Públicas y Privadas del territorio Nacional, para ello se describen una
serie de objetivos los cuales nos darán unas pautas para verificar y analizar los problemas
encontrados en los resultados obtenidos.
Para ello debemos identificar las regresiones y correlaciones para sacar una serie de conclusiones
generales identificando los posibles problemas potenciales que influyen en los estudiantes.
1. MAPA MENTAL

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y correlación.
Actividad 2. Definición de Conceptos.
Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:
• Diagrama de dispersión: Un diagrama de dispersión o gráfica de dispersión o gráfico
de burbujas es un tipo de diagrama matemático que utiliza las coordenadas cartesianas
para mostrar los valores de dos variables para un conjunto de datos.

• Correlación lineal simple: Es una medida estadística que cuantifica la dependencia


lineal entre dos variables, es decir, si se representan en un diagrama de dispersión los
valores que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo
mal que el conjunto de puntos.

• Coeficiente de determinación R2: El coeficiente de determinación, se define como la


proporción de la varianza total de la variable explicada por la regresión. El coeficiente de
determinación, también llamado R cuadrado, refleja la bondad del ajuste de un modelo a
la variable que pretender explicar.

• Correlación positiva y correlación negativa: Si (r < 0) Hay correlación negativa: las


dos variables se correlacionan en sentido inverso. A valores altos de una de ellas le suelen
corresponder valor bajos de la otra y viceversa.
Si (r > 0) Hay correlación positiva: las dos variables se correlacionan en sentido directo.
A valores altos de una le corresponden valores altos de la otra e igualmente con los
valores bajos cuánto más próximo a +1 esté el coeficiente de correlación más patente será
esta covariación.

• ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir:


Es una medida que permite conocer el grado de asociación lineal entre 2 variables
cuantitativas.
Podemos observar que en un diagrama B los puntos se acercan más a la recta, caso
contrario en el diagrama A, los puntos estan más alejados. Entonces podemos decir que
la relación lineal del diagrama A es más débil comparado a la relación que existe en el
diagrama B.

Actividad 3.
Realizar el laboratorio de regresión y correlación lineal
Desarrollar el Laboratorio denominado Regresión y Correlación lineal
1.1. Temperatura – Consumo de gas.

En una ciudad del norte de la costa colombiana fue registrada la temperatura media del día
y la cantidad de gas consumida en algunas de las residencias. Los datos están representados
en la siguiente tabla. Para estudiar la relación entre la temperatura y el consumo de gas

X Y Volumen de
Temperatura Gas
Media - C
o consumido –
cm3

3 7

6 5

3 8

1 8

5 7

7 5

9 4

13 3
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

TEMPERATURA VS CONSUMO DE GAS


9 8 8
8 7 7
7
VOLUMEN DE GAS

6 5 5
5 4
4 3 Series1
3 Lineal (Series1)
2
1
0
0 5 10 15
TEMPERATURA

Tendencia hacia abajo Correlación negativa. Fuerza o intensidad fuerte- si existe


correlación con dirección negativa.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

M= Pendiente -0,46 b= Origen 8.62 - si es confiable.

MODELO MATEMATICO
9
Y Volumen de Gas
8
consumido – cm3
7
6
Y=MX+B
5
GAS

4
3 Lineal (Y Volumen de
2 y = -0,4678x + 8,6233 Gas consumido –
1 R² = 0,905 cm3 )
0 Lineal (Y=MX+B)
0 5 10 15
TEMPERATURA
c. Determine el grado de relación de las dos variables.

Relación lineal negativa fuerte.

d. Determine el Volumen de gas consumido si la temperatura media llega a ser -1 grado


o
C?

El volumen del gas consumido si la temperatura es 1 grado es 8,16

1.4 X-Y Montaje – Horas de trabajo.

En una empresa se desea verificar si la calidad de los computadores con defectos de


montaje tiene relación con las horas trabajadas por día.
Los siguientes datos representan dicha situación:

Computador
con defectos 10 9 8 5 9 8 6 7 9 10
(Y)
Horas de
15 13 11 7 12 11 8 10 13 13
trabajo (X)

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.

La variable dependiente son los computadores con defecto.

La variable independiente son las horas de trabajo.


CALIDAD DE LOS COMPUTADORES
12
COMPUTADORES CON DEFECTO

10 y = 0,6599x + 0,6433 10 10
R² = 0,9461 9 9
8 8
7
6 6
5
4
2
0
0 2 4 6 8 10 12 14 16
HORAS TRABAJO
El tipo de asociación es relación positiva fuerte.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

M= Pendiente 0,65 b= Origen 0,64 - si es confiable

MODELO MATEMATICO
12
y = -9E-16x2 + 0,6599x + 0,64
10 R² = 1
COMPUTADORES

8 Computadores con
defectos (Y)
6
Y=MX+B
4

2 Polinómica (Y=MX+B)

0
0 2 4 6 8 10 12 14 16
HORAS

c. Determine el grado de correlación de las dos variables.

El tipo de asociación es relación positiva fuerte.

d. ¿Cuál será la cantidad de computadores con defectos producidos si un trabajador labora


6 horas?

La cantidad de computadores con defecto si se trabaja 6 horas es 4,59

1.9 Temperatura – Enfermedad respiratoria.

En una investigación realizada durante el mes de agosto en un hospital pediátrico respecto


a la relación de la temperatura ambiente media y los casos de enfermedad registrados se
obtuvieron los siguientes datos
Casos de
Temperatura
enfermedad
Media °C
respiratoria

9 28
11 26
14 22
15 22
17 22
18 16
20 12
21 6
22 6

1. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

CASOS ENFERMEDAD RESPIRATORIA


35

30

25 28
ENFERMEDAD

26
20
2222 22
15
16 Casos de
10 enfermedad
y = -1,7333x + 46,089 12 respiratoria
R² = 0,8909
5
66
0
0 2 4 6 8 10 12 14 16 18 20 22 24
TEMPEATURA

El tipo de asociación es Tendencia hacia abajo Correlación negativa. Fuerza o intensidad


fuerte - si existe correlación con dirección negativa.

2. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
¿Es confiable?
MODELO MATEMATICO
35

30 Casos de
enfermedad
25
respiratoria
20 Y=MX+B
15

10
Polinómica (Casos
y = -0,127x2 + 2,237x + 17,369
5 de enfermedad
R² = 0,9588
respiratoria )
0
0 5 10 15 20 25

M= Pendiente 0,65 b= Origen 0,64 - si es confiable

3. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

Relación no lineal negativa fuerte - una variable aumenta y la otra disminuye.

4. ¿Cuál será el número de casos esperados de enfermedad respiratoria en el hospital, si la


temperatura cae a 7 °C?
5.
Si la temperatura cae a 7 °C el número de casos es de 34.
Actividad 4. Regresión y correlación Lineal
A partir de la base de datos suministrada: Pruebas SABER 11 - 220 estudiantes 2020 (16-1),
cada estudiante, deberá:
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e
identificar la variable dependiente e independiente.
Variables: Numero de cuartos en el hogar (variable independiente)
Número de personas en el hogar (Variable dependiente)
Ya que la variable independiente es estable y no se ve afectada por otra variable.
Y la variable dependiente depende de otros factores pueden cambiar como resultado de una
manipulación.
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las
variables.

NUMERO DE CUARTOS POR PERSONAS EN EL HOGAR


14
12
12 11 11
10
10
8
PERSONAS

8 7 7 7
6 6 6 6 6 NUMERO DE PERSONAS EN
6 5 5 5 5 5 EL HOGAR
4 4 4 4 4 4 Lineal (NUMERO DE
4 3 3 3 3 3 3 3
PERSONAS EN EL HOGAR)
2 2 2 2 2 2
2 1

0
0 1 2 3 4 5 6 7 8 9 10
NUMERO DE CUARTOS

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es
confiable?

M= Pendiente 0,43 b= Origen 2,96 - no es confiable


MODELO MATEMATICO
14 y = -0,0665x2 + 0,9684x + 2,0607
12 R² = 0,1373
NUMERO DE
PERSONAS 10 PERSONAS EN EL
8 HOGAR

6 Y=MX+B

4
2 Polinómica (NUMERO
DE PERSONAS EN EL
0
HOGAR)
0 1 2 3 4 5 6 7 8 9 10
CUARTOS EN EL HOGAR

- Determine el grado de correlación de las dos variables.

Correlación no lineal positiva - una fuerza débil

- Relacionar la información obtenida con el problema.


Para el siguiente problema se puede concluir que la caída de los puntos o números de personas
estan dispersos en la recta es decir los cuartos son suficientes.

CONCLUCIONES
REFERENCIA BIBLIOGRAFICAS

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage
Learning. Páginas 675 – 686

También podría gustarte