Está en la página 1de 17

ESTADISTICA DESCRIPTIVA

PASO 4. DESCRIPCIÓN DE LA INFORMACIÓN.

Presentado a:
JOSE FERNANDO VELANDIA

Entregado por:
YENY OSORIO CORONADO cód. 30575850

Grupo: 100105_208

CIENCIAS ADMINISTRATIVAS ECONIMOCAS Y DE NEGOCIOS


ADMINISTRACION DE EMPRESAS
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
MAYO 2020
INTRODUCCIÓN

En el presente trabajo se presenta las soluciones de las actividades planteadas A partir de la

base de datos suministrada Pruebas SABER 11 - 220 estudiantes 2020 (16-1) y el

laboratorio. La realización de este trabajo es dar a conocer y poner en práctica la regresión

y correlación y medias de dispersión y estadísticas bivariantes sobre la unidad 2 de este

curso, además de los comportamientos que se dan en el plano cartesiano tanto en las

variables, como los grados y resultados que se manejan para los ejemplos que se plantean

en el laboratorio propuesto, que es de vital importancia reconocer y manejar las fórmulas

que se obtienen de la herramienta de Excel.


JUSTIFICACIÓN

Partiendo de una base de datos Pruebas SABER 11 - 220 estudiantes 2020 (16-1) y el

laboratorio se presenta las soluciones de las actividades planteadas aplicaremos el proceso

de regresión lineal simple para determinar tanto la naturaleza como la fuerza de una

relación entre dos variables y segundo lugar la regresión lineal múltiple con la cual

describiremos la relación entre dos o más variables independientes y una variable

dependiente utilizando la ecuación de regresión múltiple; estas ecuaciones de estimaciones

nos permitirá realizar una interpretación de correlación de la investigación realizada. El

trabajo de laboratorio constituye una de las mejores metodologías para la aplicación de

modelos estadísticos a las variables de los hechos.


OBJETIVOS

Objetivos Generales

• Detallar y Relacionar variables de la problemática utilizando Medidas Bivariantes,

determinar la relación entre dos o más variables inscritas en una situación específica a partir

del análisis de regresión lineal simple.

Objetivos Específicos

 Determinar la relación existente entre dos variables cuantitativas a través de las

herramientas Infostat y Excel

 Realizar diagramas de dispersión en los ejercicios de laboratorio y actividades

colaborativas que permitan determinar el tipo de asociación entre las variables

escogidas en cada ejercicio.

 En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple

crear modelos matemáticos que permita predecir el efecto de una variable sobre la

otra para determinar su fiabilidad.

 Determinar porcentajes que permitan una explicación de modelo y grado de relación

de dos variables de los ejercicios de laboratorio y de regresión y correlación lineal

simple.
Actividad 1. Mapa Mental
Actividad 2. Definición de Conceptos.

 Diagrama de dispersión.
Es un conjunto de puntos ubicados en el plano cartesiano (x, y), que representan la
dispersión de dos o más variables.

 Correlación lineal simple.


Es la relación entre dos variables, que busca determinar el cambio o pronóstico de una de
ellas cuando la otra variable es constante, determinando una variable independiente y otra
dependiente.

 Coeficiente de determinación R2
Es el porcentaje de variación entre dos variables, indicando la confiabilidad del modelo.

 Correlación positiva y correlación negativa


La correlación positiva es cuando la relación entre las variables es directa, si una variable
aumenta o disminuye la otra variable aumentará o disminuirá correspondientemente.
La correlación negativa es cuando la relación entre las variables es inversa, si una variable
aumenta la otra disminuye y viceversa.

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?


Es una medida que busca cuantificar el grado de relación entre dos variables, permitiendo
obtener una interpretación de la correlación.
Actividad 3. Realizar el laboratorio de regresión y correlación lineal

1.1 Temperatura – Consumo de gas.


En una ciudad del norte de la costa colombiana fue registrada la temperatura media del día
y la cantidad de gas consumida en algunas de las residencias.
Los datos están representados en la siguiente tabla. Para estudiar la relación entre la
temperatura y el consumo de gas.
Y Volumen
X
de Gas
Temperatura
consumido –
Media - oC
cm3
3 7
6 5
3 8
1 8
5 7
7 5
9 4
13 3

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
 De acuerdo a la dispersión de los datos, podamos apreciar que existe una relación
lineal negativa.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Y = m (X) + b
m = -0,47
b = 8,62

Y = -0,47X + 8,62

Coeficiente de determinación = 0,91 x 100%, indica una confiabilidad del 91%, lo


cual indica un porcentaje bastante considerable.

c. Determine el grado de relación de las dos variables.

Si hallamos el coeficiente de correlación al sacar la raíz cuadrada al valor del


coeficiente de determinación, obtenemos:
coeficiente de correlación=√ 0,91=0,95

Determinando que existe un grado de correlación excelente entre las dos variables.

d. Determine el Volumen de gas consumido si la temperatura media llega a ser -1


grado oC?
Reemplazando la temperatura en el modelo matemático construido tenemos:
Y =−0,47 (−1 ) +8,62
Y =9,09
El consumo de gas para un grado de temperatura media de -1 grado oC, es de 9,09
cm3

1.4. X-Y Montaje – Horas de trabajo


En una empresa se desea verificar si la calidad de los computadores con defectos de
montaje tiene relación con las horas trabajadas por día.
Los siguientes datos representan dicha situación:

Computadores 10 9 8 5 9 8 6 7 9 10
con defectos (Y)
Horas de trabajo
15 13 11 7 12 11 8 10 13 13
(X)

a. Identifique la variable dependiente (y) y la variable independiente (x), realice


el diagrama de dispersión y determine el tipo de asociación entre las variables.

Variable dependiente: Computadores con defectos


Variable independiente: Horas de trabajo

 De acuerdo a la dispersión de los datos, podamos apreciar que existe una relación
lineal positiva
b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?

Y = m (X) + b
m = 0,66
b = 0,64

Y = 0,66X + 0,64

Coeficiente de determinación = 0,95 x 100%, indica una confiabilidad del 95%,


obteniendo un porcentaje de confiabilidad bastante alto.

c. Determine el grado de correlación de las dos variables


Si hallamos el coeficiente de correlación al sacar la raíz cuadrada al valor del
coeficiente de determinación, obtenemos:
coeficiente de correlación=√0,95=0,97
Determinando que existe un grado de correlación excelente entre las dos variables.

d. ¿Cuál será la cantidad de computadores con defectos producidos si un


trabajador labora 6 horas?
Reemplazando las horas trabajadas en el modelo matemático construido tenemos:
Y =0,66 ( 6 ) +0,64
Y =4,6
Redondeando la cifra, se producirá una cifra cercana a 5 computadores con
defectos por parte de un trabajador si trabaja 6 horas.
1.9. Temperatura – Enfermedad respiratoria.
En una investigación realizada durante el mes de agosto en un hospital pediátrico respecto a
la relación de la temperatura ambiente media y los casos de enfermedad registrados se
obtuvieron los siguientes datos:
Casos de
enfermeda
Temperatur
d
a media °C
respiratori
a
9 28
11 26
14 22
15 22
17 22
18 16
20 12
21 6
22 6

1. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

 De acuerdo a la dispersión de los datos, podamos apreciar que existe una relación
lineal negativa
2. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. ¿Es confiable?
Y = m (X) + b
m = -1,73
b = 46,09

Y = -1,73X + 46,09

Coeficiente de determinación = 0,89 x 100%, indica una confiabilidad del 89%, lo cual es
un porcentaje muy representativo.

3. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.
La variable R2, 89%, representa un alto porcentaje de relación entre las dos variables y
hallando el coeficiente de correlación al sacar la raíz cuadrada al valor del coeficiente de
determinación, obtenemos:
coeficiente de correlación=√ 0,89=0,94
Determinando que existe un grado de correlación excelente entre la temperatura media
y el número de casos de enfermedad respiratoria.
4. ¿Cuál será el número de casos esperados de enfermedad respiratoria en el hospital,
si la temperatura cae a 7 °C?
Reemplazando las horas trabajadas en el modelo matemático construido tenemos:
Y =−1,73(7)+46,09
Y =33,98
Aproximando la cifra, se espera una cifra cercana a los 34 casos de enfermedad
respiratoria si la temperatura baja a 7 °C.
Actividad 4. Regresión y correlación Lineal.

REGRESIÓN Y CORRELACIÓN LINEAL


 Las variables cuantitativas que se escogieron son:
Variable dependiente Y: Promedio general.
Variable independiente X: Puntaje obtenido en la prueba de lectura crítica
(PUNTAJE_LECTURA_CRITICA).

 Diagrama de dispersión

Diagrama de dispersión
100
90
80
Promedio general

70
60
50
40
30
20
10
0
20 30 40 50 60 70 80 90
Puntaje lectura critica

Si se observa el diagrama de dispersión anterior se puede ver que entre las variables puntaje
lectura crítica y promedio general parece existir una relación lineal directa, lo que quiere
decir que al ajustar un modelo a los datos la pendiente será positiva, además, cuando la
variable X aumenta la variable Y aumenta. También parece ser que la relación entre las
variables es alta y bastante fuerte y que puede ser explicada por una recta de regresión
lineal.
 Usando Excel se estimó el modelo matemático que permite predecir el efecto de
una variable sobre la otra, el cual está dado por la siguiente expresión:
Y^ =−3.7365+1.0503∗X
Además, se obtuvo un coeficiente de determinación de r 2=0.8622, lo que quiere decir, que
la variabilidad del promedio general es explicada en un 86% por el modelo matemático. Por
tanto, podemos decir que el modelo es bastante confiable.
 Para determinar el grado de relación de las dos variables se calcula el coeficiente de
correlación, el cual usando Excel dio igual a:

ρ XY =0.9286

Por tanto, las dos variables se correlacionan en sentido directo, es decir, a medida que
aumenta el puntaje en la pruebe de lectura crítica, aumenta el promedio general. Además,
con el valor obtenido vemos que las variables están altamente correlacionadas.
 Note que ambas variables escogidas muestran una relación lineal bastante fuerte, y
que si es posible describir los datos por medio de una recta de regresión. Además de
que el promedio general si depende del puntaje obtenido en la prueba de lectura
crítica.
CONCLUSIONES

Se pudo evidenciar que para manejar cualquier tipo de variables se necesita realizar
un diagrama de dispersión y aplicar conceptos, fórmulas de relación y correlación que
permita el despeje de las ecuaciones y datos para obtener un resultado.
Los ejemplos nos muestran que son acordes a un tipo de forma lineal y la
correlación es confiable para los tipos de datos.
Hallamos los comportamientos que tienen tendencia lineal y determinamos el grado
de correlación entre las variables.
BIBLIOGRAFÍA

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical


Descriptive. Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312c
bea60961107ffc27a0

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 –
158). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc136
1e1929abe203c8219

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:


Cengage Learning. (pp 675–686). Recuperado de http://go.galegroup.com/ps/i.do?
id=GALE
%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89e57
d11ede116134cfce41

Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia.Recuperado de


http://hdl.handle.net/10596/11579

Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX:
Instituto Politécnico Nacional, (2010). ProQuest ebrary. (pp 95-109). Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?
ppg=12&docID=10365616&tm=1471981556569

Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1.


Distrito Federal, MÉXICO: Grupo Editorial Patria. (pp 99-109) Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?
ppg=6&docID=11230886&tm=1471982022168

También podría gustarte