Está en la página 1de 16

LABORATORIO ESTADISTICA

LUIS FERNANDO SARMIENTO


Cd. 72312130

TUTOR:
DANIEL FRANCISCO CHICA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


PROGRAMA: ADMINISTRACIN DE EMPRESAS
CURSO: ESTADISTICA DESCRIPTIVA
CEAD BARRANQUILLA
2016

INTRODUCCIN

El objetivo de esta actividad es analizar el grado de la relacin existente entre


variables utilizando modelos matemticos y representaciones grficas. As
pues, para representar la relacin entre dos o ms variables se desarrollar
una ecuacin que permitir estimar una variable en funcin de la otra.
A continuacin, se estudiar dicho grado de relacin entre dos variables en lo
que se llama anlisis de correlacin. Para representar esta relacin se utiliza
una representacin grfica llamada diagrama de dispersin y, finalmente, se
estudiar un modelo matemtico para estimar el valor de una variable con base
en el valor de otra, en lo que se llama anlisis de regresin.
Lo anterior teniendo como base la informacin presentada por Trnsito y
transporte de la Alcalda de Medelln, que se ha venido trabajando durante este
curso.

JUSTIFICACIN

Al comprender el estudio de la correlacin y la regresin lineales, se advetir


que en el campo de la estadstica existen situaciones que requieren el anlisis
de ms de una variable estadstica. Por ejemplo, existe una relacin entre la
estatura y el peso?, estn relacionadas la edad y la resistencia fsica?,
influye la temperatura en el ndice de criminalidad?, tienden a tener mayor
escolaridad las personas con altos ingresos en comparacin con las de bajos
ingresos?
As tambin, un profesor puede estar interesado en conocer de qu manera se
puede predecir el rendimiento en estadstica basndose en el puntaje obtenido
en una prueba de aptitud en dicha asignatura. As mismo, el psiclogo desear
saber si existe alguna relacin entre el concepto que un alumno tiene de s
mismo y su promedio en las asignaturas. Tambin, el socilogo puede estar
interesado en saber qu clase de relacin existe entre la tasa de delincuencia
juvenil que hay en una comunidad y el grado de hacinamiento de los hogares
que ah se encuentran. Como se observan son muchas situaciones cotidianas
que necesitan analizarse estadsticamente utilizando por lo menos dos
variables estadsticas.
En todos los ejemplos anteriores, se deben analizar los datos valindose de la
correlacin y la regresin lineales para obtener informacin acerca de los
problemas planteados. Este anlisis se realizar con el apoyo en diagramas de
dispersin, el clculo del coeficiente de correlacin y la ecuacin de mejor
ajuste.
Cabe destacar un punto esencial en el anlisis, las variables involucradas no
necesariamente tienen una relacin causa-efecto por lo que deber tomarse la
informacin obtenida mediante esta herramienta con una ptica estrictamente
estadstica.

Todas estas actividades permitirn resolver problemas donde se aplicar la


correlacin y regresin lineales como instrumentos preliminares en la inferencia
estadstica.

OBJETIVOS
Objetivo general:
Determinar la relacin entre dos o ms variables a partir de la regresin lineal
simple y mltiple.

Objetivos especficos:

Realizar el anlisis de correlacin lineal simple de dos variables

cuantitativas del estudio de caso.


Realizar el anlisis de correlacin mltiple de tres variables cuantitativas del

estudio de caso.
Formular conclusiones a partir de los resultados obtenidos.

CONTENIDO
Anlisis de correlacin lineal simple de las dos variables cuantitativas
seleccionadas.
Las variables seleccionadas fueron: Velocidad y nmero de muertos
a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables.

RELACIN VELOCIDAD - NUMERO DE MUERTOS


160
140
120
100
NUMERO DE MUERTOS (Y)

80

f(x) = 5.23x + 47.97


R = 0.79

60
40
20
0
0

10 12 14

VELOCIDAD

b. Encuentre el modelo matemtico que permite predecir el efecto de una variable


sobre la otra. Es confiable?
El modelo matemtico que permite predecir el efecto de una variable sobre la otra
es la ecuacin de la tendencia de la lnea, la cual corresponde a:
y = 5,2288x + 47,968.
Segn su coeficiente de determinacin; R = 0,7907, es confiable ya que se
aproxima a 1, por lo cual puede afirmarse que es confiable.
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables.
El porcentaje de explicacin del modelo est dado por la representacin
porcentual del coeficiente de determinacin, as:
R x 100% = 0,7907 x 100% = 79,07%
El grado de relacin de las dos variables est dado por la raz cuadrada del
coeficiente de determinacin, as:
R = 0,7907 = 0,8892

La representacin porcentual es:


0,8892 x 100% = 88,92%
Lo anterior seala que las dos variables de porcentaje, estn relacionadas entre
s, con un 88.92%. Tambin se puede afirmar que como el coeficiente de
correlacin tiene un valor que se aproxima a 1 entonces su correlacin es positiva.

Anlisis de correlacin mltiple de las variables cuantitativas seleccionadas.

Nmero de muertos - Grados de alcohol

NUMERO DE MUERTOS

14
12
10
8
6
4
2
0
0 1 1 2 2 3 3 4 4

RELACION: NUNERO DE
MUERTOS VS GRADOS DE
ALCOHOL
Linear (RELACION: NUNERO DE
MUERTOS VS GRADOS DE
ALCOHOL)

GRADOS DE ALCOHOL

Nmero de muertos - Velocidad


15
RELACION: NUMERO DE
MUERTOS VS VELOCIDAD

10
NUMERO DE MUERTOS

Linear (RELACION: NUMERO DE


MUERTOS VS VELOCIDAD)

5
0
0

50 100 150 200


Axis Title

Coeficiente de correlacin mltiple


Coeficiente de determinacin R
R ajustado
Observaciones

0,94616351
0,89522539
0,89326699
110

ANLISIS DE VARIANZA
Grados de
libertad
Regresin

Residuos

107

Total

109

Coeficien
Error
tes
tpico
Intercepci 3,0697589
n
6 0,5053845
Variable X
0,1992731
1
2,0586775
2
Variable X 0,0592210 0,0103745
2
6
3

Suma de
cuadrados
928,99166
9
108,72651
3
1037,7181
8
Estadstic
ot
6,0741058
91
10,330934
04
5,7083125
67

Promedio
de los
cuadrados
464,49583
43
1,0161356
37

Valor
crtico de F

F
457,11991
35

3,8344E-53

Probabilid
ad

Inferior
95%

Superior
95%

Inferior
95.0%

Superior
95.0%

1,93872E08
9,06862E18
1,03062E07

4,0716247
88
1,6636417
76
0,0386547
61

2,0678931
4
2,4537132
31
0,0797873
49

4,0716247
88
1,6636417
76
0,0386547
61

2,0678931
35
2,4537132
31
0,0797873
49

Y=- 3.0697 + 2.0586x1 + 0.0592 x2


R = 0.8932

Coeficiente de Determinacin

El modelo matemtico es confiable en un 89,32%


R = 0.9450

Coeficiente de Correlacin

La correlacin entre las variables es excelente, ya que ofrecen el 94,50%. Lo


anterior comprueba la relacin entre las variables establecidas: nmero de
muertos, grados de alcohol y velocidad.

Conclusiones
Al trabajar con dos variables cuantitativas se puede estudiar la relacin que
existe entre ellas mediante la correlacin y la regresin. Aunque los clculos de
ambas tcnicas pueden ser similares en algunos aspectos e incluso dar resultados
parecidos, no deben confundirse.

En la correlacin se mide la direccin y la fuerza de la asociacin de una


variable frente a la otra, pero nunca una relacin de causalidad. Solo cuando
tenemos una variable que es causa o depende de otra, se puede realizar entonces
una regresin.

Referencias Bibliogrficas

Rosas, A.; Zuiga, J. (2010) Estadstica descriptiva e inferencia 1. Fascculo 3:


Correlacin y regresin lineales. Colegio de Bachilleres. Recuperado de:
http://www.conevyt.org.mx/bachillerato/material_bachilleres/cb6/5sempdf/edin
1/edi1_f03.pdf

Vila, A.; Sedano, M.; Lpez, A.; Juan, A. (2012) Correlacin lineal y anlisis de
regresin. Recuperado de:
http://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf

ANEXOS

LABORATORIO ESTADISTICA
1. El rendimiento del producto de un proceso qumico est relacionado con la
temperatura de operacin del proceso. Se desea establecer la relacin que existe
entre la pureza (y) del oxgeno producido y el porcentaje de hidrocarburo
(x) que est presente en el condensador principal en un proceso de
destilacin, de acuerdo con los siguientes datos:
X
(% de
hidrocarburos)
0,99
1,02
1,15
1,29
1,46
1,36
0,87
1,23
1,55
1,4
1,19
1,15
0,98
1,01
1,11
1,2
1,26
1,32
1,43
0,95

Y
(Pureza)
90,01
89,05
91,43
93,74
96,73
94,45
87,59
91,77
99,42
93,65
93,54
92,52
90,56
89,54
89,85
90,39
93,25
93,41
94,98
87,33

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre


las variables.

El diagrama de dispersin es una herramienta grfica que ayuda a identificar la


posible relacin entre dos variables. Representa la relacin entre dos variables de
forma grfica, lo que hace ms fcil visualizar e interpretar los datos.
En la grfica de variables discretas obtenidas de la tabla se refleja una relacin
lineal positiva, es decir que aumenta el valor de la variable X con respecto al valor
de la variable Y.
b. Encuentre el modelo matemtico que permite predecir el efecto de una
variable sobre la otra. Es confiable?
El modelo matemtico que permite predecir el efecto de una variable sobre la otra
es la ecuacin de la tendencia de la lnea, la cual corresponde a:
y = 14,947x + 74,283.
Segn su coeficiente de determinacin; R = 0,8774, es confiable ya que se
aproxima a 1, por lo cual puede afirmarse que es confiable.
c. Determine el porcentaje de explicacin del modelo y el grado de relacin
de las dos variables.
El porcentaje de explicacin del modelo est dado por la representacin
porcentual del coeficiente de determinacin, as:
R x 100% = 0,8774 x 100% = 87,74%
El grado de relacin de las dos variables est dado por la raz cuadrada del
coeficiente de determinacin, as:
R = 0,8774 = 0,9366
La representacin porcentual es:
0,9366 x 100% = 93,66%
Lo anterior seala que las dos variables de porcentaje, estn relacionadas entre
s, con un 93.66%. Tambin se puede afirmar que como el coeficiente de
correlacin tiene un valor que se encuentra entre 0.90 y 1 entonces su correlacin
es positiva.
d. Cul es el porcentaje de hidrocarburo cuando la pureza del oxgeno es
igual a 51,4?
Teniendo en cuenta la informacin arrojada por el diagrama de dispersin, se
procede la siguiente manera:
y = 14,947x + 74,283
Se despeja x y a y se le da el valor de 51,4, entonces:
y = 14,947x + 74,283

R = 0,8774

51,4 = 14,947x + 74,283 (51,4 74,283) / 14,947 = x


-1,53 = x
Cuando la pureza del oxgeno es igual a 51,4, el porcentaje de hidrocarburo es
igual a -1,53.

2. El nmero de libras de vapor (y) consumidas mensualmente por una


planta qumica, se relaciona con la temperatura ambiental promedio (en F).
Para el ao 2015, se registraron los siguientes valores de temperatura y
consumo anual.

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre


las variables.

3. Los investigadores estn estudiando la correlacin entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso
ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de reflexin
nociceptiva (y) que es una medida de sensacin de punzada. Obsrvese que
ambas, X e Y, son variables aleatorias
X
(porcentaje de
sobrepeso
89
90
75
30
51
75
62
45
90
20

y (umbral de reflejo de
flexin nociceptiva)
2
3
4
4.5
5.5
7
9
13
15
14

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre


las variables.

b. Ajuste un modelo matemtico que permita predecir el efecto de una


variable sobre la otra. Es confiable?
y = - 0,062x + 11,642
El coeficiente de correlacin es: R = 0,1115.
Se puede concluir que el modelo no es confiable.

c. Determine el porcentaje de explicacin del modelo y el grado de relacin


de las dos variables.
El porcentaje de explicacin del modelo es:
R x 100% = 0,1115 x 100% = 11.15 %.
El grado de relacin de las dos variables se determina por la raz cuadrada del
coeficiente de determinacin
R = 0,1115= 0,3339161571
Su representacin porcentual es:
0,3339 x 100%= 33,39%
Lo anterior indica que las dos variables estn relacionadas entre s, con un
33,39%, no obstante su correlacin es negativa.
d. Cul es el umbral de reflejo de flexin nociceptiva, cuando hay un
porcentaje de sobrepeso, de 50?
Teniendo en cuenta la informacin arrojada por el diagrama de dispersin, se
procede la siguiente manera:
y = - 0,062x + 11,642
A x se le da el valor de 50, para obtener el valor de y:
y = - 0,062x + 11,642

R = 0,1115

y = -0,062(50) + 11,642 y = -3,1 + 11,642


y = 8,542
El umbral de reflejo de flexin nociceptiva, cuando hay un porcentaje de
sobrepeso de 50 es: 8,542.

También podría gustarte