Está en la página 1de 18

METODOLOGA DE LA INVESTIGACIN APLICADA A LA INGENIERA

AGROINDUSTRIAL
Profesor del Curso: Ing. Pedro Walter Gamarra Leiva
1) Explique qu es el Anlisis de Correlacin Simple, Mltiple y Parcial. Cul es el
coeficiente de correlacin segn la naturaleza de las variables. Graficar.
Correlacin simple: se llama as porque solo interviene una variable dependiente.
Correlacin mltiple: relacin entre varias variables independientes con una
dependiente.
Correlacin parcial: Es la relacin entre la variable dependiente y una independiente
despus de eliminar completamente (o hacindolos constantes) el efecto de las otras
variables independientes.
Coeficiente de correlacin segn la naturaleza de las variables: el grado de relacin entre
variables depende de la naturaleza delas variables involucradas en el estudio o
investigacin.
En este sentido:
si ambas variables son nominales la relacin ser descrita con el estadstico JiCuadrado.
Si ambas variables son ordinales se describe la relacin con el coeficiente de
correlacin de Spearman.
Si ambas variables son intercalares mediante el coeficiente de Pearson.
Si una variable es nominal y la otra es intercalar la relacin puede ser descrita
mediante el coeficiente Omega Cuadrado.
Si ambas variables son dicotmicas o binarias la relacin puede establecerse
mediante el coeficiente Phi.
2) Desarrolle adecuadamente si la Correlacin es una medida de confiabilidad de un
instrumento de medicin o test.
La correlacin es la base utilizada para evaluar la confiabilidad de un instrumento de medicin
o test. Si los puntajes de un test fueron medidos en base a una escalar Likert o tipo Likert, se
utilizara el Coeficiente Cronbach, pero si los puntajes provienen de alternativas dicotmicas o
binarias (si, no) se utilizara el Coeficiente de Kuder-Richardson.
Existe un coeficiente de particin por mitades llamada Correlacin de Spearman-Brown que
mide el grado de homogeneidad de un test; cuando las correlaciones entre la primera y la
segunda mitad del test, o entre pares e impares es lo ms elevada posible y en todo caso mayor
que 0.70, se concluye igualmente que el test es confiable.

3) Desarrolle 10 ejemplos de correlacin con Statgraphics Centurin XVI


1. Una compaa desea hacer predicciones del valor anual de sus ventas totales en cierto
pas a partir de la relacin de stas y la renta nacional. Para investigar la relacin
cuenta con los siguientes datos:

189

190

208

227

239

252

257

274

293

308

316

402

404

412

425

429

436

440

447

458

469

469

X representa la renta nacional en millones de euros e Y representa las ventas de la compaa


en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive).

Renta nacional

venta de la compaia

Grfico de venta de la compaia vs venta de la compaia


480

venta de la compaia

Correlaciones
460

Renta nacional

venta de la compaia

Renta nacional venta de la compaia


0.9984
(11)
0.0000
0.9984
(11)
0.0000

440

420

400
400

420

440

460

480

venta de la compaia

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de
estos coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables.
Tambin se muestra, entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El
tercer nmero en cada bloque de la tabla es un valor-P que prueba la significancia estadstica de las
correlaciones estimadas. Valores-P abajo de 0.05 indican correlaciones significativamente diferentes de cero,
con un nivel de confianza del 95.0%. Los siguientes pares de variables tienen valores-P por debajo de 0.05:
Renta nacional y venta de la compaa

2. A continuacin se presenta la relacin entre el nivel de dosis de una droga


antihipertensiva y la presin sangunea sistlica
Nivel de dosis (x)
Presin sistlica (y)

2,5

3,1 3,3 3,8

4,3 4,7

5,6

278 260 240 245 207 202 198 190 145 132 125 111

Nivel de dosis

Presion sangunea sistlica

Grfico de Nivel de dosis vs Presion sangunea sistlica

Correlaciones

Nivel de dosis

(12)
0.0000
Presin sangunea
sistlica

-0.9825
(12)
0.0000

Presin sangunea
sistlica
-0.9825

Nivel de dosis

Nivel de
dosis

2
110 140 170 200 230 260 290
Presion sangunea sistlica

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
Nivel de dosis y Presin sangunea sistlica

3. Dadas las variables, edad y peso de un grupo de diez aos elegidos al azar de una
cierta comunidad:
Edad
(x)

7,0

4,5

3,0

5,5

3,5

7,5

6,2

9,0

8,1

6,8

Peso
(y)

16,5

9,0

7,5

13,0

10,8

15,0

15,0

20,2

17,1

14,0

Edad

Peso

Grfico de Peso vs Edad

Peso

0.9518
(10)
0.0000

22

Peso
0.9518
(10)
0.0000

19

Peso

Correlaciones
Edad
Edad

16
13
10
7
3

6
Edad

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
Edad y Peso

4. El Nutricionista de un hospital realiza un estudio referente a gastos en alimentacin.


Dicho estudio se limit al nmero de comidas y el costo de ests, y los resultados
obtenidos son:
N de Comidas (x)

30

35

40

45

50

55

60

70

75

80

65

Costo por comida


(y)

20

18

16

15

14

13

12

12

11

10

12

Nmero de comidas

Costo por comida

Grfico de Costo por comida vs Nmero de comidas


20

Nmero de
comidas
Nmero de comidas

Costo por comida


-0.9591
(11)
0.0000

Costo por comida

-0.9591
(11)
0.0000

Costo por comida

Correlaciones

18
16
14
12
10
30

40
50
60
70
Nmero de comidas

80

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
Nmero de comidas y Costo por comida

5. En una empresa de transportes trabajan cuatro conductores. Los aos de antigedad


de permisos de conducir y el nmero de infracciones cometidas en el ltimo ao por
cada uno de ellos son los siguientes:

Aos (x)

Infracciones (y)

Aos

Infracciones

Grfico de Infracciones vs Aos


4

Correlaciones
Aos
Aos

Infracciones
-1.0000
(4)
0.0000

Infracciones

Infracciones

3.5
3
2.5
2
1.5

-1.0000
(4)
0.0000

1
3

3.5

4.5
Aos

5.5

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
Aos y Infracciones

6. La informacin estadstica obtenida de una muestra de tamao 12 sobre la relacin


existente entre la inversin realizada y el rendimiento obtenido en cientos de miles de
euros para explotaciones agrcolas, se muestra en el siguiente cuadro:

Inversin (X)

12

11

13

15

16

18

19

21

20

20

17

14

Rendimiento
(Y)

13

10

10

Inversin

Rendimiento

Grfico de Rendimiento vs Inversin


15
12

Inversin
Inversin

Rendimiento

0.3096
(12)
0.3275

Correlacin
(Tamao de Muestra)
Valor-P

Rendimiento
0.3096
(12)
0.3275

Rendimiento

Correlaciones

9
6
3
0
11

13

15
17
Inversin

19

21

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05 :

7. El nmero de horas dedicadas al estudio de una asignatura y la calificacin obtenida


en el examen correspondiente, de ocho personas es:

Horas (X)

19

17

30

21

22

29

15

27

Calificacin (Y)

7.5

6.5

9.5

7.5

8.5

horas

Calificaciones

Grfico de Calificaciones vs horas


9.5

Correlaciones
horas

(8)
0.5386
Calificaciones

0.2572

0.2572
(8)
0.5386

Correlacin
(Tamao de Muestra)
Valor-P

Calificaciones

horas

Calificaciones

8.5
8
7.5
7
6.5
15

18

21
24
horas

27

30

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:

8. Las estaturas de Talla y Peso del equipo titular de la UNS son las siguientes:

Talla

Peso

Grfico de Peso vs Talla


82
78
Peso

Talla

0.8438
(11)
0.0011

Peso

0.8438
(11)
0.0011

Correlacin
(Tamao de Muestra)
Valor-P

74

Peso

Correlaciones
Talla

70
66
62
58
150 155 160 165 170 175 180
Talla

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
Talla y Peso

9. El nmero de celulares vendidos y el precio de cada uno de ellos se muestra en la


siguiente tabla:

numero de celulares vendidos

Precio por cada uno de ellos

Correlaciones

Grfico de numero de celulares vendidos vs Precio por cada uno de ellos

Precio por cada uno 0.1437


de ellos
(13)
0.6396
Correlacin
(Tamao de Muestra)
Valor-P

71
numero de celulares vendidos

numero de celulares Precio por cada


vendidos
uno de ellos
numero de celulares
0.1437
vendidos
(13)
0.6396

61
51
41
31
21
0

100

200
300
Precio por cada uno de ellos

400

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:

500

10. Una empresa de transporte cobra por la cantidad de kilmetros a la que debe llevar a
sus pasajeros y estos datos se muestran en la grafica siguiente:

Kilometros

Precio

Grfico de Precio vs Kilometros


50
40
Kilometros
Kilometros

Precio
0.9930
(15)

Precio

Correlaciones

30
20

0.0000
Precio

0.9930
(15)

10

0.0000
Correlacin
(Tamao de Muestra)
Valor-P

0
0

8
12 16
Kilometros

20

24

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de variables. El rango de estos
coeficientes de correlacin va de -1 a +1, y miden la fuerza de la relacin lineal entre las variables. Tambin se muestra,
entre parntesis, el nmero de pares de datos utilizados para calcular cada coeficiente. El tercer nmero en cada bloque de
la tabla es un valor-P que prueba la significancia estadstica de las correlaciones estimadas. Valores-P abajo de 0.05
indican correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
Kilometros y Precio

4) Se puede analizar con Statgraphics Centurion XVI la Correlacin entre una Variable
Nominal de varias categoras y una Variable Intercalar (u ordinal).

Si se puede relacionar pero la correlacin es dbil; segn este ejemplo podemos observar:

Grfico del Modelo Ajustado


Sexo = 3.11602 - 0.0718232*Edad
2

Sexo

1.8
1.6
1.4
1.2
1
19

21

23
25
Edad

27

29

Regresin Simple - Sexo vs. Edad


Variable dependiente: Sexo (1= Masculino 2= Femenino)
Variable independiente: Edad (Aos)
Lineal: Y = a + b*X
Coeficientes
Parmetro
Intercepto
Pendiente

Mnimos Cuadrados
Estimado
3.11602
-0.0718232

Anlisis de Varianza
Fuente
Suma de Cuadrados
Modelo
0.466851
Residuo
2.03315
Total (Corr.)
2.5

Estndar
Error
1.20294
0.0529926

Gl
1
8
9

Estadstico
T
2.59033
-1.35534

Cuadrado Medio
0.466851
0.254144

Coeficiente de Correlacin = -0.432135


R-cuadrada = 18.674 porciento
R-cuadrado (ajustado para g.l.) = 8.50829 porciento
Error estndar del est. = 0.504127
Error absoluto medio = 0.40663
Estadstico Durbin-Watson = 1.9879 (P=0.3535)
Autocorrelacin de residuos en retraso 1 = -0.17561

Valor-P
0.0321
0.2123

Razn-F
1.84

Valor-P
0.2123

La salida muestra los resultados de ajustar un modelo lineal para describir la relacin entre Sexo y Edad. La ecuacin del
modelo ajustado es
Sexo = 3.11602 - 0.0718232*Edad
Puesto que el valor-P en la tabla ANOVA es mayor o igual a 0.05, no hay una relacin estadsticamente significativa entre
Sexo y Edad con un nivel de confianza del 95.0% ms.
El estadstico R-Cuadrada indica que el modelo ajustado explica 18.674% de la variabilidad en Sexo. El coeficiente de
correlacin es igual a -0.432135, indicando una relacin relativamente dbil entre las variables. El error estndar del
estimado indica que la desviacin estndar de los residuos es 0.504127.

5) Se aplica el Anlisis de Regresin no Lineal en el Diseo de Experimentos. Explique y


grafique con ejemplos en Software.

Tenemos nuestra tabla tomada al azar a 10 estudiantes de una determinada universidad para
determinar si hay una relacin entre la talla y el peso, y los valores se muestran a continuacin:

PASO 1:
Abrimos el statgraphics XVI.

PASO 2:
Llenamos nuestros datos:

PASO 3:
Ponemos en relacionar, luego varios factores enseguida regresin no lineal. Y luego
observamos nuestro anlisis.

REGRESION EXPONENCIAL:

Grfica del Modelo Ajustado


84

Peso

80
76
72
68
64
160

165

170
175
Talla

180

185

Regresin No Lineal - Peso


Variable dependiente: Peso (Kg)
Variables independientes:
Talla (cm)
Funcin a estimar: a*exp(b*Talla)
Estimaciones iniciales de parmetros:
a = 7.5997
b = 0.0132
Mtodo de estimacin: Marquardt
La estimacin se detuvo debido a la convergencia de la suma de cuadrados de residuos.
Nmero de iteraciones: 4
Nmero de llamadas de la funcin: 14

Resultados de la Estimacin

Parmetro
a
b

Estimado
8.06009
0.012831

Error Estndar
Asinttico
1.61225
0.00113231

Anlisis de Varianza
Fuente
Suma de Cuadrados
Modelo
56772.5
Residuo
24.4601
Total
56797.0
Total (Corr.)
396.9

Gl
2
8
10
9

Intervalo Confianza a
Asinttico
Inferior
4.34223
0.0102199

Cuadrado Medio
28386.3
3.05752

R-Cuadrada = 93.8372 porciento


R-Cuadrada (ajustada por g.l.) = 93.0669 porciento
Error estndar del est. = 1.74858
Error medio absoluto = 1.13697

95.0%
Superior
11.7779
0.0154421

Estadstico Durbin-Watson = 1.0551


Autocorrelacin residual de retardo 1 = 0.131615

Anlisis de Residuos

n
CME
MAE
MAPE
ME
MPE

Estimacin
10
3.05752
1.13697
1.57787
-0.00384747
-0.0667751

Validacin

La salida muestra los resultados de ajustar un modelo de regresin no lineal para describir la relacin entre
Peso y 1 variables independientes. La ecuacin del modelo ajustado es
Peso = 8.06009*exp(0.012831*Talla)
Al realizar el ajuste, el proceso de estimacin termin exitosamente despus de 4 iteraciones, en este punto los
coeficientes estimados convergieron con los estimados actuales.
El estadstico R-Cuadrada indica que el modelo, as ajustado, explica 93.8372% de la variabilidad en Peso. El
estadstico R-Cuadrada ajustada, que es ms adecuado para comparar modelos con diferente nmero de
variables independientes es 93.0669%. El error estndar del estimado muestra que la desviacin estndar de
los residuos es 1.74858. Este valor puede utilizarse para construir lmites de prediccin para nuevas
observaciones seleccionando la opcin de Pronsticos del men de texto. El error absoluto medio (MAE) de
1.13697 es el valor promedio de los residuos. El estadstico de Durbin-Watson (DW) prueba los residuos para
determinar si hay alguna correlacin significativa basada en el orden en que se presentaron en su archivo de
datos.

REGRESION POTENCIAL:

Grfica del Modelo Ajustado


84

Peso

80
76
72
68
64
160

165

170

175

Talla

180

185

Regresin No Lineal - Peso


Variable dependiente: Peso (Kg)
Variables independientes:
Talla (cm)
Funcin a estimar: a*Talla^b
Estimaciones iniciales de parmetros:
a = 0.0005
b = 2.3062
Mtodo de estimacin: Marquardt
La estimacin se detuvo debido a convergencia de los parmetros estimados.
Nmero de iteraciones: 9
Nmero de llamadas de la funcin: 31
Resultados de la Estimacin
Error Estndar
Parmetro Estimado
Asinttico
a
0.00068396 0.000648862
b
2.25014
0.173037
Anlisis de Varianza
Fuente
Suma de Cuadrados
Modelo
56774.4
Residuo
22.5842
Total
56797.0
Total (Corr.) 396.9

Gl
2
8
10
9

Intervalo Confianza a
Asinttico
Inferior
-0.000812323
1.85112

95.0%
Superior
0.00218024
2.64917

Cuadrado Medio
28387.2
2.82303

R-Cuadrada = 94.3098 porciento


R-Cuadrada (ajustada por g.l.) = 93.5986 porciento
Error estndar del est. = 1.68019
Error medio absoluto = 1.10356
Estadstico Durbin-Watson = 1.10352
Autocorrelacin residual de retardo 1 = 0.105079
Anlisis de Residuos
Estimacin
Validacin
n
10
CME
2.82303
MAE
1.10356
MAPE 1.53339
ME
-0.00622053
MPE
-0.0658334
El StatAdvisor
La salida muestra los resultados de ajustar un modelo de regresin no lineal para describir la relacin entre
Peso y 1 variables independientes. La ecuacin del modelo ajustado es

Peso = 0.00068396*Talla^2.25014
Al realizar el ajuste, el proceso de estimacin termin exitosamente despus de 9 iteraciones, en este punto la
suma de cuadrados residual se aproxim al mnimo.

El estadstico R-Cuadrada indica que el modelo, as ajustado, explica 94.3098% de la variabilidad en Peso. El
estadstico R-Cuadrada ajustada, que es ms adecuado para comparar modelos con diferente nmero de
variables independientes es 93.5986%. El error estndar del estimado muestra que la desviacin estndar de
los residuos es 1.68019. Este valor puede utilizarse para construir lmites de prediccin para nuevas
observaciones seleccionando la opcin de Pronsticos del men de texto. El error absoluto medio (MAE) de
1.10356 es el valor promedio de los residuos. El estadstico de Durbin-Watson (DW) prueba los residuos para
determinar si hay alguna correlacin significativa basada e el orden en que se presentaron en su archivo de
datos.