Está en la página 1de 50

Prctica Diseo de Experimentos y Regresin Lineal Simple

Obtencin de Datos: Realizar el experimento de lanzamiento de un helicptero desde una altura bien determinada
Definir con la mayor claridad el experimento
Diagrama y dimensiones del helicptero
Instrucciones y/o secuencia de fabricacin
Instrucciones y/o secuencia para la realizacin del experimento
Identificar las variables respuesta (dar o no en un blanco, tiempo de caida, distanc
Identificar el mximo de factores controlables y no controlables que influyen en ca
factores controlables: material, dimensiones, modo de lanzamiento, altura, etc
Cada factor controlable se puede valorar en niveles: por ejemplo pesado, ligero, p
factores no controlables: viento, turbulencias, humedad, obstaculos, errores sistem
Un diagrama de Ishikawa o diagrama de causa efecto o diagrama de esqueleto de
Cada uno de ustedes modifico un factor controlable, realiz en lanzamiento 5 veces y cada vez m
Se realizaron modificaciones del factor antes y despus de un valor promedio (por ejemplo si el

Algunas Hiptesis que podemos contrastar son

Existe al menos un nivel de factor que influya significativamente sobre la respues


Si es el caso cual o cuales niveles influyen ms sobre la respuesta
Para que niveles no se observan diferencias significativas sobre la respuesta
Es posible decir que a medida que el nivel del factor aumenta , aumenta o dismin
Es posible decir que los niveles altos influyen ms que los niveles bajos sobre la re
El estudio estadstico descriptivo es congruente con los resultados de intervalos d
Se cumplen las hiptesis de Normalidad e Igualdad de varianzas ?

layyoutmuestras layoutdox Herramientas Estadsticas


x x Adems del arsenal de Estadstica descriptiva (graficas, tablas, estadsticas)
x Los intervalos de confianza nos permiten establecer estimaciones de intervalo par
x Las pruebas de hiptesis nos permiten contrastar una aseveracin con otra. Por ej
x x El Anlisis de Varianza permite decidir si hay o no diferencias entre ms de dos m
x El Anlisis de Regresin permite evaluar la asociacin entre dos variables y obtene
En la hoja regresin esta una salida completa de computadora: obtener una salida
x El Anlisis de varianza de regresin permite evaluar si el modelo es o no significat
x Las comparaciones mltiples despus del ANOVA permiten distinguir cuales nivele
x x Las pruebas de Normalidad nos permiten evaluar si los rsiduos provienen o no de
x Las pruebas de igualdad de varianzas nos permiten evaluar si las varianzas son o

Una cruz indica cul es el arreglo de los datos ms adecuado para aplicar la herramienta

Documentos de Apoyo

http://ce.azc.uam.mx/profesores/hjv/texts/ProgramaR/EstadisticaenR/Risk-Cartas-s
http://ce.azc.uam.mx/profesores/hjv/texts/ProgramaR/EstadisticaenR/Beasley-Bioe
http://www.cs.wisc.edu/~yandell/st571/R/append.html
fotocopias entregadas en clase
Usar las bibliotecas de normalidad en R
para instalar la biblioteca nortest solo hay que ir al menu instalar paquetes a part
Entregar en Excel y en R con el mximo de formulas editadas y con el mapa
po de caida, distancia que se aleja, etc, etc
s que influyen en cada variable respuesta
ento, altura, etc
plo pesado, ligero, por ejemplo 5 cm, 10 cm, 13 cm, etc
culos, errores sistemticos,.
ma de esqueleto de pescado ayuda a visualizar y organizar los factores y su efecto sobre una respuesta dada (no siempre resulta el mismo diag
veces y cada vez midi las variables respuesta
o (por ejemplo si el valor promedio de la longitud del ala es 10 cm, se eligieron los niveles 6 cm, 8 cm, 10cm, 12 cm, 14 cm.), en el caso del mat

te sobre la respuesta

e la respuesta
, aumenta o disminuyen la respuesta ?
les bajos sobre la respuesta ?
dos de intervalos de confianza ?

, estadsticas)
nes de intervalo para una respuesta. Por ejemplo el promedio poblacional se encuentra entre tal y tal valor a un nivel de confianza de 1- alfa
cin con otra. Por ejemplo el promedio de tiempo de caida es 5 sec, contra el promedio de tiempo de caida es distinto a 5 sec.
entre ms de dos muestras
s variables y obtener eventualmente un modelo lineal, no lineal
: obtener una salida completa para sus datos apoyandose en los documentos y en el libro de Regresin Lineal
lo es o no significativo
tinguir cuales niveles tienen mayor, menor o misma influencia sobre la respuesta (diferencia mnima significativa, diferencia de Tukey, diferencia
s provienen o no de una distribucin Normal (qqplot, Shapiro, Anderson Darling, Cramer, Kolmogorov, Ch2,)
las varianzas son o no iguales entre dos o mas muestras (radio de dos varianzas, prueba de Bartlett, etc)

caenR/Risk-Cartas-sobre-Estadistica.pdf
caenR/Beasley-BioestatisticaUsandoR.pdf

lar paquetes a partir de archivo test y elegir nortest


empre resulta el mismo diagrama Ishikawa para distintas variables respuesta)

, 14 cm.), en el caso del material se eligieron dos materales ligeros y dos pesados respecto al papel bond.

el de confianza de 1- alfa
to a 5 sec.
ferencia de Tukey, diferencia ponderada, etc)
MUESTRA 1 MUESTRA 2
PAPEL CEBOLLA PAPEL ESTRAZA

REPETICIN TIEMPO (s) DISTANCIA (cm) REPETICIN


1 3.2 486 1
2 3.9 466 2
3 2.8 50 3
4 3.0 182 4
5 4.9 262 5
MUESTRA 3
EL ESTRAZA PAPEL BOND

TIEMPO (s) DISTANCIA (cm) REPETICIN TIEMPO (s)


5.4 501 1 5.5
3.6 400 2 6.5
5.2 574 3 5.4
5.5 95 4 5.7
4.2 374 5 5.4
MUESTRA 4
PAPEL CARTONCILLO

DISTANCIA (cm) REPETICIN TIEMPO (s) DISTANCIA (cm)


610 1 2.7 137
758 2 3.1 165
254 3 2.7 172
76 4 2.6 291
407 5 2.8 55
MUESTRA 5
PAPEL FOMI

ANCIA (cm) REPETICIN TIEMPO (s) DISTANCIA (cm)


1 4.2 320
2 4.5 235
3 3.6 509
4 3.9 87
5 3.6 177
t1 d1 t2 d2 t3 d3
3.2 486 5.4 501 5.5 610
3.9 466 3.6 500 6.5 758
2.8 50 5.2 574 5.4 254
3.0 182 5.5 95 5.7 76
4.9 262 4.2 374 5.4 407

tlig tpes
3.2 2.7
3.9 3.1
2.8 2.7
3.0 2.6
4.9 2.8
5.4 4.2
3.6 4.5
5.2 3.6
5.5 3.9
4.2 3.6

t.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE,
conf.level = 0.95, ...)

t.test(x$t1,alternative = c("two.sided"), mu = 2, conf.level = 0.95)

t.test(x$t1, alternative = c("greater"), mu = 2, conf.level = 0.95)

var.interval = function(data, conf.level = 0.95) {


df = length(data) - 1
chilower = qchisq((1 - conf.level)/2, df)
chiupper = qchisq((1 - conf.level)/2, df, lower.tail = FALSE)
v = var(data)
c(df * v/chiupper, df * v/chilower)
}
var.interval(x$t1)

var.test(y$tlig, y$tpes, ratio = 1, alternative = c("two.sided"), conf.level = 0.95)


t.test(y$tlig, y$tpes,alternative = c("less"), mu = 0,var.equal = TRUE, conf.level = 0.95)
t4 d4 t5 d5
2.7 137 4.2 320
3.1 165 4.5 235
2.7 172 3.6 509
2.6 291 3.9 87
2.8 55 3.6 177

evel = 0.95)
papel distancia tiempo dif total
1 486 3.2 -0.956 0.913936
1 466 3.9 -0.256 0.065536
1 50 2.8 -1.356 1.838736
1 182 3.0 -1.156 1.336336
1 262 4.9 3.56 0.744 0.553536
2 501 5.4 1.244 1.547536
2 400 3.6 -0.556 0.309136
2 574 5.2 1.044 1.089936
2 95 5.5 1.344 1.806336
2 374 4.2 4.78 0.044 0.001936
3 610 5.5 1.344 1.806336
3 758 6.5 2.344 5.494336
3 254 5.4 1.244 1.547536
3 76 5.7 1.544 2.383936
3 407 5.4 5.7 1.244 1.547536
4 137 2.7 -1.456 2.119936
4 165 3.1 -1.056 1.115136
4 172 2.7 -1.456 2.119936
4 291 2.6 -1.556 2.421136
4 55 2.8 2.78 -1.356 1.838736
5 320 4.2 0.044 0.001936
5 235 4.5 0.344 0.118336
5 509 3.6 -0.556 0.309136
5 87 3.9 -0.256 0.065536
5 177 3.6 3.96 -0.556 0.309136
4.156 1.06581E-014 32.6616
dif intra dif entre
-0.36 0.1296 3.56 -0.596 0.355216
0.34 0.1156 3.56 -0.596 0.355216
-0.76 0.5776 3.56 -0.596 0.355216
-0.56 0.3136 3.56 -0.596 0.355216
1.34 0 1.7956 3.56 -0.596 0.355216
0.62 0.3844 4.78 0.624 0.389376
-1.18 1.3924 4.78 0.624 0.389376
0.42 0.1764 4.78 0.624 0.389376
0.72 0.5184 4.78 0.624 0.389376
-0.58 7.9936E-016 0.3364 4.78 0.624 0.389376
-0.2 0.04 5.7 1.544 2.383936
0.8 0.64 5.7 1.544 2.383936
-0.3 0.09 5.7 1.544 2.383936
0 0 5.7 1.544 2.383936
-0.3 0 0.09 5.7 1.544 2.383936
-0.08 0.0064 2.78 -1.376 1.893376
0.32 0.1024 2.78 -1.376 1.893376
-0.08 0.0064 2.78 -1.376 1.893376
-0.18 0.0324 2.78 -1.376 1.893376
0.02 2.6645E-016 0.0004 2.78 -1.376 1.893376
0.24 0.0576 3.96 -0.196 0.038416
0.54 0.2916 3.96 -0.196 0.038416
-0.36 0.1296 3.96 -0.196 0.038416
-0.06 0.0036 3.96 -0.196 0.038416
-0.36 0 0.1296 3.96 -0.196 0.038416
7.36 4.156 25.3016
papel distancia tiempo kg
1 486 3.2 6
1 466 3.9 6
1 50 2.8 6
1 182 3.0 6
1 262 4.9 6
2 501 5.4 8
2 400 3.6 8
2 574 5.2 8
2 95 5.5 8
2 374 4.2 8
3 610 5.5 10
3 758 6.5 10
3 254 5.4 10
3 76 5.7 10
3 407 5.4 10
4 137 2.7 12
4 165 3.1 12
4 172 2.7 12
4 291 2.6 12
4 55 2.8 12
5 320 4.2 14
5 235 4.5 14
5 509 3.6 14
5 87 3.9 14
5 177 3.6 14
No x y x-xbar y-ybar (x-xb)(y-yb)
1 43 128 -14.5 -8.5 123.25
2 48 120 -9.5 -16.5 156.75
3 56 135 -1.5 -1.5 2.25
4 61 143 3.5 6.5 22.75
5 67 141 9.5 4.5 42.75
6 70 152 12.5 15.5 193.75
Mean 57.5 136.5 541.5
Sum 345 819 541.5
b
a

Clculos para el ANOVA de la Regresin


81+.96X
No x y yhat (y-ybar)^2 (yhat-ybar)^2
1 43 128 122.52 72.25 195.54
2 48 120 127.34 272.25 83.94
3 56 135 135.05 2.25 2.09
4 61 143 139.88 42.25 11.39
5 67 141 145.66 20.25 83.94
6 70 152 148.55 240.25 145.32
Mean 57.5 136.5 SST SSM
Sum 345 819 649.5000 522.2124

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.89667281
R Square 0.80402214
Adjusted R Sq 0.75502767
Standard Erro 5.64109082
Observations 6

ANOVA
df SS MS F
Regression 1 522.212378 522.212378 16.4104684
Residual 4 127.287622 31.8219056
Total 5 649.5

Coefficients Standard Error t Stat P-value


Intercept 81.0480855 13.8808808 5.83882872 0.00428903
X Variable 1 0.96438112 0.23806098 4.05098364 0.01546317
RESIDUAL OUTPUT

Observation Predicted Y Residuals


1 122.516474 5.48352627
2 127.338379 -7.33837934
3 135.053428 -0.05342832
4 139.875334 3.12466607
5 145.661621 -4.66162066
6 148.554764 3.44523598
(x-xbar)^2 yhat (y-yhat)^2
210.25 122.52 30.07
90.25 127.34 53.85
2.25 135.05 0.00
12.25 139.88 9.76
90.25 145.66 21.73
156.25 148.55 11.87
561.5
561.5 127.287622
0.96438112
81.0480855

(y-yhat)^2
30.07
53.85
0.00
9.76
21.73
11.87
SSE
127.2876

Significance F
0.01546317

Lower 95% Upper 95% Lower 95.0% Upper 95.0%


42.5085819 119.587589 42.5085819 119.587589
0.30341789 1.62534436 0.30341789 1.62534436
Treatment x (x-xbar)^2 xibar (xibar-xbar)^2 (x-xibar)^2
1 10 5.138 11.8 16.538 3.24
1 12 18.204 11.8 16.538 0.04
1 9 1.604 11.8 16.538 7.84
1 15 52.804 11.8 16.538 10.24
1 13 27.738 11.8 16.538 1.44
2 6 3.004 3.8 15.471 4.84
2 8 0.071 3.8 15.471 17.64
2 3 22.404 3.8 15.471 0.64
2 0 59.804 3.8 15.471 14.44
2 2 32.871 3.8 15.471 3.24
3 5 7.471 7.6 0.018 6.76
3 9 1.604 7.6 0.018 1.96
3 12 18.204 7.6 0.018 19.36
3 8 0.071 7.6 0.018 0.16
3 4 13.938 7.6 0.018 12.96
Total 264.933 160.133 104.800
SSM(between SSE(within)
160.133

Mean Sum Sum^2 n Sum^2/n


Treat 1 11.8 59 3481 5 696.2
Treat 2 3.8 19 361 5 72.2
Treat 3 7.6 38 1444 5 288.8
Total 7.73333333 116.000 15

ANOVA Table
Source SS df MS F
Model (between) 160.133 2 80.067 9.168
Error (within) 104.800 12 8.733
Total 264.933 14
Tabla ANOVA para x segn Treatment

Anlisis de la Varianza
------------------------------------------------------------------------------
Fuente Sumas de cuad. Gl Cuadrado Medio Cociente-F P-Valor
------------------------------------------------------------------------------
Entre grupos 160.133 2 80.0667 9.17 0.0038
Intra grupos 104.8 12 8.73333
------------------------------------------------------------------------------
Total (Corr.) 264.933 14

Tabla de Medias para x segn Treatment


con 95.0 intervalos LSD
--------------------------------------------------------------------------------
Error Estndar
Treatment Frec. Media (s agrupada) Lmite inf. Lmite sup.
--------------------------------------------------------------------------------
1 5 11.8 1.32162 9.76384 13.8362
2 5 3.8 1.32162 1.76384 5.83616
3 5 7.6 1.32162 5.56384 9.63616
--------------------------------------------------------------------------------
Total 15 7.73333

Tabla de Medias para x segn Treatment


con 95.0 intervalos HSD de Tukey
--------------------------------------------------------------------------------
Error Estndar
Treatment Frec. Media (s agrupada) Lmite inf. Lmite sup.
--------------------------------------------------------------------------------
1 5 11.8 1.32162 9.29997 14.3
2 5 3.8 1.32162 1.29997 6.30003
3 5 7.6 1.32162 5.09997 10.1
--------------------------------------------------------------------------------
Total 15 7.73333

Anlisis de Regresin - Modelo Lineal Y = a + b*X


-----------------------------------------------------------------------------
Variable dependiente: x
Variable independiente: Treatment
-----------------------------------------------------------------------------
Error Estadstico
Parmetro Estimacin estndar T P-Valor
-----------------------------------------------------------------------------
Ordenada 11.9333 2.81556 4.23836 0.0010
Pendiente -2.1 1.30335 -1.61123 0.1311
-----------------------------------------------------------------------------

Anlisis de la Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 44.1 1 44.1 2.60 0.1311
Residuo 220.833 13 16.9872
-----------------------------------------------------------------------------
Total (Corr.) 264.933 14
Coeficiente de Correlacin = -0.407991
Contraste Mltiple de Rango para x segn Treatment

-----------------------------------------------------------------
Mtodo: 95.0 porcentaje LSD
Treatment Frec. Media Grupos homogneos
-----------------------------------------------------------------
2 5 3.8 X
3 5 7.6 X
1 5 11.8 X
-----------------------------------------------------------------
Contraste Diferencias +
-----------------------------------------------------------------
1 - 2 *8.0 4
1 - 3 *4.2 4
2 - 3 -3.8 4
-----------------------------------------------------------------
* indica una diferencia significativa.

ociente-F P-Valor
egn Treatment

--------------------------------------------

Grupos homogneos
--------------------------------------------
--------------------------------------------
Diferencias +/- Lmites
--------------------------------------------
*8.0 4.07231
*4.2 4.07231
-3.8 4.07231
--------------------------------------------
No x y (x-xbar) (y-ybar) (x-xbar)^2
1 43 128 -14.5 -8.5 210.25
2 48 120 -9.5 -16.5 90.25
3 56 135 -1.5 -1.5 2.25
4 61 143 3.5 6.5 12.25
5 67 141 9.5 4.5 90.25
6 70 152 12.5 15.5 156.25

Sum 345 819 561.5


Mean 57.5 136.5
SSxx

Correlation coefficient 0.89667281


(y-ybar)^2 (x-xbar)(y-ybar)
72.25 123.25
272.25 156.75
2.25 2.25
42.25 22.75
20.25 42.75
240.25 193.75

649.5 541.5

SSyy SPxy