Documentos de Académico
Documentos de Profesional
Documentos de Cultura
78 – Estadística aplicada II
Trabajo práctico Nº 2
Informe grupal
Primer cuatrimestre de 2021
Grupo - M05
Para la realización del trabajo se construyó una ballesta siguiendo el instructivo Ballestanian.pdf.
El fin es poder analizar las distancias recorridas por los proyectiles lanzados mediante la ballesta.
En este caso los proyectiles utilizados fueron tapitas de botellas de jugo de la marca Cepita. Se
colocaron en un bowl 15 tapitas plásticas y para cada lanzamiento se escogió una tapita al azar
sin reposición.
Para el Experimento 1, se definió la variable X como la distancia del broche desde el extremo de
la ballesta medida en cm. Se tomaron 6 valores de referencia para los cuales se hicieron 5
lanzamientos, los mismos se midieron con una cinta métrica y se encuentran en el Anexo 1. Los
niveles seleccionados fueron: 7cm, 8cm, 9cm, 10cm, 11cm, y 12cm.
Para el Experimento 2, se definió la variable X1 como la distancia del broche desde el extremo
de la ballesta medida en m y X2 como la altura a la cual se encontraba la ballesta medida en cm.
La altura se consiguió colocando libros del mismo espesor debajo de la ballesta. Se tomaron 5
valores de referencia de ambas variables, para los cuales se hicieron 3 lanzamientos. Los datos se
encuentran reflejados en el Anexo 2. Los niveles seleccionados para X1 fueron: 7cm, 8cm, 9cm,
10cm, y 11cm, mientras que para X2 fueron: 5cm, 10cm, 15cm, 20cm, y 25cm.
El método de medición optado para el trabajo fue pintar todos los bordes con abundante témpera
de cada tapita antes de ser lanzada. De esta manera, se pudo observar claramente el momento en
que la tapita tocaba el suelo, ya que dejaba una mancha en el mismo. Luego de cada lanzamiento
se limpiaba toda mancha del suelo para evitar confusiones con las nuevas manchas del siguiente
lanzamiento.
PARTE 1
1.1 Luego de realizarse los lanzamientos, se construyó la tabla que se encuentra en el Anexo 1 a
partir de la cual se ejecutó el gráfico de dispersión que se observa en la Gráfico 1.1. El mismo
hace referencia al test de correlación de Pearson, el cual se llevó a cabo utilizando el programa
Minitab. Del gráfico se infiere que la variable explicativa X tiene una correspondencia con
respecto a Y lineal y positiva. Se calculó, además, el coeficiente de Correlación de Pearson,
siendo su valor r = 0,987 lo cual confirma su alta correlación.
Se planteó la siguiente prueba de hipótesis para analizar el nivel significativo de la correlación:
𝐻0 ) ρ = 0 Los datos no presentan correlación.
𝐻0 ) ρ ≠0 Los datos presentan correlación.
Si el valor de p es menor a 5% se rechaza la hipótesis nula H0, ya que los datos no tienen
correlación entre sí. Si el valor de p resulta mayor a 5% se concluye que los datos tienen
correlación entre sí, y no se rechaza la hipótesis nula H0. En este caso se obtuvo un valor de 0,000
para el valor de p, el mismo se puede observar en la Tabla 1.1, con lo cual se rechaza H0 y se
concluye que los datos resultan tener correlación con una certeza del 95%.
PARTE 2
En esta sección se procederá a analizar el Modelo de Lineal de Primer Orden (MPO)
correspondiente al Experimento 1.
2.2 En la Tabla 2.1 se presentan los resultados obtenidos del análisis de varianza para el
Experimento 1. Se procedió a realizar un ensayo de hipótesis con un nivel de significación α =
5%, dónde la hipótesis nula global es: Ho) 𝛽𝑖 = 0 contra la hipótesis alterna Ha) 𝛽𝑖 ≠ 0 para 𝑖 =
1 donde la condición de rechazo es que el valor p sea menor o igual a α = 0,05. En este caso, se
puede observar que el valor p obtenido es de 0,000 por lo que se rechaza la hipótesis nula,
2.3 A continuación, la Tabla 2.2 dispone la estimación de los coeficientes individuales del
modelo, cuyo análisis a realizar es correcto dado que se rechazó previamente la hipótesis nula
global. El ensayo de hipótesis con un nivel de significación del 5% propuesto para el término de
mayor orden (X) es el siguiente: Ho) 𝛽1 = 0 contra
Ha) 𝛽1 ≠ 0 donde la condición de rechazo es que
el valor p sea menor o igual a α = 0,05. Se puede
observar que valor p = 0,000 ≤ α = 0,05 por lo que
se procede a rechazar Ho y se concluye que la
Tabla 2.2: Coeficientes individuales
pendiente 𝛽1 es significativa con un nivel de
certeza del 95%. Para el término independiente, no
se realiza ningún test, dado que su análisis es poco relevante en este caso y siempre se incluye en
el modelo ajustado final.
2.5 Se procede a realizar un análisis residual para la variable Y (la distancia en cm recorrida por
la tapita), representado en la Figura 2.1, con el objetivo de validar los supuestos mencionados en
la sección 2.1 anteriormente.
Para el supuesto de normalidad, adicionalmente se realizó la prueba de normalidad de
Kolmogorov-Smirnov para los residuos, representada en el Gráfico 2.1, dónde: Ho) Los residuos
siguen una distribución normal vs. Ha) Los residuos no siguen una distribución normal. Dado que
el valor p que arroja esta prueba es mayor a 0,15 no se tiene evidencia suficiente para rechazar la
hipótesis nula, y por ende se puede concluir que los residuos siguen una distribución normal, con
un riesgo máximo de estar equivocados del 15%. Por otro lado, en la gráfica de probabilidad
normal de la Figura 2.1 también podemos observar que los residuos se distribuyen en las cercanías
de la recta de normalidad, lo que también nos da un indicio del cumplimiento del supuesto.
En el caso del supuesto de homocedasticidad, podemos observar el gráfico de residuos
estandarizados vs. valor ajustado en la Figura 2.1 y notar que no existe un patrón altamente
Cómo último comentario, también se puede observar el histograma en la Figura 2.1, el cual resulta
relevante dado que el modelo cuenta con 30 observaciones. Se nota que no existen valores de los
residuos estándares mayores a 3 y a -3, por lo tanto, no hay indicios de tener outliers en la muestra.
2.6 Luego de haber validado los supuestos de mínimos cuadrados en la sección anterior, el modelo
de regresión lineal ajustado de primer orden propuesto es: 𝑌𝑖 ̂ = 29,51 + 18,114𝑋𝑖. Se puede
interpretar entonces que por cada un centímetro que aumente la distancia del broche desde el
extremo de la ballesta (X), la distancia recorrida por la tapita aumentará 18,114 centímetros (Y).
Recordando que la prueba de falta de ajuste realizada en la sección 2.2 fue significativa, se llega
a la conclusión de que este modelo no es el más indicado para predecir los valores de Y en función
de X. Sin embargo, es importante aclarar que dicha conclusión no invalida el modelo propuesto,
sino que solo nos muestra que este no posee un buen ajuste.
PARTE 3
En esta sección se procederá a analizar el Modelo de Lineal de Primer Orden (MPO)
correspondiente al Experimento 2.
3.5 Para validar los supuestos utilizados en el modelo, se realizó un análisis residual de la variable
Y. En el Gráfico 3.1, se pueden observar los gráficos de residuos para Y.
Normalidad: Los puntos al principio de la recta forman una onda, lo que implica una distribución
de colas cortas. Esto da indicios de que no se cumple el supuesto de normalidad. Para corroborar
lo observado, se realizó la prueba de normalidad de Kolmogorov-Smirnov con las siguientes
3.6 El modelo de regresión lineal múltiple ajustado de primer orden propuesto es:
̂𝑖 =92,03+12,06𝑋1𝑖 +1,896𝑋2𝑖 . Por lo tanto, observando la fórmula anterior se puede decir que
𝑌
la distancia recorrida por los proyectiles aumenta en 12,06 cm si se incrementa en 1 cm la distancia
del broche (𝑋1𝑖 ), manteniéndose 𝑋2𝑖 . constante. Además, si se incrementa la altura en la que se
efectuó el disparo en 1 cm (𝑋2𝑖 ), con 𝑋1𝑖 constante, la distancia recorrida de los proyectiles
aumenta en 1,896 cm.
PARTE 4
Tabla 4.1: Ecuación de Regresión Exp 1 Tabla 4.2: Coeficientes de Ecuación de Regresión Exp 1
Tabla 4.3: Datos Resumen de Modelo Exp 1. Tabla 4.4: Valores de Análisis de Varianza Exp 1
Se comienza analizando la Tabla 4.4, donde se observa que en la falta de ajuste el valor p arroja
una cifra de 0,000 que resulta ser menor a 𝛼 = 0,05. Entonces se rechaza la hipótesis nula y se
concluye que el modelo de segundo orden no ajusta bien a los datos con una certeza del 95%.
Continuando con la Tabla 4.2, se empieza analizando la variable de mayor orden, en nuestro caso
la de orden 2. Se realiza el siguiente ensayo de hipótesis: Ho) 𝛽2 = 0 vs. Ha) 𝛽2 ≠ 0 donde la
condición de rechazo es que el valor p sea menor o igual a α = 0,05. Cómo arroja un valor de p =
0,083 > 𝛼 = 0,05, se rechaza la hipótesis nula y el término resulta ser no significativo y se debe
descartarlo con un riesgo máximo de equivocarse del 5%. Inmediatamente, se prosigue con la
variable del orden siguiente, siendo en este caso la de orden 1, realizando el siguiente test: Ho)
𝛽1 = 0 vs. Ha) 𝛽1 ≠ 0 donde la condición de rechazo es que el valor p sea menor o igual a α =
0,05. Como arroja un valor de p = 0,000 menor a α = 0,05 no se tiene evidencia suficiente para
rechazar la hipótesis nula y el termino resulta significativo con una certeza del 95%. Al tener una
variable significativa de orden 1, se considera que todas las variables de menor orden tienen que
estar incluidas en el modelo, aunque hayan arrojado resultados que indiquen lo contrario.
Adicionalmente, la correlación lineal de la PARTE 1 resultó ser significativa, mientras que en
este caso el modelo no lo fue ya que el valor arrojado de p fue 0,391 > 𝛼 =0,05. Este está incluido
en el modelo, a pesar de ser no significativo debido a que la variable de orden 1 fue significativa.
Estudiando ahora el 𝑅 2 expuesto en la Tabla 4.3 tiene un valor de 97,67%, entonces el 97,67%
de la variabilidad de la distancia en centímetros recorrida por los proyectiles es explicado por el
modelo. Para completar, la desviación estándar del error arroja un valor de S = 5,04677.
Se procede a analizar la gráfica de los residuos, Gráfico 4.1 para verificar el cumplimiento de los
supuestos de mínimos cuadrados.
Normalidad: En el gráfico de probabilidad normal se puede notar que los puntos no se ajustan a
la recta y que presentan un patrón ondulado de colas cortas. Por lo tanto, no se da como válido el
supuesto.
Independencia: En el gráfico de residuos vs orden de observación se valida el supuesto, dado que
no se observa ninguna dependencia entre las variables.
4.2 Se presenta a continuación una tabla comparativa de MPO y MSO propuesta para el
Experimento 1
Falta de
Cantidad de 2
Cantidad de 𝑅 Ajuste
Modelo Ecuación de Predicción Parámetros S Error
Parámetros ajustado (valor
significativos
de p)
MPO ̂ = 29,51 +18,114Xi
𝑌𝑖 2 2 5,24424 97,29% 0,000 27,5
̂ = -28,5 + 30,74Xi-
𝑌𝑖
MSO 3 2 5,04677 97,49% 0,000 25,5
0,664𝑋𝑖 2
4.3 Los modelos lineales planteados son de primer y segundo orden para el experimento 1.
Mediante la Tabla expuesta en el inciso 4.2 se analizan la cantidad de parámetros no
significativos, el coeficiente de determinación ajustado, el error experimental y el p-value que
señala la falta de ajuste. Si se estudia el modelo de segundo orden, el parámetro cuadrático no
proporciona información dado que no es significativo. Sin embargo, su 𝑅 2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 es levemente
mayor, lo que quiere decir que explica un poco mejor la variabilidad de la distancia recorrida por
las tapas (Y) que en el modelo de primer orden. También el MSO posee una menor desviación
estándar del error que el MPO, lo que implica que la dispersión de los valores en el primer modelo
mencionado es menor a la del segundo. Analizando ahora el p-value, ambos modelos presentan
uno menor a 0,05 por lo que se presencia una falta de ajuste en ambos modelos con una certeza
del 95%. Tanto MPO como MSO, no ajustan
de manera correcta los datos, lo que expone
que es necesario un término de orden superior
para que el ajuste sea el indicado.
Tabla 4.5: Ecuación de Regresión Exp 1 Tabla 4.6: Coeficientes de Ecuación de Regresión Exp 1
Tabla 4.7: Datos Resumen de Modelo Exp 1. Tabla 4.8: Valores de Análisis de Varianza Exp 1
Se comienza analizando la Tabla 4.8, donde se observa que en la falta de ajuste el valor p arroja
una cifra de 0,000 que resulta ser menor 𝛼 = 0,05. Entonces se rechaza la hipótesis nula y entonces
se concluye que el modelo de segundo orden no ajusta bien a los datos con una certeza del 95%.
Continuando con la Tabla 4.6, se comienza analizando las variables de mayor orden, en nuestro
caso la de orden 2. En el caso de X2, se emplea el siguiente ensayo de hipótesis: Ho) 𝛽4 = 0 vs.
Ha) 𝛽4 ≠ 0 donde la condición de rechazo es que el valor p sea menor o igual a α = 0,05. Como
arroja un valor de p = 0,009 menor a 𝛼 = 0,05 se rechaza la hipótesis nula y se concluye entonces
que el término es significativo con una certeza del 95%. En el caso de X1, se emplea el siguiente
ensayo de hipótesis: Ho) 𝛽3 = 0 vs. Ha) 𝛽3 ≠ 0 donde la condición de rechazo es que el valor p
sea menor o igual a α = 0,05. Como arroja un valor de p = 0,000 menor a 𝛼 = 0,05 se rechaza la
hipótesis nula y se concluye entonces que el término es significativo con una certeza del 95%. Al
tener por lo menos una variable significativa de orden 2, se considera que todas las variables
siguientes de menor orden tienen que estar incluidas en el modelo, aunque hayan arrojado
resultados que indiquen lo contrario.
Adicionalmente, sabemos que la correlación lineal de la PARTE 1 resultó ser significativa. En
este caso, dicho término también resulto significativo, ya que el valor arrojado de p fue 0,041
menor a 𝛼 =0,05. Por lo tanto, se incluye en el modelo, teniendo en cuenta que las variables de
mayor orden resultaron ser también significativas. Estudiando ahora el 𝑅 2 expuesto en la Tabla
4.7 tiene un valor de 94,53%, entonces el 94,53% de la variabilidad de la distancia en centímetros
recorrida por los proyectiles es explicado por el modelo. Para completar, se puede observar que
la desviación estándar del error arrojó un valor de S = 5,47513.
Se procede a analizar la gráfica de los residuos, Gráfico 4.2 para verificar el cumplimiento de los
supuestos de mínimos cuadrados.
4.5 Se presenta a continuación una tabla comparativa de MPO y MSO propuesta para el
Experimento 2
Falta de
Cantidad Cantidad de
𝑅2 Ajuste
Modelo Ecuación de Predicción de Parámetros S Error
ajustado (valor
Parámetros significativos
de p)
MPO ̂ = 92,03 +12,06𝑋1𝑖 +1,896𝑋2𝑖
𝑌𝑖 3 3 6,50629 91,83% 0,000 42,3
̂ = -62,9 + 45,75𝑋1𝑖 +3,107𝑋2𝑖
𝑌𝑖
MSO -1,871𝑋1𝑖 2-0,0404𝑋2𝑖 2
5 5 5,47513 94,21% 0,000 29,98
4.6 Los modelos lineales planteados son de primer y segundo orden para el Experimento 2.
Mediante la Tabla expuesta en el inciso 4.5 se analizan la cantidad de parámetros no
significativos, el coeficiente de determinación ajustado, el error experimental y el p-value que
señala la falta de ajuste. En ambos modelos, todas las variables de cada uno resultan significativas.
Sin embargo, su 𝑅 2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 del MSO es mayor al del MPO, lo que quiere decir que explica un
poco mejor la variabilidad de la distancia recorrida por las tapas (Y) que en el MPO. También el
MSO posee una menor desviación estándar del error que el MPO, lo que implica que la dispersión
de los valores en el primer modelo mencionado es menor a la del segundo. Analizando ahora el
p-value, ambos modelos presentan uno menor a 0,05 por lo que se presencia una falta de ajuste
en ambos modelos con una certeza del 95%. Tanto MPO como MSO, no ajustan de manera
correcta los datos, lo que expone que es necesario un término de orden superior para que el ajuste
sea el indicado.
Anexo 1
Anexo 1: Datos obtenidos de los lanzamientos de las tapitas que conforman el Experimento 1
(Aclaración: X es la distancia en centímetros del broche desde la punta de la ballesta)
Anexo 2.
EXPERIMENTO 2
N X1 X2 Y N X1 X2 Y N X1 X2 Y
1 7 5 165 28 11 10 240 55 10 20 251
2 7 5 167 29 11 10 238 56 10 20 256
3 7 5 172 30 11 10 237 57 10 20 254
4 8 5 194 31 7 15 209 58 11 20 262
5 8 5 203 32 7 15 210 59 11 20 257
6 8 5 202 33 7 15 212 60 11 20 258
7 9 5 219 34 8 15 225 61 7 25 222
8 9 5 217 35 8 15 223 62 7 25 226
9 9 5 220 36 8 15 227 63 7 25 225
10 10 5 226 37 9 15 234 64 8 25 231
11 10 5 221 38 9 15 230 65 8 25 235
12 10 5 228 39 9 15 238 66 8 25 238
13 11 5 232 40 10 15 240 67 9 25 248
14 11 5 233 41 10 15 245 68 9 25 250
15 11 5 237 42 10 15 242 69 9 25 247
16 7 10 178 43 11 15 255 70 10 25 251
Anexo 2: Datos obtenidos de los lanzamientos de las tapitas que conforman el Experimento 2.
(Aclaración: X1 es la distancia del broche desde la punta de la ballesta en centímetros y X2 la
altura de la ballesta desde el suelo en centímetros)
Material provisto por la cátedra I.T.B.A – 11.78 Estadística Aplicada II, 2021