55.-a La mitad inferior del conjunto de datos: 325 325 334 339 356 356 359 359 363 364 364
366 369, cuya mediana, y por lo tanto el cuartil inferior, es 359 (la séptima observación en
la lista ordenada).
La mitad superior de los datos es 370 373 373 374 375 389 392 393 394 397 402
403 424, cuya mediana, y por lo tanto el cuartil superior es 392. Entonces, el IQR = 392 -
359 = 33.
b. 1.5 (IQR) = 1.5 (33) = 49.5 y 3 (IQR) = 3 (33) = 99. Observaciones que están más lejos que
49.5 debajo del cuartil inferior (es decir, 359-49.5 = 309.5 o menos) o más de 49.5 unidades
por encima del cuartil superior (más de 392 + 49.5 = 441.5) se clasifican como valores atípicos 'leves'.
Los valores extremos "extremos" caerían 99 o más unidades por debajo de la inferior, o por encima de la
superior,
cuartilla. Dado que las observaciones mínimas y máximas en los datos son 325 y 424, nosotros
concluya que no hay valores atípicos leves en estos datos (y, por lo tanto, no hay valores atípicos
"extremos"
ya sea).
c. A continuación se muestra una gráfica de caja (creada por Minitab) de estos datos. Hay un ligero
positivo.
sesgar a los datos, pero no está lejos de ser simétrico. La variación, sin embargo, parece
grande (el diferencial 424-325 = 99 es un gran porcentaje de la mediana / valor típico)
re.
d. No hasta que el valor x = 424 se reduzca por debajo del valor del cuartil superior de 392,
Cualquier cambio en el valor del cuartil superior. Es decir, el valor x = 424 no pudo ser
disminuido en más de 424-392 = 32 unidades.
56.- A continuación se muestra una gráfica de caja (creada en Minitab) de estos datos.
Hay un ligero sesgo positivo a estos datos. Hay un outler extremo (x = 511). Incluso cuando
eliminando el valor atípico, la variación sigue siendo moderadamente grande.
57.-a. 1.5 (IQR) = 1.5 (216.8-196.0) = 31.2 y 3 (IQR) = 3 (216.8-196.0) = 62.4.
Valores atípicos leves: observaciones por debajo de 196-31.2 = 164.6 o por encima de 216.8 + 31.2 =
248.
Valores atípicos extremos: observaciones por debajo de 196-62.4 = 133.6 o por encima de 216.8 + 62.4 =
279.2. De
Según las observaciones, 125.8 es un valor extremo extremo y 250.2 es un valor extremo leve.
b.Una gráfica de caja de estos datos aparece a continuación. Hay un poco de sesgo positivo a los datos
pero,
a excepción de los dos valores atípicos identificados en la parte (a), la variación en los datos es
relativamente
pequeña.
58.-La característica más notable de los diagramas de caja comparativos es que los
valores de muestra de la máquina 2 tienen una variación considerablemente mayor
que los valores de muestra de la máquina 1. Sin embargo, una típica El valor, medido
por la mediana, parece ser aproximadamente el mismo para las dos máquinas. los
solo el valor atípico que existe es de la máquina 1
59.-a) ED: mediana = .4 (el valor 14 en la lista ordenada de datos). El cuartil inferior (mediana de
la mitad inferior de los datos, incluida la mediana, ya que n es impar) es
(.1 + .1) / 2 = .1. El cuartil superior es (2.7 + 2.8) / 2 = 2.75. Por lo tanto,
IQR = 2.75 - .1 = 2.65.
No ED: mediana = (1.5 + 1.7) / 2 = 1.6. El cuartil inferior (mediana de los 25 inferiores).
observaciones) es .3; el cuartil superior (mediana de la mitad superior de los datos) es 7.9.
Por lo tanto, IQR = 7.9 - .3 = 7.6.
b) ED: los valores atípicos leves son menores que .1 - 1.5 (2.65) = -3.875 o mayores que 2.75 + 1.5
(2.65) =
6.725. Los valores extremos extremos son menores que .1 - 3 (2.65) = -7.85 o mayores que 2.75 + 3
(2.65) =
10.7. Entonces, las dos observaciones más grandes (11.7, 21.0) son valores extremos extremos y las dos
siguientes
los valores más grandes (8.9, 9.2) son valores atípicos leves. No hay valores atípicos en el extremo
inferior de la
datos.
No ED: los valores atípicos leves son menores que .3 - 1.5 (7.6) = -11.1 o mayores que 7.9 + 1.5 (7.6) =
19.3. Tenga en cuenta que no hay valores atípicos leves en los datos, por lo tanto, no puede haber ningún
extremo
Outliers tampoco.
c) A continuación se muestra una gráfica de caja comparativa. Los valores atípicos en los datos de ED
son claramente visibles.
Hay un sesgo positivo notable en ambas muestras; Los datos no ed. tienen más.
variabilidad entonces los datos ed; Los valores típicos de los datos ED tienden a ser más pequeños que
los de los datos no ED.
60.- A continuación se muestra una gráfica de caja comparativa (creada en Minitab) de estos datos.
Las resistencias al estallido para las soldaduras de cierre de la boquilla de prueba son bastante diferentes
del estallido.
Fortalezas de la producción de la boquilla de la soldadura de la boquilla.
Las soldaduras de prueba tienen resistencias a la rotura mucho más altas y las resistencias a la rotura son
mucho más
variable.
Las soldaduras de producción tienen una resistencia a la rotura más consistente y son consistentemente
más bajas que las
pruebas de soldadura. Los datos de las soldaduras de producción contienen 2 valores atípicos.
61.- Los valores atípicos se producen en los datos de 6 a.m. Las distribuciones en otros momentos son
bastante simétricas.
La variabilidad y los valores 'típicos' en los datos aumentan un poco al mediodía y a las 2 p.m. veces.
5000 6000 7000 8000
prueba
bote
resistencia al estallido
tipo
62.- Para simplificar un poco el álgebra, comience por restar 76,000 de los datos originales. Esta
la transformación afectará a cada valor de fecha y la media. No afectará a la norma.
desviación.
63.- Caudal inferior superior
tasa Cuartil de cuartil mediano IQR 1.5 (IQR) 3 (IQR)
No hay valores atípicos en los tres conjuntos de datos. Sin embargo, como el
diagrama de caja comparativo a continuación muestra, los tres conjuntos de datos
difieren con respecto a sus valores centrales (las medianas son diferentes) y los datos
para la tasa de flujo 160 son algo menos variables que los otros conjuntos de datos.
Caudales 125 y 200 también muestran un pequeño grado de sesgo positivo.
65.-b) La media de los datos de HC es 96.8 / 4 = 24.2; la media de los datos de CO es 735/4 =
183.75. Por lo tanto, el coeficiente de variación de los datos de HC es 9.59 / 24.2 = .3963,
o 39.63%. El coeficiente de variación de los datos de CO es 59.41 / 183.75 = .3233, o
32.33%. Por lo tanto, a pesar de que los datos de CO tienen una desviación estándar más grande que la de
los datos de HC, en realidad muestra menos variabilidad (en términos de porcentaje) en torno a su
promedio que los datos de HC.
66.-a) El histograma aparece abajo. Un valor representativo para estos datos sería x = 90.
El histograma es razonablemente simétrico, unimodal y algo acampanado. los
la variación en los datos no es pequeña ya que la difusión de los datos (99-81 = 18) constituye
Alrededor del 20% del valor típico de 90.
b) La proporción de las observaciones que son al menos 85 es 1 - (6 + 7) / 169 = .9231. los
proporción menor que 95 es 1 - (22 + 13 + 3) / 169 = .7751.
c) x = 90 es el punto medio de la clase 89- <91, que contiene 43 observaciones (un pariente
frecuencia de 43/169 = .2544. Por lo tanto, aproximadamente la mitad de esta frecuencia, .1272, debería
agregarse a las frecuencias relativas para las clases a la izquierda de x = 90. Es decir, la
La proporción aproximada de observaciones que son menores que 90 es .0355 + .0414 + .1006
+ .1775 + .1272 = .4822.
70.-a) Hay una diferencia significativa en la variabilidad de las dos muestras. El entrenamiento con
pesas
produjo un consumo de oxígeno mucho más alto, en promedio, que el ejercicio en cinta rodante,
con los consumos medianos de aproximadamente 20 y 11 litros, respectivamente.
b) Restando la y de la x para cada sujeto, las diferencias son
La mayoría de las diferencias son positivas, lo que sugiere que el entrenamiento con pesas
produce un mayor consumo de oxígeno para la mayoría de los sujetos. La diferencia media es de unos 6.
Litros
71.-a) La mayoría de las diferencias son positivas, lo que sugiere que el entrenamiento con pesas
produce un mayor consumo de oxígeno para la mayoría de los sujetos. La diferencia media es de unos 6.
litros
b) El diagrama de caja también muestra la simetría y agrega una imagen visual de los valores atípicos, dos
en la
Extremo inferior, y uno en la parte superior.
72.- A continuación se muestra una tabla de estadísticas de resumen, una visualización de tallo y hoja y
un diagrama de caja comparativo.
Los individuos sanos tienen una mayor medida de unión al receptor en promedio que los individuos
con trastorno de estrés postraumático. También hay más variación en los valores de los individuos sanos.
La distribución
de valores para la salud es razonablemente simétrica, mientras que la distribución para el PTSD
Los individuos están sesgados negativamente. La gráfica de caja indica que no hay valores atípicos, y
confirma los comentarios anteriores sobre simetría y sesgo.
73.- Los datos parecen estar un poco sesgados hacia valores más pequeños (sesgados negativamente).
No hay valores atípicos. La media y la mediana son valores cercanos.
74.-a) Modo = .93. Ocurre cuatro veces en el conjunto de datos.
b) La categoría modal es aquella en la que se producen más observaciones.
75.-a) La mediana es la misma (371) en cada gráfica y los tres conjuntos de datos son muy simétricos. En
Además, los tres tienen el mismo valor mínimo (350) y el mismo valor máximo (392).
Además, los tres conjuntos de datos tienen los mismos cuartiles inferior (364) y superior (378). Así que
todo
Tres cuadros de caja serán idénticos.
b) A continuación se muestra una gráfica de puntos comparativa. Estos gráficos muestran que hay
diferencias en
La variabilidad de los tres conjuntos de datos. También muestran diferencias en la forma en que los
valores son
Distribuido en los tres conjuntos de datos.
c) El diagrama de caja en (a) no es capaz de detectar las diferencias entre los conjuntos de datos. los
La razón principal es que los diagramas de caja proporcionan algunos detalles para describir los datos
porque usan
sólo 5 números de resumen para comparar conjuntos de datos. Nota: La definición de inferior y
el cuartil superior utilizado en este texto es ligeramente diferente al utilizado por algún otro
Autores (y paquetes de software). Técnicamente hablando, la mediana de la mitad inferior de
Los datos no son realmente el primer cuartil, aunque en general son muy cercanos. En cambio, el
las medianas de las mitades inferior y superior de los datos a menudo se denominan inferior y superior
bisagras Nuestros diagramas de caja utilizan las bisagras inferior y superior para definir la extensión del
medio
50% de los datos, pero otros autores a veces usan los cuartiles reales para este propósito.
La diferencia suele ser muy leve, generalmente imperceptible, pero no siempre. Por ejemplo
en los conjuntos de datos de este ejercicio, un diagrama de caja comparativo basado en los cuartiles reales
(como
calculado por Minitab) se muestra a continuación. La gráfica muestra sustancialmente el mismo tipo de
información tal como se describe en (a), excepto que los gráficos basados en cuartiles son capaces de
Detectar las ligeras diferencias en la variación entre los tres conjuntos de datos.
76.- The measures that are sensitive to outliers are: the mean and the midrange. The mean is
sensitive because all values are used in computing it. The midrange is sensitive because it
uses only the most extreme values in its computation.
The median, the trimmed mean, and the midhinge are not sensitive to outliers.
The median is the most resistant to outliers because it uses only the middle value (or values)
in its computation.
The trimmed mean is somewhat resistant to outliers. The larger the trimming percentage, the
more resistant the trimmed mean becomes.
The midhinge, which uses the quartiles, is reasonably resistant to outliers because both
quartiles are resistant to outliers.
78.-a) Como la constante x se resta de cada valor x para obtener cada valor y, y
la suma o resta de una constante no afecta la variabilidad,
b) Sea c = 1 / s, donde s es la desviación estándar muestral de las x y también (por a) de las y.
Entonces sz = csy = (1 / s) s = 1, y sz
2 = 1. Es decir, las cantidades "estandarizadas" z1, ..., zn
tener una varianza muestral y una desviación estándar de 1.
80.-b) Proporción menor que
Proporción al menos
c) Primer cálculo (.90) (391 + 1) = 352.8. Por lo tanto, el percentil 90 debe ser alrededor del 352
valor ordenado El valor ordenado 351 se encuentra en el intervalo 28 - <30. El ordenamiento 352
el valor se encuentra en el intervalo 30 - <35. Hay 27 valores en el intervalo 30 - <35. Lo hacemos
sin saber cómo se distribuyen estos valores, sin embargo, el valor más pequeño (es decir, el 352o.
valor en el conjunto de datos) no puede ser inferior a 30. Por lo tanto, el percentil 90 es aproximadamente
30.
d)Primer cálculo (.50) (391 + 1) = 196. Por lo tanto, la mediana (percentil 50) debe ser la 196
valor ordenado El valor ordenado 174 se encuentra en el intervalo 16 - <18. Los siguientes 42
la observación se encuentra en el intervalo 18 - <20. Por lo tanto, la observación ordenada 175 a 216 se
encuentra en el
intervalos 18 - <20. La observación 196 se trata en medio de estos. Así, nosotros
Diría que la mediana es aproximadamente 19.
b) El primer punto en el gráfico es (2745.6 - 221.6, 221.6 0 - 4.1) = (2524.0, 217.5). los
otros son: (1476.2, 213.9), (1434.4, 204.1), (756.4, 190.2), (481.8, 188.9), (267.5,
181.0), (208.4, 129.2), (112.5, 106.3), (81.2, 103.3), (53.1, 102.6), (53.1, 92.0),
(33.4, 23.0), y (20.9, 20.9). El primer número en cada uno de los primeros siete pares.
exceda en gran medida el segundo número, por lo que cada punto cae muy por debajo de la línea de 45
grados.
Se indica un sesgo positivo sustancial (cola superior estirada).