Está en la página 1de 6

48.

- Usando la fórmula computacional


En general, el tamaño de un típico
La desviación de la media de la muestra (370.7) es de aproximadamente 24.4. Algunas observaciones
pueden desviarse de
370.7 por un poco más que esto, algunos por menos.

50.- Primero necesitamos……………..Entonces necesitamos el estándar de la muestra.


desviación
El premio máximo debe ser
x + 2s = 747.37 + 2 (606.89) = 1961.16, o en unidades de dólares, $ 1,961,160. Esto es bastante
poco menos que los $ 3.5 millones que se otorgaron originalmente.

51.b.- Si y = tiempo en minutos, entonces y = cx donde


52.- Sea d la denota quinta desviación. Entonces .3 +.9 +1.0 +1.3+ d = 0 o 3.5 + d = 0, entonces
d = -3.5. Una muestra para la cual estas son las desviaciones es 3.8, 1 x = 4.4, 2 x =
4.5, 3 x = 4.8, 4 x = 0. 5 x = (obtenido sumando 3.5 a cada desviación; agregando cualquier otra
número producirá una muestra diferente con la propiedad deseada)
53.- a. mitad inferior: 2,34 2,43 2,62 2,74 2,74 2,75 2,78 3,01 3,46
mitad superior: 3.46 3.56 3.65 3.85 3.88 3.93 3.21 4.21 4.33 4.52
Así, el cuarto más bajo es 2.74 y el cuarto más alto es 3.88.
segundo. = 3.88 - 2.74 = 1.14 s f
do. s f no cambiaría, ya que aumentar los dos valores más grandes no afecta a la parte superior
cuarto.
re. A lo sumo .40 (es decir, a cualquier cosa que no exceda de 2.74), desde entonces no cambiará la
cuarto más bajo
mi. Como n es ahora par, la mitad inferior consta de las 9 observaciones más pequeñas y la parte superior
la mitad consiste en el mayor 9. Con el cuarto más bajo = 2.74 y el cuarto más alto = 3.93,
= 1.19 s f.
54.- a. La mitad inferior del conjunto de datos: 4.4 16.4 22.2 30.0 33.1 36.6, cuya mediana, y
por lo tanto, el cuartil inferior, es
() 26.1.
2
22.2 30.0
+
+
La mitad superior del conjunto de datos: 36.6 40.4 66.7 73.7 81.5 109.9, cuya mediana, y
por lo tanto, el cuartil superior, es
() 70.2
2
66.7 73.7
=
+
.
Entonces, el IQR = (70.2 - 26.1) = 44.1
segundo.
A continuación se muestra un diagrama de caja (creado en Minitab) de estos datos:
AhíHay un ligero sesgo positivo a los datos. La variación parece bastante grande. No existen
valores atípicos
c.-Una observación debería estar más allá de 1.5 (44.1) = 66.15 unidades por debajo del nivel más bajo
cuartil [(26.1-66.15) = - 40.05 unidades] o por encima del cuartil superior
[(70.2 + 66.15) = 136.35 unidades] para ser clasificado como un valor atípico leve. Note que, en este
caso, un valor atípico en el lado inferior no sería posible debido a la variable de fuerza pura
no puede tener un valor negativo
Un extremo atípico caería (3) 44.1) = 132.3 o más unidades por debajo del inferior o superior
el cuartil superior. Dado que las observaciones mínimas y máximas en los datos son 4.4.
y 109.9 respectivamente, llegamos a la conclusión de que no hay valores atípicos, de ningún tipo, en estos
datos
conjunto.
re. No hasta que el valor x = 109.9 se reduzca por debajo de 73.7, no habría ningún cambio en el
Valor del cuartil superior. Es decir, el valor x = 109.9 no podría ser disminuido por más
que (109.9 - 73.7) = 36.2 unidades.

55.-a La mitad inferior del conjunto de datos: 325 325 334 339 356 356 359 359 363 364 364
366 369, cuya mediana, y por lo tanto el cuartil inferior, es 359 (la séptima observación en
la lista ordenada).
La mitad superior de los datos es 370 373 373 374 375 389 392 393 394 397 402
403 424, cuya mediana, y por lo tanto el cuartil superior es 392. Entonces, el IQR = 392 -
359 = 33.
b. 1.5 (IQR) = 1.5 (33) = 49.5 y 3 (IQR) = 3 (33) = 99. Observaciones que están más lejos que
49.5 debajo del cuartil inferior (es decir, 359-49.5 = 309.5 o menos) o más de 49.5 unidades
por encima del cuartil superior (más de 392 + 49.5 = 441.5) se clasifican como valores atípicos 'leves'.
Los valores extremos "extremos" caerían 99 o más unidades por debajo de la inferior, o por encima de la
superior,
cuartilla. Dado que las observaciones mínimas y máximas en los datos son 325 y 424, nosotros
concluya que no hay valores atípicos leves en estos datos (y, por lo tanto, no hay valores atípicos
"extremos"
ya sea).
c. A continuación se muestra una gráfica de caja (creada por Minitab) de estos datos. Hay un ligero
positivo.
sesgar a los datos, pero no está lejos de ser simétrico. La variación, sin embargo, parece
grande (el diferencial 424-325 = 99 es un gran porcentaje de la mediana / valor típico)
re.
d. No hasta que el valor x = 424 se reduzca por debajo del valor del cuartil superior de 392,
Cualquier cambio en el valor del cuartil superior. Es decir, el valor x = 424 no pudo ser
disminuido en más de 424-392 = 32 unidades.
56.- A continuación se muestra una gráfica de caja (creada en Minitab) de estos datos.
Hay un ligero sesgo positivo a estos datos. Hay un outler extremo (x = 511). Incluso cuando
eliminando el valor atípico, la variación sigue siendo moderadamente grande.
57.-a. 1.5 (IQR) = 1.5 (216.8-196.0) = 31.2 y 3 (IQR) = 3 (216.8-196.0) = 62.4.
Valores atípicos leves: observaciones por debajo de 196-31.2 = 164.6 o por encima de 216.8 + 31.2 =
248.
Valores atípicos extremos: observaciones por debajo de 196-62.4 = 133.6 o por encima de 216.8 + 62.4 =
279.2. De
Según las observaciones, 125.8 es un valor extremo extremo y 250.2 es un valor extremo leve.
b.Una gráfica de caja de estos datos aparece a continuación. Hay un poco de sesgo positivo a los datos
pero,
a excepción de los dos valores atípicos identificados en la parte (a), la variación en los datos es
relativamente
pequeña.
58.-La característica más notable de los diagramas de caja comparativos es que los
valores de muestra de la máquina 2 tienen una variación considerablemente mayor
que los valores de muestra de la máquina 1. Sin embargo, una típica El valor, medido
por la mediana, parece ser aproximadamente el mismo para las dos máquinas. los
solo el valor atípico que existe es de la máquina 1
59.-a) ED: mediana = .4 (el valor 14 en la lista ordenada de datos). El cuartil inferior (mediana de
la mitad inferior de los datos, incluida la mediana, ya que n es impar) es
(.1 + .1) / 2 = .1. El cuartil superior es (2.7 + 2.8) / 2 = 2.75. Por lo tanto,
IQR = 2.75 - .1 = 2.65.
No ED: mediana = (1.5 + 1.7) / 2 = 1.6. El cuartil inferior (mediana de los 25 inferiores).
observaciones) es .3; el cuartil superior (mediana de la mitad superior de los datos) es 7.9.
Por lo tanto, IQR = 7.9 - .3 = 7.6.

b) ED: los valores atípicos leves son menores que .1 - 1.5 (2.65) = -3.875 o mayores que 2.75 + 1.5
(2.65) =
6.725. Los valores extremos extremos son menores que .1 - 3 (2.65) = -7.85 o mayores que 2.75 + 3
(2.65) =
10.7. Entonces, las dos observaciones más grandes (11.7, 21.0) son valores extremos extremos y las dos
siguientes
los valores más grandes (8.9, 9.2) son valores atípicos leves. No hay valores atípicos en el extremo
inferior de la
datos.
No ED: los valores atípicos leves son menores que .3 - 1.5 (7.6) = -11.1 o mayores que 7.9 + 1.5 (7.6) =
19.3. Tenga en cuenta que no hay valores atípicos leves en los datos, por lo tanto, no puede haber ningún
extremo
Outliers tampoco.
c) A continuación se muestra una gráfica de caja comparativa. Los valores atípicos en los datos de ED
son claramente visibles.
Hay un sesgo positivo notable en ambas muestras; Los datos no ed. tienen más.
variabilidad entonces los datos ed; Los valores típicos de los datos ED tienden a ser más pequeños que
los de los datos no ED.
60.- A continuación se muestra una gráfica de caja comparativa (creada en Minitab) de estos datos.
Las resistencias al estallido para las soldaduras de cierre de la boquilla de prueba son bastante diferentes
del estallido.
Fortalezas de la producción de la boquilla de la soldadura de la boquilla.
Las soldaduras de prueba tienen resistencias a la rotura mucho más altas y las resistencias a la rotura son
mucho más
variable.
Las soldaduras de producción tienen una resistencia a la rotura más consistente y son consistentemente
más bajas que las
pruebas de soldadura. Los datos de las soldaduras de producción contienen 2 valores atípicos.
61.- Los valores atípicos se producen en los datos de 6 a.m. Las distribuciones en otros momentos son
bastante simétricas.
La variabilidad y los valores 'típicos' en los datos aumentan un poco al mediodía y a las 2 p.m. veces.
5000 6000 7000 8000
prueba
bote
resistencia al estallido
tipo
62.- Para simplificar un poco el álgebra, comience por restar 76,000 de los datos originales. Esta
la transformación afectará a cada valor de fecha y la media. No afectará a la norma.
desviación.
63.- Caudal inferior superior
tasa Cuartil de cuartil mediano IQR 1.5 (IQR) 3 (IQR)

No hay valores atípicos en los tres conjuntos de datos. Sin embargo, como el
diagrama de caja comparativo a continuación muestra, los tres conjuntos de datos
difieren con respecto a sus valores centrales (las medianas son diferentes) y los datos
para la tasa de flujo 160 son algo menos variables que los otros conjuntos de datos.
Caudales 125 y 200 también muestran un pequeño grado de sesgo positivo.
65.-b) La media de los datos de HC es 96.8 / 4 = 24.2; la media de los datos de CO es 735/4 =
183.75. Por lo tanto, el coeficiente de variación de los datos de HC es 9.59 / 24.2 = .3963,
o 39.63%. El coeficiente de variación de los datos de CO es 59.41 / 183.75 = .3233, o
32.33%. Por lo tanto, a pesar de que los datos de CO tienen una desviación estándar más grande que la de
los datos de HC, en realidad muestra menos variabilidad (en términos de porcentaje) en torno a su
promedio que los datos de HC.
66.-a) El histograma aparece abajo. Un valor representativo para estos datos sería x = 90.
El histograma es razonablemente simétrico, unimodal y algo acampanado. los
la variación en los datos no es pequeña ya que la difusión de los datos (99-81 = 18) constituye
Alrededor del 20% del valor típico de 90.
b) La proporción de las observaciones que son al menos 85 es 1 - (6 + 7) / 169 = .9231. los
proporción menor que 95 es 1 - (22 + 13 + 3) / 169 = .7751.
c) x = 90 es el punto medio de la clase 89- <91, que contiene 43 observaciones (un pariente
frecuencia de 43/169 = .2544. Por lo tanto, aproximadamente la mitad de esta frecuencia, .1272, debería
agregarse a las frecuencias relativas para las clases a la izquierda de x = 90. Es decir, la
La proporción aproximada de observaciones que son menores que 90 es .0355 + .0414 + .1006
+ .1775 + .1272 = .4822.
70.-a) Hay una diferencia significativa en la variabilidad de las dos muestras. El entrenamiento con
pesas
produjo un consumo de oxígeno mucho más alto, en promedio, que el ejercicio en cinta rodante,
con los consumos medianos de aproximadamente 20 y 11 litros, respectivamente.
b) Restando la y de la x para cada sujeto, las diferencias son
La mayoría de las diferencias son positivas, lo que sugiere que el entrenamiento con pesas
produce un mayor consumo de oxígeno para la mayoría de los sujetos. La diferencia media es de unos 6.
Litros
71.-a) La mayoría de las diferencias son positivas, lo que sugiere que el entrenamiento con pesas
produce un mayor consumo de oxígeno para la mayoría de los sujetos. La diferencia media es de unos 6.
litros
b) El diagrama de caja también muestra la simetría y agrega una imagen visual de los valores atípicos, dos
en la
Extremo inferior, y uno en la parte superior.
72.- A continuación se muestra una tabla de estadísticas de resumen, una visualización de tallo y hoja y
un diagrama de caja comparativo.
Los individuos sanos tienen una mayor medida de unión al receptor en promedio que los individuos
con trastorno de estrés postraumático. También hay más variación en los valores de los individuos sanos.
La distribución
de valores para la salud es razonablemente simétrica, mientras que la distribución para el PTSD
Los individuos están sesgados negativamente. La gráfica de caja indica que no hay valores atípicos, y
confirma los comentarios anteriores sobre simetría y sesgo.
73.- Los datos parecen estar un poco sesgados hacia valores más pequeños (sesgados negativamente).
No hay valores atípicos. La media y la mediana son valores cercanos.
74.-a) Modo = .93. Ocurre cuatro veces en el conjunto de datos.
b) La categoría modal es aquella en la que se producen más observaciones.
75.-a) La mediana es la misma (371) en cada gráfica y los tres conjuntos de datos son muy simétricos. En
Además, los tres tienen el mismo valor mínimo (350) y el mismo valor máximo (392).
Además, los tres conjuntos de datos tienen los mismos cuartiles inferior (364) y superior (378). Así que
todo
Tres cuadros de caja serán idénticos.
b) A continuación se muestra una gráfica de puntos comparativa. Estos gráficos muestran que hay
diferencias en
La variabilidad de los tres conjuntos de datos. También muestran diferencias en la forma en que los
valores son
Distribuido en los tres conjuntos de datos.
c) El diagrama de caja en (a) no es capaz de detectar las diferencias entre los conjuntos de datos. los
La razón principal es que los diagramas de caja proporcionan algunos detalles para describir los datos
porque usan
sólo 5 números de resumen para comparar conjuntos de datos. Nota: La definición de inferior y
el cuartil superior utilizado en este texto es ligeramente diferente al utilizado por algún otro
Autores (y paquetes de software). Técnicamente hablando, la mediana de la mitad inferior de
Los datos no son realmente el primer cuartil, aunque en general son muy cercanos. En cambio, el
las medianas de las mitades inferior y superior de los datos a menudo se denominan inferior y superior
bisagras Nuestros diagramas de caja utilizan las bisagras inferior y superior para definir la extensión del
medio
50% de los datos, pero otros autores a veces usan los cuartiles reales para este propósito.
La diferencia suele ser muy leve, generalmente imperceptible, pero no siempre. Por ejemplo
en los conjuntos de datos de este ejercicio, un diagrama de caja comparativo basado en los cuartiles reales
(como
calculado por Minitab) se muestra a continuación. La gráfica muestra sustancialmente el mismo tipo de
información tal como se describe en (a), excepto que los gráficos basados en cuartiles son capaces de
Detectar las ligeras diferencias en la variación entre los tres conjuntos de datos.
76.- The measures that are sensitive to outliers are: the mean and the midrange. The mean is
sensitive because all values are used in computing it. The midrange is sensitive because it
uses only the most extreme values in its computation.
The median, the trimmed mean, and the midhinge are not sensitive to outliers.
The median is the most resistant to outliers because it uses only the middle value (or values)
in its computation.
The trimmed mean is somewhat resistant to outliers. The larger the trimming percentage, the
more resistant the trimmed mean becomes.
The midhinge, which uses the quartiles, is reasonably resistant to outliers because both
quartiles are resistant to outliers.
78.-a) Como la constante x se resta de cada valor x para obtener cada valor y, y
la suma o resta de una constante no afecta la variabilidad,
b) Sea c = 1 / s, donde s es la desviación estándar muestral de las x y también (por a) de las y.
Entonces sz = csy = (1 / s) s = 1, y sz
2 = 1. Es decir, las cantidades "estandarizadas" z1, ..., zn
tener una varianza muestral y una desviación estándar de 1.
80.-b) Proporción menor que
Proporción al menos
c) Primer cálculo (.90) (391 + 1) = 352.8. Por lo tanto, el percentil 90 debe ser alrededor del 352
valor ordenado El valor ordenado 351 se encuentra en el intervalo 28 - <30. El ordenamiento 352
el valor se encuentra en el intervalo 30 - <35. Hay 27 valores en el intervalo 30 - <35. Lo hacemos
sin saber cómo se distribuyen estos valores, sin embargo, el valor más pequeño (es decir, el 352o.
valor en el conjunto de datos) no puede ser inferior a 30. Por lo tanto, el percentil 90 es aproximadamente
30.
d)Primer cálculo (.50) (391 + 1) = 196. Por lo tanto, la mediana (percentil 50) debe ser la 196
valor ordenado El valor ordenado 174 se encuentra en el intervalo 16 - <18. Los siguientes 42
la observación se encuentra en el intervalo 18 - <20. Por lo tanto, la observación ordenada 175 a 216 se
encuentra en el
intervalos 18 - <20. La observación 196 se trata en medio de estos. Así, nosotros
Diría que la mediana es aproximadamente 19.

81.-Suponiendo que el histograma es unimodal, entonces hay evidencia de sesgo positivo en el


datos desde que la mediana se encuentra a la izquierda de la media (para una distribución simétrica, la
media y
la mediana coincidiria). Para más evidencia de sesgo, compara las distancias del 5to.
y percentiles 95 de la mediana: mediana - percentil 5 = 500 - 400 = 100 mientras 95
percentil -median = 720 - 500 = 220. Por lo tanto, el 5% más grande de los valores (por encima del 95
percentil) están más alejados de la mediana que el 5% más bajo. La misma asimetría es evidente.
al comparar los percentiles 10 y 90 con la mediana: mediana - percentil 10 = 500 -
430 = 70, mientras que el percentil 90 - mediano = 640 - 500 = 140. Finalmente, tenga en cuenta que el
mayor
el valor (925) está mucho más lejos de la mediana (925-500 = 425) que el valor más pequeño (500 -
220 = 280), nuevamente una indicación de sesgo positivo.
82.-a) Hay alguna evidencia de un patrón cíclico.
d) No muy sensible, ya que (1-a) t-1 será muy pequeño.
83.- a)Cuando hay simetría perfecta, la observación más pequeña y1 y la más grande
la observación yn será equidistante de la mediana, entonces y x x y1 n - = -.
Del mismo modo, el segundo más pequeño y el segundo más grande serán equidistantes de
la mediana, entonces 1 2 y x x y n - = - -
y así. Así, los números primero y segundo en cada par serán iguales, de modo que
cada punto de la parcela caerá exactamente en la línea de 45 grados. Cuando los datos son
sesgado positivamente, yn estará mucho más lejos de la mediana que y1, entonces y x n
-~
superará considerablemente a 1
x ~ - y y el punto (~, ~) 1 y x x y n - - caerán
considerablemente por debajo de la línea de 45 grados. Un comentario similar se aplica a otros puntos en
la trama.

b) El primer punto en el gráfico es (2745.6 - 221.6, 221.6 0 - 4.1) = (2524.0, 217.5). los
otros son: (1476.2, 213.9), (1434.4, 204.1), (756.4, 190.2), (481.8, 188.9), (267.5,
181.0), (208.4, 129.2), (112.5, 106.3), (81.2, 103.3), (53.1, 102.6), (53.1, 92.0),
(33.4, 23.0), y (20.9, 20.9). El primer número en cada uno de los primeros siete pares.
exceda en gran medida el segundo número, por lo que cada punto cae muy por debajo de la línea de 45
grados.
Se indica un sesgo positivo sustancial (cola superior estirada).

También podría gustarte