Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Primer Parcial
Diseño Experimental para Biotecnología Vegetal
Código: BTU36 NRC: 7092 𝟐𝟎𝟐𝟎 − 𝟎𝟓 − 𝟏𝟗𝟑
Horario de clase: Martes y Jueves 7h15- 9h15
Docente: Pedro Romero Saker # celular: 0987294056
Correo institucional: pjromero@espe.edu.ec
Tarea: Lectura informativa del silabo de la asignatura.
Evaluación de la asignatura
EVALUACIÓN POR UNIDAD
Examen 7 35%
(prueba
conjunta)
Pruebas 7 35%
3 Unidades
parciales
Cuaderno 6 30%
(PdA)
Total 20 100%
𝟐𝟎𝟐𝟎 − 𝟎𝟓 − 𝟐𝟏𝟔
Tarea 02: Lectura connotativa del capítulo 01 (Introducción al diseño de
experimentos) del libro: Gutiérrez H. & de la Vara R., Análisis y diseño de
experimentos.3°ed.
Poner como título esta tarea el nombre de este capítulo y a continuación los
siguientes subtítulos que vayan apareciendo; inmediatamente a cada
subtitulo realizar un resumen (a mano) de su contenido. Este resumen debe
incluir los conceptos clave, tablas, figuras y demás.
Resolver las preguntas y ejercicios de este capítulo.
Capítulo 01. Introducción al diseño de experimentos
El diseño de experimentos hoy
El diseño estadístico de experimentos es precisamente la forma más eficaz de hacer
pruebas. El diseño de experimentos consiste en determinar cuáles pruebas se deben
realizar y de qué manera, para obtener datos que, al ser analizados estadísticamente,
proporcionen evidencias objetivas que permitan responder las interrogantes planteadas, y
de esa manera clarificar los aspectos inciertos de un proceso, resolver un problema o
lograr mejoras. El diseño de experimentos (DDE) es un conjunto de técnicas activas, en
el sentido de que no esperan que el proceso mande las señales útiles, sino que éste se
“manipula” para que proporcione la información que se requiere para su mejora.
Diseño de experimentos en la investigación
El objetivo de los métodos estadísticos es lograr que el proceso de generar conocimiento
y aprendizaje sea lo más eficiente posible. En este proceso, que ha demostrado ser
secuencial, interactúan dos polos: por un lado, están la teoría, los modelos, las hipótesis,
las conjeturas y los supuestos; por el otro están la realidad, los hechos, los fenómenos, la
evidencia y los datos. Así, como se comenta en Box et al. (1978), una hipótesis inicial
lleva a un proceso de deducción en el que las consecuencias derivadas de la hipótesis
pueden compararse con los datos. Cuando las consecuencias y los datos no corresponden,
entonces la discrepancia puede llevar a un proceso de inducción, en el cual se modifica
la hipótesis original.
Breve historia del diseño de experimentos
El diseño estadístico de experimentos, desde su introducción por Ronald A. Fisher en la
primera mitad del siglo XX en Inglaterra, se ha utilizado para conseguir un aprendizaje
acelerado. El trabajo de Fisher, a través de su libro The Design of Experiments (1935),
influyó de manera decisiva en la investigación agrícola, ya que aportó métodos para
evaluar los resultados de experimentos con muestras pequeñas.
10 60 1
20 60 2
30 60 3
10 90 4
20 90 5
30 90 6
9. Señale las etapas en el diseño de un experimento, así como algunos aspectos clave
de cada una de ellas.
1. Planeación y realización.
Entender y delimitar el problema u objeto de estudio.
Elegir las variables de respuesta que será medida en cada punto del diseño y
verificar que se mide de manera confiable.
Determinar cuáles factores deben estudiarse o investigarse, de acuerdo a la
supuesta influencia que tienen sobre la respuesta.
Seleccionar los niveles de cada factor, así como el diseño experimental adecuado
a los factores que se tienen y al objetivo del experimento.
Planear y organizar el trabajo experimental.
Realizar el experimento.
2. Análisis
3. Interpretación
Se recomienda decidir qué medidas implementar para generalizar el resultado del estudio
y para garantizar que las mejoras se mantengan.
10. ¿Por qué se considera la planeación del experimento como la etapa más
importante? Describa cinco actividades que se realizan en esta etapa.
11. Describa de manera breve los tres principios básicos del diseño de experimentos.
· Aleatorización: Consiste en hacer las corridas experimentales en orden aleatorio (al azar)
y con material también seleccionado aleatoriamente. Este principio aumenta la
probabilidad de que el supuesto de independencia de los errores se cumpla, lo cual es un
requisito para la validez de las pruebas de estadísticas que se realizan.
· Bloqueo: Consiste en nulificar o tomar en cuenta, en forma adecuada, todos los factores
que puedan afectar la respuesta observada.
12. Explique la diferencia entre significancia práctica y significancia estadística.
Proponga un ejemplo donde se tenga la segunda pero no la primera.
En ciertos casos, el experimentador puede encontrar que dos tratamientos son diferentes
a nivel estadístico. Esas diferencias pueden ser significativas pero no necesariamente
representan una diferencia práctica. La significancia estadística indica que la diferencia
entre hipótesis Ho y H1 es ajena al azar. Es la probabilidad de tomar la decisión de
rechazar la hipótesis nula cuando ésta es verdadera (decisión conocida como error de tipo
I, o falso positivo). Mientras que la significancia práctica indica la relevancia del estudio,
puesto que podría ser insignificante en ciertas situaciones. Se requiere de conocimiento
especializado para determinar si la diferencia es significativa desde el punto de vista
práctico. Se puede emplear intervalos de confianza junto con el valor p para su
determinación. Por ejemplo, una muestra de pacientes con una enfermedad determinada,
existe la posibilidad de que un efecto observado se deba a las diferencias entre la muestra
y la población total (error de muestreo) en lugar del medicamento en investigación. Puede
ser que el medicamento no sea efectivo, sin embargo no se le rechaza como tratamiento
contra la enfermedad. En la práctica, si se medica a los pacientes con este químico, no se
curan y pueden presentar efectos secundarios o morir.
13. Describa los cinco aspectos que son relevantes al momento de seleccionar el
diseño experimental.
14. Mencione dos problemas en su área de trabajo que pudieran abordarse con el
diseño de experimentos. Para cada problema enlista algunos factores de control y al
menos una variable de respuesta.
Los factores influyentes son los caballos de fuerza del motor, la gasolina, el tipo de aceite,
las llantas, entre otros. La variable de respuesta a evaluar son: La cantidad de galones de
combustible consumidos por días, y la velocidad máxima alcanzada.
16. Se quiere comparar el desgaste de dos marcas de llantas A y B, para lo cual se
eligen al azar 10 conductores particulares de cierta ciudad. A cinco de ellos,
seleccionados al azar, se les instalan gratis las llantas marca A y a los cinco restantes
la marca B, con el compromiso por escrito de permitir la verificación del desgaste
cada seis meses.
a) ¿Cree que este experimento permita una comparación justa del desgaste de las
dos marcas de llantas?
En parte sí y en parte no, pues hay que tomar en cuenta factores como los siguientes:
b) ¿Qué consideraciones se podrían hacer para lograr una comparación más justa?
17. Una compañía farmacéutica realizó un experimento para comprobar los tiempos
promedio (en días) que son necesarios para que una persona se recupere de los
efectos y las complicaciones que siguen a un resfriado común. En este experimento
se compararon a personas que tomaron distintas dosis diarias de vitamina C. Para
hacer el experimento se contactó a un número determinado de personas, que en
cuanto les daba el resfriado empezaban a recibir algún tipo de dosis. Si la edad de
las personas es una posible fuente de variabilidad, explique con detalle cómo
aplicaría la idea de bloqueo para controlar tal fuente de variabilidad.
Con el bloqueo de edad de las personas en el diseño de experimentos implicaría que los
tratamientos contendrán a todas las edades, por ende el efecto de estos en la variable de
respuesta se verá anulado y podremos saber el efecto de las demás variables.
Al ser distintos tratamientos, lo más probable es que el sabor del producto final sea
distinto en cada uno. El diseño experimental, a mi parecer, falla en escoger la pregunta a
responderse y debería centrarse en cómo las variaciones influyen en el sabor de la
mermelada. En este contexto, el método de calificación no refleja el resultado directo de
cómo influyen lo factores en el sabor y tan solo compara, con una escala numérica, que
mermelada sabe mejor.
Adicionalmente, la muestra escogida para las encuestas puede no ser representativa del
mercado real de consumidores de mermelada. La variable de respuesta es subjetiva y
sesgada a los gustos de las personas encuestadas. A nivel de un proyecto inicial el diseño
puede resultar favorable, pero no se ha aplicado una prueba de sabor rigurosa que permita
dar luz verde a la industrialización y posterior comercialización de mermelada de tuna.
20. Investigar quien fue Ronald A. Fisher y algunas de sus contribuciones al diseño
de experimentos.
21. Indagar en forma breve cuál ha sido el papel del diseño de experimentos en el
éxito de la industria de Japón.
En Japón se empezó a desarrollar el uso de diseño de experimentos de manera sistemática
desde 1960 en las industrias. Lo que ha dado como resultado un crecimiento industrial
acelerado en este país. Como nos dice Llui Saderra en su libro “El secreto de la calidad
Japonesa” de 1993
”El diseño estadístico de experimentos constituye el corazón de la ingeniería de calidad
y es, sin duda, la verdadera arma secreta que está detrás del éxito industrial de los
japoneses”
Lo que nos quiere decir que implementar el diseño de experimentos en las industrias,
aumenta la calidad de los productos, se disminuyen los gastos de producción y se mejora
la competencia con otros países.
22. Buscar por medio de internet, por ejemplo en scholar.google.com, artículos de
revistas científicas o tecnológicas donde se reporten los resultados de una
investigación experimental que sea de su interés. Para cada artículo anotar la
referencia completa, es decir: autor(es), año, título del trabajo y nombre de la
revista; además hacer una síntesis de lo que trata el artículo y el tipo de diseño o
pruebas que se realizaron.
Referencia:
Santiz, J., Rincón, R., & Gutierrez, F. (2012). In vitro propagation of Agave
grijalvensis B.Ullrich, an endemic species from Chiapas. Guyana - Botánica(69),
23-30. Obtenido de
http://www2.udec.cl/~gvalencia/pdf/GB2012_69_ne_Santiz_etal.pdf
∑ 𝑐𝑖 𝑌𝑖 ~ 𝑁 (∑ 𝑐𝑖 𝜇𝑖 , ∑ 𝑐𝑖 2 𝜎𝑖 2 ) ; 𝑐𝑖 ∈ ℝ
𝑖=1 𝑖=1 𝑖=1
Caso particular 1:
Si 𝑌𝑖 ~ NID (µ, σ2 ) entonces:
𝑛 𝑛 𝑛
∑ 𝑐𝑖 𝑌𝑖 ~ 𝑁 (𝜇 ∑ 𝑐𝑖 , 𝜎 2 ∑ 𝑐𝑖 2 )
𝑖=1 𝑖=1 𝑖=1
∑ 𝑌𝑖 ~ 𝑁 (𝑛𝜇, 𝑛𝜎 2 )
𝑖=1
𝜎2 𝑌̅ − 𝜇
𝑌̅~ 𝑁 (𝜇, ) ⟹ 2
𝜎 = 𝑍 ~ 𝑁(0, 1 )
𝑛
PdE √𝑛
Propiedad 2
Si 𝑌𝑖 ~ 𝐵𝑒𝑟 𝐼𝐷 (𝜋) Ber: Bernoulli; Bin: Binomial; TdLC: Teorema de limite central
entonces:
𝑛 𝑛
TdLC
∑ 𝑌𝑖 ~ 𝐵𝑖𝑛 (𝑛, 𝜋) ⟹ ∑ 𝑌𝑖 ~ 𝑁(𝑛𝜋, 𝑛𝜋(1 − 𝜋))
𝑖=1 nπ>5 𝑖=1
n(1-π)>5
n(1-π)>5
Ejercicio N°1: Se tiene una VAdRE entonces Y sigue una distribución normal (µ, σ2 );
supongamos que σ2 es conocida. Se realiza el diseño experimental respectivo y se obtiene
una muestra de tamaño “n” donde se ha calculado 𝑦̅. Calcular dos números L(de low) y
U(de upper) cuya distancia sea mínima y tales que el intervalo abierto ]L, U[ contenga a
µ con una alta probabilidad de 1-α fijada “a priori” y conocida como NdC (nivel de
confianza).
Pr(μ ∈ ]L, U[) = 1 − α ⟺ Pr (L < μ < U) = 1 − α
Pr (−U < −μ < −L) = 1 − α
𝑦̅ − 𝑈 𝑌̅ − 𝜇 𝑦̅ − 𝐿
𝑃𝑟 ( 𝜎 <𝜎 <𝜎 )=1−𝛼
⁄ 𝑛 ⁄ 𝑛 ⁄ 𝑛
√ √ √
𝑦̅ − 𝑈 𝑦̅ − 𝐿
𝑃𝑟 ( 𝜎 <𝑍<𝜎 )= 1−𝛼
⁄ 𝑛 ⁄ 𝑛
√ √
𝑦̅ − 𝑈 𝑦̅ − 𝐿
= −𝑍1−𝛼 (𝟏) 𝜎 = 𝑍1−𝛼2 (𝟐)
𝜎/√𝑛 2
√𝑛
𝜎
De (1): 𝐿 = 𝑦̅ − 𝑍1−𝛼
2 √𝑛
𝜎
De (2): 𝑈 = 𝑦̅ + 𝑍1−𝛼 𝐸 = |𝑦̅ − 𝜇|
2 √𝑛
𝜎
̅𝑍 𝛼
⟹ 𝐼𝑑𝐶𝜇 (1 − 𝛼) = 𝑦̅ + 1−
2 √𝑛
2
𝑍1−𝛼 𝜎
2
𝑛=( )
𝐸
𝟐𝟎𝟐𝟎 − 𝟎𝟓 − 𝟐𝟔𝟑
TdLC (Teorema del Limite Central)
Sean 𝑌𝑖 VAI tales que:
𝐸(𝑌𝑖 ) = 𝜇𝑖 𝑉(𝑌𝑖 ) = 𝜎 2 𝑖 ; 𝑖 = 1, 2, … , 𝑛
Sean 𝑐𝑖 ∈ ℝ. Sea la CL (Combinación Lineal) ∑𝑛𝑖=1 𝑐𝑖 𝑌𝑖
Tarea 03: Se puede demostrar que:
1. ∑𝑛𝑖=1 𝑐𝑖 𝑌𝑖 = ∑𝑛𝑖=1 𝑐𝑖 𝜇𝑖
2. 𝑉(∑𝑛𝑖=1 𝑐𝑖 𝑌𝑖 ) = ∑𝑛𝑖=1 𝑐𝑖 2 𝜎𝑖 2
∑ 𝑐𝑖 𝑌𝑖 ~ 𝑁 (∑ 𝑐𝑖 𝜇𝑖 , ∑ 𝑐𝑖 2 𝜎𝑖 2 )
𝑖=1 𝑖=1 𝑖=1
𝜎∑𝑛𝑖=1 𝑌𝑖 = √𝑛𝜎
Aplicando la PdE (propiedad de estandarización) esta distribución de muestreo queda
así:
∑𝑛𝑖=1 𝑌𝑖 − 𝑛𝜇
≈ 𝑍 ~ 𝑁(0, 12 )
√𝑛𝜎
Para un “n” lo suficientemente grande
̅ con σ desconocido
3. Distribución de muestreo para el promedio 𝒀
𝑌̅ − 𝜇
~ 𝑡𝑛−1
𝑆⁄
√𝑛
NOTAS:
1.
1 𝑛
𝑆2 = ∑ (𝑌𝑖 − 𝑌̅)2 ; 𝑆 = √𝑆 2
𝑛 − 1 𝑖=1
Varianza muestral como VA Desviación estándar muestral como VA
𝑆𝑆𝑇
⸫ 2
~ 𝑋𝑛−1 2 (𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑒𝑜 𝑝𝑎𝑟𝑎 𝑆𝑆𝑇 )
𝜎
2.
2
𝑆𝑆𝑇 ∑𝑛𝑖=1(𝑌1 − 𝑌̅)2 𝑛 𝑌1 − 𝑌̅ 𝑛
2
= 2
= ∑ ( ) = ∑ (𝑍𝑖 )2 ~𝑋𝑛−1 2
𝜎 𝜎 𝑖=1 𝜎 𝑖=1
PdE
𝑝−𝜋
⇔ ≈ 𝑍 ~ 𝑁(0, 12 )
√𝜋(1 − 𝜋)
𝑛
NOTAS:
1. Esta distribución de muestreo exige que la VAdRE
𝑌~𝐵𝑒𝑟(𝜋)
2. En este caso, 𝑌𝑖 ~𝐵𝑒𝑟𝐼𝐷(𝜋)
3.
𝑛
∑ 𝑌𝑖 ~𝐵𝑖𝑛 (𝑛, 𝜋)
𝑖=1
Donde: 𝐧𝛑 > 𝟓
𝑛 𝐧(𝟏 − 𝛑) > 𝟓
∑ 𝑌𝑖 = 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜
𝑖=1
𝜋: Probabilidad de éxito
6. Distribución de muestreo para la razón de varianzas bajo el supuesto de
homocedasticidad i,e, 𝝈𝟐 𝟏 = 𝝈𝟐 𝟐 = 𝝈𝟐
(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐
~ 𝑭𝒏𝟏 −𝟏,𝒏𝟐 −𝟏
(𝒏𝟐 − 𝟏)𝑺𝟐 𝟐
NOTAS:
1. En este caso se tiene dos VAdRE 𝑌1 y 𝑌1 tales que:
𝑌𝑖 ~𝑁𝐼𝐷(𝜇𝑖 , 𝜎𝑖 2 )
2.
1 𝑛𝑖
𝑆𝑖 2 = ̅𝑖 )2
∑ (𝑌𝑖𝑗 − 𝑌
𝑛𝑖 − 1 𝑗=1
Con:
1 𝑛𝑖
̅𝑖 =
𝑌 ∑ 𝑌𝑖𝑗
𝑛𝑖 𝑗=1
3.
Con:
𝟐𝟎𝟐𝟎 − 𝟎𝟓 − 𝟐𝟖𝟓
7. Distribución de muestreo para la CL con 𝝈𝟐 conocida
𝑛 𝑛
𝑛
∑ 𝑌𝑖 𝑐𝑖 ~ 𝑁 (𝜇 ∑ 𝑐𝑖 , 𝜎𝑖 2 ∑ 𝑐 2 𝑖 ) ; 𝑐𝑖 𝜖 ℝ
𝑖=1
𝑖=1 𝑖=1
PdE
∑𝑛𝑖=1 𝑌𝑖 𝑐𝑖 − 𝜇 ∑𝑛𝑖=1 𝑐𝑖
⟺ ≈ 𝑍 ~ 𝑁(0. 12 )
𝜎√∑𝑛𝑖=1 𝑐 2 𝑖
8. Distribución de muestro para ̅𝒀̅̅𝟏̅ − ̅𝒀̅̅𝟐̅ con 𝜎1 2 y 𝜎2 2 conocidas
𝜎1 2 𝜎2 2
𝑌̅1 − 𝑌̅2 ~ 𝑁 (𝜇1 − 𝜇2 , + )
𝑛1 𝑛2
PdE
𝑌̅1 − 𝑌̅2 − (𝜇1 − 𝜇2 )
⟺ ≈ 𝑍 ~ 𝑁 (0. 12 )
𝜎1 2𝜎2 2
√
𝑛1 + 𝑛2
NOTAS
1. Bajo el supuesto de homocedasticidad (𝜎1 2 = 𝜎2 2 = 𝜎 2 ) se tiene que:
1 1
𝑌̅1 − 𝑌̅2 ~ 𝑁 (𝜇1 − 𝜇2 , ( + ))
𝑛1 𝑛2
𝑌̅1 − 𝑌̅2 − (𝜇1 − 𝜇2 )
⟺ ≈ 𝑍 ~ 𝑁(0. 12 )
1 1
𝜎√𝑛 + 𝑛
1 2
(𝑛−1)𝑠2 (𝑛−1)𝑠2
De (1): 𝐿 = De (2): 𝑈 =
𝑋2 𝛼 𝑋2𝛼
1− ,𝑛−1 ,𝑛−1
2 2
(𝑛−1)𝑠2 2
Por lo tanto, se puede poner que: 𝐼𝑑𝐶𝜎2 (1 − 𝛼) = ] , (𝑛−1)𝑠
[
𝑋2 1−𝛼,𝑛−1 𝑋 𝛼,𝑛−1
2
2 2
(𝑛−1)𝑠2 (𝑛−1)𝑠2
NOTA: 𝐼𝑑𝐶𝜎 (1 − 𝛼) = ]√ 2 ,√ 2 [
𝑋 1−𝛼,𝑛−1 𝑋 𝛼,𝑛−1
2 2
𝟐𝟎𝟐𝟎 − 𝟎𝟔 − 𝟎𝟐𝟑
𝛼 1 + 𝑁𝑑𝐶
⟹ 1− =
2 2
2) En PdH (pruebas de hipótesis) se tiene el NdS (nivel de significancia) = α; en ese caso:
𝛼
𝑁𝑑𝑆 = 𝛼 ⟹ 1 − = 1 − 𝑁𝑑𝑆/2
2
𝛼 1−𝑁𝑑𝐶 𝛼 1−𝑁𝑑𝐶 1−(1−𝛼) 𝛼
3) Simultáneamente, = En efecto: = = =
2 2 2 2 2 2
1,7
Por lo tanto: 𝐼𝑑𝐶𝜇 (95%) = 18,1 ∓ 1,96 = 0,53 =]17,57; 18,63[
√45
c) 𝐼𝑑𝐶𝜎 (1 − 𝛼) =? , 1 − 𝛼 = 95%
(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
𝐼𝑑𝐶𝜎 (1 − 𝛼) = ]√ 2 ,√ [
𝑋1−𝛼,𝑛−1 𝑋𝛼,𝑛−1 2
2 2
Respuesta: la desviación estándar del contenido de nicotina promedio por cigarrillo está
entre 1,39mg y 2,18mg.
¿Qué se puede decir sobre las cantidades mínima y máxima de nicotina por cigarrillo?
Supongamos que 𝑌 ~ 𝑁(𝜇, 𝜎2 )
Por lo tanto, la cantidad mínima estimada de nicotina por cigarrillo es:
𝜇̂
− 3𝜎 = 𝜇̂ − 3̂
𝜎 = 𝑦̅ − 3𝑠 = 18,1 − 3 ∗ 1,7 = 13𝑚𝑔
Simultáneamente, la cantidad máxima estimada de nicotina por cigarrillo es:
𝜇̂
+ 3𝜎 = 𝜇̂ + 3̂
𝜎 = 𝑦̅ + 3𝑠 = 18,1 + 3 ∗ 1,7 = 23,2𝑚𝑔
¿Es posible garantizar con suficiente confianza que los cigarrillos tienen menos de 20mg
de nicotina?
Entonces, se sabe que:
Tarea 04: Demostrar
1) 𝐏𝐫(𝝁 − 𝝈 ≤ 𝒀 ≤ 𝝁 + 𝝈) = 𝟔𝟖, 𝟐𝟔%
PdE 𝜇 − 𝑘𝜎 − 𝜇 𝑌 − 𝜇 𝜇 + 𝑘𝜎 − 𝜇
Pr(𝜇 − 𝑘𝜎 ≤ 𝑌 ≤ 𝜇 + 𝑘𝜎) = Pr ( ≤ ≤ )
𝜎 𝜎 𝜎
𝐸 (∑ 𝑐𝑖 𝑦𝑖 ) = ∑ 𝑐𝑖 𝐸(𝑦𝑖 ) = ∑ 𝑐𝑖 𝜇𝑖
𝑖=1 𝑖=1 𝑖=1
∫ 𝑔(𝑦)𝑓(𝑦)𝑑𝑦 𝑠𝑖 𝑦 𝑒𝑠 𝑉𝐴𝐶
ℝ
∫ 𝑦 2 𝑓(𝑦)𝑑𝑦 𝑠𝑖 𝑉𝐴𝐶
ℝ
5)
b. Si 𝑔(𝑦1 , 𝑦2 ) = 𝑦1 , 𝑦2 entonces:
Not. Not.
Observación: 𝐸(𝑦1 , 𝑦2 ) = 𝜇𝑦1 ,𝑦2 ; 𝑉(𝑦1 , 𝑦2 ) = 𝜎 2 𝑦1 ,𝑦2
Consideremos la definición:
Dos VAdRE 𝑦1 y 𝑦2 son independientes si:
𝑝(𝑦1 , 𝑦2 ) = 𝑝1 (𝑦1 )𝑝1 (𝑦2 ) cuando 𝑦1 y 𝑦2 VAD.
𝑓(𝑦1 , 𝑦2 ) = 𝑝1 (𝑦1 )𝑝2 (𝑦2 ) cuando 𝑦1 y 𝑦2 VAC.
Donde:
𝑝𝑖 es la función de masa de la VAD 𝑦𝑖
𝑓𝑖 es la función de densidad de la VAL 𝑦𝑖
Entonces se puede demostrar que:
NOTAS:
3.
Inferencia estadística
Un aspecto clave en la interpretación y utilización de cualquier estadístico es que se trata
de una variable aleatoria, ya que su valor depende de los elementos que son seleccionados
para integrar la muestra, y, por lo tanto, varía de una muestra a otra. La forma de tomar
en cuenta este hecho es conocer la distribución de probabilidad de cada estadístico.
Inferencia estadística
Son afirmaciones estadísticas acerca de la población o proceso basadas en la información
contenida en la muestra.
Estadístico
Cantidad que se obtiene a partir de los datos de una muestra y que ayuda a resumir las
características de esta.
Distribución de probabilidad de X
Relaciona el conjunto de valores de X con la probabilidad asociada con cada uno de estos
valores.
Grados de libertad
Son parámetros que definen las distribuciones t, ji-cuadrada y F, y se determinan a partir
de los tamaños muestrales involucrados.
Uso de Excel
Si X tiene una distribución normal con media m y desviación estándar s con frecuencia
es de interés calcular probabilidades como P(X < x). Se puede utilizar la hoja de cálculo
de Excel para calcular este tipo de probabilidades. Para ello se utiliza la siguiente función:
Estimación puntual
Un estimador puntual de un parámetro desconocido es un estadístico que genera un valor
numérico simple, que se utiliza para hacer una estimación del valor del parámetro
desconocido; por ejemplo, tres parámetros sobre los que con frecuencia se desea hacer
inferencia son:
Una forma de saber qué tan variable es el estimador, consiste en calcular la desviación o
error estándar del estadístico, visto como una variable aleatoria. Por ejemplo, sea la
desviación estándar S y la media 𝑋̅ de una muestra de tamaño n, puesto que 𝑋̅ es una
variable aleatoria, ésta tiene su propia desviación o error estándar, que se puede estimar
mediante 𝜎̂𝑋 = 𝑆⁄ . Construir un intervalo al 100(1 – 𝛼) % de confianza para un
√𝑛
parámetro desconocido 𝜃, consiste en estimar dos números (estadísticos) L y U, de
manera que la probabilidad de que 𝜃 se encuentre entre ellos sea 1 – 𝛼, es decir,
P (L ≤ 𝜃 ≤ U) = 1 – 𝛼
Intervalo de confianza
Valores entre los que se estima está el valor de un parámetro poblacional.
𝑋̅ − 𝜇
𝑃 (– 𝑡𝛼⁄2 ≤ ≤ 𝑡𝛼⁄2 ) = 1 − 𝛼
𝑆⁄
√𝑛
𝑆 𝑆
En este sentido, 𝐿 = 𝑋̅ − 𝑡𝛼⁄2 y 𝑈 = 𝑋̅ + 𝑡𝛼⁄2 son los números buscados que
√𝑛 √𝑛
definen un intervalo al 100(1 – 𝛼 ) % para la media desconocida 𝜇. En la tabla de la
distribución T de Student se observa que para una muestra mayor o igual a 30, el intervalo
𝑆
al 100(1 – 𝛼) % para la media 𝜇 es aproximadamente 𝑋̅ ± 2 y, o sea, la media más
√𝑛
menos 2 veces su error estándar.
Tamaño de la muestra
En ocasiones es necesario calcular el tamaño de muestra n para lograr que la estimación
de una media poblacional m tenga como error máximo un valor E. En este caso, como el
error de estimación está dado por 𝐸 = 𝑡(𝛼⁄ ,𝑛−1) 𝑆⁄ , entonces despejando n obtenemos
2 √𝑛
que:
𝑡 2 (𝛼⁄ 𝑆 2
2,𝑛−1)
𝑛=
𝐸2
Como 𝑡(𝛼⁄ depende de n y ésta es la incógnita, entonces para propósitos prácticos y
2,𝑛−1)
con tamaños de muestra mayores que 30, el valor de 𝑡(𝛼⁄ puede tomarse como 2. De
2,𝑛−1)
esta manera:
4𝑆 2
𝑛=
𝐸2
Donde 𝑆 2 es un estimador de la varianza. Por ejemplo, si en el caso del grosor medio de
los discos se quisiera un error máximo de 0.004 = E, entonces se requiere:
4(0.00071)
𝑛= = 177.5
(0.004)2
Intervalo para la varianza
Con un poco de álgebra, se llega a que el intervalo de confianza para la varianza está dado
por:
(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
≤ 𝜎 ≤
𝑋 2 𝛼⁄2,𝑛−1 𝑋 21−𝛼⁄2,𝑛−1
PRUEBA.CHI.INV (𝛼/2, n – 1)
PRUEBA.CHI.INV (1 – 𝛼/2, n – 1).
Intervalo para la proporción
Se puede afirmar que de manera aproximada la proporción muestral 𝑝̂ sigue una
distribución normal con media p y varianza p (1 – p)/n. Con el uso de la misma
argumentación que en el intervalo para la media, se deduce que el intervalo de confianza
para la proporción es de la forma:
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑍𝛼⁄2 √ ≤ 𝑝 ≤ 𝑝̂ + 𝑍𝛼⁄2 √
𝑛 𝑛
Estadístico de prueba
Probar una hipótesis consiste en investigar si lo afirmado por la hipótesis nula es verdad
o no. La estrategia de prueba parte del supuesto de que 𝐻0 es verdadera, y si los resultados
de la investigación contradicen en forma suficiente dicho supuesto, entonces se rechaza
𝐻0 y se acepta la hipótesis alternativa.
Una vez planteada la hipótesis, se toma una muestra aleatoria de la población de estudio
o se obtienen datos mediante un experimento planeado de acuerdo con la hipótesis. El
estadístico de prueba es un número calculado a partir de los datos y la hipótesis nula, cuya
magnitud permite discernir si se rechaza o no la hipótesis nula 𝐻0 .
Al conjunto de posibles valores del estadístico de prueba que llevan a rechazar 𝐻0 se le
llama región o intervalo de rechazo para la prueba, y a los posibles valores donde no se
rechaza 𝐻0 se les llama región o intervalo de aceptación.
Estadístico de prueba
Formula con la que a partir de los datos y de 𝐻0 , se calcula un número cuya magnitud
permite discernir si se rechaza o no la hipótesis nula.
Criterio de rechazo
El estadístico de prueba, construido bajo el supuesto de que 𝐻0 es verdad, es una variable
aleatoria con distribución conocida. Si efectivamente 𝐻0 es verdad, el valor del estadístico
de prueba debería caer dentro del rango de valores más probables de su distribución
asociada, el cual se conoce como región de aceptación. Si cae en una de las colas de su
distribución asociada, fuera del rango de valores más probables (en la región de rechazo),
es evidencia en contra de que este valor pertenece a dicha distribución (véase figura 2.3).
De aquí se deduce que debe estar mal el supuesto bajo el cual se construyó, es decir, 𝐻0
debe ser falsa.
Figura 2.3 Hipótesis unilateral y bilateral, regiones de aceptación y rechazo.
Región de aceptación
Son los posibles valores del estadístico de prueba donde no se rechaza la hipótesis nula.
Región de rechazo
Es el conjunto de posibles valores del estadístico de prueba que llevan a rechazar la
hipótesis nula.
En toda prueba de hipótesis cada tipo de error tiene una probabilidad de ocurrir. Con 𝛼 y
𝛽 se denotan las probabilidades de los errores tipo I y II, respectivamente. Así,
Error tipo II
Es cuando se acepta una 𝐻0 que es falsa.
Potencia de la prueba
Es la probabilidad de rechazar 𝐻0 cuando es falsa.
En aquellas situaciones en las que se desea rechazar 𝐻0 : 𝜇 =𝜇0 sólo cuando 𝜇 >𝜇0 , la
hipótesis alternativa es unilateral:
𝐻0 : 𝜇 =𝜇0
𝐻𝐴 : 𝜇 > 𝜇0
En este caso se rechaza 𝐻0 si 𝑡0 > 𝑡𝛼 . Por otra parte, si lo que interesa es rechazar 𝐻0 : 𝜇
=𝜇0 sólo cuando 𝜇 < 𝜇0 entonces ahora la hipótesis unilateral se plantea de la forma:
𝐻0 : 𝜇 =𝜇0
𝐻𝐴 : 𝜇 < 𝜇0
Y se rechaza 𝐻0 si 𝑡0 < −𝑡𝛼
Figura 2.5 Resultados de las hipótesis para la media y para la varianza del peso de costales con α = 0.05.
Intervalo de confianza
En este método se rechaza 𝐻0 si el valor del parámetro declarado en la hipótesis nula se
encuentra fuera del intervalo de confianza para el mismo parámetro. Cuando la hipó tesis
planteada es de tipo bilateral, se utiliza directamente el intervalo al 100 (1 – 𝛼) % de
confianza. Si la hipótesis es unilateral, se requiere el intervalo al 100 (1 – 2𝛼) % para que
el área bajo la curva, fuera de cada extremo del intervalo, sea igual a 𝛼.
Este criterio es útil cuando el software proporciona el intervalo de confianza para el
parámetro de interés, pero no provee la prueba de hipótesis correspondiente. También
puede ser que el experimentador quiera, además de la conclusión de la hipótesis, el
intervalo de confianza para el parámetro que le interesa; en ese aspecto, este criterio tiene
ventajas sobre los anteriores.
Comparación de dos tratamientos
La comparación se puede hacer respecto a las correspondientes medias poblacionales,
varianzas, proporciones o algún otro parámetro. En seguida se explica cómo plantear y
probar las hipótesis correspondientes.
Hipótesis para dos medias
Supongamos que interesa comparar las máquinas A y B, que realizan la misma operación.
Para ello se obtendrá una muestra aleatoria de productos procesados por cada máquina, a
los cuales se les medirá o evaluará alguna característica a través de una variable continua
Y. De tal forma que los datos a observar en la máquina A son 𝑌𝐴1 , 𝑌𝐴2 , … , 𝑌𝐴𝑁 y los datos
de la máquina B son 𝑌𝐵1 , 𝑌𝐵2 , … , 𝑌𝐵𝑁 , que se pueden escribir como en la tabla 2.2:
Para que la comparación sea justa, la materia prima que utilizan las máquinas se asigna
de forma aleatoria a las máquinas, y las 2n pruebas o corridas se hacen en orden aleatorio.
No es adecuado realizar primero todas las pruebas de la máquina A y posteriormente las
de la máquina B, porque eso puede favorecer a una de las máquinas y afecta (sesga) la
comparación.
Suposición de varianzas desconocidas pero iguales
Sean dos procesos o tratamientos con medias 𝜇𝑥 y 𝜇𝑦 y varianzas 𝜇𝑥2 y 𝜇𝑥2 ,
respectivamente. Interesa investigar si las medias de dichos tratamientos pueden
considerarse estadísticamente iguales. Para ello se plantean las siguientes hipótesis:
𝐻0 : 𝜇𝑥 = 𝜇𝑦
𝐻𝐴 : 𝜇𝑥 ≠ 𝜇𝑦
𝐻𝐴 : 𝜇𝑥 − 𝜇𝑦 ≠ 0
Con 𝑆𝑥2 y 𝑆𝑦2 las varianzas muestrales de los datos de cada tratamiento.
𝐻𝐴 : 𝜎𝑥2 ≠ 𝜎𝑦2
Por ejemplo, en el caso de las centrifugadoras interesa ver si alguna de ellas tiene mayor
error (variabilidad) en sus mediciones. El planteamiento de la hipótesis se puede reescribir
como:
𝜎𝑥2
𝐻0 : =1
𝜎𝑦2
𝜎2
𝐻𝐴 : 𝜎2𝑥 ≠ 1
𝑦
Comparación de proporciones
Una situación de frecuente interés es investigar la igualdad de las proporciones de dos
poblaciones o tratamientos, es decir, se requiere probar la siguiente hipótesis:
𝐻0 : 𝑝1 = 𝑝2
𝐻𝐴 : 𝑝1 ≠ 𝑝2
Para ver si estas diferencias son significativas a favor del fármaco 2, se necesita probar la
hipótesis de igualdad de proporciones. Para ello, bajo el supuesto de distribución
binomial, el estadístico de prueba 𝑧0 está dado por:
𝑝̂1 − 𝑝̂2
𝑧0 =
1 1
√𝑝̂ (1 − 𝑝̂ ) (
𝑛1 + 𝑛2 )
𝑥 +𝑥
Donde 𝑝̂ = 𝑛1 +𝑛2 . Se rechaza 𝐻0 si |𝑧0 | = 𝑧𝛼⁄2 . Cuando la hipótesis alternativa es
1 2
unilateral, entonces 𝑧0 se compara con 𝑧𝛼 . En el caso de los fármacos, como 𝑝̂ =
65+75
= 0.70, entonces:
100+100
65/100 − 75/100
𝑧0 = = −1.543
√0.7(1 − 0.7) ( 1 + 1 )
100 100
Como |𝑧0 | = 1.543 no es mayor que 𝑧0.02 = 1.96, entonces no se rechaza 𝐻0 , por lo que
no hay evidencia suficiente para afirmar que un fármaco es mejor que otro.
Poblaciones pareadas (comparación de dos medias con muestras dependientes)
En muchas situaciones experimentales no conviene o no es posible tomar muestras
independientes, sino que la mejor estrategia es tomar muestras pareadas. Esto significa
que los datos de ambos tratamientos se obtienen por pares, de forma que cada par son
datos que tienen algo en común; por ejemplo, que a la misma unidad experimental o
espécimen de prueba se le apliquen los tratamientos a comparar. Un par de ejemplos son:
A los mismos pacientes se les aplican dos medicamentos (tratamientos) para
el dolor en distintas ocasiones; los tratamientos a comparar son los dos
medicamentos.
A las mismas piezas se les hace una prueba de dureza con distintos
instrumentos; aquí se quieren comparar los instrumentos.
EJEMPLO 2.7: Comparación de dos básculas
Se desea ver si dos básculas están sincronizadas. Para ello se toma una muestra aleatoria
de 10 especímenes y cada uno se pesa en ambas básculas, cuidando que el orden en el
que se utilizan sea elegido al azar. El trabajo lo realiza el mismo operador y los datos
obtenidos se muestran en la tabla 2.3.
𝑑̂
𝑡0 =
𝑆𝐷
⁄
√𝑛
Al hacer los cálculos resulta que:
−0.02
𝑡0 = = −2.20
0.0287⁄
√10
Como el valor-p = 0.055 es mayor que 𝛼 = 0.05 no se rechaza 𝐻0 a un nivel de
significancia de 𝛼 =0.05. Es decir, no hay suficiente evidencia en contra de la
sincronización de las básculas. Sin embargo, esta conclusión es bastante endeble dado
que el valor-p es muy similar al valor 𝛼.
Orden completamente al azar
Es aquel en el que las unidades se asignan de manera aleatoria a los tratamientos, y las
pruebas experimentales se hacen en orden aleatorio.
Muestras pareadas
Son aquellas en las que los datos de ambos tratamientos se obtienen por pares, de manera
que éstos tienen algo en común y no son independientes.
𝑑̂ 0.74
𝑡0 = = = 9.70
𝑆𝐷 0.2413⁄
⁄ √10
√𝑛
Nótese en la tabla 2.4 la gran variabilidad que existe entre los datos de un día a otro, y
también entre turnos. Eso causa que, si en lugar de analizar las diferencias se analizan los
datos de cada tratamiento (posición del cofre) por separado, las diferencias debido a
tratamientos quedan ocultas ante tanta variabilidad.
Resumen de fórmulas para procedimientos de prueba de hipótesis
En la tabla 2.5 se resumen las fórmulas de los procedimientos de pruebas de hipótesis que
involucran un parámetro de una sola población, mientras que en la tabla 2.6 se listan los
procedimientos que involucran dos parámetros de dos poblaciones. En cada caso se
muestra el planteamiento de la hipótesis, el estadístico de prueba y el criterio de rechazo,
este último para cada una de las tres posibles alternativas.
Si se trabaja con un software estadístico es más directo y conveniente basarse en el criterio
del valor-p, el cual, para cualquier hipótesis, debe ser menor que a para que sea posible
rechazar 𝐻0 .
En la tabla 2.6 note que aparecen tres maneras de probar la igualdad de medias 𝐻0 : la
primera a) es para el caso de muestras independientes suponiendo varianzas iguales. La
segunda b) es para muestras independientes sin suponer varianzas iguales, y el caso e) es
para muestras pareadas.
Uso de software
En particular, para hacer una estimación puntual y por intervalo, para la media y la
desviación estándar, la secuencia a elegir es la siguiente: Describir ⟶ Datos numéricos
⟶ Una variable; entonces, se declara la variable a analizar, la cual fue previamente
capturada en una columna de la hoja de datos y después se pide Intervalo de confianza en
las opciones tabulares y se especifica el nivel de confianza deseado (Opciones de panel).
En Excel
Para hacer cálculos estadísticos en Excel se utilizan las funciones (𝑓𝑥 ) estadísticas y la
opción Análisis de datos dentro del menú de Datos. Si no estuviera activada la opción de
Análisis de datos, ésta se activa usando la opción Complementos que está en el botón de
Office en Opciones.
Para probar la hipótesis o encontrar intervalos de confianza para un parámetro, se usa la
secuencia: Datos ⟶ Análisis de datos ⟶ Estadística descriptiva. Ahí se activa el cuadro
u opción Nivel de confianza para la media. En todos los casos, después de señalar el
análisis que se desea hacer, se abrirá una ventana en la que se especifica el rango de celdas
en el que se encuentran los datos y las estadísticas deseadas.
Cuando se quiere comparar tratamientos, se elige la misma secuencia: Datos ⟶ Análisis
de datos y luego se selecciona la opción deseada, por ejemplo: Prueba t para dos muestras
suponiendo varianzas iguales, Prueba t para medias de dos muestras emparejadas, Prueba
F para varianzas de dos muestras.
Preguntas y ejercicios (impares)
1. En un estudio estadístico, ¿Qué es una población y para que se toma una muestra?
Histograma
15
Frecuencia
10
5
Frecuencia
0
Como se puede observar en la gráfica, el comportamiento de los envases a la prueba de resistencia,
salió superior al límite establecido de 20 kg, por lo que se puede decir que los envases tienen la
resistencia adecuada a dicha fuerza
c)
X=27.246
VAR=2.046
S= 1.43
n=56
NdC=0.95-> Alfa= 0.05
𝒔
Se usa la fórmula: Id𝑪𝝁 = 𝒙̅ ∓ 𝒕𝟏−𝜶,𝒏−𝟏
𝟐 √𝒏
Datos
n=40
𝑋̅ = 3.2
S = 0.3
NdC=90% -> Alfa= 0.1
𝑠
Id𝐶𝜇 = 𝑥̅ ∓ 𝑧1−𝛼,𝑛−1 𝑛
2 √
Desarrollo
0.3
Id𝐶𝜇 = 3.2 ∓ 1.64
√40
Id𝐶𝜇 =] 3.12; 3.28 [
El contenido promedio poblacional de grasa es de ] 3.12; 3.28 [
] 3.12; 3.28 [, este es también el máximo error de estimación para la media porque es la
cantidad máxima que considera el parametro z, según alfa establecido,el tamaño de
muestra y la desviación estándar.
Datos:
NdC=95% -> Alfa=5%
1- alfa/2 = 0,975
alfa/2 =0,025
grados de libertad (n-1)=39
s2=0,0900
Chi^2 1-alfa/2 = 58,1200597
Chi^2 alfa/2 = 23,6543246
(𝑛−1)1 𝑠2 (𝑛−1)𝑠2
Id𝐶𝜎 (1 − 𝛼) =]√𝑋 2 , √ 𝑋2 [
𝛼 𝛼
1− ; 𝑛−1 ,𝑛−1
2 2
Desarrollo:
(49)0.09 (55)0.09
Id𝐶𝜎 (95%) =]√ 58,120 , √23,6543246 [ =] 0.246; 0.385 [
d) ¿Qué puede decir sobre la cantidad mínima y máxima de grasa en la leche? ¿Es posible
garantizar con suficiente confianza que la leche tiene más de 3?0% de grasa?
𝑥 = 100
𝑛 = 200
𝑥 100
𝑃̂ = = = 0.05
𝑛 200
1−∝= 0.95
1 − 0.95 =∝
∝= 0.05
∝ 1 − 0.05
𝜙 (𝑍∝ ) = 1 − = = 0.975
2 2 2
𝑍∝ = 1.95996
2
0.05(1 − 0.05)
𝐸 = 1.95996√ = 0.0302
200
c) ¿Qué tamaño de muestra se tiene que usar si se quiere estimar tal porcentaje con
un error máximo de 2%?
𝑍∝ 2 ∗ 𝑃̂ (1 − 𝑃̂)
2
𝑛=
𝐸2
𝑛 = 456.17138
10. Para evaluar la efectividad de un fármaco contra cierta enfermedad se integra en
forma aleatoria un grupo de 100 personas. Se suministra el fármaco y, transcurrido
el tiempo de prueba, se observa x = 65 personas con un efecto favorable.
a) Estime, con una confianza de 90%, la proporción de efectividad que se logrará
con tal fármaco. Haga una interpretación de los resultados.
𝑥 = 65
𝑛 = 100
𝑥 65
𝑃̂ = = = 0.65
𝑛 100
1−∝= 0.90
1 − 0.90 =∝
∝= 0.1
∝ 1 − 0.1
𝜙 (𝑍∝ ) = 1 − = = 0.95
2 2 2
𝑍∝ = 1.64485
2
R: Se acepta 𝐻0 , el peso promedio del contenido neto de las cajas es igual a 300 g.
b) Repita el inciso anterior pero ahora con un nivel de significancia del 10%.
𝑍0 = −1.889
𝑍1−0.10 = 1.64
2
√𝑛 ∗ (𝑥̅ − 𝜇𝑜 )
𝑡𝑜 =
𝑠
√10 ∗ (6.6 − 5)
𝑡𝑜 = = 2.53
2
Para 𝛼 = 0.05 con 𝑛 − 1 = 9
𝑡0.05,9 = 1.83
𝑡0 > 𝑡1−𝛼,𝑛−1
𝑡0 > 𝑡1−𝛼,𝑛−1
√18 ∗ (1.94 − 2)
𝑡𝑜 = = −3.916
0.065
Para 𝛼 = 0.05 con 𝑛 − 1 = 17
𝑡0.05,17 = 1.740
𝑡0 < 𝑡𝛼,𝑛−1
𝑡0.95,14 = 1,761
𝑡0 > 𝑡∝,𝑔.𝑙.
Rpta: con una confianza del 95% se rechaza la hipótesis nula, es decir con una desviación
estándar de 5 la presión promedio de las botellas que se usan es igual a 200psi.
15. ¿Es correcto afirmar que, en el ejercicio 17 de este capítulo, más del 8% de las
facturas tienen alguna anomalía? Para responder formule y pruebe la hipótesis
pertinente con una significancia del 5%.
𝐻 = 𝑝 ≥ 0.08
16. 𝐻𝑑𝐼 = { 𝑜
𝐻𝐼 = 𝑝 < 0.08
17.
𝜇 − 𝑛𝑝 (0.08) − 200(0.05)
𝐸𝑑𝑃 → 𝑍0 = = = −3.218
√𝑛𝑝(1 − 𝑃) √200(0.05)(0.95)
18.
19. 𝐶𝑑𝑅 → 𝑍0 > 1.96 (𝐹𝑎𝑙𝑠𝑜) 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑚𝑜𝑠 𝐻𝑜
𝐻𝑜 = 𝜇1 − 𝜇2 = 0 𝜇1 = 77,4 𝜇2 = 74,5
𝐻𝑜 = 𝜇1 − 𝜇2 ≠ 0 𝑠1 = 77,4 𝑠2 = 74,5
𝑠2 𝑠2
(𝑛1 + 𝑛2 ) (0.42667 + 0.25)2
1 2
𝑦= 2 2 = = 16.8
𝑠2 𝑠2 0.0202 + 0.006444
(𝑛1 ) (𝑛2 )
1 2
+
(𝑛1 − 1) (𝑛2 − 1)
𝑦 = 17
𝑡1−∝ ,𝑔 = 𝑡0.975 , 17 = 2.11
2
22. Una compañía de transporte de carga desea escoger la mejor ruta para llevar la
mercancía de un depósito a otro. La mayor preocupación es el tiempo de viaje. En
el estudio se seleccionaron al azar cinco choferes de un grupo de 10 y se asignaron
a la ruta A; los cinco restantes se asignaron a la ruta B. Los datos obtenidos fueron:
a) ¿Existen diferencias significativas entre las rutas? Plantee y pruebe las hipótesis
estadísticas correspondientes.
𝛼 = 5%
Prueba de Hipótesis:
𝐻𝑜 : µ1 − µ2 = 0
𝐻𝑜 : µ1 − µ2 ≠ 0
𝑛𝑎 = 5 𝑠𝑎 = 9.49
𝑛𝑏 = 5 𝑠𝑏 = 5.61
(5 − 1)9.492 + (5 − 1)5.612
𝑆𝑝 = √ = 7.79
5+5−2
1 1
𝑆(𝑦𝑎−𝑦𝑏) = √ + ∗ 𝑆𝑝
𝑛 𝑛
1 1
𝑆(𝑦𝑎−𝑦𝑏) = √ + ∗ 7.79 = 4.93
5 5
(𝑦𝑎 − 𝑦𝑏 ) − (µ𝑎 − µ𝑏 )
𝑡𝑜 =
𝑠(𝑦𝑎−𝑦𝑏)
(23 − 29) − 0
𝑡𝑜 = = −1.22
4.93
𝑡𝛼 = 2.306
2
𝐻0 = 𝜇1 = 𝜇2
𝐻𝐴 = 𝜇1 ≠ 𝜇2
𝑥1 = 980.125
𝑆1 = 73.753
𝑥2 = 974.125
𝑆2 = 64.942
𝑝̂ − 0.08
𝑧0 =
√0.08(1 − 0.08)/𝑛
980.125 − 979.125
𝑡0 =
0.5 √5165.694
𝑡0 = 0.028
𝑉𝑎𝑙𝑜𝑟 𝑝 < 𝛼 → 𝐻𝑜
𝑉𝑎𝑙𝑜𝑟 𝑝 > 𝛼 → 𝐻𝑜
𝑉𝑎𝑙𝑜𝑟 𝑝 = 0.4 ∴ 𝐻𝑜
Con Tabla:
𝑇0.975,14 = 2.145
Muestra 8
Varianza 1 5439.554
Varianza 2 4891.839
Significancia 0.05
5439.55
𝐹0 = = 1.11
4891.83
Se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos decir que
la desviación los tratamientos son iguales.
f) ¿Existe algún tratamiento mejor?
Entre ellos no se encuentra una diferencia significativa.
24. Se comparan dos métodos para inocular o contagiar una cepa del hongo del maíz
conocido como huitlacoche. En una primera etapa del estudio, el experimentador
quiere determinar cuál de los métodos genera mayor porcentaje de infección. El
método A consiste en cortar la punta de la mazorca para aplicar la cepa, y en el
método B se inyecta la cepa de forma transversal. De 41 mazorcas inoculadas con
el método A, 20 se infectaron, es decir, generaron huitlacoche; en tanto, de 38
mazorcas inoculadas con el método B se infectaron 27.
H0 : p1 = p2 𝛼 = 0.05 𝑍𝛼 = 1.96
2
HA : p1 ≠ p2
20 27
𝑍0 =
𝑝
̂1 − 𝑝
̂2
= 41 − 38 = −2.014
1 1
√𝑝̂ (1 − 𝑝̂ ) ( + ) √0.5949(1 − 0.5949) ( 1 + 1 )
𝑛1 𝑛2 41 38
|𝑍0 | > 𝑍𝛼
2
R. No hay evidencia suficiente para afirmar que el método B genera una mayor
infección de huitlacoche.
25. Con respecto al problema del ejercicio 18, se desea comparar dos tratamientos
para hacer que germine cierta semilla. Los datos del tratamiento A son los del
ejercicio 18, es decir, de 60 semillas puestas a germinar se observó que 37 de ellas
germinaron. Mientras que para el tratamiento B, de 70 semillas se observó que 30
germinaron.
a) ¿Hay una diferencia significativa entre los dos tratamientos? Pruebe la hipótesis
correspondiente a 95% de confianza.
60 semillas,37 germinaron
70 semillas,30 germinaron
H0: p1=p2
H1: p1≠ p2
P=(37+30)70+60
p=0.5153
Z0=3760−30700.5153(1−0.5153)60+0.5153(1−0.5153)70−−−−−−−−−−−−−−−−−−−−−
−−√
Z0=2.1392
Z1−∝2/=1.96
Z0>Z1−∝2/
IDCπ=3760±1.963760(1−3760)60−−−−−−−−−−√
IDCπ=3760±0.123
]0.49367;0.73967[
IDCπ=3070±0.1159
]0.31267;0.54447[
Datos:
n1=n2 = 18 piezas
d1= 1.9744 piezas
s1= 0.1450
d2= 1.9489 piezas
s2= 0.0669
1-𝛼= 0.950
1-𝛼/2=0.975
t1-𝛼/2; n-1= 2.110
Sea µ1 la densidad mínima promedio de metal medida por el método 1 y µ2 la densidad
mínima promedio de metal medida por el método 2.
𝐻0 : 𝜇1 = 𝜇2
𝐻𝐴 : 𝜇1 ≠ 𝜇2
De forma equivalente:
𝐻0 : 𝜇𝐷 = 0.6
𝐻𝐴 : 𝜇𝐷 ≠ 0.6
Donde µD es la media de la población de diferencias.
Estadístico de prueba:
𝑑̅
𝑡0 =
𝑆𝐷
⁄
√𝑛
Donde 𝑑̅ es el promedio muestral de diferencias, 𝑆𝐷 es la desviación estándar muestral de
tales diferencias y n es el tamaño de la muestra.
̅̅̅1 − ̅̅̅
(𝑑 𝑑2 ) − 𝐷0
𝑡0 =
𝑠12 𝑠22
√
𝑛1 + 𝑛2
(1.9744 − 1.9489) − 0.6
𝑡0 = = −15.2634
2 2
√0.1450 + 0.0669
18 18
Criterio de rechazo:
|𝑡0 | > 𝑡1−𝛼⁄
2, 𝑛−1
|𝑡0 | = 15.2634
𝑡1−𝛼⁄2, 𝑛−1 = 2.110
15.2634 > 2.110
Decisión y respuesta: No rechazo la hipótesis alternativa, es decir, el nuevo método no
puede proveer una reducción del 60% el tiempo de prueba.
b)
𝑆𝐷
𝐼𝑑𝐶𝜇𝐷 (1 − 𝛼) = 𝑑̅ ∓ 𝑡1−𝛼⁄2, 𝑛−1
√𝑛
𝐼𝑑𝐶𝜇𝐷 (0.95) = 0.0255 ∓ 2.110(0.0376)
c) Ignorando el apareamiento:
Datos:
n1=n2 = 18 piezas
d1= 1.9744 piezas
s1= 0.1450
d2= 1.9489 piezas
s2= 0.0669
1-𝛼= 0.950
1-𝛼/2=0.975
t1-𝛼/2; g=
Sea µ1 la densidad mínima promedio de metal medida por el método 1 y µ2 la densidad
mínima promedio de metal medida por el método 2.
𝐻0 : 𝜇1 = 𝜇2
𝐻𝐴 : 𝜇1 ≠ 𝜇2
De forma equivalente:
𝐻0 : 𝜇𝐷 = 0.6
𝐻𝐴 : 𝜇𝐷 ≠ 0.6
Donde µD es la media de la población de diferencias.
Estadístico de prueba:
𝑑̅
𝑡0 =
𝑆𝐷
⁄
√𝑛
̅
Donde 𝑑 es el promedio muestral de diferencias, 𝑆𝐷 es la desviación estándar muestral de
tales diferencias y n es el tamaño de la muestra.
̅̅̅1 − ̅̅̅
(𝑑 𝑑2 ) − 𝐷0
𝑡0 =
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2
(1.9744 − 1.9489) − 0.6
𝑡0 = = −15.2634
0.1450 2 0.0669 2
√
18 + 18
2
𝑠12 𝑠22
(𝑛 + 𝑛 )
1 2
𝑔= 2
2 2
𝑠1 𝑠22
(𝑛 ) (𝑛 )
1 2
+
(𝑛1 − 1) (𝑛2 − 1)
2
0.14502 0.06692
( 18 + 18 )
𝑔= 2 2 = 23.9239
0.14502 0.06692
( 18 ) ( 18 )
+
(18 − 1) (18 − 1)
Criterio de rechazo:
|𝑡0 | > 𝑡1−𝛼⁄
2, 𝑔
|𝑡0 | = 15.2634
𝑡1−𝛼⁄2, 𝑔 = 2.064
15.2634 > 2.064
Decisión y respuesta: No rechazo la hipótesis alternativa, es decir, el nuevo método no
puede proveer una reducción del 60% el tiempo de prueba.
En comparación con el resultado obtenido tomando en cuenta las muestras pareadas, no
tiene mucha diferencia. Se alcanza la misma conclusión.
d)
𝑆𝐷
𝐼𝑑𝐶𝜇1−𝜇2 (1 − 𝛼) = 𝑑̅ ∓ 𝑡1−𝛼⁄2,𝑔
√𝑛
𝐼𝑑𝐶𝜇𝐷 (0.95) = 0.0255 ∓ 2.064(0.0376)
𝐻0 : 𝜇1 = 𝜇2
𝐻𝐴 : 𝜇1 > 𝜇2
24,2−22,2
Calculando: 𝑡0 = 1 1
= 1,95
(2,29)∗√ +
10 10
R: Se rechaza la hipótesis nula porque 1,95>1,86, entonces se confirma que el aditivo
acelera el crecimiento de las plantas
28. Se realizó un experimento para ver si dos técnicos tienen alguna tendencia a
obtener diferentes resultados cuando determinan la pureza de cierto producto.
Cada muestra fue dividida en dos porciones y cada técnico determinó la pureza de
una de las porciones. Los resultados se muestran a continuación:
Ho:
µd ≠0
NOTAS
1. Un estimador lineal que es una CL (combinación lineal) de la muestra.
2. Un estimador insesgado 𝜃̂ tiene una esperanza igual al parámetro θ que estima.
̅ es un estimador lineal insesgado de µ
Ejercicio N°1: Demostrar que 𝒚
Resolución
¿Es 𝑦̅ un estadístico?
1
Puesto que 𝑦̅ = 𝑛 ∑𝑛𝑖=1 𝑐𝑖 = 𝑓(𝑦1 , 𝑦2 , … . . , 𝑦𝑛 ) entonces, por definición, 𝑦̅ sí es un
estadístico.
¿Es 𝑦̅ estimador lineal?
1 1 1
Si lo es. En efecto, 𝑦̅ = 𝑛 ∑𝑛𝑖=1 𝑦𝑖 = ∑𝑛𝑖=1 𝑛 𝑦𝑖 = ∑𝑛𝑖=1 𝑐𝑖 𝑦𝑖 𝑐𝑜𝑛 𝑐𝑖 = 𝑛
1
= 𝑛𝜇 = 𝜇
𝑛
Ejercicio N°2: Demostrar que 𝒔𝟐 es un estimador insesgado de 𝝈𝟐
P.D. 𝐸(𝑠 2 ) = 𝜎 2
En efecto:
1 1
. 𝐸(𝑠 2 ) = 𝐸 (𝑛−1 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 ) = 𝑛−1 𝐸( ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 )
NOTA
𝑆𝑆
SS=∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 es la suma de cuadrados corregida. En tal sentido, 𝑠 2 = 𝑛−1
𝑛 𝑛 𝑛
1 1
= 𝐸 (∑(𝑦 2 𝑖 − 2𝑦̅𝑦𝑖 − 𝑦̅ 2 )) = 𝐸 (∑ 𝑦 2 𝑖 − 2 𝑦̅ ∑ 𝑦𝑖 + 𝑛𝑦̅ 2 )
𝑛−1 𝑛−1
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛
1 1
= 𝐸 (∑ 𝑦 2 𝑖 − 2𝑛𝑦̅ 2 + 𝑛𝑦̅ 2 ) 𝑝𝑢𝑒𝑠 𝑦̅ = ∑ 𝑦𝑖 ⟺ ∑ 𝑦𝑖 = 𝑛𝑦̅
𝑛−1 𝑛
𝑖=1 𝑖=1 𝑖=1
𝑛
1
= 𝐸 (∑ 𝑦 2 𝑖 − 𝑛𝑦̅ 2 )
𝑛−1
𝑖=1
NOTA
1. 𝐸(𝑦𝑖 ) = 𝜇 , 𝑉(𝑦𝑖 ) = 𝜎 2 ,
𝜎2 𝜎2
𝑉(𝑦̅) = 𝐸(𝑦̅ 2 ) − 𝐸 2 (𝑦̅) ⟺ = 𝐸(𝑦̅ 2 ) − 𝜇 2 ⟺ 𝐸(𝑦̅) = 𝜇 2 +
𝑛 𝑛
Continuando:
𝑛 𝑛
1 1
= ((∑ 𝑦 2 𝑖 ) − 𝐸(𝑛𝑦̅ 2 )) = ( ∑ 𝐸 (𝑦 2 𝑖 ) − 𝑛𝐸(𝑦̅ 2 ))
𝑛−1 𝑛−1
𝑖=1 𝑖=1
𝑛
1 𝜎2
= (∑(𝜇 2 + 𝜎 2 ) − 𝑛 (𝜇 2 + ))
𝑛−1 𝑛
𝑖=1
1 1
= (𝑛𝜇 2 + 𝑛𝜎 2 − 𝑛𝜇 2 − 𝜎 2 ) = (𝑛 − 1)𝜎 2 = 𝜎 2 𝒍𝒒𝒒𝒅
𝑛−1 𝑛−1
𝐻𝑜 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0
𝑦̅ − 𝜇0
𝐸𝑑𝑃: 𝑍0 =
𝜎/√𝑛
NOTA:
Not Not
1. .𝑉(𝑦0 ) = 𝜎 2 0 ., 𝑉(𝑦) = 𝜎 2
Supuesto de homocedasticidad: 𝜎 2 0 = 𝜎 2
2. Toda PdH tiene un EdP (estadidtico de prueba) que se deduce bajo el supuesto
de 𝐻𝑜 (hipótesis nula) es verdad. Así, en este caso:
𝐻𝑜
TdLC TdLC
𝜎2 𝜎2
𝑦̅ ~ 𝑁 (𝜇, ) ⟺ 𝑦̅ ~ 𝑁 (𝜇0 , )
𝑛 𝑛
𝑦̅ − 𝜇0
⟺ 𝑍0 = 𝜎 𝑝𝑜𝑟 𝑒𝑙 𝑇𝑑𝐿𝐶 𝑐𝑜𝑛 𝑀𝐺
√𝑛
0,28 − 0,23
𝑍0 = = 2,73
0,12
√43
CdR: criterio de rechazo, en términos del valor p
𝑣𝑎𝑙𝑜𝑟 − 𝑝 < 𝛼 ⟹ 𝐻𝑜
𝑣𝑎𝑙𝑜𝑟 − 𝑝 ≥ 𝛼 ⟹ 𝐻𝑜
En la realidad
𝐻𝑜 𝑒𝑠 𝑉 𝐻𝑜 𝑒𝑠 𝐹
Decisión 𝐻𝑜 Acierto Error tipo II
𝐻𝑜 Error tipo I Acierto
𝛼 𝛼
2 2
𝒁𝜶 = −𝒁𝟏− 𝜶 𝒁𝟏− 𝜶
𝟐 𝟐 𝟐
Zp: Cuantil de orden “p” de 𝑍0 i.e. es aquel valor de 𝑍0 tal que Pr( 𝑍0 ≤ 𝑍𝑝 ) = 𝑝
Φ𝑍𝑝 = 𝑝
𝛼 𝛼
RdR de 𝐻𝑜 = {𝑍𝑝 Ι 𝑝 < 𝜃 𝑝 > 1 − 2 } = {𝑍𝑝 Ι 𝑍𝑝 < −𝑍1−𝛼 𝜃 𝑍𝑝 > 𝑍1−𝛼 } =
2 2 2
𝛼 𝛼
RdnR de 𝐻𝑜 = {𝑍𝑝 Ι ≤ 𝑝 ≤ 1 − 2 } = {𝑍𝑝 Ι − 𝑍1−𝛼 ≤ 𝑍𝑝 ≤ 𝑍1−𝛼 } = {𝑍𝑝 Ι |𝑍𝑝 | ≤
2 2 2
𝑍1−𝛼 }
2
Notación:
RdR= Región de rechazo
RdnR= Región de no rechazo
El valor-p es la verdadera probabilidad del error tipo I, obtenido con la evidencia muestral
y es igual al área a cola respectiva del EdP.
En este caso ½ valor-p=Pr( Z > |𝑍𝑝 | ) 𝑉𝑎𝑙𝑜𝑟 − 𝑝 = 2 Pr(Z > |𝑍𝑝 | ) = 2[1 −
Pr(Z ≤ |𝑍𝑝 | )] ⟹ 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 2[1 − Φ(|𝑍0 |)] ⟹ 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 2[1 −
Φ(2,73)] = 2(1 − 0,9968) ⟹ 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 0,0064
Por lo tanto 𝐻𝑜
Decisión: La concentración promedio de ácido úrico en personas con dicha enfermedad
es significativamente distinta que la respectiva para personas sanas (valor-p=0,0064)
𝟐𝟎𝟐𝟎 − 𝟎𝟔 − 𝟏𝟔𝟑
NOTA: El CdR (criterio de rechazo) de una PdH se puede establecer de cuatro formas:
1. En términos del valor-p esta RdD se emplea para toda PdH
𝑣𝑎𝑙𝑜𝑟 − 𝑝 < 𝛼 ⟹ 𝐻𝑜 𝑎 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝐻1
𝑣𝑎𝑙𝑜𝑟 − 𝑝 ≥ 𝛼 ⟹ 𝐻𝑜
2. En términos de valores (cuantiles) críticos
La RdD (regla de decisión) depende en este caso no solo del parámetro o combinación de parámetros sujetos
a prueba sino también del tipo de PdH: PdHB, PdHUD o PdHUI.
𝑃𝑑𝐻𝐵𝜇 (𝛼)
|𝑍𝑜 | ≤ 𝑍1−𝛼 ⟹ 𝐻𝑜
2
𝛼 𝛼
2 2
𝒁𝜶 = −𝒁𝟏− 𝜶 𝒁𝟏− 𝜶
𝟐 𝟐 𝟐
𝑃𝑑𝐻𝑈𝐷𝜇 (𝛼)
𝑃𝑑𝐻𝑈𝐼𝜇 (𝛼)
𝑍𝑜 < 𝑍𝛼 ⟹ 𝐻𝑜 a favor de 𝐻1
𝑍𝑜 ≥ 𝑍𝛼 ⟹ 𝐻𝑜
𝑃𝑑𝐻𝐵𝜎2 (𝛼) 𝐻𝑜 : 𝜎 2 = 𝜎 2 𝑜
𝐻1 : 𝜎 2 ≠ 𝜎 2 𝑜
(𝑛−1)𝑠2
EdP: 𝑋 2 𝑜 = 𝑠2 𝑜
En 𝑃𝑑𝐻𝐵𝜃 (𝛼):
Si 𝜃𝑜 𝜖 𝐼𝑑𝐶𝜃 (1 − 𝛼) entonces 𝐻𝑜
Si 𝜃𝑜 ∉ 𝐼𝑑𝐶𝜃 (1 − 𝛼) entonces 𝐻𝑜 a favor de 𝐻1
En 𝑃𝑑𝐻𝑈𝜃 (𝛼): 𝜃 ≤ 𝜃𝑜 𝑜 𝐻𝑜 : 𝜃 ≥ 𝜃𝑜
𝜃 > 𝜃𝑜 𝐻1 : 𝜃 < 𝜃𝑜
Si 𝜃𝑜 𝜖 𝐼𝑑𝐶𝜃 (1 − 2𝛼) entonces 𝐻𝑜
Si 𝜃𝑜 ∉ 𝐼𝑑𝐶𝜃 (1 − 2𝛼) entonces 𝐻𝑜 a favor de 𝐻1
Ejercicio N°2: Recapitular el ejercicio 1 estableciendo el criterio de rechazo (CdR)
de las cuatro formas indicadas
𝐻𝑜 : 𝜇 = 𝜇𝑜 ; 𝜇𝑜 = 0.23
𝐻1 : 𝜇 ≠ 𝜇𝑜
𝑦̅ − 𝜇0
𝑍𝑜 = 𝜎 ; 𝛼 ≈ 𝑠 , 𝑦̅ = 0.28, 𝑛 = 43, 𝑠 = 0.12, 𝑍𝑜 = 2.73
√𝑛
CdR: En términos del valor-p
𝑣𝑎𝑙𝑜𝑟 − 𝑝 < 𝛼 ⟹ 𝐻𝑜 a favor 𝐻1 , en este caso, 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 2 Pr(𝑍 > |𝑍𝑜 |) =
0.0064 ; 𝛼 = 0.05
𝑣𝑎𝑙𝑜𝑟 − 𝑝 < 𝛼 ⟹ 𝐻𝑜 ∴ 𝐻𝑜 a favor 𝐻1
NOTA: Estos cuantiles se calculan con NdS “α”
|𝑍𝑜 | > 𝑍1−𝛼 ⟹ 𝐻𝑜 a favor de 𝐻1 . En este caso, 𝑍1−𝛼 = 𝑍0.075 = 1.96 ; 𝑍𝑜 = 2.73
2 2
𝜇𝑜 ∈ 𝐼𝑑𝐶𝜇 (1 − 𝛼) ⟹ 𝐻𝑜
𝛼
En este caso 𝐼𝑑𝐶𝜇 (1 − 𝛼 ) = 𝑦̅ ∓ 𝑍1−𝛼 ; 𝜎 ≈𝑠
2 √𝑛
0.12
⟹ 𝐼𝑑𝐶𝜇 (95%) = 0.28 ∓ 1.96 = 0.04
√43
⟹ 𝐼𝑑𝐶𝜇 (95%) =]0.24 ; 0.32[ ∉ 𝜇𝑜
𝟐𝟎𝟐𝟎 − 𝟎𝟔 − 𝟏𝟖𝟓
Ejercicio N°3: En una clínica para el control de peso se afirma que quienes siguen
sus tratamientos durante el primer mes, pierden al menos 5 kg. Para comprobar
aquello, el MdS (Ministerio de Salud) tomó al azar 36 personas que cumplieron las
indicaciones de la clínica durante el primer mes, encontrándose que habían perdido
4,6kg en promedio con una desviación estándar.
a) ¿es cierta la afirmación de la clínica?
y= pérdida de peso, en kg, de las personas que siguen los tratamientos de la clínica
durante el primer mes
MG
2
𝐸(𝑦) = 𝜇 ; 𝜇𝑜 = 5𝑘𝑔 , 𝑉 = 𝜎 ≈ 𝑠 2 = 1.22 , 𝑛 = 36 , 𝑦̅ = 4.6 , 𝛼 = 0.02
𝐻𝑜 : 𝜇 ≥ 𝜇𝑜
𝐻1 : 𝜇 < 𝜇𝑜
𝑦̅−𝜇0 4.6−5
EdP: 𝑍𝑜 = 𝜎 = 1.2/√36 = −2.00
√𝑛
𝑍𝑜
Valor-p
𝑍𝑜
𝟐𝟎𝟐𝟎 − 𝟎𝟔 − 𝟐𝟑𝟑
Clase de ejercicios: PdH
Gutiérrez: Ejer. 21, cap.2
Y= peso en g, de las cajas de cereal 𝜇 = 𝐸(𝑦)
𝜇0 = 300 , 𝑛 = 25 , 𝑦̅ = 278.3 , 𝑠 = 4.5
a) 𝑦 ~ 𝑁(𝜇, 𝜎 2 ) , 𝑃𝑑𝐻𝐵𝑢 (𝛼) =? ? , 𝛼 = 0.05
𝐻𝑜 : 𝜇 = 𝜇𝑜
𝐻1 : 𝜇 ≠ 𝜇𝑜
𝑦̅−𝜇0 248.3−300
EdP: 𝑍𝑜 = 𝜎 ; 𝛼 ≈ 𝑠 ⟹ 𝑍𝑜 = 4.5 = −1.89
√𝑛 √25
½ Valor-p
𝛼 𝛼
2 2
𝑍𝛼 𝑍1−𝛼
2 2
𝟐𝟎𝟐𝟎 − 𝟎𝟔 − 𝟐𝟓𝟓
PdH
𝐻𝑜 : 𝜋 ≥ 𝜋𝑜 , 𝜋𝑜 = 0.5
𝐻1 : 𝜋 < 𝜋𝑜
Para otros casos
𝑃𝑑𝐻𝐵𝜃 (𝛼) 𝐻𝑜 : 𝜃 = 𝜃𝑜
𝐻𝑜 : 𝜃 ≠ 𝜃𝑜
𝑃𝑑𝐻𝑈𝐷𝜃 (𝛼) 𝐻𝑜 : 𝜃 = 𝜃𝑜
𝐻𝑜 : 𝜃 > 𝜃𝑜
𝑃𝑑𝐻𝑈𝐼𝜃 (𝛼) 𝐻𝑜 : 𝜃 = 𝜃𝑜
𝐻𝑜 : 𝜃 < 𝜃𝑜
𝑦̅−𝜇0
EdP: 𝑍𝑜 = 𝜎
√𝑛
𝑦̅ ~𝑁(𝜇, 𝜎 2 )
𝑦𝑝 − 𝜇0
̅̅̅ 𝜎
𝑍𝑃 = 𝜎 ⟺ 𝑦𝑝 = 𝜇0 + 𝑍𝑃
̅̅̅
√𝑛
√𝑛
𝜎 0.12
𝑦𝛼 = 𝜇 0 + 𝑍 𝛼
̅̅̅ = 0.23 + (−1.96) = 0.1941
2 2 √𝑛 √43
𝜎 0.12
𝑦1−𝛼 = 𝜇0 + 𝑍𝛼
̅̅̅̅̅̅ ; 𝑦0.975 = 0.23 + (1.96)
̅̅̅̅̅̅̅ = 0.2659
2 2 √𝑛 √43
𝐻𝑜 : 𝜇 = 𝜇𝑜
𝐻1 : 𝜇 > 𝜇𝑜
𝑦̅−𝜇0 17−15
EdP: 𝑍𝑜 = 𝜎 = 3 =4
√𝑛 √36