Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicio 1)
Una muestra de 16 mujeres de una gran ciudad dio para sus estaturas una media de 1,68
m y una varianza de 0,12 m. Se trata de ver si esta muestra es consistente con la H o que
la media en la ciudad es de 1,69 m
Ejercicio 2)
En una fábrica de conservas de fruta se desea verificar la Ho de que las latas resultan en
promedio con un peso no inferior
inferior a 1 kg. Se sabe que el tamaño de la fruta puede
introducir una variación en los pesos de las latas de manera que estos se distribuyan
normalmente con una dispersión del 8%. Se efectúa una muestra de 100 latas en la que
se determina los pesos, resultando la =980 gr. Deseamos saber si la muestra
comprueba o rechaza la Ho. Fijamos un coeficiente de riesgo igual al 5%.
Ejercicio 3)
Ejercicio 4)
Ejercicio 5)
980 1.350 1.020 1.140 1.520 1.390 1.205 1.180 970 1.420 1.850 1.300 1.305 1.040
1.050 1.520 1.320
Ejercicio 6)
Ejercicio 8)
La vida media de una muestra de 100 tubos fluorescentes producidos por una empresa
es de 1.570 h, con una desviación típica de 120 h. Si µ es la vida media de todos los
productos de esa empresa, contrastar la hipótesis de que µ = 1.600 h
Ejercicio 9)
Supóngase que las mariposas han sido recolectadas en una localidad y que se han
medido las concentraciones de glucósidos en relación a sus pesos. Los datos resultantes
son; la media= 0,200 gr. y S 2= 0,012 gr. para n= 75.
Probar la hipotesis nula de que µ = 0,150 gr. frente a la alternativa que es distinta.
Ejercicio 10)
Ejercicio 11)
La variación estándar especificada es de 1/2 onza. ¿Se cumple esta especificación? Use
el nivel de significación del 1% y una prueba bilateral
Ejercicio 12)
Ejercicio 8)
La vida media de una muestra de 100 tubos fluorescentes producidos por una empresa
es de 1.570 h, con una desviación típica de 120 h. Si µ es la vida media de todos los
productos de esa empresa, contrastar la hipótesis de que µ = 1.600 h
Ejercicio 9)
Supóngase que las mariposas han sido recolectadas en una localidad y que se han
medido las concentraciones de glucósidos en relación a sus pesos. Los datos resultantes
son; la media= 0,200 gr. y S 2= 0,012 gr. para n= 75.
Probar la hipotesis nula de que µ = 0,150 gr. frente a la alternativa que es distinta.
Ejercicio 10)
Ejercicio 11)
La variación estándar especificada es de 1/2 onza. ¿Se cumple esta especificación? Use
el nivel de significación del 1% y una prueba bilateral
Ejercicio 12)
[Vuelve al índice
índice]]
Proporción poblacional
Ejercicio 13)
Ejercicio 14)
En una muestra al azar de 400 productores, el 65% de ellos eran propietarios y el 33%
no. Verifique la hipótesis de que la muestra proviene de una población de la que el 60%
son propietarios. Use una probabilidad de cometer un error de tipo I del 5%.
Ejercicio 15)
Para ello selecciona una muestra aleatoria de 1000 personas adultas a las que somete a
una determinada encuesta, resumida la información proporcionada por el trabajo de
campo, se observó que el 12% de las personas encuestadas fumaba habitualmente.
Probar la hipótesis que la campaña publicitaria ha disminuido la cantidad de fumadores
Curso
Presentación
El Curso sobre Inferencia Estadística Básica para Agrónomos , está orientado a que el
alumno aprenda acerca de los métodos más importantes de Inferencia Estadística, como
lo son el método de Estimación de Parámetros y Test de Hipótesis, fundamentalmente
de tipo paramétrico. Ello le permitirá resolver una gran cantidad de situaciones
problemáticas que se presentan en las prácticas diarias de un Ingeniero Agrónomo.
Contenidos
Parte 1:Estimación de Parámetros. Estimación Puntual. Propiedades de un buen
estimador. Estimación por intervalos de confianza de la media poblacional, la
proporción poblacional, la varianza poblacional y la diferencia de medias.
Destinatarios
Este programa está orientado a:
Cronograma
14/8/02 al 25/8/02: Estimación de Parámetros
Escribir a abergagn@fca.unl.edu.ar
Es muy probable que una estadística muestral sea diferente del parámetro de la
población y sólo por coincidencia sería el uno exactamente igual al otro. La diferencia
entre el valor de una estadística muestral y el correspondiente parámetro de la población
se suele llamar error de estimación . Sólo se sabría cuál es el error si se conociera el
parámetro poblacional, pero éste por lo general se desconoce. La única manera de tener
alguna certeza al respecto es hacer todas las observaciones posibles del total de la
población en la mayoría de las aplicaciones prácticas, lo cual, desde luego, es imposible
o impracticable.
ESTIMACION: GENERALIDADES
Cualquier colección o agregación grande de cosas que deseamos estudiar o de las cuales
deseamos hacer inferencias, se llama población. El término población tiene más
significado cuando se lo junta con la definición de muestra de una población: una
muestra es una parte o subconjunto de una población.
Los valores de varias medidas descriptivas calculadas para las poblaciones, se llaman
parámetros. Para las muestras, estas mismas medidas descriptivas se llaman
estadísticas.
Un parámetro describe una población de la misma manera que una estadística describe a
una muestra.
Es costumbre simbolizar las estadísticas con letras romanas y los parámetros con letras
griegas.
Estadística Parámetro
Media aritmética µ
Variancia S² σ2
Desvío estándar S σ
Coeficiente de correlación R ρ
Una estadística calculada a partir de una muestra es un estimador del parámetro en la
población. Una estimación es alguna función de los resultados de una muestra que
produce un valor, llamado estimador.
Para la mayoría de los propósitos de investigación, se supone que las poblaciones son
infinitas, no finitas, en tamaño, las cuales son algo artificial o imaginario.
Una población finita puede ser extremadamente grande. Es posible concebir un proceso
de conteo de los elementos de la población, el cual puede ser computado; luego la
población es técnicamente finita. Afortunadamente no es necesario crear problemas en
cuanto a la distinción entre poblaciones infinitas y finitas.
Para que una muestra sirva adecuadamente como base para obtener estimadores de
parámetros poblacionales, debe ser representativa de la población.
El muestreo al azar de una población producirá muestras que "a la larga" son
representativas de la población.
ESTIMACIÓN DE PARÁMETROS
La teoría clásica de la Inferencia Estadística trata de los métodos por los cuales se
selecciona una muestra de una población y, basándose en las pruebas de las muestras, se
trata de:
Para poder utilizar la información que se tenga de la mejor manera posible, se necesita
identificar las estadísticas que sean buenos estimadores, cuyas propiedades son:
En símbolos: es insesgado
O sea que es de esperar que si se toman muchas muestras de igual tamaño partiendo de
la misma distribución y si de cada una se obtiene un valor , la media de todos los
valores de ha de estar muy cerca de .
Por ejemplo:
Se halla la razón
Supongamos que una variable aleatoria X tiene una distribución simétrica. Por lo tanto
la media aritmética y la mediana son iguales. Si se toma una muestra de esta
distribución, ¿qué estadístico muestral, o , debería utilizarse para estimar la media
de la población µ ?
La respuesta depende de cuál es el estimador más eficaz. Ambos son insesgados, pero la
si n →∞
O equivalentemente: si n →∞
Por ejemplo, se sabe que la media muestral y la variancia son estimadores consistentes
ya que tienden a acercarse a los correspondientes valores de la población a medida que
aumenta el tamaño de la muestra, pero un estadístico muestral puede ser un estimador
sin consistencia. Por ejemplo, si el valor de la primera observación o la media entre la
primera y última observación de una muestra se utilizaran para estimar la esperanza de
la población, tal estimador no sería consistente pues no tiende a acercarse más y más al
valor de la población cuando se aumenta el tamaño de la muestra.
Lo dicho hasta ahora se refiere a una estimación puntual, es decir, estimar un parámetro
a través de un único valor. Esta estimación no es muy conveniente pues con ella no se
puede determinar el error de muestreo, ni la precisión de la estimación, ni la confianza
que merece tal estimación.
Existen otros métodos para estimar parámetros poblacionales que son mucho más
precisos. Por ejemplo:
Donde:
es el límite inferior del intervalo de confianza.
En el caso anterior, se tiene una confianza de que 90 de cada 100 intervalos que se
extraigan como muestra, contendrán el verdadero valor del parámetro. Pero una vez
determinado el intervalo, es decir, una vez calculados numéricamente los extremos, ya
no debe hablarse en términos de confiabilidad ni en términos probabilísticos, pues la
situación pasa a ser completamente determinística. De tal manera, asociado a un
intervalo de confianza ya calculado, se tiene una probabilidad 0 ó 1 de que contenga al
parámetro a estimar y no hay otra opción, ya que lo contiene o no lo contiene.
Resumiendo, los extremos del intervalo son variables aleatorias, mientras que el
parámetro a determinar es constante.
En general, los pasos a seguir para estimar un parámetro por el método de los intervalos
de confianza, son:
Sea x1, x2, ... , x n una muestra aleatoria de la variable aleatoria X y sea la media
muestral.
Luego, tipificando:
Se plantea: entonces:
Observaciones:
- Si las muestras se toman sin reposición de una población finita de tamaño N, debe
emplearse el factor de corrección por finitud y el intervalo será:
- Si la población es sólo aproximadamente normal, la igualdad sigue siendo válida en
forma aproximada.
Respuesta:
X = cambio en la presión sanguínea por paciente del sanatorio (en pulsaciones por
segundo)
n = 30 σ=31- = 0.95
Luego, puede decirse que el cambio medio en la presión sanguínea por paciente,
pertenece al intervalo (3,9 ; 6,1) pulsaciones, con un nivel de confianza del 95%.
Observación: Nótese que se cae en un abuso de lenguaje pues se debería decir que el
intervalo (3,9 ; 6,1) pulsaciones pertenece a la sucesión que ofrece un nivel de confianza
del 95% para estimar el cambio medio de presión sanguínea, pero se simplifica la
expresión para hacerla menos engorrosa o extensa.
se pretende que sea lo más grande posible. Pero depende del valor de α y al hacer
O sea que debe tomarse una muestra de aproximadamente 52 pacientes en lugar de 30.
pacientes.
por resulta:
Por lo tanto:
= 1-α
Ejemplo 2: Una muestra de 15 aves tomadas al azar en un establecimiento con 5000
aves, (que elabora alimentos balanceados), permitió establecer un aumento de peso
promedio de 90 g por semana y por ave, y un desvío típico de 10 g. Se busca estimar el
incremento de peso promedio para las 5000 aves del establecimiento con un intervalo de
confianza del 90%.
Respuesta:
n = 15 = 90 g S = 10 g ¿ICM 0,90?
Por tabla:
y el intervalo resulta:
Interpretando este resultado, se dice que el aumento de peso por ave por semana en el
establecimiento está entre 85,5 y 94,6 gramos, con un 90% de confianza.
distribución: (1)
Además, (2)
Respuesta:
, n = 40 ¿ICDM0,90?
Interpretando este resultado, se dice que la diferencia entre las superficies medias de las
explotaciones agrícolo-ganaderas de ambas zonas, se encuentra entre 212,8 y 387,2 ha,
con un 90% de confianza.
∼ tδ
n1 = 10, , S1 = 5
n2 = 12, , S2 = 3, σ 1 ≠ σ 2 ¿ICDM0,95?
Con estos datos, reemplazamos en la fórmula para calcular los grados de libertad:
grados de libertad.
ICDM0,95 =
Interpretando el resultado se puede decir que la diferencia entre las edades medias de las
personas que murieron de tuberculosis en ambas ciudades, se encuentra entre 3 y 11
años, con una confianza del 95%.
INTERVALO DE CONFIANZA PARA LA VARIANCIA POBLACIONAL
Además: (2)
Invirtiendo fracciones:
Respuesta:
Por tabla:
Se interpreta este resultado diciendo que existe un 98% de confianza de que la variancia
del peso por bolsa en toda la producción de bolsas de fertilizantes de ese productor esté
entre 0,12 y 0,75
Observaciones:
INTRODUCCIÓN
En cada uno de los anteriores casos el responsable del estudio postula o conjetura algo
acerca de un sistema. Estos constituyen enunciados provisionales, puesto que al no
poder integrar el cúmulo de sus conocimientos todo lo concerniente a la situación,
aparece la incertidumbre. La función de la estadística en su aspecto inferencial es la de
apoyar el razonamiento para llegar a decisiones sólidas a pesar de la incertidumbre. Al
respecto, es tan importante el papel que desempeña la estadística en estas situaciones
que se suele hablar de la estadística moderna como "el estudio de las decisiones ante la
incertidumbre".
Se puede decir que se llaman decisiones estadísticas a las decisiones que deben
tomarse con respecto a las poblaciones a partir de una información obtenida de una
muestra de las mismas. Por ejemplo, a partir de los datos del muestreo podemos querer
llegar a decidir si un suero nuevo es realmente efectivo para la cura de una enfermedad,
si un sistema educacional es mejor que otro, si una moneda está o no cargada, etc.
En los casos que se han señalado se observa que se deben tomar decisiones con base en
datos experimentales. Y si hay que tomar decisiones es porque hay alternativas; cada
una de estas alternativas es formalizada como una hipótesis estadística y el proceso
mediante el cual se enfrentan o confrontan las hipótesis al tomar como punto de apoyo
los datos muestrales constituye lo que se denomina prueba o contraste de hipótesis.
Una hipótesis es una suposición sobre la naturaleza de una población. Las hipótesis
generalmente están expresadas en términos de parámetros poblacionales.
2
= 4 (la variancia poblacional es igual a 4)
2
>11 (la variancia poblacional es mayor que 11)
Un test de una hipótesis es un procedimiento estadístico usado para tomar una decisión
sobre el valor de un parámetro poblacional.
Ejemplo :Un semillero publicita que el peso promedio de una espiga de una cierta
variedad es de 180 gramos con una desvío estándar de 30 gramos. Un productor de
avanzada sospecha que el peso es distinto de 180 gramos, decide por lo tanto conducir
un experimento. El propósito del mismo es ver si el peso de 180 gramos es incorrecto.
Por lo tanto la hipótesis nula de interés es:
H0 : µ = 180 gramos
Se puede ver que las hipótesis son excluyentes. La hipótesis alternativa frecuentemente
se llama hipótesis de investigación , porque este tipo de hipótesis expresa la teoría que
el investigador o experimentador cree va a ser verdadera.
Para interpretar el valor del test estadístico es necesario introducir un elemento más al
test de hipótesis: la región de rechazo , que especifica los valores del test estadístico
para los cuales la hipótesis nula es rechazada ( y para los cuales la hipótesis alternativa
no es rechazada).
La región de rechazo identifica los valores del test estadístico que sostienen o sustentan
la alternativa y serían improbables, (raros) si la hipótesis nula fuera verdadera.
Ya que no se espera observar sucesos raros (valores improbables del test estadístico) la
hipótesis nula se rechazará cuando la muestra produzca un valor tal.
Para el ejemplo si la media fuera menor que 180 gr o mayor que 180 gr esta sustentaría
la hipótesis alternativa
(µ 180) y un valor de más de 2, (1,96) errores estándares por debajo o por encima
de 180 sería raro o poco probable.
= P (error de tipo I)
P (rechazar H0 si H0 es verdadera)
P (aceptar H0 si H0 es falsa)
Es deseable que tanto como estén próximos a cero pero en general esto no es
posible, ya que el experimentador desea concluir que H1 es verdadera (rechazar H0 ) el
interés está en que tenga una probabilidad pequeña tal como 0,01 ó 0,05. En otras
palabras , se desea estar seguro que si H0 es verdadera, será muy raro que sea rechazada.
El experimentador es libre de elegir el valor de , esto es, determinar cuán raro un
suceso observado debe ser para rechazar H0. Determinar si el valor de estará presente
para el test de hipótesis es algo más complicado, de modo que no se intentará su cálculo.
H0 : µ = 180 gramos
H1 : µ 180 gramos
Suponiendo que los resultados del experimento produjeron una media muestral de 187
gramos, el test estadístico se construiría como:
como el valor de z calculado= 1,65 es menor que l,96 o sea cae en la región de
aceptación , no hay evidencias sufucientes como para rechazar la hipótesis de que la
media de la población es igual a 180.
Conclusión: la publicidad que hace el semillero de que el peso promedio de las espigas
de una cierta variedad es de 180 gramos, es correcta, aunque podría existir una
probabilidad de error tipo II, si de hecho la media de tal variedad no fuera 180 gramos
HIPÓTESIS UNILATERALES
Si en el mismo ejemplo, el productor, basándose en algún conocimiento de la variedad
en cuestión sospechara que el peso promedio de las espigas es menor que 180, las
hipótesis se plantearían como:
= 0,05
Si por otra parte, el productor sospechara que el peso promedio es mayor que 180
gramos, la hipótesis y la zona de rechazo se plantearían como:
= 0,05
H0 : µ = µ 0
H1 : µ µ0
Por supuesto se puede calcular la probabilidad de error tipo II para cualquier valor de µ .
Cuanto menor sea esta probabilidad mejor será el contraste para distinguir entre
hipótesis ciertas y falsas, o sea, cuanto menor sea la probabilidad de no rechazar H0,
cuando esta sea falsa, más "potente" es el contraste. La potencia de un contraste se
mide por la probabilidad de rechazar H 0 cuando sea falsa. Al ser la probabilidad de no
rechazar H0 cuando esta es falsa, la potencia del contraste es igual a: 1 - P ( error tipo
II )
ESQUEMA PARA CONTRASTAR HIPÓTESIS
Ejemplo: Para estimar el rendimiento de parcelas plantadas con papa de una cierta
variedad, se cosecharon ocho de ellas, obteniéndose la siguiente información expresada
en kg/parcela:
¿Se puede asegurar, con α =0,05, de que esta variedad de papas tiene un rendimiento
promedio de 5,25 kg?
H0 : µ = 5,25
H1 : µ 5,25
A partir de los datos se calcula y S², para este ejemplo = 5,5625 y S² =0,2884.
Como el valor de t calculado cae entre –2,365 y 2,365 (valor tabulado de t para 7 grados
de libertad y α = 0,025, no se rechaza la hipótesis nula.
Conclusión: No hay duficiente evidencia, a partir de los datos de la muestra, para decir
que el rendimiento de papa por parcela no es igual a 5,25.
CONTRASTE DE HIPÓTESIS REFERENTES A UNA PROPORCIÓN
POBLACIONAL (P)
H0: P P0
H1: P < P0
: 0,05
Por eso se puede utilizar "p" como criterio de test para probar la hipótesis con respecto
al parámetro proporción poblacional. El test estadísto z se calcula:
H0: P = 0,90
H1: P ≠ 0,90
Como el valor calculado de Z = –0,97 reside entre los valores tabulados –1,96 y 1,96
(valores críticos de la distribucion normal ) no se rechaza H0.
El cliente, quien debe realizar una fuerte inversión, decide poner a prueba la hipótesis
del operador, estableciendo las siguientes hipótesis estadísticas:
H0) 0,2
Para probar esta hipótesis selecciona una muestra de 15 días donde se registra la
cotización diaria. El cálculo de la varianza en la muestra es S2 = 0,4.
Gráficamente se tendrá:
Como se puede observar, el estadístico utilizado como criterio para realizar el test, cae
en la zona de rechazo de la hipótesis nula.
Cuando se trata de comparar las variancias se utiliza la variable F=S²1/S²2, que como se
sabe está relacionada con la distribución F con (n1-1, n2-1) grados de libertad.
H0: σ ²1 = σ ²2
H1: σ ²1 ≠ σ ²2
n1 = n2 = 13, α = 0,05
Los supuestos que se deben cumplir son que las medias poblacionales µ 1 y µ 2 son
normales, los desvíos poblacionales y conocidos y las muestras, independientes, de
tamaño n1 y n2 respectivamente, estableciendo las siguientes hipótesis:
H0 ) µ 1 -µ 2 = 0 ó µ 1 = µ 2
a ) H1 ) µ 1 µ2
b) H1 ) µ 1 > µ 2
c) H1 ) µ 1 < µ 2
= 0,05
Si y son iguales, lo que equivale a decir que hay una sola variancia, la fórmula
anterior se puede reemplazar por la siguiente:
En el cont
contra
rast
stee a)
a) val
valor
ores
es gran
grande
dess y pequ
pequeñ
eños
os de(
de( )y por
por lo
lo tant
tanto
o peq
peque
ueño
ñoss de
de Z
son suficientes para confirmar H1. Por lo tanto para un ensayo bilateral con nivel de
significación , la hipótesis H0 se rechaza si :
Z< óZ>
En el cont
contra
rast
stee b)
b) só
sólo valo
valore
ress gra
grand
ndes
es de ( ) y de Z con
confirm
firman
an la hip
hipótes
ótesis
is H1.
En un ensayo unilateral, rechazamos H 0 cuando:
Z > Z 1-
Z<Z
H0 ) µ A = µ B ó µ A -µ B = 0
H1 ) µ A µB
Por ser un test bilateral, los valores críticos de la distribución normal, para α = 0,05 son
–1,96 y 1,96. Como
Como el valor de la estadística calculada cae entre los valores críticos, no
hay evidencias como para rechazar la hipótesis nula. Por lo tanto las media de los dos
metodos de mineralización no difieren.
a) Se suponen iguales ( ):
Los supuestos que se deben cumplir son: datos extraídos de dos muestras aleatorias
independientes de tamaño n 1 y n2 respectivamente, cuyas poblaciones son normales con
donde
Ejemplo 3: Dieciocho plantas de una misma variedad de naranjos fueron tratadas con
fertilizantes. A nueve de ellas se les aplico una cierta dosis de nitrógeno (N) y al resto
una de nitrógeno y fósforo (NP). Se midió el rendimiento en Kg. por planta; los
resultados obtenidos fueron:
_
N: X = 28 kg S² = 9
_
NP: X = 21 kg S² = 7
H0 ) µ N = µ NP ó µ N -µ NP = 0
H1 ) µ N µ NP
Suponiendo que las variancias poblacionales son iguales, de las cuales S² N y S² NP son
estimaciones, se calcula la variancia amalgmada. Si el supuesto no fuera válido debería
verificarse primeramente la homogneidad de varinacia a través del test F, en particular
si las muestras de las poblaciones no son iguales.
Donde
b) se suponen distintos ( )
También puede ocurrir que al estudiar en dos lotes de plantas homogéneas de a pares, la
aplicación de herbicidas (uno en cada lote), para ciertas plagas (se obtenga diferencias
de resistencia entre los lotes de plantas).
H0 ) ó H0) ó H0)
= 0,05
Como se establece una hipotesis de un único parámetro poblaciona (se podría pensar en
una sola muestra) , el número de grados de liberatd es (n - 1) el test estadístico es:
donde
luego se compara el tc con tn -1 . Las reglas de decisión son:
1 201 200 -1 1
2 231 236 +5 25
3 221 216 -5 25
5 228 224 -4 16
12 201 209 +8 64
La pregunta que se plantea es: ¿proporcionan los datos suficiente evidencia cómo para
concluir que el programa es efectivo en la reducción de los niveles de colesterol en
suero?
Aplicar un test de hipótesis para llegar a una decisión al repecto, utilizando un del
0,05.
Las hipótesis planteadas son:
H0)
H1) <0
= 0,05
H1: P1 ≠ P2
∼ N(0, 1)
Ejemplo 5: Sobre parcelas sembradas con dos variedades distintas de maíz (A y B), se
aplicó un herbicida que resultó ser nocivo en el sentido que destruyó gran parte de las
plantas. De un total de 500 plantas de la primera variedad fueron destruidas 200 y de
570 plantas de la segunda variedad, murieron también 200. ¿Se puede considerar que el
herbicida es igualmente nocivo para las dos variedades?. (α = 0,05).
Por ser una prueba bilateral, los valores críticos de la distribución normal son –1,96 y
1,96 ( α =0,05), como el valor de Z = 1,l8 cae entre estos valores, no se rechaza la
hipótesis nula.
Conclusión: Se puede considerar que el herbicida es igualmente nocivo para las dos
variedades.
Cuando se trata de comparar las variancias se utiliza la variable F=S²1/S²2, que como se
sabe está relacionada con la distribución F con (n1-1, n2-1) grados de libertad.
H0: σ ²1 = σ ²2
H1: σ ²1 ≠ σ ²2
n1 = n2 = 13, α = 0,05
Los supuestos que se deben cumplir son que las medias poblacionales µ 1 y µ 2 son
normales, los desvíos poblacionales y conocidos y las muestras, independientes, de
tamaño n1 y n2 respectivamente, estableciendo las siguientes hipótesis:
H0 ) µ 1 -µ 2 = 0 ó µ 1 = µ 2
a ) H1 ) µ 1 µ2
b) H1 ) µ 1 > µ 2
c) H1 ) µ 1 < µ 2
= 0,05
Si y son iguales, lo que equivale a decir que hay una sola variancia, la fórmula
anterior se puede reemplazar por la siguiente:
Z< óZ>
Z > Z 1-
Z<Z
H1 ) µ A µB
Por ser un test bilateral, los valores críticos de la distribución normal, para α = 0,05 son
–1,96 y 1,96. Como el valor de la estadística calculada cae entre los valores críticos, no
hay evidencias como para rechazar la hipótesis nula. Por lo tanto las media de los dos
metodos de mineralización no difieren.
a) Se suponen iguales ( ):
Los supuestos que se deben cumplir son: datos extraídos de dos muestras aleatorias
independientes de tamaño n 1 y n2 respectivamente, cuyas poblaciones son normales con
donde
Ejemplo 3: Dieciocho plantas de una misma variedad de naranjos fueron tratadas con
fertilizantes. A nueve de ellas se les aplico una cierta dosis de nitrógeno (N) y al resto
una de nitrógeno y fósforo (NP). Se midió el rendimiento en Kg. por planta; los
resultados obtenidos fueron:
_
N: X = 28 kg S² = 9
_
NP: X = 21 kg S² = 7
H0 ) µ N = µ NP ó µ N -µ NP = 0
H1 ) µ N µ NP
Suponiendo que las variancias poblacionales son iguales, de las cuales S² N y S² NP son
estimaciones, se calcula la variancia amalgmada. Si el supuesto no fuera válido debería
verificarse primeramente la homogneidad de varinacia a través del test F, en particular
si las muestras de las poblaciones no son iguales.
Donde
b) se suponen distintos ( )
También puede ocurrir que al estudiar en dos lotes de plantas homogéneas de a pares, la
aplicación de herbicidas (uno en cada lote), para ciertas plagas (se obtenga diferencias
de resistencia entre los lotes de plantas).
H0 ) ó H0) ó H0)
= 0,05
Como se establece una hipotesis de un único parámetro poblaciona (se podría pensar en
una sola muestra) , el número de grados de liberatd es (n - 1) el test estadístico es:
donde
1 201 200 -1 1
2 231 236 +5 25
3 221 216 -5 25
5 228 224 -4 16
12 201 209 +8 64
La pregunta que se plantea es: ¿proporcionan los datos suficiente evidencia cómo para
concluir que el programa es efectivo en la reducción de los niveles de colesterol en
suero?
Aplicar un test de hipótesis para llegar a una decisión al repecto, utilizando un del
0,05.
H0)
H1) <0
= 0,05
∼ N(0, 1)
Ejemplo 5: Sobre parcelas sembradas con dos variedades distintas de maíz (A y B), se
aplicó un herbicida que resultó ser nocivo en el sentido que destruyó gran parte de las
plantas. De un total de 500 plantas de la primera variedad fueron destruidas 200 y de
570 plantas de la segunda variedad, murieron también 200. ¿Se puede considerar que el
herbicida es igualmente nocivo para las dos variedades?. (α = 0,05).
Por ser una prueba bilateral, los valores críticos de la distribución normal son –1,96 y
1,96 ( α =0,05), como el valor de Z = 1,l8 cae entre estos valores, no se rechaza la
hipótesis nula.
Conclusión: Se puede considerar que el herbicida es igualmente nocivo para las dos
variedades.
PRUEBAS DE HIPÓTESIS DE LAS VARIANCIAS DE DOS POBLACIONES
NORMALES
Cuando se trata de comparar las variancias se utiliza la variable F=S²1/S²2, que como se
sabe está relacionada con la distribución F con (n1-1, n2-1) grados de libertad.
H0: σ ²1 = σ ²2
H1: σ ²1 ≠ σ ²2
n1 = n2 = 13, α = 0,05
Los supuestos que se deben cumplir son que las medias poblacionales µ 1 y µ 2 son
normales, los desvíos poblacionales y conocidos y las muestras, independientes, de
tamaño n1 y n2 respectivamente, estableciendo las siguientes hipótesis:
H0 ) µ 1 -µ 2 = 0 ó µ 1 = µ 2
a ) H1 ) µ 1 µ2
b) H1 ) µ 1 > µ 2
c) H1 ) µ 1 < µ 2
= 0,05
Si y son iguales, lo que equivale a decir que hay una sola variancia, la fórmula
anterior se puede reemplazar por la siguiente:
Z< óZ>
En el contraste b) sólo valores grandes de ( ) y de Z confirman la hipótesis H1.
En un ensayo unilateral, rechazamos H 0 cuando:
Z > Z 1-
Z<Z
H0 ) µ A = µ B ó µ A -µ B = 0
H1 ) µ A µB
Por ser un test bilateral, los valores críticos de la distribución normal, para α = 0,05 son
–1,96 y 1,96. Como el valor de la estadística calculada cae entre los valores críticos, no
hay evidencias como para rechazar la hipótesis nula. Por lo tanto las media de los dos
metodos de mineralización no difieren.
a) Se suponen iguales ( ):
Los supuestos que se deben cumplir son: datos extraídos de dos muestras aleatorias
independientes de tamaño n 1 y n2 respectivamente, cuyas poblaciones son normales con
donde
Ejemplo 3: Dieciocho plantas de una misma variedad de naranjos fueron tratadas con
fertilizantes. A nueve de ellas se les aplico una cierta dosis de nitrógeno (N) y al resto
una de nitrógeno y fósforo (NP). Se midió el rendimiento en Kg. por planta; los
resultados obtenidos fueron:
_
N: X = 28 kg S² = 9
_
NP: X = 21 kg S² = 7
H0 ) µ N = µ NP ó µ N -µ NP = 0
H1 ) µ N µ NP
Suponiendo que las variancias poblacionales son iguales, de las cuales S² N y S² NP son
estimaciones, se calcula la variancia amalgmada. Si el supuesto no fuera válido debería
verificarse primeramente la homogneidad de varinacia a través del test F, en particular
si las muestras de las poblaciones no son iguales.
Donde
El valor tabulado de t, para 16 grados de libertad y nivel de significación del 1% es
igual a ± 2,921. Como el valor de la estadística calculada supera al valor tabulado, se
rechas H0 . Conclusión existen diferencias estadísticamente significativas entre los
tratamientos, siendo superior el promedio por planta de naranjo, de aquellas que reciben
el tratamiento NP.
[Vuelve a índice]
b) se suponen distintos ( )
También puede ocurrir que al estudiar en dos lotes de plantas homogéneas de a pares, la
aplicación de herbicidas (uno en cada lote), para ciertas plagas (se obtenga diferencias
de resistencia entre los lotes de plantas).
H0 ) ó H0) ó H0)
= 0,05
Como se establece una hipotesis de un único parámetro poblaciona (se podría pensar en
una sola muestra) , el número de grados de liberatd es (n - 1) el test estadístico es:
donde
2 231 236 +5 25
3 221 216 -5 25
5 228 224 -4 16
12 201 209 +8 64
La pregunta que se plantea es: ¿proporcionan los datos suficiente evidencia cómo para
concluir que el programa es efectivo en la reducción de los niveles de colesterol en
suero?
Aplicar un test de hipótesis para llegar a una decisión al repecto, utilizando un del
0,05.
H0)
H1) <0
= 0,05
t (11; 0,05) = - 1,7959 (valor de tabla)
H1: P1 ≠ P2
∼ N(0, 1)
Ejemplo 5: Sobre parcelas sembradas con dos variedades distintas de maíz (A y B), se
aplicó un herbicida que resultó ser nocivo en el sentido que destruyó gran parte de las
plantas. De un total de 500 plantas de la primera variedad fueron destruidas 200 y de
570 plantas de la segunda variedad, murieron también 200. ¿Se puede considerar que el
herbicida es igualmente nocivo para las dos variedades?. (α = 0,05).
Por ser una prueba bilateral, los valores críticos de la distribución normal son –1,96 y
1,96 ( α =0,05), como el valor de Z = 1,l8 cae entre estos valores, no se rechaza la
hipótesis nula.
Conclusión: Se puede considerar que el herbicida es igualmente nocivo para las dos
variedades.
Cuando se trata de comparar las variancias se utiliza la variable F=S²1/S²2, que como se
sabe está relacionada con la distribución F con (n1-1, n2-1) grados de libertad.
H0: σ ²1 = σ ²2
H1: σ ²1 ≠ σ ²2
n1 = n2 = 13, α = 0,05
Los supuestos que se deben cumplir son que las medias poblacionales µ 1 y µ 2 son
normales, los desvíos poblacionales y conocidos y las muestras, independientes, de
tamaño n1 y n2 respectivamente, estableciendo las siguientes hipótesis:
H0 ) µ 1 -µ 2 = 0 ó µ 1 = µ 2
a ) H1 ) µ 1 µ2
b) H1 ) µ 1 > µ 2
c) H1 ) µ 1 < µ 2
= 0,05
Z< óZ>
Z > Z 1-
Z<Z
H0 ) µ A = µ B ó µ A -µ B = 0
H1 ) µ A µB
Por ser un test bilateral, los valores críticos de la distribución normal, para α = 0,05 son
–1,96 y 1,96. Como el valor de la estadística calculada cae entre los valores críticos, no
hay evidencias como para rechazar la hipótesis nula. Por lo tanto las media de los dos
metodos de mineralización no difieren.
a) Se suponen iguales ( ):
Los supuestos que se deben cumplir son: datos extraídos de dos muestras aleatorias
independientes de tamaño n 1 y n2 respectivamente, cuyas poblaciones son normales con
donde
Ejemplo 3: Dieciocho plantas de una misma variedad de naranjos fueron tratadas con
fertilizantes. A nueve de ellas se les aplico una cierta dosis de nitrógeno (N) y al resto
una de nitrógeno y fósforo (NP). Se midió el rendimiento en Kg. por planta; los
resultados obtenidos fueron:
_
N: X = 28 kg S² = 9
_
NP: X = 21 kg S² = 7
H0 ) µ N = µ NP ó µ N -µ NP = 0
H1 ) µ N µ NP
Suponiendo que las variancias poblacionales son iguales, de las cuales S² N y S² NP son
estimaciones, se calcula la variancia amalgmada. Si el supuesto no fuera válido debería
verificarse primeramente la homogneidad de varinacia a través del test F, en particular
si las muestras de las poblaciones no son iguales.
Donde
[Vuelve a índice]
b) se suponen distintos ( )
[Vuelve a índice]
También puede ocurrir que al estudiar en dos lotes de plantas homogéneas de a pares, la
aplicación de herbicidas (uno en cada lote), para ciertas plagas (se obtenga diferencias
de resistencia entre los lotes de plantas).
H0 ) ó H0) ó H0)
= 0,05
Como se establece una hipotesis de un único parámetro poblaciona (se podría pensar en
una sola muestra) , el número de grados de liberatd es (n - 1) el test estadístico es:
donde
[Vuelve a índice]
1 201 200 -1 1
2 231 236 +5 25
3 221 216 -5 25
5 228 224 -4 16
12 201 209 +8 64
TOTAL -242 10.766
La pregunta que se plantea es: ¿proporcionan los datos suficiente evidencia cómo para
concluir que el programa es efectivo en la reducción de los niveles de colesterol en
suero?
Aplicar un test de hipótesis para llegar a una decisión al repecto, utilizando un del
0,05.
H0)
H1) <0
= 0,05
[Vuelve a índice]
H1: P1 ≠ P2
∼ N(0, 1)
[Vuelve a índice]
Ejemplo 5: Sobre parcelas sembradas con dos variedades distintas de maíz (A y B), se
aplicó un herbicida que resultó ser nocivo en el sentido que destruyó gran parte de las
plantas. De un total de 500 plantas de la primera variedad fueron destruidas 200 y de
570 plantas de la segunda variedad, murieron también 200. ¿Se puede considerar que el
herbicida es igualmente nocivo para las dos variedades?. (α = 0,05).
Por ser una prueba bilateral, los valores críticos de la distribución normal son –1,96 y
1,96 ( α =0,05), como el valor de Z = 1,l8 cae entre estos valores, no se rechaza la
hipótesis nula.
Conclusión: Se puede considerar que el herbicida es igualmente nocivo para las dos
variedades.
[Vuelve a índice]
Muestras independientes
Ejercicio 1)
Una Cooperativa Agrícola debe decidir cuál de dos tipos de neumáticos (A y B) va a
comprar para sus camiones. Los neumáticos se prueban bajo condiciones semejantes
hasta que se desgastan. Se emplean 16 de cada marca. Si
y S(A) = S(B) = 340 km, ¿existen diferencias
significativas entre las medias al nivel de significación del 5%?
Ejercicio 2)
Mediante dos procesos se fabrican alambres galvanizados lisos para alambrados rurales.
Los técnicos de la fábrica desean determinar si los dos procesos poseen diferentes
efectos en la resistencia de la media de ruptura del alambre. Se someten varias muestras
a los dos procesos dando los siguientes resultados:
Proceso 1 = 9 4 10 7 9 10
Proceso 2 = 14 9 13 12 13 8 10
Ejercicio 3)
Se sabe que una máquina de empacar cereales disecados vierte el cereal seco en bolsas
de 20 kg., con una desviación estándar de 4 kg. Se llevan a cabo verificaciones
constantes de los pesos netos de las bolsas para mantener el ajuste de la maquinaria que
controla el peso. Dos muestras tomadas en dos días, presentan la siguiente información:
n1 = 30 n2 = 35
Docime la H0 que no se verifica ningún cambio en el ajuste de la máquina entre los dos
días.(α = 0,05)
Ejercicio 4)
Lote A =
Lote B =
Se desea docimar al 5% la H0:
Ejercicio 5)
Alimentación
Alimentación B
A
7,5 8,2
7,2 8,1
8,0 7,8
7,3 8,6
7,2 8,5
7,9 7,8
8,1 8,4
7,6 8,5
Ejercicio 6)
Control Vitamina A
175 142
132 311
218 337
151 262
200 302
219 195
234 253
149 199
187 236
123 216
248 211
206 176
179 249
206 214
Ejercicio 7)
Atípicas: 6,21- 5,70- 6,04 - 4,47 - 5,22 - 4,45 - 4,84 - 5,88 - 5,82- 6,09- 5,59 - 6,06 -
5,59 - 6,74 - 5,55.
Aberrantes: 4,28 - 7,71 - 6,48 - 7,71 - 7,37 - 7,20 - 7,06 - 6,40 - 8,93 - 5,91 - 5,51 - 6,36.
Probar la hipótesis que la diferencia entre las medias de las poblaciones de los
porcentajes de caucho, no son significativas (α = 0,05)
Ejercicio 8)
HEMBRAS:1061-1065-1092-1017-1021-1138-1143-1094-1270-1028
Ejercicio 9)
5,9 7,6
3,8 0,4
6,5 1,1
18,3 3,2
18,2 6,5
16,1 4,1
7,6 4,7
Probar la hipótesis de que no hay diferencia significativa entre las medias poblacionales
(α = 0,01)
[Vuelve al índice]
Muestras apareadas
Ejercicio 10)
1 1,75 1,80
2 1,43 1,52
3 1,72 1,80
4 1,58 1,59
5 1,62 1,71
6 1,72 1,78
7 1,75 1,75
8 1,80 1,81
Ejercicio 11)
Para contrastar el efecto del uso de una nueva máquina sembradora, se realizaron 10
parcelas con una conocida y otras 10 con la nueva máquina. Las 20 parcelas se eligieron
al azar, de a pares y en cada una del par, por sorteo se usó cada una de las máquinas.
1 8,0 5,6
2 8,4 7,4
3 8,0 7,3
4 6,4 6,4
5 8,6 7,5
6 7,7 6,1
7 7,7 6,6
8 5,6 6,0
9 5,7 5,6
10 6,2 5,5
9 17
17 11
31 18
18 14
7 6
8 7
20 17
10 5
Ejercicio 13)
1 4,0 4,4
2 5,2 3,7
3 5,7 4,7
4 4,2 2,8
5 4,8 4,2
6 3,9 4,3
7 4,1 3,5
8 3,0 3,7
9 4,6 3,1
10 6,8 1,9
Probar la hipótesis de que no hay diferencia significativa entre las medias poblacionales
contra la alternativa de que las flores de la parte superior producen mas semilla.(α =
0,05)
Ejercicio 14)
Supongamos que se lleva adelante una investigación sobre la eficacia de una droga en la
reducción de un tumor. Para ello se tomaron 12 ratas a las cuales se les aplican células
cancerígenas que desarrollan el tumor en cuestión.
antes después
5,2 2,3
4,1 3,2
2,3 2,1
3,5 3,0
4,0 3,3
5,1 3,9
4,2 3,0
5,0 3,5
3,9 3,6
4,1 3,2
4,0 3,6
3,5 2,9
Probar la hipótesis que las diferencias del diámetro del tumor, antes y después del
tratamiento no son significativas. (α = 0,01).
[Vuelve al índice]
Diferencia de varianzas
Ejercicio 15)
Normal: n2=24
[Vuelve al índice]
Diferencia de proporciones
Ejercicio 16)
De una muestra de 450 votantes hombres, 105 se declararon simpatizantes del candidato
A. De una muestra de 550 votantes mujeres 120 se declararon simpatizantes del mismo
candidato. ¿ Proporcionan estos datos evidencia suficiente como para considera que las
proporciones de los simpatizantes hombres y mujeres son iguales? ∝ = 0,05
Ejercicio 17)
Se realizó una encuesta para determinar la diferencia que puede existir entre las
proporciones de casados y solteros entre 20 y 30 años que fuman. Se entrevistaron 200
personas de cada grupo y se encontraron 64 casados y 80 solteros que fuman. ¿