Está en la página 1de 29

Probabilidad y

Estadística
DRA FLORENCIA JAUREGUIBERRY

UNIVERSIDAD NACIONAL DE RÍO NEGRO

INGENIERÍA EN BIOTECNOLOGÍA – INGENIERÍA EN ALIMENTOS – TECNICATURA EN ENOLOGÍA

UNIDAD 4 - CLASE 2
Contenido Unidad 4
Estimación puntual de parámetros. Condiciones de un buen estimador.
Estimaciones puntuales. Distribución de los estadísticos muestrales: media aritmética, variancia
y proporciones. Distribución de la diferencia de medias y del cociente de varianzas.
Estimaciones por intervalos de confianza.
Teoría general de las pruebas de hipótesis. Tipos de errores. Pruebas relativas a la media, a la
variancia y a una proporción.
Regresión.
Test/Prueba de Hipótesis
Los tests de hipótesis ayudan a validar o descartar una afirmación (hipótesis)
También es inferencia estadística: se trabaja a partir de la información de una muestra
Lineamiento general de pasos a seguir:
1. Se formula una hipótesis acerca de un parámetro de población
2. Se decide qué criterio utilizar para rechazar o aceptar esa hipótesis
3. Se recolectan datos de muestra
4. Se producen estadísticas muestrales
5. Se usa la información para decidir qué tan probable es que nuestro parámetro de población
hipotético sea correcto
Formulación de hipótesis
Se plantea una hipótesis sobre el valor de un parámetro poblacional.
Hipótesis nula, H0
Hipótesis alternativa, H1 o HA

Ejemplo:
H0: µ=0
H1: µ≠0 o H1: µ <0 o H1: µ >0
Criterio de
rechazo
Se usa un determinado nivel de
significatividad
El nivel de significancia indicará el
porcentaje de estadísticos que
está fuera de ciertos límites,
cuando suponemos que la
hipótesis es correcta
Cuando se fija el nivel de
significatividad, se fijan los valores
críticos correspondientes
Se pueden cometer
errores
Cuanto más alto sea el nivel de significancia que
utilizamos para probar una hipótesis, mayor será
la probabilidad de rechazar la hipótesis nula
cuando es cierta

Pero también hay una probabilidad de no


rechazar la hipótesis nula cuando no es cierta
Error Tipo I y Error Tipo II
Error tipo I: rechazar la hipótesis nula cuando es cierta
Probabilidad del error tipo I se simboliza con α

Error tipo II: aceptar (no rechazar) la hipótesis nula cuando es falsa
Probabilidad del error tipo II se simboliza con β.

La probabilidad de cometer un tipo de error puede reducirse sólo si se aumenta la probabilidad


de cometer el otro tipo de error.
Se puede reducir β aumentando el tamaño de la muestra n
Error tipo II Error tipo I
Falso positivo Falso negativo

Estás No estás
embarazado embarazada
Test con σ conocido
Una vez obtenida la muestra, se calcula el valor z del estadístico (para la media poblacional, se
usa la media muestral):
ҧ
𝑥−𝜇
𝑧= 𝜎
𝑛
Una vez obtenido ese valor, se compara con los valores críticos correspondientes al nivel de
significatividad elegidos.
Regla de decisión:
Rechace H0 si z cae en la zona de rechazo
No rechace H0 si cae en la Región de no rechazo
Prueba de dos colas
H0: µ=0
H1: µ≠0
Para α=0.05: los valores críticos para una prueba de dos colas son -1,96 y 1,96
Prueba de una cola
H0: µ≥0
H1: µ < 0
Para α=0.05, el valor crítico es -1.645
Ejemplo
CineRex sabe que la película Vengadores se exhibió un promedio de 84 días en cada ciudad de
Argentina y que la desviación estándar correspondiente fue 10 días. El administrador de CineRex
Región patagónica se interesó en comparar la popularidad de la película en su región con la que
tuvo en otros cines de Argentina. Eligió 75 salas al azar en su región y encontró que exhibieron la
película un promedio de 81.5 días.
a) Establezca las hipótesis adecuadas para probar si hubo una diferencia significativa en la
duración de la exhibición entre los teatros de la Patagonia y el resto de Argentina.
b) Pruebe estas hipótesis para un nivel de significancia del 5%.
Ejemplo
Volkswagen asegura que la VW Amarok 2.0 rinde 7.6 litros cada 100 km. El Ministerio de
Ambiente y Desarrollo Sustentable usó una muestra de 49 autos de este modelo y encontró un
media de la muestra de 7.1 litros cada 100 km. De estudios anteriores se sabe que la desviación
estándar de la población es 2.1 litros cada 100 km.
¿Si se obtiene otra muestra de 49 autos y la media muestral es de 6.9, llegaríamos a la misma
conclusión?
a) Establezca las hipótesis adecuadas para probar si hubo una diferencia significativa entre lo
que dice VW y lo que encontró el MAyDS.
b) Pruebe estas hipótesis para un nivel de significancia del 5%.
c) ¿Si se obtiene otra muestra de 49 autos y la media muestral es de 6.9, llegaríamos a la misma
conclusión?
Ejemplo
El propietario promedio de una computadora pasa 23.9 horas a la semana usando su máquina,
con una desviación estándar de 12.6 horas a la semana. Un muestreo aleatorio de 81
suscriptores de una revista especializada en computación reveló una media muestral de 27.2
horas por semana.
Según esta muestra, ¿es razonable concluir con un nivel de confianza de 95% que los
suscriptores de la revista especializada son distintos de los propietarios promedio de
computadoras?
Test con σ desconocida
Una vez obtenida la muestra, se calcula el valor z del estadístico (para la media poblacional, se usa la
media muestral):
ҧ
𝑥−𝜇
𝑡𝑛−1,𝛼 = 𝑆
𝑛
Con n-1 grados de libertad
Una vez obtenido ese valor, se compara con los valores críticos correspondientes al nivel de
significatividad elegidos.
Regla de decisión:
Rechace H0 si z cae en la zona de rechazo
No rechace H0 si cae en la Región de no rechazo
Prueba de dos colas
H0: µ=0
H1: µ≠0
Para α=0.05, grados de libertad=11 los valores críticos para una prueba de dos colas son -2,2010
y 2,2010
Ejemplo
La especialista en recursos humanos de YPF está reclutando un gran número de empleados para
un proyecto en el extranjero. Durante el proceso de selección, la administración le pregunta
cómo van las cosas, y ella responde: “Bien. Creo que la puntuación promedio en la prueba de
aptitudes será aproximadamente 90.” Cuando la administración revisa 20 de los resultados de la
prueba, encuentra que la puntuación media es 84, y la desviación estándar de esta puntuación
es 11.
Si la administración desea probar su hipótesis al nivel de significancia de 0.10, ¿cuál es el
procedimiento a seguir?
Test/Prueba de Hipótesis
Revisitando los lineamiento generales de pasos a seguir:
1. Se formula una hipótesis acerca de un parámetro de población: hipótesis nula y alternativa
2. Se decide qué criterio utilizar para rechazar o aceptar esa hipótesis: decidir nivel de
significativad, tamaño de la muestra. Decidir estadístico y distribución muestral. Valores
críticos y reglas de decisión
3. Se recolectan datos de muestra
4. Se calculan las estadísticas muestrales
5. Se usa la información para decidir qué tan probable es que nuestro parámetro de población
hipotético sea correcto: Si la estimación cae en la zona de rechazo, rechazar la H0, si cae en
zona de no rechazo, no rechazar. Describir conclusión en términos del problema real.
Método del valor p
Valor p: probabilidad de obtener una estimación igual o más extrema que la obtenida, dado que
la hipótesis nula es cierta.
El valor p es el nivel de significancia máximo con el que se puede rechazar H0

Regla de decisión:
Si el valor p es mayor a α, no rechazar la hipótesis nula
Si el valor p es menor que α, rechazar la H0
Ejemplo
Se utiliza una máquina para cortar bloques de queso suizo con un peso específico. Con base en
una larga experiencia, se ha observado que el peso de los bloques sigue una distribución normal
con desviación estándar de 0.3 kg. La máquina está ajustada para cortar bloques de 12 kg.
En una muestra de nueve bloques se encontró que el peso promedio es 12.25 kg. ¿Debemos
concluir que la máquina cortadora necesita reajustarse?
Ejemplo
El Instituto del Café asegura que más del 40% de los adultos de Estados Unidos toma una taza de
café en el desayuno. Una muestra aleatoria de 450 individuos reveló que 200 de ellos toman
café de manera habitual en el desayuno. ¿Cuál es el valor p para una prueba de hipótesis que
busca mostrar que la afirmación del Instituto del Café es correcta? (Sugerencia: pruebe H0: p
0.4, contra H1: p > 0.4.)
Proporciones. Ejemplo
José Martínez desea comparar la confiabilidad de las podadoras Hachando que vende en su
ferretería con la de las vendidas por la marca en todo el país. José sabe que sólo el 15% de todas
las podadoras Hachando necesitan reparaciones durante el primer año. Una muestra de 120 de
los clientes de Steve reveló que exactamente 22 de ellos requirieron reparaciones en el primer
año.
1. Construya intervalo de confianza para π para 98% de confianza (z=+-2,23),
2. Con un nivel de significancia de 0.02 ¿existe evidencia de que la confiabilidad de las
podadoras Hachando que vende José difiera de las que se venden en el todo el país?
Ejemplo
Ejemplo
Un fabricante de salsa de tomate está en proceso de decidir si produce o no una versión picante.
El departamento de investigación de mercados de la compañía usó un sondeo telefónico
nacional de 6,000 casas y encontró que 335 de ellos comprarían la salsa con picante. Un estudio
más extenso hecho dos años antes mostró que el 5% de las casas compraría la marca. Con un
nivel de significancia del 2%, ¿debe la compañía concluir que hay un incremento en el interés
por el sabor con picante?
Ejemplo

También podría gustarte