Está en la página 1de 5

INFERENCIA ESTADÍSTICA CON R

Significación
Al comenzar cualquier análisis debemos especificar el nivel de significación α (o error de tipo I).
La prueba estadística nos arrojará un nivel crítico p (o p-valor) que es el valor asociado al
estadístico de contraste. Compararemos entonces el p-valor con el nivel de significación (α)
para decidir si los datos apoyan o no la hipótesis planteada.

Criterio de decisión
Diremos que un contraste es estadísticamente significativo cuando se rechaza Ho, y esto ha de
ocurrir siempre que el p-valor del contraste sea menor que el nivel de significación α (o error
tipo I). Asimismo, diremos que el estadístico no es significativo cuando no podamos rechazar
Ho, es decir, el p-valor es mayor o igual que α.

Prueba de hipótesis para la proporción


Nota: Es necesario instalar previamente la librería PASWR.

La función que resuelve contrastes de hipótesis para la proporción en R es prop.test. Sus


argumentos son los siguientes:

prop.test(x, n, p = NULL, alternative = c(“two.sided”, “less”, “greater”), correct=FALSE)

donde:

 x es un valor numérico que indica el número de elementos del grupo que presentan la
característica de interés
 n es un valor numérico que indica el número total de elementos del grupo
 p es un valor numérico que se corresponde con el valor π0 que se desea comprobar si
es válido para la proporción
 alternative indica el tipo de la hipótesis alternativa del contraste. Los posibles valores
son “two.sided” (hipótesis alternativa del tipo ≠ , es la opción que se considera por defecto),
“less” (hipótesis alternativa del tipo <) y “greater” (hipótesis alternativa del tipo >).
 conf.level es un valor numérico que indica el nivel de confianza, en tanto por uno, al
que se construirá el intervalo de confianza asociado al contraste. Si omitimos este parámetro
en la llamada a la función, el intervalo de confianza se calcula a un nivel de confianza del 95%.

Ejemplo 1:

Suponga que se encuentra con un fanático de los Cachorros Club al principio de la temporada
de fútbol. Los Cachorros han jugado 20 partidos y han ganado 11 de ellos, o el 55% de sus
partidos. Con base en esa evidencia, el aficionado tiene "mucha confianza" en que los
Cachorros ganarán más de la mitad de sus juegos este año. ¿Debería tener tanta confianza?
Ejemplo 2:

Una municipalidad está interesada en averiguar si el índice de absentismo laboral es menor en


dicha municipalidad que la media nacional la que se sitúa en 9%. Con este propósito,
seleccionó al azar una muestra de 200 trabajadores de dicha municipalidad y se encontró 10
ausencias. ¿Que podría concluir respecto al interés de dicha municipalidad?

Ejemplo 3:

Cuando se prueba un fármaco para el control de los dolores de la migraña, menos del 15% de
los pacientes desarrolla gastritis. Un nuevo compuesto desarrollado en base a la planta
Valeriana Officinalis, en una muestra de 354 pacientes evidencia que solo en 90 pacientes
evidencian síntomas de gastritis. Emplee un nivel de significancia para probar que este nuevo
fármaco también produce menos del 15% de pacientes que desarrollan gastritis.

Prueba de hipótesis para una media


Prueba Z, con varianza poblacional σ 2 conocida. (n > 30).

z.test(x, mu, sigma.x, alternative c("two.sided", "less", "greater"))

Prueba t de Student, con varianza poblacional σ 2 desconocida.

t.test(x, mu, alternative c("two.sided", "less", "greater"))

donde:
 x es el vector con los elementos de interés. característica de interés.
 mu es el valor de contraste.
 sigma.x es la desviación estándar poblacional conocida.

Ejemplo 4

Prueba para la media poblacional con varianza conocida, prueba Z. Un psicólogo escolar
administra la prueba del cociente de inteligencia (IQ) de Stanford-Binet en dos condados. Se
seleccionaron al azar cuarenta estudiantes talentosos en cada condado. Se afirma que el test
de inteligencia de Stanford-Binet sigue una distribución normal con una media de 100 y una
desviación estándar de 16. Asumiendo normalidad vamos a contrastar la afirmación realizada
acerca de la media en cada condado. Data SBIQ.

SOLUCIÓN (Para el condado 1)

i) Ho: µ=100

Ha: µ≠100

ii) z.test(SBIQ[,1],mu=100,sigma.x=16,alternative="two.sided")

One-sample z-Test

data: SBIQ[, 1]

z = 11.76, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 100


95 percent confidence interval:

124.7916 134.7084

sample estimates:

mean of x

129.75

iii) Como el p valor (0,000..) es menor que el nivel de significancia (0,05) hay suficiente
evidencia para rechazar la hipótesis nula.

iv) NO se verifica que la media del test SBIQ es 100 en el condado número 1. Respecto al
condado 2 también hay evidencia que indica que la media no es 100.

Ejemplo 5

Prueba para la media poblacional con varianza desconocida, t de Student. Datos Morley:
famoso experimento de Michelson-Morley permitió estimar la velocidad de la luz en el aire.
Tenemos 100 mediciones de la velocidad de la luz tomadas en 1879 por Michelson (“Speed”,
en km/s restando 299000). Queremos determinar si la media de los datos es significativamente
distinta del valor dado por Stigler en 1977 que fue de 710.5. Data morley.

SOLUCIÓN

i) Ho: µ=710,5 F

Ha: µ≠710,5 V

ii) t.test(morley[,3],mu=710.5,alternative="two.sided")

One Sample t-test

data: morley[, 3]

t = 17.96, df = 99, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 710.5

95 percent confidence interval:

836.7226 868.0774

sample estimates:

mean of x

852.4

iii) Como el p valor (0,000..) es menor que el nivel de significancia (0,05) hay suficiente
evidencia para rechazar la hipótesis nula.

iv) Se puede afirmar que la media de los datos es significativamente diferente de lo indicado
por Stigler.
Ejemplo 6

El artículo “Uncertainly Estimation in Railway Track Life-Cycle cost” (J, of Rail and Rapid
Transit, 2009) presenta los siguientes datos sobre el tiempo de reparación (minutos) de la
rotura de un carril alto en una vía curva del tren de cierta línea de ferrocarril.

159 120 480 149 270 547 340 430 228 202 240 218
Una gráfica de probabilidad normal de los datos muestra un patrón bastante lineal, por lo que
es factible que la distribución de la población del tiempo de reparación sea al menos
aproximadamente normal. ¿Habrá pruebas de peso para concluir que el tiempo medio
verdadero de reparación es superior a 200 minutos? Utilice un nivel de significancia de 0,05.

i) Ho:

Ha:

ii)

iii) Como el p-value

iv) Se puede afirmar

Ejemplo 7

La cantidad diaria recomendada de zinc en la dieta entre los varones de 50 años de edad es de
15 mg/día. El artículo “Nutrient Intakes and Dietary Patterns of Older Americans: A National
Study” (J. of Gerontology, 1992:M145-150) presenta el siguiente resumen de datos sobre el
consumo de zinc en una muestra de varones con edades entre 65 y 74 años: n=115; x =11.3 y
s=6,43=σ. ¿Indicarán estos datos que la ingesta de zinc diaria promedio en la población de
varones de todas las edades de 65 a 74 años cae por debajo de la cantidad recomendada?
Utilice un nivel de significancia de 0.01. Asuma comportamiento normal.

i) Ho:

Ha:

ii)

iii) Como el p-value

iv) Hay evidencia estadística

Ejemplo 8

Un ingeniero industrial hace un análisis de la producción de la panadería Mantaro Valley que


hace donas que se empacan en cajas con etiquetas que dicen contener 36 donas, Si la
variación entre las donas es muy grande, algunas cajas contendrán menos peso (estafando a
los consumidores) y otras más (disminuyendo las ganancias), El supervisor de control de
calidad encontró que es posible resolver el problema si las donas tienen una media de 4,50
onzas y una desviación estándar de 0,06 onzas o menor, Se seleccionan al azar 36 donas de la
línea de producción y se pesan, con los resultados que se dan aquí (en onzas),
4,43 4,37 4,58 4,50 4,68 4,61 4,43 4,37 4,58 4,50 4,68 4,61
4,61 4,30 4,37 4,58 4,50 4,32 4,61 4,30 4,37 4,58 4,50 4,32
4,42 4,52 4,66 4,50 4,36 4,42 4,42 4,52 4,66 4,50 4,36 4,42

Realice las pruebas de hipótesis respectivas para validar que:


a) La proporción poblacional de todas las cajas que están por debajo del requerimiento
respecto al peso es 30%
b) La media poblacional de lo pesos no cumple con el requerimiento

También podría gustarte