Documentos de Académico
Documentos de Profesional
Documentos de Cultura
J. David Ramos
2023-08-25
Los datos
■ La muestra \(X\) está constituida por resultados de \(n\) ensayos
independientes.
■ Cada resultado dentro del experimento se clasifica como un exito \
(X=1\) ó un fracaso \(X=0\) para una v.a. dicotómica al menos
nominal (Proceso de Bernoulli)
■ El número total de exitos observados en la muestra corresponde a \
(T=\sum_{i=1}^n{X_i}\).
Sistema de hipótesis
■ Sea \(\pi\), la proporción verdadera de éxitos presentes en una
población.
■ T sea, \(\pi_o\) alguna constante con \(0\le\pi_o\le1\), entonces se
pueden definir los siguientes sistemas de hipótesis:
A. (A dos colas)
\[H_o:\pi=\pi_o\quad versus \quad H_a:\pi\neq\pi_o\]
B. (A cola derecha)
\[H_o:\pi\le\pi_o\quad versus\quad H_a:\pi>\pi_o\]
\(H_o\)
El estadístico de prueba es el número total de éxitos observados en una
muestra aleatoria de tamaño \(n\), es decir:
\[T=\sum_{i=1}^n{X_i}\]
Si \(H_o\) es verdadera, es decir \(\pi=\pi_o\), entonces se cumple que:
\[T\sim bin(n,\pi_o)\]
Reglas de decisión
■ Sea \(\alpha\) el nivel de significancia escogido para el test.
■ Sean \(\alpha_1\) y \(\alpha_2\) valores que representan áreas a la
izquierda y derecha respectivamente de una distribución binomial con
parámetros \(n\) y \(\pi_o\), tal que \(\alpha=\alpha_1+\alpha_2\).
■ \(T_c\) el valor observado del estadístico de prueba.
■ \(t\), \(t_1\) y \(t_2\) cuantiles de la distribución de probabilidad de
una variable \(T\) binomial con parámetros \(n\) y \(\pi_o\)
Ejemplo 1
Cierta máquina construye partes de celulares. Se considera que la
máquina opera apropiadamente si el \(10\%\) o menos de las partes
manufacturadas son defectuosas. Si más del \(10\%\) de las partes que
produce son defectuosas, entonces la máquina necesita mantenimiento.
Como resulta costoso, sólo se toma una muestra aleatoria de \(12\) partes
en las que se observó que \(4\) de ellas estaban defectuosas ¿Será que
este número de partes defectuosas observadas en la muestra son
evidencia de que la máquina necesita mantenimiento o simplemente, se
debe al azar? Utilice un \(\alpha=0.05\)
Solución
A. Sistema de hipótesis
\[H_o:\text{La máquina opera bien}\] \[H_a:\text{La máquina necesita
mantenimiento}\]
Que es equivalente a:
\[H_o:\pi\le 0.1\] \[H_a:\pi>0.1\]
donde \(\pi\) es la proporción de partes defectuosas producidas por la
máquina.
B. Supuestos
La muestra obtenida corresponde a un proceso binomial
C. Datos
Se tienen \(n=12\) ensayos independientes. \(X=1\) (éxito) corresponde a
ser una parte defectuosa.
D. Estadístico de prueba
El estadístico calculado es \(T_c=4\) que corresponde al número de
partes defectuosas observadas en la muestra. Bajo \(H_o\) se asume que \
(T\sim bin(12,0.1)\)
E. Regla de decisión
■ Se debe rechazar \(H_o\) en el nivel \(\alpha\) si \(T_c>t\), donde \(t\)
corresponde al cuantil de una distribución binomial, tal que:
\[P(T\le t)=1-\alpha\]
es decir,
\[P(T\le t)=1-\alpha=1-0.05=0.95\]
■ El quantil (bajo \(\pi=0.1\) y \(n=12\)) que cumple aproximadamente
la igualdad es \(t=3\), es decir:
\[P(T\le 3)=0.974\approx0.95\]
EL TEST EN R
■ El valor crítico \(t\) determina la región de aceptación de \(H_o\), es
decir es aquel \(t\) tal que \(P(T\le t)=0.95\):
## [1] 3
## 0 1 2 3 4 5 6 7 8 9 10
## 0.2824 0.3766 0.2301 0.0852 0.0213 0.0038 0.0005 0.0000 0.0000 0.0000
0.0000
## 11 12
## 0.0000 0.0000
#Test binomial
binom.test(x = 4,n = 12,p = 1/10,alternative = "greater",conf.level = 0.95)
##
## Exact binomial test
##
## data: 4 and 12
## number of successes = 4, number of trials = 12, p-value = 0.02564
## alternative hypothesis: true probability of success is greater than 0.1
## 95 percent confidence interval:
## 0.1228507 1.0000000
## sample estimates:
## probability of success
## 0.3333333
Ejemplo 2
El director de una universidad afirma que sólo el \(20\%\) de sus
estudiantes están en desacuerdo con su gestión. En una encuesta aplicada
a \(15\) estudiantes seleccionados aleatoriamente \(4\) estudiantes
afirmaron no concordar con la gestión del rector ¿Se podría afirmar con
un nivel de significancia del \(10\%\) que la proporción de estudiantes en
desacuerdo con la gestión del rector es distinta a la que el rector afirma?
Solución
A. Sistema de hipótesis
\[H_o:\pi= 0.2\] \[H_a:\pi\neq0.2\]
donde \(\pi\) es la proporción de estudiantes en desacuerdo con la
gestión del rector.
B. Supuestos
La muestra obtenida corresponde a un proceso binomial
C. Datos
Se tienen \(n=15\) ensayos independientes. Se considera que el éxito (\
(X=1\)) corresponde a que el estudiante seleccionado esté en desacuerdo
con la gestión del rector.
D. Estadístico de prueba
\(T_c=4\), corresponde al número de estudiantes en desacuerdo en la
muestra seleccionada. Si \(H_o\) es verdadera se asume \(T\sim
bin(15,0.2)\)
E. Regla de decisión
Se rechaza \(H_o\) en el nivel \(\alpha=0.1\) si \(T_c<t_1\), donde \(t_1\)
corresponde al cuantil de una distribución binomial, tal que:
\[P(T\le t_1)\approx\alpha_1\]
\[P(T\le t_1)\approx0.05\]
O, se rechaza \(H_o\) en el nivel \(\alpha\) si \(T_c>t_2\), donde \(t_2\)
corresponde al cuantil de una distribución binomial, tal que:
\[P(T> t_2)\approx\alpha_2\]
Esto es equivalente a:
\[P(T\le t_2)\approx=1-\alpha_1\approx0.95\]
■ Estos cuantiles se hallan en la tabla de distribución acumulada
binomial:
\[P(T\le 1)=0.167>0.05\]
\[P(T\le 6)=0.982>0.95\]
F. Decisión:
No hay suficiente evidencia estadística para rechazar \(H_o\) en el
nivel \(\alpha=0.05\), debido a que \(1<T_c<6\), es decir, se puede
suponer que la verdadera proporción de estudiantes descontentos con la
gestión del rector es del \(20\%\).
EL TEST EN R
## 0 1 2 3 4 5 6 7 8 9 10 11 12
## 0.035 0.132 0.231 0.250 0.188 0.103 0.043 0.014 0.003 0.001 0.000 0.000
0.000
## 13 14 15
## 0.000 0.000 0.000
# Se calcula P(T=Tc)
prob.Tc2<-dbinom(4, 15,0.2); prob.Tc2
## [1] 0.1876042
##
## Exact binomial test
##
## data: 4 and 15
## number of successes = 4, number of trials = 15, p-value = 0.519
## alternative hypothesis: true probability of success is not equal to 0.2
## 90 percent confidence interval:
## 0.09665833 0.51075189
## sample estimates:
## probability of success
## 0.2666667
\[Z=\dfrac{T-n\pi_o}{\sqrt{n\pi_o(1-\pi_o)}}\sim_{aprox.} N(0,1)\]
donde,
■ \(T\) es el número de éxitos observados en una muestra de tamaño \
(n\).
■ \(\pi_o\) es la proporción de éxitos esperados bajo la hipótesis nula.
■ \(n\pi_o\) el número de éxitos esperado bajo la hipótesis nula.
■ \(SE[T]=\sqrt{n\pi_o(1-\pi_o)}\) el error estándar de \(T\)
■
# Importación de datos
library(readr)
neonatos <-
read_delim("C:/Users/USER/Dropbox/ElBosque2023-2/No_parametrica/Compartido_no_parametrica/Datos/
neonatos.csv",
";", escape_double = FALSE, trim_ws = TRUE)
head(neonatos)
## # A tibble: 6 × 5
## INDIV EDAD HTA EDADGES PESORN
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1127 19 0 40 2700
## 2 2177 37 0 38 3280
## 3 1475 30 0 39 3440
## 4 1011 20 0 40 3110
## 5 550 38 0 40 2550
## 6 2405 16 1 40 3450
dim(neonatos)
## [1] 2653 5
# Selección de la variable
peso<-neonatos$PESORN
2.
Exploración de datos
tabla2<-rbind(tabla1,esperado=c(fe.alto,fe.bajo),proporcion=c(1-pi,pi))
addmargins(round(tabla2,3),margin = 2)
3.
El test asintótico en R
# Test aproximado
prop.test(x =267,n = 2653,p = 0.08,alternative = "two.sided",conf.level = 0.95,correct=F )
##
## 1-sample proportions test without continuity correction
##
## data: 267 out of 2653, null probability 0.08
## X-squared = 15.357, df = 1, p-value = 8.898e-05
## alternative hypothesis: true p is not equal to 0.08
## 95 percent confidence interval:
## 0.08976383 0.11267258
## sample estimates:
## p
## 0.1006408
# Test exacto
binom.test(x =267,n = 2653,p = 0.08,alternative = "two.sided",conf.level = 0.95 )
##
## Exact binomial test
##
## data: 267 and 2653
## number of successes = 267, number of trials = 2653, p-value =
0.0001463
## alternative hypothesis: true probability of success is not equal to 0.08
## 95 percent confidence interval:
## 0.0894496 0.1127217
## sample estimates:
## probability of success
## 0.1006408
Ejercicios
1. (Hacer a mano) Suponga que en una muestra aleatoria de
tamaño \(n=14\) se observaron \(6\) éxitos. Utilizar el test
binomial para contrastar