Documentos de Académico
Documentos de Profesional
Documentos de Cultura
7.3 Apéndice 5 El Curso de Estadística
7.3 Apéndice 5 El Curso de Estadística
En este capítulo se tratarán funciones de las variables X1, X2, ... , Xn observadas en una
muestra aleatoria seleccionada de una población bajo estudio. Las variables son
independientes y tienen una distribución común. Con mucha frecuencia se utilizan
ciertas funciones de v.a. observadas en una muestra para estimar o tomar decisiones con
respecto de parámetros poblacionales desconocidos. Por ejemplo, supongamos que se
desea estimar la media de una población . Si obtenemos una muestra aleatoria de n
observaciones, x1, x2, ... , xn, resulta adecuado estimar a través de la media de la
muestra:
La bondad de la estimación del comportamiento de las v.a. X1, X2, ... , Xn y el efecto de
Una definición más formal sería: “Un estadístico (estadígrafo) es una función de las
variables que se pueden observar en una muestra y de las constantes conocidas. Los
estadísticos se utilizan para hacer inferencias (estimaciones o decisiones) con respecto a
parámetros poblacionales desconocidos”.
Como el estadístico es una función de variables aleatorias observadas en una muestra
aleatoria, un estadístico en sí, es una variable aleatoria.
La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la
distribución de un carácter en dicha población y las distribuciones de dicho carácter en
todas sus muestras.
Las ventajas de estudiar una población a partir de sus muestras son principalmente:
Coste reducido:
Si los datos que buscamos los podemos obtener a partir de una pequeña parte del
total de la población, los gastos de recogida y tratamiento de los datos serán
menores. Por ejemplo, cuando se realizan encuestas previas a una elección, es
más barato preguntar a 4.000 personas su intención de voto, que a 30.000.000;
Mayor rapidez:
Estamos acostumbrados a ver cómo con los resultados del escrutinio de las
primeras mesas electorales, se obtiene una aproximación bastante buena del
resultado final de unas elecciones, muchas horas antes de que el recuento final
de votos haya finalizado;
Más posibilidades:
Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de
bombillas, no es posible en la práctica destruirlas todas para conocer su vida
media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña
parte de ellas y sacar conclusiones sobre las demás.
De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos
problemas:
Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el
proceso de extracción es tal que garantiza a cada uno de los elementos de la población la
misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de
selección muestreo aleatorio.
Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de ), la
cualquiera es
sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas,
tantas veces como permutaciones en el orden de sus elementos sea posible, es decir
Muestreo aleatorio con reposición
Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero
de modo que cada vez el elemento extraído es repuesto al total de la población. De esta
forma un elemento puede ser extraído varias veces. Si el orden en la extracción de la
muestra interviene, la probabilidad de una cualquiera de ellas, formada por n elementos
es:
es
es decir,
Si se saca una muestra de una población que es normal, tiene una distribución
muestral que es Normal. ¿Pero que podemos decir de la distribución de si los Xi no
están distribuidos normalmente?.
El Teorema del Límite Central nos mostrará que tendrá una distribución
aproximadamente normal si el tamaño de la muestra es grande.
Sean X1,X2, ... ,Xn variables aleatorias independientes e idénticamente distribuidas con
E(Xi) = y V(Xi) = < ∞. Definimos
Un = ( - )
√( /n)
en donde
Ejemplo
Los tiempos de espera para los clientes que pasan por una caja registradora a la salida de
una tienda de menudeo son variables aleatorias independientes con una media de 1.5
minutos y una varianza de 1.0. Aproxime la probabilidad de que se pueda atender a 100
clientes en menos de 2 horas.
Solución
Ejemplo
Un auditor toma una muestra aleatoria de tamaño n =36 de una población de 1000
cuentas por cobrar. El valor medio de las cuentas por cobrar para la población es =
$260.00, con la desviación estándar de la población = $45.00. ¿Cuál es la probabilidad
deque la media muestral sea inferior a $250.00?
Solución
Por lo tanto,
Convergencia en Probabilidad
Recordemos que si X es una v.a. continua y X1,X2, ... , Xn son v.a. independientes e
idénticamente distribuidas, que tienen la misma probabilidad que X.
=> Y= Xi tiene
y =E[y]=E[ Xi ] = n
z= Xi / n =
E[z]=
es una v.a.
V(Y) = n σ2
V(Z) = σ2 / n
Para ε > 0
Límn→∞ P( | - |>ε )=0
Por ejemplo, un investigador puede calcular el promedio de varias mediciones del peso
de un animal para obtener una estimación más exacta de dicho peso. Su consideración,
es que el promedio de muchos pesos obtenidos independientemente debe estar bastante
próximo del peso real, con una alta probabilidad.
Ejemplo
A una población de cuatro mecanógrafas se les pidió que escribieran la misma página de
un manuscrito. Los errores cometidos por cada mecanógrafa fueron:
x =( Xi ) / N
y la desviación estándar
Por lo tanto
x = ( 3 + 2 + 1 + 4 ) / 4 = 2.5 errores
σx = 1.12 errores ( aplicando la fórmula anterior)
Por otra parte, si el muestreo se hubiera realizado sin reposición debería haber seis
muestras posibles de dos mecanógrafas:
N! / [ n! ( N – n )! ] = 4! / [ 2! * 2! ] = 6
1 A, A 3,3 3
2 A, B 3,2 2.5
3 A, C 3,1 2
4 A, D 3,4 3.5
5 B, A 2,3 2.5
6 B, B 2,2 2
7 B, C 2,1 1.5
8 B, D 2,4 3
9 C, A 1,3 2
10 C, B 1,2 1.5
11 C, C 1,1 1
12 C, D 1,4 2.5
13 D, A 4,3 3.5
14 D, B 4,2 3
15 D, C 4,1 2.5
16 D, D 4,4 4
=2.5= x
2. Total 6 muestras posibles de n =2, N =4, muestreo sin reposición
1 C, D 1,4 2.5
2 A, B 3,2 2.5
3 A, C 3,1 2
4 A, D 3,4 3.5
5 B, C 2,1 1.5
6 B, D 2,4 3
=2.5= x
Figura: Función de densidad de una v.a. con respecto a una v.a. X que tiene
función de densidad de probabilidad Normal Estándar.
Ejemplo
Una máquina embotelladora puede regularse de tal manera que llene un promedio de
onzas por botella. Se ha observado que la cantidad de contenido que suministra la
máquina presenta una distribución normal con σ = 1.0 onza. De la producción de la
máquina cierto día, se obtiene una muestra aleatoria de n = 9 botellas llenas (todas
fueron llenadas con las mismas posiciones de control operativo) y se miden las onzas
del contenido de cada una. Determinar la probabilidad de la media real para tales
posiciones del control.
Solución
Si X1, X2, ... , X9 representan las onzas de contenido a observarse, se deduce que X i
presenta una distribución normal con una media y una varianza =1 para i = 1,
2, ... , 9. por tanto, tiene una distribución normal con media y X = /n = 1/9.
Se desea calcular
P( | - | ≤ 0.3 ) = P( -0.3 ≤ ( - ) ≤ 0.3 )
Por tanto la probabilidad es solo de 0.63 de que la media muestral diste a lo más en 0.3
de onza de la población real.
Distribución Ji – Cuadrado ( )
Bajo las condiciones anteriormente expuestas, para cuestiones más prácticas se suele
trabajar con la siguiente fórmula:
= ( n – 1 ) S2 /
Ejemplo
Continuando con el ejemplo anterior, se supone que las onzas del contenido que vacía la
máquina embotelladora tiene una distribución normal con =1. Supóngase que se
desea obtener una muestra aleatoria de 10 botellas y medir el contenido en cada botella.
Si se utilizan estas 10 observaciones para calcular S2, podría ser útil especificar un
intervalo de valores que incluyeran a S2 con una alta probabilidad. Encuentre los
números b1 y b2 tales que
P( b1 ≤ S2 ≤ b2) = 0.90
Solución
P( a1 ≤ (n – 1) S2 ≤ a2) = 0.90
Un método para hacerlo es encontrar el valor a2 que limita un área de 0.05 de la cola
derecha y un valor a1 que limita un área de 0.05 de la cola izquierda (0.95 de área a la
derecha). Ya que hay 9 grados de libertad, la tabla nos da a2 = 16.919 y a1 = 3.325.
a1 = (n – 1)b1 / = (n – 1)b1 = 9 b1
a2 = (n – 1)b2 / = (n – 1)b2 = 9 b2
o sea
de donde se deduce que si se desea tener un intervalo que incluya a S2 con una
probabilidad de 0.90, uno de tales intervalos es ( 0.369, 1.880). Obsérvese que este
intervalo es bastante grande.
Distribución t de Student
La función de densidad de es
Figura: Función de densidad de una de Student
Para calcular
La distribución F de Snedecor
Obsérvese que .
La forma más habitual en que nos encontraremos esta distribución será en el caso en
que tengamos n+m v.a. independientes
y así
y para ello, como en todas las distribuciones asociadas a la normal, disponemos de una
tabla (la número 6) donde encontrar aproximaciones a esas cantidades
Existen varios métodos para la generación de números seudo aleatorios, el más utilizado
es el Método de Montecarlo, también llamado Método de la Transformada Inversa, el
cual lo analizaremos a continuación.
Método de Montecarlo
.
2. Si X es continua tomar como observación de X, la cantidad x=F-1(u). En el
caso en que X sea discreta se toma x como el percentil de X, es decir el
Este proceso se debe repetir n veces para obtener una muestra de tamaño n.
Ejemplo
ti xi = F-1(ui)
76.293 0.76 0.71
31.776 0.32(=1-0.68) -0.47
50.803 0.51 0.03
71.153 0.71 0.55
20.271 0.20(=1-0.80) -0.84
33.717 0.34(=1-0.66) -0.41
17.979 0.18(=1-0.82) -0.92
52.125 0.52 0.05
41.330 0.41(=1-0.59) -0.23
95.141 0.95 1.65
Obsérvese que como era de esperar, las observaciones xi tienden a agruparse alrededor
Obsérvese que el estimador no es un valor concreto sino una variable aleatoria, ya que
aunque depende unívocamente de los valores de la muestra observados (Xi=xi), la
elección de la muestra es un proceso aleatorio. Una vez que la muestra ha sido elegida,
se denomina estimación el valor numérico que toma el estimador sobre esa muestra.
Ejemplo
Consideremos una v.a. de la que sólo conocemos que su ley de distribución es normal,
Para muestras aleatorias de tamaño n=3,
Intuitivamente, las características que serían deseables para esta nueva variable aleatoria
(que usaremos para estimar el parámetro desconocido) deben ser:
Consistencia
Cuando el tamaño de la muestra crece arbitrariamente, el valor estimado se aproxima al
parámetro desconocido.
Ö su forma equivalente
Eficiencia
Al estimador, al ser v.a., no puede exigírsele que para una muestra cualquiera se obtenga
como estimación el valor exacto del parámetro. Sin embargo podemos pedirle que su
dispersión con respecto al valor central (varianza) sea tan pequeña como sea posible.
I( ) = (1 / n) E [ - ( ∂2 ln f(x)) / ( ∂ 2
)]
Suficiencia
El estimador debería aprovechar toda la información existente en la muestra.
A continuación vamos a enunciar de modo más preciso y estudiar cada una de esas
características.
En este punto podemos plantearnos el que dado una muestra sobre la que se ha
observado los valores xi, una posible estimación del parámetro es aquella que maximiza
la función de verosimilitud.
Como es lo mismo maximizar una función que su logaritmo (al ser este una función
estrictamente creciente), este máximo puede calcularse derivando con respecto a la
función de verosimilitud ( bien su logaritmo) y tomando como estimador máximo
verosímil al que haga la derivada nula:
1. Son consistentes;
Ejemplo
Sea x1,x2, ... ,xn una muestra aleatoria de observaciones de una distribución uniforme
con función de densidad de probabilidad f(x) = 1/ , 0 ≤ x ≤ , i = 1, 2, ... , n.
Determine el estimador de máxima verosimilitud de .
Vamos a estudiar las propiedades de ciertos estimadores que por su importancia en las
aplicaciones resultan fundamentales: estimadores de la esperanza matemática y varianza
de una distribución de probabilidad.
verifica:
Por tanto es un estimador insesgado. Si además sabemos que X se distribuye como una
v.a. Normal, es sencillo comprobar que coincide con el estimador de máxima
verosimilitud (figura superior):
Proposición :
Estimador de la varianza
Proposición:
Más aún,
Demostración
Comenzamos escribiendo
Por otro lado
Luego
Cuasivarianza muestral
Esa esperanza puede ser calculada de un modo más directo, ya que la distribución del
estimador es conocida:
luego
pruebas, .
Esta expresión presenta dificultades para el cálculo, siendo más cómodo sustituirla por
la siguiente aproximación:
del mismo. Es decir, se considera el intervalo cuyos extremos son los cuantiles y
Solución:
Dada una persona cualquiera (i) de la población, el resultado de su voto es una variable
Bernulli:
Sabemos que
En la práctica el error que se comete no es muy grande si tomamos algo más simple
como
Este caso que planteamos es más a nivel teórico que práctico: difícilmente vamos a
poder conocer con exactitud mientras que es desconocido. Sin embargo nos
aproxima del modo más simple a la estimación confidencial de medias.
Para estimar , el estadístico que mejor nos va a ayudar es , del que conocemos su
ley de distribución:
Esa ley de distribución depende de (desconocida). Lo más conveniente es hacer que la
ley de distribución no dependa de ningún parámetro desconocido, para ello
estandarizamos:
Es útil considerar en este punto la simetría de la distribución normal, y observar que los
percentiles anteriores son los mismos aunque con el signo cambiado:
El problema que tenemos en este caso es más complicado que el anterior, pues no es tan
sencillo eliminar los dos parámetros a la vez. Para ello nos vamos a ayudar de lo
siguiente:
Ejemplo
Solución:
En primer lugar, en estadística inferencial, los estadísticos para medir la dispersión más
convenientes son los insesgados. Por ello vamos a dejar de lado la desviación típica
muestral, para utilizar la cuasidesviación típica:
es decir,
o dicho de forma más precisa: Con un nivel de confianza del podemos decir que la
media poblacional está en el intervalo siguiente:
Figura: Cálculo del intervalo de confianza para la media usando para ello la distribución
t de Student y la función de verosimilitud asociada, está tiene su máximo en , ya que
esta estimación puntual de es la máximo verosímil.
propiedad de la distribución :
Consideremos dos cuantiles de esta distribución que nos dejen una probabilidad
en la “zona central” de la distribución:
Solución:
con una confianza del 95%, que por supuesto contiene a las estimaciones puntuales
y calculados sobre la muestra.
± t SX(siguiente)
Unidad 7
PRUEBA DE HIPÓTESIS
Pueden presentarse en la práctica, situaciones en las que exista una teoría preconcebida
relativa a la característica de la población sometida a estudio. Tal sería el caso, por
ejemplo si pensamos que un tratamiento nuevo puede tener un porcentaje de mejoría
mayor que otro estándar, o cuando nos planteamos si los niños de las distintas
comunidades españolas tienen la misma altura.
Este tipo de circunstancias son las que nos llevan al estudio de la parcela de la
Estadística Inferencial que se recoge bajo el título genérico de Contraste de Hipótesis.
Implica, en cualquier investigación, la existencia de dos teorías o hipótesis implícitas,
que denominaremos hipótesis nula e hipótesis alternativa, que de alguna manera
reflejarán esa idea a priori que tenemos y que pretendemos contrastar con la ``realidad''.
Desarrollamos en este capítulo los contrastes de hipótesis para los parámetros más
usuales que venimos estudiando en los capítulos anteriores: medias, varianzas y
proporciones, para una o dos poblaciones. Los contrastes desarrollados en este capítulo
se apoyan en que los datos de partida siguen una distribución normal.
Ejemplo
Supongamos que debemos realizar un estudio sobre la altura media de los habitantes de
cierto pueblo de Ecuador. Antes de tomar una muestra, lo lógico es hacer la siguiente
suposición a priori, (hipótesis que se desea contrastar y que denotamos H0 ):
Al obtener una muestra de tamaño n =8, podríamos encontrarnos ante uno de los
siguientes casos:
Intuitivamente, en el caso a sería lógico suponer que excepto que la muestra obtenida
sobre los habitantes del pueblo sea muy poco representativa, la hipótesis H0 debe ser
rechazada. En el caso b tal vez no podamos afirmar con rotundidad que la hipótesis H0
sea cierta, sin embargo no podríamos descartarla y la admitimos por una cuestión de
simplicidad.
Error de tipo I:
Hipótesis nula, H0
Hipótesis alterna H1
Estadístico de la prueba
Región de rechazo
En este tema hemos estudiado dos de los cuatro elementos, para el siguiente tema se
estudiarán los dos restantes.
Las parte funcionales de una prueba estadística son el estadístico de prueba y la región
de rechazo asociada. El estadístico de la prueba (como estimador) es una función de las
mediciones muestrales en el cual se fundamenta la decisión estadística.
La región de rechazo (RR) especifica los valores del estadístico de la prueba para los
cuales se rechaza la hipótesis nula. Si en una muestra particular el valor calculado del
estadístico de la prueba se lo localiza en la región de rechazo, se rechaza la hipótesis
nula H0 y se acepta la hipótesis alterna H 1. Si el valor del estadístico de la prueba no cae
en la región de rechazo RR, aceptamos H0.
Ejemplo
En una encuesta política del candidato A se seleccionan n=15 votantes. Se desea probar
H0: p = 0.5 frente a la hipótesis alternativa H 1: p < 0.5. el estadístico de prueba es T, el
número de votantes en la muestra a favor del candidato A. Calcular si establecemos
RR = {t 2} como la región de rechazo.
Solución
Por tanto vemos que si se decide utilizar la región de rechazo RR= {t 2}, se asumen
un riesgo muy pequeño de concluir que el candidato A perderá las elecciones si, en
realidad, es ganador.
Observaciones:
1. Nótese que la hipótesis nula H0 contiene el valor investigado ó por probar del
parámetro en cuestión.
2. La hipótesis alterna trata de probar que el porcentaje no es como el candidato
piensa sino que es inferior. Esta hipótesis pudo haber sido diferente si quisieran
probar que porcentaje es mayor, esta se transformaría en p>0.5. Si solamente se
hubiera querido demostrar que no es cierto este porcentaje la hipótesis alterna
quedaría p 0.5.
3. El valor del estadístico siempre es calculado por medio de los valores obtenidos
de la muestra.
4. La región de rechazo RR se la establece de acuerdo a ciertas condiciones
preestablecidas cono son el nivel de significancia, y del valor obtenido de las
tablas de probabilidades.
7.3 Potencia de una prueba y curvas OC
Potencia de la prueba
Recuerde que la bondad de una prueba se mide por y , las probabilidades de los
errores de tipo I y II, en donde se fija de antemano para determinar la región de
rechazo. Un concepto relacionado pero más útil para evaluar el funcionamiento de una
prueba se denomina poder ( ó potencia) de la prueba. Básicamente el poder de una
prueba es la probabilidad de que la prueba rechace la hipótesis nula.
Para cualquier valor de para H1, el poder de una prueba se mide su capacidad para
detectar que la hipótesis nula es falsa. Es decir, para = 1
k(1) = P(rechazar H0 cuando = 1)
Dado que
k(1) = 1 -
Curvas OC
Nótese que es aplicable a cualquier prueba de este tipo, porque los valores del eje
horizontal han sido enunciados en unidades del error estándar de la media. Para
cualesquiera valores a la izquierda de 0, la probabilidad de aceptación indica la
probabilidad del error tipo II. A la derecha de 0, las probabilidades indican la
aceptación correcta de la hipótesis nula. Tal como lo indican las líneas punteadas,
cuando = 0, la probabilidad de aceptar la hipótesis nula es 1 - o, en este caso, 1 –
0.05 = 0.95.
En los siguientes temas desarrollaremos algunos ejemplos de cómo aplicar las curvas
OC y la potencia de la prueba.
Junto con ellos, también lo hacen los estimadores para la comparación de dos medias
(μ1 – μ2) y la comparación de parámetros binomiales (p1 – p2).
Dentro del desarrollo de este tema se puede encontrar un resumen detallado de las
pruebas de hipótesis para la media, la varianza y las proporciones.
esté cercano a cero con una gran probabilidad. Esto se expresa fijando un nivel de
significación , y tomando como región crítica , a los valores que son muy
extremados y con probabilidad en total, o sea,
y como región crítica consideraremos aquella formada por los valores extremadamente
bajos de Zexp, con probabilidad , es decir
nula es
por simetría con respecto al caso anterior, la región donde no se rechaza la hipótesis
nula es (véase la figura de abajo y contrástese con la anterior):
Observación
Para dar una forma homogénea a todos los contrastes de hipótesis es costumbre
denominar al valor del estadístico del contraste calculado sobre la muestra como valor
experimental y a los extremos de la región crítica, como valores teóricos. Definiendo
entonces
tn-1 t t T
Si realizamos el contraste
Figura: Región crítica para uno de los contrastes unilaterales de una media.
Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo
normal. Deseamos contrastar con un nivel de significación de = 0.05 si la altura media
es diferente de 174 cm. Para ello nos basamos en un estudio en el que con una muestra
de n=25 personas se obtuvo:
Solución:
La técnica a utilizar consiste en suponer que H0 es cierta y ver si el valor que toma el
estadístico
hay una evidencia suficiente para rechazar esta hipótesis al nivel de confianza del .
Es decir, no se rechaza H0.
Figura: El valor de Texp no está en la región crítica
(aunque ha quedado muy cerca), por tanto al no ser la
evidencia en contra de H0 suficientemente
significativa, ésta hipótesis no se rechaza.
Ejemplo
Consideramos el mismo ejemplo de antes. Visto que no hemos podido rechazar el que la
altura media de la población sea igual a 174 cm, deseamos realizar el contraste sobre si
la altura media es menor de 174 cm.
Solución:
Ahora el contraste es
De nuevo la técnica a utilizar consiste en suponer que H0' es cierta y ver si el valor que
toma el estadístico
es aceptable bajo esta hipótesis, con un nivel de confianza del . Se aceptará la
hipótesis alternativa (y en consecuencia se rechazará la hipótesis nula) si
existía una evidencia significativa para decir que cm, el ``simple hecho" de
plantearnos un contraste que parece el mismo pero en versión unilateral nos conduce a
rechazar de modo significativo que y aceptamos que cm. Es por ello
que podemos decir que no sólo H0' es rechazada, sino también H0. Es en este sentido en
el que los tests con H0 y H0' los consideramos equivalentes:
Contrastes de una proporción
frente a otras hipótesis alternativas. Para ello nos basamos en un estadístico (de
contraste) que ya fue considerado anteriormente en la construcción de intervalos de
confianza para proporciones y que sigue una distribución aproximadamente normal para
tamaños muestrales suficientemente grandes:
Para el contraste
extraemos una muestra y observamos el valor . Entonces se define
Luego
Supongamos que tenemos dos muestras independientes tomadas sobre dos poblaciones,
en la que estudiamos una variable de tipo dicotómico (Bernoulli):
Entonces se define
Contrastes unilaterales
En el contraste
se rechaza H0 si .
Consideremos que el carácter que estudiamos sobre la población sea una v.a. normal
cuya media y varianza son desconocidas. Vamos a contrastar la hipótesis
frente a otras hipótesis alternativas que podrán dar lugar a contrastes bilaterales o
unilaterales. La técnica consiste en observar que el siguiente estadístico experimental
que utiliza el estimador insesgado de la varianza, posee una distribución , con n-1
grados de libertad:
Entonces construimos las regiones críticas que correspondan a las hipótesis alternativas
Contraste bilateral
definimos
.
Para el contraste contrario tenemos la formulación análoga:
Por tanto el estadístico del contraste que nos conviene tiene una distribución conocida
cuando H0 es cierta --véase la definición de la distribución de Snedecor:
Contraste bilateral
Habida cuenta que la distribución de Snedecor no es simétrica sino que sólo toma
valores positivos, se rechazará la hipótesis nula cuando el el valor que tome el
estadístico del contraste al aplicarlo sobre una muestra sea muy cercano a cero, o bien,
muy grande. Es decir, se define el estadístico experimental y los límites de la región
crítica como:
Contrastes unilaterales
y entonces
Ejemplo
Solución:
En primer lugar, por tratarse de un problema de inferencia estadística, nos serán más
útiles las cuasivarianzas que las varianzas. Por ello calculamos:
Por lo tanto no rechazamos la hipótesis de homocedasticidad (que las dos son iguales)
de ambas poblaciones, y pasamos a contrastar la igualdad de las medias
utilizando el estadístico más sencillo (el que no necesita aproximar los grados de
libertad mediante la fórmula de Welch). Para ello calculamos en primer lugar la
cuasivarianza muestral ponderada:
y posteriormente
Las muestras apareadas aparecen como distintas observaciones realizadas sobre los
mismos individuos. Un ejemplo de observaciones apareadas consiste en considerar a un
conjunto de n personas a las que se le aplica un tratamiento médico y se mide por
ejemplo el nivel de insulina en la sangre antes (X) y después del mismo (Y)
Paciente xi yi di
1 150 120 30
2 180 130 50
... ... ... ...
n 140 90 50
di = xi-yi
Supongamos que la v.a. que define la diferencia entre el antes y después del tratamiento
es una v.a. d que se distribuye normalmente, pero cuyas media y varianza son
desconocidas
en el caso en que H0 fuese cierta tendríamos que el estadístico de contraste que nos
conviene es
Contraste bilateral
Entonces se define
Contrastes unilaterales
Si el contraste es
entonces se rechaza H0 si . Para el test contrario
se rechaza H0 si .
Observación
Hipótesis:
H0: Las distribuciones poblacionales para las X y las Y son idénticas
H1: Las dos distribuciones difieren en ubicación (dos colas) o bien, H 1: la
distribución de frecuencias relativas de la población para las X está desfasada
hacia la derecha de la distribución de las Y (una cola)
Estadístico de la prueba:
1) Para una prueba de dos colas, utilice T = mín(T’ , T--) en donde T’ = suma de los
trangos de las diferencias positivas y T -- = suma de los rangos de las diferencias
negativas.
2) Para la prueba de una cola (para detectar la alternativa de una cola dada
anteriormente) utilice la suma de los rangos T-- de las diferencias negativas.
Región de rechazo:
1) Para la prueba de dos colas, rechace H0 si T T0’ en donde T0 es el valor crítico
dado en la tabla de valores críticos de T en la prueba de Wilcoxon.
2) Para la prueba de una cola, rechace H0 si T - T0’
Observación:
Ejemplo
Pruebe la hipótesis nula de que no hay diferencias entre las distribuciones poblacionales
de la densidad de los pasteles para un experimento de diferencias aparejadas. Se utilizan
6 pares de pasteles, uno preparado con la mezcla A y el otro con la mezcla B. ¿Qué se
puede decir del nivel de significancia alcanzado?
Solución
Como en el caso de otras pruebas no para métricas, la hipótesis nula que debe probarse
es que las distribuciones de frecuencias de las dos poblaciones de densidades de los
pasteles son idénticas. La hipótesis alternativa, que implica una prueba de dos colas, es
que las distribuciones difieren en ubicación.
Dado que hay solamente una diferencia positiva que tiene el rango 3, T + = 3y T-- = 18, y
por lo tanto no hay evidencia suficiente para indicar una diferencia ente las
distribuciones de frecuencias de las dos poblaciones de las densidades de las
poblaciones de los pasteles. Ya que no es posible rechazar H0 para = 0.10, solamente
podemos afirmar que el valor p > 0.10.
7.6 Tablas de Contingencia
Supóngase que queremos clasificar los defectos encontrados en los muebles producidos
en cierta planta manufacturera, según (1) el tipo de defecto y (2) el turno de producción.
Se registró un número total de n = 309 muebles defectuosos y se clasificaron los
defectos como uno de cuatro tipos, A, B, C, o D. Al mismo tiempo se identificó cada
mueble según el turno de producción en el que se les fabricó. Se presentan estos datos
en la siguiente tabla conocida como Tabla de Contingencia:
Los números ente paréntesis son las estimaciones de las frecuencias esperadas de las
celdas. El objetivo es probar la hipótesis nula de que el tipo de defecto es independiente
del turno de producción, frente a la alternativa de que las dos categorías son
dependientes. Es decir, queremos probar H0: la clasificación por columnas es
independiente de la clasificación por renglones.
Sea pA igual a la probabilidad incondicional de que un efecto sea del tipo A. Asimismo,
se definen pB, pC, y pD como las probabilidades de observar los otros tres tipos de
defectos. Entonces estas probabilidades, que llamaremos probabilidades de columna de
la tabla anterior, satisfacen la condición: pA + pB + pC + pD = 1
La hipótesis nula especifica solamente que la probabilidad cada celda será igual al
producto de sus respectivas probabilidades de renglón y de columna, lo que implica la
independencia de las dos clasificaciones.
Tenemos que estimarlas probabilidades de columna y de renglón para poder estimar las
frecuencias esperadas de las celdas.
Como hemos observado, se pueden utilizar las estimaciones de las frecuencias
esperadas de las celdas en lugar de los E(n i) en la expresión de X 2, y X2 todavía tendrá
una distribución que se puede aproximar por una distribución de probabilidad 2 en un
muestreo repetitivo.
ij = ri / n
( nij ) = rij / n
Por lo tanto si utilizamos = 0.05, rechazaremos la hipótesis nula de que las dos
clasificaciones son independientes si X2 > 12. 592. Dado que el valor del estadístico de
la prueba, X2 = 19.17, es mayor que el valor crítico de 2, rechazamos la hipótesis nula
a nivel de significancia de = 0.05.El valor p asociado se da por valor p = P(2 >
19.17).
Factor A
Factor B Nivel 1 2 ... c
1 X11 X12 ... X1c X1.
2 X21 X22 ... X2c X2.
... ... ... ... ... ...
r Xr1 Xr2 ... Xrc Xr.
X.1 X.2 X.c n
El estadístico y su distribución
Sea X una v.a. cuyo rango son los valores , de modo que pi es la
probabilidad de cada valor;
un experimento aleatorio es una clase c1, c2, ..., ck(ci, ), que puede
representar valores cualitativos, discretos o bien intervalos para variables continuas. Sea
pi la probabilidad de que el resultado del experimento sea la clase ci. Vamos a considerar
contrastes cuyo objetivo es comprobar si ciertos valores pi0, propuestos para las
cantidades pi son correctas o no, en función de los resultados experimentales
, , ...,
ci
c1
c2
... ...
ck
hipótesis inicial es probablemente falsa. Para decidir cuando los valores de son
grandes es necesario conocer su ley de probabilidad. Se tiene entonces el siguiente
resultado
Como sólo son los valores grandes de los que nos llevan a rechazar H0, la región
es decir,
Observación
A pesar de que el contraste parece ser bilateral la forma de , nos indica que el
contraste es unilateral: Sólo podemos saber si existe desajuste entre los esperado y lo
observado, pero no podemos contrastar hipótesis alternativas del tipo ``pi mayor que
cierto valor''.
Observación
sólo puede tomar un número finito de valores distintos (aunque sean cantidades con
decimales). Por tanto su distribución no es continua. Luego al realizar la aproximación
mencionada hay que precisar en qué condiciones el error cometido es pequeño. De
modo aproximado podemos enunciar el siguiente criterio que recuerda al de la
aproximación binomial por la distribución normal:
1. n>30;
2. para todo .
Sin embargo esta regla resulta demasiado estricta a la hora de aplicarla en la práctica. Se
utiliza entonces una regla más flexible y que no sacrifica demasiada precisión con
respecto a la anterior:
Si a pesar de todo, estas condiciones no son verificadas, es necesario agrupar las clases
que tengan menos elementos con sus adyacentes.
Observación
El lector puede considerar los contrastes con el estadístico como una generalización
del contraste de proporciones. Para ello le invitamos a estudiar el siguiente ejemplo.
Ejemplo
Se desea saber si cierta enfermedad afecta del mismo modo a los hombres que a las
mujeres. Para ello se considera una muestra de n=618 individuos que padecen la
enfermedad, y se observa que 341 son hombres y el resto son mujeres. ¿Qué
conclusiones se obtiene de ello?
Solución:
El contraste a realizar se puede plantear de dos formas que después veremos que son
equivalentes:
frecuencias frecuencias
observadas esperadas diferencia
En conclusión, con los dos métodos llegamos a que hay una fuerte evidencia en contra
de que hay el mismo porcentaje de hombres y mujeres que padecen la enfermedad. La
ventaja de la última forma de plantear el contraste (diferencia entre frecuencias
observadas y esperadas) es que la técnica se puede aplicar a casos más generales que
variables dicotómicas, como se verá más adelante.
Observación
Hay una fórmula alternativa para el cálculo de cuya expresión es más fácil de utilizar
cuando realizamos cálculos:
Demostración
Distribuciones con parámetros desconocidos
Queremos contrastar
Las cantidades pi son desconocidas, aunque tienen una forma en la que sólo dependen
del único parámetro que debe ser estimado a partir de la muestra (r=1): Realizando esta
estimación
Intervalo
- e1
e1 - e2
e2 - e3
donde todos los pi están fijados (hipótesis H0). Entonces por lo mencionado
anteriormente, el contraste consiste en:
En este contraste se comete cierto error de aproximación y por tanto será tanto mejor
cuanto mayor sea n.
Ejemplo
Dadas dos parejas de genes Aa y Bb, la descendencia del cruce efectuado según las
leyes de Mendel, debe estar compuesto del siguiente modo:
Leyes de Mendel
Frecuencias
Fenotipo relativas
AB 9/16
Ab 3/16
aB 3/16
ab 1/16
Frecuencias
Fenotipo observadas
AB 165
Ab 47
aB 67
ab 21
Total 300
¿Se puede aceptar que se cumplen las leyes de Mendel sobre los individuos de dicha
población?
Solución:
Para ello vamos a representar en una sola tabla las frecuencias observadas, junto con las
que serían de esperar en el caso de que H0 fuese cierta:
Fenotipo
AB 165 161,33
Ab 47 42,27
aB 67 85,91
ab 21 23,52
ya que 4 son los posibles fenotipos, no se ha estimado ningún parámetro (la distribución
según las leyes de Mendel es conocida), y sobre las cantidades Ei existe solamente una
Al mismo resultado llegamos sin calcular con precisión la significatividad del contraste,
sino considerando que el valor teórico máximo que admitimos para el estadístico
Obsérvese también que el que se haya rechazado la hipótesis nula significa que hay
diferencia estadísticamente significativa entre las frecuencias observadas y las
esperadas, aunque a primera vista no lo hubiésemos percibido en el gráfico de la Figura
siguiente:
Figura: Aunque aparentan ser aproximadamente iguales las frecuencias
observadas y esperadas, existe diferencia estadísticamente significativa
entre ellas.
Unidad 8
E(Y) = 0 + 1 x
(Nótese que la variable independiente x podría ser w2 o bien (w)1/2 o aún ln w, y así
sucesivamente, para alguna otra variable independiente w).
Es decir se postula que Y = 0 + 1x + en donde es una v.a. Si 0 y 1 son
estimadores de los parámetros 0 y 1, entonces Ŷ = 0 + 1x es obviamente un
estimador de E(Y).
ŷ= 0 + 1x
es el valor que se predice del i-ésimo valor de y (cuando x = xi), entonces la desviación
del valor observado de y a partir de la recta ŷ (llamada a veces el error) es
yi – ŷi
La cantidad SCE se llama suma de los cuadrados de los errores por motivos que serán
obvios en seguida.
Si se tiene un mínimo este ocurrirá para los valores de 0 y 1 que satisfagan las
ecuaciones,
SCE / 0 =0 Ecuaciones de
SCE / 1 = 0 Mínimos Cuadrados
SCE / 1 = - 2 ( xi yi - 0 xi - 1 xi2) = 0
nótese que las ecuaciones de mínimos cuadrados son lineales en 0 y 1, y por lo tanto
se pueden resolver simultáneamente. Puede verificarse que las soluciones son
Además se puede demostrar que la resolución simultánea de las dos ecuaciones de los
mínimos cuadrados produce valores de 0 y 1 que minimizan SCE.
Ejemplo
Aplicar el método de los mínimos cuadrados para ajustar una línea recta a través de los
n=5 datos contenidos en la siguiente tabla:
x y
-2 0
-1 0
0 1
1 1
2 3
Solución Empezaremos por construir la tabla para calcular los coeficientes de las
ecuaciones de los mínimos cuadrados. Entonces se tiene:
xi yi xi yi xi2
-2 0 0 4
-1 0 0 1
0 1 0 0
1 1 1 1
2 3 6 4
xi= 0 yi = 5 xi yi = 7 xi2 = 10
y la recta ajustada es
ŷ = 1 + 0.7 x y
= Error = yi – ŷi
Esta diferencia es denominada el error del modelo y se lo denota por .
Al aplicar fórmulas para encontrar el valor esperado y la varianza de una función lineal
de variables aleatorias, obtenemos
E() = 0.
También,
Por lo tanto el error tiene una distribución de probabilidad normal con media cero y
varianza σ2
Los métodos que se presentaron en el tema anterior se pueden adaptar para aplicar el
Análisis de Varianza. Ilustraremos el método estableciendo un modelo lineal para los
datos que se obtuvieron mediante un diseño completamente aleatorio con k = 2
tratamientos.
Sea Yij la variable aleatoria obtenida en la j-ésima observación del i-ésimo tratamiento, i
= 1, 2. Definamos una variable ficticia, o indicadora de x de la manera siguiente:
X = ⌠1, si i = 2
0, si no
Yij = 0 + 1 x + ij
En donde ij es un error aleatorio con distribución normal con E(ij) = 0, y V(ij) = . En
este modelo
μ1 = E(Y1 j) = 0
μ2 = E(Y2 j) = 0 + 1
Por lo tanto 1 = μ1 + μ2 y una prueba de la hipótesis μ2 - μ1 = 0 es equivalente a la
prueba de que 1 = 0. Por intuición se indica que 0 = 1 y 1 = 2 - 1 son estimadores
adecuados de 0 y 1. Se puede demostrar que realmente estos son los estimadores por
mínimos cuadrados que se obtienen ajustando el modelo lineal formulado antes.
Ejemplo
En la tabla siguiente se dan los valores codificados de la medición de elasticidad de un
plástico, producido mediante dos procesos diferentes, para muestras
A B
6.1 9.1
7.1 8.2
7.8 8.6
6.9 6.9
7.6 7.5
8.2 7.9
De tamaño seis extraídas aleatoriamente de cada uno de los dos procesos. ¿Presentan los
datos evidencia suficiente para indicar una diferencia en la elasticidad media de los
procesos?
Observación
Los modelos estudiados en las secciones anteriores son útiles en dos situaciones
prácticas muy diferentes:
Y = 0 + 1 x +
Implica que
E(Y) = 0 + 1 x
Y = 0 + 1 x +
E(Y | X = x) = 0 + 1 x
Es decir, suponemos que la esperanza condicional de Y para un valor fijo de X es una
función lineal del valor de x. En general, suponemos que el vector variables aleatorio,
(X, Y), tiene distribución normal bivariable, en tal caso se puede demostrar que
E(Y | X = x) = 0 + 1 x
Sea (X1, Y1), (X2, Y2),..., (Xn, Yn) una muestra aleatoria de una población normal
bivariada. El estimador de máxima verosimilitud de ρ está dado por el coeficiente de
correlación muestral
Parecería lógico utilizar r como un estadístico de prueba para probar hipótesis acerca de
π, pero se presentan dificultades ya que es difícil obtener la distribución para r. Se
puede superar este problema en muestras bastantes grandes al utilizar el hecho de que
(1/2) ln[(1 + r) / (1 – r)] tiene aproximadamente una distribución normal con media
(1/2) ln[(1 + ρ) / (1 – ρ)] y varianza 1 / (n – 3). Por lo tanto para probar la hipótesis H0:
ρ = ρ0, podemos utilizar una prueba z en la cual
La forma de la región de rechazo depende de la hipótesis alternativa, si α es la
probabilidad deseada de un error tipo I. Las diferentes alternativas de mayor interés y
las regiones de rechazo correspondientes son
R2 = SC Regresión / SC Total
El R2 cambia con el modelo a diferencia del ρxy el cual no cambia con el modelo.
Ejemplo
Los datos en la siguiente tabla representan una muestra de los resultados de un examen
de aprovechamiento en matemáticas y de las calificaciones de cálculo para diez
estudiantes seleccionados independientemente, de primer año. Con esta evidencia, ¿se
concluiría que los resultados del examen de aprovechamiento en matemáticas y las
calificaciones de cálculo son independientes? Utilice α = 0.05. obtener el
correspondiente nivel de significación alcanzado.
xi = 460 yi = 760
xi yi = 36.854
Así
proponemos como hipótesis nula que X y Y son independientes, o bien, al suponer que
(X, Y) tiene una distribución normal bivariable, probamos H0: ρ = 0 frente a H1: ρ ≠ 0. El
valor del estadístico de la prueba es
Ya que zα/2 = z .025 = 1.96, el valor observado del estadístico de la prueba cae en la
región de rechazo, por lo tanto, los datos sugieren firmemente que los resultados del
examen de aprovechamiento y las calificaciones de cálculo son dependientes. Nótese
que α = 0.05 es la probabilidad de que nuestro estadístico de prueba caiga en la región
de rechazo cuando es verdadera H0. Por lo tanto, se confía bastante en que hemos
tomado una decisión correcta.
Como se aplica una prueba de dos colas, el valor p = 2 P(Z > 3.231). De los valores
obtenidos de la tabla de probabilidades de la normal, sigue que P(Z > 3.231) < P(Z >
3.00) = 0.001. Por lo tanto, el valor p < 2 (0.001) = 0.002 y para cualquier valor de α
mayor que 0.002 (lo que incluye α = 0.05, como se utilizó al inicio de este análisis)
concluiremos que π ≠ 0.
Coeficiente de correlación
Entonces b = (XT X) –1 XT Y
2. SC Reg = bT XT y – n 2
3. SC Error = yT y – bT XT y
E(Y) = β0 + β1 x1 +...+ βk xk
O bien, si y es una función de dos variables x1 y x2, pudiese elegirse una aproximación
mediante un plano a la respuesta media real, aplicando el modelo lineal E(Y) = β0 + β1
x1 + β2 x2. Por lo tanto, E(Y) es una función lineal de β0, β1 y β2 que representa un plano
en el espacio y, x1, x2. De manera similar,
E(Y) = β0 + β1 x + β2 x2
El modelo estadístico lineal que relaciona una respuesta aleatoria Y con un conjunto de
variables independientes x1, x2,..., xk tiene la forma
Y = β0 + β1 x1 +...+ βk xk + ε
En donde β0, β1,..., βk son parámetros desconocidos, ε es una v.a. y x1, x2,..., xk son
constantes conocidas. Supondremos que E(ε) = 0 y por lo tanto que
E(Y) = β0 + β1 x1 +...+ βk xk
suma de los cuadrados de las desviaciones (yi – i)2, y que esta cantidad se utiliza
para calcular la varianza de la muestra. El análisis de varianza divide la suma de los
cuadrados de las desviaciones llamadas suma total de los cuadrados de las
desviaciones, en partes, cada una de las cuales se atribuye a una de las variables
independientes en el experimento, más un residuo que se asocia con el error aleatorio.
Se puede detectar cuando una variable está muy relacionada con la respuesta,
comparándola estimación de 2 de una variable independiente particular, con la
estimación obtenida a partir de SCE aplicando una prueba F. Si la estimación para la
variable independiente es significativamente mayor, la prueba F rechazará la hipótesis
de que la variable independiente no tiene efecto y generará evidencia que indique una
relación con la respuesta.
Tabla de análisis de varianza para un diseño completamente aleatorizado
Fuente g.l. SC CM F
Tratamientos k–1 SCT CMT CMT / CME
Error n–k SCE CME
Total n-1 SC Total
CMT es la división entre la SC Tratamiento para sus grados de libertad (SCT / k-1);
CME es la división de la SCE para sus grados de libertad (SCE / n-k);
Por último se obtiene el estadístico F que es la división entre CMT y CME, los grados
de libertad son en el numerador los g.l. de la SCT y en el denominador los g.l. de la
SCE.
Ejemplo
A B
6.1 9.1
7.1 8.2
7.8 8.6
6.9 6.9
7.6 7.5
8.2 7.9
para muestras de tamaño seis extraídas aleatoriamente de cada uno de los dos procesos.
¿Presentan los datos evidencia suficiente para indicar una diferencia en la elasticidad
media de los procesos?
Solución
Aunque en este ejercicio se podría utilizar la t de Student como el estadístico de la
prueba, aplicaremos la prueba F del análisis de varianza, ya que es más general y se la
puede utilizar para comparar más de dos medias.
El valor crítico del estadístico F para α = 0.05 es 4.96. Aunque el cuadrado medio de los
tratamientos es casi tres veces mayor que el cuadrado medio del error, no es
suficientemente grande para rechazar la hipótesis nula. Por consiguiente, al nivel de
significancia α = 0.05 no hay suficiente evidencia estadística que indique una diferencia
entre μ1 y μ2. El nivel de significancia obtenido se indica mediante el valor p = P(F >
2.88) que según la tabla para la v.a. F, es tal que p > 0.10.
Observación
Los modelos que involucran variables cuntitativas son los que se han estado analizando
a lo largo de la unidad, es decir, estos modelos no se pueden analizar cuando se tiene el
tipo de variable cualitativa, para el cual existe otro tipo de investigación, el cual no es
objeto de estudio en este curso.
Todos los ejemplos que se encuentran en la presente unidad pertenecen a estos tipos de
modelos.
Los modelos para un diseño bifactorial o de dos factores es el mismo que se estudió en
la unidad 7 tema 6, y en la unidad 8 tema 4. En ambos casos se presentan ejemplos
ilustrativos que ayudarán a entender mejor la aplicación de estos modelos.
Ejemplo
El sistema funciona cuando opera una cadena intacta de componentes entre A y B. Si los
cuatro componentes funcionan independientemente, encuentre la confiabilidad del
sistema, en términos de F(y).
Solución
Observando el diagrama podemos ver que para que el sistema funcione deben trabajar a
la vez C1 y C2 y C3 ó C1 y C2 y C4 dado que no funciona C3, lo que equivale a:
Los objetos sobre los cuales se hacen las mediciones se denominan unidades
experimentales.
Los límites de control son los valores máximo y mínimo que se considera son los
límites dentro de los cuales el proceso se encuentra estable.
Una gráfica de Control es un diagrama de series de tiempo que incluye los límites de
control inferior y superior que identifican el rango de variación susceptible de
adjudicarse a causas comunes.
Recordemos que:
P (μ - 3σ ≤ x ≤ μ + 3σ ) = 0.99
P (μ - 2σ ≤ x ≤ μ + 2σ ) = 0.95
P (μ + σ ≤ x ≤ μ + σ ) = 0.68
Prueba 1: un punto fuera Prueba 2: Nueve puntos Prueba 3: Seis puntos Prueba 4: Catorce pun
de la zona A seguidos al mismo lado de seguidos crecientes o seguidos en alternanci
la línea central decrecientes arriba y abajo
Prueba 5: Dos de tres Prueba 6: Cuatro de cinco Prueba 7: Quince puntos Prueba 8: Ocho puntos
puntos en la zona A o más puntos seguidos en la seguidos en la zona C (a seguidos más allá de la
allá (a uno de los lados de zona B o más allá (a uno ambos lados de la línea zonas C (a ambos lado
la línea central) de los lados ...) central) la línea central)
En la siguiente tabla se muestra un resumen las fórmulas para las cartas de control más
usuales
Como podemos ver existen cartas de control para la media , para el rango R, la
proporción p, y para la cantidad c.
A2, D3 y D4 son valore obtenidos de la tabla de factores para gráficas de control para
ajustar los valores obtenidos en la formación de los límites de control.
Ejemplo
a) Muestra la línea
No. Pesos de paquetes (oz) s R central y
1 15,01 14,98 15,16 14,8 14,99 0,148 0,36 los
2 15,09 15,14 15,08 15,03 15,09 0,045 0,11 límites
3 15,04 15,1 14,93 15,13 15,05 0,088 0,20 de
4 14,9 15,03 14,94 14,92 14,95 0,057 0,13 control
inferior
5 15,04 15,05 15,08 14,98 15,04 0,042 0,10
y superior
6 14,96 14,081 14,96 14,91 14,73 0,432 0,88
de la
7 15,01 15,1 14,9 15,03 15,01 0,083 0,20 gráfica
8 14,71 14,92 14,77 14,95 14,84 0,116 0,24
.
9 14,81 14,8 14,64 14,95 14,80 0,127 0,31
b) Elabore
10 15,03 14,89 14,99 15,03 14,99 0,066 0,14 la
11 15,16 14,91 14,95 14,83 14,96 0,141 0,33 gráfica
12 14,92 15,05 15,01 15,02 15,00 0,056 0,13 de la
13 15,06 15,03 14,95 15,02 15,02 0,047 0,11 carta de
14 14,99 15,14 15,04 15,11 15,07 0,068 0,15 control
15 14,94 15,08 14,9 15,17 15,02 0,125 0,27 para
c) Se sale de control el proceso?. Si así fuese, Que prueba incumple?
d) Suponga que no se tienen las especificaciones, cuales serían las límites superior,
inferior y la línea central?
Solución
a.- dado que tenemos las especificaciones del producto entonces obtenemos los límites
de control por medio de ellos
c.- como podemos observar en el gráfico, el procesos se sale de control en las muestras
# 8 y # 9.
d.- Si no tuviésemos las especificaciones se deberán calcular los valores utilizando las
fórmulas de la tabla para cartas de control más comunes.
El nivel aceptable de calidad (AQL) está asociado con el riesgo del productor e indica
el porcentaje mínimo de ítem no conformes que puede haber en un lote para que este
pueda ser considerado como bueno.
Plan simple de muestreo: la información obtenida de una muestra es usada para tomar
una decisión para aceptar o rechazar el lote. Los parámetros son n tamaño de muestra y
c número de aceptación.
Al momento de tomar la nueva muestra se determinan n2, c2, r2 con una condicionante
que r2 = c2 + 1, y la prueba queda de la siguiente manera:
Si d1 + d2 ≤ c2 => acepta el lote
Si d1 + d2 > r2 => rechace el lote
n1 = 40 n2 = 60
c1 = 1 c2 = 5
r1 = 4 r2 = 6