Explora Libros electrónicos
Categorías
Explora Audiolibros
Categorías
Explora Revistas
Categorías
Explora Documentos
Categorías
INFERENCIA ESTADSTICA
(Experimentos con uno y dos
tratamientos)
DISEO DE EXPERIMENTOS SEGUNDO TEMA
Identificar los elementos de la inferencia estadstica y su importancia en
los diseos experimentales.
Explicar el papel de las distribuciones de probabilidad en la inferencia
estadstica, as como la estimacin puntual y por intervalo.
Describir las pruebas para la media y la varianza, as como los conceptos
bsicos de prueba de hiptesis.
Identificar las pruebas para la igualdad de varianzas.
Distinguir las pruebas para comparar medias con muestras
independientes y muestras pareadas.
UIP (21-303) 2
Coleccin o totalidad de posibles individuos,
POBLACIN especmenes, objetos o medidas de inters
sobre los que se hace un estudio.
UIP (21-303) 3
MUESTRA REPRESENTATIVA
REPRESENTATIVIDAD
La muestra debe tener los
aspectos clave que se MUESTREO ALEATORIO
desean analizar en la Se logra diseando de
poblacin. manera adecuada un
muestreo aleatorio (azar). Ejemplos: simple,
estratificado, sistemtico y
Seleccin sin sesgo. por conglomerados.
Todos los elementos de la Lograr muestras
poblacin con las mismas representativas en funcin
oportunidades de ser de los objetivos del estudio
incluidos en la muestra. y de ciertas circunstancias
de la poblacin.
UIP (21-303) 4
media poblacional X media muestral
desviacin poblacional S desviacin muestral
UIP (21-303) 5
Conocer la distribucin de probabilidad del estadstico
permite hacer estimaciones acerca de cul es el valor
del parmetro poblacional, y tambin ser posible
probar o verificar la validez de hiptesis o conjeturas
que se tengan sobre la poblacin o proceso.
T de Ji -
Normal F
Student cuadrada
UIP (21-303) 6
La distribucin normal estndar como la T
de Student son simtricas y centradas en
cero, mientras que las distribuciones ji-
cuadrada y F son sesgadas y slo toman
valores positivos.
Las cuatro distribuciones estn
relacionadas entre s, ya que las
distribuciones T de Student, ji-cuadrada y
F se definen en trminos de la distribucin
normal estndar.
Los parmetros que definen por completo
las distribuciones T de Student, ji-
cuadrada y F, reciben el nombre de
grados de libertad, que tienen que ver
con los tamaos muestrales involucrados.
UIP (21-303) 7
MEDIA () de proceso
Media muestral =
UIP (21-303) 8
Cuando se quiere tener mayor
certidumbre sobre el verdadero valor
del parmetro poblacional.
UIP (21-303) 9
Rango donde se estima que est el valor de un
parmetro poblacional con cierto nivel de
seguridad o confianza.
La longitud del intervalo de confianza es
Construir un intervalo al 100 (1 a)% una medida de la precisin de la
de confianza para un parmetro estimacin.
desconocido q, consiste en estimar Es deseable que la longitud de los
dos nmeros (estadsticos) L y U, de intervalos sea pequea y con alto nivel de
manera que la probabilidad de que q confianza. El ancho de los intervalos es
se encuentre entre ellos mayor a medida que sea mayor la varianza
sea 1 a, donde L y U forman el de la poblacin y el nivel de confianza
intervalo de confianza buscado [L, U]. exigido. El ancho del intervalo es menor si
se incrementa el tamao de la muestra.
UIP (21-303) 10
Cien intervalos de confianza
Cien intervalos de confianza de 68% para
una media poblacional, aunque precisos,
no contienen a la media poblacional 32%
de las veces. Esta alta tasa de fallas hace
que el intervalo de confianza de 68% sea
inaceptable para propsitos prcticos.
UIP (21-303) 11
El promedio de las edades de los estudiantes de primer
ingreso de la UIP est entre los 17 y 35 aos con un 95%
de confianza.
La longitud del intervalo de confianza es muy grande
por la variabilidad de los datos (varianza muy grande).
UIP (21-303) 12
L y U son los nmeros buscados que definen un intervalo al 100(1 a)% para la
media desconocida .
S S
L X ta /2 U X ta /2
n n
S
IC X ta /2
n
UIP (21-303) 13
En un estudio realizado en una pequea localidad de los EE.UU. para estimar la media del
adeudo en las tarjetas de crdito de la poblacin, se obtuvo una muestra de n = 25 familias,
sin contar con una estimacin previa de la desviacin estndar poblacional. La media
muestral fue de $9,312 y la desv. estndar muestral fue de $4,007. Con un 95% de
confianza (a = 0.05) encuentre el error estndar para la media y el IC para la media
poblacional.
Solucin:
X 9312, S 4007, n 25, grados de libertad 24, ta /2 2.0639
S 4007
Error estndar para la media: 801
n 25
S L = $7,659
IC(95%): X ta /2 9312 2.0639 801 9312 1653
n U = 10,965
UIP (21-303) 14
Para construir un intervalo de confianza [L, U] para la
varianza 2, la distribucin de referencia es una ji-cuadrada
(c2) con n 1 grados de libertad
n 1 S2 n 1 S2
L U
c 2
a /2, n1 c 21a /2, n1
Los valores c2a/2 y c21a/2 son puntos crticos de la distribucin ji-cuadrada con n-1 grados de
libertad y se leen en la tabla de esta distribucin para el valor de a dado.
UIP (21-303) 15
Bajo el supuesto de que el nmero de artculos defectuosos en una muestra sigue
una distribucin binomial, y suponiendo que se inspecciona una cantidad grande
de defectuosos, se puede construir
de n artculos y se encuentra una proporcin
un intervalo de confianza para la proporcin poblacional p, apoyndose en la
aproximacin de la distribucin binomial por la normal.
p 1 p p 1 p
L p Za /2 L p Za /2
n n
donde Za/2 es un percentil de tabla de la distribucin normal estndar.
*** Ver ejemplos 2.2 y 2.3 del libro de texto recomendado ***
UIP (21-303) 16
Afirmacin sobre los valores de los parmetros de una
HIPTESIS poblacin o proceso, que es susceptible de probarse a partir
ESTADSTICA de la informacin contenida en una muestra representativa
que es obtenida de la poblacin.
En las pruebas de hiptesis se empieza por hacer un supuesto tentativo acerca del parmetro poblacional. A
este supuesto tentativo se le llama hiptesis nula, y se denota por H0. Despus se define otra hiptesis,
llamada hiptesis alternativa, que contradice lo que establece la hiptesis nula y se denota como HA.
En el procedimiento de pruebas de hiptesis se usan datos de una muestra para probar dos afirmaciones
contrarias indicadas por H0 y HA.
UIP (21-303) 17
En general, la estrategia a H0: 0
seguir para probar una HA: > 0
hiptesis es suponer que la PRUEBA DE UNA COLA
hiptesis nula es verdadera,
y que en caso de ser
H0: 0
rechazada por la evidencia HA: < 0
que aportan los datos, se
estar aceptando la hiptesis H0: = 0
PRUEBA DE DOS COLAS
alternativa. HA: 0
UIP (21-303) 18
Una vez planteada la hiptesis, se toma una muestra aleatoria de la poblacin de
estudio o se obtienen datos mediante un experimento planeado de acuerdo con la
hiptesis. El estadstico de prueba es un nmero calculado a partir de los datos y la
hiptesis nula, cuya magnitud permite discernir si se rechaza o no la hiptesis nula H0.
UIP (21-303) 19
Pruebas de una y dos colas (unilaterales y bilaterales). La ubicacin de la regin o intervalo de rechazo
depende de si la hiptesis es bilateral o unilateral.
Una hiptesis es bilateral cuando la hiptesis alternativa (HA) es del tipo no es igual (); y es unilateral
cuando la alternativa es del tipo mayor que (>) o menor que (<).
Cuando es bilateral, la regin de rechazo est repartida de manera equitativa entre ambas colas de la
distribucin del estadstico de prueba.
Si la hiptesis es unilateral, la evidencia en contra de la hiptesis nula se ubica en un solo lado de la
distribucin, esto es, la regin de rechazo slo se concentra en una de las colas.
UIP (21-303) 20
Afirmacin a probar: Afirmacin a probar:
Este proceso produce menos de 8% de defectuosos Este proceso produce 8% de defectuosos
Planteamiento estadstico: Planteamiento estadstico:
H0: p 0.08 H0: p = 0.08
HA: p < 0.08 HA: p 0.08
HA se conoce como hiptesis alternativa de un solo HA se llama hiptesis alternativa de dos lados o colas
lado o cola (unilateral), ya que la nica manera de (bilateral), ya que la evidencia en contra de H0 se
rechazar H0 es teniendo valores de la proporcin obtiene con valores pequeos o grandes de la
muestral significativamente ms pequeos que proporcin muestral .
0.08.
UIP (21-303) 21
Al estudiar la media , es de inters preguntarse si sta es igual, mayor o menor a
cierto valor 0, donde 0 es un nmero conocido.
Ejemplo, puede ser de inters investigar si el rendimiento promedio de un proceso
durante esta semana es igual, mayor o menor que el de la semana anterior, 0.
UIP (21-303) 22
El valor de Z0 se compara contra Za/2 (dos colas) o contra Za (una cola).
Estos valores se interpolan en las tablas de distribucin apropiadas.
UIP (21-303) 23
Si se desea probar una hiptesis acerca de la varianza se puede hacer utilizando
las medidas estadsticas con las que se construy el intervalo de confianza S2, esto
es, con la distribucin ji-cuadrada. Para ello empleamos el siguiente estadstico:
2
1
02 =
02
donde n-1 son los grados de libertad, S2 es la varianza muestral y 02 es la varianza de referencia.
UIP (21-303) 24
SIGNIFICANCIA PREDIFINIDA
(a)
Es el riesgo mximo que el SIGNIFICANCIA OBSERVADA
experimentador est dispuesto a
correr por rechazar H0
(p-value)
indebidamente Probabilidad de observar un valor
muestral tan extremo o ms que el valor
observado, si la hiptesis nula es
verdadera.
Se rechaza H0 si el p-value
UIP (21-303) 25
La experiencia en la cra de pollos de New Jersey Red mostr que el peso medio de los pollos a los cinco meses es de 4.35
libras. Los pesos se rigen por una distribucin normal. En un esfuerzo por incrementar el peso, se agrega un aditivo
especial al alimento de los pollos. Los pesos (en libras) subsecuentes de una muestra de pollos de cinco meses de edad
fueron los siguientes:
4.41 4.37 4.33 4.35 4.30 4.39 4.36 4.38 4.40 4.39
El aditivo increment el peso medio de los pollos con un nivel de significancia de 0.01?
T de una muestra: Peso (lbs)
Conclusin:
Mtodo del valor crtico como t0 < ta (1.68 < 2.821) no se rechaza H0, por lo que con una confianza del 99% el aditivo no
increment el peso de los pollos.
Mtodo del p-value como p-value > a (0.064 > 0.01) no se rechaza H0, por lo que con una confianza del 99% el aditivo
no increment el peso de los pollos.
UIP (21-303) 26
Los investigadores por lo general estn ms interesados en conocer la diferencia entre las
medias que un valor especfico de ellas.
Un problema frecuente que se presenta es comparar la media de dos procesos o dos
tratamientos. Por ejemplo, comparar dos proveedores, dos materiales, dos mquinas o dos
mtodos de trabajo.
Ejemplo: Dos mquinas, A y B, realizan la misma operacin y deseamos comparar las medias de
esta operacin. Para que la comparacin sea justa, la materia prima que utilizan las mquinas se
asigna de forma aleatoria a las mquinas, y las 2n pruebas o corridas se hacen en orden aleatorio.
No es adecuado realizar primero todas las pruebas de la mquina A y posteriormente las de la
mquina B, porque eso puede favorecer a una de las mquinas y afecta (sesga) la comparacin.
El orden aleatorio de las pruebas nulifica el efecto de las fuentes de variabilidad que actan
durante el transcurso de las mismas (como las variables ambientales), al repartir su efecto
equitativamente en ambas mquinas.
UIP (21-303) 27
Sean dos procesos o tratamientos con medias x y y y varianzas 2 y 2 , respectivamente. Interesa
investigar si las medias de dichos procesos pueden considerarse estadsticamente iguales. Se plantean las
siguientes hiptesis:
H0: x = y H0: x - y = 0
HA: x y HA: x y 0
Para probar H0 se toman dos muestras aleatorias, como en el ejemplo de las mquinas antes descritas, de
tamao nx la del proceso X, y de tamao ny la del proceso Y; en general, es recomendable que nx = ny = n,
pero tambin puede trabajarse con nx ny si no pudieran tomarse iguales.
UIP (21-303) 28
Considere un nuevo software que ayuda a los analistas de sistemas a reducir el tiempo requerido para disear, elaborar y
poner en marcha un sistema de informacin. Para evaluar las ventajas del nuevo programa, se toma una muestra
aleatoria de 24 analistas de sistemas. A cada analista se le proporciona informacin sobre un sistema de informacin
hipottico. A 12 de ellos se les pide que elaboren el sistema de informacin usando la tecnologa actual. A los otros 12 se
les capacita para usar el nuevo software y se les instruye para que lo empleen en el desarrollo del sistema de informacin.
El investigador encargado de la evaluacin del nuevo software espera demostrar que hay diferencias significativas en el
tiempo promedio para desarrollar sistemas de informacin con las dos tecnologas.
UIP (21-303) 29
UIP (21-303) 30
En lugar de suponer, en la prueba de medias, que las varianzas son iguales o diferentes, se puede proceder a
verificarlo de manera estadstica mediante las hiptesis:
H0: = H0: =1
HA: HA: 1
En donde se prefiere la ltima expresin para enfatizar que la prueba se basa en la distribucin del
estadstico,
2
F0 = 2 donde 2 > 2
el cual, bajo el supuesto de que H0 es verdad, sigue una distribucin F con nx 1 grados de libertad en el
numerador y ny 1 grados de libertad en el denominador.
UIP (21-303) 31
Con base en los datos obtenidos en un estudio, se sabe que en las firmas de contadores pblicos la varianza de los
sueldos anuales de los empleados con mayor antigedad es aproximadamente 2.1, y la de los sueldos anuales de los
gerentes es alrededor de 11.1. Estos datos estn calculados en miles de dlares. Si se obtuvieron de muestras de 25
empleados con mayor antigedad y 26 gerentes, pruebe la hiptesis de que las varianzas poblacionales de los sueldos son
iguales. Con 0.05 como nivel de significancia, cul es su conclusin?
UIP (21-303) 32
UIP (21-303) 33
En muchas situaciones experimentales no conviene o no es posible tomar muestras independientes, sino
que la mejor estrategia es tomar muestras pareadas. Esto significa que los datos de ambos tratamientos se
van obteniendo por pares, de forma que cada par son datos que tienen algo en comn; por ejemplo, que a
la misma unidad experimental o espcimen de prueba se le apliquen los tratamientos a comparar.
Se plantea la siguiente hiptesis:
H0: 1 = 2 H0: D = 0
HA: 1 2 HA: D 0
donde D es la media de la poblacin de diferencias 1 2. De esta manera, el problema de comparar las
medias de dos poblaciones se convierte en el problema de comparar la media de una poblacin con una
constante.
Las observaciones pareadas son necesarias para eliminar fuentes de variabilidad que
podran no dejar hacer la comparacin de manera eficaz.
UIP (21-303) 34
Se desea ver si dos bsculas estn sincronizadas. Para ello se
toma una muestra aleatoria de 10 especmenes y cada uno
se pesa en ambas bsculas, cuidando que el orden en que se
utilizan sea elegido al azar. El trabajo lo realiza el mismo
operador y los datos obtenidos se muestran en la tabla
adjunta:
UIP (21-303) 35