Está en la página 1de 35

ELEMENTOS DE

INFERENCIA ESTADSTICA
(Experimentos con uno y dos
tratamientos)
DISEO DE EXPERIMENTOS SEGUNDO TEMA
Identificar los elementos de la inferencia estadstica y su importancia en
los diseos experimentales.
Explicar el papel de las distribuciones de probabilidad en la inferencia
estadstica, as como la estimacin puntual y por intervalo.
Describir las pruebas para la media y la varianza, as como los conceptos
bsicos de prueba de hiptesis.
Identificar las pruebas para la igualdad de varianzas.
Distinguir las pruebas para comparar medias con muestras
independientes y muestras pareadas.

UIP (21-303) 2
Coleccin o totalidad de posibles individuos,
POBLACIN especmenes, objetos o medidas de inters
sobre los que se hace un estudio.

(pequea) - se pueden medir todos los individuos para


tener un conocimiento exacto de las caractersticas
FINITA O INFINITA (parmetros) de esa poblacin.
(grande) - es imposible e incosteable medir a todos los
individuos

Ejemplos: materiales, Parte de una poblacin,


productos terminados, MUESTRA seleccionada adecuadamente,
partes o componentes, o que conserva los aspectos clave
REPRESENTATIVA de la poblacin.
algunos procesos.

UIP (21-303) 3
MUESTRA REPRESENTATIVA
REPRESENTATIVIDAD
La muestra debe tener los
aspectos clave que se MUESTREO ALEATORIO
desean analizar en la Se logra diseando de
poblacin. manera adecuada un
muestreo aleatorio (azar). Ejemplos: simple,
estratificado, sistemtico y
Seleccin sin sesgo. por conglomerados.
Todos los elementos de la Lograr muestras
poblacin con las mismas representativas en funcin
oportunidades de ser de los objetivos del estudio
incluidos en la muestra. y de ciertas circunstancias
de la poblacin.

UIP (21-303) 4
media poblacional X media muestral
desviacin poblacional S desviacin muestral

El objetivo de la inferencia estadstica es hacer afirmaciones vlidas acerca de la poblacin o


proceso con base en la informacin contenida en una muestra. Estas afirmaciones tienen por
objetivo coadyuvar en la toma de decisiones. Se divide en estimacin y prueba de hiptesis.

UIP (21-303) 5
Conocer la distribucin de probabilidad del estadstico
permite hacer estimaciones acerca de cul es el valor
del parmetro poblacional, y tambin ser posible
probar o verificar la validez de hiptesis o conjeturas
que se tengan sobre la poblacin o proceso.

T de Ji -
Normal F
Student cuadrada

UIP (21-303) 6
La distribucin normal estndar como la T
de Student son simtricas y centradas en
cero, mientras que las distribuciones ji-
cuadrada y F son sesgadas y slo toman
valores positivos.
Las cuatro distribuciones estn
relacionadas entre s, ya que las
distribuciones T de Student, ji-cuadrada y
F se definen en trminos de la distribucin
normal estndar.
Los parmetros que definen por completo
las distribuciones T de Student, ji-
cuadrada y F, reciben el nombre de
grados de libertad, que tienen que ver
con los tamaos muestrales involucrados.

UIP (21-303) 7
MEDIA () de proceso

Media muestral =

Estadstico que genera un


valor numrico simple, que se VARIANZA (2) de proceso

utiliza para hacer una Varianza muestral 2 = S2


estimacin del valor del
parmetro desconocido. PROPORCIN (p) de art.
defectuosos

Proporcin =

UIP (21-303) 8
Cuando se quiere tener mayor
certidumbre sobre el verdadero valor
del parmetro poblacional.

Obtener informacin sobre qu tan


precisa es la estimacin puntual.

La variacin entre una estimacin y otra


es muy grande.

La variabilidad del estimador se calcula


mediante la desviacin estndar o error
S
X estndar del estadstico, visto como una
n variable aleatoria.

UIP (21-303) 9
Rango donde se estima que est el valor de un
parmetro poblacional con cierto nivel de
seguridad o confianza.
La longitud del intervalo de confianza es
Construir un intervalo al 100 (1 a)% una medida de la precisin de la
de confianza para un parmetro estimacin.
desconocido q, consiste en estimar Es deseable que la longitud de los
dos nmeros (estadsticos) L y U, de intervalos sea pequea y con alto nivel de
manera que la probabilidad de que q confianza. El ancho de los intervalos es
se encuentre entre ellos mayor a medida que sea mayor la varianza
sea 1 a, donde L y U forman el de la poblacin y el nivel de confianza
intervalo de confianza buscado [L, U]. exigido. El ancho del intervalo es menor si
se incrementa el tamao de la muestra.

UIP (21-303) 10
Cien intervalos de confianza
Cien intervalos de confianza de 68% para
una media poblacional, aunque precisos,
no contienen a la media poblacional 32%
de las veces. Esta alta tasa de fallas hace
que el intervalo de confianza de 68% sea
inaceptable para propsitos prcticos.

Cien intervalos de confianza de 95%


calculado de estas muestras. ste presenta
un buen compromiso entre precisin y
confiabilidad para muchos propsitos.

Cien intervalos de confianza de 99.7%


calculado de estas muestras. Estos
intervalos no contienen a la media
poblacional solamente tres veces en 1 000.
Son sumamente confiables, pero poco
68% 95% 99.7% precisos.

UIP (21-303) 11
El promedio de las edades de los estudiantes de primer
ingreso de la UIP est entre los 17 y 35 aos con un 95%
de confianza.
La longitud del intervalo de confianza es muy grande
por la variabilidad de los datos (varianza muy grande).

El peso promedio de una bolsa de 1 kg de arroz de un lote


de mil unidades est entre los 0.96 y 1.04 kg con un 90%
de confianza, y entre 0.91 y 1.09 al 95% de confianza.
El intervalo de confianza es menor o mayor segn sea
el % de confianza exigido.

UIP (21-303) 12
L y U son los nmeros buscados que definen un intervalo al 100(1 a)% para la
media desconocida .

S S
L X ta /2 U X ta /2
n n

S
IC X ta /2
n

En la tabla de la distribucin T de Student se observa que para una


muestra con n 30, el valor de ta/2 es aproximadamente 2, o sea, el IC
ser la media ms menos 2 veces su error estndar.

UIP (21-303) 13
En un estudio realizado en una pequea localidad de los EE.UU. para estimar la media del
adeudo en las tarjetas de crdito de la poblacin, se obtuvo una muestra de n = 25 familias,
sin contar con una estimacin previa de la desviacin estndar poblacional. La media
muestral fue de $9,312 y la desv. estndar muestral fue de $4,007. Con un 95% de
confianza (a = 0.05) encuentre el error estndar para la media y el IC para la media
poblacional.
Solucin:
X 9312, S 4007, n 25, grados de libertad 24, ta /2 2.0639
S 4007
Error estndar para la media: 801
n 25
S L = $7,659
IC(95%): X ta /2 9312 2.0639 801 9312 1653
n U = 10,965
UIP (21-303) 14
Para construir un intervalo de confianza [L, U] para la
varianza 2, la distribucin de referencia es una ji-cuadrada
(c2) con n 1 grados de libertad

n 1 S2 n 1 S2
L U
c 2
a /2, n1 c 21a /2, n1

Los valores c2a/2 y c21a/2 son puntos crticos de la distribucin ji-cuadrada con n-1 grados de
libertad y se leen en la tabla de esta distribucin para el valor de a dado.

UIP (21-303) 15
Bajo el supuesto de que el nmero de artculos defectuosos en una muestra sigue
una distribucin binomial, y suponiendo que se inspecciona una cantidad grande
de defectuosos, se puede construir
de n artculos y se encuentra una proporcin
un intervalo de confianza para la proporcin poblacional p, apoyndose en la
aproximacin de la distribucin binomial por la normal.

p 1 p p 1 p
L p Za /2 L p Za /2
n n
donde Za/2 es un percentil de tabla de la distribucin normal estndar.

*** Ver ejemplos 2.2 y 2.3 del libro de texto recomendado ***

UIP (21-303) 16
Afirmacin sobre los valores de los parmetros de una
HIPTESIS poblacin o proceso, que es susceptible de probarse a partir
ESTADSTICA de la informacin contenida en una muestra representativa
que es obtenida de la poblacin.

Este proceso produce menos de 8% de defectuosos se puede plantear


EJEMPLO estadsticamente, en trminos de la proporcin p desconocida de artculos
defectuosos que genera el proceso, como se hace a continuacin.
H0 : p 0.08 (la proporcin de defectuosos es 0.08) Hip. Nula
HA : p < 0.08 (la proporcin es menor a 0.08) Hip. Alternativa

En las pruebas de hiptesis se empieza por hacer un supuesto tentativo acerca del parmetro poblacional. A
este supuesto tentativo se le llama hiptesis nula, y se denota por H0. Despus se define otra hiptesis,
llamada hiptesis alternativa, que contradice lo que establece la hiptesis nula y se denota como HA.
En el procedimiento de pruebas de hiptesis se usan datos de una muestra para probar dos afirmaciones
contrarias indicadas por H0 y HA.

UIP (21-303) 17
En general, la estrategia a H0: 0
seguir para probar una HA: > 0
hiptesis es suponer que la PRUEBA DE UNA COLA
hiptesis nula es verdadera,
y que en caso de ser
H0: 0
rechazada por la evidencia HA: < 0
que aportan los datos, se
estar aceptando la hiptesis H0: = 0
PRUEBA DE DOS COLAS
alternativa. HA: 0

Observe que en la hiptesis nula


H0 siempre aparece la igualdad.

UIP (21-303) 18
Una vez planteada la hiptesis, se toma una muestra aleatoria de la poblacin de
estudio o se obtienen datos mediante un experimento planeado de acuerdo con la
hiptesis. El estadstico de prueba es un nmero calculado a partir de los datos y la
hiptesis nula, cuya magnitud permite discernir si se rechaza o no la hiptesis nula H0.

ESTADSTICOS DE PRUEBA TPICOS


Regin o intervalo Regin o intervalo
Z prueba de medias, muestras
de rechazo de aceptacin
grandes, varianza conocida
t prueba de medias, muestras
Conjunto de posibles Conjunto de posibles
pequeas, varianza desconocida
valores del estadstico valores del estadstico
de prueba que llevan a
c 2 prueba de varianzas de prueba donde no se
rechazar H0. rechaza H0.

UIP (21-303) 19
Pruebas de una y dos colas (unilaterales y bilaterales). La ubicacin de la regin o intervalo de rechazo
depende de si la hiptesis es bilateral o unilateral.
Una hiptesis es bilateral cuando la hiptesis alternativa (HA) es del tipo no es igual (); y es unilateral
cuando la alternativa es del tipo mayor que (>) o menor que (<).
Cuando es bilateral, la regin de rechazo est repartida de manera equitativa entre ambas colas de la
distribucin del estadstico de prueba.
Si la hiptesis es unilateral, la evidencia en contra de la hiptesis nula se ubica en un solo lado de la
distribucin, esto es, la regin de rechazo slo se concentra en una de las colas.

RESUMEN DE LOS PASOS DE LA PRUEBA DE HIPTESIS


1. Se establecen la hiptesis nula (H0) y la hiptesis alternativa (HA).
2. Se selecciona el nivel de significancia, es decir, a.
3. Se selecciona un estadstico de prueba adecuado.
4. Se formula una regla de decisin con base en los pasos 1, 2 y 3 anteriores.
5. Se toma una decisin en lo que se refiere a la hiptesis nula con base en la
informacin de la muestra. Se interpretan los resultados de la prueba.

UIP (21-303) 20
Afirmacin a probar: Afirmacin a probar:
Este proceso produce menos de 8% de defectuosos Este proceso produce 8% de defectuosos
Planteamiento estadstico: Planteamiento estadstico:
H0: p 0.08 H0: p = 0.08
HA: p < 0.08 HA: p 0.08

HA se conoce como hiptesis alternativa de un solo HA se llama hiptesis alternativa de dos lados o colas
lado o cola (unilateral), ya que la nica manera de (bilateral), ya que la evidencia en contra de H0 se
rechazar H0 es teniendo valores de la proporcin obtiene con valores pequeos o grandes de la
muestral significativamente ms pequeos que proporcin muestral .
0.08.

H0: p 0.08 H0: p = 0.08


HA: p < 0.08 HA: p 0.08

UIP (21-303) 21
Al estudiar la media , es de inters preguntarse si sta es igual, mayor o menor a
cierto valor 0, donde 0 es un nmero conocido.
Ejemplo, puede ser de inters investigar si el rendimiento promedio de un proceso
durante esta semana es igual, mayor o menor que el de la semana anterior, 0.

Con varianza 2 conocida y n 30: Con varianza 2 desconocida y n < 30:


0 0
0 = 0 =
/ /
Donde: Donde:
desv. st. poblacional ntamao de la muestra Sdesv. st. muestral ntamao de la muestra

media muestral 0 media de referencia


media muestral 0 media de referencia

UIP (21-303) 22
El valor de Z0 se compara contra Za/2 (dos colas) o contra Za (una cola).
Estos valores se interpolan en las tablas de distribucin apropiadas.

El valor de t0 se compara contra ta/2 o contra ta. Estos valores se


interpolan en las tablas de distribucin apropiadas.

Prueba para la media:


a. Para dos colas ( 0) se rechaza H0 si |t0| > ta/2
b. Para una cola ( > 0) se rechaza Ho si t0 > ta
( < 0) se rechaza H0 si t0 < -ta

UIP (21-303) 23
Si se desea probar una hiptesis acerca de la varianza se puede hacer utilizando
las medidas estadsticas con las que se construy el intervalo de confianza S2, esto
es, con la distribucin ji-cuadrada. Para ello empleamos el siguiente estadstico:

2
1
02 =
02
donde n-1 son los grados de libertad, S2 es la varianza muestral y 02 es la varianza de referencia.

Prueba para la varianza:


a. Para dos colas (2 02) se rechaza H0 si c02 > c2a/2 c02 < c21-a/2
b. Para una cola (2 < 02) se rechaza H0 si c02 < c21-a
(2 > 02) se rechaza H0 si c02 > c2a

UIP (21-303) 24
SIGNIFICANCIA PREDIFINIDA
(a)
Es el riesgo mximo que el SIGNIFICANCIA OBSERVADA
experimentador est dispuesto a
correr por rechazar H0
(p-value)
indebidamente Probabilidad de observar un valor
muestral tan extremo o ms que el valor
observado, si la hiptesis nula es
verdadera.

Se rechaza H0 si el p-value

UIP (21-303) 25
La experiencia en la cra de pollos de New Jersey Red mostr que el peso medio de los pollos a los cinco meses es de 4.35
libras. Los pesos se rigen por una distribucin normal. En un esfuerzo por incrementar el peso, se agrega un aditivo
especial al alimento de los pollos. Los pesos (en libras) subsecuentes de una muestra de pollos de cinco meses de edad
fueron los siguientes:
4.41 4.37 4.33 4.35 4.30 4.39 4.36 4.38 4.40 4.39
El aditivo increment el peso medio de los pollos con un nivel de significancia de 0.01?
T de una muestra: Peso (lbs)

Prueba de = 4.35 vs. > 4.35


Error
estndar Lmite
de la inferior
Variable N Media Desv.Est. media de 99% T P
Peso (lbs) 10 4.3680 0.0339 0.0107 4.3377 1.68 0.064

Conclusin:
Mtodo del valor crtico como t0 < ta (1.68 < 2.821) no se rechaza H0, por lo que con una confianza del 99% el aditivo no
increment el peso de los pollos.
Mtodo del p-value como p-value > a (0.064 > 0.01) no se rechaza H0, por lo que con una confianza del 99% el aditivo
no increment el peso de los pollos.

UIP (21-303) 26
Los investigadores por lo general estn ms interesados en conocer la diferencia entre las
medias que un valor especfico de ellas.
Un problema frecuente que se presenta es comparar la media de dos procesos o dos
tratamientos. Por ejemplo, comparar dos proveedores, dos materiales, dos mquinas o dos
mtodos de trabajo.

Ejemplo: Dos mquinas, A y B, realizan la misma operacin y deseamos comparar las medias de
esta operacin. Para que la comparacin sea justa, la materia prima que utilizan las mquinas se
asigna de forma aleatoria a las mquinas, y las 2n pruebas o corridas se hacen en orden aleatorio.
No es adecuado realizar primero todas las pruebas de la mquina A y posteriormente las de la
mquina B, porque eso puede favorecer a una de las mquinas y afecta (sesga) la comparacin.
El orden aleatorio de las pruebas nulifica el efecto de las fuentes de variabilidad que actan
durante el transcurso de las mismas (como las variables ambientales), al repartir su efecto
equitativamente en ambas mquinas.

UIP (21-303) 27
Sean dos procesos o tratamientos con medias x y y y varianzas 2 y 2 , respectivamente. Interesa
investigar si las medias de dichos procesos pueden considerarse estadsticamente iguales. Se plantean las
siguientes hiptesis:

H0: x = y H0: x - y = 0

HA: x y HA: x y 0

Para probar H0 se toman dos muestras aleatorias, como en el ejemplo de las mquinas antes descritas, de
tamao nx la del proceso X, y de tamao ny la del proceso Y; en general, es recomendable que nx = ny = n,
pero tambin puede trabajarse con nx ny si no pudieran tomarse iguales.

Se rechaza H0 si el p-value < a para la pareja de hiptesis de inters.

UIP (21-303) 28
Considere un nuevo software que ayuda a los analistas de sistemas a reducir el tiempo requerido para disear, elaborar y
poner en marcha un sistema de informacin. Para evaluar las ventajas del nuevo programa, se toma una muestra
aleatoria de 24 analistas de sistemas. A cada analista se le proporciona informacin sobre un sistema de informacin
hipottico. A 12 de ellos se les pide que elaboren el sistema de informacin usando la tecnologa actual. A los otros 12 se
les capacita para usar el nuevo software y se les instruye para que lo empleen en el desarrollo del sistema de informacin.
El investigador encargado de la evaluacin del nuevo software espera demostrar que hay diferencias significativas en el
tiempo promedio para desarrollar sistemas de informacin con las dos tecnologas.

Prueba T de dos muestras e IC Conclusin:


Error Como el p-value es menor que a, entonces
estndar rechazamos la hiptesis nula y aceptamos la
de la
Muestra N Media Desv.Est. media alternativa, por lo que con un 95% de confianza
1 12 325.0 40.0 12 podemos decir que si existe diferencia en los tiempos
2 12 286.0 44.0 13
promedios de desarrollo de sistemas de informacin
Diferencia = (1) - (2) utilizando ambas tecnologas. Como la diferencia de
Estimacin de la diferencia: 39.0 1 2 es positiva, entonces es evidente que con el
IC de 95% para la diferencia: (3.4, 74.6)
Prueba T de diferencia = 0 (vs. ): Valor T = 2.27 nuevo software la implementacin toma menos
Valor p = 0.033 GL = 22 tiempo.

UIP (21-303) 29
UIP (21-303) 30
En lugar de suponer, en la prueba de medias, que las varianzas son iguales o diferentes, se puede proceder a
verificarlo de manera estadstica mediante las hiptesis:

H0: = H0: =1



HA: HA: 1

En donde se prefiere la ltima expresin para enfatizar que la prueba se basa en la distribucin del
estadstico,
2
F0 = 2 donde 2 > 2

el cual, bajo el supuesto de que H0 es verdad, sigue una distribucin F con nx 1 grados de libertad en el
numerador y ny 1 grados de libertad en el denominador.

Se rechaza H0 si el p-value < a para la pareja de hiptesis de inters.

UIP (21-303) 31
Con base en los datos obtenidos en un estudio, se sabe que en las firmas de contadores pblicos la varianza de los
sueldos anuales de los empleados con mayor antigedad es aproximadamente 2.1, y la de los sueldos anuales de los
gerentes es alrededor de 11.1. Estos datos estn calculados en miles de dlares. Si se obtuvieron de muestras de 25
empleados con mayor antigedad y 26 gerentes, pruebe la hiptesis de que las varianzas poblacionales de los sueldos son
iguales. Con 0.05 como nivel de significancia, cul es su conclusin?

Hiptesis nula (Primero) / (Segundo) = 1


Hiptesis alterna (Primero) / (Segundo) 1
Nivel de significancia = 0.05
Conclusin:
IC de 95%
para Como el p-value es menor que a, entonces
Muestra N Desv.Est. Varianza Desv.Est. rechazamos la hiptesis nula y aceptamos la
Primero 26 3.332 11.100 (2.613, 4.599) alternativa, por lo que con un 95% de
Segundo 25 1.449 2.100 (1.132, 2.016)
confianza podemos decir que las varianzas
Pruebas poblacionales de los sueldos no son iguales.
Estadstica
Mtodo GL1 GL2 de prueba Valor p
F 25 24 5.29 0.000

UIP (21-303) 32
UIP (21-303) 33
En muchas situaciones experimentales no conviene o no es posible tomar muestras independientes, sino
que la mejor estrategia es tomar muestras pareadas. Esto significa que los datos de ambos tratamientos se
van obteniendo por pares, de forma que cada par son datos que tienen algo en comn; por ejemplo, que a
la misma unidad experimental o espcimen de prueba se le apliquen los tratamientos a comparar.
Se plantea la siguiente hiptesis:

H0: 1 = 2 H0: D = 0

HA: 1 2 HA: D 0
donde D es la media de la poblacin de diferencias 1 2. De esta manera, el problema de comparar las
medias de dos poblaciones se convierte en el problema de comparar la media de una poblacin con una
constante.

Las observaciones pareadas son necesarias para eliminar fuentes de variabilidad que
podran no dejar hacer la comparacin de manera eficaz.

UIP (21-303) 34
Se desea ver si dos bsculas estn sincronizadas. Para ello se
toma una muestra aleatoria de 10 especmenes y cada uno
se pesa en ambas bsculas, cuidando que el orden en que se
utilizan sea elegido al azar. El trabajo lo realiza el mismo
operador y los datos obtenidos se muestran en la tabla
adjunta:

T pareada para Bscula1 - Bscula2


Error
estndar de Conclusin:
N Media Desv.Est. la media Como el p-value es mayor que a, no
Bscula1 10 12.87 5.17 1.63 hay evidencia para rechazar la
Bscula2 10 12.89 5.16 1.63
Diferencia 10 -0.02000 0.02867 0.00907
hiptesis nula, por lo que con un 95%
de confianza podemos decir que las
IC de 95% para la diferencia media: (-0.04051, 0.00051) bsculas estn sincronizadas (pesan
Prueba t de diferencia media = 0 (vs. 0): Valor T = -2.21 de manera similar).
Valor p = 0.055

UIP (21-303) 35

También podría gustarte