Estadística Inferencial

Estadística Inferencial
Héctor Varela V.
Población: Colección completa de valoraciones de una
característica de interés en un conjunto de individuos o elementos.
Muestra aleatoria simple: Subconjunto de una población

seleccionado al azar.
Población
completa
Muestra
(subconjunto)
Objetivo: Realizar inferencias con respecto a la población

basándose en la información contenida en una muestra.
Héctor Varela V. 2
Parámetros poblacionales
Media : 
Varianza :  
Desv. Est. : 
Proporción : p
Héctor Varela V. 3
Un estimador de un parámetro poblacional es una
función de los datos que conforman una muestra
aleatoria simple.
Propiedades deseables en un estimador
• Insesgado (sin sesgo).

• De varianza mínima.
• Consistente (a medida que aumenta el tamaño de muestra el estimador
se aproxima cada vez más al parámetro).
Si el estimador es insesgado entonces existe exactitud

en la estimación.
Si la varianza del estimador es pequeña entonces existe

precisión en la estimación.
Héctor Varela V. 4
Estimadores puntuales
Muestra aleatoria simple x1 , x 2 , ... , x n
̂  X
n 2
 (x  X )
i
ˆ  S 
 2 i  1
n 1
ˆ  S  S 2
Las estadísticas de muestras se aproximan a los parámetros

poblacionales
Héctor Varela V. 5
Población v/s Muestra
POBLACION MUESTRA
10
F re q uenc y
5
80 85 90 95
 X
2 S X2
 SX
Héctor Varela V. 6
Estimación puntual de la proporción poblacional
x1 , x2 ,, xn m.a.s. C
c
C p = Pr ob(C )
Datos dicotómicos
1 i-ésimo elemento satisface característica C

xi  
0 Si no
n
 xi
pˆ  i 1  N  de datos en la muestra que satisface C
n n
Héctor Varela V. 7
Considerar una población de tamaño N  6
Elemento Característica X
A 1
B 2
C 3
D 3
E 4
F 5
18 5
  3   2
6 3
Héctor Varela V. 8
Muestras de Tamaño 2
Muestra elementos suma Xi

1 AB 1+2= 3 1,5
2 AC 1+3= 4 2,0
3 AD 1+3= 4 2,0
4 AE 1+4= 5 2,5
5 AF 1+5= 6 3,0
6 BC 2+3= 5 2,5
7 BD 2+3= 5 2,5
8 BE 2+4= 6 3,0
9 BF 2+5= 7 3,5
10 CD 3+3= 6 3,0
11 CE 3+4= 7 3,5
12 CF 3+5= 8 4,0
13 DE 3+4= 7 3,5
14 DF 3+5= 8 4,0
15 EF 4+5= 9 4,5
Héctor Varela V. 9
Distribución de los promedios muestrales de tamaño 2
Histogram of C1
3,0 k : Nº de muestras
2,5
de tamaño 2
2,0
N
Frequency
1,5
k     15
n
1,0
0,5
0,0
1,5 2,0 2,5 3,0 3,5 4,0 4,5
C1
Promedio es un estimador
insesgado de μ
Promedio de los promedios  X 

 X i

45
3
k 15
Varianza de los promedios  2  i

X 2
 k  2
X

2
X
k 3
Héctor Varela V. 10
Muestras de Tamaño 4
Muestra elementos suma Xi
1 ABCD 1+2+3+3= 9 2,25
2 ABCE 1+2+3+4= 10 2,50
3 ABCF 1+2+3+5= 11 2,75
4 ABDE 1+2+3+4= 10 2,50
5 ABDF 1+2+3+5= 11 2,75
6 ABEF 1+2+4+5= 12 3,00
7 ACDE 1+3+3+4= 11 2,75
8 ACDF 1+3+3+5= 12 3,00
9 ACEF 1+3+4+5= 13 3,25
10 ADEF 1+3+4+5= 13 3,25
11 BCDE 2+3+3+4= 12 3,00
12 BCDF 2+3+3+5= 13 3,25
13 BCEF 2+3+4+5= 14 3,50
14 BDEF 2+3+4+5= 14 3,50
15 CDEF 3+3+4+5= 15 3,75
Distribución de los promedios muestrales de tamaño 4
Histogram
3,0
2,5
2,0
k : Nº de muestras
Frequency
1,5 de tamaño 4
1,0
= 15
0,5
0,0 Promedios de
2,25 2,50 2,75 3,00 3,25 3,50 3,75
C2 las Muestras
Promedio de los promedios  X 

 X i

45
3
k 15
Varianza de los promedios   X2 

 X i
2
 k  X2

1
k 6
La Distribución de la Media Muestral
La distribución de la media muestral de un conjunto de n datos que se

toman de una población con media  y desviación estándar  tendrá:
1. Una media igual a la media de la población.

2. Una varianza más pequeña que la de la población
x
x 
n
3. Está distribuida normalmente cuando la población paterna está
distribuida normalmente. O estará distribuida normalmente para
muestras de tamaño 30 o más cuando la población paterna no
está distribuida normalmente.
Intervalos de confianza
¿Porqué preocuparse de los intervalos de confianza?
Las estadísticas muestrales tales como el promedio y la desviación

estándar son solamente estimaciones de  y  poblacional y están
basados solamente en una muestra.
Puesto que, en estas estimaciones existe variabilidad de muestra a
muestra, se puede cuantificar la incerteza usando Intervalos de
Confianza basados en estadísticas muestrales.
Los Intervalos de Confianza reflejan la variación de muestra a
muestra de nuestros puntos de estimación.
Si por ejemplo, se calculan Intervalos de Confianza (IC) del 95%,
éstos se interpretan como tal;
Aproximadamente 95 de 100 IC (intervalos de confianza)
contendrán el parámetro de la población, o
Se está 95% cierto que el parámetro de la población está
contenido en el intervalo.
Intervalos de confianza para la media 
1
 2  2
X

Media poblacional
Límite de confianza inferior Límite de confianza superior
Intervalos de confianza para la media 
Basados en una muestra de tamaño n
s s
Pr( X - t/2, n -1    X + t /2, n -1 )  1
n n
t ( n 1)
1
 t 2 ,( n  1 ) t 2 ,( n  1 )
Estadísticas > Estadística Básica > Resumen Gráfico
Rechazo.MTW
En un intervalo de confianza para la media poblacional de la
forma
s s
X - t /2, n -1    X + t /2, n -1
n n
s
 Error estándar (SE)
n
s
t /2, n -1  Error de estimación
n
s X s
X - t /2, n -1 X + t /2, n -1
n n
Determinación del tamaño de muestra
El tamaño de muestra necesario para estimar la media

poblacional con un error de estimación no superior a d0 y
una confianza de (1   )%. Está dado por
2
 z(1 2 ) 
n     S 2
 d0 
En el caso de los tiempos de limpieza de bordes, el error de estimación en
el intervalo para el tiempo medio está dado por
d  4.8255  4.5928  0.233
¿Cuál debe ser el tamaño de muestra para estimar el tiempo

medio de limpieza de bordes con un 95% de confianza y un error
de estimación no superior a d0 = 0. 1?
Estadísticas > Potencia y tamaño de muestra
> z de 1 muestra
Tamaño Potencia
de la del Potencia
Diferencia muestra objetivo real
0,1 334 0,5 0,500757
Intervalos de confianza para la desviación estándar
( n  1) S 2
( n  1) S 2
Pr( X
  X
)  1
 2
( n 1,1   2 )  2
( n 1, 2 )

0.12
2
0.1 ( n1)
0.08
0.06
1 
0.04
0.02  2  2
0
0
(2n1, 52) 10
2
15
(n1,1 2)
20 25 30
Estadísticas > Estadística Básica > Resumen Gráfico
Tamaño de muestra para la media
Poblaciones finitas
Ahora bien, suponga que la población está dividida en una

colección finita de items (unidades muestrales), todos con la
misma probabilidad de ser seleccionadas. Si la
característica de interés X , se mide en estas unidades,
debe tenerse en cuenta el tamaño poblacional para
recalcular el tamaño muestral.
  z(1 2
n
) 2
d0
2
S N : Tamaño poblacional
n
Si  0.05 Entonces se debe recalcular el tamaño
N muestral, que estará dado por n0 donde
n
n0 
n
1
N
n
Si  0.05 El tamaño de muestra será el n calculado
N previamente
Ejemplo
Un área de suelo en estudio, está dividida en 130 cuadrantes
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40 41 42
43 44 45 46 47 48 49 50 51 52 53 54 55
56 57 58 59 60 61 62 63 64 65 66 67
68 69 70 71 72 73 74 75 76 77
78 79 80 81 82 83 84 85 86
87 88 89 90 91 92 93 94
95 96 97 98 99 100 101
102103 104 105 106 107
Un estudio piloto sobre concentración 108109 110 111 112
de un químico en el suelo, en 15 113 114 115 116
cuadrantes elegidos al azar proporcionó 117 118 119 120
una desviación estándar de 12.3 121 122 123 124
125 126 127 128
129 130
¿Cuántos cuadrantes deberían ser elegidos para estimar la
concentración media, con un error de estimación no superior a
2.5 y con una confianza del 95%?
Sample Target
Difference Size Power Actual Power n  93
2,5 93 0,5 0,500095
n 93
  0, 7154  0, 05
N 130
El tamaño de muestra está dado por
n 93
n0    54, 21  55cuadrantes
n 1, 7154
1
N
Pruebas de Hipótesis
Un problema de estimación incluye un parámetro poblacional θ, para
el cual no se tiene una noción preconcebida de su valor
En tales casos, con base en una muestra aleatoria simple se obtiene

una aproximación (estimación) a este valor (puntualmente y por
intervalos de confianza)
Ahora bien, si se tiene una conjetura de su valor, significa que se está

estableciendo una hipótesis respecto del parámetro
Es decir, se está proponiendo una teoría respecto del valor (o los valores)
del parámetro θ
Esta teoría debe ser contrastada con la realidad mediante una muestra
aleatoria simple de la población
Pruebas de Hipótesis
Las pruebas de hipótesis se realizan en todos los ámbitos en los cuales

puede contrastarse la teoría con la realidad
Probar una hipótesis implica tomar una decisión al comparar la muestra

observada respecto de la conjetura para el parámetro poblacional
(realidad)
Una prueba estadística consiste en verificar una hipótesis respecto de

uno o más valores de los parámetros
Es decir, probar su validez indicando (antes de tomar la muestra) qué

grado de evidencia es necesario para no rechazar la conjetura
¿Cuándo es necesario hacer pruebas de hipótesis?
Cuando se desea analizar entradas para determinar si afectan a una
salida dada
Salidas
Entrada A
Entrada B Proceso Productos o servicios
Entrada C
Cuando se desea validar una “mejora” antes de aplicarla
Cuando se tienen dos o más procesos diferentes y se desea averiguar si

producen resultados diferentes entre sí
Se requiere validar las conclusiones obtenidas gráficamente, para gestión

a posteriori
Básicamente, son necesarias en cualquier oportunidad que se

desea tomar decisiones a partir de una muestra. Con criterios
objetivos más que subjetivo (intuiciones)
Hipótesis
En toda prueba estadística participan dos hipótesis o teorías
La hipótesis propuesta por el observador y una negación de esta

hipótesis
La primera, se denomina hipótesis alternativa o hipótesis de

investigación, denotada por HA
La segunda, se denomina hipótesis nula y se denota por H0
El propósito del test de hipótesis es demostrar el fundamento de la

hipótesis alternativa, si tal fundamento se justifica
O decidir si los datos tienden a refutar la hipótesis nula
Lineamientos para hacer un test de hipótesis
1. Si se pone a prueba una hipótesis sobre el valor de un parámetro

θ, la declaración de igualdad siempre se incluye en H0
2. Lo que se detecte o sustente es la hipótesis alternativa
3. La hipótesis de investigación es HA, de modo que se espera que
los datos lleven a rechazar H0 y en consecuencia aceptar HA
Elementos esenciales de un test de hipótesis
La hipótesis nula H0
La hipótesis alternativa HA
El estadístico de la prueba de H0
La región de rechazo de H0
Planteamiento de hipótesis
Hipótesis nulas
H 0 : q = q0 (conocido) H 0 : q1 = q2
Hipótesis alternativas
H 0 : q ¹ q0 (bilateral ) H 0 : q1 ¹ q2 (bilateral )
H 0 : q > q0 (unilateral ) H 0 : q1 > q2 (unilateral )
H 0 : q < q0 (unilateral ) H 0 : q1 < q2 (unilateral )
Comparar con un estándar Comparar dos poblaciones
Errores en pruebas de hipótesis
Los tests de hipótesis están basados en los datos muestrales (pruebas)
para obtener una conclusión sobre los parámetros poblacionales
verdaderos (estados de naturaleza)
Por lo tanto, en los tests de hipótesis existen riesgos de llegar a conclusiones

erróneas
Riesgo 1: Rechazar H0, siendo cierta
  P(Re chazar H 0 / H 0 verdadera)  error de tipo I
α se debe establecer antes de capturar los datos
Riesgo 2: No rechazar H0, siendo falsa

  P( No rechazar H 0 / H 0 falsa )  error de tipo II
Muestra / Pruebas
(Decisión)
NO RECHAZAR Ho RECHAZAR Ho
Población / Realidad
Error tipo I
Ho Decisión a
VERDAD
VERDADERA correcta
Riesgo del productor
Ho Error tipo II
Decisión
FALSA b
correcta
Riesgo del consumidor
El error de tipo I; α define un límite de decisión c (valor crítico)
para rechazar H0
β depende de α y de los valores que realmente tienen los parámetros

El error de tipo I (α), se denomina nivel de significación
El valor crítico (límite de decisión) define una región de rechazo de la

hipótesis nula
En el caso del gráfico, se rechazará H0 con nivel de significación α,

si el estadístico de prueba de H0 es mayor o igual al valor c
No olvidar que α y por lo tanto el valor c se determinan antes de tener

los datos, lo que evita el manipular los resultados para adaptarlos a
necesidades particulares
Potencia de la prueba de hipótesis
La potencia del test es la probabilidad de rechazar correctamente

la hipótesis nula, es decir es
1- b
El error de tipo II y la potencia del test dependen de la hipótesis

alternativa
Por lo tanto, de la magnitud de la diferencia entre el valor del parámetro

en la hipótesis nula y el valor del parámetro en la hipótesis alternativa
Matriz de cuatro bloques
¿Cuáles son las pocas X vitales que deben pasar a la etapa Mejorar?
¿Qué entradas (las x) son estadísticamente significativas y deberían
mejorarse?
¿ Qué entradas (las x) son prácticamente significativas y contribuirán al
beneficio ($)?
Salidas Y
Cualitativas/
Continuas
Categorizadas
Regresión Lineal
Regresión
Continuas Regresión no
Entradas X
Logística
lineal
Comparaciones Comparaciones
Cualitativas/ de medias, de proporciones.
Categorizadas medianas, Pruebas chi-
varianzas, DOE cuadrado
Test de hipótesis sobre la media poblacional μ
Hipótesis
Hip. nula H0 : m = m0
Hip. Alt HA : m ¹ m0
Hip. Alt1 HA : m > m0
Hip. Alt2 HA : m <m0
Comparar la media poblacional con un estándar
Test - t de una muestra
Supuestos
1. Muestra aleatoria simple

2. Datos con distribución normal
x1 , x2 ,, xn m.a.s. de la población
Estadístico de prueba de H0
( X - m0 ) n
t0 =  t ( n -1 )
S
H 0 : m = m0 vs H A : m ¹ m0
t ( n 1)
1
a 2 a 2
-t(n-1;1-a 2) t( n-1;1-a 2)
Rechazar H0 si
( X - m0 ) n ( X - m0 ) n
t0 = £ -t( n-1;1-a 2 ) O si, t0 = ³ t( n-1;1-a 2 )
S S
Rechazar H0 si
p  valor  
p  valor  Pr ob(t( n 1)  t0 )  Pr ob(t( n 1)  t0 )

H 0 : m = m0 vs H A : m > m0
t ( n  1)
a
t( n-1;1-a )
Rechazar H0 si ( X - m0 ) n
t0 = ³ t ( n -1;1- a )
S
Rechazar H0 si
p  valor  
p  valor  Pr ob(t( n 1)  t0 )

H 0 : m = m0 vs H A : m < m0
t ( n 1)
a
-t(n-1;1-a)
Rechazar H0 si
( X - m0 ) n
t0 = £ - t ( n -1;1- a 2 )
S
Rechazar H0 si
p  valor  
p  valor  Pr ob(t( n 1)  t0 )
EJEMPLO
Se enviaron a 14 laboratorios soluciones estandarizadas que se
prepararon con un contenido de oxígeno disuelto de 1.2 mg/L. Se
solicitó a los laboratorios que midieran la concentración de oxígeno
disuelto usando el método de titulación de Winkler. Las
concentraciones reportadas por los laboratorios en mg/L están en el
archivo OD.MTW.
¿En promedio miden los laboratorios 1.2 mg/L, o existe algún sesgo?.
H 0 :   1.2
v/s
H A :   1.2
Los datos satisfacen los supuestos de m.a.s. de una distribución normal
Estadísticas > Estadística Básica > t de 1 Muestra
OD.MTW
Seleccionar la
hipótesis alternativa
x  0
T s/ n
1,2
Prueba de mu = 1,2 vs. no = 1,2
 1,3643
0,2453
14
Error
estándar
de la
Variable N Media Desv.Est. media IC de 95% T P
OD 14 1,3643 0,2453 0,0656 (1,2227. 1,5059) 2,51 0,026
Es improbable que la diferencia

entre las concentraciones promedio
y el estándar sea por casualidad.
Se rechaza la hipótesis nula
Es decir, el estimador de la concentración media es mayor (dif. > 0) que el

estándar de 1,2 por una cantidad que no puede atribuirse al error experimental.
Por lo tanto existe error de sesgo para explicar tal diferencia.
Caso de muestras pareadas (dependientes)
Test t - pareado
En general el test t-pareado para comparar A y B se utiliza

cuando los resultados se producen en pares que no son
independientes. De modo, que el análisis se basa en el
promedio de las diferencias obtenidas en cada par.
El test-t pareado es el utilizado para verificar si el promedio de las

diferencias entre las concentraciones es diferente de cero.
Pruebas de hipótesis sobre la media de las diferencias con observaciones
pareadas es idéntica a la prueba respecto de una media poblacional, en
donde los valores de xi se reemplazan por diferencias di de dos
observaciones pareadas.
H 0 : d  0 d  Media de las diferencias

pareadas en la población
H A : d  0
H A : d  0
H A : d  0
Muestra de pares; ( xi , yi ) i  1,2,, n
d
t0  Sd
t0 ~ t-student (n - 1)
n
n n n
 di  ( xi  yi )  i
( d  d ) 2
d i 1
 i 1
, Sd  i 1
n n n 1
Estudio Interlaboratorio
El archivo T-pareado.MTW contiene mediciones de oxígeno

disuelto obtenidas en 14 laboratorios. Cada laboratorio realizó
las mediciones usando el método Winkler (titulación) y el método
electrodo. ¿predicen diferentes concentraciones de oxígeno
disuelto los dos métodos?
H 0 :  d  0 vs H A :  d  0
μd= media de las diferencias de los métodos Winkler y electrodo
Los datos satisfacen los supuestos de m.a.s. de una distribución normal
Estadísticas > Estadística Básica > t pareada
T pareada para Winkler - Electrodo
Error
estándar
de la
N Media Desv.Est. media
Winkler 14 1,3929 0,3050 0,0815
Electrodo 14 1,7214 0,3068 0,0820
Diferencia 14 -0,329 0,494 0,132
IC de 95% para la diferencia media:: (-0,614. -0,044)

Prueba t de diferencia media = 0 (vs. no = 0): Valor T = -2,49 Valor P = 0,027
Se rechaza H0 y se concluye que los métodos proporcionan resultados

diferentes. El método electrodo entrega valores mayores que el método
Winkler
Homogeneidad de Varianzas
Para comparar medias de dos poblaciones, se debe verificar
que las varianzas poblacionales son iguales
Hipótesis
H0 :    2
2 2 Estadístico de prueba de H0
1
HA :  2
2 2
S12
F0  2
1
H A : 1   2
2 2
S2
H A : 1   2
2 2
Ejemplo
Balde A Balde B
T Llenado T Llenado
Se registran los tiempos de llenado (en
segundos) para dos tipos diferentes de 22 29
baldes. Pruebe la hipótesis de que las 25 21
varianzas de estas muestras son iguales 24 21
29 26
27 19
23 23
H 0 :  A2   B2 22 11
23 24
21 28
H 0 :  A2   B2 20 20
22 21
23 30
19 17
24 17
20 23
Baldes.MTW
Estadísticas > Estadística Básica > t de 2 muestras
Minitab calcula dos p-value:

• Test – F o Test de Bartlett’s para datos con
distribución normal.
• Test de Levene para cualquier set de datos continuos
Si se puede considerar datos normales usar

Test - F (2 varianzas)
Chequear normalidad para los tiempos de llenado de los baldes
balde A p-value = 0.434; balde B p-value = 0.788
Los dos sets de datos satisfacen el supuesto de m.a.s.
Estadísticas > Estadística Básica > 2 varianzas
datos en
columnas
diferentes
Estadísticas
Variable N Desv.Est. Varianza

Balde A 15 2,658 7,067
Balde B 15 5,057 25,571
Relación de deviaciones estándar = 0,526

Relación de varianzas = 0,276
Intervalos de confianza de 95%
IC para IC para
Distribución relación de relación de
de los datos Desv.Est. varianza
Normal (0,305. 0,907) (0,093. 0,823)
Continuo (0,241. 1,058) (0,058. 1,119)
Pruebas
Estadística
Método GL1 GL2 de prueba Valor P
Prueba F (normal) 14 14 0,28 0,022
Prueba de Levene (cualquiera continua) 1 28 3,67 0,066
Test de hipótesis sobre la diferencia de dos
medias poblacionales μ1 – μ2
Hipótesis
Hip. nula H0 : m1 = m2 H0 : m1 -m2 = 0
Hip. Alt HA : m1 ¹ m2 HA : m1 -m2 ¹ 0
Hip. Alt1 HA : m1 > m2 HA : m1 -m2 > 0
Hip. Alt2 HA : m1 <m2 HA : m1 -m2 <0
Supuestos
Muestras aleatorias independientes
Distribuidas aproximadamente normales
Con varianzas iguales
x1 , x2 , , xn m.a.s. de N ( 1 ,  ) 2
y1 , y2 , , ym m.a.s. de N ( 2 ,  2 )
Independientes
X -Y
t0 =  t( n+m-2)
(n -1) S + (m -1) S
2 2
æ 1 1 ÷ö
X Y çç + ÷
n+m-2 çè n m ÷ø
Ejemplo
Marca A Marca B
Una empresa de camiones desea 4,2 4,4
probar la eficiencia de dos marcas 3,1 3,2
de diesel. Se realizaron 15 pruebas 4,8 4,9
con cada marca de diesel, y se 5,9 5,9
registraron los kilómetros por litro. 5,8 5,8
¿Hay alguna diferencia entre las 6,4 6,5
marcas? 2,2 2,2
4,3 4,5
5,7 5,7
3,3 3,6
H0 : m1 -m2 = 0 HA : m1 -m2 ¹ 0 3,8 3,8
2,7 2,8
2,5 2,6
Diesel.MTW
3,5 3,4
3,7 3,8
Chequear Supuestos
Tests de normalidad:
Marca A: p-value = 0.456

Marca B: p-value = 0.586
Suponer que los datos son normales
Test para igualdad de varianzas
Usar test - F
P-value = 0.974
Suponer igualdad de varianzas
Para varianzas iguales
Hipótesis alternativa
T de dos muestras para Marca A vs. Marca B
Error
estándar
de la
Marca A 15 4,13 1,33 0,34
Marca B 15 4,21 1,32 0,34
Diferencia = mu (Marca A) - mu (Marca B)

Estimado de la diferencia: -0,080
IC de 95% para la diferencia: (-1,073. 0,913)
Prueba T de diferencia = 0 (vs. no =): Valor T = -0,17 Valor P = 0,870 GL = 28
Ambos utilizan Desv.Est. agrupada = 1,3274
No se rechaza H0 no existe evidencia de diferencias en las marcas de

diesel
Comparación de medias, cuando las
varianzas son desiguales
Si se rechaza la hipótesis H0 : 1   2
2 2
El estadístico de prueba de la hipótesis H0 : m1 -m2 = 0
X -Y
t =
'
0
S X2 SY2
+
n m
Tiene una distribución t – student aproximada, con grados de

libertad no necesariamente enteros
Ejemplo
Para el caso de los tiempos de llenados de baldes, se encontró que
existe evidencia de varianzas diferentes. Y se desea comparar los
tiempos medios de llenado en cada balde
Baldes.MTW
Para varianzas
desiguales
Error
estándar
de la
Balde A 15 22,93 2,66 0,69
Balde B 15 22,00 5,06 1,3
Diferencia = mu (Balde A) - mu (Balde B)

Estimado de la diferencia: 0,93
IC de 95% para la diferencia: (-2,13. 4,00)
Prueba T de diferencia = 0 (vs. no =): Valor T = 0,63 Valor
P = 0,534 GL = 21
Los grados de libertad no necesariamente corresponden a un entero. Cuando no

lo es se aproxima al número entero inmediato inferior, con el fin de ser
conservador. A modo de ejemplo
El punto t (10; 0.05) =1.812 es menor que t (11; 0.05) =1.796
Rechazar con una t con 10 g.l., implica rechazar con una t con 11 g.l. Pero no
necesariamente es así en el sentido inverso
ANALISIS DE VARIANZA
El análisis de varianza es útil cuando se desea comparar las

medias de un solo factor en dos o más niveles
¿Existe alguna diferencia ¿Qué pasa si la varianza de la

entre las medias de respuesta respuesta aumenta? ¿Existe una
en los niveles A, B y C ? diferencia entonces?
Análisis de varianza
Hipótesis
H 0 :      ......  
HA: Alguna diferencia existe entre las medias poblacionales
El Análisis de varianza prueba la hipótesis nula H0
Supuestos
– Muestras aleatorias independientes
– Residuos con distribución normal
– Varianzas iguales
Toma de muestras
y ,y , ...... , y m.a.s. de N (  ,  2 )
11 12 1n1 1
y 21 , y 22 , ...... , y 2 n m.a.s. de N (  2 ,  2 )
2

y ,y , ...... , y m.a.s. de N (  , 2 )
k1 k2 kn k k
Independientes
Cálculos previos
k ni ni k
Y..    yij , Yi.   yij , n   ni
i 1 j 1 j 1 i 1
k ni ni
  yij  yij
i 1 j 1 Y.. j 1 Yi.
Y  , Yi  
n n ni ni
Descomposición de la variación total:
Variaciones dentro de
Variación Variaciones
Total = + grupos o debida al
entre grupos ruido experimental
STC = SCE + SCD

Suma Total Suma de Cuadrados Suma de Cuadrados
de Cuadrados entre grupos dentro de grupos
o
Suma de Cuadrados
del Error
Cuando H0 es verdadero, se obtienen 2 estimaciones de la
varianza 2 de la población
CME: Cuadrado medio debido a los grupos (Factor)

- La varianza entre las medias de los factores
CMD: Cuadrado medio debido al error aleatorio.

- Varianza dentro de cada nivel del factor
CME / CMD tiene una distribución F con (k – 1) grados

de libertad en el numerador y (n – k) grados de libertad
en el denominador
Tabla ANOVA
Grados de Cuadrados
Fuente de Variación S. C. F Obs. P
libertad Medios
Factor
SCE k-1 CME CME/CMD Valor-p
(entre grupos)
Error
SCD n-k CMD
(dentro de grupos)
Total STC n-1
k: N° de grupos.
n: N° total de observaciones
F: Estadístico de prueba de H0
P: valor-p
Homogeneidad de Varianzas
Muchos test estadísticos para diferencia entre medias

asumen que las varianzas son iguales.
Se debe verificar si las varianzas son iguales.
El test de homogeneidad de varianzas compara las

varianzas de dos o más muestras.
H 0 :  12   22     k2
Test de Bartlett Test de Levene
Ejemplo
El archivo TurnosGC.MTW contiene registros de %Cu para los meses de
febrero, marzo, abril y mayo. Se desea comparar los porcentaje de cobre medios
entre los meses
 i : Contenido medio de % Cu en mes i
 i2 : Varianza de % Cu en mes i
Se desea probar
H 0 :      3   4
vs
HA: Alguna diferencia existe
Verificación de varianza constante
H 0 :  12   22   32   42
Estadísticas > Anova > Prueba de varianzas iguales
Intervalos de confianza de Bonferroni de 95%
para desviaciones estándar
Mes N Inferior Desv.Est. Superior

feb 163 3,90185 4,44705 5,15540
mar 186 4,09560 4,63092 5,31477
abr 169 3,73440 4,24675 4,90927
may 157 3,36368 3,84269 4,46817
Prueba de Bartlett (distribución normal)

Estadística de prueba = 6,19. valor p = 0,103
Prueba de Levene (cualquier distribución

continua)
Estadística de prueba = 1,69. valor p = 0,168
Héctor Varela V. Varianzas iguales 79

Comparación de medias
Los comandos para el análisis de varianza con Minitab dependen de la

disposición de los datos en la planilla
Datos en una columna y el factor en otra.

Estadísticas > ANOVA > Un solo factor
H 0 : 1   2   3   4
ANOVA unidireccional: % Cu vs. Mes
Fuente GL SC CM F P
Mes 3 1082,0 360,7 19,35 0,000
Error 671 12504,6 18,6
Total 674 13586,6
S = 4,317 R-cuad. = 7,96% R-cuad.(ajustado) = 7,55%
ICs de 95% individuales para la media

basados en Desv.Est. agrupada
Nivel N Media Desv.Est. -----+---------+---------+---------+----
feb 163 37,926 4,447 (----*-----)
mar 186 40,557 4,631 (----*----)
abr 169 37,295 4,247 (-----*----)
may 157 38,952 3,843 (-----*----)
-----+---------+---------+---------+----
37,2 38,4 39,6 40,8
Desv.Est. agrupada = 4,317
Agrupar información utilizando el método de
Tukey
Mes N Media Agrupación

mar 186 40,557 A
may 157 38,952 B
feb 163 37,926 B C
abr 169 37,295 C
Las medias que no comparten una letra son

significativamente diferentes.
Intervalos de confianza simultáneos de Tukey del 95%
Todas las comparaciones de dos a dos entre los niveles de Mes
Nivel de confianza individual = 98,95%
Mes = feb restado de:
Mes Inferior Centro Superior --------+---------+---------+---------+-

mar 1,442 2,631 3,820 (----*---)
abr -1,847 -0,631 0,585 (---*----)
may -0,213 1,026 2,265 (----*----)
--------+---------+---------+---------+-
-2,5 0,0 2,5 5,0
Comparaciones de %Cu medio del mes de febrero con los meses de

marzo abril y mayo
Hay evidencia de diferencia significativa de %Cu medio en los meses
de febrero y marzo
Mes = mar restado de:

abr -4,440 -3,262 -2,085 (----*----)
may -2,806 -1,605 -0,404 (----*---)
--------+---------+---------+---------+-
-2,5 0,0 2,5 5,0
%Cu medio de marzo difiere de %Cu medio de abril y %Cu medio de mayo
Mes = abr restado de:

may 0,429 1,657 2,885 (----*----)
--------+---------+---------+---------+-
-2,5 0,0 2,5 5,0
%Cu medio de abril difiere de %Cu medio de mayo
Chequear residuos
Re siduo  Yij  Yi
Prueba de normalidad de los residuos
Estadísticas > Estadística básica > Prueba de normalidad > Ingresar

columna de residuos
Estadísticas no paramétrica
Los tests de hipótesis desarrollados hasta aquí deben

satisfacer supuestos. Ahora bien, si alguno de los
supuestos no se satisface se debe acudir a los test no
paramétricos o de libre distribución
Los tests no paramétricos son aplicables a pruebas de

hipótesis cuando las distribuciones son no normales
Test de Mann - Whitney
Comparación de las medianas de dos poblaciones

independientes
H 0 : Mediana 1  Mediana 2
x1, x2 ,, xn m.a.s. de población 1
y1, y2 ,, ym m.a.s. de población 2
Independientes
Se ordena la muestra conjunta en magnitud no
decreciente y se asignan rangos de 1 a (n+m)
R1i : Rango del i - ésimo dato ordenado de la muestra 1
R2i : Rango del i - ésimo dato ordenado de la muestra 2
Muestra 1: 2.5, 1.8, 1.9, 2.6, 3.9 (n = 5)

Muestra 2: 3.4, 2.7, 1.5, 3.6, 2.1, 3.7 (m = 6)
Muestra conjunta ordenada:
2 1 1 2 1 1 2 2 2 2 1
1.5 1.8 1.9 2.1 2.5 2.6 2.7 3.4 3.6 3.7 3.9
Rangos 1 2 3 4 5 6 7 8 9 10 11
Para observaciones iguales se promedian los rangos
n
W   R1i (Wilcoxon)
i 1
n ( n  1)
U W  (Mann - Whitney)
2
Uso de
Se rechaza H0 si p  value  
software
estadístico No se rechaza H0 p  value  
Ejemplo
El archivo Stock.MTW registra datos de concentraciones según

dos tipos de stock. El cobre toral (Cut) no satisface los supuestos
de normalidad para comparar las concentraciones medias por el
test-t para muestras independientes
H 0 : Mediana CuStockA = Mediana CuStockB
H A : Mediana CuStockA ¹ Mediana CuStockB
Observar en el archivo que las concentraciones están apiladas, las

que deberán desapilarse para poder desarrollar el test no-paramétrico
de Mann-Whitney
Para desapilar en Minitab
Datos > Desapilar columnas
Stock.MTW
Columnas
no apiladas
Estadísticas > No parametricos > Mann-Whitney
Prueba de Mann-Whitney e IC: Cut_B. Cut_C
N Mediana
Cut_B 79 0,4300
Cut_C 101 0,4900
La estimación del punto para ETA1- ETA2 es - 0,0400

95,0 El porcentaje IC para ETA1-ETA2 es (-0,1000; 0,0200)
W = 6684,5
Prueba de ETA1 = ETA2 vs. ETA1 no es = ETA2 es significativa en 0,1806
La prueba es significativa en 0,1805 (ajustado por empates)
No diferencia significativa
Test de Kruskal - Wallis
Comparar dos o más medianas
H 0 : Med 1  Med 2    Med k
y 11 , y 12 , ...... , y 1 n m.a.s. de Población 1

1
y 21 , y 22 , ...... , y 2 n m.a.s. de Población 2

2

y k1 , y k 2 , ...... , y kn m.a.s. de Población k
k
Se ordena la muestra conjunta y se asignan rangos de 1 a n
k
n   ni
i1
Ri  Suma de los rangos de la muestra (i  ésima )
k R 2
12
K
n( n  1)
 n
i  3( n  1)
i 1 i
K 2
( k 1)
Ejemplo
El archivo Rechazo.MTW registra datos de tiempos de reproceso de

cátodos. Los tiempos de instalación de sellos no satisfacen los
supuestos estándares para comparar tiempos medios por turnos
mediante análisis de varianza
Por el método de Kruskal_Wallis se pueden comparar las medianas.

También se pueden comparar con el método de la Mediana de Mood
H 0 : MedianaTurno1 = MedianaTurno 2 = MedianaTurno 3
H A : A lg una diferencia existe
Para usar la prueba de Kruskal-Wallis en Minitab, los datos se deben

tener apilados en una columna y el factor en otra
Estadísticas > No paramétricos > Kruskal-Wallis
Rechazo.MTW
Prueba de Kruskal-Wallis: Instal_sellos vs. Turno
Prueba de Kruskal-Wallis en Instal_sellos
Clasificación
Turno N Mediana del promedio Z
1 16 0,3550 28,4 -1,02
2 24 0,3500 26,0 -2,16
3 24 0,4750 41,8 3,08
General 64 32,5
H = 9,63 GL = 2 P = 0,008
H = 9,69 GL = 2 P = 0,008 (ajustados para los vínculos)
diferencias significativas
INFERENCIA CON DATOS CUALITATIVOS
Pruebas de Hipótesis respecto de una

proporción poblacional
Hip. nula H0 : p  p0 ( p0 conocido)
Hip. Alt. H A : p  po
Hip. Alt. H A1 : p  p0
Hip. Alt. H A2 : p  p0
x1 , x2  , xn m.a.s.
1 i-ésimo elemento satisface característica C

xi  
0 Si no
n
x i
N º de datos en la muestra que satisface C
pˆ  i 1

n n
Estadístico de prueba de H 0 : p = p0
pˆ  p 0
Z0  ~N ( 0,1)
p 0 (1  p 0 )
n

Ejemplo
Una muestra aleatoria de 500 piezas contiene 65 no conformes.
¿Se puede concluir que la proporción de no conformes es menor
que 0.15?
Estadísticas > Estadística básica > 1 Proporción
H 0 : p = 0.15 H A : p < 0.15

Prueba de p = 0,15 vs. p < 0,15
Límite
Muestra X N Muestra p superior 95% Valor Z Valor P
1 65 500 0,130000 0,154739 -1,25 0,105
Uso de la aproximación normal.
No existe evidencia de que la

65
pˆ = = 0.13 proporción de no conformes es
500 menor que 0.15

Pruebas de Hipótesis sobre la diferencia de dos
proporciones poblacionales
Hipótesis
H0 : p1  p2  H0 : p1  p2  0
H A : p1  p2  H A : p1  p2  0
H A1 : p1  p2  H A2 : p1  p2  0
H A2 : p1  p2  H A2 : p1  p2  0
pˆ1 - pˆ 2 np1  mp 2

Z0 =  N (0,1) p  nm
pˆ (1- pˆ )( 1n + m1 )

Ejemplo
El presidente de una compañía piensa que la proporción de obreros
a favor del control de precios y salarios es mayor que la proporción
de ejecutivos a favor del control. Se toman muestras aleatorias
independientes de 200 obreros y 200 ejecutivos y se encuentran 44
obreros y 34 ejecutivos a favor del control.
Estadísticas > Estadística básica > 2 Proporciones

Muestra X N Muestra p
44
1 44 200 0,220000 pˆ 1 = = 0.22
200
2 34 200 0,170000
34
pˆ 2 = = 0.17
Diferencia = p (1) - p (2) 200
Estimado de la diferencia: 0,05
Límite inferior 95% de la diferencia: -0,0150394
Prueba para la diferencia = 0 vs. > 0: Z = 1,26 Valor P = 0,103
Prueba exacta de Fisher: Valor P = 0,128
No existe evidencia de diferencia

Pruebas chi-cuadrado
Para datos cualitativos o categorizados
1. La muestra debe ser elegida al azar

2. Todas las observaciones deben ser independientes
3. La definición de las categorías debe ser inequívoca
4. El número de frecuencias esperadas por categoría deber ser por
lo menos de 5
5. Si el número de frecuencias/conteos esperados por categoría es

menor que 5:
– aumentar el tamaño de la muestra,
– combinar las categorías, para eliminar las categorías con
frecuencias esperadas < 5
Pruebas de Independencia
¿Existe una asociación/relación entre dos variables por

atributo?
¿Afecta el valor de una variable por atributo al resultado de la
otra?
x1, x2 ,, xn m.a.s.
Se clasifican conjuntamente respecto de dos atributos o caracteres A y B
A con categorías A1, A2,......, Ak

B con categorías B1, B2,......, Bm
H0: Los caracteres A y B son independientes

v/s
HA: Alguna asociación existe entre las variables
Tabla de contingencia
A\B B1 B2 Bj Bm Tota
l
A1 n11 n12 n1j n1m n1·
A2 n21 n22 n2j n2m n2·
Ai ni1 ni2 nij nim ni·
Ak nk1 nk2 nkj nkm nk·

Total n·1 n·2 n·j n·m n
pij = P(AiBj) pi· = P(Ai) p·j = P(Bj)
H0: pij = pi·· p·j

nn
(n  ) i j 2

k m
ij
J  n
0
i 1 j 1
nn i j
n
J0 ~  2
( k 1)( m 1)
Uso de software Se rechaza H si p  value  

0
estadístico
No se rechaza H0 p  value  
Medidas de asociación
Coeficiente de Contingencia de Cramer

J o
n
J
Coeficiente de Contingencia de Pearson
o
J n
o
Frecuencias esperadas menores que 5

Se deben combinar clases
En tablas de contingencia de 2x2 es recomendable utilizar la

prueba exacta de Fisher o test Chi cuadrado con corrección
de Yates.

Ejemplo
Se supone que existe asociación entre el día de la semana de

producción de un artículo y la calidad de este artículo. Se
selecciona una muestra aleatoria de 500 unidades en existencia y
se clasifica según el día de producción y la calidad
Día de producción
Calidad Lunes Martes Miércoles Jueves Viernes
Excelente 44 74 79 72 31
Buena 14 25 27 24 10
Normal 15 20 20 23 9
Deficiente 3 5 5 0 0
H0: El día de la semana de producción del artículo es

independiente de su calidad
HA: Alguna asociación existe

Archivo Independencia.MTW
Estadísticas > Tablas > Prueba Chi Cuadrado (tabla de dos

factores en hoja de trabajo)

Los conteos esperados se imprimen debajo de los conteos observados
Las contribuciones Chi-cuadradas se imprimen debajo de los conteos
esperados
Lunes Martes Miércoles Jueves Viernes Total

1 44 74 79 72 31 300
45,60 74,40 78,60 71,40 30,00
0,056 0,002 0,002 0,005 0,033
2 14 25 27 24 10 100
15,20 24,80 26,20 23,80 10,00
0,095 0,002 0,024 0,002 0,000
3 15 20 20 23 9 87
13,22 21,58 22,79 20,71 8,70
0,239 0,115 0,342 0,254 0,010
4 3 5 5 0 0 13
1,98 3,22 3,41 3,09 1,30
0,531 0,978 0,746 3,094 1,300
Total 76 124 131 119 50 500
Chi-cuadrada = 7,831. GL = 12. Valor P = 0,798 No rechaza H0

5 celdas con conteos esperados menores que 5.
Comparación gráfica de
distribuciones de datos
Comparaciones de Distribuciones de Datos
Son numerosas las aplicaciones en las que se tienen dos conjuntos

de datos y el objetivo de estudio es comparar las distribuciones de
los dos grupos
Probablemente la comparación más simple es determinar si un

valor típico de un grupo está por encima o por debajo del valor
típico del otro
Los métodos gráficos pueden ser utilizados para comparar

distribuciones

Función de Distribución Empírica
x1 , x2 ,, xn m.a.s. de una población
Se ordenan los datos en magnitud no decreciente, denotados por
x(1)  x(2)  x(3)    x( n 1)  x( n )
La función de distribución empírica de la muestra está definida en

términos de la muestra ordenada
0 si t  x(1)
i

F( n ) (t )   si x( i )  t  x( i 1)
n
1 si x( n )  t
Ejemplo
La siguiente muestra de 10 observaciones
5,2 3,5 8,6 6,8 9,2 12,7 6,5 4,7 11,8 9,7
proporciona la gráfica de la distribución empírica F10 de la

muestra
Distribución Empírica
1,0
0,9
0,8
0,7
F10 (9.699) = 0.7

Probability
0,6
0,5
0,4
0,3 F10 (9.7) = 0.8
0,2
0,1
0,0
F10 (11.7) = 0.8
3,5
4,7
5,2
6,5
6,8
8,6
9,2
9,7
11,8
12,7
C1

Minitab 15 permite comparar las distribuciones empíricas de dos
conjuntos de datos. No obstante, el método no paramétrico de
Kolmogorov – Smirnov prueba la hipótesis nula de que las
distribuciones de las poblaciones de donde provienen las muestras son
iguales
x1 , x2 ,  , xn m.a.s. de tamaño n de población 1
con distribución empírica Fn
y1 , y2 ,  , ym m.a.s. de tamaño m de población 2
con distribución empírica Fm

Ejemplo
El archivo Tonelaje.MTW contiene registros de Peso del mineral que se
registra cada 5 minutos en la correa Alim MSAG antes y después de
una acción de mejora.
Gráfica > CDF Empírica

4400 5200
Percentil 20 (antes) = 4400 tons Percentil 20 (después) = 5200 tons
Percentil 70 (antes) = 5520 tons Percentil 70 (después) = 5720 tons

Estadística Inferencial

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística Inferencial

Cargado por

Copyright:

Formatos disponibles

Estadística Inferencial

Muestra aleatoria simple: Subconjunto de una población

Objetivo: Realizar inferencias con respecto a la población

Propiedades deseables en un estimador

• Insesgado (sin sesgo).

Si el estimador es insesgado entonces existe exactitud

Si la varianza del estimador es pequeña entonces existe

Muestra aleatoria simple x1 , x 2 , ... , x n

Las estadísticas de muestras se aproximan a los parámetros

1 i-ésimo elemento satisface característica C

Muestra elementos suma Xi

Promedio de los promedios  X 

Varianza de los promedios  2  i

Promedio de los promedios  X 

Varianza de los promedios   X2 

La distribución de la media muestral de un conjunto de n datos que se

1. Una media igual a la media de la población.

Las estadísticas muestrales tales como el promedio y la desviación

Límite de confianza inferior Límite de confianza superior

El tamaño de muestra necesario para estimar la media

d  4.8255  4.5928  0.233

¿Cuál debe ser el tamaño de muestra para estimar el tiempo

Ahora bien, suponga que la población está dividida en una

El tamaño de muestra está dado por

En tales casos, con base en una muestra aleatoria simple se obtiene

Ahora bien, si se tiene una conjetura de su valor, significa que se está

Las pruebas de hipótesis se realizan en todos los ámbitos en los cuales

Probar una hipótesis implica tomar una decisión al comparar la muestra

Una prueba estadística consiste en verificar una hipótesis respecto de

Es decir, probar su validez indicando (antes de tomar la muestra) qué

Cuando se desea validar una “mejora” antes de aplicarla

Cuando se tienen dos o más procesos diferentes y se desea averiguar si

Se requiere validar las conclusiones obtenidas gráficamente, para gestión

Básicamente, son necesarias en cualquier oportunidad que se

En toda prueba estadística participan dos hipótesis o teorías

La hipótesis propuesta por el observador y una negación de esta

La primera, se denomina hipótesis alternativa o hipótesis de

La segunda, se denomina hipótesis nula y se denota por H0

El propósito del test de hipótesis es demostrar el fundamento de la

O decidir si los datos tienden a refutar la hipótesis nula

1. Si se pone a prueba una hipótesis sobre el valor de un parámetro

Elementos esenciales de un test de hipótesis

H 0 : q > q0 (unilateral ) H 0 : q1 > q2 (unilateral )

H 0 : q < q0 (unilateral ) H 0 : q1 < q2 (unilateral )

Comparar con un estándar Comparar dos poblaciones

Por lo tanto, en los tests de hipótesis existen riesgos de llegar a conclusiones

Riesgo 1: Rechazar H0, siendo cierta

  P(Re chazar H 0 / H 0 verdadera)  error de tipo I

α se debe establecer antes de capturar los datos

Riesgo 2: No rechazar H0, siendo falsa

β depende de α y de los valores que realmente tienen los parámetros

El valor crítico (límite de decisión) define una región de rechazo de la

En el caso del gráfico, se rechazará H0 con nivel de significación α,

No olvidar que α y por lo tanto el valor c se determinan antes de tener

La potencia del test es la probabilidad de rechazar correctamente

El error de tipo II y la potencia del test dependen de la hipótesis

Por lo tanto, de la magnitud de la diferencia entre el valor del parámetro

Comparar la media poblacional con un estándar

Test - t de una muestra

1. Muestra aleatoria simple

x1 , x2 ,, xn m.a.s. de la población

p  valor  Pr ob(t( n 1)  t0 )  Pr ob(t( n 1)  t0 )

p  valor  Pr ob(t( n 1)  t0 )