Está en la página 1de 122

Estadística Inferencial

Héctor Varela V.
Población: Colección completa de valoraciones de una
característica de interés en un conjunto de individuos o elementos.

Muestra aleatoria simple: Subconjunto de una población


seleccionado al azar.

Población
completa
Muestra
(subconjunto)

Objetivo: Realizar inferencias con respecto a la población


basándose en la información contenida en una muestra.
Héctor Varela V. 2
Parámetros poblacionales

Media : 

Varianza :  

Desv. Est. : 

Proporción : p

Héctor Varela V. 3
Un estimador de un parámetro poblacional es una
función de los datos que conforman una muestra
aleatoria simple.

Propiedades deseables en un estimador

• Insesgado (sin sesgo).


• De varianza mínima.
• Consistente (a medida que aumenta el tamaño de muestra el estimador
se aproxima cada vez más al parámetro).

Si el estimador es insesgado entonces existe exactitud


en la estimación.

Si la varianza del estimador es pequeña entonces existe


precisión en la estimación.

Héctor Varela V. 4
Estimadores puntuales

Muestra aleatoria simple x1 , x 2 , ... , x n

̂  X
n 2
 (x  X )
i
ˆ  S 
 2 i  1
n 1
ˆ  S  S 2

Las estadísticas de muestras se aproximan a los parámetros


poblacionales

Héctor Varela V. 5
Población v/s Muestra

POBLACION MUESTRA

10

F re q uenc y
5

80 85 90 95

 X

2 S X2

 SX

Héctor Varela V. 6
Estimación puntual de la proporción poblacional

x1 , x2 ,, xn m.a.s. C
c

C p = Pr ob(C )
Datos dicotómicos

1 i-ésimo elemento satisface característica C


xi  
0 Si no

n
 xi
pˆ  i 1  N  de datos en la muestra que satisface C
n n

Héctor Varela V. 7
Considerar una población de tamaño N  6

Elemento Característica X
A 1
B 2
C 3
D 3
E 4
F 5

18 5
  3   2
6 3

Héctor Varela V. 8
Muestras de Tamaño 2

Muestra elementos suma Xi


1 AB 1+2= 3 1,5
2 AC 1+3= 4 2,0
3 AD 1+3= 4 2,0
4 AE 1+4= 5 2,5
5 AF 1+5= 6 3,0
6 BC 2+3= 5 2,5
7 BD 2+3= 5 2,5
8 BE 2+4= 6 3,0
9 BF 2+5= 7 3,5
10 CD 3+3= 6 3,0
11 CE 3+4= 7 3,5
12 CF 3+5= 8 4,0
13 DE 3+4= 7 3,5
14 DF 3+5= 8 4,0
15 EF 4+5= 9 4,5

Héctor Varela V. 9
Distribución de los promedios muestrales de tamaño 2

Histogram of C1

3,0 k : Nº de muestras
2,5
de tamaño 2
2,0
N
Frequency

1,5
k     15
n
1,0

0,5

0,0
1,5 2,0 2,5 3,0 3,5 4,0 4,5
C1
Promedio es un estimador
insesgado de μ

Promedio de los promedios  X 


 X i

45
3
k 15

Varianza de los promedios  2  i


X 2
 k  2
X

2
X
k 3
Héctor Varela V. 10
Muestras de Tamaño 4
Muestra elementos suma Xi
1 ABCD 1+2+3+3= 9 2,25
2 ABCE 1+2+3+4= 10 2,50
3 ABCF 1+2+3+5= 11 2,75
4 ABDE 1+2+3+4= 10 2,50
5 ABDF 1+2+3+5= 11 2,75
6 ABEF 1+2+4+5= 12 3,00
7 ACDE 1+3+3+4= 11 2,75
8 ACDF 1+3+3+5= 12 3,00
9 ACEF 1+3+4+5= 13 3,25
10 ADEF 1+3+4+5= 13 3,25
11 BCDE 2+3+3+4= 12 3,00
12 BCDF 2+3+3+5= 13 3,25
13 BCEF 2+3+4+5= 14 3,50
14 BDEF 2+3+4+5= 14 3,50
15 CDEF 3+3+4+5= 15 3,75

Héctor Varela V. 11
Distribución de los promedios muestrales de tamaño 4
Histogram

3,0

2,5

2,0
k : Nº de muestras
Frequency

1,5 de tamaño 4
1,0
= 15
0,5

0,0 Promedios de
2,25 2,50 2,75 3,00 3,25 3,50 3,75
C2 las Muestras

Promedio de los promedios  X 


 X i

45
3
k 15

Varianza de los promedios   X2 


 X i
2
 k  X2

1
k 6

Héctor Varela V. 12
La Distribución de la Media Muestral

La distribución de la media muestral de un conjunto de n datos que se


toman de una población con media  y desviación estándar  tendrá:

1. Una media igual a la media de la población.


2. Una varianza más pequeña que la de la población

x
x 
n
3. Está distribuida normalmente cuando la población paterna está
distribuida normalmente. O estará distribuida normalmente para
muestras de tamaño 30 o más cuando la población paterna no
está distribuida normalmente.

Héctor Varela V. 13
Intervalos de confianza
¿Porqué preocuparse de los intervalos de confianza?

Las estadísticas muestrales tales como el promedio y la desviación


estándar son solamente estimaciones de  y  poblacional y están
basados solamente en una muestra.
Puesto que, en estas estimaciones existe variabilidad de muestra a
muestra, se puede cuantificar la incerteza usando Intervalos de
Confianza basados en estadísticas muestrales.
Los Intervalos de Confianza reflejan la variación de muestra a
muestra de nuestros puntos de estimación.
Si por ejemplo, se calculan Intervalos de Confianza (IC) del 95%,
éstos se interpretan como tal;
Aproximadamente 95 de 100 IC (intervalos de confianza)
contendrán el parámetro de la población, o
Se está 95% cierto que el parámetro de la población está
contenido en el intervalo.

Héctor Varela V. 14
Intervalos de confianza para la media 
1

 2  2

X

Media poblacional

Límite de confianza inferior Límite de confianza superior

Héctor Varela V. 15
Intervalos de confianza para la media 
Basados en una muestra de tamaño n

s s
Pr( X - t/2, n -1    X + t /2, n -1 )  1
n n

t ( n 1)

1

 t 2 ,( n  1 ) t 2 ,( n  1 )

Héctor Varela V. 16
Estadísticas > Estadística Básica > Resumen Gráfico
Rechazo.MTW

Héctor Varela V. 17
En un intervalo de confianza para la media poblacional de la
forma
s s
X - t /2, n -1    X + t /2, n -1
n n
s
 Error estándar (SE)
n
s
t /2, n -1  Error de estimación
n

s X s
X - t /2, n -1 X + t /2, n -1
n n
Héctor Varela V. 18
Determinación del tamaño de muestra

El tamaño de muestra necesario para estimar la media


poblacional con un error de estimación no superior a d0 y
una confianza de (1   )%. Está dado por

2
 z(1 2 ) 
n     S 2

 d0 

Héctor Varela V. 19
En el caso de los tiempos de limpieza de bordes, el error de estimación en
el intervalo para el tiempo medio está dado por

d  4.8255  4.5928  0.233

¿Cuál debe ser el tamaño de muestra para estimar el tiempo


medio de limpieza de bordes con un 95% de confianza y un error
de estimación no superior a d0 = 0. 1?

Héctor Varela V. 20
Estadísticas > Potencia y tamaño de muestra
> z de 1 muestra

Tamaño Potencia
de la del Potencia
Diferencia muestra objetivo real
0,1 334 0,5 0,500757

Héctor Varela V. 21
Intervalos de confianza para la desviación estándar

( n  1) S 2
( n  1) S 2
Pr( X
  X
)  1
 2
( n 1,1   2 )  2
( n 1, 2 )


0.12
2
0.1 ( n1)
0.08
0.06

1 
0.04
0.02  2  2
0
0
(2n1, 52) 10
2
15
(n1,1 2)
20 25 30

Héctor Varela V. 22
Estadísticas > Estadística Básica > Resumen Gráfico

Héctor Varela V. 23
Tamaño de muestra para la media
Poblaciones finitas

Ahora bien, suponga que la población está dividida en una


colección finita de items (unidades muestrales), todos con la
misma probabilidad de ser seleccionadas. Si la
característica de interés X , se mide en estas unidades,
debe tenerse en cuenta el tamaño poblacional para
recalcular el tamaño muestral.

Héctor Varela V. 24
  z(1 2
n
) 2
d0
2
S N : Tamaño poblacional

n
Si  0.05 Entonces se debe recalcular el tamaño
N muestral, que estará dado por n0 donde

n
n0 
n
1
N

n
Si  0.05 El tamaño de muestra será el n calculado
N previamente

Héctor Varela V. 25
Ejemplo
Un área de suelo en estudio, está dividida en 130 cuadrantes
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40 41 42
43 44 45 46 47 48 49 50 51 52 53 54 55
56 57 58 59 60 61 62 63 64 65 66 67
68 69 70 71 72 73 74 75 76 77
78 79 80 81 82 83 84 85 86
87 88 89 90 91 92 93 94
95 96 97 98 99 100 101
102103 104 105 106 107
Un estudio piloto sobre concentración 108109 110 111 112
de un químico en el suelo, en 15 113 114 115 116
cuadrantes elegidos al azar proporcionó 117 118 119 120
una desviación estándar de 12.3 121 122 123 124
125 126 127 128
129 130
Héctor Varela V. 26
¿Cuántos cuadrantes deberían ser elegidos para estimar la
concentración media, con un error de estimación no superior a
2.5 y con una confianza del 95%?

Sample Target
Difference Size Power Actual Power n  93
2,5 93 0,5 0,500095

n 93
  0, 7154  0, 05
N 130

El tamaño de muestra está dado por

n 93
n0    54, 21  55cuadrantes
n 1, 7154
1
N
Héctor Varela V. 27
Pruebas de Hipótesis
Un problema de estimación incluye un parámetro poblacional θ, para
el cual no se tiene una noción preconcebida de su valor

En tales casos, con base en una muestra aleatoria simple se obtiene


una aproximación (estimación) a este valor (puntualmente y por
intervalos de confianza)

Ahora bien, si se tiene una conjetura de su valor, significa que se está


estableciendo una hipótesis respecto del parámetro

Es decir, se está proponiendo una teoría respecto del valor (o los valores)
del parámetro θ

Esta teoría debe ser contrastada con la realidad mediante una muestra
aleatoria simple de la población

Héctor Varela V. 28
Pruebas de Hipótesis

Las pruebas de hipótesis se realizan en todos los ámbitos en los cuales


puede contrastarse la teoría con la realidad

Probar una hipótesis implica tomar una decisión al comparar la muestra


observada respecto de la conjetura para el parámetro poblacional
(realidad)

Una prueba estadística consiste en verificar una hipótesis respecto de


uno o más valores de los parámetros

Es decir, probar su validez indicando (antes de tomar la muestra) qué


grado de evidencia es necesario para no rechazar la conjetura

Héctor Varela V. 29
¿Cuándo es necesario hacer pruebas de hipótesis?
Cuando se desea analizar entradas para determinar si afectan a una
salida dada
Salidas
Entrada A
Entrada B Proceso Productos o servicios
Entrada C

Cuando se desea validar una “mejora” antes de aplicarla

Cuando se tienen dos o más procesos diferentes y se desea averiguar si


producen resultados diferentes entre sí

Se requiere validar las conclusiones obtenidas gráficamente, para gestión


a posteriori

Básicamente, son necesarias en cualquier oportunidad que se


desea tomar decisiones a partir de una muestra. Con criterios
objetivos más que subjetivo (intuiciones)

Héctor Varela V. 30
Hipótesis

En toda prueba estadística participan dos hipótesis o teorías

La hipótesis propuesta por el observador y una negación de esta


hipótesis

La primera, se denomina hipótesis alternativa o hipótesis de


investigación, denotada por HA

La segunda, se denomina hipótesis nula y se denota por H0

El propósito del test de hipótesis es demostrar el fundamento de la


hipótesis alternativa, si tal fundamento se justifica

O decidir si los datos tienden a refutar la hipótesis nula

Héctor Varela V. 31
Lineamientos para hacer un test de hipótesis

1. Si se pone a prueba una hipótesis sobre el valor de un parámetro


θ, la declaración de igualdad siempre se incluye en H0
2. Lo que se detecte o sustente es la hipótesis alternativa
3. La hipótesis de investigación es HA, de modo que se espera que
los datos lleven a rechazar H0 y en consecuencia aceptar HA

Elementos esenciales de un test de hipótesis

La hipótesis nula H0
La hipótesis alternativa HA
El estadístico de la prueba de H0
La región de rechazo de H0

Héctor Varela V. 32
Planteamiento de hipótesis

Hipótesis nulas

H 0 : q = q0 (conocido) H 0 : q1 = q2

Hipótesis alternativas

H 0 : q ¹ q0 (bilateral ) H 0 : q1 ¹ q2 (bilateral )

H 0 : q > q0 (unilateral ) H 0 : q1 > q2 (unilateral )

H 0 : q < q0 (unilateral ) H 0 : q1 < q2 (unilateral )

Comparar con un estándar Comparar dos poblaciones

Héctor Varela V. 33
Errores en pruebas de hipótesis
Los tests de hipótesis están basados en los datos muestrales (pruebas)
para obtener una conclusión sobre los parámetros poblacionales
verdaderos (estados de naturaleza)

Por lo tanto, en los tests de hipótesis existen riesgos de llegar a conclusiones


erróneas

Riesgo 1: Rechazar H0, siendo cierta

  P(Re chazar H 0 / H 0 verdadera)  error de tipo I

α se debe establecer antes de capturar los datos

Riesgo 2: No rechazar H0, siendo falsa


  P( No rechazar H 0 / H 0 falsa )  error de tipo II
Héctor Varela V. 34
Muestra / Pruebas
(Decisión)

NO RECHAZAR Ho RECHAZAR Ho
Población / Realidad

Error tipo I
Ho Decisión a
VERDAD

VERDADERA correcta
Riesgo del productor

Ho Error tipo II
Decisión
FALSA b
correcta
Riesgo del consumidor

Héctor Varela V. 35
El error de tipo I; α define un límite de decisión c (valor crítico)
para rechazar H0

β depende de α y de los valores que realmente tienen los parámetros


Héctor Varela V. 36
El error de tipo I (α), se denomina nivel de significación

El valor crítico (límite de decisión) define una región de rechazo de la


hipótesis nula

En el caso del gráfico, se rechazará H0 con nivel de significación α,


si el estadístico de prueba de H0 es mayor o igual al valor c

No olvidar que α y por lo tanto el valor c se determinan antes de tener


los datos, lo que evita el manipular los resultados para adaptarlos a
necesidades particulares

Héctor Varela V. 37
Potencia de la prueba de hipótesis

La potencia del test es la probabilidad de rechazar correctamente


la hipótesis nula, es decir es

1- b

El error de tipo II y la potencia del test dependen de la hipótesis


alternativa

Por lo tanto, de la magnitud de la diferencia entre el valor del parámetro


en la hipótesis nula y el valor del parámetro en la hipótesis alternativa

Héctor Varela V. 38
Matriz de cuatro bloques
¿Cuáles son las pocas X vitales que deben pasar a la etapa Mejorar?
¿Qué entradas (las x) son estadísticamente significativas y deberían
mejorarse?
¿ Qué entradas (las x) son prácticamente significativas y contribuirán al
beneficio ($)?

Salidas Y
Cualitativas/
Continuas
Categorizadas

Regresión Lineal
Regresión
Continuas Regresión no
Entradas X

Logística
lineal

Comparaciones Comparaciones
Cualitativas/ de medias, de proporciones.
Categorizadas medianas, Pruebas chi-
varianzas, DOE cuadrado

Héctor Varela V. 39
Test de hipótesis sobre la media poblacional μ

Hipótesis
Hip. nula H0 : m = m0
Hip. Alt HA : m ¹ m0
Hip. Alt1 HA : m > m0
Hip. Alt2 HA : m <m0

Comparar la media poblacional con un estándar

Test - t de una muestra

Héctor Varela V. 40
Test - t de una muestra
Supuestos

1. Muestra aleatoria simple


2. Datos con distribución normal

x1 , x2 ,, xn m.a.s. de la población

Estadístico de prueba de H0

( X - m0 ) n
t0 =  t ( n -1 )
S

Héctor Varela V. 41
Test - t de una muestra
H 0 : m = m0 vs H A : m ¹ m0

t ( n 1)

1
a 2 a 2

-t(n-1;1-a 2) t( n-1;1-a 2)
Rechazar H0 si

( X - m0 ) n ( X - m0 ) n
t0 = £ -t( n-1;1-a 2 ) O si, t0 = ³ t( n-1;1-a 2 )
S S

Rechazar H0 si
p  valor  

p  valor  Pr ob(t( n 1)  t0 )  Pr ob(t( n 1)  t0 )


Héctor Varela V. 42
Test - t de una muestra
H 0 : m = m0 vs H A : m > m0

t ( n  1)

a
t( n-1;1-a )

Rechazar H0 si ( X - m0 ) n
t0 = ³ t ( n -1;1- a )
S
Rechazar H0 si
p  valor  

p  valor  Pr ob(t( n 1)  t0 )


Héctor Varela V. 43
Test - t de una muestra
H 0 : m = m0 vs H A : m < m0

t ( n 1)

a
-t(n-1;1-a)
Rechazar H0 si
( X - m0 ) n
t0 = £ - t ( n -1;1- a 2 )
S
Rechazar H0 si
p  valor  
p  valor  Pr ob(t( n 1)  t0 )
Héctor Varela V. 44
EJEMPLO
Se enviaron a 14 laboratorios soluciones estandarizadas que se
prepararon con un contenido de oxígeno disuelto de 1.2 mg/L. Se
solicitó a los laboratorios que midieran la concentración de oxígeno
disuelto usando el método de titulación de Winkler. Las
concentraciones reportadas por los laboratorios en mg/L están en el
archivo OD.MTW.
¿En promedio miden los laboratorios 1.2 mg/L, o existe algún sesgo?.

H 0 :   1.2
v/s

H A :   1.2

Héctor Varela V. 45
Los datos satisfacen los supuestos de m.a.s. de una distribución normal

Estadísticas > Estadística Básica > t de 1 Muestra

OD.MTW

Seleccionar la
hipótesis alternativa

Héctor Varela V. 46
x  0
T s/ n
1,2
Prueba de mu = 1,2 vs. no = 1,2
 1,3643
0,2453
14
Error
estándar
de la
Variable N Media Desv.Est. media IC de 95% T P
OD 14 1,3643 0,2453 0,0656 (1,2227. 1,5059) 2,51 0,026

Es improbable que la diferencia


entre las concentraciones promedio
y el estándar sea por casualidad.

Se rechaza la hipótesis nula

Es decir, el estimador de la concentración media es mayor (dif. > 0) que el


estándar de 1,2 por una cantidad que no puede atribuirse al error experimental.
Por lo tanto existe error de sesgo para explicar tal diferencia.

Héctor Varela V. 47
Caso de muestras pareadas (dependientes)
Test t - pareado

En general el test t-pareado para comparar A y B se utiliza


cuando los resultados se producen en pares que no son
independientes. De modo, que el análisis se basa en el
promedio de las diferencias obtenidas en cada par.

El test-t pareado es el utilizado para verificar si el promedio de las


diferencias entre las concentraciones es diferente de cero.

Héctor Varela V. 48
Pruebas de hipótesis sobre la media de las diferencias con observaciones
pareadas es idéntica a la prueba respecto de una media poblacional, en
donde los valores de xi se reemplazan por diferencias di de dos
observaciones pareadas.

H 0 : d  0 d  Media de las diferencias


pareadas en la población
H A : d  0

H A : d  0

H A : d  0

Héctor Varela V. 49
Muestra de pares; ( xi , yi ) i  1,2,, n

Estadístico de prueba de H0

d
t0  Sd
t0 ~ t-student (n - 1)
n

n n n

 di  ( xi  yi )  i
( d  d ) 2

d i 1
 i 1
, Sd  i 1

n n n 1

Héctor Varela V. 50
Estudio Interlaboratorio

El archivo T-pareado.MTW contiene mediciones de oxígeno


disuelto obtenidas en 14 laboratorios. Cada laboratorio realizó
las mediciones usando el método Winkler (titulación) y el método
electrodo. ¿predicen diferentes concentraciones de oxígeno
disuelto los dos métodos?

H 0 :  d  0 vs H A :  d  0

μd= media de las diferencias de los métodos Winkler y electrodo

Héctor Varela V. 51
Los datos satisfacen los supuestos de m.a.s. de una distribución normal
Estadísticas > Estadística Básica > t pareada

Héctor Varela V. 52
T pareada para Winkler - Electrodo

Error
estándar
de la
N Media Desv.Est. media
Winkler 14 1,3929 0,3050 0,0815
Electrodo 14 1,7214 0,3068 0,0820
Diferencia 14 -0,329 0,494 0,132

IC de 95% para la diferencia media:: (-0,614. -0,044)


Prueba t de diferencia media = 0 (vs. no = 0): Valor T = -2,49 Valor P = 0,027

Se rechaza H0 y se concluye que los métodos proporcionan resultados


diferentes. El método electrodo entrega valores mayores que el método
Winkler

Héctor Varela V. 53
Homogeneidad de Varianzas
Para comparar medias de dos poblaciones, se debe verificar
que las varianzas poblacionales son iguales

Hipótesis

H0 :    2
2 2 Estadístico de prueba de H0
1

HA :  2
2 2
S12
F0  2
1

H A : 1   2
2 2
S2
H A : 1   2
2 2

Héctor Varela V. 54
Ejemplo

Balde A Balde B
T Llenado T Llenado
Se registran los tiempos de llenado (en
segundos) para dos tipos diferentes de 22 29
baldes. Pruebe la hipótesis de que las 25 21
varianzas de estas muestras son iguales 24 21
29 26
27 19
23 23
H 0 :  A2   B2 22 11
23 24
21 28
H 0 :  A2   B2 20 20
22 21
23 30
19 17
24 17
20 23
Héctor Varela V. 55
Baldes.MTW

Estadísticas > Estadística Básica > t de 2 muestras

Minitab calcula dos p-value:


• Test – F o Test de Bartlett’s para datos con
distribución normal.
• Test de Levene para cualquier set de datos continuos

Si se puede considerar datos normales usar


Test - F (2 varianzas)

Chequear normalidad para los tiempos de llenado de los baldes

balde A p-value = 0.434; balde B p-value = 0.788

Los dos sets de datos satisfacen el supuesto de m.a.s.

Héctor Varela V. 56
Estadísticas > Estadística Básica > 2 varianzas

datos en
columnas
diferentes

Héctor Varela V. 57
Estadísticas

Variable N Desv.Est. Varianza


Balde A 15 2,658 7,067
Balde B 15 5,057 25,571

Relación de deviaciones estándar = 0,526


Relación de varianzas = 0,276

Intervalos de confianza de 95%

IC para IC para
Distribución relación de relación de
de los datos Desv.Est. varianza
Normal (0,305. 0,907) (0,093. 0,823)
Continuo (0,241. 1,058) (0,058. 1,119)

Pruebas

Estadística
Método GL1 GL2 de prueba Valor P
Prueba F (normal) 14 14 0,28 0,022
Prueba de Levene (cualquiera continua) 1 28 3,67 0,066
Héctor Varela V. 58
Test de hipótesis sobre la diferencia de dos
medias poblacionales μ1 – μ2
Hipótesis

Hip. nula H0 : m1 = m2 H0 : m1 -m2 = 0

Hip. Alt HA : m1 ¹ m2 HA : m1 -m2 ¹ 0

Hip. Alt1 HA : m1 > m2 HA : m1 -m2 > 0

Hip. Alt2 HA : m1 <m2 HA : m1 -m2 <0

Supuestos
Muestras aleatorias independientes
Distribuidas aproximadamente normales
Con varianzas iguales

Héctor Varela V. 59
Estadístico de prueba de H0

x1 , x2 , , xn m.a.s. de N ( 1 ,  ) 2

y1 , y2 , , ym m.a.s. de N ( 2 ,  2 )

Independientes

X -Y
t0 =  t( n+m-2)
(n -1) S + (m -1) S
2 2
æ 1 1 ÷ö
X Y çç + ÷
n+m-2 çè n m ÷ø

Héctor Varela V. 60
Ejemplo

Marca A Marca B
Una empresa de camiones desea 4,2 4,4
probar la eficiencia de dos marcas 3,1 3,2
de diesel. Se realizaron 15 pruebas 4,8 4,9
con cada marca de diesel, y se 5,9 5,9
registraron los kilómetros por litro. 5,8 5,8
¿Hay alguna diferencia entre las 6,4 6,5
marcas? 2,2 2,2
4,3 4,5
5,7 5,7
3,3 3,6
H0 : m1 -m2 = 0 HA : m1 -m2 ¹ 0 3,8 3,8
2,7 2,8
2,5 2,6
Diesel.MTW
3,5 3,4
3,7 3,8

Héctor Varela V. 61
Chequear Supuestos

Tests de normalidad:

Marca A: p-value = 0.456


Marca B: p-value = 0.586
Suponer que los datos son normales

Test para igualdad de varianzas

Usar test - F
P-value = 0.974
Suponer igualdad de varianzas

Héctor Varela V. 62
Estadísticas > Estadística Básica > t de 2 muestras

Para varianzas iguales

Hipótesis alternativa

Héctor Varela V. 63
T de dos muestras para Marca A vs. Marca B

Error
estándar
de la
N Media Desv.Est. media
Marca A 15 4,13 1,33 0,34
Marca B 15 4,21 1,32 0,34

Diferencia = mu (Marca A) - mu (Marca B)


Estimado de la diferencia: -0,080
IC de 95% para la diferencia: (-1,073. 0,913)
Prueba T de diferencia = 0 (vs. no =): Valor T = -0,17 Valor P = 0,870 GL = 28

Ambos utilizan Desv.Est. agrupada = 1,3274

No se rechaza H0 no existe evidencia de diferencias en las marcas de


diesel

Héctor Varela V. 64
Comparación de medias, cuando las
varianzas son desiguales

Si se rechaza la hipótesis H0 : 1   2
2 2

El estadístico de prueba de la hipótesis H0 : m1 -m2 = 0

X -Y
t =
'
0
S X2 SY2
+
n m

Tiene una distribución t – student aproximada, con grados de


libertad no necesariamente enteros

Héctor Varela V. 65
Ejemplo
Para el caso de los tiempos de llenados de baldes, se encontró que
existe evidencia de varianzas diferentes. Y se desea comparar los
tiempos medios de llenado en cada balde
Baldes.MTW
Estadísticas > Estadística Básica > t de 2 muestras

Para varianzas
desiguales

Héctor Varela V. 66
Error
estándar
de la
N Media Desv.Est. media
Balde A 15 22,93 2,66 0,69
Balde B 15 22,00 5,06 1,3

Diferencia = mu (Balde A) - mu (Balde B)


Estimado de la diferencia: 0,93
IC de 95% para la diferencia: (-2,13. 4,00)
Prueba T de diferencia = 0 (vs. no =): Valor T = 0,63 Valor
P = 0,534 GL = 21

Los grados de libertad no necesariamente corresponden a un entero. Cuando no


lo es se aproxima al número entero inmediato inferior, con el fin de ser
conservador. A modo de ejemplo
El punto t (10; 0.05) =1.812 es menor que t (11; 0.05) =1.796

Rechazar con una t con 10 g.l., implica rechazar con una t con 11 g.l. Pero no
necesariamente es así en el sentido inverso
Héctor Varela V. 67
ANALISIS DE VARIANZA

El análisis de varianza es útil cuando se desea comparar las


medias de un solo factor en dos o más niveles

¿Existe alguna diferencia ¿Qué pasa si la varianza de la


entre las medias de respuesta respuesta aumenta? ¿Existe una
en los niveles A, B y C ? diferencia entonces?

Héctor Varela V. 68
Análisis de varianza

Hipótesis

H 0 :      ......  

HA: Alguna diferencia existe entre las medias poblacionales

El Análisis de varianza prueba la hipótesis nula H0

Supuestos
– Muestras aleatorias independientes
– Residuos con distribución normal
– Varianzas iguales

Héctor Varela V. 69
Toma de muestras

y ,y , ...... , y m.a.s. de N (  ,  2 )
11 12 1n1 1

y 21 , y 22 , ...... , y 2 n m.a.s. de N (  2 ,  2 )
2



y ,y , ...... , y m.a.s. de N (  , 2 )
k1 k2 kn k k

Independientes

Héctor Varela V. 70
Cálculos previos

k ni ni k
Y..    yij , Yi.   yij , n   ni
i 1 j 1 j 1 i 1

k ni ni
  yij  yij
i 1 j 1 Y.. j 1 Yi.
Y  , Yi  
n n ni ni

Héctor Varela V. 71
Descomposición de la variación total:

Variaciones dentro de
Variación Variaciones
Total = + grupos o debida al
entre grupos ruido experimental

STC = SCE + SCD


Suma Total Suma de Cuadrados Suma de Cuadrados
de Cuadrados entre grupos dentro de grupos
o
Suma de Cuadrados
del Error

Héctor Varela V. 72
Cuando H0 es verdadero, se obtienen 2 estimaciones de la
varianza 2 de la población

CME: Cuadrado medio debido a los grupos (Factor)


- La varianza entre las medias de los factores

CMD: Cuadrado medio debido al error aleatorio.


- Varianza dentro de cada nivel del factor

CME / CMD tiene una distribución F con (k – 1) grados


de libertad en el numerador y (n – k) grados de libertad
en el denominador
Héctor Varela V. 73
Tabla ANOVA
Grados de Cuadrados
Fuente de Variación S. C. F Obs. P
libertad Medios
Factor
SCE k-1 CME CME/CMD Valor-p
(entre grupos)
Error
SCD n-k CMD
(dentro de grupos)
Total STC n-1

k: N° de grupos.
n: N° total de observaciones
F: Estadístico de prueba de H0
P: valor-p

Héctor Varela V. 74
Homogeneidad de Varianzas

Muchos test estadísticos para diferencia entre medias


asumen que las varianzas son iguales.

Se debe verificar si las varianzas son iguales.

El test de homogeneidad de varianzas compara las


varianzas de dos o más muestras.

H 0 :  12   22     k2

Test de Bartlett Test de Levene

Héctor Varela V. 75
Ejemplo
El archivo TurnosGC.MTW contiene registros de %Cu para los meses de
febrero, marzo, abril y mayo. Se desea comparar los porcentaje de cobre medios
entre los meses

 i : Contenido medio de % Cu en mes i

 i2 : Varianza de % Cu en mes i

Se desea probar

H 0 :      3   4
vs
HA: Alguna diferencia existe

Héctor Varela V. 76
Verificación de varianza constante
H 0 :  12   22   32   42
Estadísticas > Anova > Prueba de varianzas iguales

Héctor Varela V. 77
Héctor Varela V. 78
Intervalos de confianza de Bonferroni de 95%
para desviaciones estándar

Mes N Inferior Desv.Est. Superior


feb 163 3,90185 4,44705 5,15540
mar 186 4,09560 4,63092 5,31477
abr 169 3,73440 4,24675 4,90927
may 157 3,36368 3,84269 4,46817

Prueba de Bartlett (distribución normal)


Estadística de prueba = 6,19. valor p = 0,103

Prueba de Levene (cualquier distribución


continua)
Estadística de prueba = 1,69. valor p = 0,168

Héctor Varela V. Varianzas iguales 79


Comparación de medias

Los comandos para el análisis de varianza con Minitab dependen de la


disposición de los datos en la planilla

Datos en una columna y el factor en otra.


Estadísticas > ANOVA > Un solo factor

Héctor Varela V. 80
H 0 : 1   2   3   4
ANOVA unidireccional: % Cu vs. Mes

Fuente GL SC CM F P
Mes 3 1082,0 360,7 19,35 0,000
Error 671 12504,6 18,6
Total 674 13586,6

S = 4,317 R-cuad. = 7,96% R-cuad.(ajustado) = 7,55%

ICs de 95% individuales para la media


basados en Desv.Est. agrupada
Nivel N Media Desv.Est. -----+---------+---------+---------+----
feb 163 37,926 4,447 (----*-----)
mar 186 40,557 4,631 (----*----)
abr 169 37,295 4,247 (-----*----)
may 157 38,952 3,843 (-----*----)
-----+---------+---------+---------+----
37,2 38,4 39,6 40,8

Desv.Est. agrupada = 4,317

Héctor Varela V. 81
Héctor Varela V. 82
Agrupar información utilizando el método de
Tukey

Mes N Media Agrupación


mar 186 40,557 A
may 157 38,952 B
feb 163 37,926 B C
abr 169 37,295 C

Las medias que no comparten una letra son


significativamente diferentes.

Héctor Varela V. 83
Intervalos de confianza simultáneos de Tukey del 95%
Todas las comparaciones de dos a dos entre los niveles de Mes

Nivel de confianza individual = 98,95%

Mes = feb restado de:

Mes Inferior Centro Superior --------+---------+---------+---------+-


mar 1,442 2,631 3,820 (----*---)
abr -1,847 -0,631 0,585 (---*----)
may -0,213 1,026 2,265 (----*----)
--------+---------+---------+---------+-
-2,5 0,0 2,5 5,0

Comparaciones de %Cu medio del mes de febrero con los meses de


marzo abril y mayo
Hay evidencia de diferencia significativa de %Cu medio en los meses
de febrero y marzo

Héctor Varela V. 84
Mes = mar restado de:

Mes Inferior Centro Superior --------+---------+---------+---------+-


abr -4,440 -3,262 -2,085 (----*----)
may -2,806 -1,605 -0,404 (----*---)
--------+---------+---------+---------+-
-2,5 0,0 2,5 5,0

%Cu medio de marzo difiere de %Cu medio de abril y %Cu medio de mayo

Mes = abr restado de:

Mes Inferior Centro Superior --------+---------+---------+---------+-


may 0,429 1,657 2,885 (----*----)
--------+---------+---------+---------+-
-2,5 0,0 2,5 5,0

%Cu medio de abril difiere de %Cu medio de mayo

Héctor Varela V. 85
Chequear residuos
Re siduo  Yij  Yi

Héctor Varela V. 86
Prueba de normalidad de los residuos

Estadísticas > Estadística básica > Prueba de normalidad > Ingresar


columna de residuos

Héctor Varela V. 87
Estadísticas no paramétrica

Los tests de hipótesis desarrollados hasta aquí deben


satisfacer supuestos. Ahora bien, si alguno de los
supuestos no se satisface se debe acudir a los test no
paramétricos o de libre distribución

Los tests no paramétricos son aplicables a pruebas de


hipótesis cuando las distribuciones son no normales

Héctor Varela V. 88
Test de Mann - Whitney

Comparación de las medianas de dos poblaciones


independientes

H 0 : Mediana 1  Mediana 2

x1, x2 ,, xn m.a.s. de población 1

y1, y2 ,, ym m.a.s. de población 2

Independientes
Héctor Varela V. 89
Se ordena la muestra conjunta en magnitud no
decreciente y se asignan rangos de 1 a (n+m)

R1i : Rango del i - ésimo dato ordenado de la muestra 1

R2i : Rango del i - ésimo dato ordenado de la muestra 2

Muestra 1: 2.5, 1.8, 1.9, 2.6, 3.9 (n = 5)


Muestra 2: 3.4, 2.7, 1.5, 3.6, 2.1, 3.7 (m = 6)
Muestra conjunta ordenada:

2 1 1 2 1 1 2 2 2 2 1
1.5 1.8 1.9 2.1 2.5 2.6 2.7 3.4 3.6 3.7 3.9
Rangos 1 2 3 4 5 6 7 8 9 10 11
Héctor Varela V. 90
Para observaciones iguales se promedian los rangos

Estadístico de prueba de H0

n
W   R1i (Wilcoxon)
i 1
n ( n  1)
U W  (Mann - Whitney)
2

Uso de
Se rechaza H0 si p  value  
software
estadístico No se rechaza H0 p  value  

Héctor Varela V. 91
Ejemplo

El archivo Stock.MTW registra datos de concentraciones según


dos tipos de stock. El cobre toral (Cut) no satisface los supuestos
de normalidad para comparar las concentraciones medias por el
test-t para muestras independientes
H 0 : Mediana CuStockA = Mediana CuStockB
H A : Mediana CuStockA ¹ Mediana CuStockB

Observar en el archivo que las concentraciones están apiladas, las


que deberán desapilarse para poder desarrollar el test no-paramétrico
de Mann-Whitney

Héctor Varela V. 92
Para desapilar en Minitab
Datos > Desapilar columnas
Stock.MTW

Columnas
no apiladas

Héctor Varela V. 93
Estadísticas > No parametricos > Mann-Whitney

Prueba de Mann-Whitney e IC: Cut_B. Cut_C

N Mediana
Cut_B 79 0,4300
Cut_C 101 0,4900

La estimación del punto para ETA1- ETA2 es - 0,0400


95,0 El porcentaje IC para ETA1-ETA2 es (-0,1000; 0,0200)
W = 6684,5
Prueba de ETA1 = ETA2 vs. ETA1 no es = ETA2 es significativa en 0,1806
La prueba es significativa en 0,1805 (ajustado por empates)

No diferencia significativa
Héctor Varela V. 94
Test de Kruskal - Wallis

Comparar dos o más medianas

H 0 : Med 1  Med 2    Med k

y 11 , y 12 , ...... , y 1 n m.a.s. de Población 1


1

y 21 , y 22 , ...... , y 2 n m.a.s. de Población 2


2


y k1 , y k 2 , ...... , y kn m.a.s. de Población k
k

Héctor Varela V. 95
Se ordena la muestra conjunta y se asignan rangos de 1 a n

k
n   ni
i1
Ri  Suma de los rangos de la muestra (i  ésima )

Estadístico de prueba de H0

k R 2
12
K
n( n  1)
 n
i  3( n  1)
i 1 i
K 2
( k 1)

Héctor Varela V. 96
Ejemplo

El archivo Rechazo.MTW registra datos de tiempos de reproceso de


cátodos. Los tiempos de instalación de sellos no satisfacen los
supuestos estándares para comparar tiempos medios por turnos
mediante análisis de varianza

Por el método de Kruskal_Wallis se pueden comparar las medianas.


También se pueden comparar con el método de la Mediana de Mood

H 0 : MedianaTurno1 = MedianaTurno 2 = MedianaTurno 3

H A : A lg una diferencia existe

Para usar la prueba de Kruskal-Wallis en Minitab, los datos se deben


tener apilados en una columna y el factor en otra

Héctor Varela V. 97
Estadísticas > No paramétricos > Kruskal-Wallis
Rechazo.MTW

Prueba de Kruskal-Wallis: Instal_sellos vs. Turno

Prueba de Kruskal-Wallis en Instal_sellos

Clasificación
Turno N Mediana del promedio Z
1 16 0,3550 28,4 -1,02
2 24 0,3500 26,0 -2,16
3 24 0,4750 41,8 3,08
General 64 32,5

H = 9,63 GL = 2 P = 0,008
H = 9,69 GL = 2 P = 0,008 (ajustados para los vínculos)

diferencias significativas
Héctor Varela V. 98
INFERENCIA CON DATOS CUALITATIVOS

Pruebas de Hipótesis respecto de una


proporción poblacional
Hip. nula H0 : p  p0 ( p0 conocido)
Hip. Alt. H A : p  po
Hip. Alt. H A1 : p  p0
Hip. Alt. H A2 : p  p0

x1 , x2  , xn m.a.s.

1 i-ésimo elemento satisface característica C


xi  
0 Si no
Héctor Varela V. 99
n

x i
N º de datos en la muestra que satisface C
pˆ  i 1

n n

Estadístico de prueba de H 0 : p = p0

pˆ  p 0
Z0  ~N ( 0,1)
p 0 (1  p 0 )
n

Héctor Varela V. 100


Ejemplo
Una muestra aleatoria de 500 piezas contiene 65 no conformes.
¿Se puede concluir que la proporción de no conformes es menor
que 0.15?

Estadísticas > Estadística básica > 1 Proporción

H 0 : p = 0.15 H A : p < 0.15

Héctor Varela V. 101


Prueba de p = 0,15 vs. p < 0,15

Límite
Muestra X N Muestra p superior 95% Valor Z Valor P
1 65 500 0,130000 0,154739 -1,25 0,105

Uso de la aproximación normal.

No existe evidencia de que la


65
pˆ = = 0.13 proporción de no conformes es
500 menor que 0.15

Héctor Varela V. 102


Pruebas de Hipótesis sobre la diferencia de dos
proporciones poblacionales
Hipótesis
H0 : p1  p2  H0 : p1  p2  0
H A : p1  p2  H A : p1  p2  0
H A1 : p1  p2  H A2 : p1  p2  0
H A2 : p1  p2  H A2 : p1  p2  0

Estadístico de prueba de H0

pˆ1 - pˆ 2 np1  mp 2


Z0 =  N (0,1) p  nm
pˆ (1- pˆ )( 1n + m1 )

Héctor Varela V. 103


Ejemplo
El presidente de una compañía piensa que la proporción de obreros
a favor del control de precios y salarios es mayor que la proporción
de ejecutivos a favor del control. Se toman muestras aleatorias
independientes de 200 obreros y 200 ejecutivos y se encuentran 44
obreros y 34 ejecutivos a favor del control.
Estadísticas > Estadística básica > 2 Proporciones

Héctor Varela V. 104


Muestra X N Muestra p
44
1 44 200 0,220000 pˆ 1 = = 0.22
200
2 34 200 0,170000
34
pˆ 2 = = 0.17
Diferencia = p (1) - p (2) 200
Estimado de la diferencia: 0,05
Límite inferior 95% de la diferencia: -0,0150394
Prueba para la diferencia = 0 vs. > 0: Z = 1,26 Valor P = 0,103

Prueba exacta de Fisher: Valor P = 0,128

No existe evidencia de diferencia

Héctor Varela V. 105


Pruebas chi-cuadrado
Para datos cualitativos o categorizados

1. La muestra debe ser elegida al azar


2. Todas las observaciones deben ser independientes
3. La definición de las categorías debe ser inequívoca
4. El número de frecuencias esperadas por categoría deber ser por
lo menos de 5

5. Si el número de frecuencias/conteos esperados por categoría es


menor que 5:
– aumentar el tamaño de la muestra,
– combinar las categorías, para eliminar las categorías con
frecuencias esperadas < 5
Héctor Varela V. 106
Pruebas de Independencia

¿Existe una asociación/relación entre dos variables por


atributo?
¿Afecta el valor de una variable por atributo al resultado de la
otra?
x1, x2 ,, xn m.a.s.
Se clasifican conjuntamente respecto de dos atributos o caracteres A y B

A con categorías A1, A2,......, Ak


B con categorías B1, B2,......, Bm

H0: Los caracteres A y B son independientes


v/s
HA: Alguna asociación existe entre las variables
Héctor Varela V. 107
Tabla de contingencia
A\B B1 B2 Bj Bm Tota
l
A1 n11 n12 n1j n1m n1·
A2 n21 n22 n2j n2m n2·

Ai ni1 ni2 nij nim ni·

Ak nk1 nk2 nkj nkm nk·


Total n·1 n·2 n·j n·m n

pij = P(AiBj) pi· = P(Ai) p·j = P(Bj)

H0: pij = pi·· p·j

Héctor Varela V. 108


Estadístico de prueba de H0

nn
(n  ) i j 2


k m
ij

J  n
0
i 1 j 1
nn i j

n
J0 ~  2
( k 1)( m 1)

Uso de software Se rechaza H si p  value  


0
estadístico
No se rechaza H0 p  value  
Héctor Varela V. 109
Medidas de asociación

Coeficiente de Contingencia de Cramer


J o

n
J
Coeficiente de Contingencia de Pearson
o

J n
o

Frecuencias esperadas menores que 5


Se deben combinar clases

En tablas de contingencia de 2x2 es recomendable utilizar la


prueba exacta de Fisher o test Chi cuadrado con corrección
de Yates.

Héctor Varela V. 110


Ejemplo

Se supone que existe asociación entre el día de la semana de


producción de un artículo y la calidad de este artículo. Se
selecciona una muestra aleatoria de 500 unidades en existencia y
se clasifica según el día de producción y la calidad
Día de producción
Calidad Lunes Martes Miércoles Jueves Viernes
Excelente 44 74 79 72 31
Buena 14 25 27 24 10
Normal 15 20 20 23 9
Deficiente 3 5 5 0 0

H0: El día de la semana de producción del artículo es


independiente de su calidad

HA: Alguna asociación existe

Héctor Varela V. 111


Archivo Independencia.MTW

Estadísticas > Tablas > Prueba Chi Cuadrado (tabla de dos


factores en hoja de trabajo)

Héctor Varela V. 112


Los conteos esperados se imprimen debajo de los conteos observados
Las contribuciones Chi-cuadradas se imprimen debajo de los conteos
esperados

Lunes Martes Miércoles Jueves Viernes Total


1 44 74 79 72 31 300
45,60 74,40 78,60 71,40 30,00
0,056 0,002 0,002 0,005 0,033

2 14 25 27 24 10 100
15,20 24,80 26,20 23,80 10,00
0,095 0,002 0,024 0,002 0,000

3 15 20 20 23 9 87
13,22 21,58 22,79 20,71 8,70
0,239 0,115 0,342 0,254 0,010

4 3 5 5 0 0 13
1,98 3,22 3,41 3,09 1,30
0,531 0,978 0,746 3,094 1,300

Total 76 124 131 119 50 500

Chi-cuadrada = 7,831. GL = 12. Valor P = 0,798 No rechaza H0


5 celdas con conteos esperados menores que 5.
Héctor Varela V. 113
Comparación gráfica de
distribuciones de datos
Comparaciones de Distribuciones de Datos

Son numerosas las aplicaciones en las que se tienen dos conjuntos


de datos y el objetivo de estudio es comparar las distribuciones de
los dos grupos

Probablemente la comparación más simple es determinar si un


valor típico de un grupo está por encima o por debajo del valor
típico del otro

Los métodos gráficos pueden ser utilizados para comparar


distribuciones

Héctor Varela V. 115


Función de Distribución Empírica

x1 , x2 ,, xn m.a.s. de una población

Se ordenan los datos en magnitud no decreciente, denotados por

x(1)  x(2)  x(3)    x( n 1)  x( n )

La función de distribución empírica de la muestra está definida en


términos de la muestra ordenada

0 si t  x(1)
i

F( n ) (t )   si x( i )  t  x( i 1)
n
1 si x( n )  t
Héctor Varela V. 116
Ejemplo
La siguiente muestra de 10 observaciones
5,2 3,5 8,6 6,8 9,2 12,7 6,5 4,7 11,8 9,7

proporciona la gráfica de la distribución empírica F10 de la


muestra
Distribución Empírica

1,0
0,9
0,8
0,7

F10 (9.699) = 0.7


Probability

0,6
0,5
0,4
0,3 F10 (9.7) = 0.8
0,2
0,1
0,0
F10 (11.7) = 0.8
3,5

4,7
5,2

6,5
6,8

8,6

9,2
9,7

11,8

12,7

C1

Héctor Varela V. 117


Minitab 15 permite comparar las distribuciones empíricas de dos
conjuntos de datos. No obstante, el método no paramétrico de
Kolmogorov – Smirnov prueba la hipótesis nula de que las
distribuciones de las poblaciones de donde provienen las muestras son
iguales

x1 , x2 ,  , xn m.a.s. de tamaño n de población 1

con distribución empírica Fn

y1 , y2 ,  , ym m.a.s. de tamaño m de población 2

con distribución empírica Fm

Héctor Varela V. 118


Ejemplo
El archivo Tonelaje.MTW contiene registros de Peso del mineral que se
registra cada 5 minutos en la correa Alim MSAG antes y después de
una acción de mejora.

Gráfica > CDF Empírica

Héctor Varela V. 119


Héctor Varela V. 120
Héctor Varela V. 121
4400 5200
Percentil 20 (antes) = 4400 tons Percentil 20 (después) = 5200 tons
Percentil 70 (antes) = 5520 tons Percentil 70 (después) = 5720 tons
Héctor Varela V. 122

También podría gustarte