Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Inferencial
2
Estadística Inferencial
3
Estadística Inferencial
PARTE UNO
El objetivo de la estadística es hacer inferencia con respecto a
la población basándose en la información contenida en una
muestra.
f ( x1 , x 2 ,..., x n : θ ) = f ( x1 ,θ ) f ( x 2 ,θ )... f ( x n ,θ )
4
Estadística Inferencial
Definición
Definición.
5
Estadística Inferencial
Teorema
Sea c una constante entonces E (c) = c
Teorema
Sean g (Y1 , Y2 ) una función de las variables aleatorias Y1 ,Y2 , y
sea c una constante. Entonces E (cg (Y1 , Y2 )) = cE ( g (Y1 , Y2 ))
Teorema
Sea Y1 ,Y2 dos variables aleatorias con la función de densidad
conjunta f ( y1 , y 2 ) y sea g 1 (Y1 , Y2 ), g 2 (Y1 , Y2 )...g k (Y1 , Y2 ) funciones
de Y1 ,Y2 . Entonces
E ( g1 (Y1 , Y2 ) + g 2 (Y1 , Y2 ) + ... + g k (Y1 , Y2 )) =
E ( g1 (Y1 , Y2 )) + E ( g 2 (Y1 , Y2 )) + ... + E ( g k (Y1 , Y2 ))
Definición
Un estimador T es un estimador insesgado de τ (θ ) sí
E (T ) = τ (θ ) para todo θ ∈ Ω , de otra manera se dice que T es
un estimador sesgado de τ (θ ) .
Ejemplo
Considere una muestra aleatoria de una distribución f ( x, Θ) ,
con Θ = ( µ , σ 2 ) , donde µ y σ 2 son la media y la varianza de la
población.
6
Estadística Inferencial
n −
∑ (x 1 − x)
Permite obtener S 2 = i =1
como estimador de σ 2 , y
n −1
ambos µ y σ 2 .
Definición
El sesgo B de un estimador puntual θˆ está dado por
B = E (θˆ) − θ .
(a) θ θˆ (b) θ θˆ
7
Estadística Inferencial
Dados dos estimadores insesgados de un parámetro θ
seleccionamos el estimador con la menor varianza,
permaneciendo constante en todas las condiciones restantes.
Definición
Sea X 1 , X 2 ,..., X n una muestra aleatoria de tamaño n de
f ( x;θ ) . Un estimador T * de τ (θ ) es denominado un estimador
insesgado uniforme de mínima varianza de τ (θ ) sí
1. T * es insesgado para τ (θ )
2. Para cualquier otro estimador insesgado T de τ (θ ) ,
Var (T * ) ≤ Var (T ) para todo θ ∈ Ω
Definición
La media del cuadrado del error de un estimador puntual θˆ y se
define como el valor esperado de (θˆ − θ ) 2 , es decir, E (θˆ − θ ) 2 .
8
Estadística Inferencial
µ n Y µ σ2
n
p n Y p pq
pˆ =
n n
µ1 − µ 2 n1 y n2 Y1 − Y2 µ1 − µ 2 σ1 σ 2
2 2
+
n1 n2
p1 − p2 n1 y n2 pˆ1 − pˆ 2 p1 − p2 p1q1 p2 q2
+
n1 n2
respectivamente.
La manera de evaluar la bondad de cualquier procedimiento de
estimación puntual estriba en términos de la distancia entre las
estimaciones generadoras y el parámetro objetivo.
Definición
El error de estimación ε es la distancia entre un estimador y
su parámetro objetivo, es decir, ε =| θ − θˆ | .
9
Estadística Inferencial
Eficiencia relativa
Definición
Dados dos estimadores insesgados θˆ1 y θˆ2 , de un parámetro
θ , con varianzas V( θˆ ) y V( θˆ ), respectivamente, entonces la
1 2
Consistencia
Definición
El estimador θˆn es un estimador consistente de θ si para
cualquier número positivo ε se tiene que lim P(| θˆn − θ |≤ ε ) = 1 o
n→∞
Teorema
El estimador insesgado θˆn para θ es un estimador consistente
de θ sí lim V (θˆ ) = 0
n
n→∞
Suficiencia
En seguida se presentan algunos métodos para encontrar
estadísticos que en cierto sentido resumen toda la información
en una muestra con respecto a un parámetro objetivo, y tales
estadísticos tienen la propiedad de la suficiencia.
Definición
Sean y1 , y2 ,..., yn observaciones muestrales para las variables
aleatorias correspondientes Y1 , Y2 ,..., Yn . Entonces si Y1 , Y2 ,..., Yn
son variables aleatorias discretas, la verosimilitud (factibilidad)
de la muestra, L = L( y1 , y2 ,..., yn ) se define como la probabilidad
conjunta de y1 , y2 ,..., yn . Si Y1 , Y2 ,..., Yn son variables aleatorias
10
Estadística Inferencial
Teorema
Sea U un estadístico basado en una muestra aleatoria
Y1 , Y2 ,..., Yn . Entonces U es un estadístico suficiente para la
estimación de un parámetro θ si y sólo si la verosimilitud L se
puede factorizar en dos funciones no negativas
L( y1 , y2 ,..., yn ) = g (u,θ )h( y1 , y2 ,..., yn ) en donde g (u ,θ ) es una
función solamente de u y θ , y h( y1 , y2 ,..., yn ) no es una función
de θ .
En general se desea encontrar un estadístico suficiente que
reduzca los datos en la muestra hasta donde sea posible. Los
estadísticos que cumplen con ése objetivo se denominan
estadísticos de mínima suficiencia.
Suficiencia mínima y estimación insesgada de mínima
varianza
Tales estadísticos fueron desarrollados por Lehmann y Scheffé.
Suponga que Y1 , Y2 ,..., Yn representa una muestra aleatoria de
una función de probabilidad p ( y ) , o una función de densidad
f(y) con un parámetro desconocido θ . El conjunto de variables
Y1 , Y2 ,..., Yn puede tomar varios valores, supongamos que
y1 , y2 ,..., yn y x1 , x2 ,..., xn son dos conjuntos de valores posibles,
el método utiliza la razón de verosimilitudes evaluadas en esto
L( x1 , x2 ,..., xn )
dos puntos . Varias veces es posible encontrar
L( y1 , y2 ,..., yn ) n
una función g ( x1 , x2 ,..., xn ) tal que la razón mencionada no
presente el parámetro desconocido θ sí y sólo sí
g ( x1 , x2 ,..., xn ) = g ( y1 , y2 ,..., yn ) . Si se puede encontrar tal función
g, entonces g (Y1 , Y2 ,..., Yn ) es un estadístico de mínima
suficiencia para θ .
11
Estadística Inferencial
12
Estadística Inferencial
PARTE DOS
1. Introducción
Todas las herramientas estadísticas con las que se cuenta
hasta ahora, tales como tablas, gráficos y cálculo de medidas
descriptivas se podrían englobar en el término Estadística
Descriptiva, puesto que ellas esencialmente permiten describir,
presentar y resumir información que ha sido recolectada de
alguna forma.
Sin embargo las técnicas de la Estadística Descriptiva no
permiten responder interrogantes que pueden surgir cuando no
se dispone de la información sobre todos los individuos de la
población de interés sino sólo de una parte de ella, es decir,
que los datos provienen de una muestra de individuos de la
población bajo estudio. Ejemplos de esta situación son:
Si se conoce que la ganancia promedio de ventas de
una muestra de 50 automóviles nuevos es de $935,
¿qué se puede decir sobre la ganancia media de
todas las ventas de automóviles nuevos?
Si se encontró que una curso de capacitación ayuda a
encontrar trabajo a 16 de 20 jóvenes de una ciudad,
¿qué porcentaje de todos los jóvenes que buscan
trabajo se puede esperar que encuentren trabajo
después de tomar el curso?
Para responder este tipo de preguntas la Estadística dispone de
una gran cantidad de métodos que se engloban dentro de la
llamada Estadística Inferencial, los cuales se usan
esencialmente para determinar la probabilidad de que una
conclusión sacada a partir de los datos de una muestra sea
cierta en la población muestreada.
Las poblaciones pueden ser ventas, personal de una empresa,
consumidores de un producto, etc.
El proceso conocido como inferencia estadística, requiere
consideraciones de cómo fue seleccionada la muestra y cuánto
varían las observaciones de una muestra a otra. De esta
manera, los métodos de selección de los individuos que se
usarán en la investigación son de considerable importancia para
la obtención de resultados y conclusiones válidas.
El requisito fundamental de una buena muestra es que sea
representativa de la población que se trata de describir
13
Estadística Inferencial
(Población Objetivo – Figura 1). Hay, por supuesto muchas
formas de obtener una muestra no representativa. Una obvia
falta de representatividad ocurre cuando la muestra se toma de
la población equivocada. Por ejemplo, se quiere conocer la
proporción de personas que consumen un determinado
producto y la muestra se obtiene de los clientes de un solo
supermercado.
Aún cuando se esté seguro que la muestra se obtiene de la
apropiada población, otra fuente potencial de error en el
muestreo, especialmente en las encuestas de opinión son las
respuestas sesgadas. Cuestionarios mal redactados o
técnicas de entrevistas inadecuadas pueden dar lugar a
respuestas que no reflejan la realidad que se quiere evaluar.
Por otra parte, en muchas ocasiones no es posible obtener la
muestra a partir de todos los individuos que definen la población
objetivo, sino sólo a partir de una subpoblación que es
accesible al investigador en el momento de hacer la selección
de los individuos de la muestra y ella recibe el nombre de
población muestreada (Figura 1).
Población objetivo
Población muestreada
14
Estadística Inferencial
16
Estadística Inferencial
1. Distribución muestral
Un objetivo que se presenta frecuentemente en las
investigaciones de diferentes áreas es conocer el promedio de
alguna característica cuantitativa o la proporción de individuos
que poseen determinada característica cualitativa. Por ejemplo,
la edad media de las “mujeres de una dada región que usan
determinado servicio” (Población Objetivo); o la proporción de
“egresados universitarios de un país” (Población Objetivo) que
hacen una carrera de postgrado. En general, las características
de interés en un estudio se denominan parámetros
poblacionales. En los ejemplos dados los parámetros
poblacionales son la media y la proporción y generalmente se
denotan con a lamedia y con a la proporción.
Para determinar los parámetros poblacionales se requiere
conocer los valores de la variable para todos los individuos de
la población, por ejemplo para determinar la edad media se
requiere conocer la edad de todas las mujeres que usan el
servicio. Sin embargo, no siempre es posible obtener la
información de todos los individuos que componen la población
por razones de costo en tiempo y dinero, y cuando eso ocurre
se hace necesario recurrir a una muestra de la población.
Luego, a partir de los datos de la muestra se busca una manera
de combinar la información de la muestra para obtener la
característica de interés.
En el ejemplo donde el parámetro de interés es la edad media,
se toma una muestra de n (tamaño de la muestra) mujeres de
la población y se calcula el promedio de las edades en la
muestra. Surge entonces el interrogante a cerca de cual medida
de promedio se usará (media aritmética o mediana). Cualquiera
sea la medida que se use, cada una de ellas recibe el nombre
de estimador o estadístico. Si se conviene en usar la media
17
Estadística Inferencial
18
Estadística Inferencial
19
Estadística Inferencial
la población? Para responder esta pregunta se debe tener en
cuenta que la distribución muestral del estadístico depende de:
La distribución de la población, es decir, de la distribución
de probabilidad de la variable de interés (por ejemplo
edad de las mujeres que usan un servicio)
Del parámetro de interés (media, variabilidad)
Del estadístico que se elija para estimar el parámetro
(media aritmética o mediana, desviación estándar
muestral)
De la forma de selección aleatoria de la muestra.
Del tamaño de la muestra.
20
Estadística Inferencial
21
Estadística Inferencial
Z = X −µ (1)
σ/ n
MEDIA µ
DESVÍO
ESTÁNDAR σ σ
DESVÍO ERROR ESTÁNDAR
ESTÁNDAR n
x1
M1
x2
µ−σ/ n
M2
x3
µ
M3
x4
M4 ...
µ+σ/ n
.
X
Mm xm
POBLACIÓN DE X POBLACIÓN DE X
MUESTRAS DE TAMAÑO n
Observación:
Aunque siempre hay excepciones, tamaños de muestras de n =
30, o más, en la gran mayoría de los casos aseguran la validez
del teorema del límite central, es decir, la distribución muestral
22
Estadística Inferencial
23
Estadística Inferencial
2. Estimación
En esta Sección se dará algunas propiedades que debería
cumplir un estimador para conseguir estimaciones confiables
del parámetro de interés. Se considerará diferentes formas de
estimación y se estudiará una manera de medir la precisión en
la estimación.
24
Estadística Inferencial
25
Estadística Inferencial
Observaciones:
1. No debe confundirse “desviación estándar” de la distribución
de la población (variabilidad entre los individuos) con “error
estándar” del estimador que es la desviación estándar de la
distribución muestral (variabilidad entre las estimaciones de
las muestras).
2. Es muy probable que el estadístico insesgado más eficiente
no estime el parámetro poblacional con “exactitud”, esto se
debe a que en realidad cuando realizamos la estimación
sólo tomamos una muestra, y obtenemos uno de los
posibles valores del estadístico que en general no tiene
porque coincidir con el valor del parámetro que se quiere
estimar.
26
Estadística Inferencial
27
Estadística Inferencial
o bien
zα 2 σ zα 2 σ
x− ≤ µ≤ x + (6)
n n
donde
• z α 2 = valor de z tal que el área debajo de la
curva de la función de densidad de una
distribución normal correspondiente al intervalo
[ z α 2 , ∞) es igual α/2 si n es grande (este valor
es 1.96).
• n = tamaño de la muestra
• σ = desviación estándar de al población
muestreada
28
Estadística Inferencial
SE (x ) =
S 0.24
= = 0.034
n 50
y el valor de t(n-1),α/2 = 2.01. Luego, el intervalo de confianza para
la media poblacional con una confianza del 95% está dado por:
IC95% = [9.1 – 2.01x0.034; 9.1 + 2.01x0.034] = [8.96; 9.10]
Observaciones:
29
Estadística Inferencial
Actividad 2:
1. Se relaciona muchas veces un incremento en la proporción
de ahorros de los consumidores a una falta de la confianza
en la economía, y se dice que ello es un indicador de una
tendencia de recesión económica. Una muestra aleatoria de
n=200 cuentas de ahorro en una comunidad local, mostró un
incremento medio en los valores de las cuentas de 7,2% en
los últimos 12 meses y una desviación estándar de 5,6%.
a) Estime el intervalo de confianza para el aumento
porcentual promedio en las cuentas de ahorro en lo
últimos 12 meses, para ahorradores de la comunidad.
b) Obtenga una cota para su error de estimación.
2. Escriba la expresión para el IC para el parámetro de la
distribución binomial cuando n es mayor de 30.
30
Estadística Inferencial
31
Estadística Inferencial
32
Estadística Inferencial
33
Estadística Inferencial
34
Estadística Inferencial
AMERICANO EUROPEO
5%
7.93%
35
Estadística Inferencial
de la probabilidad del error Tipo I que brindan las salidas de
tales paquetes de programas, denominado P-value o
simplemente P. Este procedimiento lo podemos resumir en los
siguientes pasos:
1. Suponer que Ho es cierta.
2. Para confrontar esta suposición con la información
(parcial) que proveen los datos sobre la realidad de
Ho, se forma “una especie de indicador” de
concordancia, denominado estadístico del test, el
cual es función del de los datos.
3. Como el estadístico depende de la información de los
datos, con cada muestra posible hay asociado un
valor de este estadístico y en consecuencia se genera
una nueva variable aleatoria. Asociada a esta variable
hay una cierta distribución de probabilidad, a partir de
la cual se determina la probabilidad de que la
información de los datos concuerde con la hipótesis
nula, denominado “P-value”. De esta manera, el “P-
value” representaría la probabilidad de cometer un
error cuando se toma la decisión de rechazar Ho.
4. Es claro que si de antemano se fija que la máxima
probabilidad de error al rechazar Ho debe ser igual a
α, otra manera de tomar la decisión es comparar el
valor del P- value con α.
Si P ≤ α entonces la decisión es Rechazamos Ho
Si P > α la decisión es No hay evidencia
suficiente para rechazar Ho
36
Estadística Inferencial
37
Estadística Inferencial
38
Estadística Inferencial
39
Estadística Inferencial
Observación:
1. Si el estadístico del test es Z como el definido en (1) y donde
µ = µ0, entonces, si Z es menor que –1,96, entonces
decimos que se rechaza la hipótesis nula al nivel del 5%.
2. El intervalo de confianza de 100(1-α)% del parámetro θ
(parámetro poblacional de interés), está relacionado con una
prueba de hipótesis estadística, de dos colas, del parámetro
poblacional, con nivel α. En el ejemplo, el intervalo
σ
x ± 1,96 ≅ 871 ± 5 ,82 es de tal manera que en un
n
muestreo repetitivo, el 100(1-α)% = 95% de los intervalos
contendrán al verdadero valor de la media poblacional.
Como el valor 880 no cae dentro de este intervalo, entonces
nos inclinamos a rechazar la hipótesis de que µ = 880.
Actividad 3:
Un vendedor de coches nuevos calcula que su compañía tiene
un 4,8% de ganancias promedio en la venta de los autos
nuevos asignados. El gerente de venta aprobó los precios para
producir ese porcentaje de ganancias. El dueño de la compañía
quiere estar razonablemente seguro de que la decisión es
correcta, para ello se toma una muestra aleatoria de 30 coches
en la cual se obtiene una media y una desviación estándar del
porcentaje de ganancia de 4,5% y 3,9% respectivamente.
a) Examine los datos y utilizando solamente la intuición
¿Cree que ellos apoyan la hipótesis del gerente de venta?
b) Para realizar un test de hipótesis estadística en este caso
usaría el estadístico t o z. Explique su respuesta.
c) Usando el procedimiento de un test de hipótesis para la
ganancia media, ¿aportan los datos evidencia suficiente
que indique que la política del gerente de ventas al
aprobar los precios genera una ganancia media de 4,8%
por coche al nivel del 5%?. (Sugerencia: use uno de estos
valores para el estadístico seleccionado Z(0.025) = 1.96 y
t 0.025,(30−1) = 2.045 )
40
Estadística Inferencial
c) Hipótesis alternativa
Test de una cola Test de dos colas
H1: (µ1-µ2) > D0
H1: (µ1 − µ 2 ) ≠ D0
(o H0: (µ1-µ2) < D0)
41
Estadística Inferencial
z=
(x 1 − x 2 ) − D0 (x1 − x 2 ) − D0
= ,
σ (x1 − x 2 ) σ 12 σ 22 (13)
+
n1 n2
donde z tiene una distribución normal con media 0
y desviación estándar 1, bajo la hipótesis nula.
z=
( x1 − x2 ) − D 0
σ
1 1
+ (14)
n1 n2
s 2p =
(n1 − 1)s12 + (n2 − 1)s22
(15)
n1 + n2 − 2
Entonces, el estadístico del test toma la forma
t=
( x1 − x2 ) − D0
sp
1 1
+ (16)
n1 n2
que tiene una distribución t con (n1+n2-2) grados
de libertad, bajo la hipótesis nula.
Observación:
1. En la situación en que no se puede o no se desea hacer la
suposición de que las dos poblaciones con varianzas
iguales tengan distribución normal, la prueba t de varianzas
iguales es robusta (es decir, no sensible) con respecto a las
violaciones moderadas de la suposición de normalidad,
siempre y cuando el tamaño de muestra sea grande. En tal
situación, el test t de varianza conjunta puede utilizarse sin
que se vea seriamente afectado en su potencia. Por otro
42
Estadística Inferencial
t′ =
(x 1 − x 2 ) − D 0 ,
s12 s 22 (17)
+
n1 n 2
ν=
(s 2
1 n1 + s22 n2 )
2
(s
2
1 n1 ) (
2
s2 n
+ 2 2
)
2
(18)
n1 − 1 n2 − 1
43
Estadística Inferencial
d) Región de rechazo
Prueba de una cola Prueba de dos colas
Para los casos 1 y 2 Para los casos 1 y 2
z > zα (o bien z <- zα) z > zα 2 o z < − zα 2
Observaciones:
1. El uso del estadístico t y t´ requiere que las muestras sean
independientes y tengan distribución normal
2. El uso del estadístico t´ requiere que las poblaciones
tengan distribución normal.
44
Estadística Inferencial
45
Estadística Inferencial
x1 = $31083 x 2 = $29745
s1 = $2312 s 2 = $2569
La pregunta que surge es, ¿proporcionan los datos evidencia
que indique una diferencia en el promedio de ingreso anual
esperado tanto entre los vendedores como las vendedoras?.
Ya que se espera una diferencia en el promedio del ingreso
anual entre las vendedoras y los vendedores, es decir, µ1 < µ2 o
bien µ1 > µ2, la hipótesis nula para el test será
H0: µ1 = µ2 es decir H0: µ1 -µ2 = D0 = 0
contra la alternativa
H 1 : µ1 ≠ µ 2 es decir H 1 : (µ 1 − µ 2 ) ≠ 0
Si se supone que las poblaciones de los ingresos son normales
con diferentes desviaciones estándares y puesto que ellos son
desconocidos, se los estima con s1 y s2. Luego, el estadístico
del test está dado por (17), es decir,
t=
(x 1 − x2 )− 0
=
(31083 − 29745) − 0 = 2,45
2
s
1
+
s 2
2 (2312)2 + (2569)2
n1 n 2 40 40
Al utilizar una prueba de dos colas con α = 0,05, se considerará
α/2 = 0,025 en cada cola de la distribución del estadístico y se
rechaza H0 si el valor encontrado es mayor que
tα 2( n1 + n2 − 2 ) = 1.99 o menor que - tα 2( n1 + n2 − 2) = − 1.99 .
Puesto que, el valor observado t = 2,45 es mayor que 1,99, el
estadístico de la prueba cae en la zona de rechazo. Por lo tanto
se rechaza H0 y se concluye que hay evidencia suficiente
para asegurar que en las expectativas salariales anuales
para los vendedores es mayor que para las vendedoras.
Actividad 4:
1. Para comparar las aptitudes para seleccionar acciones por
parte de dos AFJP, se comparan las ganancias anuales
(menos los honorarios) para una inversión de $1000
(dólares) en cada una de las 30 acciones que se encuentran
en las listas de las “más recomendadas” de ambas
empresas. Las medias y las desviaciones estándares (en
dólares) para cada una de las muestras, se indican en la
tabla siguiente
46
Estadística Inferencial
Empresa
Estadística muestral 1 2
Tamaño 30 30
Media 264 199
Desviación estándar 157 111
¿Hay evidencia con los datos que indique una diferencia
entre las dos empresas de corretaje en las ganancias
medias por acción recomendada?
a) Establezca H0
b) Enuncie la hipótesis alternativa que más conviene
para contestar la pregunta expuesta antes.
c) Obtenga la región de rechazo para α = 0,05.
d) Realice la prueba y saque sus conclusiones.
e) Obtenga el correspondiente Intervalo de Confianza
para la diferencia de las medias y compare las
conclusiones que se pueden elaborar con él con
aquellas obtenidas por el test de hipótesis.
47