Está en la página 1de 160

CAPTULO I

Estadstica Descriptiva
Mara Margarita Olivares M.
Abril 2004
1 INTRODUCCIN:
Si estamos interesados en conocer alguna caracterstica de una poblacin (
conjunto de individuos u objetos) acerca de la que se quiere saber algn as-
pecto claramente denido, lo ms completo sera estudiar la poblacin entera.
Pero este procedimiento requiere mucho tiempo y resulta muy costoso, as que
normalmente nos conformamos con el conocimiento parcial de la poblacin
muestra, que elegida adecuadamente sea representativa de sta.
El objetivo de la estadstica es hacer inferencia ( tomar decisiones
hacer predicciones) acerca de una poblacin, basndose en la informacin
contenida en una muestra. Es decir, integrando el clculo de probabilidades
(que nace en el siglo XVII como teora matemtica de los juegos de azar)
y la Estadstica Descriptiva o ciencia del estado, del latn Status, que es-
tudia la descripcin de datos y tiene races ms antiguas, se obtiene una
ciencia (Estadstica Matemtica) que estudia cmo obtener conclusiones de
la investigacin emprica mediante el uso de modelos matemticos.
La estadstica acta como puente entre los modelos matemticos y los
fenmenos reales. Un modelo matemtico es una abstraccin simplicada
de una realidad ms compleja y siempre existir cierta discrepancia entre
lo observado y lo previsto por el modelo. La Estadstica nos proporciona
un mtodo para evaluar estas discrepancias entre la realidad y la teora. Su
estudio es bsico para todos aquellos que quieran trabajar en ciencia aplicada
(economa, sociolaga, etc.).
En nuestra era cada aspecto de la actividad humana es medido e inter-
pretado en trminos estadsticos. El conocimiento bsico de los mtodos
1
estadsticos nos permitir participar en los argumentos pblicos basados en
cifras y datos por lo que es un buen antdoto ante posibles manipulaciones.
Hay cinco elementos fundamentales en todo problema estadstico:
1. Denir claramente la pregunta que se desea responder acerca de la
poblacin.
2. Procedimiento de muestreo diseo del experimento.
3. Recoleccin y anlisis de datos.
4. Hacer inferencia acerca de la poblacin mediante una probabilidad.
5. Conabilidad de la inferencia bondad del ajuste.
Cuando planteamos con claridad la pregunta que queremos responder
acerca de la poblacin, procedemos a la recoleccin de datos numricos rela-
cionados con el estudio que queremos hacer.
2 Estadstica Descriptiva e Inferencia:
Una vez obtenido los datos debemos organizarlos, lo que se hace siguiendo
ciertos mtodos que constituyen la Estadstica Descriptiva. Los mtodos
comnmente usados son de tres tipos: Mtodos de Tabulacin, Mtodos
Grcos y Mtodos Numricos.
Los primeros de ellos se constituyen a partir de la elaboracin de tablas
que incluyen los datos numricos. Los mtodos grcos exigen la elaboracin
de grcos, entre los cuales los ms usados son los de barras, los circulares e
histogramas. Los mtodos numricos consisten en obtener ciertas relaciones
cuantitativas a partir de los datos.
Una vez realizado el estudio de los datos mediante los mtodos de la Es-
tadstica Descriptiva, se trata entonces de inferir o sacar conclusiones sobre
algunos aspectos de la poblacin, que generalmente se reere a la conrma-
cin de alguna hiptesis, (prueba de hiptesis) o a la estimacin de algn
promedio numrico u otras caractersticas de la poblacin (estimacin de
parmetros). Esta parte constituye lo que se conoce con el nombre de Es-
tadstica Inferencial o Inferencia Estadstica.
2
El siguiente diagrama resume lo expuesto anteriormente:
Estadstica

Descriptiva

Mtodos de Tabulacin
Mtodos Grcos
Mtodos Numricos
Inferencia

Estimacin de parmetros
Pruebas de Hiptesis.
3 CONCEPTOS BSICOS.
3.1 Estadstica Descriptiva: Una Variable
Supongamos que tenemos una fuente de material radioactivo que emite partcu-
las Alfa () y que denimos la variable aleatoria X como el nmero de
partculas observadas en una pantalla, en un intervalo de tiempo t. Bajo
ciertas hiptesis que idealizan el experimento, X tiene una distribucin de
Poisson de parmetro t.
Si queremos calcular, por ejemplo, la probabilidad de que X sea mayor
que 10 u otras caractersticas asociadas con la distribucin tales como la
esperanza, la varianza, etc., la respuesta depender del parmetro y del
intervalo de tiempo t.
Para buscar un valor numrico de , dejamos el mundo de los modelos
matemticos tericos y entramos en el mundo de las observaciones, es decir,
observamos la emisin de partculas, obtenemos algunos valores numricos de
X y luego los utilizamos de alguna manera, a n de obtener una informacin
atinada del parmetro .
En general, un material estadstico que consiste en cierto nmero de
observaciones
x
1
, x
2
, , x
N
de una variable aleatoria X, dado en la forma original, en la que los N re-
sultados aparecen en el orden en que se han observado, es muy difcil de
examinar y por lo tanto no es adecuado para darnos informacin acerca de
la variable X investigada.
El propsito de la Estadstica Descriptiva es reemplazar el material ob-
servado por cantidades relativamente pocas en nmero, que representen el
material total en otras palabras, que contenga tanta informacin como sea
posible respecto a la variable X.
3
Tipos de variables:
Los tipos de variables que consideraremos, son:
1. Variables cualitativas o atributos: no toman valores numricos y de-
scriben cualidades. Por ejemplo, clasicar una pieza como aceptable o
defectuosa.
2. Variables cuantitativas discretas: toman slo valores enteros, en muchos
casos se limita a contar el nmero de veces que ocurre un suceso. Por
ejemplo, nmero de compras de un producto en un mes.
3. Variables cuantitativas continuas: toman valores en un intervalo, cor-
responde a medir magnitudes continuas. Por ejemplo, tiempo entre la
llegada de dos autobuses.
3.1.1 MUESTRA OBSERVADA:
Sea X una variable aleatoria asociada a cierto experimento. Si realizamos N
veces el experimento, de manera independiente y bajo las mismas condiciones,
obtendremos N valores numricos, en caso de variables cuantitativas:
x
1
, x
2
, , x
N
correspondientes a la variable aleatoria X. A estos resultados obtenidos se les
llama muestra observada.
Cuando esta muestra no se somete a ninguna ordenacin especial, se le
denomina muestra bruta.
3.1.2 RECOPILACIN DE DATOS: Tablas de Frecuencias.
Los valores observados se suelen registrar en una lista. Si el nmero de obser-
vaciones no excede 20 o 30, por ejemplo, es posible darse una idea aproximada
de la distribucin, simplemente mediante la ordenacin de los valores obser-
vados, escribindolos en una tabla, en orden creciente de magnitud. Con
estos datos podemos hacer representaciones grcas y calcular determinadas
caractersticas numricas.
Si el conjunto de datos es muy grande, resulta laborioso trabajar direc-
tamente con los valores individuales observados y entonces se lleva a cabo
algn tipo de agrupacin, como paso preliminar, antes de iniciar un nuevo
tratamiento de los datos.
4
El procedimiento de agrupacin es diferente segn la variable aleatoria
sea discreta o continua.
La presentacin de los datos en forma agrupada implica alguna prdida
de informacin, pero permite apreciar mejor sus caractersticas.
Este agrupamiento se hace mediante las llamadas tablas de frecuencias.
En la tablas de frecuencias, en lugar de mostrar individualmente todos los
datos, se informa solamente cuntos de ellos estn comprendidos entre de-
terminados valores, llamados lmites de clase. Las clases son intervalos cuyos
extremos son los lmites de clase. Generalmente las clases se escogen de igual
longitud.
Una regla emprica que se suele aplicar consiste en escoger los intervalos
de clase de tal forma que no haya menos de 10 ni ms de 20 clases diferentes.
Veamos cmo se lleva a cabo la agrupacin en cada uno de los casos:
1. Caso Discreto:
En este caso resulta conveniente hacer una tabla cuya primera columna
contenga todos los valores observados y la segunda contenga la fre-
cuencia con que han aparecido dichos valores o frecuencias absolutas.
Tambin se suele aadir una tercera columna que contiene la frecuencia
relativa de los datos observados, a saber, la razn entre la frecuencia
absoluta y el nmero total de observaciones.
Este tipo de agrupacin se utiliza cuando el nmero total de valores
observados no es muy grande, en caso contrario, en lugar de asignar una
clase a cada valor observado, podemos considerar clases que contengan
varias observaciones.
Ejemplo: se cuenta el nmero de glbulos rojos en cada uno de los
169 compartimientos de un hemocitmetro. Cada uno de los compar-
timientos representa una observacin y el nmero de glbulos rojos
en cada una de ellos es el valor observado correspondiente. De dicha
5
observacin se obtiene la siguiente tabla de frecuencias:
N
o
de Globulos rojos Frecuencia Absoluta Frecuencia Relativa
4 1
1
169
5 3
3
169
6 5
5
169
7 8
8
169
8 13
13
169
9 14
14
169
10 15
15
169
11 15
15
169
12 21
21
169
13 18
18
169
14 17
17
169
15 16
16
169
16 9
9
169
17 6
6
169
18 3
3
169
19 2
2
169
20 2
2
169
21 1
1
169
Total 169 1
Con esta informacin podemos hacer un grco por medio del llamado
Histograma, que en este caso se elabora levantando una lnea o barra
sobre cada clase, de altura proporcional a la frecuencia correspondiente
o a la frecuencia relativa.
2. Caso Continuo:
En el caso en que la variable aleatoria investigada es continua, la agru-
pacin es algo ms complicada, sin embargo, en general, se procede de
la siguiente manera: se toma un intervalo adecuado de la recta real
que contenga los N valores observados y se divide dicho intervalo en
un cierto nmero de intervalos de clase.
Todas las observaciones que caen en una misma clase se agrupan y se
cuentan, el nmero resultante es la frecuencia de clase correspondiente
a dicho intervalo y despus se procede a tabular. Para proceder a la
eleccin de los lmites de clase debemos conocer la exactitud de los
6
datos originales. Cuando la tabla de frecuencia ya ha sido elaborada
debe ir acompaada de la exactitud de los datos.
Ilustraremos el procedimiento mediante algunos ejemplos:
(a) Se preparan, con la misma mezcla setenta cilindros de concreto y
se mide la resistencia a la compresin de cada uno de ellos. Los
resultados originales o muestra bruta estn dados con cuatro cifras
enteras. La siguiente tabla representa la muestra bruta:
2860 3052 2940 3128 2865 3125 2881
2950 2911 2883 3027 2872 2942 3042
3128 2965 3109 2886 3045 3238 2965
3300 3193 2865 3298 2932 2782 3201
2961 2832 2950 3059 3052 3017 3001
3045 2944 3038 2968 2953 2998 3275
3185 3003 3317 2875 2820 2808 2973
2857 2903 2910 2957 2891 2899 2884
3015 3061 3097 3085 2975 3072 3115
3073 3169 3133 3152 3102 3251 2702
Procedamos a tabular estos resultados en una tabla de frecuencias:
La diferencia entre el mximo y el mnimo valor observado es
3317 2702 = 615
(esta diferencia se llama rango de la muestra). Vamos a construir
una tabla de once clases (615/11 ' 60) , esta decisin es un tanto
arbitraria, la longitud comn de cada clase ser de 60 unidades.
Nuestro primer impulso sera tomar como clases los siguientes in-
tervalos:
(2700, 2760)
(2760, 2820)
(2820, 2880) , etc.
pero tomando los lmites de esta manera, no sabramos en qu
clase incluir los valores que coinciden con los lmites de dichos
intervalos, como por ejemplo 2820. Para evitar este tipo de am-
bigedad podramos tomar los siguientes intervalos:
(2700, 2759)
(2760, 2819)
(2820, 2879) , etc.
7
con esta eleccin, dejamos un hueco entre 2759 y 2760, etc., pero
por la precisin de los datos sabemos que all no hay observaciones,
sin embargo, es preferible elegir como lmites exactos de cada clase
los puntos correspondientes a medias unidades de la ltima cifra
signicativa de los lmites anteriores, es decir:
(2699.5, 2759.5)
(2759.5, 2819.5)
(2819.5, 2879.5) , etc.
en este caso estamos seguros de que ninguna observacin caer en
un lmite de clase.
Clase Frecuencia Absoluta Frecuencia relativa
(2699.5, 2759.5) 1
1
70
' 0, 0143
(2759.5, 2819.5) 2
2
70
' 0, 0286
(2819.5, 2879.5) 7
7
70
' 0, 1000
(2879.5, 29539.5) 11
11
70
' 0, 1571
(2939.5, 2999.5) 14
14
70
' 0, 2000
(2999.5, 3059.5) 12
12
70
' 0, 1714
(3059.5, 3119.5) 8
8
70
' 0, 1143
(3119.5, 3179.5) 6
6
70
' 0, 0857
(3179.5, 3239.5) 4
4
70
' 0, 0571
(3239.5, 3299.5) 3
3
70
' 0, 0429
(3299.5, 3359.5) 2
2
70
' 0, 0286
Total 70 1,0000
Esta informacin puede ser representada grcamente mediante
un histograma, levantando sobre cada clase un rectngulo de al-
tura proporcional a la frecuencia correspondiente o alternativa-
mente a la frecuencia relativa. Si se unen con segmentos las alturas
de los rectngulos que constituyen el histograma, en las correspon-
dientes marcas de clase, se obtiene una poligonal denominada pol-
gono de frecuencias, el cual puede suavizarse mediante una curva
suave.
(b) Se determina el porcentaje de ceniza en una muestra de carbn,
extrada de 250 vagones diferentes. Los datos originales son exac-
tos hasta la segunda cifra decimal, representados en la siguiente
8
tabla de frecuencias:
Clase(% de ceniza) Frecuencia Absoluta Frecuencia Relativa
(9, 9.99) 1
1
250
(10, 10.99) 3
3
250
(11, 11.99) 3
3
250
(12, 12.99) 9
9
250
(13, 13.99) 13
13
250
(14, 14.99) 27
27
250
(15, 15.99) 28
28
250
(16, 16.99) 39
39
250
(17, 17.99) 42
42
250
(18, 18.99) 34
34
250
(19, 19.99) 19
19
250
(20, 20.99) 14
14
250
(21, 21.99) 10
10
250
(22, 22.99) 4
4
250
(23, 23.99) 3
3
250
(24, 24.99) 0
0
250
= 0
(25, 25.99) 1
1
250
Total 250 1
Los datos se agrupan tal como aparecen en la tabla de forma que,
por ejemplo, el intervalo de clase (14, 14.99) contenga todas las
observaciones registradas con valor de 14 a 14.99, ambos inclusive.
Al agrupar los datos originales, si registramos una observacin, por
ejemplo, 14.27 con dos cifras decimales exactas, el valor realmente
observado se encuentra entre 14.265 y 14.275. Los lmites exactos
de este intervalo de clase son 13.995 y 14.995. Si los datos hubiesen
sido dados con una cifra decimal exacta, los intervalos de clase
seran de la forma (14.0, 14.9) con lmites exactos 13.95 y 14.95.
Cuando se utilizan los datos ya agrupados, para los clculos, se
supone que todas las observaciones que pertenecen a una clase
dada, estn situadas en el punto medio de dicha clase. Al hacer
esta aproximacin, se introduce un error que evidentemente se
puede hacer tan pequeo como queramos, tomando los intervalos
de clase sucientemente pequeos y reduciendo as la prdida de
informacin debida a la agrupacin. Sin embargo sto aumenta el
9
largo de la tabla y nos hace perder algo de simplicacin que es la
razn de la agrupacin. Como regla prctica se acostumbra tener
un nmero de clases entre 10 y 20.
3.1.3 FRECUENCIAS ACUMULADAS.
La frecuencia absoluta acumulada es el nmero de observaciones menores
o iguales a una cierta cantidad dada. El cociente entre frecuencia absoluta
acumulada y el nmero de observaciones, es la frecuencia relativa acumulada.
3.1.4 EJEMPLO:
Consideremos la siguiente tabla de frecuencias:
Clases Frecuencias Absolutas Frecuencias Relativas
(100, 109.5) 2
2
26
(110, 119.5) 1
1
26
(120, 129.5) 6
6
26
(130, 139.5) 4
4
26
(140, 149.5) 6
6
26
(150, 159.5) 4
4
26
(160, 169.5) 0
0
26
= 0
(170, 179.5) 1
1
26
(180, 189.5) 1
1
26
(190, 199.5) 0 0
(200, 209.5) 1
1
26
Total 26 1
10
A partir de ella construmos la tabla de frecuencias acumuladas:
Observaciones x Frec. Absol. Acumulada Frec. Rel. Acumulada
100 0 0
110 2
2
26
120 3
3
26
130 9
9
26
140 13
13
26
150 19
19
26
160 23
23
26
170 23
23
26
180 24
24
26
190 25
25
26
200 25
25
26
210 26
26
26
= 1
El grco resulta ser escalonado y creciente. Esta informacin se suele rep-
resentar mediante las ojivas que son curvas equivalentes a polgonos de fre-
cuencias acumuladas, suavizado.
3.1.5 MTODOS GRFICOS.
Para representar grcamente los datos, existen, adems del histograma,
otros tipos de grcos, tales como grcos de sectores circulares, grcos de
barras, grcos de lneas, pictogramas, polgonos de frecuencia u ojiva.
3.2 DESCRIPCIN NUMRICA DE DATOS.
Corresponde a medidas de centralizacin o dispersin, estos nmeros ayudan
a completar la informacin obtenida mediante las tabulaciones y grcos.
Las medidas de centralizacin ms usuales son: la media o promedio, la
moda y la mediana.
Las medidas de dispersin ms usuales son el rango, la varianza y la
desviacin estndar.
3.2.1 MEDIA OBSERVADA O PROMEDIO:
Se llama media observada de una muestra al promedio aritmtico de las
observaciones, es decir, si x
1
, x
2
, , x
n
son las observaciones individuales,
11
la media observada ser:
_
x =
1
N
N
X
i=1
x
i
Esta frmula slo es aplicable cuando se ha conservado la muestra bruta.
Si hemos perdido los datos originales y disponemos solamente de una tabla
de frecuencias, identicamos todos las observaciones correspondientes a una
clase con un valor nico, denominado marca de clase,(en general se toma
como marca de clase el punto medio del intervalo de clase); es decir, si y
i
es la marca de de la isima clase, f
i
la frecuencia de esta clase y
i
=
f
i
N
la frecuencia relativa de esta clase, podemos calcular la media observada
mediante la frmula:
_
x =
1
N
M
X
i=1
y
i
f
i
=
M
X
i=1
y
i

i
.
donde M es el nmero de clases. Para simplicar los clculos, puesto que
de todas formas se trata de una aproximacin, es permisible, cuando se han
adoptado intervalos disjuntos, hacer coincidir los lmites adyacentes. Por
ejemplo, en los intervalos
(2700, 2759)
(2760, 2819)
podemos tomar como maraca de clase
2700 + 2760
2
= 2730
en lugar de
2700 + 2759
2
= 2729.5
3.2.2 VARIANZA Y DESVIACIN ESTNDAR OBSERVADA.
Se llama varianza observada de una muestra x
1
, x
2
, , x
n
al valor
s
2
=
1
N
N
X
i=1

x
i

_
x

2
12
Algunas veces se preere trabajar con la varianza centrada, (como veremos
ms adelante tiene buenas propiedades), denida como
s
2
1
=
1
N 1
N
X
i=1

x
i

_
x

2
Note que
s
2
=
N 1
N
s
2
1
as, si N , s
2
= s
2
1
.
La desviacin estndar observada es s y la centrada es s
1.
Cuando no
disponemos de la muestra bruta y en su lugar contamos con la tabla de
frecuencias, calculamos las varianzas de manera anloga al caso de la media,
mediante las frmulas:
s
2
=
1
N
M
P
i=1
f
i

y
i

_
x

2
=
M
P
i=1

y
i

_
x

2
s
2
1
=
1
N1
M
P
i=1
f
i

y
i

_
x

2
=
N
N1
M
P
i=1

y
i

_
x

2
donde M es el nmero de clases. La varianza y la desviacin estndar miden
el grado de dispersin de los datos alrededor de la media.
Para el clculo de la varianza y la desviacin estndar las siguientes fr-
mulas son tiles, stas se obtienen fcilmente y se dejan como ejercicio:
s
2
=
1
N
N
P
i=1
x
2
i

_
x
2
s
2
1
=
1
N1

N
P
i=1
x
2
i
N
_
x
2

Propiedad de la Distribucin Normal Estndar: Si Z tiene distribu-


cin N(0, 1),
P(1 < Z < 1) = 0.6826
es decir, el 68, 26% de las observaciones caen en el intervalo (1, 1) , de man-
era anloga se tiene que el 95, 44% de las observaciones caen en el intervalo
(2, 2) y el 99, 74%de las observaciones caen en el intervalo (3, 3) .
Si la distribucin de X es N(, ), se obtiene que el 68, 26% de las obser-
vaciones caen en el intervalo ( , +) ,el 95, 44% de las observaciones
13
caen en el intervalo ( 2, + 2) y el 99, 74%de las observaciones caen
en el intervalo ( 3, + 3) .
De esta propiedad se obtiene la llamada regla emprica que se verica
en los casos en que el histograma correspondiente a las observaciones tiene
forma de campana:
La Regla Emprica:
Dada una distribucin de observaciones que es aproximadamente acam-
panada, el intervalo
1. ( , +) contiene aproximadamente el 68% de las observaciones
2. ( 2, + 2) contiene aproximadamente el 95% de las observaciones
3. ( 3, + 3) contiene casi todas las observaciones.
EJEMPLOS:
1. Si obsevamos la tabla de datos correspondiente a la medida de la re-
sistencia a la compresin de 70 cilindros de concreto, obtendremos:
_
x = 3010, 8857
s = 133, 84112
s
1
= 134, 80794
_
x es una buena medida de la media o centro de los datos ya que 37
observaciones son menores que
_
x y 33 mayores. En el intervalo

_
x s,
_
x +s

= (2887, 04458; 3144, 72682)


se encuentran 44 observaciones de las 70 observadas. En este caso
_
x y
s describen los datos adecuadamente.
2. La siguiente tabla o muestra bruta , representa el ingreso anual en miles
de dlares de 42 familias en un pueblo de E.E.U.U. (1977).
1,2 17,0 23,2 36,0 74,7 152,2 19,6
29,3 8,2 20,6 20,1 8,8 10,7 26,0
11,6 39,4 157,4 10,3 16,2 100,2 37,7
14,5 151,2 10,1 92,3 7,7 47,6 29,0
26,8 8,2 25,8 8,0 19,4 21,2 150,1
28,1 17,8 26,8 17,8 19,3 37,2 13,4
14
En la siguiente tabla de frecuencia correspondiente a esta muestra, se
observa enseguida que el comportamiento de los datos es mucho ms
errtico que en la tabla anterior:
Clases($) Frecuencia Absoluta Frecuencia Relativa
(100, 10000) 6
6
42
= 1/7 = 0, 1429
(10000, 20000) 13 13/42 = 0, 3095
(20000, 30000) 11 11/42 = 0, 2619
(30000, 50000) 5 5/42 = 0, 1190
(50000, 160000) 7 7/42 = 0, 1667
Si se representan estos datos en un histograma de frecuencias obser-
varn que no es simtrico alrededor de ningn punto ya que tiene una
cola larga hacia la derecha ( sesgado hacia la derecha). Para estos datos
_
x = 37, 28$
s = 41, 35
este promedio no es un valor particularmente tpico, de hecho, 32 de
los 42 datos son menores que
_
x y slo 10 son mayores, es decir,
_
x no
es una buena medida de centramiento; el histograma tiene este gran
sesgo a la derecha, ( empuje del promedio a la derecha) de tal manera
que 75% de las observaciones quedan a la izquierda del promedio. La
diferencia grande entre los datos ejerce una gran inuencia en el valor
del promedio y lo hacen tener un valor no centrado, al igual que hace
crecer la desviacin estndar.
En resumen, para datos fuertemente sesgados (a la derecha o a la
izquierda)
_
x, s s
1
pueden no ser los parmetros que describan el cen-
tro y dispersin de los datos, en este caso es conveniente denir otras
medidas de centramiento.
3.2.3 RANGO DE LA MUESTRA.
Si
x
1
, x
2
, x
3
, , x
N
una muestra observada, denimos el rango de esta muestra como la
diferencia entre la mayor y la menor de las observaciones:
R = max
1iN
x
i
min
1iN
x
i
15
3.2.4 Coeciente de Variacin o coeciente de dispersin de la
muestra:
El coeciente de dispersin de la muestra observada expresa la magnitud de
la dispersin con respecto a su media:
s
_
x
o altenativamente
s
1
_
x
3.2.5 Momentos de orden n de una muestra observada:
Si
x
1
, x
2
, x
3
, , x
N
una muestra observada, denimos el momento de orden n de esta mues-
tra como:
M
n
=
1
N
N
X
i=1

x
i

_
x

n
y is disponemos nicamentede la tabla de frecuencias:
M
n
=
1
N
M
X
i=1
f
i

y
i

_
x

n
=
M
X
i=1

y
i

_
x

n
donde M es el nmero de clases, f
i
es la frecuencia absoluta y
i
la frecuencia
relativa de la clase i.
3.2.6 Moda de la Muestra Observada.
Si
x
1
, x
2
, x
3
, , x
N
una muestra observada, llamamos moda de la muestra al valor que se
presenta con mayor frecuencia. Si disponemos solamente de una tabla de
frecuencias, tomaremos como moda el punto medio del intervalo de clase de
mayor frecuencia.
3.2.7 Mediana de la Muestra Observada.
Si
x
1
, x
2
, x
3
, , x
N
16
una muestra observada, representamos por
x
(1)
, x
(2)
, x
(3)
, , x
(N)
el mismo conjunto de datos ordenados de mayor a menor, es decir:
x
(1)
x
(2)
x
(3)
x
(N)
Una nueva medida del centro del conjunto de datos est dada por la mediana
m que es el valor central o promedio de los valores centrales de la muestra
ordenada, es decir:
m =
(
x
(
N+1
2
)
si N es impar
x
(
N
2
) +
x
(
N
2
+1)
2
si N es par
Si ordenamos la tabla de sueldos del ejemplo anterior, de menor a mayor,
como n = 42,
m =
x
(21) +
x
(22)
2
=
20, 6 + 21, 2
2
= 20, 9
m es una mejor medida del centro de los datos cuando estos son sesgados
hacia un lado, m tiene la propiedad de que prcticamente la mitad de los
datos est por debajo de m y la mitad por encima, de modo que en este
sentido es una buena representacin del centro.
Geomtricamente, la mediana es el valor de la abcisa que corresponde
a la vertical que divide el rea encerrada por un histograma en dos partes
iguales.
OBSERVACIN: La mediana de una variable aleatoria X es el punto
x Rtal que
P(X > x) = P(X x) =
1
2
.
Cuando los datos estn agrupados en una tabla de frecuencias, podemos cal-
cular aproximadamente la mediana de la muestra observada mediante un
mtodo que describiremos a continuacin (ste no es el nico mtodo, dis-
tintos mtodos nos llevan a resultados diferentes, pero todos son valores
aproximados de la mediana): Sea N el nmero de observaciones
1. Elegimos un intervalo de clase [e
k
, e
k+1
] tale que
k1
X
i=1
f
i

N
2
,
k
X
i=1
f
i
>
N
2
donde f
i
representa la frecuencia del intervalo [e
k
, e
k+1
] .
17
2. Supondremos que las observaciones que caen en el intervalo [e
k
, e
k+1
] , estn
uniformemente distribudas en dicho intervalo, es decir, si f
k
es el
nmero de observaciones en dicho intervalo y lo subdividimos en f
k
subintervalos
de igual longitud
L
k
=
e
k+1
e
k
f
k
supondremos que en cada subdivisin hay una sola observacin:
(a) Si N es impar nos gustara aproximar la mediana por la obser-
vacin que ocupa el lugar
N+1
2
, cuando la muestra bruta se ordena
de menor a mayor, entonces aadimos a
k1
P
i=1
f
i
la cantidad que
falta para obtener
N+1
2
, es decir, hallamos k
0
tal que
k1
X
i=1
f
i
+k
0
=
N + 1
2
.
Por denicin de [e
k
, e
k+1
] , 1 k
0
f
k
, entonces aproximamos
la observacin
N+1
2
por un nmero en el intervalo

e
k
+ (k
0
1)
e
k+1
e
k
f
k
, e
k
+k
0
e
k+1
e
k
f
k

.
(b) Si N es par aproximamos la mediana por la observacin que ocupa
el lugar
N
2
+ 1, cuando la muestra bruta se ordena de menor a
mayor,para ello elegimos k
0
tal que
k1
X
i=1
f
i
+k
0
=
N
2
+ 1
Por denicin de [e
k
, e
k+1
] , 1 k
0
f
k
, entonces aproximamos
la mediana por un nmero en el intervalo

e
k
+ (k
0
1)
e
k+1
e
k
f
k
, e
k
+k
0
e
k+1
e
k
f
k

Podramos tambien aproximar la mediana por el valor


x
(
N
2
) +
x
(
N
2
+1)
2

= e
k
+ (k
0
1)
e
k+1
e
k
f
k
18
Observe que

N
2
+ 1

N
2
+ 1, si N es par
N+1
2
, si N es impar
donde [x] es parte entera de x.
EJEMPLO: Calculemos la mediana correspondiente a la tabla de frecuen-
cias que describe el porcentaje de ceniza en una muestra de carbn:
N = 250,
N
2
= 125
Para hallar k tal que
k1
X
i=1
f
i

N
2
= 125,
k
X
i=1
f
i
>
N
2
= 125
acudimos a la tabla y sumamos las frecuencias de los intervalos de clase
comenzando por el primero:
1 + 3 + 3 + 9 + 13 + 27 + 28 + 39 = 123 <
N
2
, 123 + 42 = 165 >
N
2
= 125
Luego, el intervalo donde se encuentra la mediana es (17, 17.99) , para sim-
plicar los clculos podemos considerar los lmites exactos del intervalo, es
decir, (16.99, 17.99) cuya longitud es 1 :
e
k+1
e
k
= 1, f
k
= 42, e
k
= 16.99, k = 9
k1
P
i=1
f
i
+k
0
= 123 +k
0
=
N
2
+ 1 = 126, k
0
= 3
La mediana se encuentra en el intervalo

16.99 +
2
42
, 16.99 +
3
42

, m

= 17.05
3.2.8 PERCENTILES:
Como extensin de la idea de mediana ( que divide los datos en dos partes
iguales) podramos pensar en aquellos valores que dividen a los datos en
cuatro partes iguales aproximadamente, representados por Q
i
, i = 1, 2, 3; los
19
cuales se llaman primero, segundo tercer cuartil, respectivamente, claramente
Q
2
es la mediana.
Si denotamos por Q
1
= x
0.25
, Q
2
= x
0.50
, Q
3
= x
0.75
la notacin nos dice el
signicado de cada uno de ellos, as, x
0.25
es un valor tal que aproximadamente
el 25% de las observaciones estn a su izquierda, similarmente para los otros
casos.
Anlogamente, los valores que dividen los datos en diez partes iguales se
llaman deciles:
D
1
= x
0.10
, D
2
= x
0.20
, , D
9
= x
0.90
.
En algunas aplicaciones, especialmente cuando hay una gran cantidad de
datos, es preferible usar percentiles (divisin de datos en cien partes iguales).
El percentil P
p
o percentil p esimo es el centil de p% y representa un nmero
tomado entre las observaciones, ordenadas de menor a mayor tal que p% de
la muestra est a la izquierda y el (100 p)% est a la derecha.
Para hallar P
p
procedemos de manera anloga al caso de la mediana:
1. Si disponemos de la muestra bruta ordenada en orden creciente, podemos
calcular el centil de p% directamente: sea N el nmero de observaciones
(en el caso de la mediana p = 50), el centil p es el dato tal que la can-
tidad de datos que estn debajo de l es
pN
100
si esta cantidad es un entero, aproximamos
P
p
= x
(
pN
100
+1)
o el punto medio de entre los valores x
(
pN
100
)
y x
(
pN
100
+1
)
(como lo hicimos
en el caso de la mediana). Si esa cantidad no es un entero tomamos
parte entera de
pN
100
+ 1 y aproximamos
P
p
= x
([
pN
100
+1])
2. Si no disponemos de la muestra bruta y contamos con la tabla de fre-
cuencias, podemos proceder de la siguiente manera:
20
(a) Elegimos un intervalo de clase [e
k
, e
k+1
] tale que
k1
X
i=1
f
i

pN
100
,
k
X
i=1
f
i
>
pN
100
donde f
i
representa la frecuencia del intervalo [e
k
, e
k+1
] .
(b) Supondremos que las observaciones que caen en el intervalo [e
k
, e
k+1
] , estn
uniformemente distribudas en dicho intervalo, es decir, si f
k
es el
nmero de observaciones en dicho intervalo y lo subdividimos en
f
k
subintervalos de igual longitud
L
k
=
e
k+1
e
k
f
k
supondremos que en cada subdivisin hay una sola observacin.
(c) Calculamos k
0
tal que
k1
X
i=1
f
i
+k
0
=

pN
100
+ 1

entonces, elegimos P
p
en el intervalo

e
k
+ (k
0
1)
e
k+1
e
k
f
k
, e
k
+k
0
e
k+1
e
k
f
k
.

EJEMPLO: Las notas obtenidas por 1350 estudiantes en los exmenes


de ingreso a la Universidad (en base a 100 puntos), en cierto ao, aparece
agrupado en la siguiente tabla de frecuencias:
Clases Frecuencias
(0, 10) 2
(11, 20) 15
(21, 30) 75
(31, 40) 150
(41, 50) 302
(51, 60) 352
(61, 70) 287
(71, 80) 120
(81, 90) 42
(91, 100) 5
Total 1350
21
Clculo de la Moda: el intervalo donde hay ms observaciones es (51, 60) , tomamos
como moda el valor
60 + 51
2
= 55.5
Clculo de la mediana: N = 1350,
N
2
= 675,
N
2
+ 1 = 676 :
2 + 15 + 75 + 150 + 302 = 544 <
N
2
= 675
544 + 352 = 896 > 675, k = 6
Consideramos el intervalo de clase [51, 60] , para facilitar los clculos tomamos
en su lugar el intervalo [50, 60] de longitud 10
e
k+1
e
k
= 10, f
6
= 352,
k1
P
i=1
f
i
+k
0
= 544 +k
0
=
N
2
+ 1 = 676, k
0
= 132
La mediana estar en el intervalo

e
k
+ (k
0
1)
e
k+1
e
k
f
k
, e
k
+k
0
e
k+1
e
k
f
k
.

= (53.72, 53.75)
Si queremos aproximarla por un valor numrico, podemos tomar el punto
medio del intervalo, a saber:
m = 53.73
Clculo del centil 12% :
Np
100
= 162,
Np
100
+ 1 = 163
2 + 15 + 75 = 92 < 162
92 + 150 > 162, k = 4.
Tomamos el intervalo de clase: [e
k
, e
k+1
] = [30, 40] , k
0
= 163 92 = 71. El
centil de 12% se encuentra en el intervalo (34.66, 34.73) y podemos elegir
P
12
= 34.70
es decir, que el 12% de las observaciones se hallan a la izquierda de 34.70.
22
3.3 Estadstica Descriptiva (Dos Variables): Mnimos
Cuadrados.
En muchos problemas obtenemos datos pareados (x
i
, y
i
), no conocemos la dis-
tribucin conjunta de las variables aleatorias correspondientes y al gracar
estos datos tenemos la impresin de que una recta podra ser un buen ajuste
para ellos, aunque los puntos no estn exactamente sobre una recta. Los
problemas de este tipo, suelen manejarse por medio del mtodo de los mni-
mos cuadrados que consiste en hallar la recta
y = ax +b
que mejor se ajusta a esos datos, para ello debemos calcular los parmetros
a y b a partir de los datos, es decir:
Si nos dan un conjunto de datos pareados {(x
i
, y
i
); i = 1, 2, 3, , n} , las
estimaciones de mnimos cuadrados de los coecientes a y b son los valores
para los cuales la cantidad:
q(a, b) =
n
X
i=1
[y
i
(a +bx
i
)]
2
es un mnimo. Al diferenciar parcialmente con respecto a a y a b y al igualar
estas derivadas parciales a cero, se obtiene:
q
a
= (2)
n
P
i=1
[y
i
(a +bx
i
)] = 0
q
b
= (2)
n
P
i=1
x
i
[y
i
(a +bx
i
)] = 0
que producen el siguiente sistema de ecuaciones:
n
P
i=1
y
i
= an +b
n
P
i=1
x
i
n
P
i=1
x
i
y
i
= a
n
P
i=1
x
i
+b
n
P
i=1
x
2
i
Al resolver ese sistema de ecuaciones se obtiene:
a =
_
y b
_
x
b =
Sxy
S
xx
23
donde :
S
xx
=
n
P
i=1
(x
i

_
x)
2
=
n
P
i=1
x
2
i

1
n

n
P
i=1
x
i

2
S
xy
=
n
P
i=1
(x
i

_
x)(y
i

_
y) =
n
P
i=1
x
i
y
i

1
n

n
P
i=1
x
i

n
P
i=1
y
i

3.3.1 EJERCICIO:
Consideremos los siguientes datos acerca del nmero de horas de estudio de
10 personas para presentar un examen de ingls y sus calicaciones obtenidas
en base a 100 puntos:
Horas de estudio (x) Calicacin en la prueba (y)
4 31
9 58
10 65
14 73
4 37
7 44
12 60
22 91
1 21
17 84
Graque los datos y halle la ecuacin de la recta que mejor se ajusta a estos
datos, usando el Mtodo de Mnimos Cuadrados.
3.4 Correlacin:
Recuerde que si X e Y son dos variables aleatorias, el coeciente de cor-
relacin de ellas se dene como:
=
Cov(X, Y )
p
V ar(x)V ar(Y )
este valor est en el intervalo [1, 1] y mide en cierto sentido el grado de de-
pendencia lineal entre las variables, si = 1, con porbabilidad uno, existe
una dependencia lineal perfecta entre las variables. Si las variables son inde-
pendientes = 0, el recproco es falso, salvo cuando la distribucin conjunta
de las variables es normal.
24
El coeciente de correlacin observado correspondiente a dos muestras
aleatorias de X e Y respectivamente es:
r =
n
P
i=1
(x
i

x)(y
i

y)
r
n
P
i=1
(x
i

x)
2
n
P
i=1
(y
i

y)
2
En la prctica para tener una idea estimada del grado de correlacin de dos
variables, se utilizan los llamados diagramas de dispersin nubes de puntos,
que son los puntos correspondientes a los pares (x
i
, y
i
) , que representan las
observaciones de ambas variables, representados en un plano cartesiano. Si
r = 0 no existe relacin lineal entre las variables, si r < 0 y cercano a
1, existe cierta correlacin lineal entre las variables y la mejor recta que
aproxima los datos tiene pendiente negativa ( es decreciente).
4 Funcin de Distribucin Emprica.
Sea (, F, P) un espacio de probabilidades. Cuando realizamos un experi-
mento el conjunto de resultados de las observaciones sirve de material inicial
para toda investigacin estadstica, en muchos casos corresponden a los val-
ores experimentales {x
1
, x
2
, , x
n
} de cierta variable aleatoria X. La dis-
tribucin de esta variable P
X
(B) = P(X B) , B boreliano de R, en general
se deconoce al menos parcialmente.
Consideremos n repeticiones independientes de la variable aleatoria X, es
decir, X
1
, , X
n
es una sucesin de variables aleatorias independientes con
la misma dostribucin que X.
Denamos
I
x
(B) =

1 si x B
0 si x / B
si consideramos sobre el conjunto {x
1
, x
2
, , x
n
} la distribucin uniforme
es decir la probabilidad P
n
denida como
P
n
(B) =
1
n
n
X
i=1
I
x
i
(B) =
card {i : x
i
B}
n
si en esta denicin escribimos X
i
en lugar de los resultados de la muestra,
esa expresin ser una variable aleatoria.
25
DEFINICIN: Sea X una variable aleatoria de funcin de distribucin
F(x), X
1
, , X
n
es una sucesin de variables aleatorias independientes con
la misma dostribucin que X, denamos
F
n
(x) =
1
n
n
X
i=1
I
X
i
((, x]) =
card {i : X
i
x}
n
esta expresin es una variable aleatoria que denominamos funcin de dis-
tribucin emprica. Tambin se puede expresar como
F
n
(x) =
1
n
n
X
i=1
I
(,x]
(X
i
) =
card {i : X
i
x}
n
donde
I
(,x]
(X
i
) =

1 si X
i
x
0 si X
i
> x
Teorema 1: Sea X una variable aleatoria de funcin de distribucin F(x), X
1
, , X
n
es una sucesin de variables aleatorias independientes con la misma distribu-
cin que X,
F
n
(x)
c.s
F(x), x, n
donde c.s signica, casi siempre y explcitamente expresa que la probabilidad
P del conjunto donde esto no ocurre es cero.
Demostracin
La Ley fuerte de grandes nmeros (Wiebe R. Pestman, Mathematical
Statistics, Walter de Gruyter, Berlin, New York,1998, Teorema VII.2.14) nos
asegura este resultado pues F
n
(x) es el promedio de n variables aleatorias
independientes de esperanza
E(F
n
(x)) = E
"
1
n
n
X
i=1
I
X
i
((, x])
#
=
1
n
n
X
i=1
E(I
X
i
((, x])) =
1
n
n
X
i=1
P(X
i
x) =
1
n
n
X
i=1
F (x) = F(x)
Podemos estimar la funcin de distribucin F(x) por medio de la fun-
cin de distribucin emprica, la mayor distancia vertical entre las grcas de
26
las funciones F
n
y F est representada por la expresin sup
xR
|F
n
(x) F(x)| ,
el teorema de Glivenco-Cantelli nos dice que esta expresin tiende a cero
cuando n , para casi todo , es decir, el conjunto donde no hay
convergencia tiene probabilidad cero.
Teorema 2: Si n
sup
xR
|F
n
(x) F(x)|
c.s
0, n
este resultado se conoce como el Teorema de Glivenko-Cantelli.
Demostracin:
Daremos una demostracin para el caso F continua.
Sea > 0 arbitrariamente pequeo de forma tal que el nmero N =
1

sea un entero. La continuidad de F nos permite hallar nmeros tales que


F(z
1
) =
1
N
= , F(z
k
) =
k
N
= k, k = 1, 2, , N 1;
denimos z
0
= , z
N
= , as F(z
0
) = 0, F(z
N
) = 1
Si z (z
k
, z
k+1
] las relaciones siguientes son ciertas
F
n
(z) F(z) F
n
(z
k+1
) F(z
k
) = F
n
(z
k+1
) F(z
k+1
) +
F
n
(z) F(z) F
n
(z
k
) F(z
k+1
) F
n
(z
k
) F(z
k
)
Consideremos los siguiente eventos
A
k
= { : F
n
(z
k
) F(z
k
), n }
por el teorema 1, P(A
k
) = 1. Sea A =
N
T
k=0
A
k
, tambin P(A) = 1. Si A,
existir n() : si n n()
|F
n
(z
k
) F(z
k
)| < , k = 0, 1, 2, , N
este resultado junto a las desigualdades anteriores nos asegura que
2 F
n
(z
k
) F(z
k
) F
n
(z) F(z) F
n
(z
k+1
) F(z
k+1
) + 2
de donde
sup
z
|F
n
(z) F(z)| 2, si n n()
27
con probabilidad uno.
Para una demostracin general se puede consultar Kai Lai Chung, A
cours in Probability Theory, Academic Press, captulo 5, Teorema 5.5.1 o
Wiebe R. Pestman, Mathematical Statistics, Walter de Gruyter, Berlin, New
York,1998, captulo VII, Teorema VII.3.4.
28
Estadstica Descriptiva.
Estadstica
Prctica N
o
1
1. Los siguientes datos indican el nmero de trabajadores que faltan a una
fbrica en 50 das de trabajo:
13 5 13 37 10 16 2 11 6 12
8 19 21 12 11 7 7 9 16 18
3 11 19 6 15 10 14 10 7 24
11 3 6 10 4 6 32 9 12 7
29 12 9 10 8 20 15 5 17 10
Utilice las seis clases: 0-4, 5-9, 10-14, 15-19, 20-24, 25 mayor para
construir una tabla de frecuencias absolutas y relativas. Dibujar el
histograma. Construir la tabla de frecuencias acumuladas. Encontrar
media muestral, desviacin estandard, moda, mediana y cuartiles. Se
cumple la regla emprica?
2. Los siguientes datos son lo nmeros de torsiones requeridas para doce
barras cierta aleacin: 33, 24, 39, 48, 26, 35, 38, 54, 23, 34, 29 y 37.
Calcule:
(a) media
(b) s
2
(c) la mediana
(d) la moda
(e) los cuartiles.
(f) Se cumple la regla emprica?
3. Demuestre que
n
X
i=1
(x
i

_
x) = 0
para una muestra x
1
, x
2
, , x
n
.
1
4. Si los datos se codican de tal manera que x
i
= cu
i
+a, demuestre que
_
x = c
_
u + a, s
x
= cs
u
para una muestra pareada x
1
, x
2
, , x
n
; u
1
, u
2
, , u
n
.
5. La efectividad de una nueva tcnica para controlar un insecto que afecta
un tipo de cultivo se puede medir contando el nmero de larvas del
insecto halladas en cierta supercie de cultivo. Despus de aplicar
la tcnica, se contaron las larvas en 40 reas, obteniendo los datos
siguientes:
5 0 2 40 27 3 0 22
14 0 4 19 38 2 5 16
0 7 42 15 39 0 2 0
29 26 14 0 3 27 32 20
3 0 17 35 29 12 16 6
(a) Elabore una tabla de frecuencias absolutas y relativas y haga los
histogramas correspondientes.
(b) Calcule las acumuladas absolutas y relativas y haga los histogra-
mas correspondientes.
(c) Se cumple la regla emprica?
(d) En lugar de histogramas haga ahora grcos de lnea.
(e) Encontrar media muestral, varianza, desviacin estandard, moda,
mediana y cuartiles de los datos.
6. Despus de observar el tiempo de vida de 70 motores, se obtuvieron los
siguientes datos:
Intervalos de aos de funcionamiento Nmero de motores
[0, 1) 30
[1, 2) 23
[2, 31) 6
[3, 4) 5
4 aos o ms 6
(a) Haga un histograma de frecuencias relativas.
(b) Se cumple la regla emprica?
2
(c) En base al histograma de la parte a), qu distribucin sospecha
Ud. que podra tener la variable aleatoria T =tiempo de vida de
un motor del tipo considerado?
(d) Calcule aproximadamente, la media, desviacin y mediana de es-
tos datos.
7. La evidencia directa de la ley de gravitacin universal de Newton la
obtuvo Henry Cavendish (1731-1810). En el experimento se obtuvo la
densidad ( en el tiempo) de la tierra y se construy la siguiente tabla:
5.36 5.29 5.58 5.65 5.57 5.53 5.62 5.29
5.44 5.34 5.79 5.10 5.27 5.39 5.42 5.47
5.63 5.34 5.46 5.30 5.75 5.68 5.85
(a) Calcular la media y la desviacin estndar.
(b) Calcular los cuartiles, gracar densidad contra tiempo.
(c) Hay alguna tendencia obvia?
8. Las materias primas que se utilizan en la produccin de una bra sin-
ttica se almacenan en un sitio sin control de humedad. En 12 das,
las mediciones de la humedad relativa del lugar del almacenamiento
y el contenido de humedad de una muestra de la materia prima (en
porcentajes ambas) producen los siguientes resultados:
Humedad
Ambiente
46 53 37 42 43 29 60 44 41 48 33 40
Humedad
en la materia prima
12 14 11 13 10 8 17 12 10 15 9 13
(a) Ajuste una recta de mnimos cuadrados a partir de la cual po-
damos predecir el contenido de humedad de la materia prima en
funcin de la humedad del lugar.
(b) Utilice el resultado anterior para calcular el contenido de humedad
de la materia prima cuando la humedad relativa es del 38%.
9. La siguiente tabla muestra las ventas (en miles de unidades) de una pe-
quea empresa de componentes electrnicos durante los ltimos 10 aos.
Ao 1 2 3 4 5 6 7 8 9 10
Ventas 2, 6 2, 85 3, 02 3, 45 3, 69 4, 26 4, 73 5, 16 5, 91 6, 5
3
(a) Sea X = ao y Y = ventas. Graque la nube de puntos (x
i
, y
i
) .
(b) Sea X = ao y Y = ln(ventas). Graque la nube de puntos
(x
i
, y
i
) .
(c) A cul de las dos nubes anteriores cree Ud. que se ajusta mejor
una recta?
(d) Calcule las dos rectas de regresin y grafquelas.
Semestre Abril-Julio2004/MMOM.
4
REPASO DE DISTRIBUCIONES DE PROBABILIDADES
Estadstica
Prctica N
o
2
1. El nmero de accidentes de trabajo en una fbrica sigue una distribu-
cin de Poisson. Se sabe que el promedio de accidentes en dicha fbrica
mensualmente es de 3. Durante el mes pasado ocurrieron 6 accidentes.
Se puede considerar que este nmero es excesivamente alto? (es decir,
poco probable).
2. La experiencia ha demostrado que el 30% de las personas que contraen
cierta enfermedad se logra curar. Una compaa farmacutica ha de-
sarrollado un medicamento para dicha enfermedad. Se eligen al azar 10
personas enfermas y se les administra el medicamento, 5 logran curarse,
cul es la probabilidad de este evento si se supone que la medicina no
tuvo ningn efecto?. Qu opina Ud. del medicamento?
3. Un examen de seleccin mltiple tiene 15 preguntas, cada una de las
cuales posee 5 respuestas posibles y de stas slo una es correcta. Si un
estudiante contesta todas las preguntas al azar, cul es la probabilidad
de contestar correctamente al menos 10 preguntas?
4. El fabricante de una marca de pasta de dientes arma que el 60% de
los consumidores preeren esa marca. Si entrevistamos a un grupo
de personas escogidas al azar del grupo de consumidores de pasta de
dientes, cul es la probabilidad de tener que entrevistar al menos 5
personas para encontrar al primer consumidor que preere esa marca?
5. El nmero de errores que hace una mecangrafa tiene una distribucin
de Poisson con una media de 4 errores por pgina. Cul es la proba-
bilidad de que una pgina escogida al azar tenga a lo sumo 4 errores?
6. Una fbrica utiliza un producto cuyo uso diario puede modelarse por
medio de una distribucin exponencial de parmetro 4 (esto es, la can-
tidad de producto utilizada en un da es una variable aleatoria expo-
nencial de parmetro = 4, medida en toneladas). Cuntas toneladas
de producto debe almacenar la fbrica para que la probabilidad de
quedarse sin producto en un da dado sea slo 0, 05?.
1
7. Un defecto metablico ocurre en aproximadamente 1 de cada 100 nacimien-
tos. Si en un hospital nacen 4 nios en un da dado, calcule:
(a) la probabilidad de que ninguno tenga el defecto
(b) la probabilidad de que a lo sumo uno de ellos tenga el defecto
(c) la probabilidad de que al menos uno de ellos tenga el defecto.
8. En un examen se plantean 10 preguntas a las que debe responderse con
verdadero o falso. Un alumno aprobar el examen si al menos 7 de sus
respuestas son acertadas.
(a) Qu probabilidad de aprobar tiene un estudiante que responde
todo al azar?
(b) Qu probabilidad de aprobar tiene un estudiante que sabe el 30%?
Semestre Abril-Julio 2004/MMOM
2
Repaso de Desigualdad de Tchebyshe,
Distribucin Normal, Teorema Central del Lmite.
Estadstica
Prctica N
o
3
1. Sea X una variable aleatoria con distribucin normal de parmetros
R, > 0
Demuestre que
(a) E(X) = , V ar(X) =
2
.
(b) Z =
X

tiene distribucin normal estndar.


2. Una lnea area sabe que el 5% de las personas que hacen reservaciones
en un cierto vuelo, al nal no se presentan. Si la aerolnea vende 160
boletos para este vuelo, y slo hay 155 asientos en el avin, cul es la
probabilidad de que todo pasajero con reservacin que se presente al
aeropuerto tenga un puesto en el vuelo?.
3. En una empresa se ha observado que el gasto semanal en mantenimiento
y reparaciones es una variable aleatoria con distribucin aproximada-
mente normal de media = Bs. 24000 y desviacin = Bs.1200. Cunto
debe presupuestarse semanalmente para mantenimiento y reparaciones
para que el monto presupuestado sea excedido con una probabilidad de
a lo sumo 0, 1?
4. Un encuestador cree que el 20%de los votantes de una zona est a
favor del candidato A. Si se escogen 24 votantes de la zona, aproxime la
probabilidad de que la fraccin de votantes de la muestra que favorece
al candidato A, no diera de la verdadera fraccin (en toda la zona) en
ms de 0, 06.
5. Una mquina se manda a reparar si una muestra de 100 artculos es-
cogidos al azar de su gran produccin diaria, revela un 15% mas de
defectuosos. Si la mquina en realidad slo produce un 10% de defec-
tuosos, calcule aproximadamente la probabilidad de que la manden a
reparar.
1
6. La vida activa de un cierto frmaco sigue una distribucin N(1200, 40)
das. Se desea enviar un lote de medicamentos, de modo tal que la vida
media del lote no sea inferior a 1180 das con probabilidad 0, 95. Qu
tamao debe tener la muestra?
7. Encuentre una aproximacin de la probabilidad, de que el nmero de
veces que salga 1, est comprendido entre 1900 y 2150 veces, al lanzar
un dado perfecto 12000 veces.
8. Se toma una muestra al azar con reposicin, a efectos de estimar la
fraccin p de hembras en una poblacin. Encontrar un tamao de
muestra que asegure que la estimacin se har con un error de menos
de 0, 005 , al menos con una probabilidad de 0, 99.
9. Se desea estimar la probabilidad de falla p, en un proceso de produccin,
mediante la observacin de n objetos producidos, elegidos independi-
entemente. Se sabe que p est entre 0, 1 y 0, 3 por informacin previa.
Halle el tamao n de la muestra para que la probabilidad de que la fre-
cuencia relativa de objetos fallados en la muestra, diera del verdadero
valor p en ms de 0, 01 sea menor que 0, 05.
10. El porcentaje de individuos daltnicos de una poblacin es P descono-
cido. Se desea estimar este procentaje P a partir del porcentaje ob-
servado en una muestra de tamao n. Calcular el tamao que debe
tener la muestra a n de que el error cometido sea inferior al 1% con
probabilidad 0, 90 en los casos:
(a) No se sabe nada acerca de P.
(b) Se sabe que P es inferior al 16%.
11. Se ha observado que las notas de un examen de admisin siguen una
distribucin aproximadamente normal, de media 78 y varianza 36.( Las
notas estn entre 1 y 100).
(a) Si un grupo de estudiantes va apresentar dicho examen, qu por-
centaje de ellos espera Ud. que obtenga notas entre 70 y 90?
(b) Cul es la probabilidad de que una persona que tome el examen
obtenga ms de 72?
2
(c) Suponga que los estudiantes cuyas notas se encuentran en el 10%
superior de la distribucin sern admitidos inmediatamente. Cul
debe ser la nota mnima que debe tener un estudiante para ser
admitido inmediatamente?
12. La duracin de un tipo de bombillos sigue una distribucin Normal de
media = 1000 horas y desviacin = 100 horas.
Se desea enviar una muestra de bombillos de manera que la duracin
media de la muestra no diera de en ms de 50 horas con una prob-
abilidad de 0, 95.
(a) Hallar el tamao que debe tener la muestra.
(b) Resuelva el problema, si se desconoce la distribucin :
i. Usando Tchebichev.
ii. Usando el Teorema Central del Lmite.
13. Una compaa tiene 90 ejecutivos. Supongamos que la probabilidad de
que un ejecutivo necesite una secretaria al comenzar su da de trabajo
es
1
10
. Si queremos que con un 95% de certeza haya una secretaria
disponible para cada ejecutivo que la solicite, cuntas secretarias de-
beran contratarse para un centro secretarial que sirva al grupo de 90
ejecutivos?
14. Un fabricante de cereales arma que el peso medio de una caja del ce-
real que vende es de 330, 4 grs. con una desviacin de 21 grs. Se desea
vericar si su armacin es cierta. Para esto se va a elegir una muestra
aleatoria de cajas del cereal y calcular el peso promedio de la muestra.
Cuntas cajas debemos tener en la muestra para que el peso promedio
se encuentre a menos de 7 grs. de la verdadera media con una proba-
bilidad de 0, 99? (Suponga que la distribucin del peso de cada caja es
normal ).
15. Si la probabilidad de que un individuo sufra una reaccin alrgica por la
inyeccin de cierto medicamento es de 0,001; calcule la probabilidad de
que, de un total de 2000 individuos a quienes se inyect el medicamento,
ms de 2 tengan una reaccin alrgica.
Semestre Abril-Julio 2004/MMOM
3
Captulo II
Inferencia Estadstica:
Estimacin Puntual de Parmetros.
Mara Margarita Olivares M.
Abril 2004
1 INTRODUCCIN:
Cuando se realiza un experimento aleatorio, los posibles resultados de dicho
experimento se pueden pensar como una variable aleatoria.
En general, un material estadstico consiste en un nmero de observa-
ciones x
1
, x
2
, , x
N
, obtenido a partir de N repeticiones independientes del
experimento aleatorio relacionado con X. La estadstica descriptiva reduce el
material observado o muestra bruta, reemplazndolo por cantidades relati-
vamente pocas en nmero que representen el material total y que contengan
toda la informacin posible de la variable aleatoria X.
En el material estadstico raramente podemos incluir todas las obser-
vaciones que podramos realizar tericamente, por lo que este material se
puede considerar como una muestra aleatoria simple o como una sucesin de
variables aleatorias independientes, todas con la misma distribucin, la cual
est sujeta a uctuaciones estadsticas ya que se obtendran valores distintos
x
0
1
, x
0
2
, , x
0
N
, si realizramos N nuevas observaciones.
Es decir, antes de realizar el experimento, los valores de X que se van a
observar deben concebirse como N variables aleatorias
X
1
, X
2
, , X
N
,
independientes, idnticamente distribuidas, con la misma distribucin de la
variable aleatoria X.
1
El objetivo de la estadstica es hacer inferencia acerca de una poblacin
basndose en la informacin contenida en una muestra, por ejemplo, tomar
decisiones sobre la distribucin de probabilidad de la variable aleatoria X y
describir esa distribucin basndose en la observacin de esta variable aleato-
ria. Puesto que las distribuciones se caracterizan por medidas descriptivas
numricas, llamadas parmetros, la estadstica se interesa en hacer inferen-
cia acerca de los parmetros de las distribuciones de probabilidad. Algunos
parmetros tpicos son la media, la desviacin estndar, el rea bajo la dis-
tribucin de probabilidad a partir de un valor de la variable aleatoria o el
rea entre dos valores de la variable.
Algunos ejemplos pueden aclarar esta idea:
1. El lavaplatos de un restaurante posee un certicado de garanta que
expresa que de cada 100 platos que lava, slo rompe 3. El primer da
lava 500 platos y se le rompen 23, resulta creble lo que expresa la
garanta?
2. Se repite independientemente un experimento que puede dar lugar en
cada repeticin al resultado A con probabilidad p. Al cabo de 200
repeticiones, A ocurri 22 veces. Se desea saber al menos aproximada-
mente el valor de p.
3. Una calculadora bolsillo tiene una rutina generadora de nmeros aleato-
rios, que de acuerdo a lo que indica el fabricante, proporciona una suce-
sin de variables aleatorias independientes de distribucin uniforme en
[0, 1] . Se genera una sucesin x
1
, x
2
, , x
N
, . Apartir del conocimiento
de ella, resulta aceptable la armacin del fabricante?
En los ejemplos anteriores, planteamos problemas de estimacin de
parmetros y tambin de pruebas de hiptesis, los cuales analizaremos
ms adelante.
Supongamos que F es la funcin de distribucin terica de la variable
aleatoria X , en observacin; F en general contendr uno o ms parmetros
tales como y en el caso de la distribucin normal. Una vez conocidos
los valores numricos de estos parmetros, la variable aleatoria que estamos
investigando queda completamente caracterizada.
Basndonos en las observaciones
x
1
, x
2
, , x
N
,
2
estimamos los valores numricos de los parmetros de F, estos estimadores
empricos de los parmetros tericos son a su vez variables aleatorias y como
tales estn sujetos a uctuaciones estadsticas. Para tener una medida de la
magnitud esperada de estas uctuaciones y por lo tanto de la conanza que
podemos depositar en los valores encontrados para los parmetros a partir
de las observaciones, debemos deducir a partir de F, las distribuciones de
nuestros estimadores.
As pues, antes de que podamos resolver un problema estadstico dado,
debemos, en primer lugar, establecer una hiptesis sobre la forma matemtica
de la funcin de distribucin F.
A veces, por experiencias anteriores, se sabe que podemos suponer una
determinada distribucin, por ejemplo, la distribucin normal. O bien, a
partir de ciertas hiptesis que idealizan el experimento considerado podemos
deducir su distribucin, basndonos en las reglas conocidas de la teora de
probabilidad. Por ejemplo, cuando se cuenta el nmero de partculas que
se observan en una pantalla, emitidas por una sutancia radioactiva durante
un tiempo t, bajo ciertas hiptesis simplicativas, podemos suponer que la
distribucin es de Poisson de parmetro t y justamente es el parmetro
el valor que debenos estimar a partir de las observaciones.
1.1 DEFINICIONES:
1.1.1 MUESTRA ALEATORIA SIMPLE:
Es un vector aleatorio

X = (X
1
, X
2
, , X
N
)
cuyas componentes son variables aleatorias independientes, idnticamente
distribuidas, siendo N el tamao de la muestra.
1.1.2 ESTADSTICO (o ESTADGRAFO)
Es toda funcin T de una muestra aleatoria

X = (X
1
, X
2
, , X
N
) que a su
vez resulte ser una variable aleatoria:
T
N
= T(

X) = T (X
1
, X
2
, , X
N
)
(La funcin T debe ser lo sucientemente regula como para que T(

X) sea
una variable aleatoria)
3
EJEMPLOS DE ESTADSTICOS:
1. Media Muestral Aleatoria:
_
X =
1
N
(X
1
+ X
2
+ + X
N
) =
1
N
N
X
i=1
X
i
2. Varianza Muestral Aleatoria:
S
2
=
1
N
N
X
i=1
(X
i

_
X)
2
3. Varianza Muestral Centrada Aleatoria:
S
2
1
=
1
N 1
N
X
i=1
(X
i

_
X)
2
1.1.3 OBSERVACIN:
La distribucin de estos estadsticos est determinada por la distribucin
terica F de la variable aleatoria X.
1.2 ESTIMADOR:
Un estimador paramtrico o para simplicar, diremos simplemente, un esti-
mador, es un estadstico cuyo valor observado intentamos usar para estimar
el valor de un parmetro desconocido de la distribucin terica. (El enfoque
paramtrico supone que la forma del modelo es conocida).
La media muestral y la varianza muestral aleatorias, como lo indica sus
nombres, son estimadores de la media y la varianza de la distribucin terica.
Supongamos que T
N
= T (X
1
, X
2
, , X
N
) sea un estimador de un cierto
parmetro de una distribucin terica. La diferencia:
T
N
= T (X
1
, X
2
, , X
N
)
se denomina Error de Estimacin. Una buena forma de conseguir que T
N
sea un buen estimador, es pedir que el error de estimacin sea pequeo y
4
esto puede hacerse, por ejemplo, exigiendo que se cumplan condiciones tales
como:
P(|T (X
1
, X
2
, , X
N
) | > ) <
para valores pequeos de > 0, > 0; o bien que
E

|T (X
1
, X
2
, , X
N
) |
k

< c
para valores apropiados de las constantes k > 0,y c > 0 pequeo.
En particular, llamamos error cuadrtico medio a la expresin:
E

|T (X
1
, X
2
, , X
N
) |
2

,
es deseable que un estimador tenga un error cuadrtico medio pequeo.
A menudo, tienen inters, sobre todo tcnico, las siguientes propiedades:
1. T es un Estimador Insesgado o Centrado de cuando
E(T (X
1
, X
2
, , X
N
)) =
para todo N 1. En este caso el error cuadrtico medio coincide con
la varianza.
A la diferencia
E(T (X
1
, X
2
, , X
N
))
se le llama sesgo de T.
2. EFICIENCIA RELATIVA: dos estimadores insesgados T
1
y T
2
, del
mismo parmetro , basados en las mismas observaciones, se suelen
comparar utilizando la eciencia relativa de T
2
con respecto a T
1
, la
cual se dene como el cociente
V ar(T
1
)
V ar(T
2
)
.
Si este cociente es menor que 1, es decir, V ar(T
1
) < V ar(T
2
) diremos
que el estimador T
1
es ms eciente que T
2
.
3. ESTIMADOR CONSISTENTE:
Sea T un estimador del parmetro y sea
T
n
= T (X
1
, X
2
, , X
n
)
5
una sucesin de estimadores de , que representan a T con base en la
muestra de tamao n.
Se dice que T es un estimador consistente si:
lim
N
P(|T (X
1
, X
2
, , X
N
) | ) = 0
(Este tipo de convergencia se llama convergencia en probabilidad del
estimador al verdadero valor del parmetro).
EJERCICIOS:
1. Demostrar que si T es un estimador de cuyo error cuadrtico medio
tiende a cero cuando n , es consistente.
2. Si T es insesgado y Var(T
n
) tiende cero cuando n , entonces T es
consistente.
3. Si lim
N
E(T
N
(X
1
, X
2
, , X
N
)) = y lim
N
V ar (T
N
(X
1
, X
2
, , X
N
)) =
0, entonces T es consistente.
1.3 Propiedades de la media y la varianza aleatorias:
(Como estimadores de la media y la varianza).
Sea

X = (X
1
, X
2
, , X
N
) una muestra aleatoria de la variable X, con
= E(X
i
) ,
2
= V ar(X
i
).i = 1, 2, , N
1.
_
X =
1
N
N
P
i=1
X
i
es un estimador insesgado y consistente de :
E

_
X

=
1
N
N
P
i=1
E(X
i
) =
1
N
N =
V ar(
_
X) =
1
N
2
N
P
i=1
V ar (X
i
) =
1
N
2
N
2
=

2
N
2. S
2
1
es un estimador insesgado de
2
:
6
Puesto que S
2
1
=
N
N1
S
2
, podemos calcular E(S
2
) y deducir de all la
E(S
2
1
) =
N
N1
E(S
2
) . Para calcular E(S
2
) , supongamos que:
E(X
i
) = , E((X
i
)
2
) = V ar(X
i
) =
2
, 1 i N.
N
P
i=1
(X
i

_
X)
2
=
N
P
i=1
(X
i

_
X + )
2
=
N
P
i=1
(X
i
)
2
+ N(
_
X)
2
+ 2(
_
X)
N
P
i=1
(X
i
) =
N
P
i=1
(X
i
)
2
+ N(
_
X)
2
2N(
_
X)
2
=
N
P
i=1
(X
i
)
2
N(
_
X)
2
o equivalentemente
N
X
i=1
(X
i
)
2
=
N
X
i=1
(X
i

_
X)
2
+ N(
_
X )
2
Este resultado tiene una interpretacin importante pues descompone
la variabilidad de los datos respecto a su media verdadera como suma
de la variabilidad respecto a la media muestral y la variabilidad entre
la media muestral y la verdadera.
Tomando esperanza:
N
2
= E(NS
2
) + NV ar(
_
X)
E(S
2
) =
2


2
N
=
N1
N

2
.
De aqu se obtiene que:
E

S
2
1

=
N
N 1
E

S
2

=
2
.
Note que S
2
1
es un estimador insesgado o centrado de la varianza, mien-
tras que S
2
no lo es. Esta es la razn por la que se preere trabajar con
S
2
1
en lugar de S
2
y por sto S
2
1
recibe el nombre de varianza centrada
o varianza muestral corregida, el divisor n1 se denomina nmero de
grados de libertad.
Si llamamos residuo a
e
i
= x
i

_
x
7
entonces la varianza muestral centrada o corregida ser
S
2
1
=
1
N 1
N
X
i=1
e
2
i
cuando N = 1,
_
x = x
1
y antes de tomar la muestra podemos armar
que e
1
= 0. No hay ningn grado de libertad. Si N = 2, tendremos
que e
1
= x
1

_
x = x
1

x
1
+x
2
2
=
x
1
x
2
2
= e
2
. Hay solamente un grado
de libertad e
1
(o e
2
). Dado un residuo el otro queda automticamente
jado. En general, para cualquier tamao muestral
N
X
i=1

x
i

_
x

=
N
X
i=1
e
i
= 0
antes de tomar la muestra solo hay n1 residuos desconocidos porque el
ltimo siempre puede calcularse usando la expresin anterior. Diremos
que disponemos de n 1 grados de libertad para calcular los residuos
y por tanto la desviacin tpica de los datos.
3. S
2
1
y S
2
son consistentes, si E(X
4
) < ; se puede demostrar que:
V ar(S
2
) =

4

2
2
N

2(
4
2
2
2
)
N
2
+

4
3
2
2
N
3
donde

k
= E

(X )
k

es el k-simo momento centrado de la variable aleatoria X.


Este clculo es bastante complicado, para una demostracin se puede
consultar Mtodos Matemticos de estadstica de Harald Cramer, edi-
torial Aguilar, Madrid.
Puesto que
lim
N
E(S
2
) = lim
N
N 1
N

2
=
2
y lim
N
V ar(S
2
) = 0
se deduce que S
2
es consistente y puesto que E(S
2
1
) =
2
, se obtiene
que:
lim
N
V ar(S
2
1
) = lim
N
N
2
(N 1)
2
V ar(S
2
) = 0
tambin obtenemos que S
2
1
es consistente.
8
1.4 Mtodo de Mxima Verosimilitud.
El mtodo general ms importante para hallar estimadores de los parmetros
desconocidos de una distribucin terica se conoce con el nombre de mtodo
de mxima verosimilitud introducido por R. A. Fisher. Es un mtodo sis-
temtico que permite hallar estimadores puntuales de cualquier nmero de
parmetros desconocidos de una distribucin.
1.4.1 Funcin de Verosimilitud:
Se llama Funcin de Verosimilitud de una muestra observada a la densidad
conjunta ( o funcin de probabilidad conjunta en el caso discreto) de la
muestra aleatoria X
1
, X
2
, , X
N
, considerada como funcin del parmetro
o de los parmetros desconocidos. Es decir,
L(
1
,
2
, ,
N
) = f
X
1
,X
2
, ,X
N
(x
1
, x
2
, , x
N
;
1
,
2
, ,
N
)
en el caso de densidad y en el caso discreto:
L(
1
,
2
, ,
N
) = p
X
1
,X
2
, ,X
N
(x
1
, x
2
, , x
N
;
1
,
2
, ,
N
)
con
p
X
1
,X
2
, ,X
N
(x
1
, x
2
, , x
N
;
1
,
2
, ,
k
) = P(X
i
= x
i
; i = 1, 2, , N)
donde
j
, j = 1, 2, , k, son los parmetros desconocidos de la distribucin.
OBSERVACIN: La funcin de verosimilitud representa, en cierto sen-
tido, la probabilidad de observar lo que realmente se observ.
El mtodo consiste en elegir los parmetros
j
de manera que la proba-
bilidad de observar lo que se observ sea mxima, es decir, se desea elegir los
parmetros
j
de tal forma que maximicen la funcin de verosimilitud.
Si X es la variable aleatoria asociada al experimento y

j
, j = 1, 2, , k,
son los parmetros desconocidos de su distribucin, denotando por

= (
1
,
2
, ,
k
),
si X
1
, X
2
, , X
N
es una muestra aleatoria de la variable aleatoria X en-
tonces:
9
1. En el caso de densidad, si f(x;

) es la densidad de X, y x
1
, x
2
, , x
N
representa la muestra observada, se tendr que
L(x
1
, x
2
, , x
N
;

) = f(x
1
;

) f(x
2
;

) f(x
N
;

)
2. En el caso discreto, si g(x;

) = P(X = x) es la funcin de probabilidad


de X, si x
1
, x
2
, , x
N
representa la muestra observada,
1
,
2
, ,
r
con 1 r N son los valores distintos observados y f
1
, f
2
, , f
r
, son
las frecuencias respectivas, con
r
P
i=1
f
i
= N, se tendr que
L(x
1
, x
2
, , x
N
;

) =

g(
1
;

f
1

g(
2
;

f
2

g(
r
;

f
r
OBSERVACIN: Se quiere elegir

= (
1
,
2
, ,
k
)
de modo que L(x
1
, x
2
, , x
N
;

) sea mximo.
Note que
L

i
= 0 si y solo si
lnL

i
= 0 ya que
lnL

i
=
1
L
L

i
. Luego, si L es
derivable con respecto a los parmetros, los extremos se calculan trabajando
con la funcin ln L ya que los clculos son ms simples.
EJEMPLOS:
1. Estimadores de mxima verosimilitud de la media y de la varianza
2
de una distribucin normal: sea x
1
, x
2
, , x
N
una muestra observada
de la distribucin normal, queremos estimar los parmetros basndonos
en esta muestra, por el mtodo de mxima verosimilitud:
f(x
i
; , ) =
1

2
exp

1
2
2
(x
i
)
2

,

x = (x
1
, x
2
, , x
N
)
L(

x; , ) =
N
Q
i=1
1

2
exp

1
2
2
(x
i
)
2

=
1
(2
2
)
N/2
exp

1
2
2
N
P
i=1
(x
i
)
2

10
tomando logaritmo neperiano:
l(, ) = lnL(

x; , ) = N ln
N
2
ln(2)
1
2
2
N
P
i=1
(x
i
)
2
l(,)

=
1

2
N
P
i=1
(x
i
) = 0 =
1
N
N
P
i=1
x
i
=
_
x
l(,)

=
N

+
1
2
3
N
P
i=1
(x
i
)
2
= 0
2
=
1
N
N
P
i=1
(x
i

_
x)
2
= s
2
Para vericar que estos valores maximizan la funcin l(, ) se debe
evaluar
=

2
l(,)


2
l(,)

2
l(,)


2
l(,)

en el punto (, ) encontrado. (Mtodo del Hessiano). Si > 0 y

2
l(,)

< 0 evaluados ambos en los puntos


=
1
N
N
X
i=1
x
i
=
_
x,
2
=
1
N
N
X
i=1
(x
i

_
x)
2
= s
2
encontrados, entonces concluimos que
_
x y s
2
realizan un mximo de
l(, ).
2. Sea X una variable con distribucin uniforme en el intervalo [0, b] con
b > 0. Calculemos el estimador de mxima verosimilitud del parmetro
b basndonos en una muestra x
1
, x
2
, , x
N
. La densidad de X es
f(x; b) =
1
b
, x [0, b]
La funcin de verosimilitud es:
L(x
1
, x
2
, , x
N
; b) = f(x
1
; b) f(x
2
; b) f(x
N
; b) =
1
b
N
, 0 x
i
b, para todo i = 1, 2, , N.
o expresado de otra forma:
L(x
1
, x
2
, , x
N
; b) =
1
b
N
, max x
i
[0, b] , 0 min x
i
.
11
Al gracar la funcin Lcomo funcin del parmetro b, se observa que
el valor mximo se realiza en el valor
b = max x
i
en este punto Lno es derivable.
3. Estimador de mxima verosimilitud del parmetro > 0 de la dis-
tribucin de Poisson, basado en una muestra x
1
, x
2
, , x
N
: Si X tiene
distribucin de Poisson, su rango es
{0, 1, 2, , k, (k + 1), } ,
de estos valores solo un nmero nito estar representado en la mues-
tra x
1
, x
2
, , x
N
. Sea r = max x
i
, entonces los valores 0, 1, 2, , r,
estarn representados en la muestra con frecuencias , f
i
, 1 i r,
respectivamente, donde f
i
puede ser eventualmente cero para algn
1 i r, verican:
r
X
i=1
f
i
= N.
Derivando el logaritmo neperiano de la funcin de verosimilitud e igua-
lando a cero, se obtiene:
L(x
1
, x
2
, , x
N
; ) =
r
Q
i=0

i
e

i!

f
i
, l() = lnL(

x; ) =
r
P
i=0
f
i
ln

i
e

i!

l()

=
r
P
i=0
f
i

= 0
1

r
P
i=0
if
i
=
r
P
i=0
f
i
= N
de donde: =
1
N
r
P
i=0
if
i
=
1
N
r
P
i=0
x
i
=
_
x.
4. Supongamos que en cierto experimento se observa un suceso Acuya
probabilidad p es desconocida. Hacemos N observaciones y observamos
f veces A . La variable observada X tiene distribucin de Bernoulli de
parmetro p, siendo
P(A) = P(X = 1) = p.
La funcin de verosimilitud y la derivada de su logaritmo se obtiene
fcilmente:
L(x
1
, x
2
, , x
N
; p) = p
f
(1 p)
Nf
l(p) = ln L(

x; p) = f ln p + (N f) ln(1 p)
l(p)
p
=
f
p
+
Nf
1p
= 0 p =
f
N
.
12
Es decir, la frecuencia relativa observada es el estimador de mxima
verosimilitud de la probabilidad de que ocurra el suceso A.
EJERCICIOS: Halle los estimadores de mxima verosimilitud, basados
en una muestra x
1
, x
2
, , x
N
, si la variable observada tienen distribucin:
1. Exponencial de parmetro > 0.
2. Densidad f(x; p) = px
p1
, 0 x 1, p > 0.
1.5 Estimacin Puntual: Mtodo de los Momentos.
Sea X
1
, X
2
, , X
N
una muestra aleatoria de una variable aleatoria X cuya
distribucin terica depende de uno o varios parmetros desconocidos. El
mtodo de los momentos para estimar los parmetros basndose en una ob-
servacin x
1
, x
2
, , x
N
, es el ms antiguo que se haya propuesto con este
objeto, fue introducido por K. Pearson.
Consiste en igualar un nmero conveniente de momentos muestrales a
los correspondientes momentos de la distribucin, que son funciones de los
parmetros desconocidos. Considerando tantos momentos como parmetros
haya que estimar y resolviendo las ecuaciones resultantes respecto a dichos
parmetros, se obtienen estimaciones de stos. Este mtodo da muchas veces
lugar, en la prctica, a clculos relativamente simples.
As, por ejemplo, si X tiene densidad f(x; ) dependiendo de un solo
parmetro desconocido, se utiliza como estimador de la solucin de la
ecuacin
E(X) =
1
N
N
X
i=1
X
i
=
_
X
donde
E(X) =

f(x; )dx
en el caso que esta ecuacin tenga solucin nica. Si tiene innitas soluciones,
como suele suceder cuando la distribucin terica depende de k parmetros
desconocidos, con k 2, se agrega la ecuacin
E

X
2

x
2
f(x; )dx =
1
N
N
X
i=1
X
2
i
.
13
Si sta no es suciente, se agrega la que corresponde al momento de tercer
orden, y as sucesivamente, hasta determinar una solucin nica, si sto es
posible.
1.5.1 EJEMPLOS:
1. Distribucin uniforme en [0, b] , con b > 0 desconocido: como por ejem-
plo
(a) Se escogen al azar nmeros entre 0 y algn nmero desconocido.
(b) Tiempos de espera del autobs de las 8 A.M.
La densidad es
f(x; ) =

1
b
, x [0, b]
0, si no.
Tenemos que resolver la ecuacin:
E(X) =
1
N
N
X
i=1
X
i
=
_
X
pero la esperanza de una variable aleatoria de densidad uniforme de
parmetros (0, b) es:
E(X) =

xf(x; )dx =
1
b
b
Z
0
xdx =
b
2
.
Igualando obtenemos:
b
2
=
_
X, tomamos

b = 2
_
X
El estimador

b de b, es insesgado, pues
E

= 2E

_
X

=
2
N
N
X
i=1
E(X
i
) =
2
N
NE(X) = 2
b
2
= b.
14
El error medio cuadrtico del estimador

b, por ser en este caso inses-
gado, coincide con su varianza:
E

b b)
2

= V ar(

b) = V ar(2
_
X) =
4
N
2
N
X
i=1
V ar (X
i
) =
4
N
V ar(X) =
4
N
b
2
12
por ser X uniforme en [0, b] . Por lo tanto
V ar(

b) =
b
2
3N
0 si N ,
es decir, nuestro estimador

b = 2
_
X del parmetro desconocido b es
consistente.
Por el mtodo de mxima verosimilitud, obtuvimos como estimador del
parmetro b a

b = max(X
1
, X
2
, , X
N
). Veamos que este estimador no
es insesgado; como tenemos que hallar su esperanza, debemos calcular
antes su distribucin:
P

b x

= P(max(X
1
, X
2
, , X
N
) x) =
P(X
1
x, X
2
x, , X
N
x) =
N
Q
i=1
P(X
i
x) = (P(X x))
N
= (F(x; b))
N
donde F es la funcin de distribucin de X que es uniforme en el inter-
valo [0, b] . Es fcil calcular esta funcin de distribucin para obtener:
F(x; b) =

0 si x < 0
x
b
si x [0, b]
1 si x > b.
As, la funcin de distribucin del estimador, es:
P

b x

0 si x < 0
x
N
b
N
si x [0, b]
1 si x > b.
15
y derivando, obtenemos la densidad de

b :
f
b
(x) =

N
b
N
x
N1
si x [0, b]
0 si no.
La esperanza de esta distribucin es:
E

=
N
N + 1
b,
es decir, este estimador del parmetro b no es insesgado, pero s lo es
asintticamente ya que
lim
N
E

= lim
N
E(max(X
1
, X
2
, , X
N
)) = lim
N
N
N + 1
b = b.
Este estimador es consistente, en efecto:
E

b
2

=
N
N+2
b
2
, E

=
N
N+1
b
V ar

=

N
N+2

N
2
(N+1)
2

b
2
=
Nb
2
(N+2)(N+1)
2
por lo tanto su varianza tiende a cero cuando N tiende a innito.
2. Dada una muestra aleatoria de distribucin de Bernoulli de parmetro
p, estimemos p por el mtodo de los momentos y por el mtodo de
mxima verosimilitud:
(a) Mtodo de Mxima Verosimilitud:
si X tiene distribucin de Bernoulli de parmetro p, x
1
, x
2
, , x
N
es una muestra de la variable aleatoria X y f es la frecuencia
correspondiente al nmero de unos presentes en la muestra, se
tendr:
L(x
1
, x
2
, , x
N
; p) = p
f
(1 p)
Nf
l(p) = ln L(

x; p) = f lnp + (N f) ln(1 p)
l(p)
p
=
f
p
+
Nf
1p
= 0 p =
f
N
.
De aqu se deduce que el estimador de mxima verosimilitud de p
es:

p =
1
N
N
X
i=1
X
i
=
_
X.
16
(b) Mtodo de lo Momentos: debemos resolver la siguiente ecuacin:
E(X) =
1
N
N
X
i=1
X
i
pero la esperanza de la distribucin de Bernoulli de parmetro p,
es p. As, el estimador del parmetro p, en ambos casos es
_
X.
Este estimador es insesgado ya que
E

_
X

=
1
N
N
X
i=1
E(X
i
) = p
y tambin es consistente pues:
V ar(
_
X) = V ar

1
N
N
P
i=1
X
i

=
1
N
2
N
P
i=1
V ar(X
i
) =
p(p1)
N
por lo tanto la varianza del estimador tiende a cero cuando N
tiende a innito.
EJERCICIO: Hallar el estimador del parmetro > 0, por el mtodo de
los momentos correspondiente a:
a) La distribucin exponencial.
b) La distribucin de Poisson.
1.6 Una cota inferior para el error cuadrtico medio
de un estimador: Desigualdad de Crmer-Rao.
Supongamos que X
1
, X
2
, , X
N
es una muestra aleatoria de distribucin
F = F(x; )
y que dicha distribucin tiene una densidad f(x, ) derivable respecto al
parmetro R.
Denotemos por:
f(

x; ) = f
X
1
,X
2
, ,X
N
(x
1
, x
2
, , x
N
; )
17
la densidad conjunta de la muestra aleatoria evaluada en el punto

x = (x
1
, x
2
, , x
N
).
Supongamos tambin que la identidad
Z
R
N
f
X
1
,X
2
, ,X
N
(x
1
, x
2
, , x
N
; )dx
1
dx
2
dx
N
= 1
puede derivarse respecto al parmetro , bajo el signo de integral. Bajo esta
hiptesis, podemos obtener la siguiente identidad:
0 =
R
R
N
f(

x,)

dx
1
dx
2
dx
N
=
R
R
N
1
f(

x;)
f(

x,)

f(

x; )dx
1
dx
2
dx
N
=
E

lnf(

X,)

= E

lnL()

,

X = (X
1
, X
2
, , X
N
).
Si
b() = E(T(X
1
, X
2
, , X
N
) )
es el sesgo del estimador T del parmetro y calculamos su derivada, se
tendr
1 + b
0
() =

E(T(X
1
, X
2
, , X
N
)) =

Z
R
N
T(

x)f(

x; )dx
1
dx
2
dx
N
Si admitimos que esta ltima integral se puede derivar bajo el signo de inte-
gral respecto al parmetro , obtenemos las siguientes igualdades:
1 + b
0
() =
R
R
N
T(

x)

f(

x; )dx
1
dx
2
dx
N
=
R
R
N
T(

x)
1
f(

x;)
f(

x,)

f(

x; )dx
1
dx
2
dx
N
=
R
R
N
T(

x)
lnf(

X,)

f(

x; )dx
1
dx
2
dx
N
=
E

T(

X)
lnL()

= E

T(

X)
lnL()

lnL()

=
E

T(

X)

lnL()

puesto que E

lnL()

= 0.
18
1.6.1 Desigualdad de Crmer-Rao:
Si todas las derivaciones bajo el signo de integral son vlidas ( es cierto
bajo la hiptesis de suciente regularidad de la densidad f), se cumple la
desigualdad:
(1 + b
0
())
2
E
"

T(

X)

2
#
E
"

ln L()

2
#
,
por la desigualdad de Cauchy-Schwarz, en particular, si T es insesgado
b() = 0, b
0
() = 0, E
"

T(

X)

2
#
= V ar(T(

X))
1 V ar(T(

X))E

lnL()

.
Adems, bajo condiciones de suciente regularidad de la densidad f, se cumple
E
"

ln L()

2
#
= E

2
ln L()

ya que:

2
lnL()

lnL()

1
L()
L()

=
1
L()

2
L()

1
L()
L()

2
=
1
L()

2
L()

lnL()

2
E
h

2
lnL()

i
= E

lnL()

si 0 =
R
R
N
f(

x,)

dx
1
dx
2
dx
N
puesto que
E
h
1
L()

2
L()

i
=
R
R
N
1
f(

x,)

2
f(

x,)

f(

x, )dx
1
dx
2
dx
N
=
R
R
N

2
f(

x,)

dx
1
dx
2
dx
N
=

R
R
N
f(

x,)

dx
1
dx
2
dx
N
= 0
si las derivaciones bajo el signo de integral son posibles.
En conclusin, la desigualdad obtenida se denomina desigualdad de Crmer-
Rao:
"
E

lnL()

2
!#
1
E
"

T(

X)

2
#
19
OBSERVACIONES:
1. La desigualdad de Crmer-Rao proporciona una cota inferior del er-
ror cuadrtico medio de un estimador. En particular, para los esti-
madores insesgados, proporciona una cota inferior para la varianza del
estimador. Esta cota inferior no tiene por qu ser alcanzada, pero si se
encuentra un estimador insesgado cuya varianza es:
"
E

lnL()

2
!#
1
entonces la desigualdad expresa que se trata de un estimador de mnima
varianza.
2. Valen resultados anlogos a los anteriores cuando la distribucin es
discreta, reemplazando la densidad f(

x, ) por la funcin
P

X =

x;

que representa la funcin de probabilidad de la variable aleatoria X.


3. Se llama eciencia de un estimador insesgado al cociente de varianzas
que dene su eciencia relativa respecto a un eventual estimador de
varianza mnima, es decir:
Eciencia de T =

lnL()

1
V ar(T)
4. Un estimador insesgado de varianza mnima tiene eciencia igual a
1; tal estimador suele llamarse Estimador Eciente. Si la sucesin de
eciencias de una sucesin de estimadores insesgados tiende a 1, la
sucesin se dice que es asintticamente eciente.
EJEMPLO: El estimador de mxima verosimilitud del parmetro de
la distribucin de Poisson tiene varianza mnima, es decir, es un estimador
eciente; en efecto:
ln L() =
r
X
i=0
f
i
ln

i
e

i!

20
donde f
i,
0 i r son las frecuencias de los valores 0, 1, 2, , r represen-
tados en la muestra x
1
, x
2
, , x
N
con max(x
1
, x
2
, , x
N
) = r. Derivando
con respecto al parmetro e igualando a cero, obtenemos que el estimador de
mxima verosimilitud del parmetro es

=
_
X =
1
N
N
X
i=1
X
i
,
que es un estimador insesgado de pues
E(
_
X) =
1
N
N
X
i=1
E(X
i
) = ,
adems la cota de Crmer-Rao coincide con la varianza del estimador que es:
V ar(
_
X) =

N
pues:
E

ln L()

2
!
=
N
2

2
E

_
X

=
N
2

2
V ar(
_
X) =
N

por lo tanto:
"
E

lnL()

2
!#
1
=

N
= V ar(
_
X),
puesto que,

=
_
X tiene eciencia 1 es un estimador de varianza mnima.
1.7 Estadsticos Sucientes.
Sea X
1
, X
2
, , X
N
una muestra aleatoria cuya distribucin es conocida y
queremos estimar un parmetro de su distribucin. Un estadstico T
n
=
T(X
1
, X
2
, , X
N
) es suciente para el parmetro desconocido si para to-
dos los resultados posibles T = t la distribucin condicional de (X
1
, X
2
, , X
N
)
dado T = t no es funcin del parmetro . Es decir, toda la informacin ac-
erca del parmetro que puede ser extraida de la muestra X
1
, X
2
, , X
N
est contenida en T.
Ejemplo:
21
Sean X
1
, X
2
una muestra aleatoria con distribucin de Poisson de parmetro
. Consideremos el estadstico
T = 2X
1
+ X
2
Este estadstico no es suciente para :
P((X
1
, X
2
) = (1, 1) | T = 3) =
P((X
1
,X
2
)=(1,1),T=3)
P(T=3)
=
P((X
1
,X
2
)=(1,1))
P(T=3)
=
P(X
1
=1)P(X
2
=1)
P(X
1
=0)P(X
2
=3)+P(X
1
=1)P(X
2
=1)
=
e
2

2
e
2

3
/6+e
2

2
=
6
+6
Es muy til conectar la idea de suciencia con la de factorizacin de la
funcin de verosimilitud asociada a una muestra, el siguiente teorema que
solo enunciaremos nos da un criterio para la suciencia relacionado con la
funcin de verosimilitud:
Teorema de factorizacin:
Sea X
1
, X
2
, , X
N
una muestra aleatoria, T
N
= T( X
1
, X
2
, , X
N
)
un estimador de un parmetro deconocido de la distribucin. T
es suciente si y solo si existe h : R
n
[0, ) que no depende de :
R [0, ) tal que
L

= h(x
1
, , x
N
)(, T(x
1
, , x
N
)
donde L

es la funcin de verosimilitud de la muestra.


Ejemplo:
Sea X
1
, X
2
, , X
N
una muestra aleatoria de distribucin exponencial de
parmetro . Sea
T
N
=
X
1
+ X
2
+ + X
N
N
donde la densidad de X
i
viene dada por
f(x) =
1

; x > 0
As la funcin de verosimilitud del parmetro desconocido es
L

=
1

N
e

x
1
++x
N

=
1

N
e
N
_
x

; x
1
, x
2
, , x
N
> 0
22
el estadstico T =
_
X es suciente para , dena
(, t) =
1

N
e
Nt

, t 0
h = 1
as
L

= h(x
1
, , x
N
)(, T(x
1
, , x
N
))
Observacin: Los estadsticos sucientes no son nicos en el sentido que
si
n
P
i=1
x
i
es suciente para en un modelo de Poisson, tambin lo ser
1
n
n
P
i=1
x
i
o
1
8
n
P
i=1
x
i
. Algunas de estas funciones tendrn buenas propiedades como esti-
madores del parmetro entonces las llamaremos estimadores sucientes.
23
DISTRIBUCIONES DE PROBABILIDAD.
ESTADSTICA
PRCTICA N
0
4
1. Determine la varianza de la distribucin de Poisson basndose en su
funcin generatriz de momentos ( o transformada geomtrica).
2. Sea X una variable aleatoria de densidad expenencial, de parmetro
= 1.
Determine la funcin de densidad de
Y = X
3
3. Sean X e Y dos variables aleatorias independientes, f y g las densi-
dades de X e Y respectivamente, con X > 0. Calcule la densidad de la
variable aleatoria
Z =
Y
X
(Sugerencia: Exprese F
Z
(z) = P

Y
X
z

como una integral doble yluego


derive respecto a z.
4. DISTRIBUCIN NORMAL BIDIMENSIONAL:
Diremos que dos variables aleatorias X e Y tienen distribucin normal
conjunta, si su funcin de densidad conjunta viene dada por:
f(x, y) =
1
2
1

1
exp
h

1
2(1
2
)

(x
1
)
2

2
1

2(x
1
)(y
1
)

2
+
(y
2
)
2

2
2
i
donde es el coeciente de correlacin entre X e Y,
2
1
es la varianza de
X,
2
2
es la varianza de Y,
1
es la esperanza de X y
2
es la esperanza
de Y .
(a) Sea
C =


2
1

12

12

2
2

la matriz de covarianza de X e Y, donde


12
= Cov(X, Y ). Calcule
la inversa de C.
1
(b) Verique que
f(x, y) =
1
2
1

1
exp

1
2

zC
1
z
t

donde z = ((x
1
), (y
1
)) y z
t
es la traspuesta de z y C
1
es
la inversa de C.
(c) Calcule las densidades marginales de X e Y.
(d) Si X e Y son independientes, el coeciente de correlacin es cero.
El recproco no es cierto, en general. Demuestre que si X e Y
tienen distribucin conjunta normal y = 0, entonces X e Y son
independientes.
5. DISTRIBUCIN NORMAL MULTIDIMENSIONAL:
Sea

X = (X
1
, X
2
, X
3
, , X
n
) un vector aleatorio. Si la matriz de
covaianzas C de

X tiene determinante distinto de cero, diremos que
la distribucin de

X es normal de dimensin n, cuando la densidad
conjunta de X
1
, X
2
, X
3
, , X
n
viene dada por:
f(x
1
, x
2
, x
3
, , x
n
) =
1
(2)
n
2

exp

1
2

zC
1
z
t

donde es el determinante de la matriz de covarinazas C,


z = ((x
1

1
), (x
2

2
), , (x
n

n
)) ,
i
= E(X
i
) , i = 1, 2, , n
y C
1
es la inversa de C.
(a) Si
ij
= Cov(X
i
X
j
) = 0, para i distinto de j, entonces C es una
matriz diagonal tal que
Diag(C) =

2
1
,
2
2
,
2
n

Calcule C
1
.
(b) Demuestre que si
ij
= Cov(X
i
X
j
) = 0, para i distinto de j, entonces
X
1
, X
2
, X
3
, , X
n
son mutuamente independientes.
Observacin: la parte b) establece que un vector normal aleato-
rio tiene componentes mutuamente independientes s y slo si
Cov(X
i
X
j
) = 0 para i distinto de j. Es decir, si y slo si la matriz
de covarianzas es diagonal.
2
6. Sea X una variable aleatoria con distribucin normal N(,
2
).
(a) Demuestre que su transformada de Laplace viene dada por:
L(s; , ) = e
s
e

2
s
2
2
,
deduzca de aqu su Transformada de Fourier ( o Funcin Carac-
terstica).
(b) Sea Z = X
2
, donde X es normal N(0, 1). Calcule la transfor-
mada de Laplace de Z y deduzca que su distribucin es gamma
de parmetros p =
1
2
, =
1
2
; es decir, que su funcin de densidad
viene dada por:
f
Z
(z) =
p
1/2z
1/2
e

z
2
(1/2)
donde (1/2) =

. Puede calcular la densidad de Z sin calcular


su transformada de Laplace?
(c) Sean X
1
, X
2
, X
3
, , X
n
variables aleatorias independientes e idn-
ticamente distribudas, normales N(0, 1). Sea
Y = X
2
1
+ X
2
2
+ X
2
3
+ + X
2
n
.
Calcule la transformada de Laplace de Y. Deduzca que Y tiene
distribucin gamma de parmetros p =
n
2
, =
1
2
, es decir, que la
densidad de Y viene dada por:
f
Y
(y) =
(1/2)
n
2
y
(n2)/2
e

y
2
(n/2)
Esta distribucin recibe el nombre de chi-cuadrado (X
2
) con n
grados de libertad.
7. Sea X una variable aleatoria N(0, 1). Y una variable aleatoria chi-
cuadrado (X
2
) con n grados de libertad. Si X e Y son independientes,
denimos T como:
T =

n
X

Y
.
Demuestre que la densidad de T viene dada por:
f
T
(t) =
(
n+1
2
)

n(n/2)
1

(1 +
t
2
n
)

n+1
2
, t (, )
3
La distribucin de T recibe el nombre de distribucin tStudent con
n grados de libertad ( o de parmetro n). Note que f
T
es simtrica
alrededor del origen (E(T) = 0).
Sugerencia: calcule F
t
(t) = P(T t) = P

X
t

, utilizando la
densidad conjunta de X e Y, luego derive respecto a t.
8. Sean X
1
, X
2
, X
3
, , X
n
variables aleatorias independientes, normales
N(
i
,
2
i
), i = 1, 2, , n. Demuestre que la variable aleatoria:
X = a
1
X
1
+ a
2
X
2
+ a
3
X
3
+ + a
n
X
n
tiene distribucin N(,
2
), donde
= a
1

1
+ a
2

2
+ a
3

3
+ + a
n

n
,
2
=
n
X
i=1
a
2
i

2
i
9. Sean X
1
, X
2
, X
3
, , X
n
variables aleatorias independientes e idntica-
mente distribuidas, normales N(,
2
).
(a) Sea
_
X =
1
n
n
P
i=1
X
i
. Demuestre que
_
X tiene distribucin normal N(,
2
/n).
Sugerencia: Calcule la transformada de Fourier de
_
X.
(b) Sea Z =
1

2
n
P
i=1
(X
i
)
2
. Demuestre que Z tiene distribucin X
2
con
n grados de libertad.
(c) Sea S
2
=
1
n
n
P
i=1
(X
i

_
X)
2
. Verique que:
1

2
n
X
i=1
(X
i

_
X)
2
=
nS
2

2
.
El objetivo de este ejercicio es demostrar que la variable aleatoria
nS
2

2
, tiene distribucin X
2
con n 1 grados de libertad. Observe
que en la denicin de S
2
si sutituimos las variables aleatorias
X
i
por Z
i
= X
i
, el valor de S
2
no vara.
4
Denamos las siguientes variables aleatorias:
Y
1
=
1

12
(Z
1
Z
2
)
Y
2
=
1

23
(Z
1
+ Z
2
2Z
3
)
Y
n1
=
1

(n1)n
(Z
1
+ Z
2
+ Z
3
+ + Z
n1
(n 1)Z
n
)
Y
n
=
1

n
n
P
i=1
Z
i
.
i. Demuestre que las variables aleatoriasY
1
, Y
2
, Y
3
, , Y
n
tienen
distribucin N(0,
2
).
ii. Verique, calculando las correlaciones entre ellas, que son in-
dependientes.
iii. Establezca por induccin que
n
X
i=1
Y
i
2
=
n
X
i=1
Z
i
2
(La transformacin denida en c, deja invariante el origen).
iv. Demuestre que nS
2
=
n1
P
i=1
Y
i
2
.
v. Deduzca que
nS
2

2
tiene distribucin X
2
con n 1 grados de
libertad.
(d) Note que
_
X =
1

n
Y
n
+. Deduzca que S
2
y
_
X son independientes.
(e) Sea S
2
1
=
1
n1
n
P
i=1
(X
i

_
X)
2
i. Verique que:
nS
2

2
=
(n 1)S
2
1

2
ii. Sean
X =

n
(
_
X )

; Y =
(n 1)S
2
1

2
.
Verique que X es normal estndar e Y es X
2
con n1 grados
de libertad. Adems X e Y son independientes.
iii. Verique que:
_
X
S
1

n =

n 1X

Y
5
y deduzca de esta igualdad que la distribucin de
_
X
S
1

n
es t student con (n 1) grados de libertad.
Abril-Julio 2004/MMOM
6
ESTIMADORES PUNTUALES
ESTADSTICA -PRCTICA N
o
5
1. Sea

un estimador de un parmetro . Sea b el sesgo de

, es decir,
b = E

.
Demuestre que el error cuadrtico medio de

es igual a:
V ar(

) +b
2
.
2. Sean

1
y

2
dos estimadores insesgados de un parmetro tales que
V ar(

1
) =
2
1
, V ar(

2
) =
2
2
Demuestre que si a es un nmero real, entonces:

3
= a

1
+ (1 a)

2
es un estimador insesgado de . Si

1
y

2
son independientes, cmo se
debe escoger a para minimizar la varianza de

3
?
3. Sea Y
1
, Y
2
, Y
3
una muestra aleatoria simple de una distribucin expo-
nencial de densidad:
f(y) =

, y > 0
0 si no
Considere los 5 siguientes estimadores de :

1
= Y
1
,

2
=
Y
1
+Y
2
2
,

3
=
Y
1
+ 2Y
2
3
,

4
= min(Y
1
, Y
2
, Y
3
),

5
=
_
Y
(a) Cules estimadores son sesgados?
(b) Entre estos estimadores, cul es el que tiene la varianza ms pe-
quea?
1
(c) Hallar la eciencia relativa de

1
respecto a

5
, la de

2
y

3
re-
specto a

5
.
4. El nmero de fallas por semanas de un cierto tipo de mini- computado-
ras es una variable aleatoria Y con distribucin de Poisson de parmetro
. Se dispone de una muestra aleatoria simple Y
1
, Y
2
, Y
3
, , Y
n
de Y.
(a) Sugiera dos estimadores insesgados para .
(b) El costo semanal de reparacin de estas fallas es la v.a.
C = 3Y +Y
2
Demuestre que
E(C) = 4 +
2
(c) Obtenga una funcin de Y
1
, Y
2
, Y
3
, , Y
n
, que sea un estimador
insesgado de E(C) .
5. Sea X
1
, X
2
, X
3
, , X
n
una muestra aleatoria simple de una distribu-
cin de Bernoulli de parmetro p.
(a) Demuestre que
_
X es un estimador insesgado de p.
(b) Considere el estimador
n
_
X(1
_
X)
?Es ste un estimador insesgado de la varianza de la distribucin?
(c) Modique adecuadamente el estimador anterior para obtener un
estimador insesgado de la varianza.
6. Sea X
1
, X
2
, X
3
, , X
n
una muestra aleatoria simple de una distribu-
cin normal N(
1
,
2
1
) y Y
1
, Y
2
, Y
3
, , Y
m
una muestra aleatoria simple
de una distribucin normal N(
2
,
2
2
), supongamos que las X
i,
Y
j
, son
independientes entre s.
(a) Considere el estadstico
_
X
_
Y y encuentre su distribucin, su
media y su varianza. Es ste un estimador insesgado de
1

2
?
2
(b) Sean:
S
2
1
=
1
n1
n
P
i=1
(X
i

_
X)
2
, S
2
2
=
1
m1
n
P
i=1
(Y
i

_
Y )
2
S
p
=
(n1)S
2
1
+(m1)S
2
2
n+m2
S
p
se puede interpretar como una ponderacin de S
2
1
y S
2
2
. En el
caso n = m, S
p
=
S
2
1
+S
2
2
2
. Demuestre que si
1
=
2
= , entonces
S
p
es un estimador insesgado de
2
.
7. Se utiliza el siguiente procedimiento para evitar respuestas falsas a
preguntas delicadas en una encuesta. Sea A una pregunta delicada (por
ejemplo, evade Ud. el pago de impuestos?). Sea B una prgunta inocua
(por ejemplo, su cdula de identidad termina en un nmero par?). Se le
pide al sujeto que lance una moneda en secreto; si sale cara, contesta la
pregunta A, si sale sello contesta la pregunta B. El encuestador recibe
una sola respuesta (si o no) y no sabe a qu pregunta corresponde. Si
esta encuesta se realiza a 1000 sujetos y 600 de ellos contestaron si
, qu porcentaje de individuos se estima que evade impuesto?
8. Sea X
1
, X
2
, X
3
, , X
n
una muestra aleatoria simple de una distribu-
cin N(, ). Consideremos los estimadores de del tipo siguiente:
U = a
1
X
1
+a
2
X
2
+a
3
X
3
+ +a
n
X
n
donde a
1
, a
2
, a
3
, , a
n
son nmeros reales. Determine los a
i
para que
U sea un estimador insesgado y tenga varianza mnima.
9. Demuestre que si
f
es un estimador insesgado de y si V ar(
f
) no es
igual a cero, entonces
f

2
no es un estimador insesgado de
2
.
10. Demuestre que la media muestral
_
X es un estimador insesgado de var-
ianza mnima del parmetro de una poblasin de Poisson.
M.M.O.M./Abril 2004
3
Mtodos de Estimacin.
Estadstica
Prctica N
o
6
1. Dada una muestra aleatoria simple de tamao n de una variable aleato-
ria X, calcular el estimador de mxima verosimilitud y de los momentos
cuando X tiene las siguientes distribuciones:
(a) Bernoulli de parmetro p.
(b) Poisson de parmetro .
(c) Exponencial de parmetro .
(d) N(,
2
) con y desconocido.
(e) N(,
2
) con conocido y desconocido.
(f) N(,
2
) con desconocido y conocido.
Hallar en cada caso las propiedades del estimador obtenido: sesgo,
consistencia, eciencia.
2. Hallar por el mtodo de los momentos los estimadores de y para
la funcin Gamma (, ).
3. La muestra 1.3, 0.6, 1.7, 2.2, 0.3, 1.1 proviene de una distribucin uni-
forme en [0, b] . Encontrar los valores numricos de los estimadores de b
obtenidos por los mtodos de mxima verosimilitud y de los momentos.
4. El nmero de defectos congnitos de un individuo en una cierta poblacin
sigue una distribucin de Poisson de parmetro . De una muestra de
n = 50 individuos de la poblacin, se observaron los siguientes datos:
N
o
de defectos 1 2 3 4
Frecuencias 31 15 4 0
Hallar el estimador de mxima verosimilitud del parmetro .
5. Una variable aleatoria discreta toma los valores 0, 1 y 2 con:
P(0) = p
2
, P(1) = 2p(1 p), P(2) = (1 p)
2
,
donde 0 < p < 1 es un parmetro desconocido. Hallar la estimacin
mximo verosmil de p a partir de una muestra de tamao n = 100 en
la que se ha presentado 23 veces el 0, 52 veces el 1 y 25 veces el 2.
1
6. Para determinar la verdadera proporcim p de artculos defectuosos
en un lote grande, se revisan uno tras otro artculos de ste, hasta
encontrar 10 defectuosos. Si tuvimos que revisar 168 artculos antes de
parar, cul es el estimador de mxima verosimilitud de p?
7. Sea Y
1
, Y
2
, Y
n
una muestra aleatoria simple de una distribucin uni-
forme en el intervalo [0, 2 + 1] , con > 0 es decir, con densidad:
f(y) =

1
2+1
, 0 < y < 2 + 1
0 , y 0
Encuentre el estimador de mxima verosimilitud de .
8. Sea Y
1
, Y
2
, Y
n
una muestra aleatoria simple de una distribucin con
la siguiente densidad:
f(y) =

2(y)

2
, 0 < y <
0 , y 0
Determinar el valor de por el mtodo de los momentos.
9. Supongamos que X
1
, X
2
, X
n
y Y
1
, Y
2
, Y
n
son muestras aleatorias
simples de dos poblaciones normales independientes con medias
1
y

2
y varianzas
2
1
y
2
2
respectivamente. Determinar el estimador de
mxima verosimilitud de
1

2
.
Sugerencia: Considere la muestra Z
i
= X
i
Y
i
, halle su distribucin y
escribasu funcin de verosimilitud.
10. Una mquina se puede averiar por dos razones A y B. Se desea estimar
la probabilidad de avera diaria de cada tipo sabiendo que:
(a) La probabilidad de avera tipo A es doble que la de B.
(b) No existen otros tipos de avera posible.
(c) Se han observado 30 das con el resultado siguiente: 2 averas tipo
A, 3 tipo B y 25 das sin avera.
Respuesta: p
A
=
1
18
, p
B
=
2
18
, p
C
= probabilidad de no avera=
15
18
.
11. Demostrar que
_
X es un estadstico suciente para en un modelo de
Poisson.
2
12. Sea f(x) = x
1
, x (0, 1) . Hallar el estimador de mximo verosmil
para y vericar que es un estadstico suciente.
13. Basndose en la igualdad
n
X
i=1
(x
i
)
2
=
n
X
i=1

x
i

_
x

2
+n

_
x

2
demuestre que la funcin de verosimilitud de un modelo normal N(,
2
)
se puede escribir
L(, ) =
1

n
(2)
n
2
exp
h

n
2
2

s
2
+ (
_
x )
2

i
concluyendo que el estadstico vectorial T
n
= T(X
1
, , X
n
) = (
_
X, S
2
)
es suciente para
(, ) RR
+
(una familia paramtrica). Sugerencia: tome
h(x
1
, , x
n
) = 1, para obtener
L(, ) = h(x
1
, , x
n
)(, , T(x
1
, , x
n
))
: R
2
R
MMOM/2004
3
Captulo III
Intervalos de Conanza
Mara Margarita Olivares
Mayo 2004
1 Estimacin por Intervalos de Conanza.
1.1 Introduccin y conceptos bsicos.
Sea X
1
, X
2
, , X
n
una muestra aleatoria simple de una variable aleatoria
X cuya distribucin depende de uno o varios parmetros desconocidos. Si
T(X
1
.X
2
, , X
n
) es un estimador puntual de (un parmetro desconocido
de la distribucin), dada una observacin x
1
, x
2
, , x
n
, estimamos por
T(x
1
, x
2
, , x
n
).
La estimacin puntual tiene como inconveniente que al dar como estimacin
del parmetro desconocido un nico valor, la estimacin no coincidir con
el verdadero valor del parmetro, luego, para que sto tenga inters prctico
debemos conocer el grado de precisin de la estimacin o conformarnos con
que la equivocacin no sea muy grande.
El concepto de estimacin por Intervalo de Conanza proporciona una
respuesta a esta cuestin.
Ejemplo:
Supongamos que una tienda mantiene registros sobre el nmero de unidades
de cierto producto que vende mensulamente.El conocimiento de la demanda
promedio es importante para el mantenimiento del inventario. Se supondr
que no hay uctuaciones en la temporada.
En los ltimos 36 meses, en base a los datos, se tiene una media
_
x = 200
unidades. Es decir, esta media es una estimacin puntual de un parmetro
desconocido, el cual representa la demanda promedio de este producto en
1
la tienda. Del conocimiento de este estimador no podemos responder por
ejemplo, la siguiente pregunta: ? podra la demanda media desconocida no
ser mayor a 250 ni menor a 150 unidades?, pues no se tiene alguna indicacin
del posible error en la estimacin puntual, por eso, no podemos responder
esta pregunta. El error en el estimado puntual se mide en trminos de la
variacin (varianza) muestral del correspondiente estimador.
Si por ejemplo, la desviacin estndar de la media
_
X es 60 unidades,
valindonos del teorema central del lmite podemos argumentar que
_
X tiene
una distribucin aproximadamente N(, = 60), de aqu se deduce que
la probabilidad de que
_
X se encuentre a dos desviaciones estndar de la
verdadera media es aproximadamente igual a 0, 95. Es decir, para n grande,
P

_
X

< 120

= 0, 95
o equivalentemente
P

_
X 120 < <
_
X + 120

= 0, 95
si sustituimos el valor de la media muestral
_
x = 200 obtenido se tiene que
(80, 320) lo cual sugiere que la demanda podra ser tan grande como 250
y tan pequea como 150 unidades siempre que
q
V ar(
_
X) = 60.
Observe que

_
X 120,
_
X + 120

es un intervalo aleatorio y la probabil-


idad de que la verdadera media est all es de 0, 95. Si se obtuviesen 100
muestras del mismo tamao en forma repetida de una poblacin y para cada
muestra se calculan las madias observadas y sustituimos
_
x en el intervalo
aleatorio debe esperarse que 95 de ellos contenagan el verdadero valor de la
media desconocida. El intervalo especco (80, 320) no es ms que una
realizacin del intervalo aleatorio

_
X 120,
_
X + 120

en base a los datos de


una sola muestra en la cual sustituimos
_
x = 200. El valor de probabilidad
0, 95 se reere slo al intervalo aleatorio

_
X 120,
_
X + 120

, es incorrecto
decir que la probabilidad de que (80, 320) es de 0, 95 pues aqu slo hay
constantes, nada es aleatorio, lo que se puede decir que con una conanza
de 0, 95 podemos decir que (80, 320) , lo cual es una alta conanza. Asi
que no es correcto escribir P(80 < < 320) = 0, 95, en algunos textos lo
escriben abusando del lenguaje probabilstico pero debe entenderse como se
explic arriba. De acuerdo a estas aclaratorias, el intervalo (80, 320) recibe
el nombre de intervalo de conanza del 95% para .
2
1.1.1 Denicin:
Intervalo de Conanza al nivel 1 para el parmetro construido a partir
de la muestra X
1
, X
2
, , X
n
, es una pareja de estadsticos (T
1
, T
2
), que
cumplan la propiedad:
P(T
1
(X
1
, X
2
, , X
n
) T
2
(X
1
, X
2
, , X
n
)) = 1
1.1.2 Denicin:
Regin de conanza al nivel 1 para el parmetro construida a partir de
la muestra X
1
, X
2
, , X
n
es una aplicacin C que a cada punto

x = (x
1
, x
2
, , x
n
) R
n
asocia el subconjunto C(

x) del espacio de parmetros, de modo que


P( C(X
1
, X
2
, , X
n
)) = 1
Ntese que C(X
1
, X
2
, , X
n
) es un conjunto aleatorio. En el caso en que el
espacio de parmetros est contenido en R, si este conjunto es un intervalo, la
regin de conanza se llama intervalo de conanza y esta denicin coincide
con la dada anteriormente.
1.1.3 Mtodo prctico para la construccin de intervalos de con-
anza.
1. Obtener una variable aleatoria g(X
1
, X
2
, , X
n
; ) que sea funcin de
la muestra y del parmetro desconocido cuya distribucin sea conocida
e independiente de .
2. Obtener un conjunto D en el rango de g para el cual valga
P(g(X
1
, X
2
, , X
n
; ) D) = 1
3. Expresar el suceso [g(X
1
, X
2
, , X
n
; ) D] en la forma equivalente
[ C(X
1
, X
2
, , X
n
)]
La regin C(X
1
, X
2
, , X
n
) es una regin de conanza al nivel 1
para , si sta resulta ser un intervalo, entonces es un intervalo de
conanza.
3
1.1.4 Observaciones:
1. Si
C(X
1
, X
2
, , X
n
) = (T
1
(X
1
, X
2
, , X
n
), T
2
(X
1
, X
2
, , X
n
)
es un intervalo de conanza para al nivel 1 a menudo se dice que
constituye un intervalo de conanza de 100(1 )% o con coeciente
de conanza 100(1 )%.
2. El coeciente de conanza 1 es un valor que elige el experimentador.
Suele tomarse = 0, 10 ( 0, 05 0, 01), es decir 100(1 )% ser 90%
respectivamente 95% 99%.
3. El coeciente de conanza representa la probabilidad proporcin de
veces que los intervalos conocidos contendrn el verdadero valor de .
4. El valor desconocido es constante, mientras que los intervalos obtenidos
son aleatorios puesto que sus extremos dependen de la muestra aleatoria.
As, un intervalo de conanza del 95%( una estimacin por intervalos
al nivel 0, 95) no es un intervalo jo que contiene a con probabilidad
0, 95, sto no tendra sentido pues si el intervalo es jo el parmetro es-
tar o no en l ( la probabilidad sera cero uno). Luego, al evaluar los
extremos del intervalo a partir de la muestra observada x
1
, x
2
, , x
n
,
lo que podemos decir es que si se repitieran las n observaciones varias
veces al menos el 95% de las veces acertaremos, es decir, estar en el
intervalo obtenido.
5. Si podemos elegir entre varios mtodos que dan lugar a diferentes in-
tervalos de conanza para un parmetro desconocido , trataremos de
elegir el que nos proporcione el intervalo de menor longitud.
6. Si hay varios parmetros desconocidos hallaremos regiones de conanza
o intervalos de conanza para cada uno de ellos.
1.2 Estimacin por intervalos de conanza para la me-
dia :
1.2.1 Para la distribucin N(, ) cuando es conocido:
Sea X
1
, X
2
, , X
n
una muestra alatoria simple de la variable aleatoria X de
distribucin N(, ), cuando es conocido.
4
Para un nivel de conanza 1 consideremos el estadstico:
Z =
(
_
X )
/

n
=

n
(
_
X )

el cual tiene distribucin normal N(0, 1). Sea z

2
el valor tal que si Z es
normal estndar satisface:
P

Z > z

=

2
.
Si es conocido podemos buscar este valor en la tabla de la distribucin
normal. Puesto que la distribucin normal es simtrica alrededor del origen,
se tiene que :
P

Z < z

=

2
,
por lo tanto
P

2
< Z < z

= 1
Si sustituimos el valor de Z en la expresin anterior y despejando , obten-
dremos:
P

_
X

n
z

2
< <
_
X +

n
z

= 1
es decir, con probabilidad 1 , se encuentra en el intervalo aleatorio

_
X

n
z

2
,
_
X +

n
z

;
dicho de otra forma: para cada muestra x
1
, x
2
, , x
n
, el intervalo que se
obtien como estimacin es
I =

_
x

n
z

2
,
_
x +

n
z

con nivel 1 , donde


_
x =
1
n
n
P
i=1
x
i
. Es habitual expresar este resultado di-
ciendo que : la estimacin de es
_
xcon error de

n
z

2
para un nivel de
conanza 1 .
5
1.2.2 Ejemplos:
1. A partir de una muestra aleatoria simple X
1
, X
2
, , X
n
de la distribu-
cin N(, 1) construir un intervalo de conanza para al nivel 95%
siendo la media observada
_
x = 3, 05; n = 100.
Usando el procedimiento anteriormente desarrollado, se obtienen que
el intervalo de conanza al nivel 95% es:

_
X
z
0,025
10
,
_
X +
z
0,025
10

donde z
0.025
se obtiene en la tabla de la distribucin normal, hallando:
P(Z > z
0,025
) = 1 P(Z z
0,025
) =

2
= 0, 025
de donde
P(Z z
0,025
) = 1 0, 025 = 0, 975.
De aqu se obtiene que
z
0,025
= 1, 96.
Luego el intervalo de conanza es

_
X 0, 196,
_
X + 0, 196

Basndonos en nuestras observaciones, sustituimos


_
X por su valor ob-
servado para obtener como estimacin del intervalo
I = (2.85, 3.25)
al nivel de conanza de 95%.
2. Si en el ejemplo anterior se desea estimar el tamao necesario de la
muestra de manera tal que con probabilidad 1 = 0, 95 la media
muestral
_
X se encuentre en un intervalo igual a = 0, 20 unidades
alrededor de la media de la distribucin se procede de la siguiente
manera: puesto que en en este caso
P

n
z

2
<
_
X <
1

n
z

= 1 = 0.95
6
y lo que se quiere es que
_
X ( 0.20, + 0.20)
con probabilidad 0.95, tomamos =
1

n
z

2
= 0.20, hemos calculado en
este caso z

2
y obtuvimos 1.96, despejando n en la ltima ecuacin se
tiene que
n =

1.96
0.20

2
= 96.04
Si tomamos n = 97 podemos conar en que si estimamos por medio
de
_
X el error ser menor que 0.20 para el nivel 0.95.
1.2.3 Para la distribucin N(, ) cuando es desconocido:
Sea X
1
, X
2
, , X
n
una muestra alatoria simple de la variable aleatoria X de
distribucin N(, ), cuando es desconocido.
En este caso se sabe que
(
_
X)
/

n
=

n
(
_
X)

es N(0, 1)
(n1)S
2
1

2
es X
2
n1
y que S
2
1
y
_
X son independientes, por lo tanto el estadstico:
(
_
X )
S
1
/

n
=
(
_
X )
S/

n 1
tiene distribucin t de Studente con n 1 grados de libertad, donde
S
2
1
=
1
n 1
n
X
i=1
(x
i

_
x)
2
, S
2
=
1
n
n
X
i=1
(x
i

_
x)
2
.
Recordemos que la densidad correspondiente a esta distribucin es simtrica
alrededor del origen. Es fcil ver que si
T
n1
=
(
_
X)
S
1
/

n
E(T
n1
) = 0, V ar(T
n1
) =
n
n2
, lim
n
V ar(T
n1
) = 1.
7
Usaremos una notacin anloga al caso anterior, llamando t
n1,

2
el valor tal
que si T
n1
es tStudent con n 1 grados de libertad
P

T
n1
> t
n1,

=

2
.
entonces se tendr que
P

t
n1,

2
<
(
_
X)
S
1
/

n
< t
n1,

= 1
P

_
X
S
1

n
t
n1,

2
< <
_
X +
S
1

n
t
n1,

= 1
siendo, el intervalo aleatorio

_
X
S
1

n
t
n1,

2
,
_
X +
S
1

n
t
n1,

el intervalo de conanza para al nivel 1 .


As, a cada muestra x
1
, x
2
, , x
n
,le corresponde la estimacin por inter-
valo
I =

_
x
s
1

n
t
n1,

2
,
_
x +
s
1

n
t
n1,

al nivel 1 . A este nivel la estimacin de


00
es
_
xcon error de
s
1

n
t
n1,

2
.
1.3 Estimacin por intervalos de conanza para
2
:
1.3.1 Para la distribucin N(, ) cuando es desconocido:
Sea X
1
, X
2
, , X
n
una muestra aleatoria simple de la variable aleatoria X
de distribucin N(, ), con y son desconocidos. Fijemos un nivel 1
y consideremos el estadstico
1

2
n
X
i=1
(X
i

_
X)
2
=
(n 1)S
2
1

2
,
el cual tiene distribucin chi- cuadrado con n 1 grados de libertad. Esta
densidad no es simtrica alrededor del cero. Queremos hallar un intervalo tal
que
P

a < X
2
n1
< b

= 1 , P

X
2
n1
b

= P

X
2
n1
a

=

2
8
de aqu se deduce que a = x
2
n1,1

2
, b = x
2
n1,

2
. As tendremos:
P

x
2
n1,1

2
<
(n 1)S
2
1

2
< x
2
n1,

= 1
despejando
2
obtenemos:
P

(n 1)S
2
1
x
2
n1,1

2
<
2
<
(n 1)S
2
1
x
2
n1,

2
!
= 1
obtenindose como intervalo aleatorio de conanza para
2

(n 1)S
2
1
x
2
n1,1

2
,
(n 1)S
2
1
x
2
n1,

2
!
al nivel 1 . Si queremos estimar
2
con S
2
en lugar de S
2
1
=
n
n1
S
2
,
obtendremos el intervalo:

nS
2
x
2
n1,1

2
,
nS
2
x
2
n1,

2
!
.
1.3.2 Para la distribucin N(, ) cuando es conocido:
En este caso podemos hallar el intervalo de conanza para como lo hicimos
para cuando es conocido, pero en este caso despejamos en lugar de
. Se recomienda estimar usando el estadstico del caso anterior el cual no
depende de .
1.4 Intervalos de Conanza para
1

2
en el caso Nor-
mal:
Un problema importante es la comparacin de las medias de dos poblaciones.
Por ejemplo, podra desearse comparar la efectividad de dos mtodos de
enseanza. Para sto, los estudiantes se dividiran en dos grupos, con uno de
ellos se usara el mtodo A y con el otro el mtodo B. Entonces habra que
hacer inferencias respecto a la diferencia en el aprovechamiento promedio de
los estudiantes, medido en base a alguna prueba.
En este caso se consideran dos poblaciones, la primera con media
1
y
varianza
2
1
y la segunda con media
2
y varianza
2
2
.
9
Se extrae una muestra aleatoria de n
1
observaciones de la primera poblacin
y una muestra aleatoria de n
2
observaciones de la segunda poblacin y se
supone que las muestras se extraen independientemente.
Sean X
1
, X
2
, , X
n
la muestra alatoria de la primera poblacin con
distribucin N(
1
,
1
) y Y
1
, Y
2
, , Y
n
la muestra alatoria de la segunda
poblacin con distribucin N(
2
,
2
) ,
_
X
_
Y es un estimador puntual de

2
, insesgado pues:
E

_
X
_
Y

= E
_
(X) E(
_
Y ) =
1

2
y consistente, pues
V ar(
_
X
_
Y ) = V ar(
_
X) +V ar(
_
Y ) =

2
1
n
1
+

2
2
n
2
0, n
1
, n
2
.
1.4.1 Para la distribucin Normal cuando
1
y
2
son conocidos,
al nivel 1 :
El estadstico
Z =
_
X
_
Y (
1

2
)
q

2
1
n
1
+

2
2
n
2
tiene distribucin N(0, 1). Tomando z

2
tal que
P

Z > z

=

2
se tiene que
P

2
< Z < z

= 1
despejando
1

2
, obtenemos:
P

_
X
_
Y z

2
s

2
1
n
1
+

2
2
n
2

1

2

_
X
_
Y +z

2
s

2
1
n
1
+

2
2
n
2

= 1 .
De aqu que un un intervalo aleatorio de conanza para
1

2
si
1
y
2
son
conocidos, al nivel 1 es:

_
X
_
Y z

2
s

2
1
n
1
+

2
2
n
2
,
_
X
_
Y +z

2
s

2
1
n
1
+

2
2
n
2

.
10
1.4.2 Ejemplo:
Se compara la calidad de dos tipos de neumticos para automviles probando
muestras de n
1
= n
2
= 100 neumticos de cada tipo. Para sto se observa
el nmero de kilmetros recorridos hasta que se produce un desgaste que se
dene como una cierta cantidad de desgaste. Se supone
2
1
= 1.400.000,
2
2
=
1.960.000 ambos conocidos y que la distribucin de los recorridos es normal.
Como resultados de las pruebas se obtuvo
_
x = 26.400Kms.,
_
y = 25.100Kms.
Estimemos mediante un intervalo de conanza de 0.99 la diferencia de las
medias:
1 = 0.99, = 0.01,

2
= 0.005, z

2
= 2, 5758
q

2
1
n
1
+

2
2
n
2
= 183, 0303;
_
X
_
Y = 1300
As obtenemos como intervalo para
1

2
(827, 8481; 1772, 1519)
al estimar
1

2
por
_
X
_
Y se comete un error de estimacin de
z

2
s

2
1
n
1
+

2
2
n
2
= 472, 1519Kms.
1.4.3 Para la distribucin Normal cuando
1
y
2
son desconocidos
pero iguales, al nivel 1 :
Si

1
=
2
= , X
1
, X
2
, , X
n
e Y
1
, Y
2
, , Y
n
son dos muestras independientes de distribuciones N(
1
,
1
) y N(
2
,
2
) respectivamente,
consideramos el estadstico:
T =
_
X
_
Y (
1

2
)
q
1
n
1
+
1
n
2
S
p
con
S
2
p
=
(n
1
1)S
2
1
+ (n
2
1)S
2
2
n
1
+n
2
2
siendo
S
2
1
=
1
n
1
1
n
1
X
i=1
(X
i

_
X)
2
, S
2
2
=
1
n
2
1
n
2
X
i=1
(Y
i

_
Y )
2
.
11
El estadstico T tiene distribucin t Student con n
1
+ n
2
2 grados de
libertad. Un intervalo de conanza para
1

2
, en este caso se obtiene
haciendo:
P

t
n
1
+n
2
2 ,

2
T t
n
1
+n
2
2 ,

= 1
donde
P

T
n
1
+n
2
2
t
n
1
+n
2
2 ,

=

2
.
Despejando
1

2
obtenemos:
P

_
X
_
Y S
p
t
n
1
+n
2
2 ,

2
q
1
n
1
+
1
n
2

1

2

_
X
_
Y +S
p
t
n
1
+n
2
2 ,

2
q
1
n
1
+
1
n
2

=
1
De aqu se deduce que el intervalo de conanza aleatorio para
1

2
cuando
1
=
2
= es desconocido ser

_
X
_
Y S
p
t
n
1
+n
2
2 ,

2
r
1
n
1
+
1
n
2
,
_
X
_
Y +S
p
t
n
1
+n
2
2 ,

2
r
1
n
1
+
1
n
2

.
1.4.4 Observacin:
Si n es grande (n 30), las tablas de la distribucin t con n grados de
libertad dan la aproximacin normal. De all que si n
1
+n
2
2 30, resolver
el problema para
1
=
2
= desconocido es equivalente a usar el intervalo
de conanza para
1

2
con
1
y
2
conocidos e iguales estimndolo con S
p
que es un estimador insesgado de . Observe que
S
p
t
n
1
+n
2
2 ,

2
r
1
n
1
+
1
n
2
= t
n
1
+n
2
2 ,

2
s
S
2
p
n
1
+
S
2
p
n
2
y si n
1
+n
2
2 30, t
n
1
+n
2
2 ,

2

= z

2
.
1.4.5 Preliminar: Distribucin F o de Snedeccor.
Si Y
1
y Y
2
son variables aleatorias independientes de distribucin Chi-cuadrado
con n
1
y n
2
grados de libertad, respectivamente, la distribucin del cociente
Z =
Y
1
n
1
Y
2
n
2
12
se denomina distribucin F o de Snedeccor.
Se deja como ejercicio, utilizar las tcnicas conocidas del curso de proba-
bilidades para demostrar que la densidad viene dada por:
f
F
(z) =

n
1
+n
2
2

n
1
2

n
2
2

n
1
n
2

n
1
2
z
n
1
2
1

1 +
n
1
z
n
2

n
1
+n
2
2
, si z 0
Los parmetros n
1
y n
2
suelen denominarse grados de libertad de la distribu-
cin.
Los fractiles de esta distribucin se encuentran en las tablas. Es decir si
denotamos por F
n
1
,n
2
=
Y
1
n
1
Y
2
n
2
, hallarn
P

F
n
1
,n
2
f
n
1
,n
2;

=
para pequeos. Por lo tanto si queremmos hallar
P

F
n
1
,n
2
f
n
1
,n
21;

= 1
con pequeo, como 1 es grande no podrn utilizar la tabla directamente.
Note que F
n
1
,n
2
f
n
1
,n
21;
equivale a
Y
2
n
2
Y
1
n
1

1
fn
1
,n
21;
por lo tanto
1 = P

F
n
1
,n
2
f
n
1
,n
21;

= P

F
n
2
,n
1

1
f
n
1
,n
21;

=
1 P

F
n
2
,n
1

1
fn
1
,n
21;

, por lo tanto P

F
n
2
,n
1

1
fn
1
,n
21;

=
de donde se concluye que f
n
1
,n
21;
=
1
f
n
2
,n
1
;
1.5 Intervalo de conanza para

1

2
cuando
1
y
2
no se
conocen:
Consideramos el estadstico
F
n
1
1,n
2
2
=
S
2
1

2
1
S
2
2

2
2
=
(n
1
1)
S
2
1

2
1
(n
1
1)
(n
2
1)
S
2
2

2
2
(n
2
1)
13
que tiene distribucin F con parmetros n
1
1 y n
2
1 (del numerador y
del denominador respectivamente), pues (n
1
1)
S
2
1

2
1
tiene distribucin Chi-
cuadrado con n
1
1 grados de libertad y (n
2
1)
S
2
2

2
2
tiene distribucin Chi-
cuadrado con n
2
1 grados de libertad donde S
2
1
y S
2
2
son independientes. Se
obtiene el siguiente intervalo de conanza para el cociente de las varianzas

2
1

2
2
:
I =

S
2
1
S
2
2
1
f
n
1
1,n
2
1,

2
,
S
2
1
S
2
2
f
n
2
1,n
1
1,

2
!
al nivel 1 , donde f
n
2
1,n
1
1,

2
=
1
f
n
1
1,n
2
1,1

2
y
P

f
n
1
1,n
2
1,1

2
<
S
2
1

2
1
S
2
2

2
2
< f
n
1
1,n
2
1,

= 1
1.6 Intervalos de Conanza para muestras grandes:
1.6.1 Para la proporcin p de la Distribucin de Bernoulli:
Sea X
1
, X
2
, , X
n
una muestra aleatoria simple de la variable aleatoria X
de distribucin de Bernoulli de parmetro p.Queremos construir un intervalo
de conanza para p al nivel 1 .
En denitiva lo que se quiere estimar es la proporcin de elementos de
una poblacin que tienen una determinada caracterstica (por ejemplo, pro-
porcin de machos en una poblacin proporcin de xitos).
En este caso la muestra no es normal, pero si la muestra es grande
podemos valernos del teorema central del lmite para tener una aproximacin
Normal de
_
X. Es decir,
_
X =
1
n
n
X
i=1
X
i
es un estadstico insesgado y consistente de p, ya que
E

_
X

= p, V ar(
_
X) =
p(1 p)
n
as el estadstico
_
X p
q
p(1p)
n
14
es aproximadamente normal estndar.
1.6.2 Si = p(1 p) es conocido:
En este caso no hay nada que estimar, pues se conoce p.
1.6.3 Si = p(1 p) es desconocido:
La distribucin de
_
X p
q
p(1p)
n
es normal estndar si n es grande. Si en lugar de ste estadstico, estimamos
la varianza por

p(1

p) donde

p =
_
X, se puede demostrar que
_
X p
q

p(1

p)
n
para n grande, es aproximadamente normal estndar. Observe que
_
X p
q

p(1

p)
n
=
_
X p
q
p(1p)
n
q
p(1p)
n
q

p(1

p)
n
y
q
p(1p)
n
r

p(1

p)
n
1 probabilidad, pues

p =
_
X es un estimador consistente de p.
De aqu se deduce que:
P

2
<
_
X p
q

p(1

p)
n
< z

= 1
y de aqu:
P

_
X z

2
s

p(1

p)
n
< p <
_
X +z

2
s

p(1

p)
n

= 1
15
El intervalo obtendo al (1 )100% de conabilidad, viene dado por:
I =

_
X z

2
s

p(1

p)
n
,
_
X +z

2
s

p(1

p)
n

donde

p =
_
x. El error que se comete al estimar p =
_
X, que es la frecuencia
relativa de xitos es de z

2
q

p(1

p)
n
, donde z

2
verica:
P

Z > z

=

2
si Z tiene distribucin normal estndar.
1.6.4 Comparacin de proporciones:
Sea X
1
, X
2
, , X
n
1
es un muestra alatoria de de una variable aleatoria X con
distribucin B(p
1
) y Y
1
, Y
2
, , Y
n
2
es una muestra alatoria de una variable
aleatoria Y con distribucin B(p
2
), X e Y independientes , n
1
y n
2
grandes
un intervalo de conanza para p
1
p
2
al nivel 1 es:

_
X
_
Y z

2
s
_
X(1
_
X)
n
1
+
_
Y (1
_
Y )
n
2
,
_
X
_
Y +z

2
s
_
X(1
_
X)
n
1
+
_
Y (1
_
Y )
n
2

1.6.5 Para el parmetro de la distribucin de Poisson.


Si X
1
, X
2
, , X
n
1
es un muestra alatoria de una variable aleatoria X con
distribucin de Poisson de parmetro y queremos construir un intervalo de
conanza al nivel 1 para , cuando n es grande, por el teorema central
del lmite, se tiene que:
_
X
q

n
es aproximadamente normal estndar. De aqu se obtiene que:
P

2
<
_
X
q

n
< z

= 1
16
y despejando el parmetro desconocido:
P

_
X z

2
r

n
< <
_
X +z

2
r

n
!
= 1
de este igualdad, usando el mtodo grco para resolver inecuaciones, se
obtiene:
I =

_
X +
z
2

2
n

1
2
z

2
s
4
_
X
n
+
z
2

2
n
2
,
_
X +
z
2

2
n
+
1
2
z

2
s
4
_
X
n
+
z
2

2
n
2

en la prctica, se opera como en el caso de la distribucin de Bernoulli, es


decir, estimamos la varianza por

=
_
x y usando la aproximacin normal
para n grande podemos suponer que:
_
X
q

n
es normal estndar. Obtenemos as, un intervalo de conanza ms simple:
I =

_
X z

2
s

n
< <
_
X +z

2
s

.
1.6.6 Ejercicio:
Hallar un intervalo para la media de la distribucin exponencial de parmetro
1

, es decir, de densidad:
f(x) =

, x > 0
0 si no.
1.7 Construccin de Intervalos de Conanza a partir
de la Desigualdad de Tchebychev.
Si Y es una variable aleatoria se puede probar que si > 0,
P(|Y | )
1

2
E

Y
2

17
sea un parmetro desconocido de la distribucin de Y y

su estimador.
Si R(

) = E
"

2
#1
2
y Y =

R(

)
obtenemos que
1

2
E

Y
2

=
1

2
, pues E

Y
2

= 1
de aqu se obtiene
P


R(

1
1

2
despejando el parmetro desconocido
P

R(

)

+R(

1
1

2
.
Este intervalo de conanza est basado en el estimador

y su error cuadrtico
medio. La desventaja prctica de este mtodo es que se obtienen intervalos
demasiado grandes.
1.8 Otro mtodo de construccin de intervalos de con-
anza:
Si se conoce la distribucin del estimador

y esta depende del parmetro a
estimar, se pueden hallar a() y b() tales que
P

a()

b()

= 1
y despejando el parmetro se obtiene el intervalo de conanza.
1.8.1 Ejemplo: Distribucin uniforme en [0, ] .
Recordemos que el estimador de mxima verosimilitud de es
max(X
1
, X
2
, , X
n
)
cuya esperanza es
n
n+1
; si tomamos

=
n+1
n
max(X
1
, X
2
, , X
n
),

es ins-
esgado.
18
La densidad de

es:
f

(x) =
(
n
n+1
(n+1)
n
x
n1

n
, 0 x
n+1
n

0 si no
Supongamos que queremos hallar a y b tales que
P

a

b

= 1 = 0.90
Hallamos a y b vericando las siguientes ecuaciones:
P

= 0.05, P

= 0.05
obtenemos como solucin
P

(0.05)
1
n
n + 1
n


(0.95)
1
n
n + 1
n

= 0.90
de donde:
P

max(X
1
, X
2
, , X
n
)
(0.95)
1
n

max(X
1
, X
2
, , X
n
)
(0.05)
1
n
!
= 0.90
Observe que si estimamos por max(X
1
, X
2
, , X
n
) se obtiene el mismo in-
tyervalo de conanza para .
1.9 Datos Apareados:
Si (X
1
, Y
1
), , (X
n
, Y
n
) es una muestra aleatoria simple de (X, Y ),y D =
XY, si D es normal N(,
2
), entonces D
1
, D
n
es una muestra aleatoria
simple de D, D
i
= X
i
Y
i
, con distribucin normal N(,
2
). Para obtener
intervalos de conanza par y
2
se procede como en el caso de una muestra
unidimensional, es decir:
1.9.1 Intervalo de Conanza para al nivel 1 :
Si es conocido:
I =

Dz

n
,

D +z

Si es desconocido:
I =

Dt
n1,

2
S
1

n
,

D +t
n1,

2
S
1

19
1.9.2 Intervalo de Conanza para
2
al nivel 1 :
I =

(n 1)S
2
1
X
2
n1,

2
,
(n 1)S
2
1
X
2
n1,1

2
!
donde
S
2
1
=
1
n 1
n
X
i=1
(D
i


D)
2
.
Note que si
E(X
i
) =
1
, V ar(X
i
) =
2
1
, E(Y
i
) =
2
, V ar(Y
i
) =
2
2
E(X
i
Y
i
) =
1

2
= , V ar(X
i
Y
i
) =
2
1
+
2
2
=
2
si X e Y son independientes. Si no lo son

2
=
2
1
+
2
2
2Cov(X, Y ) =
2
1
+
2
2
2
1

2
.
Ejemplo de una muestra con datos apareados.
Se quiere saber si un frmaco tiene el efecto colateral de levar la presin
sitlica sangunea. Se seleccionan en forma aleatoria n personas de diferentes
edades y condiciones de salud. En condiciones controladas de laboratorio se
toma la presin sangunea a cada persona, luego se les administra el frmaco
y nuevamente se toma la presin. Obtenemos as observaciones apareadas:
(X
1
, Y
1
), , (X
n
, Y
n
) de presiones sanguneas de cada sujeto, antes y despus
de administrar el frmaco.
20
Intervalos de Conanza (Parte I)
Estadstica- Prctica N
o
7
1. Los datos que a continuacin se dan son los pesos en gramos del con-
tenido de 16 cajas de cereal que se seleccionaron de un proceso de
llenado, con el propsito de vericar el peso promedio:
506 508 499 497
503 504 510 512
514 493 496 506
502 509 496 505
Si el peso de cada caja es una variable aleatoria normal con una desviacin
estndar igual a = 5grs., obtenga los intervalos de conanza estima-
dos del 90%, 95% y 99%para la media de llenada del proceso.
2. Una nca cuadrada tiene lado L. Suponga que, si medimos esta lon-
gitud L, la medicin, debido a diversos errores, sigue una distribucin
N(L, 1).
En 100 mediciones se ha obtenido una media muestral de 325mts..Si
usamos sta como estimacin de L, obtenga un intervalo de conanza
de 95%para L. Calcule el mnimo tamao que debe tener la muestra
para que en la estimacin de Lse cometa un error mximo de 0.1mts.
con una probabilidad de 0.95.
3. Se hace un envo de latas de conserva, de las que se arma que el peso
medio es de 1000grs.. Se examina una muestra de 5 latas, obtenindose
los siguientes pesos:
995 992 1005 998 1000
en gramos. Encuentre un intervalo de conanza del 95% para el peso
medio de las latas. En base al intervalo obtenido, aceptara Ud. la
armacin de que = 1000grs.?
4. Un fabricante de cauchos asegura que un tipo de caucho tiene una
vida til media de aproximadamente 43000 millas. Para vericar esta
armacin se prueban 10 cauchos en una rueda de prueba que simula las
1
condiciones normales de rodaje. Los tiempos de vida que se obtienen
(en miles de millas) son:
42 36 46 43 41 35 43 45 40 39
Calcule el intervalo de conanza apropiado y decida si estos datos con-
rman o no la armacin del fabricante. Hgalo al nivel (1 ) para
los valores de igual a 0.2, 0.1, 0.05 y 0.01. Discuta los resultados.
5. Halle un intervalo de conanza al nivel (1 ) para correspondiente
a una distribucin normal con media = 0 y desconocido a partir
de una muestra simple X
1
, X
n
de esta distribucin.
6. Sea X el nmero de horas semanales que trabajan los ingenieros de
una gran planta industrial. Suponemos X normal y queremos estimar
su varianza. Para esto se selecciona una muestra de 21 ingenieros de
la planta y se observa que la desviacin de la muestra es de 7 horas.
Calcule el intervalo de conanza del 90%para la verdadera desviacin.
7. Los errores aleatorios que se cometen en las pesadas de una balanza
siguen una distribucin N(,
2
). Se realizan 9 pesadas, comprobndose
los siguientes errores (en mgs.) :
0.07 0.3 1.8 0.1 2.0 2.3 0.62 0.12 1.4
(a) Encuentre un intervalo de conanza del 95%para y un intervalo
de conanza del 95% para
2
.
(b) Aceptara Ud. la armacin del fabricante de balanzas, de que los
errores cometidos en las pesadas siguen una distribucin N(0, 1)?
8. Se administraron 2 nuevos medicamentos a pacientes con padecimiento
cardaco. El primer medicamento baj la presin sangunea de 16 pa-
cientes en un promedio de 11 puntos con una desviacin de 6. El segundo
medicamento baj la presin sangunea de otros 20 pacientes en un
promedio de 12 puntos con una desviacin de 8. Determine un inter-
valo de conanza del 99% para la diferencia en la reduccin media de la
presin sangunea, al suponer que las mediciones tienen distribuciones
normales con varianzas iguales. Qu se puede concluir?
2
9. Una compaa de seguros trabaja con 2 talleres, AyB. La compaa
sospecha que el taller A tiende a cobrar ms que el taller B. Para veri-
car sto, se pide a ambos talleres que hagan un avalo del costo para
reparar 15 vehculos, los mismos en ambos talleres, obtenindose (en
miles de bolvares) los siguientes datos:
Vehculo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Taller A 76 102 95 13 30 63 53 62 22 48 113 121 69 76 84
Taller B 73 91 84 15 27 58 49 53 20 42 110 110 61 67 75
A los niveles de conanza 90, 95 y 99%, decida si estos datos presentan
o no evidencia para aceptar que el taller A tiende a sobre facturar.
10. Un problema importante es el de jar criterios acerca de la cantidad
de sustancias qumicas txicas que se puede tolerar en aguas de ros
y lagos. Una medida comn de toxicidad de una sustancia es la con-
centracin de sta que es capaz de matar el 50% de una especie de
peces en prueba en un tiempo determinado. Esta medida se denomina
CL50 (concentracin letal que mata el 50%).
(a) Para insecticida DDT y una cierta especie de peces, las medidas
de CL50 (en partes por milln) en 12 experimentos fueron:
16 5 21 19 10 5 8 2 7 4 9 2
Suponiendo normalidad, estime la media de CL50 para DDT, con
un coeciente de conanza del 90%.
(b) Otro insecticida comn, el Diazinon, di las siguientes medidas
para su CL50, en tres experimentos:
7.8 1.6 1.3
Encuentre un intervalo de conanza del 90%para la diferencia de
las medias de CL50 para el DDT y el Diazinon (suponga igualdad
de varianzas). Se puede concluir aqu que algunos de los insecti-
cidas es menos letal?
(c) Se realizaron 7 experimentos mas para medir el CL50 del Diazinon
obteniendo los siguientes resultados:
4.6 1.2 10.5 6.3 1.5 7.1 1.8
Repita la parte anterior tomando los 10 datos para el Diazinon.
3
11. Un fabricante asegura a una compaa que le compra un producto
regularmente, que el porcentaje de productos defectuosos no es mayor
dle 5% . Para comprobar la armacin del fabricante, la compaa
selecciona de su inventario, 200 unidades de este producto y las prueba.
Se descubren un total de 19 unidades defectuosas en la muestra, deber
sospechar la compaa de la armacin del fabricante? Utilice 95% de
conabilidad.
12. La Cmara de Comercio de una ciudad se encuentra interesada en es-
timar la cantidad de dinero promedio que gasta la gente que asiste a
convenciones, calculando alojamiento, comida y entretenimiento por
da. De las distintas convenciones se seleccionaron 16 personas y se
les pregunt la cantidad que gastaban por da. Se obtuvo la siguiente
informacin en dlares:
150 175 163 148 142 189 135 174
168 152 158 184 134 146 155 163
si suponemos que la cantidad gastada en un da es una variable aleatoria
con distribucin norma, obtenga los intervalos de conanza estimados
del 90, 95 y 98% para la cantidad promedio real.
MMOM/04
4
Intervalos de Conanza (II)
Estadstica. Prctica N
o
8
1. El tiempo de compras de una muestra aleatoria de 64 clientes de un super-
mercado di un promedio de 33 minutos con una desviacin de 16 minutos.
Estime el verdadero tiempo de compras por cliente con un intervalo de con-
anza del 90%. Suponga distribucin normal.
2. Si se utiliza
_
X como estimador la media , demuestre que podemos tener
el (1 )100% de conanza en que el valor absoluto del error

_
X

, no
exceder una cantidad prejada e, cuando el valor de la muestra sea
n =

z

2
.
Suponga distribucin normal.
3. Supongamos que tenemos una muestra grande de una distribucin de Bernoulli
de parmetro p. Demuestre que podemos tener por lo menos el (1)100%
de conanza en que el valor absoluto del error

p p

, cuando utilizamos la
proporcin de la muestra para estimar p,no exceder una cantidad e especi-
cada cuando el tamao de la muestra sea
n =
z
2

2
4e
2
.
4. En una cierta poblacin se desea conocer la proporcin de individuos alrgi-
cos al polen de Acacias. En 100 individuos escogidos al azar se observaron
10 alrgicos.
1. Hallar el intervalo de conanza del 95% de la proporcin pedida.
2. Cuntos individuos se deberan observar para que, con probabilidad
0.95, el error mximo en la estimacin de alrgicos sea del 1%.
3. Conteste la pregunta anterior si Ud. no dispone de ninguna muestra
ya examinada de la poblacin.
5. Un remedio tpico para la calvicie, el Minoxidil, se administr a un grupo
de 310 hombres calvos, de los cuales el 32% observ crecimiento de cabello
nuevo. Simultneamente se administr un placebo a un grupo de 309 hom-
bres calvos, de los cuales 20% observ crecimiento de cabello nuevo. A
partir de estos datos, al nivel de conanza del 95%, qu puede decir de la
efectividad del Minoxidil?.
6. Se supone que el nmero de erratas por pgina de un cierto libro sigue una
distribucin de Poisson. Elegidas al azar 95 pginas se obtuvo:
Nmero de erratas 0 1 2 3 4 5
Nmero de pginas 40 30 15 7 2 1
Hallar el intervalo de conanza del 90%para el nmero medio de erratas por
pgina en el libro.
1. Usando el Teorema Central del Lmite.
2. Usando la desigualdad de Chebychev.
7. Sea X una variable aleatoria con distribucin Gamma de parmetro p = 2
y desconocido, es decir la densidad de X es:
f(x) =

2
(2)
xe
x
, x > 0.
1. Si Y = 2X, pruebe que Y tiene distribucin chi-cuadrado con 4 grados
de libertad.
2. Utilice la parte anterior para hallar un intervalo de conanza del 90%
para .
8. Se han medido los siguientes valores (en miles de personas) para la audiencia
de un programa de TVen distintos das: 521,742,593,635,788,717,606,639,666,624.
Construir un intervalo de conanza para la audiencia media y otro para la
varianza, bajo hiptesis de normalidad, al 99% de conanza.
9. El nmero diario de piezas fabricadas por una mquina A en cinco das ha
sido: 50,48,53,60,37; mientras que en esos mismos das una mquina B ha
hecho: 40,51,62,55 y 64. Se pide:
1. Construir un intervalo al 95% de conanza para la diferencia de las
medias entre ambas mquinas, suponiendo la misma varianza y dis-
tribucin normal.
2
2. Construir un intervalo para el cociente de las varianzas al 95% de con-
anza.? Es posible suponer que las varianzas son iguales?
3. Utilizando el mismo estimador de la varianza comn hallado en la
primera parte de este ejercicio, halle el tamao muestral n de am-
bas muestras para que al nivel de 95%, la longitud del intervalo de
conanza para la diferencia de las medias sea 8 unidades.
10. Suponga que se mide un objeto independientemente con dos procedimien-
tos de medidas diferentes. Sean L
1
y L
2
las longitudes medidas obtenidas
con cada mtodo. Si cada mtodo est correctamente calibrado podemos
suponer que E(L
1
) = E(L
2
) = L, la longitud verdadera. Los mtodos no
tienen necesariamente la misma exactitud, si medimos la exactitud mediante
la varianza, entonves V ar(L
1
) 6= V ar (L
2
) . Si Z = aL
1
+ (1 a)L
2
como
nuestro estimador de L, es inmediato vericar que es insesgado. ?Para qu
valor de a (0, 1) es mnima la varianza de Z?
11. Una muestra de 400 candidatos polticos, 200 escogidos al azar en el este y
200 en el oeste, se clasic teniendo en cuenta si el candidato tuvo respaldo
de un sindicato nacional y si el candidato gan la eleccin. Un resumen de
los datos es el siguiente:
Oeste Este
Ganadores respaldados por el sindicato 120 142
Encuentre un intervalo de conanza del 95% para la diferencia entre las
proporciones de ganadores respaldados por el sindicato, en el oeste y en el
este.
MMOM/04
3
Captulo IV
Prueba de Hiptesis
Mara Margarita Olivares
Mayo 2004
1 Introduccin:
En los captulos anteriores hemos resuelto el problema de obtener medidas
aproximadas de parmetros de los que depende la distribucin de un conjunto
de observaciones. Ahora queremos tomar decisiones acerca de esos mismos
parmetros. El tipo de decisin que vamos a considerar es el siguiente
sabemos que el parmeetro pertenece a un cierto espacio de parmetros
B. Dado un subconjunto B
0
de Bqueremos decidir si resulta razonable
admitir que B
0
si debemos rechazar esta suposicin,
es decir, consideraremos el estudio de la prueba o contraste de una hipte-
sis.
Una hiptesis estadstica es una armacin con respecto a alguna carac-
terstica desconocida de una poblacin de inters. La esencia de probar una
hiptesis estadstica es el decidir si la armacin se encuentra apoyada por
la evidencia experimental que se obtiene a travs de una muestra aleatoria.
Ilustremos con un ejemplo la nocin de una hiptesis estadstica: se tiene
inters en probar la eciencia de una nueva vacuna contra la gripe o resfriado
comn, para ello se inyectan 10 personas con el suero y se observan por el
periodo de un ao. Ocho personas pasaron el invierno sin resfriado, ?resulta
razonable admitir la eciencia del nuevo suero basndose en el resultado
experimental obtenido?.
El razonamiento que se utiliza en una prueba de hiptesis estadstica
es parecido al procedimiento que se usa en una corte judicial: al juzgar
1
un hombre por robo, la corte siempre asume que el acusado es inocente,
mientras no se pruebe lo contrario. El scal trata por todos los medios de
presentar evidencias que contradigan la hiptesis de inocencia del acusado y
de conseguir su condena. En el problemas estadstico del ejemplo, la vacuna
es el acusado, la hiptesis de prueba, llamada hiptesis nula, es que la vacuna
no es efectiva. El experimentador hace papel de scal, est convencido de
que su vacuna es efectiva y trata de usar la evidencia contenida en la muestra
para rechazar la hiptesis nula.
Intuitivamente procederamos seleccionando el nmero Y de personas que
no contraen el resfriado, como una medida de la cantidad de evidencia en la
muestra. Si Y resulta muy pequeo se tendra poca evidencia para rechazar
o apoyar la hiptesis nula, si Y resulta grande, rechazaramos la hiptesis
nula, concluyendo as que la vacuna es efectiva. De hecho, si la hiptesis nula
fuese cierta (y la vacuna fuese inecaz) la probabilidad de pasar el invierno sin
resfriado sera p =
1
2
, el promedio E(Y ) = np = 5. Existen valores de Y tales
como Y = 10 Y = 0, 1, 2, 3, 4, 5 que permitira a cualquier persona tomar
una decisin intuitiva respecto al rechazo o no de la hiptesis nula (vacuna
inecaz). Pero si Y = 7, 8, 9, ? qu se podra decir?. Ya sea que usemos un
procedimiento objetivo o subjetivo, seleccionaramos aquel que tenga menor
probabilidad de tomar una decisin incorrecta. Un instrumento para tomar
decisiones, es llamado, estadstico de prueba. En nuestro ejemplo, el nmero
de personas no afectadas por el resfriado es suciente como estadstico de
prueba:
Y = n
o
de personas no afectadas por el resfriado
el Rango de Y es
R(Y ) = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
Estos valores se dividen en dos grupos: uno llamado regin de rechazo y el
otro regin de aceptacin. Despus de realizar el experimento, si Y toma un
valor en la regin de rechazo, la hiptesis nula es rechazada, de lo contrario,
el experimentador no rechaza la hiptesis ya que la muestra no presenta su-
ciente evidencia como para rechazar la hiptesis. (Posteriormente veremos
que se rechaza o se acepta la hiptesis nula solo si los riesgos de una decisin
errnea son conocidos y pequeos).
Supongamos que en nuestro ejemplo hemos escogido
{Y = 8 o 9 o10}
2
como regin de rechazo y los otros valores como regin de aceptacin, puesto
que observamos Y = 8 personas sin resfriado, rechazamos la hiptesis nula
de que la vacuna es inecaz y conclumos que la probabilidad de pasar el
invierno sin ningn resfriado es mayor que p =
1
2
cuando se usa la vacuna.
Podramos preguntarnos: ? cul es la probabilidad de rechazar la hipte-
sis nula siendo cierta?. Esto no es ms que la probabilidad del evento
{Y = 8 o9 o10}
si p =
1
2
y esta probabilidad es
P(Y = 8 o Y = 9 o Y = 10) =
10
X
k=8

10
k

1
2

1
2

10k
= 0, 055
Puesto que hemos decidido rechazar la hiptesis nula y la probabilidad de
error es pequea , podemos estar razonablemente seguros de haber tomado
una decisin correcta.
El fabricante de la vacuna se enfrenta a dos tipos de errores posibles:
1. Error de tipo I: rechazar la hiptesis nula y concluir equivocadamente
que la vacuna es ecaz ( esto podra conducir a desarrollar programas
costosos de producin y grandes prdidas nancieras).
2. Error de tipo II: no rechazar la hiptesis nula y concluir equivocada-
mente que la vacuna es inecaz ( aqu el productor perdera las utili-
dades potenciales derivadas de la venta de la vacuna).
La probabilidad de estos dos tipos de errores, y respectivamente, se
relacionan inversamente. Un aumento del tamao de la muestra proporciona
ms informacin para tomar la decisin y por tanto reduce tanto como . El
experimentador selecciona los valores y y luego, la regin de rechazo; el
tamao de la muestra se escoge de acuerdo a estas probabilidades.
En nuestro ejemplo, llamando H
0
la hiptesis nula y H
1
la hiptesis al-
ternativa
H
0
: p = 0.5
H
1
: p > 0.5
= P(Rechazar H
0
siendo cierta) = P(Y = 8, 9, 10/p = 0.5) = 0.055

p
= P(Aceptar H
0
siendo falsa, para p > 0.5)
en particular,
p
= P(Aceptar H
0
siendo falsa, para p = 0.9) =
P(0, 1, 2, 3, 4, 5, 6, 7/p = 0.9) = 0.07
3
Estos valores
= 0.055,
0.9
= 0.07
dan una medida de los riesgos de cometer alguno de los errores posibles para
esta prueba.
2 Conceptos Bsicos:
Una prueba estadstica implica cuatro elementos:
1. La hiptesis nula
2. La hiptesis alternativa
3. El estadstico de prueba
4. La regin de rechazo
2.1 La Hiptesis Nula:
Se indica simblicamente por H
0
y establece la hiptesis sometida a prueba.
As H
0
especica valores para uno ms parmetros de la poblacin. En
el ejemplo anterior, la hiptesis nula es p = 0.5, y puesto que en este caso
H
0
especica un solo valor para el parmetro p, recibe el nombre de hiptesis
simple, de otra forma se conoce como hiptesis compuesta, por ejemplo si
H
0
: p 0.5.
2.2 La Hiptesis Alternativa:
Se indica simblicamente como H
1
la cual debe reejar el valor posible
intervalo de valores del parmetro de inters, si la hiptesis nula es falsa, as,
la hiptesis alternativa representa una forma de negacin de la hiptesis nula.
H
1
puede ser simple o compuesta. En nuestro ejemplo, H
1
es p > 0.5 (es una
hiptesis compuesta). A pesar de que no se pretende generalizar, en muchas
ocasiones es deseable establecer una hiptesis nula que sea ms especca
que la alternativa. De esta manera la hiptesis nula es generalmente simple
y mientras que la alternativa es compuesta.
4
2.3 El Estadstico de Prueba:
La decisin de rechazar o de aceptar la hiptesis nula se basa en la infor-
macin contenida en una muestra extrada de la poblacin de inters. Los
valores de la muestra se usan para calcular un slo nmero, este nmero
acta como ente que toma decisiones y lo llamamos estadstico de prueba.
2.4 Regin de Rechazo:
El conjunto de valores o rango del estadstico de prueba se divide en dos
conjuntos regiones. Si el estadstico de prueba calculado a partir de una
muestra especca asume un valor dentro de la regin de rechazo, entonces
la hiptesis nula es rechazada y decidimos a favor de la alternativa. Si este
valor cae fuera de la regin de rechazo (cae en la regin de aceptacin), no
se rechaza H
0
lo cual no debe interpretarse como equivalente a que H
0
deba
ser aceptada sino que simplemente, la informacin experimental que se tiene
no conduce a rechazarla.
De todo lo anterior se deduce que dadas las hiptesis a probar: H
0
y H
1
y dado el conjunto de variables sobre la que se basa la prueba, disear esa
prueba consiste en elegir la regin de rechazo.
2.5 Tipos de Errores:
Al llevar a cabo la prueba de una hiptesis H
0
contra H
1
, el resultado puede
ser rechazar H
0
o bien no rechazar H
0
. Por otra parte puede ser que en la
realidad la hiptesis H
0
se cumpla o que no se cumpla. Denotamos por R la
regin de rechazo y por T(X
1
, X
2
, , X
n
) el estadstico de prueba.
1. Error de primera especie o tipo I: Cuando H
0
se cumple y nuestra de-
cisin es rechazarla, cometemos un error llamado de primera especie o
tipo I. La probabilidad de cometer este error la denotaremos por:
= P(T(X
1
, X
2
, , X
n
) R | H
0
) = P
H
0
(T(X
1
, X
2
, , X
n
) R)
2. Error de segunda especie o tipo II: Cuando H
0
no se cumple y no la
rechazamos, cometemos un error llamado de segunda especie o de tipo
II. La probabilidad de cometer este error la denotamos por
= P(T(X
1
, X
2
, , X
n
) R
c
| H
1
) = P
H
1
(T(X
1
, X
2
, , X
n
) R
c
)
5
donde R
c
es el complemento de la regin de rechazo, es decir, es la
regin de aceptacin.
2.6 Potencia de la Prueba:
= 1 = P
H
1
(T(X
1
, X
2
, , X
n
) R)
es la potencia de la prueba, representa la probabilidad de no cometer un error
de segunda especie.
2.6.1 Observaciones:
1. Las notaciones
P(T(X
1
, X
2
, , X
n
) R | H
0
) y P(T(X
1
, X
2
, , X
n
) R | H
1
)
no corresponden a probabilidades condicionales sino a probabilidades
correspondientes a un valor del parmetro compatible con cada una de
las hiptesis, para evitar confucin es preferible utilizar las notaciones
P
H
1
T(X
1
, X
2
, , X
n
) R
c
) y P
H
0
(T(X
1
, X
2
, , X
n
) R) sinem-
bargo utilizaremos las dos notaciones indistintamente..
2. Si H
0
es simple, por ejemplo H
0
: p = p
0
= P(T(X
1
, X
2
, , X
n
) R | p = p
0
)
es el nivel de la prueba. Si H
0
es compuesta, por ejemplo, p [a, b] , se
suele llamar el nivel de la prueba a :
sup
p[a,b]
P(T(X
1
, X
2
, , X
n
) R | p) = = sup
p[a,b]
(p)
3. Si H
1
es simple, por ejemplo H
1
: p = p
1
= P(T(X
1
, X
2
, , X
n
) R | p = p
1
)
es la potencia de la prueba. Si H
1
es compuesta, por ejemplo, H
1
: p
[c, d] , se tendr una funcin potencia de la prueba
(p) = P(T(X
1
, X
2
, , X
n
) R | p)
para cada p compatible con H
1
( en este caso, p [c, d]).
6
La siguiente tabla muestra las cuatro situaciones que pueden darse segn
se cumpla o no H
0
y segn decidamos o no rechazarla:
Realidad
Rechazar H
0
T(X
1
, X
2
, , X
n
) R
No rechazar H
0
T(X
1
, X
2
, , X
n
) / R
Se cumple H
0
Error I(prob.) Probabilidad 1
No se cumple H
0
Probabilidad 1 = Error II(prob.)
Regresemos a la analoga del proceso judicial para proporcionar una idea
ms clara sobre el problema. Si la hiptesis nula es el acusado es inocente,
entonces, con toda seguridad, la alternativa es el acusado es culpable.
El rechazo de la hiptesis nula implicara que el juicio ha sido capaz de
proporcionar suciente evidencia para garantizar el veredicto de culpable.
Por otro lado, si el juicio no presenta evidencia sustancial, el veredicto
ser inocente. Esta decisin no implica necesariamente que el acusado
sea inocente, ms bien, hace nfasis en la falta de evidencia necesaria para
condenar al acusado. Por lo tanto, un veredicto de culpable es ms fuerte
que un veredicto de inocente, lo cual surge del principio judicial generalmente
aceptado: es peor condenar a un inocente que dejar ir a un culpable. Si
el veredicto es culpable, se desea tener un grado muy alto de seguridad de
que no se va a condenar a una persona inocente, es decir, que el error tipo I
proveniente de rechazar H
0
siendo cierta tenga muy baja probabilidad, por lo
tanto, en muchas situaciones el error tipo I se considera como un error ms
grave que el error tipo II.
En las pruebas de hiptesis estadsticas el enfoque general es aceptar la
premisa de que el error de tipo I es mucho ms serio que el tipo II y formular
la hiptesis nula y alternativa de acuerdo a sto.
Como resultado se tiene que muchas veces se selecciona con anticipacin el
tamao mximo del error de tipo I que puede tolerarse y se intenta denir un
procedimiento de prueba que minimice el error de tipo II. En otras palabras,
no es posible seleccionar tanto como y disear una prueba estadstica
para probar H
0
contra H
1
, dada una muestra aleatoria de tamao n.
Un principio sencillo y razonable al obtener reglas de decisin para una
prueba de hiptesis estadstica es seleccionar aquel procedimiento de prueba
que tenga el tamao ms pequeo para el error del tipo II (mxima poten-
cia), entre todos los procedimientos que tengan el mismo tamao para el
error del tipo I. En este contexto debe notarse que el valor de no puede
hacerse arbitrariamente pequeo, sin que se incremente el valor de . En
otras palabras, para una muestra de tamao n dado, el tamao del error de
7
tipo II normalmente aumentar conforme el error de tipo I disminuya. Lo
que en general se hace en la prctica, es ajustar el tamao del error de tipo
I cambiando la regin de rechazo del estadstico de prueba para as alcanzar
un balance satisfactorio entre los tamaos de los errores, siempre y cuando
se tome en cuenta el mximo tamao del error de tipo I que puede tolerarse
en una situacin particular.
2.7 Valor Crtico del Estadstico de Prueba:
Si T(X
1
, , X
n
) es el estadstico de prueba, el valor c de T(X
1
, , X
n
) que
separa la regin de rechazo y aceptacin ( valores c
i
i = 1, 2, , k; segn la
regin tenga uno o varios puntos frontera) se llama valor crtico (respectiva-
mente crticos) del estadstico de prueba.
2.7.1 Tipos de Regiones Crticas o de Rechazo:
Supongamos que H
0
es simple: =
0
1. Si H
1
es >
0
H
1
es <
0
alternativamente la prueba es unilateral.
2. Si H
1
es >
0
<
0
simultneamente la prueba es bilateral.
La prueba estadstica unilateral debe formarse slo si el valor del parmetro
en uno de los lados no tiene sentido para el investigador. (As, en el ejem-
plo de la vacuna antiresfriado H
1
: p > 0.5 es una prueba unilateral, pues la
alternativa que interesa es que aumente la probabilidad de pasar el invierno
sin resfriado). Si el investigador no est seguro, debe realizarse una prueba
bilateral.
Una prueba bilateral da lugar a regiones crticas bilaterales, que en forma
general sern simtricas, las dos partes de la regin se seleccionan de tal
manera que la probabilidad de caer en cada una de ellas sea la misma.
2.8 Procedimiento para algunas pruebas de Hiptesis:
Supongamos que X
1
, , X
n
es una muestra aleatoria de X de distribucin
N(,
2
) :
1. Para
H
0
: =
0
H
1
: >
0
<
0
(prueba bilateral)
8
(a) Si es conocido, utilizamos el estadstico de prueba
Z =

n(
_
X
0
)

N(0, 1) bajo H
0
Si es el error de primera especie, la regin de rechazo se obtiene
hallando z

2
tal que
P

2
Z z

= 1
La regin de rechazo viene dada por:

, z

2
,

Si la prueba es unilateral, por ejemplo, H


1
: >
0
, la regin de
rechazo se halla encontrando z tal que
P(Z > z) =
la regin de rechazo viene dada por
(z

, ) .
Si la prueba es unilateral izquierda, por ejemplo, H
1
: <
0
, la
regin de rechazo se halla encontrando z tal que
P(Z < z) =
o equivalentemente
P(Z > z) =
puesto que la distribucin normal estndar es simtrica respecto
al origen la regin de rechazo viene dada por
(, z

)
2.8.1 P-valor
Observe que en el caso de la prueba bilateral, la regin de rechazo es de la
forma

(x
1
, , x
n
) :

n(
_
x
0
)

> c

9
hemos ajustado c de manera que
P
H
0

n(
_
X
0
)

> c
!
=
El procedimiento de decisin es el siguiente
Si

n(
_
x
0
)

> c, asumimos H
1
Si

n(
_
x
0
)

c, asumimos H
0
la funcin u P
H
0

n(
_
X
0
)

> u

es estrictamente decreciente y en u = c
tiene el valor y se cumple
P
H
0

n(
_
X
0
)

> u
!
u c
si denotamos por T
obs
una observacin del estadstico de prueba

n(
_
X
0
)

y
esta satisface
P
H
0

n(
_
X
0
)

> |T
obs
|
!

rechazamos H
0
.
La expresin P

n(
_
X
0
)

> |T
obs
|

es llamada p valor asociado a la


observacin T
obs
o nivel de signicain de lo observado.
En el caso de prueba unilateral derecha el p valor es
P
H
0

n(
_
X
0
)

> T
obs
!
y en el caso de la prueba unilateral izquierda el p valor corresponde a
P
H
0

n(
_
X
0
)

< T
obs
!
En todos los casos se toma la siguiente decisin:
Si el p valor asumimos H
1
Si el p valor > asumimos H
0
10
Esta tcnica expuesta para hallar el p-valor asociado a una prueba estads-
tica se generaliza fcilmente a las pruebas que se desarrollarn ms adelante
sutituyendo el estadstico de prueba por el correspondiente en cada caso. Se
debe sealar que hay queser cuidadoso con aquellas distribuciones que no
sean simtricas respecto al origen (chi-cuadrado, distibucin F)
1. (a) EJEMPLO: Se desea probar al 95%de certeza la hiptesis nula
siguiente:
una poblacin estadstica normal tiene media cero, basndose en
una muestra de tamao n = 9 y suponiendo que = 1(es cono-
cida), contra la alternativa que la media es positiva.
Hallemos la regin crtica al nivel = 1 0.95 = 0.05
H
0
: = 0 H
1
: > 0
que es una prueba unilateral. El estadstico de prueba es:
Z =

n
_
X

9
_
X = 3
_
X
que tiene distribucin N(0, 1) bajo la hiptesis nula. Queremos
hallar la regin de rechazo a partir de:
P(Z > z

) = = 0.05
de aqu se deduce que
z

= 1, 6448
Si Z > 1, 6448 rechazamos la hiptesis nula, esto equivale a
_
X >
1, 6448
3
= 0, 5483
La regin de rechazo se puede expresar como
_
X > 0, 5483
El error de tipo I es = 0.05
Si =
1
> 0, el error de tipo II se calcula a partir de
(
1
) = P

_
X 0, 5483 | =
1

=
P
_
X
1
1/

9
3 (0, 5483
1
) | =
1
!
11
si en particular
1
= 1
= P

_
X 0, 5483 | = 1

=
P
_
X 1
1/

9
1, 3551 | =
1
!
donde
_
X1
1/

9
tiene distribucin N(0, 1) si
1
= 1, de aqu obtenemos
= 0, 0877.
(b) Si es desconocido, utilizamos el estadstico de prueba
T =

n(
_
X
0
)
S
1
tStudent con n1 grados de libertad, bajo H
0
La regin de rechazo bilateral vendr dada por:

, t
n1,

t
n1,

2
,

siendo el nivel de signicacin de la prueba.


EJEMPLO: El fabricante de cierto tipo de bateras anuncian que
estas tienen una vida promedio de 2000 horas. Se desea probar
esta hiptesis al nivel 95% de conanza basndose en el hecho de
que 6 bateras tomadas al azar tuvieron vidas de:
2005, 1980, 1920, 2010, 1975, 1950 horas.
Supondremos que la duracin es normal. En este caso tendremos:
H
0
: = 2000 H
1
: < 2000
(es una prueba unilateral). = 1 0.95 = 0.05, hallemos t
5,
tal
que
P(T > t
5,
) = = 0.05
La regin de rechazo unilateral es:
(, t
5,
) = (, 2.015)
Usando la muestra obtenemos:
_
X = 1973, 3333; S
1
= 34, 009804; T = 1, 9206145 / R
12
No hay evidencia como para rechazar la hiptesis al 95% de nivel
de signicacin.
El p valor es
P(T
5
< 1, 9206145) = 0, 05642
que es el nivel de signicacin de lo observado. Si hubisemos
tomado = 0, 06, se rechazara la hiptesis nula. Podramos
rechazar al 94%.
2. Para
2
:
H
0
:
2
=
2
0
H
1
:
2
>
2
0

2
<
2
0
El estadstico de prueba en este caso es:
X
2
=
(n 1)S
2
1

2
0
que tiene distribucin Chi-cuadrado con n 1 grados de libertad, bajo
la hiptesis nula. Al nivel de signicacin se obtiene como regin de
rechazo bilateral

0, x
2
n1,1

x
2
n1,

2
,

.
EJEMPLO: Dadas las observaciones:
1.4, 1.9, 1.3, 1.4, 1.5
Probar
H
0
:
2
=
2
0
= 0.05 H
1
:
2
>
2
0
= 0.05
con nivel = 0.05. De la muestra se obtiene:
S
2
1
= 0.055,
_
X = 1.5, n 1 = 4, X
2
= 4.4
Puesto que la prueba es unilateral, tomamos como regin de rechazo la
que proviene de:
P

X
2
> x
2
4,

= = 0.05
Usando la tabla, obtenemos x
2
4,
= 9, 488, puesto que el valor observado
X
2
= 4.4 no cae en la regin de rechazo al 5% de nivel, no se puede
rechazar la hiptesis nula. El p valor es
P

X
2
> 4, 4

= 0, 35457
13
Si
2
= 0.08, la potencia
= P

X
2
> x
2
4,
|
2
= 0.08

se puede calcular de la siguiente manera: la regin de rechazo es


R =

X
2
=
(n 1)S
2
1

2
0
> 9, 488 = x
2
4,

puesto que si suponemos que la varianza es


2
= 0.08 ya no ser
cierto que
(n1)S
2
1

2
0
es chi-cuadrado con 4 grados de libertad, por lo tanto
debemos cambiar
2
0
por
2
, es decir:

(n 1)S
2
1

2
0
> 9, 488

=

(n 1)S
2
1

2
>

2
0

2
9, 488

=

(n 1)S
2
1

2
> 5.93

Bajo la hiptesis alternativa


2
= 0.08,
(n1)S
2
1

2
tiene distribucin Chi-
cuadrado con 4 grados de libertad, usando la tabla se obtiene que:
P

(n 1)S
2
1

2
> 5.93 |
2
= 0.08

= 0.20
2.8.2 POBLACIONES NORMALES E INDEPENDIENTES:
Sea X N(
1
,
2
1
), Y N(
2
,
2
2
), X
1
, , X
n
1
una muestra aleatoria sim-
ple de X y Y
1
, , Y
n
2
una muestra aleatoria simple de Y . Las muestras X
e Y son independientes.
Comparacin de Medias:
H
0
:
1
=
2
, H
1
:
1
>
2

1
<
2
1. Si
1
y
2
son conocidos, el estadstico de prueba es:
Z =
_
X
_
Y (
1

2
)
q

2
1
n
1
+

2
2
n
2
=
_
X
_
Y
q

2
1
n
1
+

2
2
n
2
bajo la hiptesis nula, este estadstico tiene distribucin N(0, 1), al
nivel se toma como regin de aceptacin aquella que satisface
P

2
Z z

= 1
obtenindose como regin de rechazo
R =

, z

2
,

14
2.
1
=
2
= son desconocidos, el estadstico de prueba es:
T =
_
X
_
Y (
1

2
)
S
p
q
1
n
1
+
1
n
2
=
_
X
_
Y
S
p
q
1
n
1
+
1
n
2
t Student con n
1
+n
2
2
grados de libertad, bajo la hiptesis nula. Al nivel , la regin de
rechazo bilateral es:
R =

, t
n1,

t
n1,

2
,

.
Comparacin de Varianzas:
H
0
:
2
1
=
2
2
, H
1
:
2
1
>
2
2
o
2
1
<
2
2
El estadstico de prueba es:
F =
(n
1
1)S
2
1
/
2
1
(n
1
1)
(n
2
1)S
2
2
/
2
2
(n
2
1)
=
S
2
1
S
2
2
bajo la hiptesis nula, F tiene distribucin F con parmetros n
1
1 y n
2
1. Al
nivel la regin de aceptacin se obtiene a partir de:
P

f
n
1
1,n
2
,1;1

2
F f
n
1
1,n
2
1,

= 1
donde f
n
1
1,n
2
1,1

2
=
1
f
n
2
1,n
1
1,

2
. La regin de rechazo bilateral viene dada
por:
R =

0, f
n
1
1,n
2
1,1

f
n
1
1,n
2
1,

2
,

2.8.3 Datos Apareados:


Comparacin de medias, muestras dependientes apareadas:
Supongamos que queremos comparar dos marcas de neumticos. Una
posibilidad es poner durante k kilmetros la marca A en n
1
neumticos y la
marca B en n
2
neumticos, medir los desgastes medios (
_
X,
_
Y ) y aplicar la
comparacin de medias para dos muestras independientes y normales. Si la
variabilidad de la poblacin es muy grande, el valor observado del estadstico
de prueba podra ser muy pequeo y no detectaramos la diferencia entre las
medias a menos que esta diferencia sea enorme.
15
Lo que ocurre es que la diferencia de los desgastes de los cauchos depende
de muchos factores que no controlamos: tipo de conduccin, conductor, su-
percie, etc. Al no controlar estos factores, la variabilidad muestral ser tan
grande que nos impedir observar posibles diferencias entre las medias. Una
solucin es disponer en cada vehculo dos neumticos A y dos B y medir
diferencias de desgastes en el mismo vehculo, al ser la variabilidad de estas
difernecias mucho menor, tendremos en general un mejor contraste.
La clave de este procedimiento es disponer de medidas por pares tomadas
en condiciones muy semejantes, de manera que a priori las dos unidades
experimentales (ruedas en el ejemplo) que comparamos sean lo mas iguales
posibles. As la variabilidad de las diferencias ser pequea y podemos iden-
ticar ms fcilmente cambios.
Supongamos que elegimos 2n unidades homogneas por pares (ruedas del
mismo coche, personas de iguales caractersticas,objetos de iguales propiedades,
etc.). Si (X
1
, Y
1
), , (X
n
, Y
n
) es una muestra aleatoria simple de (X, Y ),
y D = X Y, si D es normal N(,
2
), entonces D
1
, D
n
es una muestra
aleatoria simple de D, D
i
= X
i
Y
i
, con distribucin normal N(,
2
). Si
E(X
i
) =
1
, E(Y
i
) =
2
; E(D
i
) =
1

2
y si no hay diferencia entre las me-
dias la esperanza de D
i
ser cero. Supongamos igualdad de las varianzas
de X
i
y Y
i
, denotemos por
2
0
esta varianza comn, entonces Var(D
i
) =

2
0
+
2
0
2
0

0
, es el coeciente de correlacin de las dos variables (X, Y ),
de aqu,

2
= V ar(D
i
) = 2
2
0
(1 )
si las dos medidas que comparamos,( los desgastes de los neumticos en un
mismo coche, en nuestro ejemplo), son anlogas, ser positivo y cercano a
1, la variabilidad ser menor que si tomamos muestras independientes.
Para la prueba de hiptesis (bilateral)
H
0
:
1

2
= 0
H
1
:
1

2
6= 0
usamos el estadstico
Z =
_
D

n
que bajo la hiptesis nula tiene distribucin normal estndar, si se conoce la
16
varianza. Si no conecemos la varianza, nos valemos del estadstico
T =
_
D
S
1

n
que tiene distribucin t-de Student, con n 1 grados de libertad y donde
S
2
1
=
1
n 1
n
X
i=1

D
i

_
D

2
las regiones de rachazo sern respectivamente

, z

2
S
z

2
,

, t
n1;

2
S
t
n1;

2
,

para las pruebas unilaterales se procede como se ha hecho anteriormente.


Ejemplo:
En el ejemplo de los cauchos se tienen los siguientes datos apareados
Autom ovil Neum atico A Neum atico B D = AB
1 10, 6 10, 2 0, 4
2 9, 8 9, 4 0, 4
3 12, 3 11, .8 0, 5
4 9, 7 9, 1 0, 6
5 8, 8 8, 3 0, 5
obtenemos los siguientes valores
_
D = 0, 48
S
1
= 0, 0837
(si hubisemos considerado dos muestras independientes, se hubiese obtenido
S
p
= 1, 32). El estadstico de prueba tiene distribucin T-estudent con 4
grados de libertad
T =
_
D
S
1

n
nos da como valor observado T
obs
= 0, 57, no se rechaza la hiptesis nula al
95% de conanza.
17
2.8.4 PROPORCIONES (Muestras Grandes):
A) Si X es de Bernoulli de parmetro p, X
1
, X
n
una muestra aleatoria
simple de X :
H
0
: p = p
0
, H
1
: p > p
0
p < p
0
El estadstico de prueba es:
Z =
_
X p
0
q
p
0
(1p
0
)
n
N(0, 1)
bajo la hiptesis nula, si n es grande. La regin de rechazo bilaterales:
R =

, z

2
,

B) Si X tiene distribucin de Poisson de parmetro y X


1
, X
n
una
muestra aleatoria simple de X :
H
0
: =
0
, H
1
: >
0
<
0
El estadstico de prueba es:
Z =
_
X
0
q

0
n
N(0, 1)
bajo la hiptesis nula. La regin de rechazo bilateral viene dada por:
R =

, z

2
,

2.8.5 Comparacin de proporciones:


X
1
, , X
n
1
una muestra aleatoria simple de X y Y
1
, , Y
n
2
una muestra
aleatoria simple de Y . Las muestras X e Y son independientes de distribu-
cin de Bernoulli de parmetros p
1
y p
2
respectivamente:
H
0
: p = p
1
= p
2
, H
1
: p
1
> p
2
p
1
< p
2
Si denotamos por
_
p =
n
1
_
X +n
2
_
Y
n
1
+n
2
,
18
_
p es un estimador insesgado de p bajo la hiptesis nula, por lo tanto es un
estimador de la varianza p(1 p). Se usa el siguiente estadstico de prueba
Z =
_
X
_
Y
r
_
p(1
_
p)

1
n
1
+
1
n
2

bajo la hiptesis nula, para muestras grandes, es aproximadamente N(0, 1).


Se tiene como regin de rechazo:
R =

, z

2
,

.
2.9 Las mejores pruebas.
Una buena prueba estadstica es aquella que para un nivel de signicacin
dado o tolerable por el investigador conduzca a una mxima potencia ( tenga
el menor error de segunda especie). La respuesta a este problema no las da
el teorema conocido como Lema de Neyman-Pearson, el cual enunciaremos
para hiptesis simples, su demostracin se encuentra mas all de los objetivos
de este curso.
Lema de Neyman- Pearson
Sea X
1
, , X
n
es una muestra aleatoria de tamao n de una poblacin
cuya funcin de densidad ( o funcin de probabilidad segn el caso) es f(x; ),
se consideran las hiptesis nulas y alternativas siguientes:
H
0
: =
0
H
1
: =
1
en donde
0
y
1
se especican. Si es el tamao mximo del error de tipo I
que se puede tolerar, entonces la mejor prueba para H
0
contra H
1
es aquella
que tiene mxima potencia entre todas las pruebas cuyo error tipo I no sea
mayor a .
Si existe una regin crtica C de tamao y una constante positiva k tal
que
L
0
(x
1
, ,x
n
;
0
)
L
1
(x
1
, ,x
n
;
1
)
k interior C
L
0
(x
1
, ,xn;
0
)
L
1
(x
1
, ,x
n
;
1
)
k exterior C
entonces C es la mejor regin crtica de tamao para probar H
0
contra H
1
,
en donde L
0
y L
1
son las funciones de verosimilitud relativas a cada una de
las hiptesis.
19
Ejemplo:
Sea X
1
, , X
n
es una muestra aleatoria de tamao n de una poblacin
normal de media desconocida y varianza
2
conocida. Determinar la mejor
regin crtica de tamao para probar
H
0
: =
0
H
1
: =
1
en donde
1
>
0
. Las funciones de verosimilitud bajo cada hiptesis son:
L
0
(x
1
, , x
n
;
0
) =

n
exp

n
P
i=1
(x
i

0
)
2
/2
2

L
1
(x
1
, , x
n
;
1
) =

n
exp

n
P
i=1
(x
i

1
)
2
/2
2

de acuerdo al lema, la mejor regin crtica es aquella para la cual


exp

n
P
i=1
(x
i

0
)
2
/2
2

exp

n
P
i=1
(x
i

1
)
2
/2
2
k
si tomamos logaritmo despus de desarrollar, se puede expresar como
n
X
i=1
(x
i

1
)
2

n
X
i=1
(x
i

0
)
2
2
2
ln(k)
desarrollando y simplicando obtenemos
_
x
n(
2
1

2
0
) 2
2
ln(k)
2(
1

0
)
esta expresin dene la mejor regin crtica para esta prueba, donde
1
>

0
, de manera sencilla, la mejor regin crtica es el extremo derecho de la
distribucin de muestreo de
_
X bajo la hiptesis nula, es decir, dado , el valor
crtico
_
x
0
puede encontrarse mediante una adecuada eleccin de la constante
k > 0, de manera tal que
P

_
X
_
x
0
| =
0

=
20
si en perticular = 0, 05, como bajo H
0
,
_
X tiene distribucin normal con me-
dia
0
y varianza
2
entonces Z =
_
X
0
/

n
es normal estndar y valindonos
de la tabla para esta distribucin se obtiene
P

Z
_
x
0

0
/

n
| =
0

= 0.05
con
_
x
0

0
/

n
= 1, 645 o equivalentemente
_
x
0
=
1,645

n
+
0
, la hiptesis H
0
:
=
0
se rechazar a favor de H
1
: =
1
>
0
cada vez que
_
X sea

1,645

n
+
0
. Note que esta mejor regin crtica no depende de
1
>
0
, por lo
que esta regin crtica recibe el nombre de regin ( o prueba) uniformemente
ms potente para probar H
0
: =
0
contra H
1
: =
1
>
0
.
Observe que esta regin coincide con la expuesta anteriormente para este
tipo de prueba de hiptesis unilateral en este caso especco. Hemos enun-
ciado este lema y expuesto este ejemplo de manera de justicar en cierto
modo las regiones crticas seleccionadas para cada uno de los casos presenta-
dos en esta gua.
21
Prctica N
o
9
Estadstica
1. Para probar la hiptesis de que una moneda est bien hecha, se toma la
siguiente regla de decisin: se acepta la hiptesis si el nmero de caras
obtenido en una serie de 100 lanzamientos se encuentra entre 40 y 60
(ambos inclusive). De otro modo se rechaza.
(a) Hallar la probabilidad de rechazar la hiptesis cuando en realidad
es cierta.
(b) Cul es la probabilidad de aceptar la hiptesis de que la moneda
est bien hecha cuando la probabilidad real de obtener cara es
p = 0.7?
(c) Denotemos por la probabilidad de la parte anterior (probabili-
dad de error de tipo II). El siguiente cuadro muestra los valores
de correspondientes a distintos valores de p :
p 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.00 0.00 0.0192 0.504 0.9642 0.504 0.0192 0.00 0.00
Haga un grco de y de 1 en funcin de p. Cmo deberan
ser los grcos ideales?
2. Se recibe un envo de latas de conserva, de las que se arma que el peso
medio son 1000 gramos. Examinamos una muestra de 5 de estas latas,
obteniendo que el peso medio de la muestra es de 995 grs. Al nivel de
conanza 95% se puede aceptar que el peso medio es 100gramos?. Cul
es el mximo valor para el nivel de signicacin que permitira aceptar
la hipotsis de la empresa de latas de conserva?(Este valor se denom-
ina p valor o valor de signicacin observado). Suponga distribucin
normal.
3. Una compaa est interesada en determinar si el promedio de Kms.
rodados por vehculos en un mes, de su ota de vehculos asignados
a vendedores, ha aumentado por encima del promedio usual de 2600
Kms. Supongamos que la desviacin es conocida e igual a 35 Kms.
Despus de examinar 400 vehculos de la ota, en un mes dado, se
encontr que el promedio de rodaje de stos, fue de 2640 Kms. ( es
decir, hubo un aumento de 1,5% en el rodaje medio mensual para los
vehculos de la muestra).
1
(a) Al nivel = 0, 05 y en base a la muestra, se puede aceptar que el
rodaje medio de la ota ha aumentado?
(b) Calcule el p valor o valor de signicacin observado de esta ota y
discuta el resultado. ?Son los datos sucientemente signicativos
para rechazar
H
0
: = 2600
contra
H
1
: > 2600?
(c) ?Qu pasara si observsemos un aumento de 1,5% en el rodaje
medio mensual para una muestra de 100 vehculos? ?Qu pasara
si esa muestra fuese de 25 vehculos?
4. Dos investigadores efectan el contaje de colonias de bacterias en 10
placas de Petri. Los datos obtenidos por cada uno fueron:
Inv.1 63 249 292 79 161 397 118 93 94 163
Inv.2 80 198 323 97 181 416 139 112 118 161
Para = 0, 05 ?qu puede decirse acerca de los mtodos de contaje?
5. Un odontlogo arma que el 40% de los nios de 10 aos presentan
indicios de caries dental. Se tom una muetra de 100 nios y se observ
que 32 de ellos presentan indicios de caries. Probar la hiptesis del
dentista al nivel = 0, 10. ?Cul es el p valor en este caso? ?Para qu
valores de se aceptara y para qu valores se rechazara la hiptesis
del odontlogo?
6. Para estudiar el efecto de la aspirina sobre la coagulacin sangunea,
se midi el tiempo de protombina (que es una prueba relacionada con
la velocidad de coagulacin) a 12 hombres adultos, antes y tres ho-
ras despus de administrarles 650 mgrs. de aspirina, obtenindose los
siguientes datos, ( los cuales indican tiempo en segundo).Suponga dis-
tribucin normal.
sujeto 1 2 3 4 5 6 7 8 9 10 11 12
Antes 12, 3 12, 0 12, 0 13, 0 13, 0 12, 5 11, 3 11, 8 11, 5 11, 0 11, 0 11, 3
Despus 12, 0 12, 3 12, 5 12, 0 13, 0 12, 5 10, 3 11, 3 11, 5 11, 5 11, 0 11, 5
2
(a) Para = 0, 05 diga si estos datos permiten concluir que la ad-
ministracin de 650 mgs. de aspirina tiene algn efecto sobre el
tiempo de protombina. Hgalo de dos maneras:
i. Por medio de una prueba de hiptesis bilateral.
ii. Por medio de un intervalo de conanza.
(b) Utilice la tabla para obtener el p valor aproximado.
7. Los electro encefalogramas muestran las uctuaciones de la actividad
elctrica en el cerebro. Hay diversos tipos de ondas cerebrales: una
de ellas son las ondas alfa, cuya frecuencia vara entre 8 y13 ciclos por
segundo. Un grupo de mdicos canadienses realiz un estudio acerca
de los efectos de la deprivacin sensorial en los patrones de emisin de
ondas alfa. Se estudiaron 20 presos, que se dividieron en dos grupos de
10. Cada individuo del primer grupo fue recluido en celda solitaria, los
del segundo en celdas usuales. Despus de 7 das se midieron las ondas
alfa, obteniendo:
Celdas usuales 10, 7 10, 7 10, 4 10, 9 10, 5 10, 3 9, 6 11, 1 11, 2 11, 4
Celdas solitarias 9, 6 10, 4 9, 7 10, 3 9, 2 9, 3 9, 9 9, 5 9, 0 10, 9
Aparentemente hay un descenso en la frecuencia de las ondas alfa y
aumento en la variabilidad cuando las personas se recluyen en soledad.
Pruebe si esta diferencia de frecuencias y variabilidad son signicativas
al nivel = 0, 05. Suponga distribucin normal.
8. Se considera qu el 20% de las personas de una poblacin tienen una de-
terminada caracterstica gentica. Sinembargo en un estudio realizado
en 100 personas de la poblacin se encontr slo 15 con la caracters-
tica. Para = 0.01 ?aceptaramos la hiptesis de que la proporcin
de personas con la caracterstica dada es inferior al 20%? ?Qu nivel
de signicacin tienen los datos? Cambiara la respuesta si en una
poblacin de 200 personas hubisemos hallado 30 con la caracterstica?
9. En un estudio diseado para ver si una dieta controlada puede retardar
los efectos de la arterioesclerosis, se hizo un seguimiento a 846 personas
elegidas al azar de una poblacin. La mitad de ellas sigui una dieta
prejada y a la otra mitad se le permiti alimentarse como deseara. Al
nal de 8 aos, 66 personas del primer grupo muri de un infarto al
3
miocardio o infarto cerebral. En el segundo grupo (grupo de control),
murieron 93 personas por la misma causa. Haga los anlisis estadsticos
apropiados.
10. La duracin media de una muestra de 12 bombillos es 1250 horas, con
una desviacin de 115 horas. Se cambia el material del lamento por
otro nuevo y entonces de una muestra de 12 bombillos se obtuvo una
duracin media de 1340 horas, con una desviacin de 106 horas. Para
= 0, 05
(a) ?Puede aceptarse que la varianza no ha cambiado?
(b) ?Ha aumentado la duracin media de los bombillos?
11. Los registros de un hospital muestran que de una muestra aleatorias
de 1000 hombres que ingresaron al servicio de hospitalizacin, 52 pre-
sentaban problemas cardiacos, mientras que en una muestra aleatoria
de 1000 mujeres que ingresaron a este servicio, 23 presentaron proble-
mas cardiacos.
(a) ?Estos datos presentan suciente evidencia, al nivel = 0, 05
para concluir que la proporcin de hombres que ingresan al hos-
pital por enfermedades cardiacas es superior a la proporcin de
mujeres que ingresan al hospital por el mismo motivo?
(b) ?Cul es el p valor?
(c) En base a la respuesta anterior, ? qu decidira Ud. para =
0, 01?
12. Un proceso qumico ha producido en promedio, 800 toneladas por
da. Las producciones diarias durante la semana pasada fueron, en
toneladas: (suponga distribucin normal)
785, 805, 790, 793, 802
(a) ?Indican estos datos que la produccin promedio fue menor que
800 toneladas y que por lo tanto, hay algo malo en el proceso?
Realice una prueba al nivel de signicacin de 5%.
(b) Halle el p valor o nivel de signicacin observado
4
(c) Encuentre un intervalo de conanza del 90% para la produccin
media.
13. Se obtienen dos muestras aleatorias cada una de 11 observaciones, de
poblaciones normales con medias
1 y

2
respectivamente y varianza
comn
2
. Las medias muestrales y las varianzas muestrales centradas
son las siguientes:
_
y
1
= 60, 4
S
2
1
= 31, 40
_
y
2
= 65, 3
S
2
2
= 44, 8
(a) Al nivel de signicacin = 0, 1 ?presentan los datos suciente
evidencia para concluir que hay diferencia entre las medias de las
poblaciones?
(b) Halle el p valor o nivel de signicacin observado.
(c) Encuentre un intervalo de conanza del 90% para la diferencia de
las medias.
14. Se observa durante 20 das la temperatura de operacin de dos hornos
para el secado de pintura asociado con dos lneas de produccin.Suponga
dsitribucin normal. Las medias muestrales y las varianzas muestrales
centradas son:
_
y
1
= 164
S
2
1
= 81
_
y
2
= 168
S
2
2
= 172
?Presentan los datos suciente evidencia para concluir que hay difer-
encia en la variabilidad de la temperatura de los dos hornos? Pruebe la
hiptesis
2
1
=
2
2
contra
2
2
>
2
1
con un nivel de signicacin = 0, 1.
Suponga distribucin normal.
15. El fabricante de una mquina para envasar jabn en polvo, arma que
la mquina puede cargar las cajas con un peso dado, con una amplitud
(variacin) no mayor de 2/5 de onza. Se encontr que la media y la
varianza centrada de una muestra de 8 cajas de tres libras eran eran
iguales a 3,1 y 0,018 respectivamente. Suponga distribucin normal.
5
(a) Pruebe la hiptesis de que la varianza de la poblacin de pesos es

2
= 0, 01 contra
2
> 0, 01. Use = 0, 05.
(b) Encuentre un intervalo de conanza para
2
y para la media al
90% de conanza.
16. Durante un periodo de 15 das se registran los precios de cierre de dos
tipos de acciones. Las medias muestrales y las varianzas centradas
muestrales son las siguientes: (suponga distribucin normal)
_
y
1
= 40, 33
S
2
1
= 1, 64
_
y
2
= 42, 54
S
2
2
= 2, 96
(a) ?Presentan los datos suciente evidencia para concluir que hay
diferencia en la variabilidad de las dos acciones para las pobla-
ciones asociadas con las dos muestras?
(b) Encuentre un intervalo de conanza para el cociente de las dos
varianzas poblacionales al 95% de conanza.
MMOM/2004
6
Captulo V
Bondad de Ajuste-Prueba Chi-Cuadrado
Tablas de Contingencia con dos criterios de
clasicacin.
Anlisis de varianza: comparacin de ms de
dos medias
Mara Margarita Olivares M.
Junio 2004
0.1 Prueba Chi-cuadrado: Bondad de Ajuste
0.1.1 Introduccin:
Hasta ahora todas las situaciones que hemos examinado han tenido como
suposicin bsica que los datos que se tienen provienen de una distribucin
dada que depende de uno o varios parmetros desconocidos los cuales se
pueden estimar por medio de un nmero, un intervalo de conanza o hacer
pruebas de hiptesis referente a ellos.
Si tenemos un conjunto de valores muestrales x
1
, x
2
, , x
n
, correpondiente
a una muestra aleatoria simple X
1
, X
2
, , X
n
y se desea saber si hay mo-
tivos razonables para considerar la distribucin de esta muestra, como una
distribucin de probabilidad dada, es importante tener criterios para decidir
si efectivamente es razonable suponer, basndose en los resultados experi-
mentales, acerca de la veracidad de la hiptesis formulada.
A partir de las observaciones podemos trazar una curva de frecuencias
acumuladas ( o un histograma ) y compararla con la funcin de distribucin
de la hiptesis ( o funcin de probabilidad o densidad, segn la variable
sea discreta o continua) y obtener as una idea, al menos cualitativa de la
coincidencia entre ambas distribuciones.
Sin embargo, es necesario, para dar un veredicto preciso, introducir alguna
medida cuantitativa del grado de desviacin que muestran los datos respecto
a la distribucin hipottica. Si esta medida excede algn lmite adecuado
jo debemos rechazar la hiptesis y viceversa.
Tal medida de la desviacin se puede denir de diversas formas, nosotros
estudiaremos una de ellas: la prueba Chi-Cuadrado introducida por K.Pearson.
Las pruebas que tratan este tipo de problemas, se llaman pruebas de
Bondad de Ajuste.
0.1.2 Caso Discreto:
Supongamos que X es discreta y se realizan n observaciones del experimento
en investigacin. Sea
1
,
2
, ,
k
con (k n), el nmero de observaciones
distintas de la variable X , f
1
, f
2
, , f
k
son las frecuencias correspondientes,
es decir, f
i
es el nmero de observaciones iguales a
i
. (Eventualmente f
i
=
0 para algn i).
1
Sea
p
i
= P(X =
i
) , i = 1, 2, , k;
k
X
i=1
p
i
= 1
la distribucin hipottica, la cual suponemos totalmente especicada, es de-
cir, en su expresin no aparecen parmetros desconocidos.
Sea
f
i
n
el estimador de mxima verosimilitud de p
i
, f
1
+f
2
+ , f
k
= n.
Observaciones:
a) Si n est jo, f
i
es el nmero de veces que aparece
i
en n repeticiones
del experimento y p
i
representa la probabilidad de obtener
i
, luego,
f
i
tiene distribucin binomial de parmetros (n, p
i
), donde E(f
i
) =
np
i
.
La diferencia f
i
np
i
mide la desviacin entre las frecuencias observadas
y las frecuencias esperadas.
K. Pearson demostr que si tomamos
X
2
=
k
X
i=1
(f
i
np
i
)
2
np
i
=
k
X
i=1
f
2
i
np
i
n (si
k
X
i=1
p
i
= 1)
obtenemos una medida de la desviacin cuyas propiedades son particular-
mente sencillas:
Se puede demostrar que si n , (np
i
5), el estadstico
X
2
=
k
X
i=1
(f
i
np
i
)
2
np
i
bajo la hiptesis que
p
i
= P(X =
i
) , i = 1, 2, , k
es la verdadera distribucin (sin parmetros desconocidos) tiene distribucin
Chi-Cuadrado con k 1 grados de libertad.
2
(Para una demostracin ver : Mtodos Matemticos de Estadstica, de
Harald Cramer, Cap.XXX, 30.1.; un esbozp de la demostracin en Mathe-
matical Statistics, an introducction, Wiebe R. Pestman; una demostracin
rigurosa en Wilks,S.S.Mthematical Statistics, Jhon Wiley & Sons, Inc., New
York 1962)
b) Si los valores p
i
= P(X =
i
) , i = 1, 2, , k fueron obtenidos esti-
mando r parmetros desconocidos de la distribucin hipottica P, la
expresin
X
2
=
k
X
i=1
(f
i
np
i
)
2
np
i
cuando n (np
i
5) tiene distribucin Chi-Cuadrado con k1r
grados de libertad. (Mtodos Matemticos de Estadstica, de Harald
Cramer, Cap.XXX, 30.3).
Toma de Decisin:
Nosotros queremos que f
i
est cercano a np
i
, es decir, que el valor observado
X
2
obs
=
k
X
i=1
(f
i
np
i
)
2
np
i
est cercano a cero, procedemos jando el nivel de signicacin de la prueba,
hallamos x
2
,k1r
a partir de
P

X
2
> x
2
,k1r

=
que representa la probabilidad de rechazar la hiptesis nula, siendo cierta
probabilidad de cometer un error de primera especie.
Si X
2
obs
> x
2
,k1r
rechazamos la hiptesis nula.
Ejemplo:
Despus de lanzar un dado 300 veces, se han obtenido las siguientes frecuen-
cias:
cara 1 2 3 4 5 6
frecuencias 43 49 56 45 66 41
al nivel = 0.05, se puede decir que el dado est bien construido?.
3
1. Si el dado est bien construido debe suceder que
H
0
:
1
6
= P(X = i) , i = 1, 2, , 6
En este caso, E(f
i
) = np
i
= 300
1
6
= 50.
Evaluamos
X
2
obs
=
k
X
i=1
(f
i
50)
2
50
= 8.96
La distribucin del estadstico es Chi-Cuadrado con k 1 = 5 grados
de libertad. Al buscar en la tabla hallamos que
X
2
5;0.05
= 11.07
por lo tanto al nivel de 5% aceptamos H
0
pues X
2
< X
2
5;0.05
y con-
cluimos que el dado est bien construido.
Para hallar el p valor debemos calcular P(X
2
5
> 8.96) es algo mayor
a 0, 10.
0.1.3 Caso Continuo:
Esta es una simple generalizacin del caso discreto. Se procede de la siguiente
manera: sean x
1
, , x
n
n observaciones de la variable aleatoria X, las cuales
tabulamos en una tabla de frecuencias, si k es el nmero de intervalos de
clase, I
i
, es el i esimo intervalo tal que:
k
X
i=1
P(I
i
) = 1,
f
i
el nmero de observaciones que caen en I
i
, denotando por p
i
= P(I
i
) la
probabilidad terica, el estadstico de prueba ser:
X
2
=
k
X
i=1
(f
i
np
i
)
2
np
i
si n (np
i
5), su distribucin es Chi-Cuadrado con k 1 r grados
de libertad, donde r es el nmero de parmetros estimados en la distribucin
terica.
Si no hay parmetros estimados, en este caso, r = 0, la distribucin del
estadstico ser X
2
con k 1 grados de libertad.
4
Ejemplos:
1. Un generador de nmeros aleatorios produjo n = 100 nmeros, los
cuales aparecen tabulados en la siguiente tabla:
Clases
0.0
0.099
0.1
0.199
0.2
0.299
0.3
0.399
0.4
0.499
Frecuencias 7 14 8 16 6
Clases
0.5
0.599
0.
0.699
0.75
0.799
0.85
0.8599
0.9
0.999
Frecuencias 13 17 4 10 5
Queremos probar al nivel de conanza 99%( = 0.01) la hiptesis que
dichos nmeros provienen de una distribucin uniforme en [0, 1] .
La longitud de cada intervalo de clase I
i
es
|I
i
| = 0.099 ' 0.1 = p
i
= P(I
i
)
si P es uniforme en [0, 1] ; n = 100, np
i
= 10 5, i = 1, 2, , 10,
X
2
=
k
X
i=1
(f
i
np
i
)
2
np
i
; X
2
obs
= 20
tiene aproximadamente distribucin Chi-Cuadrado con nueve grados
de libertad, en la tabla hallamos que
X
2
9;0.01
= 21, 666;
luego, al nivel de conanza de 99%aceptamos la hiptesis. Si =
0.05 se rechaza la hiptesis nula pues
X
2
9;0.05
= 16, 916;
el p valor est entre esos dos niveles de signicacin, por lo que se
rechaza la hiptesis nula.
2. Los resultados del peso en gramos de 570 nios nacidos en un cierto
5
hospital estn tabulados en la siguiente tabla:
Clases (0, 2400) (2401, 2600) (2601, 2800) (2801, 3000)
Fracuencias 10 13 19 60
Clases (3001, 3200) (3201, 3400) (3401, 3600) (3601, 3800)
Fracuencias 61 72 92 80
Clases (3801, 4000) (4001, 4200) (4201, 4400)
Fracuencias 66 48 21
Clases (4401, 4600) (4601, 4800) 4801
Fracuencias 9 15 4
Queremos probar el ajuste de estos datos a una distribucin normal
por medios de una prueba Chi-Cuadrado al 95% y 99%de conanza.
Estimamos =
_
X = 3540;
2
= S
2
1
= 283, 240, (la primera y la l-
tima clase estn abiertas, arbitariamente hemos tomado en ellas como
marcas de clase los valores 1900 y 5100 gramos). Si suponemos =
3540;
2
= 283, 240, calculamos
p
i
= P(I
i
)
obtendremos:
X
2
=
k
X
i=1
(f
i
570p
i
)
2
570p
i
; X
2
obs
= 24, 283.
Puesto que hemos estimado dos parmetros, la distribucin de nuestro
estadstico de prueba es asintticamente Chi-Cuadrado con 11 grados
de libertad, obteniendo
X
2
11;0.05
= 19, 675; X
2
11;0.01
= 24, 725
as el p-valor est entre esos dos niveles por lo que rechazamos la hipte-
sis nula.
0.1.4 Tablas de Contingencia con dos criterios de clasi-
cacin:
Un problema frecuente en el anlisis de datos enumerativos es el de la in-
dependencia de dos mtodos de clasicacin de los sucesos observados. Por
6
ejemplo, clasicamos los defectos de los muebles producidos en una planta
de fabricacin, primero, de acuerdo al tipo de defecto y segundo, de acuerdo
al turno de produccin. Lo que deseamos investigar es una posible depen-
dencia entre las dos clasicaciones. Varan las proporciones de los diversos
tipos de defectos de un turno a otro?. Por ejemplo, se observa un total de
n = 309 muebles con defectos y se clasican en cuatro tipos de defectos :
A, B, C, D. Al mismo tiempo, cada mueble se identica de acuerdo al turno
de produccin en el que es fabricado.
Tabla de Contingencia
Turnos Defecto A Defecto B Defecto C Defecto D Total
1 15(22.51) 21(20.99) 45(38.94) 13(11.56) 94
2 26(22.99) 31(21.44) 34(39.77) 5(11.81) 96
3 33(28.50) 17(26.57) 49(49.29) 20(14.63) 119
Total 74 69 128 38 309
Denotamos por p
A
la probabilidad de que el defecto sea del tipo A, anloga-
mente para p
B
, p
C
, p
D
; estas probabilidades las llamaremos probabilidades de
las columnas de la tabla y se satisface:
p
A
+p
B
+p
C
+p
D
= 1
Anlogamente p
i
, i = 1, 2, 3 es la probabilidad de que ocurra un defecto en el
turno i (probabilidad de la la i) donde:
p
1
+p
2
+p
3
= 1.
Si las clasicaciones son independientes, entonces la probabilidad correspon-
diente a una celda debe ser el producto de las probabilidades de la la y de la
columna correspondiente a dicha celda. Por ejemplo, laprobabilidad de que
un defecto particular ocurra en el turno 1 y sea del tipo A debe ser p
1
p
A
.
La hiptesis nula se reere a la independencia de las dos clasicaciones.
No se especican los valores numricos de las probabilidades de las celdas.
Por lo tanto, debemos estimar las probabilidades de las las y de las columnas
para poder estimar las frecuencias de celdas esperadas. Los estimadores de
mxima verosimilitud de las probabilidades correspondientes a las columnas,
son:

p
A
=
c
1
n
=
74
309

p
B
=
c
2
n
=
69
309

p
C
=
c
3
n
=
128
309

p
D
=
c
4
n
=
38
309
7
donde c
i
, i = 1, 2, 3, 4 es la frecuencia observada de la columna i. Similar-
mente,

p
1
=
r
1
n
=
94
309

p
2
=
r
2
n
=
96
309

p
3
=
r
3
n
=
119
309
son los estimadores de las probabilidades correspondientes a las las, r
i
, i =
1, 2, 3 es la frecuencia observada de la la i.
Si n
i,j
es la frecuencia observada de la celda que se encuentra en la la i
y la columna j de la tabla de contingencia, entonces, la estimacin del valor
esperado de n
ij
es en particular para n
11

E(n
11
) = n

p
1

p
A
= n
r
1
n
c
1
n
=
r
1
c
1
n
,
en general,

E(n
ij
) =
r
i
c
j
n
, i = 1, 2, 3; j = 1, 2, 3, 4.
En nuestro ejemplo, hemos colocado los clculos de las frecuencias esperadas
entre parntesis, en la tabla de contingencia. El estadstico de prueba, en
general, es
X
2
=
c
X
j=1
r
X
i=1

n
ij


E(n
ij
)

E(n
ij
)
X
2
(c1)(r1)
,
donde c es el nmero de columnas y r es el nmero de las.
Observacin: El nmero de grados de libertad debera ser rc menos 1
por la restriccin
c
X
j=1
r
X
i=1
n
ij
= n,
y debemos restar el nmero total de estimaciones, es decir, por cada esti-
macin, (r 1) en total por las las, ya que la r esima queda determinada
por las primeras (r 1), anlogamente, por cada estimacin, (c 1) en total
por las columnas, se obtiene el nmero de grados de libertad del estimador:
rc 1 (r 1) (c 1) = (r 1)(c 1).
En nuestro ejemplo
X
2
=
4
X
j=1
3
X
i=1

n
ij


E(n
ij
)

E(n
ij
)
X
2
6
8
el valor observado del estimador es
X
2
obs
= 19.18
A un nivel = 0, 05 la regin de rechazo viene dadad por

X
2
0.05;6
,

donde
P

X
2
6
> X
2
0.05;6

= 0, 05
Utilizando la tabla se obtiene que X
2
0.05;6
= 12, 60 como X
2
obs
= 19.18 cae en
la regin de rechazo se rechaza la hiptesis nula, es decir, se concluye que no
hay independencia entre el turno y el tipo de defecto. El p valor se calcula
hallando
P

X
2
6
> 19, 18

valindonos de la tabla se obtiene un p-valor menor que 0.005, mucho menor


que 0, 05.
0.1.5 Anova
Anlisis de Varianza: Para introducir el mtodo de Anlisis de Vari-
anza (ANOVA) vamos a estudiar un ejemplo sencillo:
Supongamos que el nmero de horas de sueo de los miembros de una
familia est dada por:
Adultos 8.4 7.7 7.9
Nios 9.8 9.9 10.3
Queremos constatar si la variacin (diferencia entre las medias), es debida a
la edad no es signicativa esa diferencia.
_
y
1
=
8.4+7.7+7.9
3
= 8(media del grupo i = 1 de adultos)
_
y
2
=
9.8+9.9+10.3
3
= 10(media del grupo i = 2 de nios)
Si y
ij
es la observacin nmero j del grupo i :
y
ij
=
_
y
i
+ (y
ij

_
y
i
)
9
Hagamos una tabla que compare cada resultado con la media de su grupo:
j = 1 j = 2 j = 3
Adultos (i = 1) 8 + 0.4 8 0.3 8 0.1
Nios (i = 2) 10 0.2 10 0.1 10 + 0.3
Observe que tenemos dos grupos, cada uno con medias diferentes.La media
de toda la muestra (uniendo los dos grupos) es:
_
y =
8.4 + 7.7 + 7.9 + 9.8 + 9.9 + 10.3
6
= 9
y
ij
=
_
y + (
_
y
i

_
y) + (y
ij

_
y
i
)
Hagamos una tabla que muestre la variacin de la media de cada grupo con
la media general:
j = 1 j = 2 j = 3
Adultos (i = 1) 9 1 + 0.4 9 1 0.3 9 1 0.1
Nios (i = 2) 9 + 1 0.2 9 + 1 0.1 9 + 1 + 0.3
donde
_
y es la media general
(
_
y
i

_
y) compara la media de cada grupo con la media general
(y
ij

_
y
i
) variacin de cada individuo respecto a la media de su grupo
sumamos i = 1, 2 (nmero de grupos), j = 1, 2, 3 (observaciones en cada
grupo):
2
X
i=1
3
X
j=1
(y
ij

_
y)
2
=
2
X
i=1
3
X
j=1
(
_
y
i

_
y)
2
+
2
X
i=1
3
X
j=1
(y
ij

_
y
i
)
2
porque
2
2
X
i=1
3
X
j=1
(
_
y
i

_
y)(y
ij

_
y
i
) = 0.
ya que
3
P
j=1
(y
ij

_
y
i
) = 3
_
y
i
3
_
y
i
= 0.
Esta descomposicin es la idea bsica del ANOVA, (Anlisis de Varianza
en ingls), si N = n
1
+n
2
, n
i
es el nmero de observaciones del grupo i

S
2
2
=
1
N 2
2
X
i=1
n
i
X
j=1
(y
ij

_
y
i
)
2
10
es un estimador puntual de la varianza
2
de la muestra Y
ij
( se supone que
todas las variables tienen la misma varianza). Es fcil ver que
2
X
i=1
n
i
X
j=1
(
_
y
i

_
y)
2
=
2
X
i=1
n
i
(
_
y
i

_
y)
2
.
En general: si (Y
ij
) , i = 1, 2, , k; j = 1, 2, , n
i
; (k es el nmero de
poblaciones o grupos), Y
ij
N(m
i
,
2
) :
_
Y
i
=
1
n
i
n
i
X
j=1
Y
ij
estima m
i

S
2
k
=
1
N k
k
X
i=1
n
i
X
j=1
(Y
ij

_
Y
i
)
2
es un estimador de
2
, N = n
1
+n
2
+, n
k
.
Se quiere hacer la siguiente prueba de hiptesis:
H
0
: m
1
= m
2
= = m
k
H
1
: existen al menos dos medias diferentes
Bajo la hiptesis nula

S
2
=
1
k 1
k
X
i=1
n
i
(
_
y
i

_
y)
2
estima
2
y
F =

S
2

S
2
k
F
k1,.Nk
Una discrepancia con la hiptesis nula queda indicada por un valor grande de
F, ya que el numerador (variabilidad de la media de cada grupo con la media
general), cuando la hiptesis nula es falsa, ser en promedio ms grande que
el denominador (variabilidad dentro de cada grupo) por lo que la regin de
rechazo para un dado ser:
[F > f
k1,Nk,
]
donde
P([F > f
k1,Nk,
]) = .
11
En nuestro ejemplo, k = 2, n
1
= n
2
= 3, N = 6,

S
2
= 6,

S
2
2
= 0.1, F = 60, si
= 0.01, f
1,4,
= 21.20 por lo que se rechaza la hiptesis a este nivel. El p
valor es 0.015 el cual representa
P([F > 60])
Observe que en nuestro ejemplo slo hay dos grupos, este contraste es identco
al de la rpuba T- de student hecha para comparar dos medias, se puede
demostrar que el cociente

S
2

S
2
2
el cuadrado del estadstico T, n
1
+n
2
2 grados
de libertad.
El mtodo que hemos expuesto, se denomina, Anlisis de varianza con un
slo factor o clasicacin simple. Fue inventado por Fisher (1925) con el ob-
jetivo de descomponer la variabilidad de un experimento (variabilidad total)
en componentes independientes que puedan asignarse a diferentes causas.
Por ejemplo, si queremos comparar el rendimineto de k mquinas medido
por su produccin diaria. Existen diversos factores que pueden inuir en la
produccin diaria de cada mquina ( aunque trabajen en condiciones idn-
ticas), por ejemplo, pureza de la materia prima, desajustes aleatorios de la
mquina, temperatura de funcionamiento, habilidad del operario, etc. Si
medimos durante n
i
das la produccin diaria de la mquina i
k
X
i=1
n
i
= N es el total de datos
Si y
ij
es la produccin diaria de la mquina i en el da j, el objetivo del
anlisis es
1. comprobar si todas las mquinas son idnticas respecto a la produccin
media diaria
2. Si las mquinas no tienen la misma produccin media, estimar la pro-
duccin media de cada una.
El anlisis de varianza formula esta situacin mediante un modelo matemtico,
nosotros tratamos slo el modelo con un solo factor.
La motivacin es la siguiente: comparacin de medias de poblaciones
normales. Hemos estudiado el problema de comparar dos medias de pobla-
ciones normales, cuando hay igual varianza e independencia de las dos mues-
tras, usando una prueba T de Student, ya sea construyendo un intervalo
12
de conanza o haciendo una prueba de hiptesis. Mediante el anlisis de
varianza se generaliza este problema a la comparacin de medias de k pobla-
ciones a partir de muestras independientes de tamaos n
1
, , n
k
. Se trata
de hallar una prueba para
H
0
:
1
=
2
= =
k
H
1
:
i
6=
j
para algn i 6= j
donde Y
ij
tiene distribucin N(
i
,
2
); i = 1, 2, , k; j = 1, 2, , n
i
.
El inconveniente de hacer esta prueba dos a dos es que el error de primera
especie se incremente por cada prueba. Fisher desarroll este mtodo para
comparar ms de dos medias, comparando la variabilidad interna de los gru-
pos con la variabilidad entre grupos.
Bajo hiptesis nula, Y
ij
es normal N(,
2
), se tiene la siguiente descom-
posicin de la variabilidad total
k
X
i=1
n
i
X
j=1
(y
ij

_
y)
2
=
k
X
i=1
n
i
X
j=1
(
_
y
i

_
y)
2
+
k
X
i=1
n
i
X
j=1
(y
ij

_
y
i
)
2
donde,
k
P
i=1
n
i
P
j=1
(
_
y
i

_
y)
2
=
k
P
i=1
n
i
(
_
y
i

_
y)
2
, el estadstico de prueba bajo la
hiptesis nula y suponiendo igualdad de varianzas es
F =

S
2

S
2
k
F
k1,.Nk
donde

S
2
k
=
1
N k
k
X
i=1
n
i
X
j=1
(y
ij

_
y
i
)
2
representa la variabilidad interna de los grupos y

S
2
=
1
k 1
k
X
i=1
n
i
(
_
y
i

_
y)
2
la variabilidad entre grupos. Valores grandes de F indican que la hiptesis
nula no es verdadera.
13
Observaciones: Los resultados del contraste F en la prueba ANOVA son
sustancialmente vlidos aunque los datos no sean normales, en ese sentido se
dice que es una tcnica robusta frente a desviaciones de la normalidad.
El efecto de desigualdad de las varianzas en los grupos sobre el contraste
F y los contrastes de medias dependen de que el nmero de observaciones
en cada grupo sea igual o muy distinto. Si todos los grupos tienen el mismo
nmero de observaciones, el contraste F es igualmente exacto aunque las
varianzas sean distintas. Es decir, podemos despreocuparnos de las varianzas
a efectos de contrastes de medias, siempre que haya aproximadamente el
mismo nmero de observaciones por grupo, en caso contrario, diferencias
entre las varianzas pueden ser graves.
14
Prueba X
2
Bondad de Ajuste- Independencia
Anlisis de Varianza (ANOVA)
Prctica #10
Estadstica
1. Despus de lanzar un dado 300 veces, se han obtenido las siguientes
frecuencias:
Lado 1 2 3 4 5 6
Frecuencia 43 49 56 45 66 41
Al nivel de signicacin, = 0.05, se puede armar que el dado es
regular?
2. En el transcurso de dos horas, el nmero de llamadas por minuto so-
licitadas a una central telefnica fue:
Llamadas/minuto 0 1 2 3 4 5 6
Frecuencia 6 18 32 35 17 10 2
Al nivel de signicacin, = 0.05, se puede aceptar que el nmero de
llamadas por minuto sigue una distribucin de Poisson?.
3. Se clasicaron 1000 individuos de una poblacin segn el sexo y segn
sean normales o daltnicos:
masculino femenino
normales 442 514
daltnicos 38 6
En base a un modelo gentico, las probabilidades deben ser:
masculino femenino
normales
p
2
p
2
2
+ pq
daltnicos
q
2
q
2
2
donde q = 1 p = proporcin de genes defectuosos en la poblacin. A
partir de la muestra se ha estimado que q = 0.087 concuerdan los datos
con el modelo?
4. El gerente de una planta industrial quiere determinar si el nmero
de empleados que asisten al consultorio mdico de la planta est dis-
tribuido en forma equitativa durante los 5 das de la semana. Con base
1
a una muestra aleatoria se observ durante 4 semanas de trabajo, el
siguiente nmero de consultas:
Lunes Martes Mircoles Jueves Viernes
49 35 32 39 45
Al nivel de signicacin, = 0.05, existe alguna razn para creer que
el nmero de empleados que asisten al consultorio mdico se encuentra
distribuido equitativamente durante los cinco das de la semana?
5. Los datos que se dan a continuacin corresponden al lapso de tiempo,
medido en minutos, necesario para que cada uno de 50 clientes de un
banco, lleve a cabo una transaccin:
2.3 0.2 2.9 0.4 2.8
2.4 4.4 5.8 2.8 3.3
3.3 4.7 2.5 5.6 9.5
1.8 4.7 2.5 5.6 9.5
1.8 4.7 0.7 6.2 1.2
7.8 0.8 0.9 0.4 1.3
3.1 3.7 7.2 1.6 1.9
2.4 4.6 3.8 1.5 2.7
0.4 1.3 1.1 5.5 3.4
4.2 1.2 0.5 6.8 5.2
6.3 7.6 1.4 0.5 1.4
Al nivel de signicacin, = 0.05, se puede concluir que los tiempos
estn exponencialmente distribuidos con parmetro = 3.2 minutos?
La densidad exponencial es:
f(c) =
exp(
x

, x > 0.
6. Un siclogo desea conocer la relacin entre los sntomas deterioros-
sicognicos del pensamiento y depresin. En una muestra de 100 in-
dividuos obtuvo los siguientes datos
Deterioros Si Sicognicos No
Depresin Si 38 31
Depresin No 9 22
Con el nivel de conanza del 95%, existe relacin entre ambos sntomas?
2
7. Una fbrica de automviles quiere averiguar si la preferencia por un
modelo tiene relacin con el sexo de los clientes. En una muestra aleato-
ria de 2000 posibles clientes se observaron las siguientes preferencias:
Modelo A Modelo B Modelo C
Mujeres 340 400 260
Hombres 350 270 380
Existe relacin al nivel = 0.01?
8. Para los datos que se dan en la siguiente tabla, pruebe si hay inde-
pendencia entre la capacidad de una persona para la matemtica y su
inters en la estadstica. Utilice le nivel de signicacin = 0.01.
Cap.Mat.baja Cap.Mat.promedio Cap.Mat.alta
Inters Est.Baja 63 42 15
Inters Est.promedio 58 61 31
Inters Est.alto 14 47 29
9. Un total de 6000 estudiantes de escuela elemental fueron clasicados de
acuerdo a su condicin social y a su ubicacin en dos tipos de programas
educacionales. Los resultados se dan en la tabla. Proporcionan los
datos suciente evidencia para concluir que hay dependencia entre la
condicin social y la ubicacin en los programas educacionales? Use
= 01
Cond.Social A Cond.Social B Total
Prog.Educativo A 163 117 280
Prog.Educativo B 1477 4243 5720
Total 1640 4360 6000
10. Cuatro grupos de estudiantes se sometieron a tcnicas de enseanza
diferentes y se examinaron al nal de un perodo especco de tiempo.
Debido a las bajas en los grupos experimentales (por enfermedad, trans-
ferencias, etc.) el nmero de estudiantes en los grupos no fue el mismo.
Se tiene la siguiente tabla:
Tcnica:1 65, 87, 73, 79, 61, 69
Tcnica:2 75, 69, 83, 81, 72, 79, 90
Tcnica:3 59, 78, 67, 62, 76
Tcnica:4 94, 89, 80, 88
3
Presentan los datos suciente evidencia para concluir que hay diferen-
cias en el rendimiento medio correspondientes a las cuatro tcnicas?
(Realice un anlisis de varianza)
11. Un siclogo clnico quera comparar tres mtodos para reducir los nive-
les de hostilidad en estudiantes universitarios. Cada prueba sicolgica
(PNH) fue usada para medir el grado de hostilidad. Las puntuaciones
altas en esta prueba se usaron como indicacin de gran hostilidad. En
el experimento se usaron 11 estudiantes que obtuvieron puntuaciones
altas y muy cercanas entre s. De los 11 estudiantes se seleccionaron
5 al azar y se trataron con el mtodo A, de los 6 restantes se tomaron
tres al azar y se trataron con el mtodo B y el resto se trat con el
mtodo C. Todos los tratamientos se realizaron durante un semestre.
Cada estudiante tom la prueba PNH nuevamente al nal del semestre,
con los resultados siguientes:
Mtodo:A 73, 83, 76, 68, 80
Mtodo:B 54, 74, 71
Mtodo:C 79, 98, 87
(a) Realice un anlisis de varianza para este experimento.
(b) Presentan los datos suciente evidencia para concluir que hay
diferencias entre las respuestas medias de los estudiantes de los
tres mtodos, despus del tratamiento?
12. Se efecta un experimento para determinar el efecto de la edad sobre el
ritmo cardiaco, cuando una persona es sometida a una cantidadespec-
ca de ejercicio. Para esto, se selecionaron 10 varones de los 4 grupos
de edades: 10-19-20-39-40-59-60-69. Cada individuo accion un molino
a una velocidad especca durante 12 minutos y se anot el aumento
del ritmo cardiaco (diferencia antes y despus del ejercicio), en latidos
4
por minuto. Los datos se muestran en la tabla.
Edad
[10 19] [20 39] [40 59] [60 69]
29 24 37 28
33 27 25 29
26 33 22 34
27 31 33 36
39 21 28 21
35 28 26 20
33 24 30 25
29 34 34 24
36 21 27 33
22 32 33 32
Total 309 275 295 282
(a) ?Presentan los datos suciente evidencia que indique que hay
diferencia entre el aumento medio del ritmo cardiaco de los 4 gru-
pos de edades?. Use = 0.05.
(b) Encuentre un intervalo de conanza la 90% para la diferencia entre
el aumento medio del ritmo cardiaco del grupo de 10-19 aos y el
del grupo de 60-69 aos.
(c) Encuentre un intervalo de conanza del 90% para el aumento
medio del ritmo cardiaco del grupo de 20-39 aos.
(d) Aproximadamente, cuntas personas se necesitaran en cada grupo
si se desea estimar la media de un grupo con un error no mayor
de 2 latidos por segundo, con una probabilidad igual a 0, 95?.
MMOM/04
5
Captulo VI
Recta de Regresin lineal
Prof. Mara Margarita Olivares
Julio 2004
1 Recta de mnimos cuadrados.
En muchos problemas obtenemos datos pareados (x
i
, y
i
), no conocemos la dis-
tribucin conjunta de las variables aleatorias correspondientes y al gracar
estos datos tenemos la impresin de que una recta podra ser un buen ajuste
para ellos, aunque los puntos no estn exactamente sobre una recta. Prob-
lemas de este tipo, suelen manejarse por medio del mtodo de los mnimos
cuadrados que consiste en hallar la recta
y = ax + b
que mejor se ajusta a esos datos, para ello debemos calcular los parmetros
a y b a partir de los datos, es decir:
si nos dan un conjunto de datos pareados {(x
i
, y
i
); i = 1, 2, 3, , n} , las
estimaciones de mnimos cuadrados de los coecientes a y b son los valores
para los cuales la cantidad:
q(a, b) =
n
X
i=1
[y
i
(a + bx
i
)]
2
es un mnimo. Al diferenciar parcialmente con respecto a a y a b y al igualar
estas derivadas parciales a cero:
q
a
= (2)
n
P
i=1
[y
i
(a + bx
i
)] = 0
q
b
= (2)
n
P
i=1
x
i
[y
i
(a + bx
i
)] = 0
1
que producen el siguiente sistema de ecuaciones:
n
P
i=1
y
i
= an + b
n
P
i=1
x
i
n
P
i=1
x
i
y
i
= a
n
P
i=1
x
i
+ b
n
P
i=1
x
2
i
Al resolver ese sistema de ecuaciones se obtiene:
a =
_
y b
_
x
b =
S
xy
Sxx
donde :
S
xx
=
n
P
i=1
(x
i

_
x)
2
=
n
P
i=1
x
2
i

1
n

n
P
i=1
x
i

2
S
xy
=
n
P
i=1
(x
i

_
x)(y
i

_
y) =
n
P
i=1
x
i
y
i

1
n

n
P
i=1
x
i

n
P
i=1
y
i

2 Regresin Lineal Simple.


Introduccin:
En este curso hemos estudiado el siguiente tipo de problema:
se tiene una variable aleatoria Y (que denominaremos respuesta) cuya
distribucin se supone conocida, excepto por uno o varios parmetros. En
particular se estudiaron los siguientes casos:
1. Y con distribucin de Bernoulli de parmetro p desconocido, donde
P(Y = 1) = p, P(Y = 0) = 1 p, E(Y ) = p
2. Y con distribucin de Poisson de parmetro , E(Y ) = es descono-
cido.
3. Y es normal de parmetros desconocidos , , con E(Y ) = , V ar(Y ) =

2
.
y en base a una muestra y
1
, , y
n
de la variable aleatoria Y se desea
estimar dichos parmetros. Como es observable, uno de los parmetros
bsicos a observar es la media de la variable aleatoria.
Se estudiaron tres maneras de estimar:
2
(a) Estimacin puntual
(b) Estimacin por intervalos de conanza
(c) Pruebas de hiptesis.
En cualquiera de estos casos lo primero que hay que hacer es encontrar un
estadstico para estimar el parmetro (obtener un estimador del parmetro).
Hagamos incapi en el caso Y es normal de parmetros desconocidos , ,
con E(Y ) = , V ar(Y ) =
2
que es el que se asemeja ms al problema que
estamos tratando de estudiar. En este caso podemos estimar la media por
_
y =
y
1
+ + y
n
n
o promedio de valores de la muestra y estimamos
2
por
S
2
1
=
1
n 1
n
X
i=1

y
i

_
y

2
o variabilidad centrada de la muestra alrededor de su media , en ambos casos
los estadsticos son insesgados.
Suponer que Y tiene distribucin normal N(,
2
) es equivalente a suponer
que
Y = +
donde es una variable aleatoria normal de media cero y varianza
2
.
Con los estadsticos
_
Y y S
2
1
o con S
2
=
1
n
n
P
i=1

y
i

_
y

2
se cosntruye los
llamados estadsticos pivotales, por ejemplo, si es conocido, el estadstico
pivotal para es
_
Y
/

n
que tiene distribucin normal estndar.
A partir de los estadsticos pivotales obetenemos intervalos de conanza,
podemos hacer pruebas de hiptesis.
Generalizacin del problema de estimacin de una variable aleato-
ria .
Supongamos que tenemos una variable aleatoria Y (respuesta) que de-
pende de una o varias variables x (o factores). Estos factores se pueden
dividir en dos grupos:
3
1. Un factor o un grupo de factores (x
1
, , x
k
) conocidos al observar Y.
Suponemos que la dependencia de Y de estos factores tiene una forma
funcional conocida.
2. Otro grupo de factores que pueden ser conocidos o no al observar Y, no
sabemos necesariamente cmo depende de ellos, pero suponemos que
cada uno inuye en la respuesta Y, en pequea magnitud.
En resumen, suponemos que
Y = f(x
1
, , x
k
) +
siendo una variable aleatoria y en el caso de un solo factor
Y = f(x) +
Ejemplos:
1. Y = benecio anual obtenido por una corporacin
X = gastos de publicidad.
2. Y = aumentode peso, en un mes, de cierta raza de ganado que se
alimenta con cierto tipo de alimento.
X
1
= peso inicial del animal.
X
2
= cantidad de alimento consumido diariamente.
X
3
= contenido de protenas del alimento.
X
4
= contenido de agua del alimento.
X
5
= contenido de carbohidratos del alimento.
X
6
=

1 el animal estuvo sano en el mes


0 el animal estuvo enfermo en el mes
3. Y = nota obtenida por un estudiante de ingienera en matemtica I
X = nota obtenida por un estudiante en la prueba de admisin.
En todos estos casos vamos a querer estimar la media de Y como funcin
de X o de X
1
, , X
k
, queremos contestar preguntas como la siguiente:
4
1. ?Cul es el benecio medio de la corporacin para un gasto dado de
publicidad X = x?
2. ?Cul es el aumento de peso promedio para los animales que no se
enfermaron en un mes y que recibieron un alimento que contena 15%
de protenas, 10% de agua y el resto de carbohidratos?
Estos modelos
Y = f(x
1
, , x
k
) +
que relacionan una variable aleatoria dependiente Y con una o varias vari-
ables independientes x
1
, , x
k
no aleatorias se denominan modelos de re-
gresin. Si tenemos una sola variable independiente
Y = f(x) +
hablamos de modelos de regresin simple. Si tenemos varias variables inde-
pendientes hablamos de regresin mltiple.
El modelo que estudiaremos es el de regresin lineal simple, nos limitare-
mos al caso en que f es una funcin lineal de x :
Y =
0
+
1
x +
donde es una variable aleatoria, se estudiar la dependencia lineal de una
variable aleatoria Y (respuesta) respecto de una variable explicativa x. En
general, la palabra lineal se reere a los parmetros, es decir, ningn
parmetro en un modelo lineal, aparecer con exponente o multiplicado o
dividido entre otro parmetro. Es decir los siguientes modelos son tambin
lineales en los parmetros:
Y =
0
+
1
x +
2
x
2
+
Y =
0
+
1
x +
2
x
2
+
3
x
3
+
Y =
0
+
1
ln(x) +
Y =
0
+
1
x
1
+
2
x
2
+
3
x
1
x
3
+
pero el modelo Y =
0
exp(
1
x) + no es lineal en los parmetros. Nosotros
estudiaremos slo el caso f(x) =
0
+
1
x.
Hiptesis Bsicas:
Se observan n variables respuestas (aleatorias) Y
i
=
0
+
1
x
i
+
i
, i =
1, 2, , n que corresponden a cada variable no aleatoria x
i
(variable inde-
pendiente explicativa). Las variables Y
i
son independientes estocsticamente
5
(independencia en el sentido aleatorio o probabilstico), es decir,
i
y
j
son
independientes para i 6= j.
i
tiene distribucin N(0,
2
). Todas las observa-
ciones tienen la misma varianza, V ar(Y
i
) =
2
; E(Y
i
) =
0
+
1
x
i
. Por lo
que estimar la media de las variables respuestas es equivalente a estimar los
parmetros de la recta de regresin.
Mtodo de Mnimos Cuadrados:
Para obtener los estimadores de mnimos cuadrados de los parmetros

0
,
1
se considera la desviacin de la observacin Y
i
de su media y se deter-
minan los valores de los parmetros que minimizan la suma de los cuadrados
de estas desviaciones. La isima desviacin o i esimo error es

i
= Y
i
(
0
+
1
x
i
)
y la suma de los cuadrados de los errores es
n
X
i=1

2
i
=
n
X
i=1
(Y
i

1
x
i
)
2
diferenciando con respecto a los parmetros e igualando a cero obtenemos
las siguientes ecuaciones
n
0
+
1
n
P
i=1
x
i
=
n
P
i=1
y
i

0
n
P
i=1
x
i
+
1
n
P
i=1
x
2
i
=
n
P
i=1
x
i
y
i
que conducen a obtener los estimadores buscados, el estimador mnimo cuadrado
de
0
es
B
0
=
_
y B
1
_
x
con
B
1
=
n
P
i=1

x
i

_
x

y
i

_
y

n
P
i=1

x
i

_
x

2
=
Cov(x, y)
S
2
x
donde
cov(x, y) =
1
n
n
X
i=1

x
i

_
x

y
i

_
y

; S
2
x
=
1
n
n
X
i=1

x
i

_
x

2
6
es el estimador de mnimos cuadrados de
1
correspondiente a las observa-
ciones (x
i
, y
i
). Finalmente, dados los estimadores

0
y

1
la recta de regresin
estimada para el modelo es

Y
i
=

0
+

1
x
i
donde

Y
i
es el estimador para la media de la observacin Y
i
, que corresponde
al valor x
i
de la variable de prediccin.
Observacin:
Como notacin, utilizaremos

1
y

0
para referirnos al estimador de
1
y

0
respectivamente y B
1
y B
0
para los estimadores observados, es decir,
evaluados en las observaciones.
Si sustitumos la relacin entre los parmetros
B
0
=
_
y B
1
_
x
en la recta de regresin estimada, obtenemos

Y
i
=
_
Y +

1
(x
i

_
x)
La diferencia entre el valor observado y el estimado se denomina i esimo
residuo o residual:
e
i
= y
i


y
i
y son estimadores de la variable aleatoria no observable
i
, proporcionan
importante informacin de lo que puede faltar en el modelo de regresin
estimado. La varianza
2
en general no se conoce y se estima por la varianza
residual (su raiz cuadrada es la desviacin estndar residual)
S
2
R
=
1
n 2
n
X
i=1

y
i


y
i

2
=
1
n 2
n
X
i=1
e
2
i
se usa n2 pues se pierden dos grados de libertad al estimar los dos parmet-
ros
0
,
1
. Este estimador de la varianza es insesgado si el modelo de regresin
es correcto.
Se cumplen las siguientes propiedades: (se deja como ejercicio la veri-
cacin)
1.
n
P
i=1
e
i
= 0
7
2.
n
P
i=1
y
i
=
n
P
i=1

y
i
3.
n
P
i=1
x
i
e
i
= 0
Estimacin por Mxima Verosimilitud para el Modelo Lineal
Simple.
Para hallar los estimadores mnimos cuadrados de los parmetros no se
necesit utilizar la distribucin de los errores aleatorios
i
. Bajo nuestras
hiptesis es posible obtener los estimadores de mxima verosimilitud ya que
Y
i
son variables aleatorias independientes de distribucin N (
0
+
1
x
i
,
2
)
dado que es una funcin lineal de una variable aletoria
i
con distribucin
normal. La funcin de verosimilitud viene dada por
L(y
1
, , y
n
;
0
,
1
,
2
=

n
exp
"

1
2
2
n
X
i=1
(y
i

1
x
i
)
2
#
donde
ln(L(
0
,
1
,
2
)) =
n
2
ln(2)
n
2
ln(
2
)
1
2
2
n
X
i=1
(y
i

1
x
i
)
2
al tomar las derivadas parciales con respecto a cada uno de los parmetros se
obtendr que los estimadores de
0
,
1
son los mismos hallados por mnimos
cuadrados y para
2
se obtiene

2
=
1
n
n
X
i=1

y
i


y
i

2
que no es insesgado pero para valores grandes de n no se diferencia mucho
del S
2
R
que si es insesgado.
Los estimadores de mxima verosimilitud tienen buenas propiedades, son
consistentes, sucientes y tienen varianza mnima es por eso que mostramos
que los estimadores hallados para los parmetros coinciden con los de mxima
verosimilitud.
Interpretacin Geomtrica dela estimacin.
8
El mtodo de mnimos cuadrados admite una simple interpretacin ge-
omtrica. Expresando vectorialmente las observaciones, demanos los sigu-
ientes vectores las:
Y
0
= (y
1
, , y
n
) 1
0
= (1, , 1)
X
0
= (x
1
, , x
n
)
0
= (
1
, ,
n
)
El modelo postulado es: Y =
0
1 +
1
X+ e
0
= (e
1
, , e
n
)
Estimar el modelo por mnimos cuadrados equivale a encontrar constantes
B
0
, B
1
tales que el mdulo del vector de residuos
e = Y

Y
sea mnimo, es decir, se trata de encontrar un vector

Y en el plano denido
por los vectores 1 y X tales que su distancia al vector Y sea mnima, la
solucin es la proyeccin ortogonal del vector Y sobre este plano, cualquier
otra eleccin nos dara un vector residual e de mdulo mayor. El vector de
residuos e ser perpendicular a todos los vectores del plano, en particular su
producto escalar con los vectores 1 y Xes cero obtenindose as las ecuaciones
llamadas normales o mnimo- cuadrticas
e
0
1 =
n
X
i=1
e
i
= 0
e
0
X =
n
X
i=1
e
i
x
i
= 0
observe que al reemplazar
e
0
=

Y

Y

0
con

Y = B
0
1+B
1
X, B
0
es la estimacin de
0
y B
1
es la de
1
obtendremos
las ecuaciones
n
0
+
1
n
P
i=1
x
i
=
n
P
i=1
y
i

0
n
P
i=1
x
i
+
1
n
P
i=1
x
2
i
=
n
P
i=1
x
i
y
i
que permitieron hallar los estimadores mnimo-cuadrado.
Propiedades de los Estimadores:
9
1. Coeciente de Regresin

1
Este estimador se puede expresar como

1
=
n
X
i=1
w
i
Y
i
con w
i
=

x
i

_
x

nS
2
x
pues
B
1
=
n
P
i=1

x
i

_
x

y
i

_
y

n
P
i=1

x
i

_
x

2
=
n
P
i=1

x
i

_
x

y
i
nS
2
x
as,

1
es combinacin lineal de variables Y
i
normales, por lo tanto tiene
distribucin normal. Observe que
n
X
i=1
w
i
= 0,
n
X
i=1
w
2
i
=
1
nS
2
x
y que si denotamos por p
i
=

y
i

_
y

x
i

_
x
la pendiente de la recta que une
(x
i
, y
i
) con

_
x,
_
y

B
1
=
n
P
i=1

x
i

_
x

2
p
i
nS
2
x
=
n
X
i=1
d
i
p
i
es una ponderacin de las pendientes p
i
=

y
i

_
y

x
i

_
x
con pesos que
dependen de la distancia relativa de cada punto x
i
y el centro de todos
ellos, note que
d
i
=
(x
i

_
x)
2
nS
2
x
= w
i
(x
i

_
x) 0,
n
X
i=1
d
i
=
n
P
i=1

x
i

_
x

2
nS
2
x
= 1.
10
El estimador

1
es insesgado, en efecto
E

=
X
w
i
E(Y
i
) =
0
X
w
i
+
1
X
w
i
x
i
=
1
Calculemos la varianza de

1
V ar(

1
) =
X
w
2
i
V ar(Y
i
) =
2
1
nS
2
x
por lo tanto

1
tiene distribucin N

1
,
2 1
nS
2
x

, y as, es un estimador
insesgado y consistente del coeciente de regresin.
2. Estimador

0
(ordenada en el origen)
Es preferible escribir la recta de regresin en funcin del estimador del
coeciente de regresin, pues a veces la relacin observada no tiene
sentido para x = 0

y =
_
y + B
1
(x
_
x)
esta expresin pone de maniesto que la relacin construida es vlida en
un entorno del punto

_
x,
_
y

que representa el centro de las observaciones


que se utiliza para construir el modelo. Estudiaremos las propiedades
del estimador

0
ya que puede ser de inters:
B
0
=
_
y B
1
_
x =
1
n
X
y
i

_
x
X
w
i
y
i
=
X

1
n

_
xw
i

y
i
=
X
r
i
y
i
es decir

0
=
X
r
i
Y
i
por lo tanto tambin obtenemos que

0
tiene distribucin normal.

0
es insesgado, en efecto
E

=
P
1
n

_
xw
i

(
0
+
1
x
i
) =

0
(1
_
x
P
w
i
) +
1
_
x
1
_
x
P
w
i
x
i
=
0
11
Hallemos la V ar(

0
) :
V ar(

0
) =
X
r
2
i

2
=
2
X

1
n

_
xw
i

2
=
2

1
n
+
_
x
2
nS
2
x
!
note que

2
n
es el error dela estimacin de
_
Y pues V ar(
_
Y ) =

2
n
; el error
de estimacin de la pendiente de la recta de regresin vine dado por
V ar(

1
) =
2 1
nS
2
x
el cual aparece reejado en la V ar(

0
) y se transmite
a la ordenada del origen en funcin de lo alejado que est
_
x del origen.
Se concluye que

0
tiene distribucin N

0
,
2

1
n
+
_
x
2
nS
2
x

siendo as
insesgado y consistente..
Observaciones:
Los estimadores

0
y

1
no son independientes, aceptaremos sin demostracin
que
cov(

0
,

1
) =
_
x
2
nS
2
x
y que
_
Y y

1
son independientes
3. Varianza residual

S
2
R
(estimador de
2
)
Recordemos que
S
2
R
=
1
n 2
n
X
i=1

y
i


y
i

2
=
1
n 2
n
X
i=1
e
2
i
se puede demostrar que
(n 2)

S
2
R

2
tiene distribucin X
2
n2
(chi-cuadrado
con n2 grados de libertad), la esperanza de esta distribucin es n2
y la varianza es 2(n 2) por lo que se concluye que
E


S
2
R

=

2
n 2
E

(n 2)

S
2
R

=
2
12
y que
V ar(

S
2
R
) =

4
(n 2)
2
V ar

(n 2)

S
2
R

=
2
4
(n 2)
as

S
2
R
es un estimador insesgado y consistente de
2
.
Hemos denotado por

S
2
R
el estimador insesgado de
2
en funcin de las
variables aleatorias Y
i
y S
2
R
cuando este estimador es evaluado en las
observaciones.
Inferencia sobre los parmetros: intervalos de conanza y prue-
bas de hiptesis.
A partir de las distribuciones de los estimadores

0
,

1
,

S
2
R
de los parmet-
ros podemos construir estadsticos que nos permitan hacer inferencias, el
siguiente cuadro muestra los estadsticos que nos permiten hacer el contraste
parmetro
0

1

2
estimador

S
2
R
estadstico T
n2
=

S
R
q
1 +
_
x
2
S
2
x
T
n2
=

S
x
S
R
(n 2)

S
2
R

2
X
2
n2
Coeciente de determinacin o R
2
El coeciente de determinacin se dene como
R
2
=
P

y
i

_
y

2
P
y
i

_
y

2
el numerador (V E) es la variabilidad explicada por la regresin y el denom-
inador (V T) la variabilidad total..En el caso que estamos tratando, tenemos
una recta de regresin lineal simple as:
V E =
P

y
i

_
y

2
=
P
_
y + B
1
(x
i

_
x)
_
y

2
= B
2
1
P
(x
i

_
x)
2
= B
2
1
nS
2
x
V T = nS
2
y
13
por lo tanto
R
2
=
B
2
1
nS
2
x
nS
2
y
=
B
2
1
S
2
x
S
2
y
=
(cov(x, y))
2
S
4
x
S
2
x
S
2
y
=
(cov(x, y))
2
S
2
x
S
2
y
= r
2
donde r es el coeciente de correlacin asociado a (x
i
, y
i
) el cual se dene
como
r =
cov(x, y)
S
x
S
y
es decir, en el caso de regresin lineal simple, cuando se trata de una recta
de regresin, el coeciente de determinacin coincide con el coeciente de
correlacin lineal.
Se concluye que si la regresin o relacin lineal entre x e y es exacta,
|r| = 1.
Si no existe relacin entre las variables (E

0,

y
i
es prximo a
_
y)
en este caso r 0.
La denicin de R
2
es general, R
2
= r
2
(coeciente de correlacin de
Pearson) solo en le caso de regresin lineal simple, cuando la regresin es
una recta.
El coeciente de correlacin se usa para comparar rectas de regresin
entre s, pero se debe evitar su uso indiscrimanado. Dos rectas de regresin
pueden tener la misma ecacia predictiva y los mismos errores de estimacin
y sinembargo tener diferentes coecientes de correlacin.
14

También podría gustarte