Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NotasEstadistica PDF
NotasEstadistica PDF
Estadstica Descriptiva
Mara Margarita Olivares M.
Abril 2004
1 INTRODUCCIN:
Si estamos interesados en conocer alguna caracterstica de una poblacin (
conjunto de individuos u objetos) acerca de la que se quiere saber algn as-
pecto claramente definido, lo ms completo sera estudiar la poblacin entera.
Pero este procedimiento requiere mucho tiempo y resulta muy costoso, as que
normalmente nos conformamos con el conocimiento parcial de la poblacin
muestra, que elegida adecuadamente sea representativa de sta.
El objetivo de la estadstica es hacer inferencia ( tomar decisiones
hacer predicciones) acerca de una poblacin, basndose en la informacin
contenida en una muestra. Es decir, integrando el clculo de probabilidades
(que nace en el siglo XVII como teora matemtica de los juegos de azar)
y la Estadstica Descriptiva o ciencia del estado, del latn Status, que es-
tudia la descripcin de datos y tiene races ms antiguas, se obtiene una
ciencia (Estadstica Matemtica) que estudia cmo obtener conclusiones de
la investigacin emprica mediante el uso de modelos matemticos.
La estadstica acta como puente entre los modelos matemticos y los
fenmenos reales. Un modelo matemtico es una abstraccin simplificada
de una realidad ms compleja y siempre existir cierta discrepancia entre
lo observado y lo previsto por el modelo. La Estadstica nos proporciona
un mtodo para evaluar estas discrepancias entre la realidad y la teora. Su
estudio es bsico para todos aquellos que quieran trabajar en ciencia aplicada
(economa, sociolaga, etc.).
En nuestra era cada aspecto de la actividad humana es medido e inter-
pretado en trminos estadsticos. El conocimiento bsico de los mtodos
1
estadsticos nos permitir participar en los argumentos pblicos basados en
cifras y datos por lo que es un buen antdoto ante posibles manipulaciones.
Hay cinco elementos fundamentales en todo problema estadstico:
2
El siguiente diagrama resume lo expuesto anteriormente:
Mtodos de Tabulacin
Descriptiva Mtodos Grficos
Estadstica
Mtodos Numricos
Estimacin de parmetros
Inferencia
Pruebas de Hiptesis.
3 CONCEPTOS BSICOS.
3.1 Estadstica Descriptiva: Una Variable
Supongamos que tenemos una fuente de material radioactivo que emite partcu-
las Alfa () y que definimos la variable aleatoria X como el nmero de
partculas observadas en una pantalla, en un intervalo de tiempo t. Bajo
ciertas hiptesis que idealizan el experimento, X tiene una distribucin de
Poisson de parmetro t.
Si queremos calcular, por ejemplo, la probabilidad de que X sea mayor
que 10 u otras caractersticas asociadas con la distribucin tales como la
esperanza, la varianza, etc., la respuesta depender del parmetro y del
intervalo de tiempo t.
Para buscar un valor numrico de , dejamos el mundo de los modelos
matemticos tericos y entramos en el mundo de las observaciones, es decir,
observamos la emisin de partculas, obtenemos algunos valores numricos de
X y luego los utilizamos de alguna manera, a fin de obtener una informacin
atinada del parmetro .
En general, un material estadstico que consiste en cierto nmero de
observaciones
x1 , x2 , , xN
de una variable aleatoria X, dado en la forma original, en la que los N re-
sultados aparecen en el orden en que se han observado, es muy difcil de
examinar y por lo tanto no es adecuado para darnos informacin acerca de
la variable X investigada.
El propsito de la Estadstica Descriptiva es reemplazar el material ob-
servado por cantidades relativamente pocas en nmero, que representen el
material total en otras palabras, que contenga tanta informacin como sea
posible respecto a la variable X.
3
Tipos de variables:
Los tipos de variables que consideraremos, son:
x1 , x2 , , xN
4
El procedimiento de agrupacin es diferente segn la variable aleatoria
sea discreta o continua.
La presentacin de los datos en forma agrupada implica alguna prdida
de informacin, pero permite apreciar mejor sus caractersticas.
Este agrupamiento se hace mediante las llamadas tablas de frecuencias.
En la tablas de frecuencias, en lugar de mostrar individualmente todos los
datos, se informa solamente cuntos de ellos estn comprendidos entre de-
terminados valores, llamados lmites de clase. Las clases son intervalos cuyos
extremos son los lmites de clase. Generalmente las clases se escogen de igual
longitud.
Una regla emprica que se suele aplicar consiste en escoger los intervalos
de clase de tal forma que no haya menos de 10 ni ms de 20 clases diferentes.
Veamos cmo se lleva a cabo la agrupacin en cada uno de los casos:
1. Caso Discreto:
En este caso resulta conveniente hacer una tabla cuya primera columna
contenga todos los valores observados y la segunda contenga la fre-
cuencia con que han aparecido dichos valores o frecuencias absolutas.
Tambin se suele aadir una tercera columna que contiene la frecuencia
relativa de los datos observados, a saber, la razn entre la frecuencia
absoluta y el nmero total de observaciones.
Este tipo de agrupacin se utiliza cuando el nmero total de valores
observados no es muy grande, en caso contrario, en lugar de asignar una
clase a cada valor observado, podemos considerar clases que contengan
varias observaciones.
Ejemplo: se cuenta el nmero de glbulos rojos en cada uno de los
169 compartimientos de un hemocitmetro. Cada uno de los compar-
timientos representa una observacin y el nmero de glbulos rojos
en cada una de ellos es el valor observado correspondiente. De dicha
5
observacin se obtiene la siguiente tabla de frecuencias:
No de Globulos rojos Frecuencia Absoluta Frecuencia Relativa
1
4 1 169
3
5 3 169
5
6 5 169
8
7 8 169
13
8 13 169
14
9 14 169
15
10 15 169
15
11 15 169
21
12 21 169
18
13 18 169
17
14 17 169
16
15 16 169
9
16 9 169
6
17 6 169
3
18 3 169
2
19 2 169
2
20 2 169
1
21 1 169
Total 169 1
Con esta informacin podemos hacer un grfico por medio del llamado
Histograma, que en este caso se elabora levantando una lnea o barra
sobre cada clase, de altura proporcional a la frecuencia correspondiente
o a la frecuencia relativa.
2. Caso Continuo:
En el caso en que la variable aleatoria investigada es continua, la agru-
pacin es algo ms complicada, sin embargo, en general, se procede de
la siguiente manera: se toma un intervalo adecuado de la recta real
que contenga los N valores observados y se divide dicho intervalo en
un cierto nmero de intervalos de clase.
Todas las observaciones que caen en una misma clase se agrupan y se
cuentan, el nmero resultante es la frecuencia de clase correspondiente
a dicho intervalo y despus se procede a tabular. Para proceder a la
eleccin de los lmites de clase debemos conocer la exactitud de los
6
datos originales. Cuando la tabla de frecuencia ya ha sido elaborada
debe ir acompaada de la exactitud de los datos.
Ilustraremos el procedimiento mediante algunos ejemplos:
(a) Se preparan, con la misma mezcla setenta cilindros de concreto y
se mide la resistencia a la compresin de cada uno de ellos. Los
resultados originales o muestra bruta estn dados con cuatro cifras
enteras. La siguiente tabla representa la muestra bruta:
2860 3052 2940 3128 2865 3125 2881
2950 2911 2883 3027 2872 2942 3042
3128 2965 3109 2886 3045 3238 2965
3300 3193 2865 3298 2932 2782 3201
2961 2832 2950 3059 3052 3017 3001
3045 2944 3038 2968 2953 2998 3275
3185 3003 3317 2875 2820 2808 2973
2857 2903 2910 2957 2891 2899 2884
3015 3061 3097 3085 2975 3072 3115
3073 3169 3133 3152 3102 3251 2702
Procedamos a tabular estos resultados en una tabla de frecuencias:
La diferencia entre el mximo y el mnimo valor observado es
3317 2702 = 615
(esta diferencia se llama rango de la muestra). Vamos a construir
una tabla de once clases (615/11 ' 60) , esta decisin es un tanto
arbitraria, la longitud comn de cada clase ser de 60 unidades.
Nuestro primer impulso sera tomar como clases los siguientes in-
tervalos:
(2700, 2760)
(2760, 2820)
(2820, 2880) , etc.
pero tomando los lmites de esta manera, no sabramos en qu
clase incluir los valores que coinciden con los lmites de dichos
intervalos, como por ejemplo 2820. Para evitar este tipo de am-
bigedad podramos tomar los siguientes intervalos:
(2700, 2759)
(2760, 2819)
(2820, 2879) , etc.
7
con esta eleccin, dejamos un hueco entre 2759 y 2760, etc., pero
por la precisin de los datos sabemos que all no hay observaciones,
sin embargo, es preferible elegir como lmites exactos de cada clase
los puntos correspondientes a medias unidades de la ltima cifra
significativa de los lmites anteriores, es decir:
(2699.5, 2759.5)
(2759.5, 2819.5)
(2819.5, 2879.5) , etc.
8
tabla de frecuencias:
Clase(% de ceniza) Frecuencia Absoluta Frecuencia Relativa
1
(9, 9.99) 1 250
3
(10, 10.99) 3 250
3
(11, 11.99) 3 250
9
(12, 12.99) 9 250
13
(13, 13.99) 13 250
27
(14, 14.99) 27 250
28
(15, 15.99) 28 250
39
(16, 16.99) 39 250
42
(17, 17.99) 42 250
34
(18, 18.99) 34 250
19
(19, 19.99) 19 250
14
(20, 20.99) 14 250
10
(21, 21.99) 10 250
4
(22, 22.99) 4 250
3
(23, 23.99) 3 250
0
(24, 24.99) 0 250
=0
1
(25, 25.99) 1 250
Total 250 1
9
largo de la tabla y nos hace perder algo de simplificacin que es la
razn de la agrupacin. Como regla prctica se acostumbra tener
un nmero de clases entre 10 y 20.
3.1.4 EJEMPLO:
Consideremos la siguiente tabla de frecuencias:
10
A partir de ella construmos la tabla de frecuencias acumuladas:
11
la media observada ser:
1 X
N
_
x= xi
N i=1
Esta frmula slo es aplicable cuando se ha conservado la muestra bruta.
Si hemos perdido los datos originales y disponemos solamente de una tabla
de frecuencias, identificamos todos las observaciones correspondientes a una
clase con un valor nico, denominado marca de clase,(en general se toma
como marca de clase el punto medio del intervalo de clase); es decir, si yi
fi
es la marca de de la isima clase, fi la frecuencia de esta clase y i = N
la frecuencia relativa de esta clase, podemos calcular la media observada
mediante la frmula:
1 X X
M M
_
x= yi fi = yi i .
N i=1 i=1
1 X
N
2 _ 2
s = xi x
N i=1
12
Algunas veces se prefiere trabajar con la varianza centrada, (como veremos
ms adelante tiene buenas propiedades), definida como
1 X
N
_ 2
s21 = xi x
N 1 i=1
Note que
N 1 2
s2 = s1
N
as, si N , s2 = s21 .
La desviacin estndar observada es s y la centrada es s1. Cuando no
disponemos de la muestra bruta y en su lugar contamos con la tabla de
frecuencias, calculamos las varianzas de manera anloga al caso de la media,
mediante las frmulas:
1
P
M _ 2 P
M _ 2
s2 = N
fi yi x = i yi x
i=1 i=1
1
PM _ 2 N
P
M _ 2
s21 = N1
fi yi x = N1
i yi x
i=1 i=1
1
P
N _2
s2 = N
x2i x
i=1
2 1
PN
2
_2
s1 = N1 xi N x
i=1
13
caen en el intervalo ( 2, + 2) y el 99, 74% de las observaciones caen
en el intervalo ( 3, + 3) .
De esta propiedad se obtiene la llamada regla emprica que se verifica
en los casos en que el histograma correspondiente a las observaciones tiene
forma de campana:
La Regla Emprica:
Dada una distribucin de observaciones que es aproximadamente acam-
panada, el intervalo
EJEMPLOS:
1. Si obsevamos la tabla de datos correspondiente a la medida de la re-
sistencia a la compresin de 70 cilindros de concreto, obtendremos:
_
x = 3010, 8857
s = 133, 84112
s1 = 134, 80794
_
x es una buena medida de la media
_
o centro de los datos ya que 37
observaciones son menores que x y 33 mayores. En el intervalo
_ _
x s, x + s = (2887, 04458; 3144, 72682)
_
se encuentran 44 observaciones de las 70 observadas. En este caso x y
s describen los datos adecuadamente.
2. La siguiente tabla o muestra bruta , representa el ingreso anual en miles
de dlares de 42 familias en un pueblo de E.E.U.U. (1977).
14
En la siguiente tabla de frecuencia correspondiente a esta muestra, se
observa enseguida que el comportamiento de los datos es mucho ms
errtico que en la tabla anterior:
Clases($) Frecuencia Absoluta Frecuencia Relativa
6
(100, 10000) 6 42
= 1/7 = 0, 1429
(10000, 20000) 13 13/42 = 0, 3095
(20000, 30000) 11 11/42 = 0, 2619
(30000, 50000) 5 5/42 = 0, 1190
(50000, 160000) 7 7/42 = 0, 1667
Si se representan estos datos en un histograma de frecuencias obser-
varn que no es simtrico alrededor de ningn punto ya que tiene una
cola larga hacia la derecha ( sesgado hacia la derecha). Para estos datos
_
x = 37, 28$
s = 41, 35
este promedio no es un valor particularmente
_
tpico, de hecho, 32
_
de
los 42 datos son menores que x y slo 10 son mayores, es decir, x no
es una buena medida de centramiento; el histograma tiene este gran
sesgo a la derecha, ( empuje del promedio a la derecha) de tal manera
que 75% de las observaciones quedan a la izquierda del promedio. La
diferencia grande entre los datos ejerce una gran influencia en el valor
del promedio y lo hacen tener un valor no centrado, al igual que hace
crecer la desviacin estndar.
En resumen,_
para datos fuertemente sesgados (a la derecha o a la
izquierda) x, s s1 pueden no ser los parmetros que describan el cen-
tro y dispersin de los datos, en este caso es conveniente definir otras
medidas de centramiento.
15
3.2.4 Coeficiente de Variacin o coeficiente de dispersin de la
muestra:
El coeficiente de dispersin de la muestra observada expresa la magnitud de
la dispersin con respecto a su media:
s s1
_ o altenativamente _
x x
1 X X
M M
_ n _ n
Mn = fi yi x = i yi x
N i=1 i=1
16
una muestra observada, representamos por
x(1) , x(2) , x(3) , , x(N)
el mismo conjunto de datos ordenados de mayor a menor, es decir:
x(1) x(2) x(3) x(N )
Una nueva medida del centro del conjunto de datos est dada por la mediana
m que es el valor central o promedio de los valores centrales de la muestra
ordenada, es decir:
(
x( N +1 ) si N es impar
m= x( N 2) + x( N +1)
2
2
2
si N es par
Si ordenamos la tabla de sueldos del ejemplo anterior, de menor a mayor,
como n = 42,
x(21) + x(22) 20, 6 + 21, 2
m= = = 20, 9
2 2
m es una mejor medida del centro de los datos cuando estos son sesgados
hacia un lado, m tiene la propiedad de que prcticamente la mitad de los
datos est por debajo de m y la mitad por encima, de modo que en este
sentido es una buena representacin del centro.
Geomtricamente, la mediana es el valor de la abcisa que corresponde
a la vertical que divide el rea encerrada por un histograma en dos partes
iguales.
OBSERVACIN: La mediana de una variable aleatoria X es el punto
x R tal que
1
P (X > x) = P (X x) = .
2
Cuando los datos estn agrupados en una tabla de frecuencias, podemos cal-
cular aproximadamente la mediana de la muestra observada mediante un
mtodo que describiremos a continuacin (ste no es el nico mtodo, dis-
tintos mtodos nos llevan a resultados diferentes, pero todos son valores
aproximados de la mediana): Sea N el nmero de observaciones
1. Elegimos un intervalo de clase [ek , ek+1 ] tale que
X
k1
N X
k
N
fi , fi >
i=1
2 i=1 2
donde fi representa la frecuencia del intervalo [ek , ek+1 ] .
17
2. Supondremos que las observaciones que caen en el intervalo [ek , ek+1 ] , estn
uniformemente distribudas en dicho intervalo, es decir, si fk es el
nmero de observaciones en dicho intervalo y lo subdividimos en fk subintervalos
de igual longitud
ek+1 ek
Lk =
fk
supondremos que en cada subdivisin hay una sola observacin:
X
k1
N +1
fi + k0 = .
i=1
2
18
Observe que
N N
2
+ 1, si N es par
+1 = N+1
2 2
, si N es impar
donde [x] es parte entera de x.
X
k1
N X k
N
fi = 125, fi > = 125
i=1
2 i=1
2
3.2.8 PERCENTILES:
Como extensin de la idea de mediana ( que divide los datos en dos partes
iguales) podramos pensar en aquellos valores que dividen a los datos en
cuatro partes iguales aproximadamente, representados por Qi , i = 1, 2, 3; los
19
cuales se llaman primero, segundo tercer cuartil, respectivamente, claramente
Q2 es la mediana.
Si denotamos por Q1 = x0.25 , Q2 = x0.50 , Q3 = x0.75 la notacin nos dice el
significado de cada uno de ellos, as, x0.25 es un valor tal que aproximadamente
el 25% de las observaciones estn a su izquierda, similarmente para los otros
casos.
Anlogamente, los valores que dividen los datos en diez partes iguales se
llaman deciles:
Pp = x( pN +1)
100
Pp = x([ pN +1])
100
20
(a) Elegimos un intervalo de clase [ek , ek+1 ] tale que
X
k1
pN X
k
pN
fi , fi >
i=1
100 i=1 100
donde fi representa la frecuencia del intervalo [ek , ek+1 ] .
(b) Supondremos que las observaciones que caen en el intervalo [ek , ek+1 ] , estn
uniformemente distribudas en dicho intervalo, es decir, si fk es el
nmero de observaciones en dicho intervalo y lo subdividimos en
fk subintervalos de igual longitud
ek+1 ek
Lk =
fk
supondremos que en cada subdivisin hay una sola observacin.
(c) Calculamos k0 tal que
X
k1
pN
fi + k0 = +1
i=1
100
entonces, elegimos Pp en el intervalo
ek+1 ek ek+1 ek
ek + (k0 1) , ek + k0 .
fk fk
21
Clculo de la Moda: el intervalo donde hay ms observaciones es (51, 60) , tomamos
como moda el valor
60 + 51
= 55.5
2
Clculo de la mediana: N = 1350, N2 = 675, N2 + 1 = 676 :
N
2 + 15 + 75 + 150 + 302 = 544 < 2
= 675
544 + 352 = 896 > 675, k = 6
Consideramos el intervalo de clase [51, 60] , para facilitar los clculos tomamos
en su lugar el intervalo [50, 60] de longitud 10
m = 53.73
P12 = 34.70
22
3.3 Estadstica Descriptiva (Dos Variables): Mnimos
Cuadrados.
En muchos problemas obtenemos datos pareados (xi , yi ), no conocemos la dis-
tribucin conjunta de las variables aleatorias correspondientes y al graficar
estos datos tenemos la impresin de que una recta podra ser un buen ajuste
para ellos, aunque los puntos no estn exactamente sobre una recta. Los
problemas de este tipo, suelen manejarse por medio del mtodo de los mni-
mos cuadrados que consiste en hallar la recta
y = ax + b
que mejor se ajusta a esos datos, para ello debemos calcular los parmetros
a y b a partir de los datos, es decir:
Si nos dan un conjunto de datos pareados {(xi , yi ); i = 1, 2, 3, , n} , las
estimaciones de mnimos cuadrados de los coeficientes a y b son los valores
para los cuales la cantidad:
X
n
q(a, b) = [yi (a + bxi )]2
i=1
q P
n
a
= (2) [yi (a + bxi )] = 0
i=1
q Pn
b
= (2) xi [yi (a + bxi )] = 0
i=1
23
donde :
2
P
n _
2
P
n
1
P
n
Sxx = (xi x) = x2i n
xi
i=1 i=1 i=1
Pn _ _ P
n
1
P
n P
n
Sxy = (xi x)(yi y) = xi yi n
xi yi
i=1 i=1 i=1 i=1
3.3.1 EJERCICIO:
Consideremos los siguientes datos acerca del nmero de horas de estudio de
10 personas para presentar un examen de ingls y sus calificaciones obtenidas
en base a 100 puntos:
Horas de estudio (x) Calificacin en la prueba (y)
4 31
9 58
10 65
14 73
4 37
7 44
12 60
22 91
1 21
17 84
Grafique los datos y halle la ecuacin de la recta que mejor se ajusta a estos
datos, usando el Mtodo de Mnimos Cuadrados.
3.4 Correlacin:
Recuerde que si X e Y son dos variables aleatorias, el coeficiente de cor-
relacin de ellas se define como:
Cov(X, Y )
= p
V ar(x)V ar(Y )
este valor est en el intervalo [1, 1] y mide en cierto sentido el grado de de-
pendencia lineal entre las variables, si = 1, con porbabilidad uno, existe
una dependencia lineal perfecta entre las variables. Si las variables son inde-
pendientes = 0, el recproco es falso, salvo cuando la distribucin conjunta
de las variables es normal.
24
El coeficiente de correlacin observado correspondiente a dos muestras
aleatorias de X e Y respectivamente es:
P
n
(xi x)(yi y)
i=1
r=r
P
n P
n
(xi x)2 (yi y)2
i=1 i=1
En la prctica para tener una idea estimada del grado de correlacin de dos
variables, se utilizan los llamados diagramas de dispersin nubes de puntos,
que son los puntos correspondientes a los pares (xi , yi ) , que representan las
observaciones de ambas variables, representados en un plano cartesiano. Si
r = 0 no existe relacin lineal entre las variables, si r < 0 y cercano a
1, existe cierta correlacin lineal entre las variables y la mejor recta que
aproxima los datos tiene pendiente negativa ( es decreciente).
1X
n
card {i : xi B}
Pn (B) = Ixi (B) =
n i=1 n
25
DEFINICIN: Sea X una variable aleatoria de funcin de distribucin
F (x), X1 , , Xn es una sucesin de variables aleatorias independientes con
la misma dostribucin que X, definamos
1X
n
card {i : Xi x}
Fn (x) = IXi ((, x]) =
n i=1 n
1X
n
card {i : Xi x}
Fn (x) = I(,x] (Xi ) =
n i=1 n
donde
1 si Xi x
I(,x] (Xi ) =
0 si Xi > x
26
las funciones Fn y F est representada por la expresin sup |Fn (x) F (x)| ,
xR
el teorema de Glivenco-Cantelli nos dice que esta expresin tiende a cero
cuando n , para casi todo , es decir, el conjunto donde no hay
convergencia tiene probabilidad cero.
Teorema 2: Si n
c.s
sup |Fn (x) F (x)| 0, n
xR
Ak = { : Fn (zk ) F (zk ), n }
T
N
por el teorema 1, P(Ak ) = 1. Sea A = Ak , tambin P(A) = 1. Si A,
k=0
existir n() : si n n()
de donde
sup |Fn (z) F (z)| 2, si n n()
z
27
con probabilidad uno.
28
Estadstica Descriptiva.
Estadstica
Prctica No 1
13 5 13 37 10 16 2 11 6 12
8 19 21 12 11 7 7 9 16 18
3 11 19 6 15 10 14 10 7 24
11 3 6 10 4 6 32 9 12 7
29 12 9 10 8 20 15 5 17 10
Utilice las seis clases: 0-4, 5-9, 10-14, 15-19, 20-24, 25 mayor para
construir una tabla de frecuencias absolutas y relativas. Dibujar el
histograma. Construir la tabla de frecuencias acumuladas. Encontrar
media muestral, desviacin estandard, moda, mediana y cuartiles. Se
cumple la regla emprica?
(a) media
(b) s2
(c) la mediana
(d) la moda
(e) los cuartiles.
(f) Se cumple la regla emprica?
3. Demuestre que
X
n
_
(xi x) = 0
i=1
1
4. Si los datos se codifican de tal manera que xi = cui + a, demuestre que
_ _
x = cu + a, sx = csu
2
(c) En base al histograma de la parte a), qu distribucin sospecha
Ud. que podra tener la variable aleatoria T = tiempo de vida de
un motor del tipo considerado?
(d) Calcule aproximadamente, la media, desviacin y mediana de es-
tos datos.
9. La siguiente tabla muestra las ventas (en miles de unidades) de una pe-
quea empresa de componentes electrnicos durante los ltimos 10 aos.
Ao 1 2 3 4 5 6 7 8 9 10
Ventas 2, 6 2, 85 3, 02 3, 45 3, 69 4, 26 4, 73 5, 16 5, 91 6, 5
3
(a) Sea X = ao y Y = ventas. Grafique la nube de puntos (xi , yi ) .
(b) Sea X = ao y Y = ln(ventas). Grafique la nube de puntos
(xi , yi ) .
(c) A cul de las dos nubes anteriores cree Ud. que se ajusta mejor
una recta?
(d) Calcule las dos rectas de regresin y grafquelas.
Semestre Abril-Julio2004/MMOM.
4
REPASO DE DISTRIBUCIONES DE PROBABILIDADES
Estadstica
Prctica No 2
6. Una fbrica utiliza un producto cuyo uso diario puede modelarse por
medio de una distribucin exponencial de parmetro 4 (esto es, la can-
tidad de producto utilizada en un da es una variable aleatoria expo-
nencial de parmetro = 4, medida en toneladas). Cuntas toneladas
de producto debe almacenar la fbrica para que la probabilidad de
quedarse sin producto en un da dado sea slo 0, 05?.
1
7. Un defecto metablico ocurre en aproximadamente 1 de cada 100 nacimien-
tos. Si en un hospital nacen 4 nios en un da dado, calcule:
2
Repaso de Desigualdad de Tchebyshe,
Distribucin Normal, Teorema Central del Lmite.
Estadstica
Prctica No 3
R, > 0
Demuestre que
1
6. La vida activa de un cierto frmaco sigue una distribucin N(1200, 40)
das. Se desea enviar un lote de medicamentos, de modo tal que la vida
media del lote no sea inferior a 1180 das con probabilidad 0, 95. Qu
tamao debe tener la muestra?
2
(c) Suponga que los estudiantes cuyas notas se encuentran en el 10%
superior de la distribucin sern admitidos inmediatamente. Cul
debe ser la nota mnima que debe tener un estudiante para ser
admitido inmediatamente?
3
Captulo II
Inferencia Estadstica:
Estimacin Puntual de Parmetros.
Mara Margarita Olivares M.
Abril 2004
1 INTRODUCCIN:
Cuando se realiza un experimento aleatorio, los posibles resultados de dicho
experimento se pueden pensar como una variable aleatoria.
En general, un material estadstico consiste en un nmero de observa-
ciones x1 , x2 , , xN , obtenido a partir de N repeticiones independientes del
experimento aleatorio relacionado con X. La estadstica descriptiva reduce el
material observado o muestra bruta, reemplazndolo por cantidades relati-
vamente pocas en nmero que representen el material total y que contengan
toda la informacin posible de la variable aleatoria X.
En el material estadstico raramente podemos incluir todas las obser-
vaciones que podramos realizar tericamente, por lo que este material se
puede considerar como una muestra aleatoria simple o como una sucesin de
variables aleatorias independientes, todas con la misma distribucin, la cual
est sujeta a fluctuaciones estadsticas ya que se obtendran valores distintos
x01 , x02 , , x0N , si realizramos N nuevas observaciones.
Es decir, antes de realizar el experimento, los valores de X que se van a
observar deben concebirse como N variables aleatorias
X1 , X2 , , XN ,
1
El objetivo de la estadstica es hacer inferencia acerca de una poblacin
basndose en la informacin contenida en una muestra, por ejemplo, tomar
decisiones sobre la distribucin de probabilidad de la variable aleatoria X y
describir esa distribucin basndose en la observacin de esta variable aleato-
ria. Puesto que las distribuciones se caracterizan por medidas descriptivas
numricas, llamadas parmetros, la estadstica se interesa en hacer inferen-
cia acerca de los parmetros de las distribuciones de probabilidad. Algunos
parmetros tpicos son la media, la desviacin estndar, el rea bajo la dis-
tribucin de probabilidad a partir de un valor de la variable aleatoria o el
rea entre dos valores de la variable.
Algunos ejemplos pueden aclarar esta idea:
x1 , x2 , , xN ,
2
estimamos los valores numricos de los parmetros de F, estos estimadores
empricos de los parmetros tericos son a su vez variables aleatorias y como
tales estn sujetos a fluctuaciones estadsticas. Para tener una medida de la
magnitud esperada de estas fluctuaciones y por lo tanto de la confianza que
podemos depositar en los valores encontrados para los parmetros a partir
de las observaciones, debemos deducir a partir de F , las distribuciones de
nuestros estimadores.
As pues, antes de que podamos resolver un problema estadstico dado,
debemos, en primer lugar, establecer una hiptesis sobre la forma matemtica
de la funcin de distribucin F.
A veces, por experiencias anteriores, se sabe que podemos suponer una
determinada distribucin, por ejemplo, la distribucin normal. O bien, a
partir de ciertas hiptesis que idealizan el experimento considerado podemos
deducir su distribucin, basndonos en las reglas conocidas de la teora de
probabilidad. Por ejemplo, cuando se cuenta el nmero de partculas que
se observan en una pantalla, emitidas por una sutancia radioactiva durante
un tiempo t, bajo ciertas hiptesis simplificativas, podemos suponer que la
distribucin es de Poisson de parmetro t y justamente es el parmetro
el valor que debenos estimar a partir de las observaciones.
1.1 DEFINICIONES:
1.1.1 MUESTRA ALEATORIA SIMPLE:
Es un vector aleatorio
X = (X1 , X2 , , XN )
cuyas componentes son variables aleatorias independientes, idnticamente
distribuidas, siendo N el tamao de la muestra.
3
EJEMPLOS DE ESTADSTICOS:
1 X
_ N
1
X= (X1 + X2 + + XN ) = Xi
N N i=1
1 X
N _
2
S = (Xi X)2
N i=1
1 X
N _
S12 = (Xi X)2
N 1 i=1
1.1.3 OBSERVACIN:
La distribucin de estos estadsticos est determinada por la distribucin
terica F de la variable aleatoria X.
1.2 ESTIMADOR:
Un estimador paramtrico o para simplificar, diremos simplemente, un esti-
mador, es un estadstico cuyo valor observado intentamos usar para estimar
el valor de un parmetro desconocido de la distribucin terica. (El enfoque
paramtrico supone que la forma del modelo es conocida).
La media muestral y la varianza muestral aleatorias, como lo indica sus
nombres, son estimadores de la media y la varianza de la distribucin terica.
TN = T (X1 , X2 , , XN )
4
esto puede hacerse, por ejemplo, exigiendo que se cumplan condiciones tales
como:
P (|T (X1 , X2 , , XN ) | > ) <
para valores pequeos de > 0, > 0; o bien que
E |T (X1 , X2 , , XN ) |k < c
E (T (X1 , X2 , , XN )) =
Tn = T (X1 , X2 , , Xn )
5
una sucesin de estimadores de , que representan a T con base en la
muestra de tamao n.
Se dice que T es un estimador consistente si:
EJERCICIOS:
_ P
N
1 1
E X = N
E (Xi ) = N
N =
i=1
_
1
PN
1 2
V ar(X) = N2
V ar (Xi ) = N2
N 2 = N
i=1
6
N
Puesto que S12 = N1 S 2 , podemos calcular E (S 2 ) y deducir de all la
N
E (S12 ) = N1 E (S 2 ) . Para calcular E (S 2 ) , supongamos que:
o equivalentemente
X
N X
N _ _
2
(Xi ) = (Xi X)2 + N(X )2
i=1 i=1
7
entonces la varianza muestral centrada o corregida ser
1 X 2
N
S12 = e
N 1 i=1 i
_
cuando N = 1, x = x1 y antes de tomar la muestra podemos afirmar
que e1 = 0. No _
hay ningn grado de libertad. Si N = 2, tendremos
que e1 = x1 x = x1 x1 +x2
2
= x1 x
2
2
= e2 . Hay solamente un grado
de libertad e1 (o e2 ). Dado un residuo el otro queda automticamente
fijado. En general, para cualquier tamao muestral
X
N
_ X
N
xi x = ei = 0
i=1 i=1
8
1.4 Mtodo de Mxima Verosimilitud.
El mtodo general ms importante para hallar estimadores de los parmetros
desconocidos de una distribucin terica se conoce con el nombre de mtodo
de mxima verosimilitud introducido por R. A. Fisher. Es un mtodo sis-
temtico que permite hallar estimadores puntuales de cualquier nmero de
parmetros desconocidos de una distribucin.
9
1. En el caso de densidad, si f (x; ) es la densidad de X, y x1 , x2 , , xN
representa la muestra observada, se tendr que
L(x1 , x2 , , xN ; ) = f (x1 ; ) f (x2 ; ) f (xN ; )
2. En el caso discreto, si g(x; ) = P (X = x) es la funcin de probabilidad
de X, si x1 , x2 , , xN representa la muestra observada, 1 , 2 , , r
con 1 r N son los valores distintos observados y f1 , f2 , , fr , son
Pr
las frecuencias respectivas, con fi = N, se tendr que
i=1
f1 f2 fr
L(x1 , x2 , , xN ; ) = g( 1 ; ) g( 2 ; ) g( r ; )
EJEMPLOS:
10
tomando logaritmo neperiano:
N 1
P
N
l(, ) = ln L( x; , ) = N ln 2
ln(2) 2 2
(xi )2
i=1
l(,) 1
P
N
1
P
N _
= 2
(xi ) = 0 = N
xi = x
i=1 i=1
l(,) P
N P
N _
= N + 1
23
(xi )2 = 0 2 = 1
N
(xi x)2 = s2
i=1 i=1
1 X 1 X
N N
_ _
= xi = x, 2 = (xi x)2 = s2
N i=1 N i=1
_
encontrados, entonces concluimos que x y s2 realizan un mximo de
l(, ).
11
Al graficar la funcin L como funcin del parmetro b, se observa que
el valor mximo se realiza en el valor
b = max xi
en este punto L no es derivable.
3. Estimador de mxima verosimilitud del parmetro > 0 de la dis-
tribucin de Poisson, basado en una muestra x1 , x2 , , xN : Si X tiene
distribucin de Poisson, su rango es
{0, 1, 2, , k, (k + 1), } ,
de estos valores solo un nmero finito estar representado en la mues-
tra x1 , x2 , , xN . Sea r = max xi , entonces los valores 0, 1, 2, , r,
estarn representados en la muestra con frecuencias , fi , 1 i r,
respectivamente, donde fi puede ser eventualmente cero para algn
1 i r, verifican:
Xr
fi = N.
i=1
Derivando el logaritmo neperiano de la funcin de verosimilitud e igua-
lando a cero, se obtiene:
Qr i fi Pr i
e
L(x1 , x2 , , xN ; ) = i!
, l() = ln L( x; ) = fi ln ei!
i=0 i=0
l() P r i 1
P r Pr
= f i
1 = 0
ifi = fi = N
i=0 i=0 i=0
1
P
r
1
P
r _
de donde: = N
ifi = N
xi = x.
i=0 i=0
12
Es decir, la frecuencia relativa observada es el estimador de mxima
verosimilitud de la probabilidad de que ocurra el suceso A.
13
Si sta no es suficiente, se agrega la que corresponde al momento de tercer
orden, y as sucesivamente, hasta determinar una solucin nica, si sto es
posible.
1.5.1 EJEMPLOS:
1. Distribucin uniforme en [0, b] , con b > 0 desconocido: como por ejem-
plo
La densidad es 1
b
,x [0, b]
f (x; ) =
0, si no.
Tenemos que resolver la ecuacin:
1 X
N _
E (X) = Xi = X
N i=1
Z Zb
1 b
E (X) = xf (x; )dx = xdx = .
b 2
0
Igualando obtenemos:
b _ _
= X, tomamos b = 2X
2
El estimador b de b, es insesgado, pues
_ 2 X
N
2 b
E b = 2E X = E (Xi ) = NE (X) = 2 = b.
N i=1 N 2
14
El error medio cuadrtico del estimador b, por ser en este caso inses-
gado, coincide con su varianza:
4 X
_ N
2
E (b b) = V ar(b) = V ar(2X) = 2 V ar (Xi ) =
N i=1
4 4 b2
V ar(X) =
N N 12
por ser X uniforme en [0, b] . Por lo tanto
b2
V ar(b) = 0 si N ,
3N
_
es decir, nuestro estimador b = 2X del parmetro desconocido b es
consistente.
Por el mtodo de mxima verosimilitud, obtuvimos como estimador del
parmetro b a b = max(X1 , X2 , , XN ). Veamos que este estimador no
es insesgado; como tenemos que hallar su esperanza, debemos calcular
antes su distribucin:
P b x = P (max(X1 , X2 , , XN ) x) =
P (X1 x, X2 x, , XN x) =
Q
N
P (Xi x) = (P (X x))N = (F (x; b))N
i=1
15
y derivando, obtenemos la densidad de b :
N N1
bN
x si x [0, b]
f (x) =
b 0 si no.
La esperanza de esta distribucin es:
N
E b = b,
N +1
es decir, este estimador del parmetro b no es insesgado, pero s lo es
asintticamente ya que
N
lim E b = lim E (max(X1 , X2 , , XN )) = lim b = b.
N N N N + 1
16
(b) Mtodo de lo Momentos: debemos resolver la siguiente ecuacin:
1 X
N
E (X) = Xi
N i=1
a) La distribucin exponencial.
b) La distribucin de Poisson.
F = F (x; )
17
la densidad conjunta de la muestra aleatoria evaluada en el punto
x = (x1 , x2 , , xN ).
Si
b() = E (T (X1 , X2 , , XN ) )
es el sesgo del estimador T del parmetro y calculamos su derivada, se
tendr
Z
0
1 + b () = E (T (X1 , X2 , , XN )) = T ( x)f ( x; )dx1 dx2 dxN
RN
Si admitimos que esta ltima integral se puede derivar bajo el signo de inte-
gral respecto al parmetro , obtenemos las siguientes igualdades:
R
1 + b0 () = RN T ( x) f ( x; )dx1 dx2 dxN =
R 1
f ( x ,)
RN T ( x)
f ( x; )dx1 dx2 dxN =
f ( x ;)
R
ln f (X,)
N T ( x)
R
f ( x; )dx1 dx2 dxN =
ln L() ln L()
E T (X) = E T (X) E lnL() =
ln L()
E T (X)
ln L()
puesto que E
= 0.
18
1.6.1 Desigualdad de Crmer-Rao:
Si todas las derivaciones bajo el signo de integral son vlidas ( es cierto
bajo la hiptesis de suficiente regularidad de la densidad f ), se cumple la
desigualdad:
" 2 # " 2 #
ln L()
2
(1 + b0 ()) E T (X) E ,
puesto que
h i R 2
1 2 L()
E L() 2 = RN 1 f(2x,) f ( x, )dx1 dx2 dxN =
f ( x ,)
R 2 f (
x ,)
R f (x ,)
RN 2
dx1 dx2 dxN = RN
dx1 dx2 dxN = 0
19
OBSERVACIONES:
1. La desigualdad de Crmer-Rao proporciona una cota inferior del er-
ror cuadrtico medio de un estimador. En particular, para los esti-
madores insesgados, proporciona una cota inferior para la varianza del
estimador. Esta cota inferior no tiene por qu ser alcanzada, pero si se
encuentra un estimador insesgado cuya varianza es:
" 2 !#1
ln L()
E
20
donde fi, 0 i r son las frecuencias de los valores 0, 1, 2, , r represen-
tados en la muestra x1 , x2 , , xN con max(x1 , x2 , , xN ) = r. Derivando
con respecto al parmetro e igualando a cero, obtenemos que el estimador de
mxima verosimilitud del parmetro es
1 X
_ N
=X= Xi ,
N i=1
1 X
_ N
E(X) = E(Xi ) = ,
N i=1
adems la cota de Crmer-Rao coincide con la varianza del estimador que es:
_
V ar(X) =
N
pues:
2 ! _
ln L() N2 2 N 2 _ N
E = 2 E X = 2 V ar(X) =
21
Sean X1 , X2 una muestra aleatoria con distribucin de Poisson de parmetro
. Consideremos el estadstico
T = 2X1 + X2
22
_
el estadstico T = X es suficiente para , defina
1 N t
(, t) = e ,t 0
N
h = 1
as
L = h(x1 , , xN )(, T (x1 , , xN ))
23
DISTRIBUCIONES DE PROBABILIDAD.
ESTADSTICA
PRCTICA N0 4
Y = X3
f (x, y) = h i
2 (y2 )2
1
2 1 2 1
exp 2(12 ) (x
1
2
1)
2(x1 )(y1 )
1 2
+ 22
1
(a) Sea
21 12
C=
12 22
la matriz de covarianza de X e Y, donde 12 = Cov(X, Y ). Calcule
la inversa de C.
1
(b) Verifique que
1 1 1 t
f (x, y) = exp zC z
2 1 2 1 2
donde z = ((x 1 ), (y 1 )) y z t es la traspuesta de z y C 1 es
la inversa de C.
(c) Calcule las densidades marginales de X e Y.
(d) Si X e Y son independientes, el coeficiente de correlacin es cero.
El recproco no es cierto, en general. Demuestre que si X e Y
tienen distribucin conjunta normal y = 0, entonces X e Y son
independientes.
y C 1 es la inversa de C.
2
6. Sea X una variable aleatoria con distribucin normal N(, 2 ).
7. Sea X una variable aleatoria N(0, 1). Y una variable aleatoria chi-
cuadrado (X 2 ) con n grados de libertad. Si X e Y son independientes,
definimos T como:
X
T = n .
Y
Demuestre que la densidad de T viene dada por:
( n+1
2
) 1
fT (t) = , t (, )
n(n/2) (1 + t2 ) n+1
2
n
3
La distribucin de T recibe el nombre de distribucin tStudent con
n grados de libertad ( o de parmetro n). Note que fT es simtrica
alrededor del origen (E (T ) = 0).
Sugerencia: calcule Ft (t) = P (T t) = P X tn Y , utilizando la
densidad conjunta de X e Y, luego derive respecto a t.
X = a1 X1 + a2 X2 + a3 X3 + + an Xn
X
n
2
= a1 1 + a2 2 + a3 3 + + an n , = a2i 2i
i=1
1 X
n _
2 nS 2
(Xi X) = .
2 i=1 2
4
Definamos las siguientes variables aleatorias:
Y1 = 112 (Z1 Z2 )
Y2 = 123 (Z1 + Z2 2Z3 )
Yn1 = 1 (Z1 + Z2 + Z3 + + Zn1 (n 1)Zn )
(n1)n
Pn
Yn = 1n Zi .
i=1
1
Pn _
(e) Sea S12 = n1
(Xi X) 2
i=1
i. Verifique que:
nS 2 (n 1)S12
=
2 2
ii. Sean _
(X ) (n 1)S12
X= n ;Y = .
2
Verifique que X es normal estndar e Y es X 2 con n1 grados
de libertad. Adems X e Y son independientes.
iii. Verifique que: _
X n 1X
n=
S1 Y
5
y deduzca de esta igualdad que la distribucin de
_
X
n
S1
es t student con (n 1) grados de libertad.
Abril-Julio 2004/MMOM
6
ESTIMADORES PUNTUALES
ESTADSTICA -PRCTICA No 5
1. Sea un estimador de un parmetro . Sea b el sesgo de , es decir,
b = E .
Demuestre que el error cuadrtico medio de es igual a:
V ar() + b2 .
2. Sean 1 y 2 dos estimadores insesgados de un parmetro tales que
V ar(1 ) = 21 , V ar(2 ) = 22
1
(c) Hallar la eficiencia relativa de 1 respecto a 5 , la de 2 y 3 re-
specto a 5 .
C = 3Y + Y 2
Demuestre que
E (C) = 4 + 2
(c) Obtenga una funcin de Y1 , Y2 , Y3 , , Yn , que sea un estimador
insesgado de E (C) .
2
(b) Sean:
1
P
n _
1
P
n _
S12 = n1
(Xi X)2 , S22 = m1
(Yi Y )2
i=1 i=1
(n1)S12 +(m1)S22
Sp = n+m2
U = a1 X1 + a2 X2 + a3 X3 + + an Xn
M.M.O.M./Abril 2004
3
Mtodos de Estimacin.
Estadstica
Prctica No 6
1. Dada una muestra aleatoria simple de tamao n de una variable aleato-
ria X, calcular el estimador de mxima verosimilitud y de los momentos
cuando X tiene las siguientes distribuciones:
1
6. Para determinar la verdadera proporcim p de artculos defectuosos
en un lote grande, se revisan uno tras otro artculos de ste, hasta
encontrar 10 defectuosos. Si tuvimos que revisar 168 artculos antes de
parar, cul es el estimador de mxima verosimilitud de p?
10. Una mquina se puede averiar por dos razones A y B. Se desea estimar
la probabilidad de avera diaria de cada tipo sabiendo que:
2
12. Sea f (x) = x1 , x (0, 1) . Hallar el estimador de mximo verosmil
para y verificar que es un estadstico suficiente.
MMOM/2004
3
Captulo III
Intervalos de Confianza
Mara Margarita Olivares
Mayo 2004
T (x1 , x2 , , xn ).
1
la tienda. Del conocimiento de este estimador no podemos responder por
ejemplo, la siguiente pregunta: ? podra la demanda media desconocida no
ser mayor a 250 ni menor a 150 unidades?, pues no se tiene alguna indicacin
del posible error en la estimacin puntual, por eso, no podemos responder
esta pregunta. El error en el estimado puntual se mide en trminos de la
variacin (varianza) muestral del correspondiente estimador.
_
Si por ejemplo, la desviacin estndar de la media X es 60 unidades,
_
valindonos del teorema central del lmite podemos argumentar que X tiene
una distribucin aproximadamente
_
N(, = 60), de aqu se deduce que
la probabilidad de que X se encuentre a dos desviaciones estndar de la
verdadera media es aproximadamente igual a 0, 95. Es decir, para n grande,
_
P X < 120 = 0, 95
o equivalentemente
_ _
P X 120 < < X + 120 = 0, 95
_
si sustituimos el valor de la media muestral x = 200 obtenido se tiene que
(80, 320) lo cual sugiere que la demanda podra
q ser tan grande como 250
_
y tan pequea como 150 unidades siempre que V ar(X) = 60.
_ _
Observe que X 120, X + 120 es un intervalo aleatorio y la probabil-
idad de que la verdadera media est all es de 0, 95. Si se obtuviesen 100
muestras del mismo tamao en forma repetida de una poblacin_
y para cada
muestra se calculan las madias observadas y sustituimos x en el intervalo
aleatorio debe esperarse que 95 de ellos contenagan el verdadero valor de la
media desconocida. El intervalo _ especfico
_ no es ms que una
(80, 320)
realizacin del intervalo aleatorio X 120, X + 120 en base a los datos de
_
una sola muestra en la cual sustituimos x _= 200. El
_
valor
de probabilidad
0, 95 se refiere slo al intervalo aleatorio X 120, X + 120 , es incorrecto
decir que la probabilidad de que (80, 320) es de 0, 95 pues aqu slo hay
constantes, nada es aleatorio, lo que se puede decir que con una confianza
de 0, 95 podemos decir que (80, 320) , lo cual es una alta confianza. Asi
que no es correcto escribir P (80 < < 320) = 0, 95, en algunos textos lo
escriben abusando del lenguaje probabilstico pero debe entenderse como se
explic arriba. De acuerdo a estas aclaratorias, el intervalo (80, 320) recibe
el nombre de intervalo de confianza del 95% para .
2
1.1.1 Definicin:
Intervalo de Confianza al nivel 1 para el parmetro construido a partir
de la muestra X1 , X2 , , Xn , es una pareja de estadsticos (T1 , T2 ), que
cumplan la propiedad:
1.1.2 Definicin:
Regin de confianza al nivel 1 para el parmetro construida a partir de
la muestra X1 , X2 , , Xn es una aplicacin C que a cada punto
x = (x1 , x2 , , xn ) Rn
asocia el subconjunto C( x) del espacio de parmetros, de modo que
P ( C(X1 , X2 , , Xn )) = 1
P (g(X1 , X2 , , Xn ; ) D) = 1
[ C(X1 , X2 , , Xn )]
3
1.1.4 Observaciones:
1. Si
C(X1 , X2 , , Xn ) = (T1 (X1 , X2 , , Xn ), T2 (X1 , X2 , , Xn )
es un intervalo de confianza para al nivel 1 a menudo se dice que
constituye un intervalo de confianza de 100(1 )% o con coeficiente
de confianza 100(1 )%.
2. El coeficiente de confianza 1 es un valor que elige el experimentador.
Suele tomarse = 0, 10 ( 0, 05 0, 01), es decir 100(1 )% ser 90%
respectivamente 95% 99%.
3. El coeficiente de confianza representa la probabilidad proporcin de
veces que los intervalos conocidos contendrn el verdadero valor de .
4. El valor desconocido es constante, mientras que los intervalos obtenidos
son aleatorios puesto que sus extremos dependen de la muestra aleatoria.
As, un intervalo de confianza del 95% ( una estimacin por intervalos
al nivel 0, 95) no es un intervalo fijo que contiene a con probabilidad
0, 95, sto no tendra sentido pues si el intervalo es fijo el parmetro es-
tar o no en l ( la probabilidad sera cero uno). Luego, al evaluar los
extremos del intervalo a partir de la muestra observada x1 , x2 , , xn ,
lo que podemos decir es que si se repitieran las n observaciones varias
veces al menos el 95% de las veces acertaremos, es decir, estar en el
intervalo obtenido.
5. Si podemos elegir entre varios mtodos que dan lugar a diferentes in-
tervalos de confianza para un parmetro desconocido , trataremos de
elegir el que nos proporcione el intervalo de menor longitud.
6. Si hay varios parmetros desconocidos hallaremos regiones de confianza
o intervalos de confianza para cada uno de ellos.
4
Para un nivel de confianza 1 consideremos el estadstico:
_ _
(X ) (X )
Z= = n
/ n
el cual tiene distribucin normal N(0, 1). Sea z 2 el valor tal que si Z es
normal estndar satisface:
P Z > z 2 = .
2
Si es conocido podemos buscar este valor en la tabla de la distribucin
normal. Puesto que la distribucin normal es simtrica alrededor del origen,
se tiene que :
P Z < z 2 = ,
2
por lo tanto
P z 2 < Z < z 2 = 1
Si sustituimos el valor de Z en la expresin anterior y despejando , obten-
dremos: _
_
P X z 2 < < X + z 2 = 1
n n
es decir, con probabilidad 1 , se encuentra en el intervalo aleatorio
_ _
X z2 ,X + z2 ;
n n
5
1.2.2 Ejemplos:
1. A partir de una muestra aleatoria simple X1 , X2 , , Xn de la distribu-
cin N(, 1) construir un intervalo de confianza para al nivel 95%
siendo la media observada
_
x = 3, 05; n = 100.
I = (2.85, 3.25)
6
y lo que se quiere es que
_
X ( 0.20, + 0.20)
1 X 1X
n n
_ _
S12 = (xi x)2 , S 2 = (xi x)2 .
n 1 i=1 n i=1
Tn1 = (SX)
1/ n
n
E (Tn1 ) = 0, V ar(Tn1 ) = , lim V
n2 n
ar(Tn1 ) = 1.
7
Usaremos una notacin anloga al caso anterior, llamando tn1, 2 el valor tal
que si Tn1 es tStudent con n 1 grados de libertad
P Tn1 > tn1, 2 = .
2
entonces se tendr que
_
(X)
P tn1, 2 < S1 / n < tn1, 2 = 1
_ _
P X S1n tn1, 2 < < X + S1n tn1, 2 = 1
1 X
n _
2 (n 1)S12
(Xi X) = ,
2 i=1 2
8
de aqu se deduce que a = x2n1,1 , b = x2n1, . As tendremos:
2 2
2 (n 1)S12 2
P xn1,1 < < xn1, = 1
2 2 2
despejando 2 obtenemos:
!
(n 1)S12 (n 1)S 2
1
P < 2 < =1
x2n1,1 x2n1,
2 2
n
al nivel 1 . Si queremos estimar 2 con S 2 en lugar de S12 = n1
S2,
obtendremos el intervalo:
!
nS 2 nS 2
, .
x2n1,1 x2n1,
2 2
9
Se extrae una muestra aleatoria de n1 observaciones de la primera poblacin
y una muestra aleatoria de n2 observaciones de la segunda poblacin y se
supone que las muestras se extraen independientemente.
Sean X1 , X2 , , Xn la muestra alatoria de la primera poblacin con
distribucin N(1 , 1 ) y Y1 , Y2 , , Yn _la muestra
_
alatoria de la segunda
poblacin con distribucin N(2 , 2 ) , X Y es un estimador puntual de
1 2 , insesgado pues:
_ _ _ _
E X Y = E(X) E(Y ) = 1 2
y consistente, pues
_ _ _ _ 21 22
V ar(X Y ) = V ar(X) + V ar(Y ) = + 0, n1 , n2 .
n1 n2
10
1.4.2 Ejemplo:
Se compara la calidad de dos tipos de neumticos para automviles probando
muestras de n1 = n2 = 100 neumticos de cada tipo. Para sto se observa
el nmero de kilmetros recorridos hasta que se produce un desgaste que se
define como una cierta cantidad de desgaste. Se supone 21 = 1.400.000, 22 =
1.960.000 ambos conocidos y que la distribucin
_
de los recorridos
_
es normal.
Como resultados de las pruebas se obtuvo x = 26.400Kms., y = 25.100Kms.
Estimemos mediante un intervalo de confianza de 0.99 la diferencia de las
medias:
1 = 0.99, = 0.01, 2 = 0.005, z 2 = 2, 5758
q _ _
21 22
n1
+ n2
= 183, 0303; X Y = 1300
As obtenemos como intervalo para 1 2
(827, 8481; 1772, 1519)
_ _
al estimar 1 2 por X Y se comete un error de estimacin de
s
21 22
z 2 + = 472, 1519Kms.
n1 n2
1 = 2 = , X1 , X2 , , Xn e Y1 , Y2 , , Yn
son dos muestras independientes de distribuciones N(1 , 1 ) y N(2 , 2 ) respectivamente,
consideramos el estadstico:
_ _
X Y (1 2 )
T = q
1
n1
+ n12 Sp
con
(n1 1)S12 + (n2 1)S22
Sp2 =
n1 + n2 2
siendo n n
1 X 1 _ 1 X 2 _
S12 = (Xi X)2 , S22 = (Yi Y )2 .
n1 1 i=1 n2 1 i=1
11
El estadstico T tiene distribucin t Student con n1 + n2 2 grados de
libertad. Un intervalo de confianza para 1 2 , en este caso se obtiene
haciendo:
P tn1 +n2 2 , 2 T tn1 +n2 2 , 2 = 1
donde
P Tn1 +n2 2 tn1 +n2 2 , 2 = .
2
Despejando 1 2 obtenemos:
_ _ q _ _ q
P X Y Sp tn1 +n2 2 , 2 n11 + n12 1 2 X Y + Sp tn1 +n2 2 , 2 n11 + 1
n2
=
1
1.4.4 Observacin:
Si n es grande (n 30), las tablas de la distribucin t con n grados de
libertad dan la aproximacin normal. De all que si n1 + n2 2 30, resolver
el problema para 1 = 2 = desconocido es equivalente a usar el intervalo
de confianza para 1 2 con 1 y 2 conocidos e iguales estimndolo con Sp
que es un estimador insesgado de . Observe que
r s
1 1 Sp2 Sp2
Sp tn1 +n2 2 , 2 + = tn1 +n2 2 , 2 +
n1 n2 n1 n2
12
se denomina distribucin F o de Snedeccor.
Se deja como ejercicio, utilizar las tcnicas conocidas del curso de proba-
bilidades para demostrar que la densidad viene dada por:
n1 n1
n1 +2 n2 n1 2 z 2 1
fF (z) = n1 n2 n1 +2 n2 , si z 0
2 2 n2 n1 z
1 + n2
P Fn1 ,n2 fn1 ,n2; =
1 = P Fn1 ,n2 fn1 ,n21; = P Fn2 ,n1 fn ,n1 =
1 21;
1 P Fn2 ,n1 fn ,n1 , por lo tanto P Fn2 ,n1 fn ,n1 =
1 21; 1 21;
1
de donde se concluye que fn1 ,n21; = fn2 ,n1 ;
1
1.5 Intervalo de confianza para 2 cuando 1 y 2 no se
conocen:
Consideramos el estadstico
2
S1
(n1 1)
S12 2
1
21 (n1 1)
Fn1 1,n2 2 = S22
= 2
S2
(n2 1)
22 2
2
(n2 1)
13
que tiene distribucin F con parmetros n1 1 y n2 1 (del numerador y
S2
del denominador respectivamente), pues (n1 1) 12 tiene distribucin Chi-
1
S2
cuadrado con n1 1 grados de libertad y (n2 1) 22 tiene distribucin Chi-
2
cuadrado con n2 1 grados de libertad donde S12 y S22 son independientes. Se
obtiene el siguiente intervalo de confianza para el cociente de las varianzas
21
22
:
!
S12 1 S12
I= , fn2 1,n1 1, 2
S22 fn1 1,n2 1, 2 S22
1
al nivel 1 , donde fn2 1,n1 1, 2 = f y
n1 1,n2 1,1
2
2
S1
21
P fn1 1,n2 1,1 2 < S22
< fn1 1,n2 1, 2 = 1
22
14
es aproximadamente normal estndar.
y de aqu:
s s
_ _
p(1 p) p(1 p)
P X z 2 < p < X + z 2 =1
n n
15
El intervalo obtendo al (1 )100% de confiabilidad, viene dado por:
s s
_
p(1 p) _ p(1 p)
I = X z 2 , X + z 2
n n
_ _
donde p = x. El error que se qcomete al estimar p = X, que es la frecuencia
p(1 p)
relativa de xitos es de z 2 n
, donde z 2 verifica:
P Z > z 2 =
2
si Z tiene distribucin normal estndar.
16
y despejando el parmetro desconocido:
r r !
_ _
P X z 2 < < X + z 2 =1
n n
1.6.6 Ejercicio:
Hallar un intervalo para la media de la distribucin exponencial de parmetro
1
, es decir, de densidad:
1
x
e ,x >0
f (x) =
0 si no.
Si R() = E y Y =
obtenemos que
R()
1 2 1 2
E Y = , pues E Y =1
2 2
de aqu se obtiene
1
P 1 2
R()
18
La densidad de es:
(
nn+1 xn1 n+1
(n+1)n n
,0 x n
f (x) =
0 si no
Supongamos que queremos hallar a y b tales que
P a b = 1 = 0.90
19
1.9.2 Intervalo de Confianza para 2 al nivel 1 :
!
(n 1)S12 (n 1)S12
I= 2
, 2
Xn1, Xn1,1
2 2
donde
1 X
n
S12 = 2.
(Di D)
n 1 i=1
Note que si
2 = 21 + 22 2Cov(X, Y ) = 21 + 22 2 1 2 .
20
Intervalos de Confianza (Parte I)
Estadstica- Prctica No 7
1. Los datos que a continuacin se dan son los pesos en gramos del con-
tenido de 16 cajas de cereal que se seleccionaron de un proceso de
llenado, con el propsito de verificar el peso promedio:
Si el peso de cada caja es una variable aleatoria normal con una desviacin
estndar igual a = 5grs., obtenga los intervalos de confianza estima-
dos del 90%, 95% y 99% para la media de llenada del proceso.
2. Una finca cuadrada tiene lado L. Suponga que, si medimos esta lon-
gitud L, la medicin, debido a diversos errores, sigue una distribucin
N(L, 1).
En 100 mediciones se ha obtenido una media muestral de 325mts..Si
usamos sta como estimacin de L, obtenga un intervalo de confianza
de 95% para L. Calcule el mnimo tamao que debe tener la muestra
para que en la estimacin de L se cometa un error mximo de 0.1mts.
con una probabilidad de 0.95.
1
condiciones normales de rodaje. Los tiempos de vida que se obtienen
(en miles de millas) son:
42 36 46 43 41 35 43 45 40 39
2
9. Una compaa de seguros trabaja con 2 talleres, A y B. La compaa
sospecha que el taller A tiende a cobrar ms que el taller B. Para veri-
ficar sto, se pide a ambos talleres que hagan un avalo del costo para
reparar 15 vehculos, los mismos en ambos talleres, obtenindose (en
miles de bolvares) los siguientes datos:
Vehculo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Taller A 76 102 95 13 30 63 53 62 22 48 113 121 69 76 84
Taller B 73 91 84 15 27 58 49 53 20 42 110 110 61 67 75
A los niveles de confianza 90, 95 y 99%, decida si estos datos presentan
o no evidencia para aceptar que el taller A tiende a sobre facturar.
10. Un problema importante es el de fijar criterios acerca de la cantidad
de sustancias qumicas txicas que se puede tolerar en aguas de ros
y lagos. Una medida comn de toxicidad de una sustancia es la con-
centracin de sta que es capaz de matar el 50% de una especie de
peces en prueba en un tiempo determinado. Esta medida se denomina
CL50 (concentracin letal que mata el 50%).
(a) Para insecticida DDT y una cierta especie de peces, las medidas
de CL50 (en partes por milln) en 12 experimentos fueron:
16 5 21 19 10 5 8 2 7 4 9 2
Suponiendo normalidad, estime la media de CL50 para DDT, con
un coeficiente de confianza del 90%.
(b) Otro insecticida comn, el Diazinon, di las siguientes medidas
para su CL50, en tres experimentos:
7.8 1.6 1.3
Encuentre un intervalo de confianza del 90% para la diferencia de
las medias de CL50 para el DDT y el Diazinon (suponga igualdad
de varianzas). Se puede concluir aqu que algunos de los insecti-
cidas es menos letal?
(c) Se realizaron 7 experimentos mas para medir el CL50 del Diazinon
obteniendo los siguientes resultados:
4.6 1.2 10.5 6.3 1.5 7.1 1.8
Repita la parte anterior tomando los 10 datos para el Diazinon.
3
11. Un fabricante asegura a una compaa que le compra un producto
regularmente, que el porcentaje de productos defectuosos no es mayor
dle 5% . Para comprobar la afirmacin del fabricante, la compaa
selecciona de su inventario, 200 unidades de este producto y las prueba.
Se descubren un total de 19 unidades defectuosas en la muestra, deber
sospechar la compaa de la afirmacin del fabricante? Utilice 95% de
confiabilidad.
4
Intervalos de Confianza (II)
Estadstica. Prctica No 8
8. Se han medido los siguientes valores (en miles de personas) para la audiencia
de un programa de TV en distintos das: 521,742,593,635,788,717,606,639,666,624.
Construir un intervalo de confianza para la audiencia media y otro para la
varianza, bajo hiptesis de normalidad, al 99% de confianza.
9. El nmero diario de piezas fabricadas por una mquina A en cinco das ha
sido: 50,48,53,60,37; mientras que en esos mismos das una mquina B ha
hecho: 40,51,62,55 y 64. Se pide:
2
2. Construir un intervalo para el cociente de las varianzas al 95% de con-
fianza.? Es posible suponer que las varianzas son iguales?
3. Utilizando el mismo estimador de la varianza comn hallado en la
primera parte de este ejercicio, halle el tamao muestral n de am-
bas muestras para que al nivel de 95%, la longitud del intervalo de
confianza para la diferencia de las medias sea 8 unidades.
11. Una muestra de 400 candidatos polticos, 200 escogidos al azar en el este y
200 en el oeste, se clasific teniendo en cuenta si el candidato tuvo respaldo
de un sindicato nacional y si el candidato gan la eleccin. Un resumen de
los datos es el siguiente:
Oeste Este
Ganadores respaldados por el sindicato 120 142
MMOM/04
3
Captulo IV
Prueba de Hiptesis
Mara Margarita Olivares
Mayo 2004
1 Introduccin:
En los captulos anteriores hemos resuelto el problema de obtener medidas
aproximadas de parmetros de los que depende la distribucin de un conjunto
de observaciones. Ahora queremos tomar decisiones acerca de esos mismos
parmetros. El tipo de decisin que vamos a considerar es el siguiente
1
un hombre por robo, la corte siempre asume que el acusado es inocente,
mientras no se pruebe lo contrario. El fiscal trata por todos los medios de
presentar evidencias que contradigan la hiptesis de inocencia del acusado y
de conseguir su condena. En el problemas estadstico del ejemplo, la vacuna
es el acusado, la hiptesis de prueba, llamada hiptesis nula, es que la vacuna
no es efectiva. El experimentador hace papel de fiscal, est convencido de
que su vacuna es efectiva y trata de usar la evidencia contenida en la muestra
para rechazar la hiptesis nula.
Intuitivamente procederamos seleccionando el nmero Y de personas que
no contraen el resfriado, como una medida de la cantidad de evidencia en la
muestra. Si Y resulta muy pequeo se tendra poca evidencia para rechazar
o apoyar la hiptesis nula, si Y resulta grande, rechazaramos la hiptesis
nula, concluyendo as que la vacuna es efectiva. De hecho, si la hiptesis nula
fuese cierta (y la vacuna fuese ineficaz) la probabilidad de pasar el invierno sin
resfriado sera p = 12 , el promedio E (Y ) = np = 5. Existen valores de Y tales
como Y = 10 Y = 0, 1, 2, 3, 4, 5 que permitira a cualquier persona tomar
una decisin intuitiva respecto al rechazo o no de la hiptesis nula (vacuna
ineficaz). Pero si Y = 7, 8, 9, ? qu se podra decir?. Ya sea que usemos un
procedimiento objetivo o subjetivo, seleccionaramos aquel que tenga menor
probabilidad de tomar una decisin incorrecta. Un instrumento para tomar
decisiones, es llamado, estadstico de prueba. En nuestro ejemplo, el nmero
de personas no afectadas por el resfriado es suficiente como estadstico de
prueba:
Y = no de personas no afectadas por el resfriado
el Rango de Y es
{Y = 8 o 9 o10}
2
como regin de rechazo y los otros valores como regin de aceptacin, puesto
que observamos Y = 8 personas sin resfriado, rechazamos la hiptesis nula
de que la vacuna es ineficaz y conclumos que la probabilidad de pasar el
invierno sin ningn resfriado es mayor que p = 12 cuando se usa la vacuna.
Podramos preguntarnos: ? cul es la probabilidad de rechazar la hipte-
sis nula siendo cierta?. Esto no es ms que la probabilidad del evento
{Y = 8 o9 o10}
1
si p = 2
y esta probabilidad es
10 k 10k
X 10 1 1
P (Y = 8 o Y = 9 o Y = 10) = = 0, 055
k=8
k 2 2
3
Estos valores
= 0.055, 0.9 = 0.07
dan una medida de los riesgos de cometer alguno de los errores posibles para
esta prueba.
2 Conceptos Bsicos:
Una prueba estadstica implica cuatro elementos:
1. La hiptesis nula
2. La hiptesis alternativa
3. El estadstico de prueba
4. La regin de rechazo
4
2.3 El Estadstico de Prueba:
La decisin de rechazar o de aceptar la hiptesis nula se basa en la infor-
macin contenida en una muestra extrada de la poblacin de inters. Los
valores de la muestra se usan para calcular un slo nmero, este nmero
acta como ente que toma decisiones y lo llamamos estadstico de prueba.
5
donde Rc es el complemento de la regin de rechazo, es decir, es la
regin de aceptacin.
2.6.1 Observaciones:
1. Las notaciones
P (T (X1 , X2 , , Xn ) R | H0 ) y P (T (X1 , X2 , , Xn ) R | H1 )
= P (T (X1 , X2 , , Xn ) R | p = p0 )
= P (T (X1 , X2 , , Xn ) R | p = p1 )
(p) = P (T (X1 , X2 , , Xn ) R | p)
6
La siguiente tabla muestra las cuatro situaciones que pueden darse segn
se cumpla o no H0 y segn decidamos o no rechazarla:
Rechazar H0 No rechazar H0
T (X1 , X2 , , Xn ) R T (X1 , X2 , , Xn )
/R
Se cumple H0 Error I(prob.) Probabilidad 1
Realidad
No se cumple H0 Probabilidad 1 = Error II(prob.)
Regresemos a la analoga del proceso judicial para proporcionar una idea
ms clara sobre el problema. Si la hiptesis nula es el acusado es inocente,
entonces, con toda seguridad, la alternativa es el acusado es culpable.
El rechazo de la hiptesis nula implicara que el juicio ha sido capaz de
proporcionar suficiente evidencia para garantizar el veredicto de culpable.
Por otro lado, si el juicio no presenta evidencia sustancial, el veredicto
ser inocente. Esta decisin no implica necesariamente que el acusado
sea inocente, ms bien, hace nfasis en la falta de evidencia necesaria para
condenar al acusado. Por lo tanto, un veredicto de culpable es ms fuerte
que un veredicto de inocente, lo cual surge del principio judicial generalmente
aceptado: es peor condenar a un inocente que dejar ir a un culpable. Si
el veredicto es culpable, se desea tener un grado muy alto de seguridad de
que no se va a condenar a una persona inocente, es decir, que el error tipo I
proveniente de rechazar H0 siendo cierta tenga muy baja probabilidad, por lo
tanto, en muchas situaciones el error tipo I se considera como un error ms
grave que el error tipo II.
En las pruebas de hiptesis estadsticas el enfoque general es aceptar la
premisa de que el error de tipo I es mucho ms serio que el tipo II y formular
la hiptesis nula y alternativa de acuerdo a sto.
Como resultado se tiene que muchas veces se selecciona con anticipacin el
tamao mximo del error de tipo I que puede tolerarse y se intenta definir un
procedimiento de prueba que minimice el error de tipo II. En otras palabras,
no es posible seleccionar tanto como y disear una prueba estadstica
para probar H0 contra H1 , dada una muestra aleatoria de tamao n.
Un principio sencillo y razonable al obtener reglas de decisin para una
prueba de hiptesis estadstica es seleccionar aquel procedimiento de prueba
que tenga el tamao ms pequeo para el error del tipo II (mxima poten-
cia), entre todos los procedimientos que tengan el mismo tamao para el
error del tipo I. En este contexto debe notarse que el valor de no puede
hacerse arbitrariamente pequeo, sin que se incremente el valor de . En
otras palabras, para una muestra de tamao n dado, el tamao del error de
7
tipo II normalmente aumentar conforme el error de tipo I disminuya. Lo
que en general se hace en la prctica, es ajustar el tamao del error de tipo
I cambiando la regin de rechazo del estadstico de prueba para as alcanzar
un balance satisfactorio entre los tamaos de los errores, siempre y cuando
se tome en cuenta el mximo tamao del error de tipo I que puede tolerarse
en una situacin particular.
1. Para
H0 : = 0 H1 : > 0 < 0 (prueba bilateral)
8
(a) Si es conocido, utilizamos el estadstico de prueba
_
n(X 0 )
Z= N(0, 1) bajo H0
Si es el error de primera especie, la regin de rechazo se obtiene
hallando z 2 tal que
P z 2 Z z 2 = 1
P (Z > z) =
(z , ) .
P (Z < z) =
o equivalentemente
P (Z > z) =
puesto que la distribucin normal estndar es simtrica respecto
al origen la regin de rechazo viene dada por
(, z )
2.8.1 P-valor
Observe que en el caso de la prueba bilateral, la regin de rechazo es de la
forma _
n(x 0 )
(x1 , , xn ) :
>c
9
hemos ajustado c de manera que
_ !
n(X )
0
PH0 >c =
10
Esta tcnica expuesta para hallar el p-valor asociado a una prueba estads-
tica se generaliza fcilmente a las pruebas que se desarrollarn ms adelante
sutituyendo el estadstico de prueba por el correspondiente en cada caso. Se
debe sealar que hay queser cuidadoso con aquellas distribuciones que no
sean simtricas respecto al origen (chi-cuadrado, distibucin F)
1. (a) EJEMPLO: Se desea probar al 95% de certeza la hiptesis nula
siguiente:
una poblacin estadstica normal tiene media cero, basndose en
una muestra de tamao n = 9 y suponiendo que = 1(es cono-
cida), contra la alternativa que la media es positiva.
Hallemos la regin crtica al nivel = 1 0.95 = 0.05
H0 : = 0 H1 : > 0
que es una prueba unilateral. El estadstico de prueba es:
_
nX _ _
Z= = 9X = 3X
que tiene distribucin N(0, 1) bajo la hiptesis nula. Queremos
hallar la regin de rechazo a partir de:
P (Z > z ) = = 0.05
de aqu se deduce que
z = 1, 6448
Si Z > 1, 6448 rechazamos la hiptesis nula, esto equivale a
_ 1, 6448
X> = 0, 5483
3
La regin de rechazo se puede expresar como
_
X > 0, 5483
El error de tipo I es = 0.05
Si = 1 > 0, el error de tipo II se calcula a partir de
_
(1 ) = P X 0, 5483 | = 1 =
_ !
X 1
P 3 (0, 5483 1 ) | = 1
1/ 9
11
si en particular 1 = 1
_
= P X 0, 5483 | = 1 =
_ !
X 1
P 1, 3551 | = 1
1/ 9
_
X1
donde 1/ tiene distribucin N(0, 1) si = 1, de aqu obtenemos
9 1
= 0, 0877.
(b) Si es desconocido, utilizamos el estadstico de prueba
_
n(X 0 )
T = tStudent con n1 grados de libertad, bajo H0
S1
La regin de rechazo bilateral vendr dada por:
, tn1, 2 tn1, 2 ,
(, t5, ) = (, 2.015)
12
No hay evidencia como para rechazar la hiptesis al 95% de nivel
de significacin.
El p valor es
P (T5 < 1, 9206145) = 0, 05642
que es el nivel de significacin de lo observado. Si hubisemos
tomado = 0, 06, se rechazara la hiptesis nula. Podramos
rechazar al 94%.
2. Para 2 :
H0 : 2 = 20 H1 : 2 > 20 2 < 20
El estadstico de prueba en este caso es:
(n 1)S12
X2 =
20
que tiene distribucin Chi-cuadrado con n 1 grados de libertad, bajo
la hiptesis nula. Al nivel de significacin se obtiene como regin de
rechazo bilateral
[
0, x2n1,1 x2n1, , .
2 2
13
Si 2 = 0.08, la potencia
= P X 2 > x24, | 2 = 0.08
se puede calcular de la siguiente manera: la regin de rechazo es
2 (n 1)S12 2
R= X = > 9, 488 = x4,
20
puesto que si suponemos que la varianza es 2 = 0.08 ya no ser
(n1)S 2
cierto que 2 1 es chi-cuadrado con 4 grados de libertad, por lo tanto
0
debemos cambiar 20 por 2 , es decir:
(n 1)S12 (n 1)S12 20 (n 1)S12
> 9, 488 = > 2 9, 488 = > 5.93
20 2 2
(n1)S 2
Bajo la hiptesis alternativa 2 = 0.08, 2
1
tiene distribucin Chi-
cuadrado con 4 grados de libertad, usando la tabla se obtiene que:
(n 1)S12 2
P > 5.93 | = 0.08 = 0.20
2
2.8.2 POBLACIONES NORMALES E INDEPENDIENTES:
Sea X N(1 , 21 ), Y N(2 , 22 ), X1 , , Xn1 una muestra aleatoria sim-
ple de X y Y1 , , Yn2 una muestra aleatoria simple de Y . Las muestras X
e Y son independientes.
Comparacin de Medias:
H0 : 1 = 2 , H1 : 1 > 2 1 < 2
1. Si 1 y 2 son conocidos, el estadstico de prueba es:
_ _ _ _
X Y (1 2 ) X Y
Z= q 2 2
=q 2
1 2 1 22
n1
+ n2 n1
+ n2
14
2. 1 = 2 = son desconocidos, el estadstico de prueba es:
_ _ _ _
X Y (1 2 ) X Y
T = q = q t Student con n1 + n2 2
Sp n11 + n12 Sp n11 + 1
n2
Comparacin de Varianzas:
H0 : 21 = 22 , H1 : 21 > 22 o 21 < 22
15
Lo que ocurre es que la diferencia de los desgastes de los cauchos depende
de muchos factores que no controlamos: tipo de conduccin, conductor, su-
perficie, etc. Al no controlar estos factores, la variabilidad muestral ser tan
grande que nos impedir observar posibles diferencias entre las medias. Una
solucin es disponer en cada vehculo dos neumticos A y dos B y medir
diferencias de desgastes en el mismo vehculo, al ser la variabilidad de estas
difernecias mucho menor, tendremos en general un mejor contraste.
La clave de este procedimiento es disponer de medidas por pares tomadas
en condiciones muy semejantes, de manera que a priori las dos unidades
experimentales (ruedas en el ejemplo) que comparamos sean lo mas iguales
posibles. As la variabilidad de las diferencias ser pequea y podemos iden-
tificar ms fcilmente cambios.
Supongamos que elegimos 2n unidades homogneas por pares (ruedas del
mismo coche, personas de iguales caractersticas,objetos de iguales propiedades,
etc.). Si (X1 , Y1 ), , (Xn , Yn ) es una muestra aleatoria simple de (X, Y ),
y D = X Y, si D es normal N(, 2 ), entonces D1 , Dn es una muestra
aleatoria simple de D, Di = Xi Yi , con distribucin normal N(, 2 ). Si
E(Xi ) = 1 , E(Yi ) = 2 ; E(Di ) = 1 2 y si no hay diferencia entre las me-
dias la esperanza de Di ser cero. Supongamos igualdad de las varianzas
de Xi y Yi , denotemos por 20 esta varianza comn, entonces Var(Di ) =
20 + 20 2 0 0 , es el coeficiente de correlacin de las dos variables (X, Y ),
de aqu,
2 = V ar(Di ) = 2 20 (1 )
si las dos medidas que comparamos,( los desgastes de los neumticos en un
mismo coche, en nuestro ejemplo), son anlogas, ser positivo y cercano a
1, la variabilidad ser menor que si tomamos muestras independientes.
Para la prueba de hiptesis (bilateral)
H0 : 1 2 = 0
H1 : 1 2 6= 0
usamos el estadstico _
D
Z=
n
16
varianza. Si no conecemos la varianza, nos valemos del estadstico
_
D
T = S1
n
1 X _ 2
n
S12 = Di D
n 1 i=1
17
2.8.4 PROPORCIONES (Muestras Grandes):
A) Si X es de Bernoulli de parmetro p, X1 , Xn una muestra aleatoria
simple de X :
H0 : p = p0 , H1 : p > p0 p < p0
El estadstico de prueba es:
_
X p0
Z=q N(0, 1)
p0 (1p0 )
n
H0 : = 0 , H1 : > 0 < 0
H0 : p = p1 = p2 , H1 : p1 > p2 p1 < p2
Si denotamos por _ _
_ n1 X + n2 Y
p= ,
n1 + n2
18
_
p es un estimador insesgado de p bajo la hiptesis nula, por lo tanto es un
estimador de la varianza p(1 p). Se usa el siguiente estadstico de prueba
_ _
X Y
Z=r
_ _
p(1 p) n11 + 1
n2
19
Ejemplo:
Sea X1 , , Xn es una muestra aleatoria de tamao n de una poblacin
normal de media desconocida y varianza 2 conocida. Determinar la mejor
regin crtica de tamao para probar
H0 : = 0
H1 : = 1
_ n(21 20 ) 2 2 ln(k)
x
2(1 0 )
esta expresin define la mejor regin crtica para esta prueba, donde 1 >
0 , de manera sencilla, la mejor
_
regin crtica es el extremo derecho de la
distribucin
_
de muestreo de X bajo la hiptesis nula, es decir, dado , el valor
crtico x0 puede encontrarse mediante una adecuada eleccin de la constante
k > 0, de manera tal que
_ _
P X x0 | = 0 =
20
_
si en perticular = 0, 05, como bajo_H0 , X tiene distribucin normal con me-
X 0
dia 0 y varianza 2 entonces Z = es normal estndar y valindonos
/ n
de la tabla para esta distribucin se obtiene
_
x0 0
P Z | = 0 = 0.05
/ n
_
x0 0 _
con = 1, 645 o equivalentemente x0 = 1,645
n
+ 0 , la hiptesis H0 :
/ n _
= 0 se rechazar a favor de H1 : = 1 > 0 cada vez que X sea
1,645
n
+0 . Note que esta mejor regin crtica no depende de 1 > 0 , por lo
que esta regin crtica recibe el nombre de regin ( o prueba) uniformemente
ms potente para probar H0 : = 0 contra H1 : = 1 > 0 .
Observe que esta regin coincide con la expuesta anteriormente para este
tipo de prueba de hiptesis unilateral en este caso especfico. Hemos enun-
ciado este lema y expuesto este ejemplo de manera de justificar en cierto
modo las regiones crticas seleccionadas para cada uno de los casos presenta-
dos en esta gua.
21
Prctica No 9
Estadstica
1. Para probar la hiptesis de que una moneda est bien hecha, se toma la
siguiente regla de decisin: se acepta la hiptesis si el nmero de caras
obtenido en una serie de 100 lanzamientos se encuentra entre 40 y 60
(ambos inclusive). De otro modo se rechaza.
1
(a) Al nivel = 0, 05 y en base a la muestra, se puede aceptar que el
rodaje medio de la flota ha aumentado?
(b) Calcule el p valor o valor de significacin observado de esta flota y
discuta el resultado. ?Son los datos suficientemente significativos
para rechazar
H0 : = 2600
contra
H1 : > 2600?
(c) ?Qu pasara si observsemos un aumento de 1,5% en el rodaje
medio mensual para una muestra de 100 vehculos? ?Qu pasara
si esa muestra fuese de 25 vehculos?
2
(a) Para = 0, 05 diga si estos datos permiten concluir que la ad-
ministracin de 650 mgs. de aspirina tiene algn efecto sobre el
tiempo de protombina. Hgalo de dos maneras:
i. Por medio de una prueba de hiptesis bilateral.
ii. Por medio de un intervalo de confianza.
(b) Utilice la tabla para obtener el p valor aproximado.
Celdas usuales 10, 7 10, 7 10, 4 10, 9 10, 5 10, 3 9, 6 11, 1 11, 2 11, 4
Celdas solitarias 9, 6 10, 4 9, 7 10, 3 9, 2 9, 3 9, 9 9, 5 9, 0 10, 9
3
miocardio o infarto cerebral. En el segundo grupo (grupo de control),
murieron 93 personas por la misma causa. Haga los anlisis estadsticos
apropiados.
(a) ?Indican estos datos que la produccin promedio fue menor que
800 toneladas y que por lo tanto, hay algo malo en el proceso?
Realice una prueba al nivel de significacin de 5%.
(b) Halle el p valor o nivel de significacin observado
4
(c) Encuentre un intervalo de confianza del 90% para la produccin
media.
15. El fabricante de una mquina para envasar jabn en polvo, afirma que
la mquina puede cargar las cajas con un peso dado, con una amplitud
(variacin) no mayor de 2/5 de onza. Se encontr que la media y la
varianza centrada de una muestra de 8 cajas de tres libras eran eran
iguales a 3,1 y 0,018 respectivamente. Suponga distribucin normal.
5
(a) Pruebe la hiptesis de que la varianza de la poblacin de pesos es
2 = 0, 01 contra 2 > 0, 01. Use = 0, 05.
(b) Encuentre un intervalo de confianza para 2 y para la media al
90% de confianza.
(a) ?Presentan los datos suficiente evidencia para concluir que hay
diferencia en la variabilidad de las dos acciones para las pobla-
ciones asociadas con las dos muestras?
(b) Encuentre un intervalo de confianza para el cociente de las dos
varianzas poblacionales al 95% de confianza.
MMOM/2004
6
Captulo V
Bondad de Ajuste-Prueba Chi-Cuadrado
Tablas de Contingencia con dos criterios de
clasificacin.
Anlisis de varianza: comparacin de ms de
dos medias
Junio 2004
0.1 Prueba Chi-cuadrado: Bondad de Ajuste
0.1.1 Introduccin:
Hasta ahora todas las situaciones que hemos examinado han tenido como
suposicin bsica que los datos que se tienen provienen de una distribucin
dada que depende de uno o varios parmetros desconocidos los cuales se
pueden estimar por medio de un nmero, un intervalo de confianza o hacer
pruebas de hiptesis referente a ellos.
Si tenemos un conjunto de valores muestrales x1 , x2 , , xn , correpondiente
a una muestra aleatoria simple X1 , X2 , , Xn y se desea saber si hay mo-
tivos razonables para considerar la distribucin de esta muestra, como una
distribucin de probabilidad dada, es importante tener criterios para decidir
si efectivamente es razonable suponer, basndose en los resultados experi-
mentales, acerca de la veracidad de la hiptesis formulada.
A partir de las observaciones podemos trazar una curva de frecuencias
acumuladas ( o un histograma ) y compararla con la funcin de distribucin
de la hiptesis ( o funcin de probabilidad o densidad, segn la variable
sea discreta o continua) y obtener as una idea, al menos cualitativa de la
coincidencia entre ambas distribuciones.
Sin embargo, es necesario, para dar un veredicto preciso, introducir alguna
medida cuantitativa del grado de desviacin que muestran los datos respecto
a la distribucin hipottica. Si esta medida excede algn lmite adecuado
fijo debemos rechazar la hiptesis y viceversa.
Tal medida de la desviacin se puede definir de diversas formas, nosotros
estudiaremos una de ellas: la prueba Chi-Cuadrado introducida por K.Pearson.
Las pruebas que tratan este tipo de problemas, se llaman pruebas de
Bondad de Ajuste.
1
Sea
X
k
pi = P (X = i ) , i = 1, 2, , k; pi = 1
i=1
Observaciones:
a) Si n est fijo, fi es el nmero de veces que aparece i en n repeticiones
del experimento y pi representa la probabilidad de obtener i , luego,
fi tiene distribucin binomial de parmetros (n, pi ), donde E (fi ) =
npi .
X
k
(fi npi )2 Xk
fi2 Xk
X2 = = n (si pi = 1)
i=1
npi i=1
np i i=1
X
k
(fi npi )2
2
X =
i=1
npi
pi = P (X = i ) , i = 1, 2, , k
2
(Para una demostracin ver : Mtodos Matemticos de Estadstica, de
Harald Cramer, Cap.XXX, 30.1.; un esbozp de la demostracin en Mathe-
matical Statistics, an introducction, Wiebe R. Pestman; una demostracin
rigurosa en Wilks,S.S.Mthematical Statistics, Jhon Wiley & Sons, Inc., New
York 1962)
Toma de Decisin:
Nosotros queremos que fi est cercano a npi , es decir, que el valor observado
X
k
(fi npi )2
2
Xobs =
i=1
npi
Ejemplo:
Despus de lanzar un dado 300 veces, se han obtenido las siguientes frecuen-
cias:
cara 1 2 3 4 5 6
frecuencias 43 49 56 45 66 41
al nivel = 0.05, se puede decir que el dado est bien construido?.
3
1. Si el dado est bien construido debe suceder que
1
H0 : = P (X = i) , i = 1, 2, , 6
6
1
En este caso, E (fi ) = npi = 300 6
= 50.
Evaluamos
X
k
(fi 50)2
2
Xobs = = 8.96
i=1
50
La distribucin del estadstico es Chi-Cuadrado con k 1 = 5 grados
de libertad. Al buscar en la tabla hallamos que
2
X5;0.05 = 11.07
por lo tanto al nivel de 5% aceptamos H0 pues X 2 < X5;0.05
2
y con-
cluimos que el dado est bien construido.
Para hallar el p valor debemos calcular P (X52 > 8.96) es algo mayor
a 0, 10.
4
Ejemplos:
1. Un generador de nmeros aleatorios produjo n = 100 nmeros, los
cuales aparecen tabulados en la siguiente tabla:
X
k
(fi npi )2
2 2
X = ; Xobs = 20
i=1
npi
5
hospital estn tabulados en la siguiente tabla:
pi = P (Ii )
obtendremos:
X
k
(fi 570pi )2
2 2
X = ; Xobs = 24, 283.
i=1
570pi
as el p-valor est entre esos dos niveles por lo que rechazamos la hipte-
sis nula.
6
ejemplo, clasificamos los defectos de los muebles producidos en una planta
de fabricacin, primero, de acuerdo al tipo de defecto y segundo, de acuerdo
al turno de produccin. Lo que deseamos investigar es una posible depen-
dencia entre las dos clasificaciones. Varan las proporciones de los diversos
tipos de defectos de un turno a otro?. Por ejemplo, se observa un total de
n = 309 muebles con defectos y se clasifican en cuatro tipos de defectos :
A, B, C, D. Al mismo tiempo, cada mueble se identifica de acuerdo al turno
de produccin en el que es fabricado.
Tabla de Contingencia
7
donde ci , i = 1, 2, 3, 4 es la frecuencia observada de la columna i. Similar-
mente,
p1 = rn1 = 309
94
p2 = rn2 = 309
96
p3 = rn3 = 119
309
son los estimadores de las probabilidades correspondientes a las filas, ri , i =
1, 2, 3 es la frecuencia observada de la fila i.
Si ni,j es la frecuencia observada de la celda que se encuentra en la fila i
y la columna j de la tabla de contingencia, entonces, la estimacin del valor
esperado de nij es en particular para n11
r1 c1 r1 c1
E(n11 ) = np1 pA = n = ,
n n n
en general,
ri cj
E(nij ) = , i = 1, 2, 3; j = 1, 2, 3, 4.
n
En nuestro ejemplo, hemos colocado los clculos de las frecuencias esperadas
entre parntesis, en la tabla de contingencia. El estadstico de prueba, en
general, es
2
X
c X
r nij E(nij )
2 2
X =
X(c1)(r1) ,
j=1 i=1E(nij )
donde c es el nmero de columnas y r es el nmero de filas.
8
el valor observado del estimador es
2
Xobs = 19.18
donde
P X62 > X0.05;6
2
= 0, 05
2 2
Utilizando la tabla se obtiene que X0.05;6 = 12, 60 como Xobs = 19.18 cae en
la regin de rechazo se rechaza la hiptesis nula, es decir, se concluye que no
hay independencia entre el turno y el tipo de defecto. El p valor se calcula
hallando
P X62 > 19, 18
valindonos de la tabla se obtiene un p-valor menor que 0.005, mucho menor
que 0, 05.
0.1.5 Anova
Anlisis de Varianza: Para introducir el mtodo de Anlisis de Vari-
anza (ANOVA) vamos a estudiar un ejemplo sencillo:
Supongamos que el nmero de horas de sueo de los miembros de una
familia est dada por:
9
Hagamos una tabla que compare cada resultado con la media de su grupo:
j=1 j=2 j=3
Adultos (i = 1) 8 + 0.4 8 0.3 8 0.1
Nios (i = 2) 10 0.2 10 0.1 10 + 0.3
Observe que tenemos dos grupos, cada uno con medias diferentes.La media
de toda la muestra (uniendo los dos grupos) es:
_ 8.4 + 7.7 + 7.9 + 9.8 + 9.9 + 10.3
y = =9
_ _ _
6 _
yij = y + (yi y) + (yij yi )
Hagamos una tabla que muestre la variacin de la media de cada grupo con
la media general:
j=1 j=2 j=3
Adultos (i = 1) 9 1 + 0.4 9 1 0.3 9 1 0.1
Nios (i = 2) 9 + 1 0.2 9 + 1 0.1 9 + 1 + 0.3
donde
_
_ _
y es la media general
y) compara la media de cada grupo con la media general
(yi
_
(yij yi ) variacin de cada individuo respecto a la media de su grupo
sumamos i = 1, 2 (nmero de grupos), j = 1, 2, 3 (observaciones en cada
grupo):
X
2 X
3
_ 2 X
2 X
3
_ _ 2 X
2 X
3
_
(yij y) = (yi y) + (yij yi )2
i=1 j=1 i=1 j=1 i=1 j=1
porque
X
2 X
3
_ _ _
2 (yi y)(yij yi ) = 0.
i=1 j=1
P
3 _ _ _
ya que (yij yi ) = 3yi 3yi = 0.
j=1
Esta descomposicin es la idea bsica del ANOVA, (Anlisis de Varianza
en ingls), si N = n1 + n2 , ni es el nmero de observaciones del grupo i
n
1 XX
i2
_
S22 = (yij yi )2
N 2 i=1 j=1
10
es un estimador puntual de la varianza 2 de la muestra Yij ( se supone que
todas las variables tienen la misma varianza). Es fcil ver que
X ni
2 X X
2
_ _ 2 _ _
(yi y) = ni (yi y)2 .
i=1 j=1 i=1
1 X _ _ 2
k
2
S = ni (yi y)
k 1 i=1
estima 2 y
S2
F = Fk1,.Nk
Sk2
Una discrepancia con la hiptesis nula queda indicada por un valor grande de
F, ya que el numerador (variabilidad de la media de cada grupo con la media
general), cuando la hiptesis nula es falsa, ser en promedio ms grande que
el denominador (variabilidad dentro de cada grupo) por lo que la regin de
rechazo para un dado ser:
[F > fk1,Nk, ]
donde
P ([F > fk1,Nk, ]) = .
11
En nuestro ejemplo, k = 2, n1 = n2 = 3, N = 6, S 2 = 6, S22 = 0.1, F = 60, si
= 0.01, f1,4, = 21.20 por lo que se rechaza la hiptesis a este nivel. El p
valor es 0.015 el cual representa
P ([F > 60])
Observe que en nuestro ejemplo slo hay dos grupos, este contraste es identco
al de la rpuba T- de student hecha para comparar dos medias, se puede
S2
demostrar que el cociente el cuadrado del estadstico T, n1 + n2 2 grados
S22
de libertad.
El mtodo que hemos expuesto, se denomina, Anlisis de varianza con un
slo factor o clasificacin simple. Fue inventado por Fisher (1925) con el ob-
jetivo de descomponer la variabilidad de un experimento (variabilidad total)
en componentes independientes que puedan asignarse a diferentes causas.
Por ejemplo, si queremos comparar el rendimineto de k mquinas medido
por su produccin diaria. Existen diversos factores que pueden influir en la
produccin diaria de cada mquina ( aunque trabajen en condiciones idn-
ticas), por ejemplo, pureza de la materia prima, desajustes aleatorios de la
mquina, temperatura de funcionamiento, habilidad del operario, etc. Si
medimos durante ni das la produccin diaria de la mquina i
X
k
ni = N es el total de datos
i=1
12
de confianza o haciendo una prueba de hiptesis. Mediante el anlisis de
varianza se generaliza este problema a la comparacin de medias de k pobla-
ciones a partir de muestras independientes de tamaos n1 , , nk . Se trata
de hallar una prueba para
H0 : 1 = 2 = = k
H1 : i 6= j para algn i 6= j
X ni
k X X ni
k X X ni
k X
_ 2 _ _ 2 _
(yij y) = (yi y) + (yij yi )2
i=1 j=1 i=1 j=1 i=1 j=1
P
k P
ni _ _ P
k _ _
donde, (yi y)2 = ni (yi y)2 , el estadstico de prueba bajo la
i=1 j=1 i=1
hiptesis nula y suponiendo igualdad de varianzas es
S2
F = Fk1,.Nk
Sk2
donde
n
1 XX
i k
_
Sk2 = (yij yi )2
N k i=1 j=1
representa la variabilidad interna de los grupos y
1 X _ _ 2
k
S2 = ni (yi y)
k 1 i=1
13
Observaciones: Los resultados del contraste F en la prueba ANOVA son
sustancialmente vlidos aunque los datos no sean normales, en ese sentido se
dice que es una tcnica robusta frente a desviaciones de la normalidad.
El efecto de desigualdad de las varianzas en los grupos sobre el contraste
F y los contrastes de medias dependen de que el nmero de observaciones
en cada grupo sea igual o muy distinto. Si todos los grupos tienen el mismo
nmero de observaciones, el contraste F es igualmente exacto aunque las
varianzas sean distintas. Es decir, podemos despreocuparnos de las varianzas
a efectos de contrastes de medias, siempre que haya aproximadamente el
mismo nmero de observaciones por grupo, en caso contrario, diferencias
entre las varianzas pueden ser graves.
14
Prueba X 2 Bondad de Ajuste- Independencia
Anlisis de Varianza (ANOVA)
Prctica #10
Estadstica
masculino femenino
p p2
normales 2 2
+ pq
q q2
daltnicos 2 2
1
a una muestra aleatoria se observ durante 4 semanas de trabajo, el
siguiente nmero de consultas:
Lunes Martes Mircoles Jueves Viernes
49 35 32 39 45
Al nivel de significacin, = 0.05, existe alguna razn para creer que
el nmero de empleados que asisten al consultorio mdico se encuentra
distribuido equitativamente durante los cinco das de la semana?
5. Los datos que se dan a continuacin corresponden al lapso de tiempo,
medido en minutos, necesario para que cada uno de 50 clientes de un
banco, lleve a cabo una transaccin:
2.3 0.2 2.9 0.4 2.8
2.4 4.4 5.8 2.8 3.3
3.3 4.7 2.5 5.6 9.5
1.8 4.7 2.5 5.6 9.5
1.8 4.7 0.7 6.2 1.2
7.8 0.8 0.9 0.4 1.3
3.1 3.7 7.2 1.6 1.9
2.4 4.6 3.8 1.5 2.7
0.4 1.3 1.1 5.5 3.4
4.2 1.2 0.5 6.8 5.2
6.3 7.6 1.4 0.5 1.4
Al nivel de significacin, = 0.05, se puede concluir que los tiempos
estn exponencialmente distribuidos con parmetro = 3.2 minutos?
La densidad exponencial es:
exp( x )
f (c) = , x > 0.
6. Un siclogo desea conocer la relacin entre los sntomas deterioros-
sicognicos del pensamiento y depresin. En una muestra de 100 in-
dividuos obtuvo los siguientes datos
Deterioros Si Sicognicos No
Depresin Si 38 31
Depresin No 9 22
Con el nivel de confianza del 95%, existe relacin entre ambos sntomas?
2
7. Una fbrica de automviles quiere averiguar si la preferencia por un
modelo tiene relacin con el sexo de los clientes. En una muestra aleato-
ria de 2000 posibles clientes se observaron las siguientes preferencias:
Modelo A Modelo B Modelo C
Mujeres 340 400 260
Hombres 350 270 380
Existe relacin al nivel = 0.01?
8. Para los datos que se dan en la siguiente tabla, pruebe si hay inde-
pendencia entre la capacidad de una persona para la matemtica y su
inters en la estadstica. Utilice le nivel de significacin = 0.01.
Cap.Mat.baja Cap.Mat.promedio Cap.Mat.alta
Inters Est.Baja 63 42 15
Inters Est.promedio 58 61 31
Inters Est.alto 14 47 29
3
Presentan los datos suficiente evidencia para concluir que hay diferen-
cias en el rendimiento medio correspondientes a las cuatro tcnicas?
(Realice un anlisis de varianza)
11. Un siclogo clnico quera comparar tres mtodos para reducir los nive-
les de hostilidad en estudiantes universitarios. Cada prueba sicolgica
(PNH) fue usada para medir el grado de hostilidad. Las puntuaciones
altas en esta prueba se usaron como indicacin de gran hostilidad. En
el experimento se usaron 11 estudiantes que obtuvieron puntuaciones
altas y muy cercanas entre s. De los 11 estudiantes se seleccionaron
5 al azar y se trataron con el mtodo A, de los 6 restantes se tomaron
tres al azar y se trataron con el mtodo B y el resto se trat con el
mtodo C. Todos los tratamientos se realizaron durante un semestre.
Cada estudiante tom la prueba PNH nuevamente al final del semestre,
con los resultados siguientes:
4
por minuto. Los datos se muestran en la tabla.
Edad
[10 19] [20 39] [40 59] [60 69]
29 24 37 28
33 27 25 29
26 33 22 34
27 31 33 36
39 21 28 21
35 28 26 20
33 24 30 25
29 34 34 24
36 21 27 33
22 32 33 32
Total 309 275 295 282
(a) ?Presentan los datos suficiente evidencia que indique que hay
diferencia entre el aumento medio del ritmo cardiaco de los 4 gru-
pos de edades?. Use = 0.05.
(b) Encuentre un intervalo de confianza la 90% para la diferencia entre
el aumento medio del ritmo cardiaco del grupo de 10-19 aos y el
del grupo de 60-69 aos.
(c) Encuentre un intervalo de confianza del 90% para el aumento
medio del ritmo cardiaco del grupo de 20-39 aos.
(d) Aproximadamente, cuntas personas se necesitaran en cada grupo
si se desea estimar la media de un grupo con un error no mayor
de 2 latidos por segundo, con una probabilidad igual a 0, 95?.
MMOM/04
5
Captulo VI
Recta de Regresin lineal
Prof. Mara Margarita Olivares
Julio 2004
y = ax + b
que mejor se ajusta a esos datos, para ello debemos calcular los parmetros
a y b a partir de los datos, es decir:
si nos dan un conjunto de datos pareados {(xi , yi ); i = 1, 2, 3, , n} , las
estimaciones de mnimos cuadrados de los coeficientes a y b son los valores
para los cuales la cantidad:
X
n
q(a, b) = [yi (a + bxi )]2
i=1
1
que producen el siguiente sistema de ecuaciones:
P
n P
n
yi = an + b xi
i=1 i=1
Pn P
n P
n
xi yi = a xi + b x2i
i=1 i=1 i=1
donde :
2
P
n _
2
P
n
1
P
n
Sxx = (xi x) = x2i n
xi
i=1 i=1 i=1
Pn _ _ P
n
1
P
n P
n
Sxy = (xi x)(yi y) = xi yi n
xi yi
i=1 i=1 i=1 i=1
2
(a) Estimacin puntual
(b) Estimacin por intervalos de confianza
(c) Pruebas de hiptesis.
1 X
n
_ 2
S12 = yi y
n 1 i=1
3
1. Un factor o un grupo de factores (x1 , , xk ) conocidos al observar Y.
Suponemos que la dependencia de Y de estos factores tiene una forma
funcional conocida.
Y = f (x1 , , xk ) +
Y = f (x) +
Ejemplos:
4
1. ?Cul es el beneficio medio de la corporacin para un gasto dado de
publicidad X = x?
2. ?Cul es el aumento de peso promedio para los animales que no se
enfermaron en un mes y que recibieron un alimento que contena 15%
de protenas, 10% de agua y el resto de carbohidratos?
Estos modelos
Y = f (x1 , , xk ) +
que relacionan una variable aleatoria dependiente Y con una o varias vari-
ables independientes x1 , , xk no aleatorias se denominan modelos de re-
gresin. Si tenemos una sola variable independiente
Y = f (x) +
Y = 0 + 1x +
5
(independencia en el sentido aleatorio o probabilstico), es decir, i y j son
independientes para i 6= j. i tiene distribucin N(0, 2 ). Todas las observa-
ciones tienen la misma varianza, V ar(Yi ) = 2 ; E (Yi ) = 0 + 1 xi . Por lo
que estimar la media de las variables respuestas es equivalente a estimar los
parmetros de la recta de regresin.
Mtodo de Mnimos Cuadrados:
Para obtener los estimadores de mnimos cuadrados de los parmetros
0 , 1 se considera la desviacin de la observacin Yi de su media y se deter-
minan los valores de los parmetros que minimizan la suma de los cuadrados
de estas desviaciones. La isima desviacin o i esimo error es
i = Yi ( 0 + 1 xi )
donde
1 X 1 X
n n
_ _ 2 _ 2
cov(x, y) = xi x yi y ; Sx = xi x
n i=1 n i=1
6
es el estimador de mnimos cuadrados de 1 correspondiente a las observa-
ciones (xi , yi ). Finalmente, dados los estimadores 0 y 1 la recta de regresin
estimada para el modelo es
Yi = 0 + 1 xi
donde Yi es el estimador para la media de la observacin Yi , que corresponde
al valor xi de la variable de prediccin.
Observacin:
Como notacin, utilizaremos 1 y 0 para referirnos al estimador de 1 y
0 respectivamente y B1 y B0 para los estimadores observados, es decir,
evaluados en las observaciones.
Si sustitumos la relacin entre los parmetros
_ _
B0 = y B1 x
en la recta de regresin estimada, obtenemos
_ _
Yi = Y + 1 (xi x)
La diferencia entre el valor observado y el estimado se denomina i
esimo
residuo o residual:
ei = yi yi
y son estimadores de la variable aleatoria no observable i , proporcionan
importante informacin de lo que puede faltar en el modelo de regresin
estimado. La varianza 2 en general no se conoce y se estima por la varianza
residual (su raiz cuadrada es la desviacin estndar residual)
1 X 1 X 2
n n
2
SR2 = yi yi = e
n 2 i=1 n 2 i=1 i
se usa n2 pues se pierden dos grados de libertad al estimar los dos parmet-
ros 0 , 1 . Este estimador de la varianza es insesgado si el modelo de regresin
es correcto.
Se cumplen las siguientes propiedades: (se deja como ejercicio la verifi-
cacin)
P
n
1. ei = 0
i=1
7
P
n P
n
2. yi = yi
i=1 i=1
P
n
3. xi ei = 0
i=1
donde
1 X
n
n n
ln(L( 0 , 1 , 2 )) = ln(2) ln( 2 ) 2 (yi 0 1 xi )2
2 2 2 i=1
al tomar las derivadas parciales con respecto a cada uno de los parmetros se
obtendr que los estimadores de 0 , 1 son los mismos hallados por mnimos
cuadrados y para 2 se obtiene
1 X
n
2
2 = yi yi
n i=1
8
El mtodo de mnimos cuadrados admite una simple interpretacin ge-
omtrica. Expresando vectorialmente las observaciones, defimanos los sigu-
ientes vectores filas:
Y0 = (y1 , , yn ) 10 = (1, , 1)
X0 = (x1 , , xn ) 0 = (1 , , n )
El modelo postulado es: Y = 0 1 + 1 X + e0 = (e1 , , en )
Estimar el modelo por mnimos cuadrados equivale a encontrar constantes
B0 , B1 tales que el mdulo del vector de residuos
e = YY
sea mnimo, es decir, se trata de encontrar un vector Y en el plano definido
por los vectores 1 y X tales que su distancia al vector Y sea mnima, la
solucin es la proyeccin ortogonal del vector Y sobre este plano, cualquier
otra eleccin nos dara un vector residual e de mdulo mayor. El vector de
residuos e ser perpendicular a todos los vectores del plano, en particular su
producto escalar con los vectores 1 y X es cero obtenindose as las ecuaciones
llamadas normales o mnimo- cuadrticas
X
n
0
e1 = ei = 0
i=1
Xn
e0 X = ei xi = 0
i=1
con Y = B0 1 + B1 X, B0 es la estimacin de 0 y B1 es la de 1 obtendremos
las ecuaciones
P
n Pn
n 0 + 1 xi = yi
i=1 i=1
P
n Pn P
n
0 xi + 1 x2i = xi yi
i=1 i=1 i=1
que permitieron hallar los estimadores mnimo-cuadrado.
Propiedades de los Estimadores:
9
1. Coeficiente de Regresin 1
Este estimador se puede expresar como
X
n
1 = wi Yi
i=1
_
xi x
con wi = pues
nSx2
n
P _ _ n
P _
xi x yi y xi x yi
i=1 i=1
B1 = n
P _ 2
=
nSx2
xi x
i=1
as, 1 es combinacin lineal de variables Yi normales, por lo tanto tiene
distribucin normal. Observe que
X
n X
n
1
wi = 0, wi2 =
i=1 i=1
nSx2
_
yi y
y que si denotamos por pi = _ la pendiente de la recta que une
_ _ x i x
(xi , yi ) con x, y
n
P _ 2
xi x pi X
n
i=1
B1 = = di pi
nSx2 i=1
_
yi y
es una ponderacin de las pendientes pi = _ con pesos que
xi x
dependen de la distancia relativa de cada punto xi y el centro de todos
ellos, note que
n
P _ 2
_
2 X
n xi x
(xi x) _ i=1
di = = wi (xi x) 0, di = = 1.
nSx2 i=1
nSx2
10
El estimador 1 es insesgado, en efecto
X X X
E 1 = wi E (Yi ) = 0 wi + 1 wi xi = 1
Calculemos la varianza de 1
X 1
V ar( 1 ) = wi2 V ar(Yi ) = 2
nSx2
2 1
por lo tanto 1 tiene distribucin N 1 , nS 2 , y as, es un estimador
x
insesgado y consistente del coeficiente de regresin.
2. Estimador 0 (ordenada en el origen)
Es preferible escribir la recta de regresin en funcin del estimador del
coeficiente de regresin, pues a veces la relacin observada no tiene
sentido para x = 0
_ _
y = y + B1 (x x)
esta expresin pone de_manifiesto
_
que la relacin construida es vlida en
un entorno del punto x, y que representa el centro de las observaciones
que se utiliza para construir el modelo. Estudiaremos las propiedades
del estimador 0 ya que puede ser de inters:
_ _ 1X _X X1 _ X
B0 = y B1 x = yi x wi yi = xwi yi = ri yi
n n
es decir
X
0 = ri Yi
por lo tanto tambin obtenemos que 0 tiene distribucin normal.
0 es insesgado, en efecto
P1 _
E 0 = n
xwi ( 0 + 1 xi ) =
_P _ _P
0 (1 x wi ) + 1 x 1 x wi xi = 0
11
Hallemos la V ar( 0 ) :
!
X X1 _
2
1
_2
x
V ar( 0 ) = ri2 2 = 2 xwi = 2 +
n n nSx2
2 _ _ 2
note que es el error dela estimacin de Y pues V ar(Y ) = ; el error
n n
de estimacin de la pendiente de la recta de regresin vine dado por
V ar( 1 ) = 2 nS1 2 el cual aparece reflejado en la V ar( 0 ) y se transmite
x _
a la ordenada del origen en funcin de lo alejado que est x del origen.
_ 2
Se concluye que 0 tiene distribucin N 0 , 2 n1 + nS x
2 siendo as
x
insesgado y consistente..
Observaciones:
Los estimadores 0 y 1 no son independientes, aceptaremos sin demostracin
que _
x 2
cov( 0 , 1 ) = 2
nSx
_
y que Y y 1 son independientes
3. Varianza residual SR2 (estimador de 2 )
Recordemos que
1 X 1 X 2
n n
2
SR2 = yi yi = e
n 2 i=1 n 2 i=1 i
(n 2)SR2 2
se puede demostrar que tiene distribucin Xn2 (chi-cuadrado
2
con n 2 grados de libertad), la esperanza de esta distribucin es n 2
y la varianza es 2(n 2) por lo que se concluye que
2
2
(n 2)SR
E SR2 = E = 2
n2 2
12
y que
4
(n 2)SR2 2 4
V ar(SR2 ) = 2 V ar =
(n 2) 2 (n 2)
as SR2 es un estimador insesgado y consistente de 2 .
Hemos denotado por SR2 el estimador insesgado de 2 en funcin de las
variables aleatorias Yi y SR2 cuando este estimador es evaluado en las
observaciones.
parmetro 0 1 2
estimador
0 1
SR2
n 0 0 n 1 1 Sx
(n 2)SR2 2
estadstico Tn2 = q _2
Tn2 = Xn2
SR 1 + Sx2 SR 2
x
Coeficiente de determinacin o R2
El coeficiente de determinacin se define como
P _2
yi y
R2 = P _ 2
yi y
13
por lo tanto
14