Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadstica Bsica
ISBN 84-7723-747-6
ISBN 978-84-7723-747-1
para topografa
9 788477 237471
50
Rodrigo
Martnez Quintana
66
ESTADSTICA BSICA
PARA TOPOGRAFA
MANUALES UEX
66
ESTADSTICA BSICA
PARA TOPOGRAFA
2009
Edita
ISSN 1135-870-X
ISBN 978-84-692-0988-2
Depsito Legal M-14.077-2009
Edicin electrnica: Pedro Cid, S.A.
Telf.: 914 786 125
Pr
ologo
Es bien conocido que los errores aleatorios estan presentes en todo proceso de
medici
on. En un trabajo topogr
aco, un estudio y tratamiento adecuado de
dichos errores es de vital importancia para avalar las mediciones realizadas,
as como para determinar el comportamiento de las observaciones indirectas
derivadas de ellas. Teniendo esto en mente, en este manual desarrollamos los
contenidos matematicos basicos necesarios para afrontar con exito el estudio
de los errores aleatorios, que es el objeto de interes de la Teora de errores. Sin
embargo, los contenidos seleccionados van a ser expuestos en un contexto mas
general que el que estrictamente dene la Teora de errores, aunque en todo
momento seran ilustrados con una gran variedad de ejemplos tpicos de dicha
teora. Estos contenidos son los apropiados para una asignatura de estadstica
b
asica para Ingeniera Tecnica en Topografa as como del futuro Grado de
Ingeniera en Geomatica y Topografa y estan programados para impartirse en
60 horas presenciales (45 horas de desarrollo teorico y 15 horas de desarrollo
pr
actico).
Este manual ha sido dividido en 9 temas, agrupados en 4 bloques tem
aticos:
Metodos para la descripcion y analisis de conjuntos de datos, Probabilidad,
Teora de muestra y Estadstica Inferencial. Los dos primeros temas estan dedicados a describir y analizar datos. En el Tema 1 exponemos c
omo realizar un
lizar la informaci
on contenida en un conjunto de datos unidimensionales. A
continuaci
on, en el Tema 2, desarrollamos las tecnicas necesarias para describir y analizar conjuntamente una muestra con datos multidimensionales. En
el segundo bloque tematico exponemos los conceptos principales de la Teora
de la Probabilidad. Concretamente, en el Tema 3 introducimos el concepto
Manuales Uex
Manuales Uex
Adem
as de los contenidos teoricos y pr
acticos, en cada tema adjuntamos las
sentencias apropiadas para desarrollar en el software estadstico R los ejemplos
ilustrativos utilizados para exponer los contenidos. Asimismo, cada tema es
completado con algunas cuestiones y problemas, como ayuda para el trabajo
no presencial del alumno.
Finalmente queremos hacer constar que para una mejor lectura y comprensi
on
Indice general
Pr
ologo
0. Preliminares
0.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
0.4. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bloque tem
atico I: M
etodos para la descripci
on y an
alisis de conjuntos de datos
unidimensionales
11
1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
12
1.3. Gracos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
20
21
24
27
33
1.4.5. Transformaci
on de datos . . . . . . . . . . . . . . . . . .
34
1.5. Pr
acticas de laboratorio . . . . . . . . . . . . . . . . . . . . . .
36
39
Manuales Uex
1. M
etodos para la descripci
on y an
alisis de conjuntos de datos
43
44
2.3. Gr
acos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
50
51
2.4.2. Transformaci
on de datos . . . . . . . . . . . . . . . . . .
57
2.5. Pr
acticas de laboratorio . . . . . . . . . . . . . . . . . . . . . .
60
63
Bloque tem
atico II: Probabilidad
67
3. Introducci
on a la Teora de la Probabilidad
69
3.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
69
71
73
75
75
77
78
79
Manuales Uex
4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
43
83
83
84
4.2.1. Funci
on de probabilidad . . . . . . . . . . . . . . . . . .
87
4.2.2. Funci
on de densidad . . . . . . . . . . . . . . . . . . . .
90
4.2.3. Transformaci
on de variables aleatorias . . . . . . . . . .
94
95
96
99
113
137
6.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
6.2. Modelos de probabilidad discretos . . . . . . . . . . . . . . . . 138
6.2.1. Distribuci
on uniforme discreta . . . . . . . . . . . . . . 138
6.2.2. Distribuci
on binomial y de Bernoulli . . . . . . . . . . . 140
6.3. Modelos de probabilidad continuos . . . . . . . . . . . . . . . . 148
6.3.1. Distribuci
on uniforme continua . . . . . . . . . . . . . . 148
6.3.2. Distribuci
on normal . . . . . . . . . . . . . . . . . . . . 150
6.3.3. Distribuciones asociadas al modelo normal est
andar . . 160
6.4. Modelos de probabilidad multidimensionales . . . . . . . . . . . 167
6.4.2. Distribuci
on normal multivariante . . . . . . . . . . . . 170
6.5. Pr
acticas de laboratorio . . . . . . . . . . . . . . . . . . . . . . 174
6.6. Cuestiones y problemas . . . . . . . . . . . . . . . . . . . . . . 179
Bloque tem
atico III: Teora de muestras
183
Manuales Uex
6.4.1. Distribuci
on multinomial . . . . . . . . . . . . . . . . . 167
11
185
211
8. Introducci
on a la Teora de Estimaci
on
213
Manuales Uex
12
237
9.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
9.2. Test de hipotesis para la media . . . . . . . . . . . . . . . . . . 244
9.2.1. Con varianza conocida . . . . . . . . . . . . . . . . . . . 244
9.2.2. Con varianza desconocida . . . . . . . . . . . . . . . . . 248
9.3. Test de hipotesis para la varianza . . . . . . . . . . . . . . . . . 250
9.4. Test de hipotesis de igualdad de varianzas . . . . . . . . . . . . 252
9.5. Test de hipotesis para la diferencia de medias . . . . . . . . . . 255
9.5.1. Muestras aleatorias simples independientes . . . . . . . 256
9.5.2. Muestras aleatorias relacionadas . . . . . . . . . . . . . 258
9.6. Test de hipotesis de independencia . . . . . . . . . . . . . . . . 259
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
261
262
263
265
268
Bibliografa b
asica
271
Ap
endices
273
A. Tablas estadsticas
273
B. Variaciones y combinaciones
281
C. Cifras signicativas
285
Indice alfab
etico
287
291
Referencias
294
Manuales Uex
13
Tema 0
Preliminares
0.1.
Introducci
on
0.2.
Clasicaci
on de los errores en el proceso
de medici
on
Manuales Uex
Manuales Uex
0.3.
Deniciones y conceptos b
asicos
experimentales. Estas
son clasicadas, atendiendo al car
acter, en categoras o
modalidades que son exhaustivas y excluyentes, es decir, cada unidad experimental es clasicada en una y solo en u
nica categora. Ejemplos de caracteres
cualitativos son el tipo de instrumento de medida, con las categoras analogico
Manuales Uex
Manuales Uex
Manuales Uex
Poblacin
Carcter
X
Teora de
muestras
x1, , xn
Estadstica
inferencial
Teora
de la
Probabilidad
Estadstica
descriptiva
0.4.
Ejemplo
A continuaci
on, exponemos brevemente a modo de ejemplo el estudio asociado a un proceso de medicion. Observemos que este estudio es la consecuencia
directa de aplicar los metodos y tecnicas que desarrollamos en los siguientes
temas. Fijando ideas, suponemos que estamos interesados en determinar la distancia en metros entre dos puntos. Dado que dicha distancia es desconocida,
utilizamos un distanci
ometro con apreciacion en milmetros para aproximarla.
Si medimos dicha distancia dos veces, una vez eliminados los errores sistematicos, es muy probable a
un que obtengamos dos mediciones diferentes, debido a
la presencia de errores aleatorios. Por tanto, la medici
on de dicha distancia es
un experimento aleatorio asociado a un car
acter cuantitativo continuo medido
en escala numerica. Las unidades experimentales son mediciones. Dado que el
n
umero de mediciones es innitas (a priori), con el n de aproximar el comportamiento de las mediciones, registramos 25 observaciones de las mismas. Estas
observaciones constituyen nuestra muestra. Notemos que para obtener un conjunto de mediciones representativos tenemos que aplicar tecnicas de Muestreo
Estadstico. Una vez registrados los datos, realizamos un estudio descriptivo,
Manuales Uex
Distancia
Fr. absoluta
Medidas caractersticas
Datos originales
(36.135, 36.139]
(36.139, 36.143]
(36.143, 36.147]
(36.147, 36.151]
(36.151, 36.155]
2
7
10
5
1
Media
Mediana
1o Cuartil
3o Cuartil
Cuasidesviaci
on tpica
Meda
36.145
36.145
36.143
36.147
0.003535
0.002
Total
25
20
40
60
80
10
100
Cuadro 1: Tabla de frecuencias (tabla de la izquierda) y valores de medidas caractersticas (tabla de la derecha) para el conjunto de mediciones consideradas
en el Apartado 0.4.
36.135
36.140
36.145
36.150
36.155
36.130
36.135
36.140
36.145
36.150
36.155
36.160
Manuales Uex
Manuales Uex
Bloque Tem
atico I
Manuales Uex
M
etodos para la descripci
on y
an
alisis de conjuntos de datos
Tema 1
M
etodos para la descripci
on y
an
alisis de conjuntos de datos
unidimensionales
1.1.
Introducci
on
car
acter, as como de la escala de medida del conjunto de datos. A partir de
ahora, supondremos que hemos observado un determinado car
acter, cualitativo o cuantitativo, en n elementos de una poblacion, lo que constituye una
muestra de tama
no n.
Manuales Uex
observaci
on de un u
nico car
acter. Dicho estudio depende de la naturaleza del
11
1.2.
Tablas de frecuencias
En general, si el tama
no de la muestra es elevado, la simple secuencia de
los datos observados no proporciona informaci
on sobre el comportamiento de
los mismos. En cambio, podemos extraer esta informacion organizando los
datos en una tabla denominada tabla de frecuencias. En ella presentamos los
datos agrupados en clases, que para un car
acter cualitativo son sus categoras
y para un car
acter cuantitativo son los valores numericos o intervalos que los
contengan. En cualquier caso, las clases consideradas tienen que ser exhaustivas
y excluyentes, es decir, cada dato es clasicado en una y solamente en una clase.
A cada clase, asociamos la frecuencia absoluta que es el n
umero de veces que
aparece dicha clase en el conjunto de datos observados. Como las clases son
exhaustivas y excluyentes, la suma total de las frecuencias absolutas coincide
con el n
umero de datos en la muestra. Para conocer la representaci
on global de
una clase en el conjunto de datos, incorporamos su frecuencia relativa que es
la proporci
on de apariciones de la clase en el conjunto de datos observados. La
calculamos como la frecuencia absoluta dividido entre el tama
no de la muestra.
Como las clases son exhaustivas y excluyentes, la suma total de las frecuencias
relativas es uno. Dado que es mas usual hablar en terminos de porcentaje,
en ocasiones, las frecuencias relativas son reemplazadas por las frecuencias
porcentuales, es decir, las frecuencias relativas multiplicadas por cien. A la
clase con mayor frecuencia la denominamos clase modal o moda, es decir, la
clase mas representativa en la muestra. En ocasiones hay mas de una moda en
la muestra.
Ejemplo 1.1 Supongamos que para las mediciones de un trabajo topogr
aco
de gran envergadura han participado tres equipos de campo, E1, E2 y E3, de
modo que cada medida ha dependido de un s
olo equipo. Con el n de conocer
Manuales Uex
la distribuci
on de participaci
on de los distintos equipos de trabajo, hemos
12
Equipos
Fr. absolutas
Fr. relativas
Fr. porcentuales
E1
E2
E3
4
10
6
0.20
0.50
0.30
20 %
50 %
30 %
Total
20
100 %
Manuales Uex
13
No de vertices
Fr. absolutas
1
2
3
4
5
6
3
8
9
6
3
1
3
11
20
26
29
30
0.10
0.37
0.67
0.87
0.97
1
Manuales Uex
14
Manuales Uex
15
Medici
on
Fr. absoluta
Fr. relativa
(36.135, 36.139]
(36.139, 36.143]
(36.143, 36.147]
(36.147, 36.151]
(36.151, 36.155]
2
7
10
5
1
0.08
0.28
0.40
0.20
0.04
0.08
0.36
0.76
0.96
1
Total
25
Manuales Uex
16
mos, por ejemplo, que en el intervalo denido por los valores 36.139 y 36.151
se encuentra el 88 % de las mediciones de la muestra. Ademas, en los dos primeros intervalos se acumulan el 36 % de los valores observados mientras que
s
olo un 24 % en los dos u
ltimos.
1.3.
Gr
acos
Manuales Uex
17
10
E1
E2
E3
E1
E2
E3
Manuales Uex
topogr
acas intervienen de 2 a 4 vertices, siendo estos n
umeros de vertices los
18
m
as numerosos en el conjunto de redes topogr
acas observadas.
Finalmente, para el conjunto de datos considerado en el Ejemplo 1.3 hemos
realizado un histograma (gr
aco de la izquierda de la Figura 1.2) y un diagrama
de tallo-hoja (tabla de la derecha del Cuadro 1.4). Observemos que, en esta
0.0
0.2
0.4
0.6
0.8
10
1.0
36.135
36.140
36.145
36.150
36.155
1
2
3
4
5
6
Hoja
Tallo
Hoja
000
00000000
000000000
000000
000
0
36.13
36.14
36.14
36.14
36.15
78
1122333
4455566777
88880
2
siones erroneas. En la Figura 1.3 mostramos dos diagramas de barras correspondientes al Ejemplo 1.1. El gr
aco de la izquierda es correcto. En cambio,
el graco de la derecha es confuso, pues el area del rectangulo correspondiente
al equipo de trabajo E3 es mas del doble que el area del rectangulo correspondiente al equipo de trabajo E1, mientras que esa relacion no se mantiene
Manuales Uex
19
10
10
E1
E2
E3
E1
E2
E3
1.4.
Medidas caractersticas
Manuales Uex
20
1.4.1.
Medidas de centralizaci
on
La medida de centralizaci
on mas com
un es la media aritmetica muestral, la
denotamos por x y la denimos como el promedio de los valores de la muestra,
es decir
xi
.
n
A partir de su denici
on tenemos que las desviaciones positivas y negativas de
x=
i=1
n
n
(xi x) =
xi nx = 0,
i=1
i=1
y por tanto podemos decir que la media aritmetica muestral es una medida
de centralizaci
on, pues representa el centro geometrico para el conjunto de
datos. Ademas, si los valores del conjunto de datos son ceros y unos, entonces
la media aritmetica muestral representa la proporci
on de unos en el conjunto
de datos.
Para el conjunto de datos considerados en el Ejemplo 1.3, tenemos que
x=
Manuales Uex
21
Por tanto, la media aritmetica muestral es una medida de centralizacion apropiada para describir datos homogeneos. Para un conjunto de datos que presente
un comportamiento heterogeneo, originado por ejemplo por la presencia de
datos atpicos, una medida de centralizaci
on apropiada es la mediana muestral.
La denimos como aquel valor que, supuesto los datos ordenados de menor a
mayor, deja igual n
umero de valores a su izquierda que a su derecha. Si el
n
umero de datos es impar tomamos el valor central de los datos. Si el n
umero
de datos es par la calculamos como la media de los valores centrales. Es decir,
si x1 x2 . . . xn entonces la mediana es
x(n+1)/2
si n es impar
(xn/2 + xn/2+1 )/2 si n es par.
Ejemplo 1.5 Para el conjunto de datos considerado en el Ejemplo 1.3, n = 25
es impar y por tanto la mediana es el dato que ocupa la posici
on 13=(25+1)/2,
una vez ordenados estos de menor a mayor. Dicha ordenaci
on puede ser obtenida a partir del tallo-hoja (ver Cuadro 1.4), de donde deducimos que 36.145
m es la mediana de las mediciones tomadas. En esta ocasion coincide con el
valor de la media aritmetica muestral, consecuencia de la homogeneidad de los
datos.
Por otro lado, para el conjunto de datos considerado en el Ejemplo 1.2, n =
30 es par y por tanto la mediana es el valor medio de los datos que ocupa
Manuales Uex
22
n
i=1 log xi
n
n
e
xi ,
=
i=1
1
1
n
x
i=1 i
media aritmetica muestral. Esto muestra la homogeneidad de los datos, hecho
que se reeja en su histograma.
Como hemos comentado anteriormente, la medida de centralizacion mas utilizada es la media aritmetica muestral. Por ello, a partir de ahora nos referiremos
Manuales Uex
Para el Ejemplo 1.3, tenemos que ambas medias coinciden con el valor de la
23
n
wi xi
i=1
,
n
j=1 wj
1 3 + 2 8 + ... + 5 3 + 6 1
= 3.03 vertices.
3 + 8 + ... + 3 + 1
1.4.2.
Medidas de posici
on
Manuales Uex
24
100(1p) %, a su derecha, una vez que esos estan ordenados de menor a mayor.
Por tanto, los cuantiles nos proporcionan valores que ocupan determinadas
posiciones en el conjunto de datos. Atendiendo al valor de p, destacamos los
cuartiles y los percentiles.
si nj/100 no es entero
x[nj/100]+1
x[nj/100] + (x[nj/100]+1 x[nj/100] )j/100 si nj/100 es entero ,
Observemos que las posiciones obtenidas solo dependen del conjunto de datos a
traves del tama
no de la muestra. Por tanto los cuantiles son medidas robustas,
es decir, su valor no esta fuertemente inuenciado por la presencia de valores
1 La
z.
parte entera de un n
umero positivo z es el mayor n
umero natural menor o igual que
Manuales Uex
25
Manuales Uex
26
0.3
0.4
0.5
0.6
0.7
0.8
36.143
36.144
36.145
36.146
36.147
x1
x3
x2
x4
x5
x1
x2
x3
x4
x5
Figura 1.5: Conjuntos de datos con las mismas media y mediana muestral y
diferente comportamiento en la dispersi
on.
1.4.3.
Medidas de dispersi
on
Manuales Uex
27
1
(xi x)2 .
n i=1
Manuales Uex
en unidades que son el cuadrado de las unidades de las observaciones. Por ello
28
denimos la desviaci
on tpica muestral como la raz cuadrada de la varianza
muestral, que se expresa en las mismas unidades que los datos. Para el calculo
de la varianza, y por ende de la desviaci
on tpica, requerimos conocer previamente el valor de la media muestral, que de no ser un valor exacto, tenemos
que redondearlo. Este redondeo provocar
a un error que se propagar
a al valor
i=1
(xi x)2 =
n
n
(x2i 2xxi + x2 ) =
x2i
i=1
i=1
xi
i=1
xi = 2 + . . . + 3 = 91 vertices y
i=1
30
i=1
i=1
xi = 903.620 m y
25
x2i = 32661.160 m2 ,
i=1
Manuales Uex
29
Manuales Uex
30
Manuales Uex
31
36.155
36.150
36.145
36.140
36.135
Figura 1.6: Diagrama de caja para los datos considerados en el Ejemplo 1.2
(gr
aco de la izquierda) y en el Ejemplo 1.3 (gr
aco de la derecha).
el 25 % de los datos centrales menores en relacion al 25 % de los datos centrales
mayores. En el gr
aco de la izquierda de la Figura 1.6 mostramos el diagrama
de caja para el Ejemplo 1.2 y el del Ejemplo 1.3 en el gr
aco de la derecha.
Observemos que en el extremo inferior de la caja trazamos una lnea que se
extiende hasta o bien el mnimo de los datos o el menor dato mayor que el
cuartil primero menos 1.5 veces el rango intercuartlico. En este u
ltimo caso, los
datos menores que dicho extremo son representados mediante puntos aislados
y los consideraremos como datos atpicos, por estar demasiado alejados de la
mediana. En los diagramas de caja mostrados en la Figura 1.6, el extremo
inferior de la lnea es el valor mnimo de los datos y por tanto no detectan
la presencia de valores atpicos. De manera similar trazamos una lnea desde
el extremo superior de la caja. Concretamente, la lnea se extiende o bien
el maximo de los datos o bien el mayor dato menor que el cuartil primero
menos 1.5 veces el rango intercuartlico. Asimismo, en este u
ltimo caso, los
datos mayores a dicho extremo son representados mediante puntos aislados y
los consideraremos como valores atpicos, por estar demasiado alejados de la
mediana (ver Figura 1.7). En los diagramas de caja mostrados en la Figura
1.6 observamos que la mediana muestral se encuentra en mitad de la caja.
Manuales Uex
Adem
as para el graco de la derecha el rango donde se encuentran el 25 % de
32
los datos menores es similar que el del 25 % de los datos mayores, lo que nos
muestra cierta homogeneidad alrededor de la mediana. Esto no sucede para el
gr
aco de la izquierda, observ
andose cierta asimetra a valores grandes. Este
comportamiento ya lo habamos detectado en el analisis del histograma y del
diagrama tallo-hoja (ver Figura 1.2 y Cuadro 1.4).
1.4.4.
Medidas de forma
i=1 (xi
n
s3
x)3
A partir del conocimiento de la media aritmetica y la mediana podemos predecir la asimetra de los datos. Si la media aritmetica y la mediana estan
pr
oximas, este hecho nos indica cierta simetra, pues en promedio los valores
grandes se compensan con los menores. En cambio, si la media aritmetica es
superior a la mediana, este hecho indica la presencia de valores mayores que
Manuales Uex
atpico.
33
36.140
36.145
36.150
36.145
36.155
36.135
36.140
36.145
36.150
36.155
36.160
36.160
36.135
36.155
36.155
36.150
36.150
36.145
36.145
36.140
36.140
36.150
36.135
36.140
36.135
36.140
36.145
36.150
36.130
10
Figura 1.7: Comportamiento del histograma y diagrama de caja de los conjuntos de datos considerados en el Ejemplo 1.12.
dominan a los menores y por tanto los datos presenta una asimetra a la derecha. En caso contrario, los datos presentan una asimetra a la izquierda, pues
los valores menores dominan a los mayores.
1.4.5.
Transformaci
on de datos
Manuales Uex
34
55
50
40
25
4.0
2 e04
30
35
3.6
3.8
6 e04
45
3.4
1 e03
3.2
Manuales Uex
35
Medidas caractersticas
Datos originales
Datos transformados
Media
Mediana
1o Cuartil
3o Cuartil
Cuasidesviaci
on tpica
Meda
Coef. Asimetra
36.145
36.145
36.143
36.147
0.0035355
0.002
0
145
145
143
147
3.5355
2
0
Manuales Uex
transformados.
36
1.5.
Pr
acticas de laboratorio
Para la situaci
on descrita en el Ejemplo 1.1, utilizamos las siguientes sentencias:
Manuales Uex
barplot(cumsum(-sort(-table(x)))/length(x),col=0)
37
Manuales Uex
sum((x-mean(x))^2)/length(x); sqrt(sum((x-mean(x))^2)/length(x))
38
1.6.
Cuestiones y problemas
Manuales Uex
39
Intervalos
Fr. absoluta
Fr. relativa
Fr. absoluta
acumulada
Fr. relativa
acumulada
5
0.14
(16.165, 16.170]
13
0.74
44
Total
Manuales Uex
3. Discutir razonadamente cu
al de los diagramas de caja mostrados en la Figura
40
Figura 1.9: Diagramas de caja asociados a los tres conjuntos de datos considerados en el Problema 3.
sean distancias y angulos. Para tal n hemos seleccionados 20 mediciones registradas en el trabajo y hemos anotado el tipo de medida, obteniendose la
secuencia:
A, D, D, A, D, A, A, A, D, A, A, D, D, A, A, D, A, D, D, A,
donde A denota angulo y D denota distancia. Atendiendo a la naturaleza
del caracter, analizar descriptivamente de manera exhaustiva y sintetizada los
datos seleccionados, utilizando para ello el software estadstico R.
5. Supongamos que en un trabajo topogr
aco de precision estamos interesados
en determinar las relaciones de proporcionalidad entre los tipos de vertices
geodesicos considerados (Primer, Segundo y Tercer Orden). Para tal n hemos
seleccionados al azar 25 vertices geodesicos registrados en el trabajo y hemos
anotado el nivel de los mismos, obteniendose la secuencia:
PO, TO, TO, TO, TO, TO, TO, PO, TO, SO, SO, TO, SO, TO, SO, TO,
TO, TO, SO, SO, SO, TO, SO, TO, SO.
donde PO: Primer Orden, SO: Segundo Orden y TO: Tercer Orden. Atendiendo
sintetizada los datos seleccionados, utilizando para ello el software estadstico
R.
6. Supongamos que en un trabajo topogr
aco estamos interesados en determinar el n
umero de mediciones que dependen de cada uno de los vertices
Manuales Uex
41
Manuales Uex
42
Tema 2
M
etodos para la descripci
on y
an
alisis de conjuntos de datos
multidimensionales
2.1.
Introducci
on
En el tema anterior hemos supuesto que para cada individuo o unidad experimental observamos un u
nico car
acter. Sin embargo, lo habitual es observar
varios caracteres en cada individuos, obteniendose datos multidimensionales.
En esta situacion, ademas de realizar un estudio descriptivo para cada uno de
los caracteres, podemos analizar de manera descriptiva la relacion o asociacion entre los valores observados de los distintos caracteres. Para ello, como
en el caso de un caracter, la descripcion y an
alisis de un conjunto de datos
multidimensionales se basa en organizar el conjunto de datos en una tabla,
representarlos en gracos y resumir la informaci
on que contienen mediante
ciertas medidas caractersticas. La naturaleza de los caracteres condiciona el
teres, aunque el estudio se puede generalizar sin dicultad cuando el n
umero
de caracteres sea mayor. As, suponemos que en n individuos observamos dos
caracteres, de modo que a cada individuo le asociamos dos valores, uno para
cada caracter. Por tanto, el conjunto de datos a analizar est
a formado por n
vectores bidimensionales, que constituyen la muestra.
Manuales Uex
43
2.2.
Tablas de contingencia
Como en el caso de un solo caracter, para construir una tabla agrupamos las
categoras o valores de los caracteres en clases que son exhaustivas y excluyentes. A cada individuo lo clasicamos atendiendo a la clase de cada car
acter
a la que pertenece. Por tanto, las clases conjuntas estan constituidas por la
combinaci
on de dos clases, una por cada car
acter. Estas clases conjuntas tambien son exhaustivas y excluyentes y en n
umero son el producto del n
umero de
clases de cada caracter. Para cada una de estas clases conjuntas denimos la
frecuencia absoluta y la frecuencia relativa de igual manera que para la de las
clases de un caracter. A la tabla asociada a estas frecuencias la denominamos
tabla de contingencia o tabla de doble entrada, pues las las representan las
clases de un caracter y las columnas a las clases del otro caracter. Esta tabla muestra tambien las frecuencias absolutas (relativas) de las clases de cada
car
acter a las que denominamos frecuencias absolutas (relativas) marginales y
la obtenemos como la suma de las frecuencias absolutas (relativas) de las las
o columnas.
Las tablas de contingencia las podemos utilizar para organizar la informaci
on
de caracteres tanto cualitativos como cuantitativos. Notemos que para caracteres cuantitativos una agrupaci
on de los valores puede ser necesaria, como ya
ocurra en la tabla de frecuencias de un car
acter cuantitativo.
Ejemplo 2.1 Supongamos que para la situaci
on considerada en el Ejemplo
1.1, ademas de anotar el equipo de trabajo que ha tomado la medida, registramos el tipo de medicion realizada, donde distinguimos entre distancias y
angulos. El siguiente conjunto de datos corresponde a los 20 datos observados:
DE3, DE2, DE3, AE3, AE1, DE1, AE2, DE3, DE2, DE1, AE2, AE2, AE2,
Manuales Uex
44
donde AEi denota que el equipo i ha medido un angulo y DEi denota que el
equipo i ha medido una distancia, con i {1, 2, 3}.
En esta nueva situaci
on, cada medicion puede ser clasicada en 6 clases atendiendo al tipo de medida as como al equipo que ha tomado la medida. En el
Tipo/Equipos
E1
E2
E3
Marg. Tipos
Angulo
Distancia
2 (0.10)
2 (0.10)
7 (0.35)
3 (0.15)
1 (0.05)
5 (0.25)
10 (0.50)
10 (0.50)
Marg. Equipo
4 (0.20)
10 (0.50)
6 (0.30)
20 (1)
Manuales Uex
45
Tipo/Equipos
E1
E2
E3
Tipo/Equipos
E1
E2
E3
Angulo
Distancia
0.20
0.20
0.70
0.30
0.10
0.50
Angulo
Distancia
0.50
0.50
0.70
0.30
0.17
0.83
Cuadro 2.2: Frecuencias relativas condicionadas por tipos (tabla de la izquierda) y por equipos (tabla de la derecha) para el conjunto de datos considerado
en el Ejemplo 2.1.
Ejemplo 2.2 Teniendo en cuenta el Cuadro 2.1, observamos que 4 mediciones
han sido tomadas por el equipo E1, dos angulos y dos distancias. Por tanto,
la frecuencia relativa del tipo de medida condicionado a que sea tomada por el
equipo E1 es de 0.5 para angulos y 0.5 para distancias. Podemos observar que
esta relacion no se conserva para el equipo E2, siendo la frecuencia relativa
condicionada para angulos y distancias de 0.7 y 0.3, respectivamente. Por
tanto, la proporci
on de mediciones de cada tipo de angulo tomadas por cada
equipo depende del equipo, pues para E1 es de 0.50 mientras que para E2
de 0.70. En la tabla de la izquierda del Cuadro 2.2 mostramos las frecuencias
relativas condicionadas por tipos y en la tabla de la derecha las frecuencias
relativas condicionadas por equipos. Observamos que la suma de las las son
uno para la tabla de la izquierda, pues condicionamos sobre los tipos. Adem
as
la suma de las columnas son tambien uno para la tabla de la derecha, pues
condicionamos sobre los equipos.
2.3.
Gr
acos
El tipo de gr
aco apropiado para representar un conjunto de datos asociado
a dos caracteres depende de la naturaleza de los mismos. Cuando los dos ca-
Manuales Uex
46
10
A
D
6
4
2
0
E1
E2
E3
10
E1
E2
E3
Figura 2.1: Diagramas de barras agrupadas para el conjunto de datos considerado en el Ejemplo 2.1.
de barras apiladas. Consiste en el diagrama de barras de un car
acter, donde
cada barra la dividimos en tantas zonas como clases tenga el otro caracter.
El area de cada zona viene dado por la frecuencia relativa condicionada a la
clase asociada a la barra. Notemos que para cada tipo de diagrama podemos
obtener dos gr
acos, dependiendo del car
acter que jemos en el eje horizontal.
Ejemplo 2.3 Como ambos caracteres asociados al conjunto de datos considerado en el Ejemplo 2.1 son cualitativos, representamos los datos utilizando
diagramas de barras agrupadas y apiladas. En el gr
aco de la izquierda de la
Figura 2.1 mostramos el diagrama de barras agrupadas, donde el car
acter asociado al tipo de medida es utilizado para la agrupaci
on de barras. Asimismo,
en el graco de la derecha de la Figura 2.1 mostramos el diagrama de barras
agrupadas cuando el car
acter asociado al equipo es utilizado para la agrupacion de barras. Finalmente, los diagramas de barras apilados son mostrados en
la Figura 2.2. En el gr
aco de la izquierda condicionamos a las clases denidas
por el caracter asociado al tipo de medida, mientras que en el gr
aco de la
derecha condicionamos a las clases denidas por el equipo de trabajo. Obsery Cuadro 2.2, respectivamente. Con todo ello, si nuestro objetivo es mostrar la
heterogeneidad de la proporci
on de medidas de tipo
angulo que son medidas
por cada equipo de trabajo, elegimos el diagrama de barras apiladas donde las
clases que se jan en el eje horizontal son los equipos.
Manuales Uex
vemos que los gracos representan las frecuencias calculadas en el Cuadro 2.1
47
14
D
A
10
8
6
4
2
0
10
12
E3
E2
E1
12
14
E1
E2
E3
Manuales Uex
tipo de distanci
ometro. La primera es cuantitativa continua medida en escala
48
40
80
15.340
15.350
15.360
15.370
40
80
group Analgico
Digital
Analgico
15.340
15.350
15.360
15.370
group Digital
Distancia horizontal
Manuales Uex
y la dispersi
on de las mediciones tomadas con el distanciometro analogico es
superior a las mediciones tomadas con el distanciometro digital.
49
Observaci
on
Distancia
Angulo
Observaci
on
Distancia
Angulo
1
2
3
4
5
6
7
8
9
10
42.36
42.27
42.39
42.44
42.44
42.32
42.42
42.40
42.35
42.38
20.32920
20.32917
20.32922
20.32922
20.32923
20.32918
20.32920
20.32921
20.32920
20.32920
11
12
13
14
15
16
17
18
19
20
42.37
42.32
42.47
42.32
42.52
42.35
42.36
42.42
42.40
42.39
20.32921
20.32919
20.32924
20.32918
20.32923
20.32919
20.32920
20.32921
20.32921
20.32922
2.4.
Medidas caractersticas
Manuales Uex
50
20.32916
20.32920
20.32924
42.25
42.30
42.35
42.40
42.45
42.50
42.55
Digital
Anal
ogico
Media
Mediana
1o Cuartil
3o Cuartil
Cuasidesviaci
on tpica
Meda
Coef. Asimetra
15.356
15.356
15.354
15.357
0.0030414
0.002
0.29567
15.357
15.357
15.353
15.363
0.0068550
0.005
-0.22156
2.4.1.
Medidas de asociaci
on
Cuando los dos caracteres son cuantitativos, ademas de obtener las medidas
caractersticas muestrales para cada uno de ellos, podemos denir medidas de
Manuales Uex
51
1
(xi x)(yi y),
n i=1
donde x e y denotan las medias muestrales asociadas a los valores del primer y el segundo caracter, respectivamente. Siguiendo un desarrollo similar al
realizado para la varianza muestral obtenemos la siguiente expresi
on de f
acil
c
omputo para la covarianza muestral
n
xi yi
i=1
x y.
Notemos que la unidad de medida de la covarianza es el producto de las unidades de los dos caracteres.
Ejemplo 2.7 Teniendo en cuenta la informaci
on recogida en el Cuadro 2.5,
obtenemos para el conjunto de datos considerado en el Ejemplo 2.5, que
20
xi yi = 17232.86,
i=1
20
i=1
xi = 847.69 y
20
yi = 406.5841.
i=1
Como el tama
no muestral es 20, calculamos el valor de la covarianza, que es
pr
oximo a 9 diezmillonesima.
El valor de la covarianza muestral puede ser positivo o negativo. Un producto
Manuales Uex
del tipo (xi x)(yi y) es positivo si y solo si los valores de los caracteres son
52
los dos mayores o los dos menores que los valores de sus respectivas medias
Suma
xi
yi
xi yi
xi
yi
xi yi
42.36
42.27
42.39
42.44
42.44
42.32
42.42
42.40
42.35
42.38
20.32920
20.32917
20.32922
20.32922
20.32923
20.32918
20.32920
20.32921
20.32920
20.32920
861.1449
859.3140
861.7556
862.7721
862.7725
860.3309
862.3647
861.9585
860.9416
861.5515
42.37
42.32
42.47
42.32
42.52
42.35
42.36
42.42
42.40
42.39
20.32921
20.32919
20.32924
20.32918
20.32923
20.32919
20.32920
20.32921
20.32921
20.32922
861.3486
860.3313
863.3828
860.3309
864.3989
860.9412
861.1449
862.3651
861.9585
861.7556
423.77
203.29203
8614.9064
423.92
203.29208
8617.9579
Cuadro 2.5: C
alculo de la covarianza muestral del conjunto de datos considerado en el Ejemplo 2.7.
tendencia de tipo lineal inversa entre los dos caracteres, es decir, valores bajos
(altos) de un car
acter se asocian a valores altos (bajos) del otro caracter a
traves de una dependencia de tipo lineal, obtenemos un valor negativo. Un
valor pr
oximo a cero nos indica una escasa asociacion de tipo lineal entre
ambos caracteres. Por todo ello, decimos que la covarianza es una medida de
asociacion para medir relaciones lineales. Obviamente, a
un siendo la covarianza
pr
oxima a cero, una relacion entre ambos caracteres es posible, pero no sera de
tipo lineal.
En la Figura 2.6 mostramos dos diagramas de dispersi
on donde se observa
una tendencia de tipo lineal, directa para el gr
aco de la izquierda (covarianza
muestral positiva) e inversa para el gr
aco de la derecha (covarianza muestral
gura 2.7 no apreciamos tendencia de tipo lineal, pues la covarianza muestral
es proxima a cero. Para el gr
aco de la izquierda observamos cierta independencia entre los valores de los dos caracteres, mientras que una asociacion de
tipo cuadr
atica puede ser apropiada para describir los datos del gr
aco de la
derecha.
Manuales Uex
53
65.350
50.670
81.375
50.675
81.385
50.680
81.395
50.685
81.405
65.355
65.360
65.365
65.354
65.356
65.358
65.360
65.362
65.364
50.670
16.34500
50.675
16.34501
50.680
50.685
16.34502
65.350
65.354
65.358
65.362
65.354
65.356
65.358
65.360
65.362
Manuales Uex
A partir de su denici
on, deducimos que coeciente de correlacion muestral de
54
20.28
20.32916
20.30
20.32
20.32920
20.34
20.36
20.38
20.32924
20.40
42.25
42.30
42.35
42.40
42.45
42.50
42.55
42.25
42.30
42.35
42.40
42.45
42.50
42.55
Manuales Uex
55
1000
2000
3000
4000
Manuales Uex
de Pearson pr
oximo a cero y en cambio el valor absoluto del coeciente de
56
correlaci
on de Spearman pr
oximo a uno. Un diagrama de dispersi
on de un
conjunto de datos con tales caractersticas lo mostramos en la Figura 2.9,
donde el coeciente de correlacion de Person en 0.64860 y el de Spearman es
0.90033.
Dist.
Rango
Angulo
Rango
Dist.
Rango
Angulo
Rango
42.36
42.27
42.39
42.44
42.44
42.32
42.42
42.40
42.35
42.38
7.5
1.0
11.5
17.5
17.5
3.0
15.5
13.5
5.5
10.0
20.32920
20.32917
20.32922
20.32922
20.32923
20.32918
20.32920
20.32921
20.32920
20.32920
8.0
1.0
16.0
16.0
18.5
2.5
8.0
12.5
8.0
8.0
42.37
42.32
42.47
42.32
42.52
42.35
42.36
42.42
42.40
42.39
9.0
3.0
19.0
3.0
20.0
5.5
7.5
15.5
13.5
11.5
20.32921
20.32919
20.32924
20.32918
20.32923
20.32919
20.32920
20.32921
20.32921
20.32922
12.5
4.5
20.0
2.5
18.5
4.5
8.0
12.5
12.5
16.0
2.4.2.
Transformaci
on de datos
Manuales Uex
57
Manuales Uex
58
OA
OB
AB
Obs.
OA
OB
AB
1
2
3
4
5
6
7
8
9
10
65.358
65.362
65.357
65.359
65.352
65.353
65.353
65.356
65.357
65.353
101.036
101.040
101.039
101.036
101.029
101.027
101.032
101.025
101.037
101.032
35.678
35.678
35.682
35.677
35.677
35.674
35.679
35.669
35.680
35.679
11
12
13
14
15
16
17
18
19
20
65.362
65.354
65.353
65.358
65.357
65.353
65.360
65.356
65.355
65.361
101.041
101.030
101.030
101.032
101.031
101.026
101.035
101.032
101.033
101.041
35.679
35.676
35.677
35.674
35.674
35.673
35.675
35.676
35.678
35.680
Manuales Uex
59
Medidas caractersticas
Media
Mediana
Meda
Varianza
Covarianza
OA
OB
65.356
101.033
65.356
101.032
0.003
0.0035
0.0000097475 0.00002206
0.00001166
AB
35.677
35.677
0.002
0.0000084875
2.5.
Pr
acticas de laboratorio
Para la situaci
on descrita en el Ejemplo 2.1, utilizamos las sentencias:
Cargar el conjunto de datos
x<-as.factor(c("E3", "E2", "E3", "E3", "E1", "E1", "E2", "E3",
"E2", "E1", "E2", "E2", "E2", "E1", "E2", "E3", "E2", "E2",
"E2", "E3"))
y<-as.factor(c("D", "D", "D", "A", "A", "D", "A", "D", "D",
"D", "A", "A", "A", "A", "A", "D", "A", "D", "A", "D"))
Frecuencias absolutas, relativas y relativas condicionas
table(x,y); table(x,y)/length(x); f<-function(z){z/sum(z)}
round(apply(table(x,y),2,f),2); apply(table(y,x),2,f)
Manuales Uex
60
barplot(table(x,y),be=T,leg= rownames(table(x,y)))
barplot(table(y,x),be=T,leg = rownames(table(y,x)))
barplot(table(x,y),leg= rownames(table(x,y)))
barplot(table(y,x),leg= rownames(table(y,x)))
Manuales Uex
61
Manuales Uex
mean(z); mean(y)-mean(x)
62
Mediana muestral
median(z); median(y)-median(x)
Varianza muestral
mean((z-mean(z))^2); mean((x-mean(x))^2)+mean((y-mean(y))^2)
-2*mean((x-mean(x))*(y-mean(y)))
2.6.
Cuestiones y problemas
Manuales Uex
63
Distaci
ometro/Tipo
(16.165, 16.170]
Marg. Tipo
Anal
ogico
Digital
Marg. Distanci
ometro
1(
)
(
)
8(
)
(
)
(
)
(0.04)
(
)
4(
)
6(
)
(0.24)
(0.20)
(
)
3
6
25 (
Manuales Uex
64
35.35750
Y
35.35749
35.358
35.35748
35.356
61.380
35.354
61.385
61.390
61.395
35.360
61.400
35.362
35.350
35.355
35.360
35.365
35.354
35.356
35.358
35.360
35.362
Manuales Uex
apreciaci
on en segundos tomamos medidas de dos angulos, uno horizontal y
65
Bloque Tem
atico II
Manuales Uex
Probabilidad
67
Tema 3
Introducci
on a la Teora de la
Probabilidad
3.1.
Introducci
on
3.2.
Manuales Uex
69
un suceso A est
a incluido en otro B y lo denotamos por A B, si y solo
Manuales Uex
70
3.3.
bilidad m
axima. Ademas, por ser una medida, la probabilidad de dos sucesos
incompatibles A y B es la suma de las probabilidades de los mismos, es decir,
P (A B) = P (A) + P (B) si A B = .
Consecuencia de estas suposiciones tenemos las siguientes propiedades que
permiten calcular la probabilidad de un suceso en funci
on de otros sucesos
P (Ac ) = 1 P (A)
P () = 0
P (A B) = P (A) + P (B) P (A B)
Si A B entonces P (A) P (B)
Manuales Uex
m
as sencillos.
71
0.2
0.0
0.1
Frecuencia relativa
0.3
0.4
1000
2000
3000
4000
5000
Tamao muestral
Manuales Uex
a cada uno de ellos le asociamos probabilidad 1/K. As, si un suceso esta for-
72
3.4.
Probabilidad condicionada
Manuales Uex
P ({x R : x = 0 }) = 0.
73
P (A B)
,
P (B)
donde suponemos que P (B) > 0 para que el cociente este bien denido. Es
inmediato probar que la probabilidad condicionada de cualquier suceso es un
valor no negativo, que al suceso B le asocia valor uno y que la probabilidad
de la uni
on de dos sucesos incompatibles es la suma de las probabilidades
condicionadas. Observemos que P (A|B) no es, en general, igual a P (B|A), y
P (A|B c ) no es en general igual a P (A|B).
Ejemplo 3.6 Si para la situaci
on descrita en el Ejemplo 3.5, denotamos por
ET M C = {ET 1, ET 2} al suceso constituido por las estaciones totales mal
1
,
2
como ya habamos calculado. Por otro lado, P (ET M C|{ET 1}) = 1, pues si
P ({ET 1}|ET M C) =
el resultado del experimento ha sido elegir la ET 1, entonces hemos seleccionado una estaci
on total que esta mal calibrada. Observemos que si solo sabemos que dos estaciones totales estan mal calibradas y no conocemos que
estaciones totales son, entonces tenemos que P ({ET 1}|ET M C) = 1/5 y
Manuales Uex
P (ET M C|{ET 1}) = 2/5, que coinciden con las probabilidades de los sucesos
74
sin condicionar.
Finalmente, si denotamos por ET BC = {ET 3, ET 4, ET 5}, al suceso constitui-
do por las estaciones totales bien calibradas, obtenemos que P ({ET 1}|ET BC)
= 0, que no coincide con P ({ET 1}|ET M C).
3.4.1.
La probabilidad condicionada nos ayuda a calcular la probabilidad de la interseccion de dos sucesos, mediante la siguiente expresion, denominada regla de
la multiplicaci
on
P (A B) = P (B)P (A|B) = P (A)P (B|A).
Teniendo en cuenta esta expresion, podemos deducir la probabilidad de un
suceso A a partir de la probabilidad de un suceso B y las probabilidades de A
condicionada a B y B c , como sigue
P (A) = P (A B) + P (A B c ) = P (B)P (A|B) + P (B c )P (A|B c ).
A este resultado lo denominamos teorema de la probabilidad total y es de gran
utilidad en el c
alculo de determinadas probabilidades a partir de otras m
as
sencillas de obtener.
Ejemplo 3.7 Para la situaci
on descrita en el Ejemplo 3.6, donde denotamos
por ET M C = {ET 1, ET 2} y ET BC = {ET 3, ET 4, ET 5}, calculamos la
3.4.2.
Sucesos independientes
P (B A)
P (B)P (A)
=
= P (B).
P (A)
P (A)
Manuales Uex
Adem
as, la probabilidad de la intersecci
on de ambos sucesos es el producto de
75
1
P ({S1ET 3&S2ET 1})
= .
P ({S1ET 3})
5
Manuales Uex
76
3.4.3.
Regla de Bayes
P (A|B)P (B)
P (A B)
=
.
P (A)
P (A|B)P (B) + P (A|B c )P (B c )
Ejemplo 3.9 Supongamos que de las cinco estaciones totales del Centro Universitario de Merida conocemos que dos estan mal calibradas, pero no sabemos que estaciones son. Para detectar si una estacion total esta bien o
mal calibrada seguimos un metodo de deteccion. Dicho metodo no es exacto en sus decisiones. Mas concretamente sabemos que al aplicarlo a una estaci
on total proporciona una decisi
on correcta con probabilidad 0.95. Por
tanto, si denotamos por ET BC (ET M C) al conjunto de estaciones totales bien (mal) calibrada y por DET BC (DET M C) al suceso asociado a
la decision de que la estacion total esta bien (mal) calibrada, tenemos que
P (DET BC|ET BC) = P (DET M C|ET M C) = 0.95. Aplicando el teorema de
la probabilidad total, tenemos que la probabilidad de detectar una estaci
on
mal calibrada al aplicar el metodo es
P (DET M C) =
Manuales Uex
+
=
.
=
5 100 5 100
100
77
2
5
95
100
38
=
,
41/100
41
que es mayor que 0.4. Asimismo, deducimos que P (ET BC|DET M C) = 3/41,
que es la probabilidad de cometer un error cuando la decisi
on tomada es que
la estacion total esta mal calibrada.
3.5.
Pr
acticas de laboratorio
Manuales Uex
x<-y==1; cumsum(x)/(1:length(x))
78
3.6.
Cuestiones y problemas
Manuales Uex
79
Manuales Uex
80
Manuales Uex
81
Tema 4
Variables aleatorias
unidimensionales
4.1.
Introducci
on
En el tema anterior hemos introducido el concepto de probabilidad para medir la incertidumbre en el resultado de un experimento aleatorio. Si en este
experimento aleatorio estamos interesados en un determinado caracter nos
convendr
a conocer las probabilidades de los sucesos relacionados con dicho
car
acter. Si es cuantitativo, los sucesos vendr
an expresados en terminos de
valores numericos. Las propiedades de los n
umeros pueden ser de ayuda para denir y describir el comportamiento aleatorio del experimento, lo cual no
ocurre si la naturaleza del car
acter asociado al experimento es cualitativa. En
este tema, introducimos el concepto de variable aleatoria unidimensional como
una funci
on que asocia a cada resultado del experimento un valor numerico,
independientemente de la naturaleza del car
acter. Esto permite trasladar la
incertidumbre en el resultado del experimento aleatorio a valores numericos.
junto de n
umeros, con lo cual la denicion y descripcion de la distribuci
on
de probabilidad asociada a una variable aleatoria se simplica. La funci
on
de probabilidad y la funci
on de densidad nos permiten esta tarea. Asimismo,
deniremos algunas medidas caractersticas que sintetizan la distribuci
on de
probabilidad de una variable aleatoria, aunque no la determinan de manera
Manuales Uex
83
4.2.
Variable aleatoria
R
X()
y los valores de X estan sujetos a las leyes del azar subyacente al experimento
aleatorio. As por ejemplo, si x R
P (X x) = P ( : X() x).
El conjunto de valores numericos que toma una variable constituye el espacio
muestral de la variable aleatoria. Si es de cardinal nito o innito numerable diremos que la variable aleatoria es discreta. Si es de cardinal innito no
numerable, diremos que la variable aleatoria es continua.
A la funci
on F (x) = P (X x), con x R, la denominamos funci
on de
Manuales Uex
distribuci
on de la variable aleatoria X. Esta funci
on caracteriza la distribuci
on
probabilidad en el espacio muestral de la variable X. De su propia denici
on
deducimos que la funcion de distribuci
on es no decreciente, continua por la
derecha y
lim F (x) = 0 y lim F (x) = 1.
84
Como dos son las estaciones totales mal calibradas y tres las bien calibradas, los valores de la variable aleatoria X son 0, 1 y 2. Concretamente al
suceso {ET 1&ET 2} le asigna el valor 0, el valor 1 es asociado a los suce-
sos {ET 1&ET 3}, {ET 1&ET 4}, {ET 1&ET 5}, {ET 2&ET 3}, {ET 2&ET 4},
{ET 2&ET 5} y el valor 2 a los sucesos {ET 3&ET 4}, {ET 3&ET 5},
{ET 4&ET 5}. Como solo son tres los posibles valores que toma la variable
X, deducimos que es una variable aleatoria discreta. Las probabilidades asociadas, dependen de las probabilidades de los sucesos elementales asignados a
bles, entonces la funcion de distribuci
on de la variable aleatoria X es
F (x) =
10
10
1
si
si
si
si
Manuales Uex
cada valor. Si asumimos que todos los sucesos del experimento son equiproba-
85
0.0
0.2
0.4
F(x)
0.6
0.8
1.0
Manuales Uex
86
Una funci
on de distribuci
on que describe esta situacion puede ser
0
si x < 10
x2 + x + 1
si
10 x < 0
F (x) = 200x2 10 x 2 1
+ +
si 0 x < 10
200 10 2
1
si x 10,
0.0
0.2
0.4
F(x)
0.6
0.8
1.0
15
10
10
15
4.2.1.
Funci
on de probabilidad
La funci
on de distribuci
on valorada en x nos mide la incertidumbre de obtener
un resultado para el cual el valor de la variable sea menor o igual que x.
Este concepto generaliza al de frecuencia relativa acumulada denida para
un conjunto de datos medidos en escala ordinal o numerica. A continuaci
on,
extendemos el concepto de frecuencia relativa de un conjunto de datos a una
Manuales Uex
variable aleatoria X.
87
0.0
0.0
0.1
0.2
0.2
0.4
0.3
p(x)
F(x)
0.4
0.6
0.5
0.8
0.6
0.7
1.0
p(xn ) = 1.
n=1
Con la notaci
on utilizada, hemos supuesto implcitamente que el valor mnimo
de la variable, x1 , se puede determinar. En ocasiones esto no es posible, pero
los resultados anteriores siguen siendo v
alidos sin mas que modicar convenientemente la notacion.
Ejemplo 4.3 Para la variable aleatoria X considerada en el Ejemplo 4.1 tenemos que {0, 1, 2} es el espacio muestral y la funcion de probabilidad est
a de-
Manuales Uex
terminada por
88
1
6
3
, p(1) =
y p(2) =
.
10
10
10
En el gr
aco de la izquierda de la Figura 4.3 mostramos la funci
on de distrip(0) =
buci
on de la variable aleatoria X y en el gr
aco de la derecha su funci
on de
probabilidad, donde observamos la relaci
on con la funci
on de distribuci
on.
0.7
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Figura 4.4: Diagramas de barras para los conjuntos de datos obtenidos cuando
el n
umero de repeticiones del experimento es 100 (graco de la izquierda), 1000
(gr
aco central) y 10000 (gr
aco de la derecha), considerados en el Ejemplo
4.3.
Notemos que el graco correspondiente a la funci
on de probabilidad se asemeja
en forma a un diagrama de barras, donde en lugar de frecuencias relativas
representamos probabilidades. Asimismo, los diagramas de barras aproximan
el comportamiento de la funci
on de probabilidad a medida que las repeticiones
del experimento aumentan, tal y como mostramos en la Figura 4.4, donde el
n
umero de repeticiones considerado son 100 (gr
aco de la izquierda), 1000
(gr
aco central) y 10000 (gr
aco de la derecha). Consecuentemente ponemos
de maniesto que la frecuencia relativa de un suceso aproxima a la probabilidad
de dicho suceso.
si x < x1
0
n
F (x) =
Manuales Uex
partir de la funci
on de probabilidad como sigue
89
4.2.2.
Funci
on de densidad
Manuales Uex
como
90
h0
P (x h X x + h)
, x R,
2h
1
F(x)
F(x)
f(x)
x
Si existe la funci
on de densidad en un punto x, entonces tenemos que la funcion
de distribuci
on es continua en ese punto, por ser derivable. Adem
as, tenemos
que P (X = x) = 0. Debido a esto, a la hora de calcular probabilidades de
intervalos a partir de la funci
on de densidad no inuye incorporar los extremos,
es decir,
P (x1 X x2 ) = P (x1 < X x2 ) = P (x1 X < x2 ) = P (x1 < X < x2 ).
Manuales Uex
91
0.4
0.3
0.2
f(x)
0.2
F(x)
0.3
0.4
0.0
0.0
0.1
P ( 2 X 2 )
0.1
P (X 2 )
Adem
as, como la funcion de distribuci
on es no decreciente, entonces la funcion
de densidad es no negativa, nula en un punto si este no pertenece al espacio
muestral. Cuanto mayor sea el valor de la funci
on de densidad en un punto,
mayor probabilidad para que la variable tome valores cercanos a dicho punto.
Ejemplo 4.4 Como la funci
on de distribuci
on de la variable aleatoria X considerada en Ejemplo 4.2 es derivable, obtenemos la siguiente expresi
on de su
funci
on de densidad
f (x) =
100 +
x +
100
0
1
10
1
10
si
si
si
si
x < 10
10 x < 0
0 x < 10
x 10.
Manuales Uex
92
(gr
aco de la derecha) frente a la funci
on de distribuci
on (gr
aco de la izquierda) de la variable aleatoria X. Observemos que la funci
on de densidad
es positiva en el intervalo denido por los valores -10 y 10, que determina el
espacio muestral de la variable aleatoria continua. Sobre el espacio muestral,
la funci
on de densidad no es contante, alcanzando su m
aximo en el cero. De
0.0
0.00
0.2
0.05
0.4
f(x)
F(x)
0.6
0.10
0.8
1.0
0.15
15
10
10
15
15
10
10
15
f (x)dx =
3
y P (5 < X < 10) =
8
10
f (x)dx =
1
.
8
Teniendo en cuenta estas probabilidades, podemos calcular probabilidades condicionadas. Por ejemplo si conocemos que el error en la medicion es positivo,
entonces tenemos una probabilidad de 0.75 de que sea menor de 5 unidades
pues
P (0 X 5|X 0) =
P (0 X 5)
3
= .
P (X 0)
4
Manuales Uex
xima a la funci
on de densidad. Este comportamiento se muestra en la Figura
93
0.15
0.10
f(x)
0.05
0.00
0.00
0.05
f(x)
0.10
0.15
15
10
10
15
15
10
10
15
4.2.3.
Transformaci
on de variables aleatorias
Manuales Uex
En muchas ocasiones no solo estamos interesados en la distribucion de la variable aleatoria X, sino en una transformaci
on de la propia variable, Y = g(X),
siendo g() una funci
on real. Como X es una variable aleatoria, Y es otra variable aleatoria cuya funci
on de distribuci
on la podemos determinar en algunas
situaciones a partir de la funci
on de distribuci
on de la variable X.
94
0.0
0.00
0.2
0.05
0.4
0.10
f(y)
F(y)
0.6
0.15
0.8
0.20
1.0
0.25
10
15
10
15
si y < 0
si y < 0
0
0 2
y
y
P (Y y) = 100
+ 15 si 0 y < 10
+ y5 si 0 y < 10 y f (y) = 50
0
si y 10,
1
si y 10
En el gr
aco de la izquierda de la Figura 4.9 mostramos la funci
on de distribucion y en el gr
aco de la derecha la funcion de densidad de la variable aleatoria
Y . En ambos gr
acos podemos observar que el espacio muestral esta comprendido entre 0 y 10. A partir de estas funciones obtenemos, por ejemplo, que
P (0 Y 5) = 3/4. Obviamente, este valor corresponde a la probabilidad de
que la variable aleatoria X se encuentre en el intervalo denido por los valores
-5 y 5.
Manuales Uex
4.3.
95
4.3.1.
Medidas de centralizaci
on
La medida de centralizaci
on mas utilizada de una variable aleatoria X es la
media o esperanza matem
atica, que para el caso discreto se dene como
=
xi p(xi ),
i=1
on
donde {xn }n0 denota el espacio muestral de la variable aleatoria. Su expresi
Manuales Uex
96
6
3
1
, p(1) =
, p(2) =
,
10
10
10
1
6
3
6
+1
+2
= estaciones bien calibradas.
10
10
10
5
xf (x)dx,
donde hemos reemplazamos las probabilidades del caso discreto por la funci
on
de densidad y el sumatorio por un signo integral (sumas innitas no contables),
en el sentido de sumar cada valor por su peso en la poblaci
on.
Ejemplo 4.7 Como la funci
on de densidad de la variable aleatoria continua
considerada en el Ejemplo 4.2 admite la expresi
on
si
si
si
si
+ 1
f (x) = 100x 10 1
100 10
0
x < 10
10 x < 0
0 x < 10
x 10,
10
x
x2
+
100 10
dx +
10
0
x2
x
+
100 10
dx = 0 mm.
Observemos que cuando realizamos mediciones con el distanciometro cometemos errores, posiblemente de magnitudes no nulas, pero en promedio estos se
compensan.
Manuales Uex
97
i=1
10
yfY (y)dy =
0
10
y2
y
+
50 5
dy =
10
mm.
3
10
0
10
x
x
x
x2
10
+
+
mm.
|x|fX (x)dx =
dx+
dx =
100 10
100 10
3
10
10
0
Manuales Uex
98
m
f (x)dx =
f (x)dx = 0.5
De su denici
on, se deduce que la mediana es u
nica para el caso continuo y
puede no serlo para el caso discreto, pues si tenemos una variable aleatoria que
toma el valor 0 con probabilidad 0.5 y el valor 1 probabilidad 0.5, entonces
cualquier valor entre 0 y 1 puede considerarse como la mediana.
1.0
0.15
0.6
10 + 5 2
10 5 2
0.05
0.4
f(x)
F(x)
10 + 5 2
0.10
0.8
0.75
0.25
0.25
0.50
0.25
0.0
0.00
0.2
10 5 2
15
10
10
15
15
10
10
15
Figura 4.10: C
alculo del primer y tercer cuartil para la variable aleatoria descrita en el Ejemplo 4.2.
Ejemplo 4.9 Para la variable aleatoria discreta considerada en el Ejemplo
4.1 tenemos que el valor de la mediana es 1, pues F (0) = 0.1 y F (1) = 0.7. Por
otro lado, para la variable aleatoria considerada el Ejemplo 4.2 la mediana es
el 0, pues F (0) = 0.5 y la variable es continua.
4.3.2.
Medidas de posici
on
Manuales Uex
99
4.3.3.
Medidas de dispersi
on
2
2
=
(xi ) p(xi ) o =
2
i=1
(x )2 f (x)dx,
Manuales Uex
100
Ejemplo 4.11 Calculamos la varianza de la variable aleatoria discreta considerada en el Ejemplo 4.1, como
2 =
6
5
2
2
6
6
9
1
6
3
+ 1
+ 2
=
.
10
5
10
5
10
25
0 3
10
x2
x2
x3
x
50
+
+
mm.2 .
2 =
dx +
dx =
100
10
100
10
3
10
0
Conocer solo la media y la desviacion tpica de una variable aleatoria nos
permite calcular una cota de la proporci
on de distribuci
on que esta situada en
el intervalo denido por los valores k y + k, siendo k una constante
1
.
k2
8
3
y P ( 3 < X < + 3) .
4
9
6 6
1
P X
= P (X = 0).
4
5
5
Manuales Uex
6
3
6
3
3
P
2 <X < +2
= P (X 1),
4
5
5
5
5
101
5 2
5 2
2 < X < 2
.
3
3
En este caso sabemos que este probabilidad vale 2 2/ 3 2/3. Si tomamos
k = 3, obtenemos que
8
P 5 6 < X < 5 6 ,
9
que en este caso es irrelevante puesto que conocemos que el espacio muestral
se encuentra entre -10 y 10.
Manuales Uex
102
de distribuci
on, deducimos que la mediana de Y es 10 5 2, y por tanto, la
meda de X. Observemos que, en esta situacion, la meda es la mitad del rango
intercuartlico. As, el intervalo denido por el primer y el tercer cuartil es el
mismo que el que obtenemos a partir de la mediana y la meda.
0.25
0.25
0.15
f(y)
0.05
15
10
0.00
0.00
0.00
0.05
0.05
0.10
f(x)
0.15
0.10
0.20
0.15
f(y)
0.10
0.20
15
10
10
15
10
15
4.3.4.
Medidas de forma
Manuales Uex
103
0.15
0.10
f(x)
0.05
0.05
f(x)
0.10
0.15
0.00
F(5)
0.00
F(5)
15
10
10
15
15
10
10
15
Figura 4.12: C
alculo de probabilidades en variables simetricas.
Finalmente, notemos que conocida la media de una variable aleatoria simetrica,
el calculo de probabilidades se simplica teniendo en cuenta la igualdad
P (X x) = P (X + x).
As, para la variable aleatoria simetrica X considerada en el Ejemplo 4.2,
hemos obtenido que = 0, y por tanto, tenemos que
P (X 5) = 1 P (X 5),
como mostramos en la Figura 4.12.
Manuales Uex
4.3.5.
104
Transformaci
on de variables aleatorias
X
.
Manuales Uex
105
Medidas
Media
Mediana
1o Cuartil
3o Cuartil
Varianza
Meda
Coef. Asimetra
0
0
10 + 5 2
10 5 2
50/3
10 5 2
nulo
0
0
1 + 0.5 2
1 0.5 2
5/30
1 0.5 2
nulo
Cuadro 4.1: Medidas caractersticas de la variable aleatoria Y = 0.1X obtenidas a partir de la variable aleatoria X, siendo X la variable descrita en el
Ejemplo 4.2.
on derivada de g(). As, teniendo en cuenta las exdonde g () denota a la funci
presiones de la media y la varianza para transformaciones lineales, obtenemos
que
2
.
Y g(X ) y Y2 (g (X ))2 X
2
Observemos que g(X ) y (g (X ))2 X
son una aproximaci
on de la media y la
Manuales Uex
la distribuci
on de la observaci
on directa que la dene.
106
Ejemplo 4.15 Supongamos que estamos interesados en determinar el comportamiento del error de medicion del area de un crculo de radio nominal 5
metros, cuando en la medicion del radio utilizamos el distanci
ometro descrito
en el Ejemplo 4.2. Como la variable aleatoria X describe el comportamiento
Como el valor esperado de los errores del radio es nulo, entonces la media de
los errores del area tambien esta pr
oxima a 0.
4.4.
Pr
acticas de laboratorio
Para estudiar el comportamiento probabilstico de la variable aleatoria descrita en el Ejemplo 4.1, utilizamos las sentencias:
Funci
on de distribuci
on y de probabilidad
x<--1:3; Fx<-c(0,.1,.7,1,1); px<-c(0,0.1,0.6,.3,0)
plot(x, Fx, xlim=c(-1.25,3.25), ylab="F(x)", type="s")
plot(x, px, xlim=c(-1,3), ylab="p(x)",type="h", lwd=4)
Generar 100 valores de la variable aleatoria
library(e1071); x<-rdiscrete(100, c(.1,.6,.3), 0:2)
Representar el diagrama de barras
barplot(table(x)/length(x), col=0, ylim=c(0,0.7))
Manuales Uex
abline(h=c(.1,.6,.3), lty=2)
107
Manuales Uex
fd1<-function(x)x/(100)+1/10; fd2<-function(x)-x/(100)+1/10
108
4.5.
Cuestiones y problemas
de densidad
k(1 x2 )
f (x) =
0
si 1 < x 1
en otro caso.
Manuales Uex
109
0.15
0.10
f(x)
f(x)
5
10
15
20
25
0.05
0.00
0.00
0.00
0.05
0.05
0.10
f(x)
0.15
0.10
0.20
0.25
0.15
15
10
10
15
15
10
10
15
Manuales Uex
110
x
1
si 5 < x 0
25 + 5
x
1
f (x) = 100
+ 10 si 0 < x 10
0
en otro caso.
i) Representar la funci
on de densidad de la variable aleatoria X.
Manuales Uex
111
Tema 5
Variables aleatorias
multidimensionales
5.1.
Introducci
on
Manuales Uex
medidas del grado de asociacion entre ellas. Estas medidas son analogas a
113
5.2.
Vector aleatorio
el valor 2, el valor 1 es asociado a los sucesos {ET 1&ET 3}, {ET 1&ET 4},
{ET 1&ET 5}, {ET 2&ET 3}, {ET 2&ET 4}, {ET 2&ET 5} y el valor 0 a los su-
cesos {ET 3&ET 4}, {ET 3&ET 5}, {ET 4&ET 5}. Por tanto, si asumimos que
todos los sucesos del experimento son equiprobables, la funci
on de probabilidad asociada a la variable aleatoria Y , independientemente de la variable X,
Manuales Uex
admite la expresion
114
P (Y = 0) =
3
6
1
, P (Y = 1) =
y P (Y = 2) =
.
10
10
10
En el gr
aco de la izquierda de la Figura 5.1 mostramos la funci
on de distribuci
on de la variable aleatoria Y y en el gr
aco de la derecha su funci
on de
probabilidad.
0.0
0.0
0.1
0.2
0.2
0.4
0.3
p(y)
F(y)
0.4
0.6
0.5
0.8
0.6
0.7
1.0
1
y
0
si y < 5
y +1
si 5 y < 0
f (y) = 25 y 5 1
si 0 y < 5
+
25 5
0
si y 5.
Observemos que, conocidas las funciones de densidad de cada una de las variables aleatorias, no determinamos la distribuci
on conjunta de los valores de
Manuales Uex
115
R R
(X(), Y ()).
5.2.1.
Funci
on de probabilidad conjunta
Manuales Uex
116
p(x, y) = 1.
x,yS
asigna el vector (0, 2), el vector (1, 1) se asocia a los sucesos {ET 1&ET 3},
{ET 1&ET 4}, {ET 1&ET 5}, {ET 2&ET 3}, {ET 2&ET 4}, {ET 2&ET 5} y el
vector (2, 0) a los sucesos {ET 3&ET 4}, {ET 3&ET 5}, {ET 4&ET 5}. Por ello,
la funci
on de probabilidad conjunta es
P (X = 0, Y = 2) =
6
3
1
, P (X = 1, Y = 1) =
y P (X = 2, Y = 0) =
.
10
10
10
5.2.2.
Funci
on de densidad conjunta
Manuales Uex
117
y1
Manuales Uex
118
0
si x < 10
0
si y < 5
x
1
1
si 10 x < 0, 5 y < 0
+ 10 25 + 5
100
x
1
1
+5
si 10 x < 0, 0 y < 5
+
f (x, y) = 100x 10 1 25
y
1
+
+
10 25
5 si 0 x < 10, 5 y < 0
100
y
x
1
100 + 10 25 + 15
si 0 x < 10, 0 y < 5
0
si
y5
0
si x 10.
En este caso, el espacio muestral es el producto cartesiano de los espacios muestrales de las dos variables. Notemos que el valor de una variable no determina
unvocamente el valor de la otra. En la Figura 5.2 mostramos la representaci
on gr
aca de la funci
on de densidad. Observamos que al vector (0, 0) la
funci
on de densidad le asigna el m
aximo valor. Por tanto, es m
as probable que
4
2
y
0
2
4
10
0
x
10
10
10
5.2.3.
Manuales Uex
119
pX (x) = P (X = x) =
p(x, y) y pY (y) = P (Y = y) =
(x,y)S
p(x, y),
(x,y)S
3
1
, P (Y = 0) = P (X = 2, Y = 0) =
,
10
10
P (X = 1) = P (X = 1, Y = 1) =
6
6
, P (Y = 1) = P (X = 1, Y = 1) =
,
10
10
P (X = 2) = P (X = 2, Y = 0) =
1
3
, P (Y = 2) = P (X = 0, Y = 2) =
.
10
10
Manuales Uex
de la otra.
120
De manera analoga, cuando las dos variables aleatorias son continuas, calculamos las funciones de densidad marginales como
fX (x) =
f (x, y)dx.
Y |X
0
1
2
0
0
P (X = 0, Y = 2)
0
P (X = 1, Y = 1)
0
P (X = 2, Y = 0)
0
0
0
si x < 10
0
si y < 5
x + 1
y +1
si
10
x
<
0
si
5 y <0
fX (x) = 100x 10 1
y fY (y) = 25 y 5 1
+
si 0 x < 10
si 0 y < 5
100 10
25 5
0
si x 10
0
si y 5.
En el gr
aco de la izquierda de la Figura 5.4 mostramos la funci
on de densidad
de la variable aleatoria X y en el graco de la derecha la funci
on de densidad
de la variable aleatoria Y . Comparandolas, deducimos que ambas variables son
simetricas, tienen la misma media y mediana y la dispersion de X es mayor
que la de Y . Este hecho se maniesta en que la magnitud de la varianza y
la meda de la variable aleatoria Y es menor que la varianza y la meda de la
variable aleatoria X, respectivamente. Esto puede obedecer a las caractersticas
de precision de un distanci
ometro digital frente a uno anal
ogico.
5.3.
A partir de la funci
on de probabilidad o de densidad conjunta del vector aleatorio (X, Y ) podemos determinar si las variables aleatorias X e Y son independientes o por el contrario est
an relacionadas, en el sentido de que el valor
Manuales Uex
En resumen, la funci
on de probabilidad o de densidad conjunta de un vector
aleatorio (X, Y ) no solo determina la distribuci
on conjunta de las dos variables,
sino que tambien describe el comportamiento probabilstico de las variables
aleatorias a traves de las distribuciones marginales.
121
f(y)
0.00
0.00
0.05
0.05
0.10
f(x)
0.15
0.10
0.20
0.25
0.15
15
10
10
15
10
10
P (X = x, Y = y)
= P (X = x).
P (Y = y)
Manuales Uex
122
5.4.
Medidas de asociaci
on
En general, aunque variables aleatorias sean dependientes, el valor de una variable no tiene porque determinar de manera unvoca el valor de la otra, aunque
s condiciona su comportamiento. Para medir el grado de dependencia entre
ambas variables introducimos medidas de asociaci
on. La denici
on e interpretaci
on de estas medidas es analoga a la de las medidas de asociacion muestrales
expuestas en el Tema 2 para analizar descriptivamente dos caracteres cuantitativos, referidas ahora a los valores que toma las variables aleatorias. En
caso de confusion, llamamos a estas medidas de asociacion poblacionales para
distinguirlas de la muestrales, que hacen referencia a un conjunto de datos.
A continuaci
on denimos la covarianza y el coeciente de correlacion de un
vector aleatorio (X, Y ).
La covarianza del vector aleatorio (X, Y ), la denotamos por XY y la denimos
como el valor esperado del producto de las diferencias entre las variables y
sus medias. Seg
un sean las dos variables discretas o continuas obtenemos las
siguientes expresiones para el calculo de la covarianza,
XY =
x,yS
XY =
(x X )(y Y )p(x, y)
Manuales Uex
123
6
6
4
1
4
6
XY =
+ 1
0
2
5
5
10
5
5
10
9
6
4
3
= .
+ 2
0
5
5
10
25
Como el valor de la covarianza es negativo, deducimos que existe una relacion
lineal inversa entre las variables. De hecho tenemos que Y = 2 X.
Por contra, para las variables aleatorias continuas X e Y descritas en el Ejemplo 5.2, obtenemos que
0 2
0 2
x
y
x
y
+
+
XY =
dx
dy
100 10
25 5
10
5
5 2
0 2
x
y
x
y
+
+
dx
dy
+
100 10
25 5
10
0
0 2
10
x
y
x2
y
+
+
dx
dy
+
100 10
25 5
0
5
5 2
10
x
y
x2
y
+
+
dx
dy = 0.
+
100 10
25 5
0
0
Manuales Uex
124
2
X XY
,
XY
Y2
XY
,
X Y
Con todo ello, deducimos que XY = 1, que nos indica la existencia de una
relaci
on lineal inversa exacta entre X e Y . Finalmente, como las variables
aleatorias consideradas en el Ejemplo 5.2 son independientes, tenemos que el
coeciente de correlacion es nulo.
De la propia denici
on del coeciente de correlacion, obtenemos que XX = 1,
no importa el orden en la relaci
on. Ademas, como el coeciente de correlacion
es una medida relativa, su magnitud no est
a afectada por transformaciones
lineales de las variables aleatorias. Observemos que el coeciente de correlacion
s
olo nos informa de la existencia de relaci
on lineal.
Manuales Uex
125
5.5.
Transformaci
on de vectores aleatorios
En muchas situaciones pr
acticas no es posible determinar de manera directa el
comportamiento de un vector aleatorio (Z, W ) de interes para nuestro estudio.
En cambio podemos conocer el comportamiento de otro vector aleatorio (X, Y )
que determina al vector (Z, W ) de manera indirecta aplicando cierta transformacion, (Z, W ) = g(X, Y ). Ejemplos de esta situacion son la descripcion del
comportamiento probabilstico de la medicion de un
angulo horizontal como
diferencia o suma de mediciones de dos angulos horizontales, la descripci
on
del area de un rectangulo a partir de las mediciones de la base y la altura o la
descripcion de la altura y la distancia horizontal entre dos puntos, conocidas
la medicion del
angulo de inclinaci
on y la medici
on de la distancia entre ellos.
Conocida la funci
on de probabilidad o de densidad conjunta del vector aleatorio
(X, Y ), es posible obtener en determinadas situaciones, mediante un cambio de
variables, la funci
on de probabilidad o de densidad conjunta del vector aleatorio
(Z, W ). Sin embargo, en la mayora de las situaciones practicas, solo estamos
interesados en determinar medidas caractersticas del vector aleatorio (Z, W ),
m
as que en la propia funci
on de probabilidad o de densidad conjunta. Estas
medidas caractersticas pueden ser aproximadas realizando c
alculos sencillos a
partir de las medidas caractersticas del vector (X, Y ). Este procedimiento es
el aplicado habitualmente en las pr
acticas de campo, a pesar de obtener solo
una aproximaci
on de las medidas caractersticas.
A continuaci
on, aproximamos las medias y la matriz de varianzas-covarianzas
del vector aleatorio (Z, W ), a partir de la medidas caractersticas del vector
aleatorio (X, Y ). En primer lugar suponemos que Z = a1 X + b1 Y + c1 y
Manuales Uex
126
ente ambos vectores aleatorios es de tipo lineal. Para facilitar los calculos, esta
relaci
on la expresamos matricialmente como
Z
W
a1
a2
b1
b2
c1
c2
X
Y .
1
(5.1)
2
Z
ZW
ZW
2
W
Z
W
a1
a2
b1
b2
a1
a2
c1
c2
b1
b2
c1
c2
2
X
XY
0
X
Y ,
1
XY
Y2
0
(5.2)
a1
0
0 b1
c1
0
a2
b2 .
c2
(5.3)
X
2
Z = 1 1
y Z = 1 1
Y
XY
XY
Y2
1
1
2
2
= X
+ Y2 2XY .
Z = X Y y Z
la varianza de Z es la suma de las varianzas de X e Y . Esta situacion de independencia se verica cuando al medir el angulo no utilizamos la referencia
utilizada para medir el angulo , tal y como mostramos en el graco central
de la Figura 5.5. En cambio si la covarianza es positiva, la varianza de Z es
menor que la suma de las varianzas de las variables X e Y . Esta situacion
Manuales Uex
127
X
Y
X
Y
g1
g1
Z g1 (X , Y ) +
(X X ) +
(Y Y ),
x (X ,Y )
y (X ,Y )
g2
g2
W g2 (X , Y ) +
(X X ) +
(Y Y ), (5.4)
x (X ,Y )
y (X ,Y )
siendo
gi
t
(X ,Y )
ximaci
on es la generalizacion dada en el tema anterior para la transformaci
on
Manuales Uex
128
g1
g1
=1 y
= 1.
x (X ,Y )
y (X ,Y )
As, aplicando la ecuaci
on (5.4), deducimos que la aproximaci
on
Z X Y + (X X ) (Y Y ) = X Y,
es exacta.
Teniendo en cuenta la aproximaci
on de (Z, W ) dada en (5.4), deducimos que
dicha aproximaci
on es de tipo lineal como la descrita en (5.1), tomando
gi
gi
ai =
, bi =
,
x (X ,Y )
y (X ,Y )
ci = gi (X , Y ) X
gi
x
(X ,Y )
gi
y
(X ,Y )
para i {1, 2}. A partir de (5.2) y (5.3) obtenemos aproximaciones a las medias
y a la matriz de varianzas-covarianzas, respectivamente, del vector (Z, W ) en
funci
on de las medidas caractersticas del vector aleatorio (X, Y ).
Ejemplo 5.12 Supongamos que estamos interesados en determinar el area
de un rectangulo a partir de las mediciones de su base y altura. Si el comportamiento de las mediciones del area, la base y la altura del rect
angulo es
descrito por las variables aleatorias Z, X e Y , respectivamente, deducimos
que Z = XY , que no es una transformaci
on lineal. Aplicando la aproximaci
on
dada en (5.4), tenemos que
Manuales Uex
Z X Y + Y (X X ) + X (Y Y ),
129
Altura
Distancia horizontal
Manuales Uex
2
2
W X cos Y y W
X
cos2 Y +2X Y2 sen2 Y 2X XY cos Y sen Y ,
130
2
ZW X
cos Y sen Y 2X Y2 cos Y sen Y + X (cos2 Y sen2 Y )XY .
Notemos que puede ocurrir que XY sea nulo y ZW no lo sea, pues la transformaci
on puede denir cierta relaci
on entre las variables aleatorias Z y W .
Este hecho lo ilustramos en la Figura 5.7 donde mostramos el diagrama de dispersion para un conjunto de datos extrado del experimento aleatorio asociado
1.8
1.6
0.8
1.0
1.2
0.9
1.4
1.0
1.1
2.0
1.2
2.2
2.8
2.9
3.0
3.1
3.2
2.2
2.4
2.6
2.8
5.6.
Pr
acticas de laboratorio
Para la situaci
on descrita en el Ejemplo 5.4, utilizamos las siguientes sen-
Representar la funci
on de densidad conjunta
f<-function(x,y){
(x/100+1/10)*(y/25+1/5)*(-10<=x)*(x<0)*(-5<=y)*(y<0)+
Manuales Uex
tencias:
131
(x/100+1/10)*(-y/25+1/5)*(-10<=x)*(x<0)*(0<=y)*(y<5)+
(-x/100+1/10)*(y/25+1/5)*(0<=x)*(x<10)*(-5<=y)*(y<0)+
(-x/100+1/10)*(-y/25+1/5)*(0<=x)*(x<10)*(0<=y)*(y<5)}
x<-seq(-11,11,0.5); y<-seq(-6,6,0.5); z<-outer(x,y,f)
persp(x,y,z, theta = 30, phi = 30)
Generar 1000 valores del vector aleatorio
x1<-runif(1000,-5,5); x2<-runif(1000,-5,5)
y1<-runif(1000,-2.5,2.5); y2<-runif(1000,-2.5,2.5)
cbind(x<-x1+x2,y<-y1+y2)
Representar el diagrama de dispersi
on de los vectores generados
plot(x,y,xlim=c(-10,10),ylim=c(-5,5))
Para mostrar las aproximaciones de las medidas caractersticas para la situaci
on descrita en el Ejemplo 5.12, utilizamos las sentencias:
Generar 10000 valores de un vector aleatorio
library(MASS); xy<-mvrnorm(10000,c(5,6),cbind(c(1,.5),c(.5,1)))
x<-xy[,1];y<-xy[,2]; z<-x*y
Representar las observaciones directas y las indirectas
Manuales Uex
plot(x,y); hist(z)
132
Cuestiones y problemas
Manuales Uex
5.7.
133
f(x,y)
f(x,y)
Figura 5.8: Funciones de densidad conjuntas para el vector aleatorio considerado en el Problema 2.
iii) Si dos variables aleatorias discretas son independientes, entonces las funciones de probabilidad de dichas variables aleatorias determinan la funcion de probabilidad conjunta.
iv) La varianza de la suma de dos variables aleatorias es la suma de las
varianzas de dichas variables aleatorias.
v) La varianza de la suma de dos variables aleatorias es mayor o igual que
la suma de las varianzas de dichas variables aleatorias.
vi) La covarianza del vector (X, Y ) coincide con la del vector (X + a, Y + b),
para cualesquiera valores a, b R.
2. Discutir razonadamente cu
al de las funciones de densidad conjuntas mostradas en la Figura 5.8 est
a asociada a un vector aleatorio continuo tal que el
coeciente de correlacion entre sus variables sea negativo.
3. Supongamos que de las 5 estaciones totales existentes en el Centro Universitario de Merida, 2 estan mal calibradas. Adem
as, supongamos que las
Manuales Uex
pr
acticas de cierta asignatura se dividen en dos sesiones practicas y que al
134
Manuales Uex
135
Manuales Uex
7. Utilizando el software estadstico R y un conjunto de datos generados asociado al experimento aleatorio descrito en el problema anterior, comparar las
medidas caractersticas asociadas al area del rectangulo y las aproximaciones
obtenidas a partir de las medidas caractersticas de las medidas directas.
136
Tema 6
Principales modelos de
probabilidad en el campo de la
Topografa
6.1.
Introducci
on
Como hemos comentado en los temas anteriores, el comportamiento probabilstico de una variable o vector aleatorio queda determinado una vez conocida su funci
on de probabilidad para el caso discreto, o su funci
on de densidad
para el caso continuo. En la pr
actica no siempre es evidente la distribucion de
probabilidad o modelo probabilstico que subyace a un experimento aleatorio
y ha de ser el experimentador el que ajuste una funci
on de probabilidad o de
densidad a las variables de interes. La eleccion de estas funciones debe estar
motivada por la compresi
on de la naturaleza del experimento, y la validez de
la eleccion debe ser vericada a traves de la evidencia emprica.
Por tanto, a la hora de elegir, el experimentador debe conocer en profundiexponemos una serie de modelos de probabilidad discretos y continuos, tanto
para variables como para vectores aleatorios, frecuentemente utilizados en el
campo de la Topografa. Para cada uno de estos modelos ofrecemos una discusi
on sobre las condiciones que debe vericar el experimento para su aplicaci
on,
deduciendo la expresi
on matematica del modelo en base a estas condiciones.
Manuales Uex
137
6.2.
6.2.1.
Distribuci
on uniforme discreta
Para una variable aleatoria discreta cuyo espacio muestral tiene cardinal nito con todos sus elementos equiprobables, una distribuci
on de probabilidad
adecuada es la uniforme discreta.
Ejemplo 6.1 Consideramos el experimento aleatorio descrito en el Ejemplo
3.1, donde elegimos al azar una estacion total de entre las cinco existentes en
el almacen del Centro Universitario de Merida. Si enumeramos las estaciones
totales del uno al cinco y denimos la variable aleatoria X, ndice de la estaci
on
total seleccionada, tenemos que el espacio muestral de la variable aleatoria
Manuales Uex
138
0.0
0.00
0.2
0.05
0.4
0.10
p(x)
F(x)
0.6
0.15
0.8
0.20
1.0
0.25
P (X = xi ) =
1
, i {1, . . . , n}.
n
De su propia denici
on, deducimos que para determinar un modelo uniforme
solo es necesario especicar el espacio muestral de la variable aleatoria. Gracamente, un distribuci
on uniforme est
a caracterizada por tener una funci
on
de probabilidad uniforme en los valores del espacio muestral y escalones de la
6.1.
A partir de la funci
on de probabilidad obtenemos que
n
1
1
xi y 2 =
(xi )2 .
n i=1
n i=1
Manuales Uex
139
6.2.2.
Distribuci
on binomial y de Bernoulli
Manuales Uex
buci
on de la variable aleatoria X y en el gr
aco de la derecha su funci
on de
140
p(x)
0.0
0.0
0.1
0.2
0.2
0.4
0.3
F(x)
0.6
0.4
0.5
0.8
0.6
1.0
1.0
0.5
0.0
0.5
1.0
1.5
2.0
1.0
0.5
0.0
0.5
1.0
1.5
2.0
P (X = 1) = p.
El par
ametro p de un modelo de Bernoulli puede representar la probabilidad
de cierto suceso del experimento aleatorio. Este suceso es codicado por la
variable como 1 y a su complementario por el valor 0. Teniendo en cuenta
este esquema, en el siguiente ejemplo consideramos una generalizacion de la
distribuci
on de Bernoulli.
Manuales Uex
Ejemplo 6.4 Para la variable aleatoria X descrita en el Ejemplo 6.3, deducimos que sigue un modelo de Bernoulli de par
ametro p = 0.6. Ademas,
on es
obtenemos que = 0.6, 2 = 0.24, la mediana es uno y la distribuci
asimetrica a la izquierda, tal y como, mostramos en el graco de la derecha de
la Figura 6.2.
141
pues en las dos sesiones se ha elegido una estacion total mal calibrada, la
seleccion en una sesion es independiente de la seleccion en la otra sesion y la
probabilidad de elegir en una sesi
on una estacion total mal calibrada es de 0.4.
Siguiendo un razonamiento an
alogo tenemos que
P (X = 2) = 0.6 0.6 = 0.36.
Finalmente, si solo se ha seleccionado una estacion total bien calibrada entre
las dos sesiones, esto implica que en una sesion se ha seleccionado una mal
calibrada y en la otra una estaci
on total bien calibrada. Como el orden en la
seleccion no importa, es decir, o bien en la primera sesi
on se ha elegido la bien
calibrada y en la segunda la mal calibrada o viceversa, tenemos que
P (X = 1) = 2 0.4 0.6 = 0.48.
En el gr
aco de la izquierda de la Figura 6.3 mostramos la funci
on de distribuci
on de la variable aleatoria X y en el gr
aco de la derecha su funci
on de
Manuales Uex
142
0.3
0.0
0.0
0.1
0.2
0.2
0.4
p(x)
F(x)
0.6
0.4
0.8
0.5
1.0
1
x
P (X = x) =
n(n 1) (n x + 1) x
p (1 p)nx , x {0, 1, . . . , n},
x(x 1) 1
Manuales Uex
si
on, tenemos que la variable aleatoria X sigue una distribuci
on binomial de
143
0.5
0.0
0.1
0.2
p(x)
0.3
0.4
0.5
0.4
0.3
p(x)
0.2
0.1
0.0
0.0
0.1
0.2
p(x)
0.3
0.4
0.5
10
12
Manuales Uex
(gr
aco de la derecha).
144
Observemos que si p > 0.5 (p < 0.5), los valores mas probables de la variable
son los valores de mayor (menor) magnitud, pues en promedio m
as (menos)
de la mitad de las repeticiones seran favorables a la observaci
on del suceso
de interes. El calculo de las probabilidades de un modelo binomial puede ser
0.4
0.0
0.1
0.2
p(x)
0.3
0.4
0.3
0.2
p(x)
0.0
0.1
0.2
0.0
0.1
p(x)
0.3
0.4
3
x
Manuales Uex
145
Manuales Uex
146
Manuales Uex
147
0.20
0.15
p(x)
0.10
0.05
0.00
0.00
0.05
p(x)
0.10
0.15
0.20
10
15
x
20
25
30
10
20
30
40
50
60
6.3.
A continuaci
on exponemos distribuciones de probabilidad asociadas a variables aleatorias continuas. A pesar de existir un gran abanico de modelos que
describen una extensa variedad de situaciones pr
acticas, nos centramos en el
modelo uniforme y en el modelo normal, as como los modelos asociados a la
distribuci
on normal, por ser las que aparecen con mayor frecuencia en campo
de la Topografa.
6.3.1.
Distribuci
on uniforme continua
Al igual que en el caso discreto, un modelo de interes es la distribucion uniforme. Se caracteriza por asignar la misma probabilidad a intervalos incluidos
en el espacio muestral que tengan la misma amplitud. Es apropiado cuando la
amplitud del espacio muestral es nito y no observamos de antemano zonas
m
as probables que otras.
Ejemplo 6.10 Supongamos que la variable aleatoria X considerada en el
Ejemplo 4.2, que modeliza el error en milmetros cometido con un distan-
Manuales Uex
148
0,
F (x) = x+10
20
1,
si x < 10
0,
si 10 x < 10 y f (x) = 1
20 ,
si x 10
si x < 10 o x > 10
si 10 x 10,
f(x)
0.0
0.00
0.01
0.2
0.02
0.4
0.03
F(x)
0.6
0.04
0.8
0.05
1.0
0.06
15
10
10
15
15
10
10
15
0,
1
ba ,
si x < a o x > b
si a x b.
b+a
(b a)2
y 2 =
.
2
12
Manuales Uex
la expresion
149
6.3.2.
Distribuci
on normal
Manuales Uex
150
x2
1
f (x) = e 2 , x R.
2
En el gr
aco de la izquierda de la Figura 6.8 mostramos su funci
on de distribucion y en el gr
aco de la derecha su funcion de densidad, donde observamos su
forma acampanada. De sus propiedades deducimos que la media y la mediana
0.2
0.0
0.0
0.2
0.1
0.4
f(x)
F(x)
0.6
0.3
0.8
1.0
0.4
0.4
0.3
0.2
f(x)
0.1
0.2
0.1
f(x)
0.3
0.4
F(x)
0.0
0.0
F(x)
3
0
x
1F(x)
1
Figura 6.9: C
alculo de la funci
on de distribuci
on de la normal estandar para
valores negativos teniendo en cuenta su simetra.
del modelo normal estandar son nulos, el valor de su varianza es la unidad y
es una distribuci
on simetrica, con valores mas probables cuanto m
as cercanos
a cero, donde alcanza el maximo la funcion de densidad.
El calculo de la funci
on de distribuci
on del modelo normal estandar esta implementado en cualquier software estadstico. En cualquier caso en el Cuadro
A.2 mostramos una tabulaci
on de dichos valores. A continuaci
on, indicamos
P (X 2) = 0.977 y P (X 2) = 1 P (X 2) = 0.023.
Observemos que la tabulacion anterior no nos permite calcular de manera
directa la funci
on de distribuci
on para valores negativos. Sin embargo, por
la simetra del modelo normal, tenemos que F (x) = 1 F (x), tal y como
Manuales Uex
151
0.4
0.1
0.997
0.0
0.0
0.0
0.1
0.954
0.2
f(x)
0.3
0.4
0.3
0.2
f(x)
0.2
0.683
0.1
f(x)
0.3
0.4
Manuales Uex
P (z/2 X z1/2 ) = 1 .
152
0.2
z1
0.1
f(x)
0.3
0.4
0.0
2
3
2
1
(x)2
1
e 22 , x R.
2
Manuales Uex
153
Manuales Uex
154
x
X
=P
Manuales Uex
155
0.3
0.2
f(x)
200
0.954
0.0
0.1
0.954
100
f(x)
300
0.4
400
4.996
4.998
5.000
5.002
5.004
Y 5
5.002 5
P (Y 5.002) = P
= P (Z 2) = 0.977.
0.001
0.001
Asimismo
P (Y 4.998) = P
4.998 5
Y 5
0.001
0.001
= P (Z 2) = 0.023,
Manuales Uex
y por tanto
156
Manuales Uex
pr
acticas, en especial de un proceso de medicion, es el teorema central del lmi-
157
60
40
f(x+y)
f(y)
4.990
4.995
5.000
5.005
5.010
20
20
20
40
40
60
f(x)
80
60
100
80
120
80
100
140
6.985
6.990
6.995
7.000
7.005
7.010
11.98
11.99
12.00
12.01
12.02
x+y
Xi
i=1
Manuales Uex
central) y n = 30 (gr
aco de la derecha). Observemos que, a pesar de ser la
158
0.10
0.06
p(x)
0.04
p(x)
0.05
4
0
x
0.00
0.00
0.00
0.05
0.02
0.10
p(x)
0.15
0.20
0.10
0.08
0.25
0.30
0.15
10
0
x
10
20
10
10
20
Manuales Uex
P (X = 0) P (Y 1/2) y P (X = n) P (Y n 1/2),
159
0.00
0.05
p(x)
0.10
0.15
10
15
20
25
29.5 46
P (W 30) P (T 29.5) = P Z
43.884
= 1 P (Z 2.491) = 0.994,
Manuales Uex
160
6.3.3.
0.4
0.3
f(x)
0.2
n=4
n=8
0.1
2
0
0.0
f(x)
n=2
10
15
20
Manuales Uex
de su funci
on de densidad, que es no acotada y esta denida para cualquier
161
Zi2 ,
i=1
Manuales Uex
162
2 1 2
2
2 2
1
2
Manuales Uex
163
0.4
N(0,1)
f(t)
0.2
0.3
n=4
0.0
0.1
n=1
n
, n > 2.
n2
Para cualquier p, tal que 0 < p < 1, denotamos por tp (n) al cuantil de orden
p de la variable aleatoria T , es decir
P (T tp (n)) = p.
Por tanto, si 0 < < 1, obtenemos que
P (t/2 (n) T t1/2 (n)) = 1 .
Por la simetra de la distribuci
on t de Student, deducimos que t/2 (n) =
t1/2 (n). En la Figura 6.22, mostramos la posici
on de los cuantiles t/2 (n)
Manuales Uex
t(n) para ciertos valores de n y p, con p > 0.5. Para valores grandes de n
164
utilizamos la aproximaci
on a un modelo normal est
andar. Como t0.975 (2) =
4.303, entonces deducimos que
P (4.303 T 4.303) = 0.95,
siendo T un modelo t de Student con 2 grados de libertad.
0.2
t1
0.1
f(t)
0.3
0.4
0.0
X/n
,
Y /m
m
2m2 (n + m 2)
, m > 2 y 2 =
, m > 4.
m2
n(m 2)2 (m 4)
Manuales Uex
m grados de libertad.
165
1.0
0.8
n=2,m=4
0.6
0.6
0.8
1.0
0.4
f(f)
n=10,m=4
0.2
0.2
0.4
f(f)
n=4,m=10
0.0
0.0
n=4,m=2
0
10
10
1
,
Fp (n, m)
1
1
F
Fp (n, m)
= 1 p.
1
P
F F1/2 (n, m) = 1 .
F1/2 (m, n)
En la Figura 6.24, mostramos la posici
on de los cuantiles F/2 (n, m) y
Manuales Uex
166
2
F
(n, m)
2
F1
(n, m)
6.4.
Una vez estudiados los principales modelos de probabilidad para variables aleatorias, tanto discretas como continuas, a continuaci
on describimos dos modelos
de probabilidad asociados a vectores aleatorios. Estos modelos se caracterizan
por denir distribuciones de probabilidad conocidas en cada una de las variables aleatorias que constituyen el vector aleatorio. Concretamente, estudiamos
el modelo multinomial, asociado a la distribuci
on binomial de las variables,
y el modelo normal multidimensional, asociado a variables aleatorias con distribuci
on normal. Con el n de reducir la notaci
on, a partir de ahora, s
olo
tender las deniciones a vectores de dimension mayor.
6.4.1.
Distribuci
on multinomial
Como hemos comentado, la distribucion binomial es un modelo apropiado para describir el comportamiento probabilstico del n
umero de veces que en n
Manuales Uex
167
Manuales Uex
B(2, 0.4), respectivamente. Como, en este caso particular, la union de los dos
168
sucesos considerados cubren todas las posibilidades, es decir, una estacion total
esta bien o mal calibrada, entonces la suma total de estaciones elegidas en las
dos sesiones es dos. Matematicamente este hecho lo expresamos como X +Y =
2.
n(n 1) (n x y + 1) x y
p p (1 pA pB )(nxy) ,
[x(x 1) 1][y(y 1) 1] A B
siendo x e y n
umeros enteros no negativos y tales que x + y n. Deducimos
Manuales Uex
En el siguiente ejemplo, no existe relacion lineal entre las variables del modelo
multinomial.
169
6.4.2.
Distribuci
on normal multivariante
Manuales Uex
1
2(1 2XY )
e
a
170
x X
X
2
x X
y Y
y Y
2XY
+
X
Y
Y
gr
aco izquierdo de la Figura 6.25, mostramos la funci
on de densidad conjunta
del modelo normal multivariante, donde apreciamos la forma acampanada, en
f(x,y)
2
x X
x X
y Y
y Y
1
2XY
= k,
+
2(1 2XY )
X
X
Y
Y
siendo k una constante. Dichas elipses esta centradas en (X , Y ) y con orientaci
on denida por el signo del coeciente de correlaci
on. En la Figura 6.26
mostramos el comportamiento de la orientacion de las curvas de nivel con
respecto al signo del coeciente de correlacion, negativo (gr
aco de la izquierda), nulo (gr
aco central) y positivo (gr
aco de la derecha). Observamos que
su orientaci
on corresponde a la relaci
on directa o inversa existente entre las
variables aleatorias X e Y .
Como comentamos en el tema anterior, un coeciente de correlacion nulo,
si el vector aleatorio (X, Y ) sigue un modelo normal multivariante, entonces
adem
as las variables aleatorias X e Y son independientes. Por tanto, en el caso
del modelo normal multivariante, la independencia es equivalente a la ausencia
de dependencia de tipo lineal. Si XY = 1, la relacion lineal entre X e Y es
perfecta y denida por la expresi
on Y = Y XY X + Y Y XY X .
Manuales Uex
171
2
+ 2abXY X Y + b2 Y2 .
delo normal con media aX + bY y varianza a2 X
X
Y
Manuales Uex
172
X X
X
Y Y
Y
X X
X
Y Y
Y
2p (2)
= p,
x X
X
y Y
Y
= 2p (2).
Cuando 0 < |XY | < 1, entonces las variables X e Y son dependientes. En este
caso, para proponer una elipse tenemos que aplicar previamente una transformacion para obtener variables aleatorias independientes.
Ejemplo 6.21 Supongamos que las variables aleatorias X e Y describen el
comportamiento probabilstico del error en la medicion de las coordenadas
cartesianas del punto Q = (QX , QY ) con respecto a un sistema de referencia ortogonal con origen en O. Supongamos tambien que el comportamiento probabilstico del vector (X, Y ) es un modelo normal multivariante de
par
ametros X = Y = 0 (en media no se comete error en la medicion),
2
X
= Y2 = 0.000025 y XY = 0 (las mediciones de las coordenadas se rea-
lizan de manera independiente). Como 20.95 (2) = 5.991 (ver Cuadro A.4),
to Q, determinada por las mediciones, yace en la circunferencia con centro
de distribuci
on de las posiciones del punto Q determinadas por las mediciones
(gr
aco de la derecha), ambas con una probabilidad de 0.95.
Manuales Uex
173
(0,0)
0.95
QY
0.95
QX
6.5.
Pr
acticas de laboratorio
Para la descripci
on de un modelo uniforme discreto, utilizamos las sentencias:
Generar valores del experimento aleatorio asociado
library(e1071); x<-rdiscrete(10000,prob=rep(1/5,5),value=1:5)
plot(table(x)/length(x))
Para la descripci
on de un modelo binomial, utilizamos las sentencias:
Calcular la funci
on de probabilidad
n<-6; p<-0.25; x<-1; round(dbinom(x,n,p),3)
Representar la funci
on de probabilidad
Manuales Uex
plot(0:n,dbinom(0:n,n,p),xlab="x",ylab="p(x)",type="h",lwd=4)
174
Calcular la funci
on de distribuci
on
x<-1; round(pbinom(x,n,p),3)
Representar la funci
on de distribuci
on
plot((-1):(n+1),pbinom((-1):(n+1),n,p),xlab="x",
ylab="F(x)",type="s")
Generar valores del experimento aleatorio asociado
x<-rbinom(10000,n,p);plot(table(x)/length(x))
Para la descripci
on de un modelo uniforme continuo, utilizamos las sentencias:
Calcular la funci
on de densidad
a<--10; b<-10; x<-0; dunif(x,a,b)
Representar la funci
on de densidad
x<-seq(a-5,b+5,0.01)
plot(x,dunif(x,a,b),xlab="x",ylab="f(x)",type="l")
Calcular la funci
on de distribuci
on
x<-0; punif(x,a,b)
Representar la funci
on de distribuci
on
x<-seq(a-5,b+5,0.01)
plot(x,punif(x,a,b),xlab="x",ylab="F(x)",type="s")
Generar valores del experimento aleatorio asociado
x<-runif(10000,a,b); hist(x,prob=T); abline(h=0.05,lty=2)
Calcular la funci
on de densidad
me<-0; vari<-1; x<-0; dnorm(x,me,sqrt(vari))
Representar la funci
on de densidad
Manuales Uex
Para la descripci
on de un modelo normal, utilizamos las sentencias:
175
x<-seq(-3.25,3.25,0.1)
plot(x,dnorm(x,me,sqrt(vari)),type="l",xlab="x",ylab="f(x)")
Calcular la funci
on de distribuci
on
x<-0; pnorm(x,me,sqrt(vari))
Representar la funci
on de distribuci
on
x<-seq(-3.25,3.25,0.1)
plot(x,pnorm(x,me,sqrt(vari)),type="l",xlab="x",ylab="F(x)")
Calcular el cuantil de orden p
p<-0.975; round(qnorm(p,me,sqrt(vari)),3)
Generar valores del experimento aleatorio asociado
x<-rnorm(10000,me,sqrt(vari)); hist(x,prob=T)
x<-seq(-3.25,3.25,0.1);lines(x,dnorm(x,me,sqrt(vari)))
Para situaci
on descrita en el Ejemplo 6.14, utilizamos las sentencias:
Generar 1000 valores de cada modelo normal
x<-rnorm(10000,5,0.003);y<-rnorm(10000,7,0.004); z<-x+y
Representar y comparar los valores generados
hist(z,br=50,prob=T,xlab="x+y",ylab="f(x+y)",main=)
lines(x<-seq(min(z),max(z),0.0001),dnorm(x,12,sqrt(0.000025)))
Manuales Uex
176
las sentencias:
plot(0:30,dbinom(0:30,30,0.5),xlab="x",ylab="p(x)",type="h",
lwd=21, ylim=c(0,.15),col="gray",xlim=c(5,25))
lines(x<-seq(5,25,0.1),dnorm(x,15,sqrt(7.5)))
Calcular la funci
on de distribuci
on
x<-0; pt(x,n)
Representar la funci
on de distribuci
on
Manuales Uex
x<-seq(-8,8,0.1); plot(x,dt(x,n),type="l",xlab="x",ylab="f(x)")
177
x<-seq(-8,8,0.1); plot(x,pt(x,n),type="l",xlab="x",ylab="F(x)")
Calcular el cuantil de orden p
p<-0.975; round(qt(p,n),3)
Para la descripci
on de un modelo F de Snedecor, utilizamos las sentencias:
Calcular la funci
on de densidad
n<-8; m<-6; x<-0; df(x,n,m)
Representar la funci
on de densidad
x<-seq(0,15,0.1)
plot(x,dt(x,n,m),type="l",xlab="x",ylab="f(x)")
Calcular la funci
on de distribuci
on
x<-0; pf(x,n,m)
Representar la funci
on de distribuci
on
x<-seq(0,15,0.1)
plot(x,pf(x,n,m),type="l",xlab="x",ylab="F(x)")
Calcular el cuantil de orden p
p<-0.975; round(qf(p,n,m),3)
Para la descripci
on de un modelo multinomial, utilizamos las sentencias:
Manuales Uex
Calcular la funci
on de probabilidad conjunta
178
6.6.
Cuestiones y problemas
Manuales Uex
179
Manuales Uex
180
Manuales Uex
6. Utilizando el software estadstico R y valores generados de un modelo uniforme U (5, 5), mostrar que la suma de dos variables aleatorias con modelo
uniforme continuo no sigue un modelo uniforme. Discutir cu
al es el modelo de
probabilidad m
as adecuado para describir dicha suma, cuando el n
umero de
sumandos aumenta.
181
Bloque Tem
atico III
Manuales Uex
Teora de muestras
183
Tema 7
Introducci
on a la Teora de
muestras
7.1.
Introducci
on
Una vez conocida la funcion de probabilidad o de densidad de una variable aleatoria, es posible determinar su comportamiento probabilstico y el del
car
acter que describe. Sin embargo, lo habitual es que, ya sea por razones
economicas, de tiempo o fsicas, no tengamos acceso a todos los individuos
de la poblaci
on y por tanto no podemos determinar dichas funciones. En la
pr
actica solo dispondremos de un conjunto de datos obtenidos al tomar los
valores del caracter sobre un subconjunto de la poblaci
on al que denominamos
muestra. A partir de estos datos podemos extraer informaci
on sobre la distribuci
on de probabilidad de la variable que describe al car
acter bajo estudio,
utilizando las tecnicas que expondremos en el bloque tematico de inferencia
estadstica. Pero para que este proceso de inferencia aporte resultados ables,
los individuos de la muestra han de representar adecuadamente el comportamuestras estudia procedimientos, basados en el azar, destinados a seleccionar
una muestra representativa de una poblaci
on. En este tema expondremos los
aspectos fundamentales de esta teora y analizaremos las propiedades de la
media y la cuasivarianza muestral bajo la hip
otesis de que los datos proceden
de una variable que sigue un modelo normal.
Manuales Uex
185
7.2.
Como hemos comentado, cuando no es posible determinar el valor de una variable en todos los elementos de la poblacion, seleccionamos un conjunto de
individuos representativos, al que denominamos muestra. Para que la muestra
sea representativa es preciso que el proceso de seleccion sea aleatorio y que cada elemento de la poblaci
on tenga la misma oportunidad de ser incluido en la
muestra. Al conjunto de datos obtenidos tras realizar este tipo de muestreo lo
denominamos muestra aleatoria simple. El procedimiento de obtenci
on de una
muestra aleatoria simple depende de las caractersticas de la poblacion. Si los
elementos de la poblacion existen conceptualmente, pero no en la realidad, como sucede en el caso de las mediciones, las observaciones las obtenemos de manera consecutiva, repitiendo el experimento aleatorio de manera independiente
bajo condiciones identicas para los factores que son controlables. En cambio,
cuando la seleccion la realizamos en una poblaci
on de elementos tangibles, el
n
umero total de elementos es nito. En esta situacion, cada elemento de la
muestra lo seleccionamos al azar de entre todos los elementos de la poblacion,
despues de reemplazar (devolver) a la poblaci
on el u
ltimo elemento seleccionado. Para seleccionar un elemento al azar, enumeramos consecutivamente los
elementos de la poblacion y mediante un software estadstico generamos un
valor de un modelo uniforme discreto, siendo los ndices asignados su espacio
muestral. Dicho valor indica el elemento a seleccionar. Este procedimiento de
seleccion implica que las repeticiones son independientes y que en cada repeticion los elementos de la poblacion son equiprobables. En ocasiones, cuando el
tama
no de la poblaci
on es mayor que 30 y el tama
no de la muestra no supera
el 10 % del total, el elemento seleccionado puede no ser reemplazado y la mues-
Manuales Uex
186
Manuales Uex
187
Manuales Uex
188
la informaci
on proporcionada por una muestra aleatoria simple. Generalmente, dicha informaci
on es una funcion de los valores de la muestra, como por
ejemplo la media muestral o la cuasivarianza muestral, que sintetizan el comportamiento del conjunto de datos. Pero en las tecnicas empleadas en inferencia estadstica no solo es determinante la informaci
on contenida en los datos.
Muestra 1
Muestra 2
..
.
Muestra m
(X1 , . . . , Xn )
S2
x1,1 , . . . , xn,1
x1,2 , . . . , xn,2
..
.
x1,m , . . . , xn,m
x1
x2
..
.
xm
s21
s22
..
.
s2m
X=
X1 + . . . + Xn
1
y S2 =
(Xi X)2 ,
n
n 1 i=1
describen el comportamiento probabilstico de la media muestral y la cuasivarianza muestral, respectivamente. Observemos que a las variables aleatorias X
y S 2 las denotamos con letras may
usculas a diferencia de la media muestral
y cuasivarianza muestral de una muestra concreta fueron denotadas por x y
s2 , respectivamente, en el bloque tematico referido a estadstica descriptiva.
Por tanto, x y s2 son los valores de las variables aleatorias X y S 2 , respectivamente, cuando la realizacion del vector (X1 , . . . , Xn ) es una muestra con
media muestral x y cuasivarianza muestral s2 . En el Cuadro 7.1 mostramos
los valores de X y S 2 , cuando hemos observado m muestras aleatorias simples,
donde xi,j denotan el valor de la i-esima observacion de la muestra j-esima,
y xj y s2j denota a la media muestral y cuasivarianza muestral, respectivacuasivarianza estan asociados a muestras, que son el resultado de obtener una
muestra aleatoria simple.
Ejemplo 7.3 Supongamos que la variable aleatoria X describe el comportamiento aleatorio de observar cierta distancia, expresada en metros, con un
Manuales Uex
189
200
500
400
600
1000
800
1500
15.245
15.250
15.255
15.260
0.00000
0.00005
0.00010
0.00015
Manuales Uex
A continuaci
on estudiamos la distribuci
on de las variables aleatorias X y S 2 ,
190
que denen la forma del histograma de los valores x y s2 dados en la Figura 7.1,
cuando el n
umero de muestras es sucientemente grande. Al comportamiento
probabilstico de dichas variables lo denominamos distribuci
on en el muestreo
de la media muestral y de la cuasivarianza muestral, respectivamente. Este
comportamiento depende del tama
no muestral, as como de la distribuci
on de
7.3.
Distribuci
on en el muestreo de la media
muestral con varianza conocida
n
n
1
1 2
2
2
,
Xi = y X
= 2
X i =
n i=1
n i=1
n
X es una transformaci
on lineal de variables aleatorias independientes siguiendo
un modelo normal, deducimos que la distribuci
on de muestreo de la media
muestral es tambien normal, con media y varianza 2 /n. En esta situacion,
X y X pertenecen a la misma familia de distribuciones, aunque con par
ametros
distintos.
Manuales Uex
191
100
f(x)
50
40
0
20
f(x)
60
150
80
15.24
15.25
15.26
x
15.27
15.24
15.25
15.26
15.27
Manuales Uex
192
entre los extremos del intervalo obtenido para la media de la variable aleatoria
X es de 4 milmetros. Si pretendemos reducir esa distancia, tendremos que
aumentar el tama
no muestral, pues la dispersi
on se reduce. Dicha distancia
esta determinada por el cuantil de orden 0.975 de la normal est
andar junto al
error estandar de la media, independientemente del valor de dicha media. Por
100
100
150
150
50
0
50
0.95
15.245
15.250
15.255
15.260
15.265
15.245
15.250
15.255
15.260
15.265
1.96 0.001,
n
o equivalentemente que
96.04 =
0.005
1.96
0.001
n,
es decir, el tama
no muestral tiene que ser superior a 97 para que el valor de
la media muestral del 95 % de las muestras aleatorias simples no diste mas de
1 milmetro de la media de la variable aleatoria X. Este hecho lo mostramos
en la Figura 7.4, donde representamos la relaci
on entre el tama
no muestral y
la distancia a la media de la variable aleatoria X de los extremos del intervalo
que contiene al 95 % de los valores de la media muestral.
En cambio, si la variable aleatoria X no sigue un modelo normal no podemos
garantizar que el comportamiento probabilstico de X este determinado por
deducimos que la distribuci
on de muestreo de la media muestral la podemos
aproximar por un modelo normal con media y varianza 2 /n, siempre que el
tama
no muestral sea sucientemente grande (n 30). Observemos que la apro-
ximaci
on al modelo normal es independiente de la distribuci
on probabilstica
de la variable aleatoria X.
Manuales Uex
una distribuci
on normal. Sin embargo, en virtud del teorema central del lmite
193
0.006
0.004
0.002
distancia
0.008
0.010
50
100
150
0.000075
0.000075
P 15.254 1.96
X 15.254 + 1.96
0.95,
6
6
es decir, el valor de la media muestral del aproximadamente el 95 % de las
muestras aleatorias simples de tama
no 36 extradas de manera independiente
Manuales Uex
194
15.240
15.245
15.250
15.255
15.260
15.265
15.270
15.240
150
100
50
0
20
10
40
20
60
30
200
80
40
250
100
15.245
15.250
15.255
15.260
15.265
15.250
15.252
15.254
15.256
15.258
15.260
0.6 1.645
0.24
0.24
X 0.6 + 1.645
0.90,
n
n
Manuales Uex
que
195
7.4.
Distribuci
on en el muestreo de la cuasivarianza muestral
A continuaci
on estudiamos el comportamiento probabilstico de la variable
aleatoria S 2 asociada a una muestra aleatoria simple. Tenemos que, si la varianza de la variable aleatoria X es 2 , entonces la media de la variable aleano muestral y de la distribuci
on
toria S 2 es 2 , independientemente del tama
de la variable aleatoria X. Sin embargo, un resultado para la distribuci
on en
el muestreo de la cuasivarianza muestral solo es posible bajo el supuesto que
la variable X siga un modelo normal. En este caso, el modelo 2 de Pearson esta asociado al comportamiento probabilstico de la variable aleatoria S 2 .
Concretamente, tenemos que si la variable aleatoria X sigue un modelo normal
con media y varianza 2 , entonces la variable aleatoria
(n 1)S 2
,
2
sigue una distribuci
on 2 de Pearson con n 1 grados de libertad. Observemos
que los grados de libertad obedecen a la idea de que conocido el valor de
la media muestral de una muestra de tama
no n, solo n 1 datos no estan
determinados. Ademas, notemos que la distribuci
on de S 2 no depende de la
magnitud de y es diferente a la de la variable aleatoria X.
Manuales Uex
196
f(x)
0.10
0.95
0.05
40
0
0.00
20
f(x)
60
0.15
80
15.24
15.25
15.26
x
15.27
10
15
0.484
S2
11.14329
P
2
= 0.95
4
4
Si la variable aleatoria X no sigue un modelo normal, la distribuci
on en el
muestreo de la cuasivarianza muestral no se ajusta a un modelo de probabilidad
denido. En el siguiente ejemplo ponemos de maniesto este hecho.
Ejemplo 7.8 Para la variable aleatoria X considerada en el Ejemplo 7.5,
siendo X un modelo uniforme en el intervalo denido por los valores 15.239 y
15.269, tenemos que 2 = (0.03)2 /12 y (n 1)S 2 / 2 = 12(n 1)S 2 /(0.03)2 .
En la Figura 7.7 mostramos el comportamiento de los valores de 12(n
junto a la funci
on de densidad de la distribuci
on 2 de Pearson con n 1
grados de libertad, para n = 5 (gr
aco de la izquierda) y n = 10 (gr
aco de la
Manuales Uex
197
0.00
0.00
0.02
0.05
0.04
0.06
0.10
0.08
0.10
0.15
0.12
0.14
10
12
10
15
20
Figura 7.7: Comportamiento de los valores de 12(n 1)S 2 /(0.03)2 para 10000
muestras aleatorias simples de tama
no muestral n, junto a la funci
on de densidad de la distribuci
on 2 de Pearson con n 1 grados de libertad, para
n = 5 (gr
aco de la izquierda) y n = 10 (gr
aco de la derecha), asociado a la
situaci
on descrita en el Ejemplo 7.8.
7.5.
Distribuci
on en el muestreo de la media
muestral con varianza desconocida
X
n
Manuales Uex
(n 1)S 2
2
198
el comportamiento aleatorio del error medio cometido en 5 mediciones independientes de dicha distancia. Como la variable aleatoria X sigue un modelo
normal N (15.254, 0.000025) y z0.975 = 1.960 (ver Cuadro A.3), deducimos que
1.96 0.005
1.96 0.005
= 0.95,
P
Y
5
5
es decir, la magnitud del valor absoluto del error medio muestral del 95 % de
las muestras aleatorias simples de tama
no 5 no es superior a 4 milmetros. En
cambio, si no conocemos que = 0.005, como t0.975 (4) = 2.776 (ver Cuadro
A.5), obtenemos que
P
2.776
2.776
Y
S
5
5
= 0.95,
es decir, la magnitud del valor absoluto del cociente entre el error medio muestral y la cuasivarianza muestral del 95 % de las muestras aleatorias simples de
tama
no 5 no es superior a 1.241. Por tanto, si la cuasivarianza muestral de una
muestra es 0.000005, obtenemos que el valor absoluto del error no es superior
a 6 milmetros. Observemos que esta cota del error es superior a la obtenida
anteriormente cuando el valor de la varianza era conocido. La base te
orica de
este hecho radica en que z0.975 < t0.975 (4).
Distribuci
on en el muestreo de la diferencia de dos medias muestrales
Manuales Uex
7.6.
199
X1 + . . . + XnX
,
nX
Y =
Y1 + . . . + YnY
,
nY
2
=
SX
X
Y
1
1
(Xi X)2 y SY2 =
(Yi Y )2 ,
nX 1 i=1
nY 1 i=1
Manuales Uex
7.6.1.
200
2
y varianza X
/nX + Y2 /nY . Tipicando, obtenemos que la variable aleatoria
X Y (X Y )
2
,
2
X
Y
nX + nY
XY (X Y )
2
2
X /nX +Y /nY
2 / 2 +(n 1)S 2 / 2
(nX 1)SX
Y
X
Y
Y
nX +nY 2
X Y (X Y )
2
2
1
nX
1
nY
Ejemplo 7.10 Supongamos que para medir cierto angulo utilizamos de manera independiente dos teodolitos con apreciaci
on en segundos. Si las variables
que describen el comportamiento aleatorio de medir dicho
angulo con cada
uno de los teodolitos siguen modelos normales con medias y varianzas iguales,
Manuales Uex
201
0.3
0.2
0.1
0.0
500
500
1000
1000
1500
1500
32.5425
32.5430
32.5435
32.5440
32.5425
32.5430
32.5435
32.5440
X Y
,
2
2
SX +SY
5
2 + S 2 . En el gr
de la variable aleatoria 5(X Y )/ SX
aco de la derecha de
Y
Manuales Uex
202
7.6.2.
En ocasiones las variables aleatorias X e Y no son independientes. En esta situacion, para cada elemento de la poblaci
on observamos el valor de las
dos caractersticas. As, una muestra aleatoria simple de tama
no n consiste
en seleccionar al azar n individuos a los que observamos a la vez tanto el
7.7.
Distribuci
on en el muestreo del cociente de
dos cuasivarianzas muestrales
Manuales Uex
203
7.8.
Pr
acticas de laboratorio
Manuales Uex
204
10
15
20
25
0.3
0.2
0.0
0.00
0.00
0.1
0.05
0.05
0.10
0.10
0.4
0.5
0.15
0.15
0.6
10
15
20
10
br=50, prob=T)
x<-seq(15.245,15.265,0.0001)
lines(x,dnorm(x,15.254,sqrt(0.000005)))
Generar la distribuci
on en el muestreo de la cuasivarianza muestral
Manuales Uex
m<-10000;
res<-rnorm(n*m,15.254,0.005)
hist(apply(matrix(res,n,m),2,mean),xlab="",ylab="",main="",
205
hist(160000*apply(matrix(res,n,m),2,var),xlab="",ylab="",
main="",br=50,prob=T)
lines(x<-seq(0,15,0.01),dchisq(x,4))
Determinar el tama
no muestral
plot(n<-1:150,1.96*0.005/sqrt(n),type="l",xlab="n",
ylab="distancia"); abline(h=0.001,lty=2)
Manuales Uex
lines(x,dnorm(x,15.254, sqrt(0.000075/5)),lty=2)
206
Generar la distribuci
on en el muestreo de la cuasivarianza muestral
hist(4/((0.03)^2/12)*apply(matrix(res,n,m),2,var),xlab="",
ylab="", main="",br=50,prob=T)
lines(x<-seq(0,12,0.01),dchisq(x,4),lty=2)
Cuestiones y problemas
libertad.
Manuales Uex
7.9.
207
Manuales Uex
de la cuasivarianza muestral.
208
2 +S 2
SX
Y
5
Manuales Uex
209
Bloque Tem
atico IV
Manuales Uex
Estadstica Inferencial
211
Tema 8
Introducci
on a la Teora de
Estimaci
on
8.1.
Introducci
on
Manuales Uex
213
Manuales Uex
214
ces una situacion parametrica puede ser asumida y las inferencias se centrar
an
en los parametros media y varianza de la variable aleatoria. Determinar estos
par
ametros es de vital importancia, pues si en el proceso de medicion no intervienen mas errores que el aleatorio, entonces la media representa el valor
real de la distancia medida por el distanci
ometro y la varianza la dispersi
on
8.2.
Estimaci
on puntual de la media y la varianza
X=
X1 + . . . + Xn
1
y S2 =
(Xi X)2 ,
n
n 1 i=1
Manuales Uex
par
ametros, a partir de la informaci
on proporcionada por una muestra aleato-
215
Manuales Uex
216
8.3.
Estimaci
on por intervalo de la media
Manuales Uex
217
x z1
2 1 2
+ z1
2
n
z1
x + z1
2 1 2
+ z1
2
n
z1
x z1
2 1 2
+ z1
2
n
z1
x + z1
8.3.1.
z1/2 , + z1/2
,
n
n
Manuales Uex
x z1/2 , x + z1/2
,
n
n
218
garantiz
andose que el 100(1 ) % de los intervalos as construidos contienen
de conanza esta determinada por la cantidad z1/2 / n, teniendo en cuenta las propiedades de los cuantiles del modelo normal est
andar deducimos que
al aumentar el nivel de conanza, la amplitud del intervalo tambien aumenta. Asimismo, jado el nivel de conanza, la amplitud del intervalo disminuye
al aumentar el tama
no de la muestra, pues tenemos mayor informaci
on del
comportamiento probabilstico de la poblaci
on. Una cuesti
on interesante es
determinar el tama
no muestral necesario para que la semiamplitud del intervalo de conanza sea menor que cierta magnitud d. Si el nivel de conanza es
1 , obtenemos que
1/2
.
d
Puesto que el esfuerzo de muestro aumenta con el tama
no de la muestra,
conviene tomar el menor valor de n que satisface la desigualdad anterior.
Ejemplo 8.4 Para la situaci
on descrita en el Ejemplo 8.2, tenemos que =
0.005 m., n = 4 y x = 7.001 m. Como z0.975 = 1.960 (ver Cuadro A.3), el
intervalo de conanza para la media con un nivel de conanza de 0.95 es
x z1/2 , x + z1/2
= (6.996, 7.006).
n
n
As, el valor medio de las mediciones realizadas con el distanciometro se encuentra en el intervalo denido por los valores 6.996 y 7.006, con una conanza
verdadero valor de la distancia calibrada. Sin embargo, un 5 % de los intervalos
proporcionados con este metodo no contiene a dicho valor. En el gr
aco de la
izquierda de la Figura 8.2 mostramos 50 intervalos de conanza para la media
al nivel 0.95 correspondientes a 50 muestras aleatorias simples independientes,
donde se pone de maniesto este hecho.
Manuales Uex
219
6.990
6.990
6.995
6.995
7.000
7.005
7.000
7.010
7.005
7.015
7.020
7.010
10
20
30
40
50
20
40
60
80
100
Manuales Uex
8.3.2.
220
X
,
n
S
sigue un modelo t de Student con n 1 grados de libertad, siendo S la raz
S
S
P X t1/2 (n 1) X + t1/2 (n 1)
= 1 ,
n
n
s
s
x t1/2 (n 1) , x + t1/2 (n 1)
,
n
n
s
s
x t1/2 (n 1) , x + t1/2 (n 1)
= (6.992, 7.010).
n
n
As, la media del distanci
ometro se encuentra en el intervalo denido por los
valores 6.992 y 7.010, con una conanza del 95 %. Observemos que el intervalo
de conanza obtenido tiene amplitud mayor que el obtenido cuando conocemos
el valor de la varianza.
Manuales Uex
m2 . Como t0.975 (3) = 3.182 (ver Cuadro A.5), el intervalo de conanza para
221
proporci
on de cierta caracterstica cualitativa. Para ello utilizamos el modelo
de Bernoulli, cuyo par
ametro es la proporcion a determinar.
Ejemplo 8.6 Supongamos que hemos extrado una muestra aleatoria simple
de tama
no 100 del experimento aleatorio descrito en el Ejemplo 8.3, donde
la variable aleatoria asociada al experimento es un modelo de Bernoulli de
par
ametro p, con p = P (X = 1). Como el valor uno est
a asociado al suceso
elemental de seleccionar al azar una estacion total bien calibrada de entre las
existentes en el almacen del Centro Universitario de Merida, entonces la media
muestral nos indica la proporci
on de estaciones totales bien calibradas entre las
2
seleccionadas. Si x = 0.64 y s = 0.2304, como z0.975 = 1.96 (ver Cuadro A.3),
el tama
no muestral es sucientemente grande y nx(1 x) > 5, construimos el
intervalo de conanza para p al nivel de conanza 0.95 siguiente
s
s
= (0.546, 0.734).
x z1/2 , x + z1/2
n
n
Manuales Uex
222
Observemos que a partir de la muestra hemos realizado un proceso de inferencia estadstica para la media. El intervalo de conanza es un rango de valores
en el que tenemos una conanza alta de que contenga al valor real de la media.
No confundir este intervalo asociado al par
ametro como un intervalo para el
rango de valores de la variable.
2 1 2
2
2 2
1
2
8.4.
Estimaci
on por intervalo de la varianza
(n 1)S 2
(n 1)S 2
2
P
2
= 1 ,
21/2 (n 1)
/2 (n 1)
de la distribuci
on 2 (n 1). Teniendo esto en cuenta, construimos el siguiente
Manuales Uex
(n 1)s2
(n 1)s2
,
.
21/2 (n 1) 2/2 (n 1)
223
(n 1)s2
(n 1)s2
,
= (0.000009, 0.000403).
21/2 (n 1) 2/2 (n 1)
As, la varianza asociada al distanci
ometro se encuentra en el intervalo denido
por los valores 0.000007 y 0.000306, con una conanza del 95 %.
8.5.
Estimaci
on por intervalo del cociente de
varianzas
Manuales Uex
224
X=
X1 + . . . + XnX
,
nX
n
2
=
SX
Y =
Y1 + . . . + YnY
,
nY
n
X
Y
1
1
(Xi X)2 y SY2 =
(Yi Y )2 ,
nX 1 i=1
nY 1 i=1
Y y Y2 , respectivamente.
En este modelo, ademas del estudio individual de cada par
ametro, es de interes
determinar intervalos para ciertas funciones de los mismos. Concretamente,
proporcionamos intervalos de conanza para el cociente de varianzas y para
la diferencia de medias. Si suponemos que X e Y describen el comportamiento probabilstico de las mediciones de una cierta distancia o angulo con dos
instrumentos de medida diferentes, entonces un intervalo de conanza para el
cociente de las varianza es u
til para comparar la precisi
on en la medicion de
cada uno de estos instrumentos, considerandose de la misma precision cuando
el cociente sea la unidad. Asimismo, un intervalo de conanza para la diferencia de medias es de utilidad para la comparaci
on de la discrepancia en las
mediciones con cada instrumento.
En primer lugar proporcionamos un intervalo de conanza para el cociente de
varianzas. Como las muestras aleatorias simples asociadas a cada poblacion son
extradas de manera independiente, hemos comentado en el bloque tem
atico
F de Snedecor con nX 1 y nY 1 grados de libertad. As
SY2
Y2
SY2
P F/2 (nX 1, nY 1) 2 2 F1/2 (nX 1, nY 1) 2 = 1 ,
SX
X
SX
donde (0, 1) y F/2 (nX 1, nY 1) es el cuantil de orden /2 del modelo F
Manuales Uex
2
2 2
/X
SY sigue un modelo
anterior que la distribuci
on en el muestreo de Y2 SX
225
(nX 1, nY 1)
2
F1
(nX 1, nY 1)
s2Y
s2Y
F/2 (nX 1, nY 1) 2 , F1/2 (nX 1, nY 1) 2 .
sX
sX
Observemos que el intervalo obtenido no es simetrico con respecto s2Y /s2X , pues
la distribuci
on F de Snedecor no es simetrica. Sin embargo, las propiedades e
interpretaci
on del intervalo son an
alogas a las de los intervalos para la media
y la varianza. Por convenio, cuando calculamos intervalos de conanza del
cociente de varianzas, en el numerador ponemos la varianza de la poblaci
on
que tiene mayor varianza muestral. Recordamos tambien que para el calculo
de cuantiles de un modelo F de Snedecor, tenemos que
F/2 (nX 1, nY 1) =
1
.
F1/2 (nY 1, nX 1)
Manuales Uex
226
Ejemplo 8.8 Supongamos que para medir cierto angulo utilizamos de manera
independiente dos teodolitos con apreciaci
on en segundos, de modo que las
variables que describen el comportamiento aleatorio de medir dicho angulo
con cada uno de los teodolitos siguen modelos normales. Seleccionadas las
siguientes muestras aleatorias simples de tama
no 5 asociadas a cada uno de
los teodolitos,
Muestra X: 35.3428, 35.3426, 35.3423, 35.3426, 35.3424,
8.6.
Estimaci
on por intervalo de la diferencia
de medias
A continuaci
on proporcionamos un intervalo de conanza para la diferencia
de medias X Y . Un intervalo de este tipo nos es u
til, por ejemplo, para
valorar la exactitud de dos instrumentos de medida. En la exposici
on distinguimos entre muestras aleatorias simples independientes y muestras aleatorias
relacionadas.
8.6.1.
2
2
2
2
X
X
x y z1/2
+ Y , x y + z1/2
+ Y .
nX
nY
nX
nY
Manuales Uex
2
varianza X
/nX + Y2 /nY . Por tanto,
2
2
2
2
X
X
+ Y X Y X Y +z1/2
+ Y = 1 ,
PX Y z1/2
nX nY
n X nY
227
de la variable aleatoria
X Y (X Y )
,
SXY
2 + (n 1)S 2
(nX 1)SX
1
1
Y
Y
+
SXY =
.
nX + nY 2
nX
nY
Por tanto,
siendo sXY la realizacion de la variable aleatoria SXY . Observemos que el intervalo de conanza esta centrado en la diferencia de las medias muestrales.
2
Como las varianzas X
y Y2 son desconocidas, para valorar si las podemos su2
/Y2 . En
poner iguales, utilizamos un intervalo de conanza para el cociente X
Manuales Uex
distribuci
on t de Student.
228
8.6.2.
Hasta ahora hemos considerado que las variables aleatorias X e Y son independientes. En ocasiones ambas variables estan relacionadas y los metodos
anteriormente descritos no son aplicables. Como ya hemos comentado en alguna ocasion, las mediciones de dos angulos horizontales utilizando la misma
referencia es un caso tpico de dependencia, pues el valor de la medici
on de
un angulo condiciona el valor de la medici
on del otro. En una situaci
on de
dependencia, suponemos que observamos dos muestras aleatorias relacionadas de tama
no n, es decir, una realizacion del vector ((X1 , Y1 ), . . . , (Xn , Yn )),
siendo los vectores (Xi , Yi ) con i {1, . . . , n} independientes y con la misma
distribuci
on que (X, Y ). Como la media de la variable aleatoria D = X Y
es X Y , entonces proporcionar un intervalo de conanza para la diferencia de medias X Y , consiste en proponer un intervalo de conanza para
la media de la variable aleatoria D. Si suponemos que esta variable sigue un
modelo normal, como una muestra aleatoria simple de tama
no n asociada a
la variable aleatoria D es una realizacion del vector aleatorio (D1 , . . . , Dn ),
sD
sD
d t1/2 (n 1) , d + t1/2 (n 1)
,
n
n
siendo d la media muestral y sD la raz cuadrada de la cuasivarianza muestral
de la muestra aleatoria simple asociada a la variable aleatoria D.
Manuales Uex
SD
SD
P D t1/2 (n 1) D + t1/2 (n 1)
= 1 ,
n
n
229
X
Y
valor del
angulo horizontal . Para obtener un intervalo de conanza para la
on en notaci
on centesimal junto a la diferencia de
angulos. Como x = 61.7811 e y = 25.3455, entonces una estimacion puntual
Manuales Uex
como sD = 0.0002 y t0.995 (3) = 5.841 (ver Cuadro A.5), un intervalo de con-
230
Muestra
1a
2a
3a
4a
X
Y
61.7814
25.3457
61.7812
25.3455
61.7805
25.3452
61.7813
25.3455
36.4357
36.4357
36.4353
36.4358
8.7.
Pr
acticas de laboratorio
Manuales Uex
plot(1:m,xi<-x-qnorm(1-alpha/2)*sigma/sqrt(n),ylim=c(6.99,7.01))
231
Manuales Uex
232
alpha<-0.1;
var.test(y,x,conf.level=1-alpha)$conf.int
Calcular estimaci
on por intervalo para la diferencia de medias
round(t.test(x,y,var.equal=T,conf.level=1-alpha)$conf.int,4)
round(t.test(x,y,var.equal=F,conf.level=1-alpha)$conf.int,4)
Para obtener inferencias por estimaci
on para la situaci
on considerada en el
Ejemplo 8.10, utilizamos las sentencias:
Cargar el conjunto de datos
x<-c(61.7814, 61.7812, 61.7805, 61.7813)
y<-c(25.3457, 25.3455, 25.3452, 25.3455); d<-x-y
Calcular estimaci
on puntual de las medias
Calcular estimaci
on por intervalo para la diferencia de medias
alpha<-0.01
round(t.test(x,y,pair=T,conf.level=1-alpha)$conf.int,4)
Manuales Uex
233
8.8.
Cuestiones y problemas
Manuales Uex
234
Manuales Uex
iv) Utilizando el software estadstico R, proporcionar un intervalo de conanza al 95 % para la diferencia de los valores medios de las mediciones
proporcionadas por los distanci
ometros si suponemos que las varianzas
son distintas.
235
Tema 9
Introducci
on a la Teora sobre
Contraste de Hip
otesis
9.1.
Introducci
on
Manuales Uex
237
hip
otesis alternativa H1 : 2 > 0.000025 es unilateral.
Manuales Uex
238
La hip
otesis nula se asume como cierta antes de aplicar el test de modo que si
aceptamos la hipotesis alternativa, es debido a que los datos muestran fuerte
discrepancias frente a la hip
otesis nula. En cambio, la aceptaci
on de H0 indica
que la informaci
on contenida en la muestra no contiene evidencias sucientes
para rechazarla y por tanto seguimos asumiendola como cierta. Notemos que
peque
nos, siendo los habituales = 0.1, = 0.05 y = 0.01. As, cuando la
decisi
on es rechazar la hip
otesis nula, tenemos la garanta de que tenemos una
probabilidad peque
na de equivocarnos, lo que hace able la aceptaci
on de la
hip
otesis H1 .
Observemos que el error de tipo II no es controlado por la regla de decisi
on
del test de hip
otesis, pues no podemos controlar simult
aneamente las probaes controlado, si la decision es aceptar la hip
otesis nula podemos tener una
probabilidad alta de cometer un error, lo que nos obliga a tener cierta cautela. Por ello, en esta situaci
on, mas que aceptar la hip
otesis nula, armamos
que la muestra obtenida no nos permite rechazarla o que no aporta evidencias
sucientes contra ella.
Manuales Uex
bilidades de los dos tipos de errores. Por tanto, como el error de tipo II no
239
Realidad
Decisi
on
H0 cierta
H1 cierta
Aceptar H0
Aceptar H1
Decisi
on correcta
Error de Tipo I
Error de Tipo II
Decisi
on correcta
H0 : =7 vs. H1 : 7
Regin de Regin de Regin de
rechazo aceptacin rechazo
Rechazamos Aceptamos Rechazamos
H0
H0
H0
x<7
x7
x>7
Manuales Uex
240
2
x7
= .
0.005
5
X 7
0.005
Manuales Uex
241
regin de
rechazo
regin de
aceptacin
0.025
0.4
0.3
3
regin de
rechazo
0.95
0.025
zexp
0.0
0.1
0.2
0.4
0.0
0.1
0.2
0.3
si la discrepancia es por exceso (+) o por defecto (), con respecto al valor
calibrado. Como dichos valores se encuentra en la regi
on de rechazo, decidimos
que el distanci
ometro no es exacto. Una vez tomada la decision hemos podido
Manuales Uex
242
0.4
0.3
regin de
rechazo
0.9
0.05
zexp
regin de
rechazo
regin de
aceptacin
0.008
0.984
regin de
rechazo
0.008
zexp
0.0
0.0
0.05
0.2
regin de
aceptacin
0.1
regin de
rechazo
0.1
0.2
0.3
0.4
el error permisible. Cuanto menor sea pv los datos observados muestran mas
Manuales Uex
243
9.2.
Test de hip
otesis para la media
A continuaci
on desarrollamos un test de hip
otesis para comparar la media
de una variable aleatoria X con respecto a un valor conocido. Si denotamos
por a la media de la variable y por 0 al valor de prueba a comparar,
contrastamos la hip
otesis nula H0 : = 0 , frente a la hip
otesis alternativa
H1 : = 0 . Como hemos visto en el Ejemplo 9.2, esta situacion es apropiada
9.2.1.
X 0
.
n
Manuales Uex
244
0.4
0.3
z1
regin de
rechazo
0.2
regin de
aceptacin
zexp
0.1
2
3
2
1
1p
p 2
p 2
0.0
0.4
0.3
0.2
z1
regin de
rechazo
0.0
0.1
0.4
0.2
0.0
0.1
0.3
x 0
,
n
Manuales Uex
245
0.4
0.3
regin de
aceptacin
z1
regin de
rechazo
0.1
0.2
z1
regin de
regin de
rechazo
aceptacin
0.1
0.2
0.3
0.4
0.0
0.0
gr
aco de la izquierda de la Figura 9.5. Asimismo, para contrastar la hip
otesis
nula H0 : 0 frente a la hip
otesis alternativa H1 : < 0 al nivel de sig-
nicaci
on , tomamos como region de rechazo al conjunto de valores menores
que z1 , como mostramos en el graco de la derecha de la Figura 9.5.
Ejemplo 9.3 Para el test de hip
otesis de la media planteado en el Ejemplo
9.2, donde contrastamos la hip
otesis nula H0 : = 7 frente a la hip
otesis
alternativa H1 : = 7, hemos obtenido que una discrepancia de 6 milmetros
Manuales Uex
hip
otesis nula. Ahora bien, una vez que decidimos que el distanci
ometro no es
246
0.4
0.3
0.2
0.2
0.3
0.4
zexp
0.1
0.1
zexp
0.992
0.008
0.0
0.008
0.0
0.992
3
Figura 9.6: C
alculo del p-valor para la hip
otesis nula H0 : 7 (graco de la
izquierda) y H0 : 7 (graco de la derecha).
como mostramos en el graco de la izquierda de la Figura 9.6. Por tanto,
decidimos que > 0 , siendo un resultado signicativo al nivel de signicaci
on
de 0.05, es decir, la probabilidad de error al hacer esta armaci
on es inferior al
5 %. Ademas, como el p-valor es peque
no en relacion a , los datos muestran
fuerte discrepancia. Observemos que hemos planteado como hip
otesis nula H0 :
7, pues si planteamos como hipotesis nula H0 : 7, no tenemos razones
sucientes para rechazarla, pues el p-valor es 0.992, como mostramos en el
gr
aco de la izquierda de la Figura 9.6. As pues, planteando la hip
otesis nula
H0 : 7, tanto solo asumimos que 7.
Una vez decidido que > 7, una estimacion por intervalo puede ser de utilidad
para cuanticar el valor de la media. Como z0.975 = 1.96 (ver Cuadro A.3),
tenemos que el intervalo de conanza para la media al nivel de conanza de
0.95 lo calculamos como
z0.975
z0.975
,x + n
= (7.001, 7.012).
x n
Manuales Uex
247
9.2.2.
En todo lo anterior, hemos supuesto conocida la varianza de la variable aleatoria X. Sin embargo, es posible aplicar un test de hip
otesis para la media,
sin necesidad de conocer el valor de la varianza de la variable. En efecto, en el
Tema 7 hemos comentado que, bajo la hip
otesis nula H0 : = 0 , la variable
aleatoria
X 0
,
n
S
sigue un modelo t de Student con n 1 grados de libertad, siendo S la raz
X 0
t1/2 (n 1) = 1 ,
P t1/2 (n 1) n
S
x 0
,
n
s
Manuales Uex
248
Si la hip
otesis alternativa es unilateral, la regi
on de aceptacion es modicada
de manera analoga a lo realizado cuando la varianza es conocida.
0.3
t1
(n 1 )
1
0
t0.975(3)
regin de
aceptacin
0.025
2
2
regin de
rechazo
regin de
rechazo
0.95
texp
0.0
t0.975(3)
0.2
(n 1 )
0.1
t1
0.0
0.1
0.2
0.3
0.025
2
s
olo utilizamos la informaci
on proporcionada por la muestra y no las especicaciones del distanciometro sobre su dispersion, tenemos que n = 4, x = 7.001 m.
x 0
0.001
= 2
n
= 0.252.
s
0.000029
Como t0.975 (3) = 3.182 (ver Cuadro A.5), es mayor que el valor experimental,
entonces deducimos que la diferencia observada de un milmetro no es signicativa con nivel de signicaci
on = 0.05 y decidimos asumir la exactitud
del distanci
ometro. Notemos que el resultado es consistente con el intervalo de
conanza de nivel de conanza de 0.95 obtenido en el Ejemplo 8.5, utilizando
la misma muestra, pues el intervalo contiene al valor nominal de la distancia
calibrada. En el gr
aco de la derecha de la Figura 9.7 mostramos la situaci
on
del valor experimental con respecto a la regi
on de aceptacion para el nivel de
signicaci
on = 0.05.
Si la variable aleatoria X no sigue un modelo normal, pero el tama
no muestral
muestreo de la media muestral se aproxima por un modelo normal y por tanto,
la construccion de la regi
on de aceptacion que vimos en el apartado 9.2.1 sigue
siendo valida. Si la varianza es desconocida, reemplazamos por s, la raz
cuadrada de la cuasivarianza muestral. A efectos pr
acticos, la aproximaci
on
proporciona buenos resultados para n 60.
Manuales Uex
249
construir la regi
on de aceptacion a partir del modelo normal est
andar y el valor
experimental es
zexp =
x 0
= 0.833.
n
s
Como z0.975 = 1.96 (ver Cuadro A.3) es mayor que el valor experimental,
entonces deducimos que la diferencia observada no es signicativa al nivel
de signicacion 0.05, y decidimos asumir que la proporci
on de estaciones
bien calibradas es 0.6. As, el p-valor es mayor que 0.05. En efecto, como
P (Z 0.833) = 0.798 (ver Cuadro A.2), siendo Z un modelo normal est
andar,
tenemos que pv = 0.404. Notemos que el resultado es consistente con el inter-
Manuales Uex
9.3.
250
Test de hip
otesis para la varianza
Pearson con n 1 grados de libertad. Esto nos conduce a tomar como regi
on
2exp =
(n 1)s2
,
02
Manuales Uex
dos zonas, pues rechazamos la hipotesis nula cuando la magnitud del cociente
251
regin de
rechazo
(n 1 )
regin de regin de
aceptacin rechazo
1
2
regin de regin de
aceptacin rechazo
(n 1 )
(n 1)
regin de
regin de
rechazo
aceptacin
1(n 1)
1
Figura 9.8.
(n 1)s2
= 3.48.
02
Como 20.95 (3) = 7.815 (ver Cuadro A.4) es mayor que el valor experimental,
entonces asumimos que la precision del distanci
ometro es menor o igual a las
Manuales Uex
252
9.4.
Test de hip
otesis de igualdad de varianzas
En todo lo anterior, las inferencias estadsticas se han basado en la informacion contenida en una muestra aleatoria simple. En lo que sigue, de modo
al desarrollado en estimacion por intervalo, a continuaci
on estudiamos test de
probabilstico de las mediciones de una cierta distancia o angulo con dos ins-
valor experimental
Fexp =
s2X
,
s2Y
Manuales Uex
conduce a tomar como region de aceptacion el intervalo denido por los valores
253
(nX 1, nY 1)
regin de
rechazo
F(nX 1, nY 1)
regin de
aceptacin
F1
2 1
regin de
rechazo
regin de regin de
aceptacin rechazo
(nX 1, nY 1)
regin de
aceptacin
F1(nX 1, nY 1)
regin de
rechazo
Manuales Uex
254
Ejemplo 9.7 Retornamos a la situacion descrita en el Ejemplo 8.8, para contrastar la igualdad en dispersi
on de las mediciones de cierto angulo usando de
manera independiente dos teodolitos con apreciaci
on en segundos. Para ello
2
= Y2 frente a la hip
otesis alternativa
planteamos la hip
otesis nula H0 : X
de tama
no 5 asociadas a cada uno de los teodolitos, sean
s2Y
= 1.097.
s2X
Adem
as, como F0.05 (4, 4) = 0.157 y F0.95 (4, 4) = 6.388 (ver Cuadro A.6),
decidimos asumir la igualdad de dispersi
on al nivel de signicaci
on = 0.1.
Esta decision es consistente con el resultado obtenido mediante estimacion por
intervalos, donde la unidad est
a contenida en el intervalo de conanza para el
cociente de varianzas al nivel de conanza 0.90.
9.5.
Test de hip
otesis para la diferencia de medias
a la hip
otesis alternativa bilateral H1 : X Y = 0 , siendo 0 un valor
Manuales Uex
255
9.5.1.
7 que la distribuci
on en el muestreo de la variable aleatoria
X Y 0
2
2
X
Y
nX + nY
Manuales Uex
2
Observemos que el valor experimental depende del valor de las varianzas X
2
y Y . De modo analogo al desarrollado en estimacion por intervalo, cuando los valores de las varianzas son desconocidos pero supuestamente iguales,
calculamos el valor experimental como
256
texp =
siendo
sXY =
x y 0
,
sXY
1
1
+
nX
nY
la hip
otesis nula al nivel de signicaci
on , si |texp | > t1/2 (nX + nY 2).
Teniendo esto en cuenta, el p-valor lo calculamos como
pv = P (|T | > texp ),
siendo T un modelo t de Student con nX + nY 2 grados de libertad. Como
2
las varianzas X
y Y2 son desconocidas, para valorar si las podemos suponer
2
= Y2 . Si el
iguales, previamente hemos de contrastar la hip
otesis H0 : X
Dado que t0.95 (8) = 1.860 (ver Cuadro A.5), es mayor que el valor experimental, entonces asumimos la exactitud de los teodolitos al nivel de signicaci
on
= 0.1. Esta decision es consistente con el resultado obtenido en el Ejemplo
8.9, mediante estimacion por intervalos, donde el cero est
a contenido en el
intervalo de conanza para la diferencia de medias al nivel de conanza 0.90.
Manuales Uex
texp =
257
9.5.2.
a la hip
otesis alternativa H1 : X Y = 0 , siendo 0 un valor conocido,
D = 0 . Si la hip
otesis alternativa es unilateral, el razonamiento es an
alogo.
d 0
n
,
sD
Manuales Uex
258
n2
texp = rP
= 0.466.
1 rP2
Como t0.975 (3) = 3.182 (ver Cuadro A.5) es mayor que |texp |, entonces asumi-
mos la hip
otesis de independencia lineal entre las mediciones de los dos teodolitos, es decir, la discrepancias observadas sobre la independencia no son signicativas al nivel de signicaci
on de 0.05. Como rS = 0.406 y r0.05 (5) = 0.90
n2
texp = rP
= 4.328
1 rP2
es mayor que t0.975 (2) = 4.303 (ver Cuadro A.5). Esta dependencia de tipo
lineal se maniesta tambien en la magnitud del coeciente de correlaci
on muestral de Spearman, siendo en este caso rS = 0.943, cercano a uno. Observemos
que a pesar de mostrar fuerte evidencia de dependencia, el test asociado no
es signicativo, pues r0.05 (4) = 1, mayor que rS . Esto muestra el caracter
conservador de este test, sobre todo si el tama
no muestral es peque
no.
9.7.
Test de hip
otesis sobre la distribuci
on
Las hip
otesis planteadas hasta ahora dependen de ciertas caractersticas de la
poblaci
on, usualmente la media y la varianza. Sin embargo, en ocasiones, no
en describir el comportamiento probabilstico de la variable aleatoria X. Es por
ello que a continuaci
on planteamos hip
otesis sobre su distribucion, distinguiendo entre el caso discreto y el caso continuo. Para casos discretos, la hipotesis
nula consiste en especicar la funci
on de probabilidad de la variable aleatoria,
mientras que en casos continuos la hip
otesis nula esta en funci
on de alg
un
Manuales Uex
259
9.7.1.
Caso discreto
Supongamos en primer lugar que la variable aleatoria X es discreta con espacio muestral nito, {a1 , . . . , am }. Esta situacion es apropiada para describir
el comportamiento aleatorio de una caracterstica cualitativa donde cada ca-
H0 : P (X = a1 ) = p1 , . . . , P (X = am ) = p(0)
m
(0)
(0)
(0)
(0)
es la frecuencia esperada bajo la hip
otesis nula. Por tanto, Oi npi
nos
2exp =
2
(0)
m
Oi npi
(0)
Manuales Uex
i=1
260
npi
2exp =
2
(0)
m
Oi npi
i=1
Ei
(64 60)2
2
(36 40)2
+
= .
40
60
3
Como las frecuencias esperadas son 40 y 60, las condiciones de validez del
test se cumplen y por tanto para tomar una decisi
on comparamos el valor
experimental con 20.95 (1) = 3.841 (ver Cuadro A.4), concluyendo que las
diferencias observadas no son signicativas.
9.7.2.
Caso continuo
Manuales Uex
261
9.7.1.
Caso discreto
Supongamos en primer lugar que la variable aleatoria X es discreta con espacio muestral nito, {a1 , . . . , am }. Esta situacion es apropiada para describir
el comportamiento aleatorio de una caracterstica cualitativa donde cada ca-
H0 : P (X = a1 ) = p1 , . . . , P (X = am ) = p(0)
m
(0)
(0)
(0)
(0)
es la frecuencia esperada bajo la hip
otesis nula. Por tanto, Oi npi
nos
2exp =
2
(0)
m
Oi npi
(0)
Manuales Uex
i=1
262
npi
6.990
20
6.995
40
7.000
60
7.005
80
7.010
6.985
6.990
6.995
7.000
7.005
7.010
7.015
9.8.
Pr
acticas de laboratorio
Manuales Uex
t.test(x,mu=mu0,conf.level=1-alpha)
263
Manuales Uex
a los del modelo normal estandar. Las discrepancias observadas al ajuste por
264
Manuales Uex
265
9.9.
Cuestiones y problemas
hip
otesis para contrastar la hip
otesis H0 : 0 frente a H1 : > 0 .
Manuales Uex
266
4. Sean 12.350, 12.351, 12.345, 12.342 y 12.356, 12.356, 12.352, 12.357 dos conjuntos de mediciones expresadas en metros de cierta distancia, utilizandose
para ello dos distanci
ometros con apreciacion en milmetros, uno para cada
conjunto de datos. Suponemos que las mediciones proporcionadas por ambos
Manuales Uex
267
Manuales Uex
iii) Determinar si podemos suponer que cada una de las muestras procede
de un modelo normal.
268
Bibliografa b
asica de
referencia
Entendemos como buena poltica para la formaci
on del alumno, animarle a que
consulte libros de texto, especialmente aquellos especcamente orientados al
desarrollo de metodos matematicos en el campo de la Ingeniera. Teniendo
en cuenta que el programa de contenidos expuestos incluye varios bloques
tematicos, existen en la literatura una gran variedad y cantidad de textos
apropiados para tal n. Con la intenci
on de facilitar al alumno la labor de
consulta, indicamos a continuaci
on una breve bibliografa estructurada por
materia.
Probabilidad y Estadstica
damos algunos textos especcos de otras disciplinas pero que pueden ser u
ltil
para entender los contenidos expuestos. Entre ellos destacamos Garca (2004),
donde se proponen una gran batera de cuestiones y problemas, y Martn &
Luna del Castillo (1990), un texto cl
asico en Bioestadstica.
Manuales Uex
269
Manuales Uex
http://www.math.uah.edu/stat/, donde se encuentra ubicado el laboratorio virtual de Probabilidad y Estadstica de la Universidad de Alabama
en Hunstville, que propone m
ultiples actividades did
acticas sobre cuestiones de Probabilidad y Estadstica.
270
Ap
endice A
Tablas estadsticas
A continuaci
on, mostramos las principales tablas a utilizar para calcular probabilidades, cuantiles y lmites de signicacion de los principales modelos de
probabilidad. Concretamente, mostramos las siguientes
Cuadro A.1: Tabulaci
on de la funci
on de distribuci
on de modelos binomiales.
Cuadro A.2 Tabulaci
on de la funci
on de distribuci
on del modelo normal
estandar.
Cuadro A.3 Tabulaci
on de cuantiles del modelo normal estandar.
Cuadro A.4 Tabulaci
on de cuantiles de modelos 2 de Pearson.
Cuadro A.5 Tabulaci
on de cuantiles de modelos t de Student.
Cuadro A.6 Tabulaci
on de cuantiles de modelos F de Snedecor.
Manuales Uex
271
x|p
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
0
1
2
0
1
2
3
0
1
2
3
4
0
1
2
3
4
5
0
1
2
3
4
5
6
0
1
2
3
4
5
6
7
0
1
2
3
4
5
6
7
8
0.902
0.998
1.000
0.857
0.993
1.000
1.000
0.815
0.986
1.000
1.000
1.000
0.774
0.977
0.999
1.000
1.000
1.000
0.735
0.967
0.998
1.000
1.000
1.000
1.000
0.698
0.956
0.996
1.000
1.000
1.000
1.000
1.000
0.663
0.943
0.994
1.000
1.000
1.000
1.000
1.000
1.000
0.810
0.990
1.000
0.729
0.972
0.999
1.000
0.656
0.948
0.996
1.000
1.000
0.590
0.919
0.991
1.000
1.000
1.000
0.531
0.886
0.984
0.999
1.000
1.000
1.000
0.478
0.850
0.974
0.997
1.000
1.000
1.000
1.000
0.430
0.813
0.962
0.995
1.000
1.000
1.000
1.000
1.000
0.722
0.978
1.000
0.614
0.939
0.997
1.000
0.522
0.890
0.988
0.999
1.000
0.444
0.835
0.973
0.998
1.000
1.000
0.377
0.776
0.953
0.994
1.000
1.000
1.000
0.321
0.717
0.926
0.988
0.999
1.000
1.000
1.000
0.272
0.657
0.895
0.979
0.997
1.000
1.000
1.000
1.000
0.640
0.960
1.000
0.512
0.896
0.992
1.000
0.410
0.819
0.973
0.998
1.000
0.328
0.737
0.942
0.993
1.000
1.000
0.262
0.655
0.901
0.983
0.998
1.000
1.000
0.210
0.577
0.852
0.967
0.995
1.000
1.000
1.000
0.168
0.503
0.797
0.944
0.990
0.999
1.000
1.000
1.000
0.563
0.938
1.000
0.422
0.844
0.984
1.000
0.316
0.738
0.949
0.996
1.000
0.237
0.633
0.896
0.984
0.999
1.000
0.178
0.534
0.831
0.962
0.995
1.000
1.000
0.133
0.445
0.756
0.929
0.987
0.999
1.000
1.000
0.100
0.367
0.679
0.886
0.973
0.996
1.000
1.000
1.000
0.490
0.910
1.000
0.343
0.784
0.973
1.000
0.240
0.652
0.916
0.992
1.000
0.168
0.528
0.837
0.969
0.998
1.000
0.118
0.420
0.744
0.930
0.989
0.999
1.000
0.082
0.329
0.647
0.874
0.971
0.996
1.000
1.000
0.058
0.255
0.552
0.806
0.942
0.989
0.999
1.000
1.000
0.422
0.877
1.000
0.275
0.718
0.957
1.000
0.179
0.563
0.874
0.985
1.000
0.116
0.428
0.765
0.946
0.995
1.000
0.075
0.319
0.647
0.883
0.978
0.998
1.000
0.049
0.234
0.532
0.800
0.944
0.991
0.999
1.000
0.032
0.169
0.428
0.706
0.894
0.975
0.996
1.000
1.000
0.360
0.840
1.000
0.216
0.648
0.936
1.000
0.130
0.475
0.821
0.974
1.000
0.078
0.337
0.683
0.913
0.990
1.000
0.047
0.233
0.544
0.821
0.959
0.996
1.000
0.028
0.159
0.420
0.710
0.904
0.981
0.998
1.000
0.017
0.106
0.315
0.594
0.826
0.950
0.991
0.999
1.000
0.302
0.797
1.000
0.166
0.575
0.909
1.000
0.092
0.391
0.759
0.959
1.000
0.050
0.256
0.593
0.869
0.982
1.000
0.028
0.164
0.442
0.745
0.931
0.992
1.000
0.015
0.102
0.316
0.608
0.847
0.964
0.996
1.000
0.008
0.063
0.220
0.477
0.740
0.912
0.982
0.998
1.000
0.250
0.750
1.000
0.125
0.500
0.875
1.000
0.062
0.313
0.687
0.938
1.000
0.031
0.187
0.500
0.812
0.969
1.000
0.016
0.109
0.344
0.656
0.891
0.984
1.000
0.008
0.063
0.227
0.500
0.773
0.938
0.992
1.000
0.004
0.035
0.145
0.363
0.637
0.855
0.965
0.996
1.000
Manuales Uex
272
F(z)
0.000
0.010
0.020
0.030
0.040
0.050
0.060
0.070
0.080
0.090
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
0.500
0.540
0.579
0.618
0.655
0.691
0.726
0.758
0.788
0.816
0.841
0.864
0.885
0.903
0.919
0.933
0.945
0.955
0.964
0.971
0.977
0.982
0.986
0.989
0.992
0.994
0.995
0.997
0.997
0.998
0.504
0.544
0.583
0.622
0.659
0.695
0.729
0.761
0.791
0.819
0.844
0.867
0.887
0.905
0.921
0.934
0.946
0.956
0.965
0.972
0.978
0.983
0.986
0.990
0.992
0.994
0.995
0.997
0.998
0.998
0.508
0.548
0.587
0.626
0.663
0.698
0.732
0.764
0.794
0.821
0.846
0.869
0.889
0.907
0.922
0.936
0.947
0.957
0.966
0.973
0.978
0.983
0.987
0.990
0.992
0.994
0.996
0.997
0.998
0.998
0.512
0.552
0.591
0.629
0.666
0.702
0.736
0.767
0.797
0.824
0.848
0.871
0.891
0.908
0.924
0.937
0.948
0.958
0.966
0.973
0.979
0.983
0.987
0.990
0.992
0.994
0.996
0.997
0.998
0.998
0.516
0.556
0.595
0.633
0.670
0.705
0.739
0.770
0.800
0.826
0.851
0.873
0.893
0.910
0.925
0.938
0.949
0.959
0.967
0.974
0.979
0.984
0.987
0.990
0.993
0.994
0.996
0.997
0.998
0.998
0.520
0.560
0.599
0.637
0.674
0.709
0.742
0.773
0.802
0.829
0.853
0.875
0.894
0.911
0.926
0.939
0.951
0.960
0.968
0.974
0.980
0.984
0.988
0.991
0.993
0.995
0.996
0.997
0.998
0.998
0.524
0.564
0.603
0.641
0.677
0.712
0.745
0.776
0.805
0.831
0.855
0.877
0.896
0.913
0.928
0.941
0.952
0.961
0.969
0.975
0.980
0.985
0.988
0.991
0.993
0.995
0.996
0.997
0.998
0.998
0.528
0.567
0.606
0.644
0.681
0.716
0.749
0.779
0.808
0.834
0.858
0.879
0.898
0.915
0.929
0.942
0.953
0.962
0.969
0.976
0.981
0.985
0.988
0.991
0.993
0.995
0.996
0.997
0.998
0.999
0.532
0.571
0.610
0.648
0.684
0.719
0.752
0.782
0.811
0.836
0.860
0.881
0.900
0.916
0.931
0.943
0.954
0.962
0.970
0.976
0.981
0.985
0.989
0.991
0.993
0.995
0.996
0.997
0.998
0.999
0.536
0.575
0.614
0.652
0.688
0.722
0.755
0.785
0.813
0.839
0.862
0.883
0.901
0.918
0.932
0.944
0.954
0.963
0.971
0.977
0.982
0.986
0.989
0.992
0.994
0.995
0.996
0.997
0.998
0.999
(*) Por ejemplo, dado z = 2.00, tenemos que P (Z 2.00) = 0.977, siendo Z
un modelo normal est
andar.
Manuales Uex
273
zp
0.000
0.001
0.002
0.003
0.004
0.005
0.006
0.007
0.008
0.009
0.50
0.60
0.70
0.80
0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90
0.91
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
0.000
0.253
0.524
0.842
0.878
0.915
0.954
0.994
1.036
1.080
1.126
1.175
1.227
1.282
1.341
1.405
1.476
1.555
1.645
1.751
1.881
2.054
2.326
0.003
0.256
0.527
0.845
0.882
0.919
0.958
0.999
1.041
1.085
1.131
1.180
1.232
1.287
1.347
1.412
1.483
1.563
1.655
1.762
1.896
2.075
2.366
0.005
0.259
0.530
0.849
0.885
0.923
0.962
1.003
1.045
1.089
1.136
1.185
1.237
1.293
1.353
1.419
1.491
1.572
1.665
1.774
1.911
2.097
2.409
0.008
0.261
0.533
0.852
0.889
0.927
0.966
1.007
1.049
1.094
1.141
1.190
1.243
1.299
1.359
1.426
1.499
1.580
1.675
1.787
1.927
2.120
2.457
0.010
0.264
0.536
0.856
0.893
0.931
0.970
1.011
1.054
1.098
1.146
1.195
1.248
1.305
1.366
1.433
1.506
1.589
1.685
1.799
1.943
2.144
2.512
0.013
0.266
0.539
0.860
0.896
0.935
0.974
1.015
1.058
1.103
1.150
1.200
1.254
1.311
1.372
1.440
1.514
1.598
1.695
1.812
1.960
2.170
2.576
0.015
0.269
0.542
0.863
0.900
0.938
0.978
1.019
1.063
1.108
1.155
1.206
1.259
1.317
1.379
1.447
1.522
1.607
1.706
1.825
1.977
2.197
2.652
0.018
0.272
0.545
0.867
0.904
0.942
0.982
1.024
1.067
1.112
1.160
1.211
1.265
1.323
1.385
1.454
1.530
1.616
1.717
1.838
1.995
2.226
2.748
0.020
0.274
0.548
0.871
0.908
0.946
0.986
1.028
1.071
1.117
1.165
1.216
1.270
1.329
1.392
1.461
1.538
1.626
1.728
1.852
2.014
2.257
2.878
0.023
0.277
0.550
0.874
0.912
0.950
0.990
1.032
1.076
1.122
1.170
1.221
1.276
1.335
1.398
1.468
1.546
1.635
1.739
1.866
2.034
2.290
3.090
Manuales Uex
(*) Por ejemplo, dado p = 0.975, tenemos que P (Z 1.960) = 0.975, siendo
Z un modelo normal est
andar.
274
n|p
0.005
0.025
0.05
0.25
0.5
0.75
0.95
0.975
0.995
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
30
40
50
60
70
80
90
100
0.000
0.010
0.072
0.207
0.412
0.676
0.989
1.344
1.735
2.156
2.603
3.074
3.565
4.075
4.601
5.142
5.697
6.265
6.844
7.434
13.787
20.707
27.991
35.534
43.275
51.172
59.196
67.328
0.001
0.051
0.216
0.484
0.831
1.237
1.690
2.180
2.700
3.247
3.816
4.404
5.009
5.629
6.262
6.908
7.564
8.231
8.907
9.591
16.791
24.433
32.357
40.482
48.758
57.153
65.647
74.222
0.004
0.103
0.352
0.711
1.145
1.635
2.167
2.733
3.325
3.940
4.575
5.226
5.892
6.571
7.261
7.962
8.672
9.390
10.117
10.851
18.493
26.509
34.764
43.188
51.739
60.391
69.126
77.929
0.102
0.575
1.213
1.923
2.675
3.455
4.255
5.071
5.899
6.737
7.584
8.438
9.299
10.165
11.037
11.912
12.792
13.675
14.562
15.452
24.478
33.660
42.942
52.294
61.698
71.145
80.625
90.133
0.455
1.386
2.366
3.357
4.351
5.348
6.346
7.344
8.343
9.342
10.341
11.340
12.340
13.339
14.339
15.338
16.338
17.338
18.338
19.337
29.336
39.335
49.335
59.335
69.334
79.334
89.334
99.334
1.323
2.773
4.108
5.385
6.626
7.841
9.037
10.219
11.389
12.549
13.701
14.845
15.984
17.117
18.245
19.369
20.489
21.605
22.718
23.828
34.800
45.616
56.334
66.981
77.577
88.130
98.650
109.141
3.841
5.991
7.815
9.488
11.070
12.592
14.067
15.507
16.919
18.307
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
31.410
43.773
55.758
67.505
79.082
90.531
101.879
113.145
124.342
5.024
7.378
9.348
11.143
12.833*
14.449
16.013
17.535
19.023
20.483
21.920
23.337
24.736
26.119
27.488
28.845
30.191
31.526
32.852
34.170
46.979
59.342
71.420
83.298
95.023
106.629
118.136
129.561
7.879
10.597
12.838
14.860
16.750
18.548
20.278
21.955
23.589
25.188
26.757
28.300
29.819
31.319
32.801
34.267
35.718
37.156
38.582
39.997
53.672
66.766
79.490
91.952
104.215
116.321
128.299
140.169
Manuales Uex
2p
275
Manuales Uex
tp (n )
276
n|p
0.6
0.7
0.8
0.9
0.95
0.975
0.995
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0.325
0.289
0.277
0.271
0.267
0.265
0.263
0.262
0.261
0.260
0.260
0.259
0.259
0.258
0.258
0.258
0.257
0.257
0.257
0.257
0.257
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.727
0.617
0.584
0.569
0.559
0.553
0.549
0.546
0.543
0.542
0.540
0.539
0.538
0.537
0.536
0.535
0.534
0.534
0.533
0.533
0.532
0.532
0.532
0.531
0.531
0.531
0.531
0.530
0.530
0.530
1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
Fp(n, m)
m|n
161.45
18.510
10.130
7.710
6.610
5.990
5.590
5.320
199.50
19.000
9.550
6.940
5.790
5.140
4.740
4.460
215.71
19.160
9.280
6.590
5.410
4.760
4.350
4.070
224.58
19.250
9.120
6.390
5.190
4.530
4.120
3.840
230.16
19.300
9.010
6.260
5.050
4.390
3.970
3.690
233.99
19.330
8.940
6.160
4.950
4.280
3.870
3.580
236.77
19.350
8.890
6.090
4.880
4.210
3.790
3.500
238.88
19.370
8.850
6.040
4.820
4.150
3.730
3.440
647.79
38.510
17.440
12.220
10.010
8.810
8.070
7.570
799.50
39.000
16.040
10.650
8.430
7.260
6.540
6.060
864.16
39.170
15.440
9.980
7.760
6.600
5.890
5.420
899.58
39.250
15.100
9.600
7.390
6.230
5.520
5.050
921.85
39.300
14.880
9.360
7.150
5.990
5.290
4.820
937.11
39.330
14.730
9.200
6.980
5.820
5.120
4.650
948.22
39.360
14.620
9.070
6.850
5.700
4.990
4.530
956.66
39.370
14.540
8.980
6.760
5.600
4.900
4.430
16210
198.50
55.552
31.333
22.785
18.635
16.236
14.688
19999
199.00
49.799
26.284
18.314
14.544
12.404
11.042
21614
199.17
47.467
24.259
16.530
12.917
10.882
9.596
22499
199.25
46.195
23.155
15.556
12.028
10.050
8.805
23055
199.30
45.392
22.456
14.940
11.464
9.522
8.302
23437
199.33
44.838
21.975
14.513
11.073
9.155
7.952
23714
199.36
44.434
21.622
14.200
10.786
8.885
7.694
23925
199.38
44.126
21.352
13.961
10.566
8.678
7.496
p = 0.95
1
2
3
4
5
6
7
8
p = 0.975
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
Manuales Uex
p = 0.995
277
0.1
0.05
0.01
0.001
n|
0.1
0.05
0.01
0.001
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
0.800
0.800
0.829
0.732
0.667
0.617
0.576
0.536
0.507
0.484
0.464
0.446
0.431
0.417
0.404
0.391
0.380
0.371
0.362
0.353
0.345
0.338
0.331
0.324
1.000
0.900
0.943
0.821
0.762
0.700
0.648
0.618
0.587
0.560
0.538
0.521
0.503
0.485
0.472
0.458
0.447
0.435
0.425
0.415
0.406
0.398
0.389
0.382
1.000
1.000
1.000
0.929
0.881
0.833
0.782
0.755
0.720
0.692
0.670
0.645
0.626
0.610
0.593
0.579
0.564
0.551
0.539
0.528
0.516
0.506
0.497
0.488
1.000
1.000
1.000
1.000
0.976
0.933
0.891
0.864
0.839
0.813
0.789
0.768
0.747
0.730
0.713
0.696
0.681
0.668
0.654
0.642
0.630
0.619
0.609
0.598
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
0.318
0.312
0.307
0.301
0.297
0.292
0.287
0.283
0.279
0.275
0.271
0.268
0.264
0.261
0.258
0.254
0.251
0.248
0.246
0.243
0.240
0.238
0.235
0.233
0.375
0.368
0.362
0.356
0.350
0.345
0.339
0.334
0.329
0.325
0.320
0.316
0.312
0.308
0.305
0.301
0.298
0.294
0.291
0.288
0.285
0.282
0.279
0.276
0.479
0.471
0.464
0.456
0.449
0.443
0.436
0.430
0.424
0.419
0.413
0.408
0.403
0.398
0.393
0.389
0.385
0.380
0.376
0.372
0.369
0.365
0.361
0.358
0.589
0.580
0.571
0.563
0.555
0.547
0.540
0.533
0.526
0.519
0.513
0.507
0.501
0.495
0.490
0.485
0.479
0.474
0.470
0.465
0.460
0.456
0.452
0.447
Manuales Uex
278
Ap
endice B
Variaciones y
combinaciones
El calculo de probabilidades a traves de la regla de Laplace se basa en el
conocimiento del n
umero de casos favorables y el n
umero de casos posibles.
Esto implica un proceso de conteo que puede simplicarse mediante el empleo
del c
alculo combinatorio. El objetivo del c
alculo combinatorio es determinar
cuantos subconjuntos se pueden formar con los elementos de un conjunto dado,
distinguiendose entre calculo combinatorio con repetici
on y calculo combinatorio sin repetici
on, seg
un se permita o no que los elementos se repitan. Por otro
lado, surgen las variaciones o combinaciones seg
un importe o no el orden de
los elementos que forman los subconjuntos. Por tanto, en el c
alculo combinatorio distinguimos entre variaciones sin repetici
on, variaciones con repetici
on,
combinaciones sin repetici
on y combinaciones con repetici
on.
Para ilustrar las diferentes situaciones, en lo que sigue, suponemos que en
el almacen del Centro Universitario de Merida disponemos de 5 estaciones
totales para la realizacion de las pr
acticas de campo de cierta asignatura. Si las
a considerar esta constituido por cinco elementos. Supongamos tambien que
existen dos grupos de pr
acticas y que cada uno de ellos elige una estacion
total para la realizaci
on de las pr
acticas. Un posible resultado de la eleccion
es cuando el grupo uno escoge ET 3 y el grupo dos ET 1. Esta asignacion,
desde el punto de vista de los grupos, es distinta a la que sucede cuando el
Manuales Uex
279
Manuales Uex
280
Manuales Uex
281
Ap
endice C
Cifras signicativas
En lo que sigue introducimos el concepto de cifras signicativas, u
til para
representar un n
umero real en un computador. Es sabido que cualquier n
umero
real a lo podemos representar en forma decimal de manera u
nica con un n
umero
nito o innito de cifras, sean {0, 1, . . . , 9}, mediante la expresion
a=
j 10j ,
j=m
Manuales Uex
un n
umero menor o igual de cifras signicativas que n no sufre variaci
on. En
283
N
umero real
N
umero de cifras signicativas
Notaci
on cientca con 7 cifras
23
200
23.50002
456.78375
456.78385
56442.8644
2
3
7
8
8
9
23
200
2350002 102
4567838 103
4567838 103
5644286 105
3141593 101
Cuadro C.1: N
umero de cifras signicativas.
umero de cifras signicativas del n
umero es mayor de n + 1,
mn es 5 y el n
entonces lo representamos como m , . . . , mn+1 + 1. Cuando mn es 5 y el
n
umero de cifras signicativas del n
umero es n + 1, entonces es representado
por m , . . . , mn+1 si mn+1 es par y por m , . . . , mn+1 + 1 si mn+1 es
impar. En el Cuadro C.1 mostramos la notaci
on cientca con 7 cifras signicativas para algunos n
umeros reales. Notemos que usualmente los computadores
utilizan 7 cifras signicativas, aunque se puede ampliar. En el caso del software
estadstico R utilizamos para ello el comando options(digits=n). Ademas,
en los resultados intermedios que intervienen en cualquier c
alculo se utiliza un
n
umero doble de cifras signicativas.
Manuales Uex
284
Indice alfab
etico
calculo combinatorio, 281
datos atpicos, 21
car
acter
cuantitativo, 3
continuo, 4
discreto, 4
agrupadas, 46
coeciente
apiladas, 47
de correlacion, 125
de caja, 31
de asimetra, 103
de dispersion, 49
muestral, 33
de correlacion
de Pareto, 17
de sectores, 17
de Pearson muestral, 54
de tallo-hoja, 17
de Spearman muestral, 55
qq-plot, 264
de variaci
on, 100
muestral, 31
combinaciones
distribuci
on
F de Snedecor, 165
2 de Pearson, 161
t de Student, 163
binomial, 143
de Bernoulli, 141
covarianza, 123
en el muestreo
muestral, 52
cuantil, 99
muestral, 24
de la cuasivarianza, 190
de la media, 190
geometrica, 147
hipergeometrica, 147
cuasidesviaci
on tpica muestral, 29
multinomial, 168
cuasivarianza muestral, 29
normal, 153
Manuales Uex
cualitativo, 3
285
relativa, 12
acumulada, 13
multivariante, 170
uniforme continua, 149
condicionada, 45
marginal, 44
error, 1
de propagaci
on, 3
funci
on
de densidad, 90
marginal, 119
de tipo I, 239
de distribuci
on, 84
de probabilidad, 87
conjunta, 116
errores
marginal, 119
instrumental, 2
naturales, 2
personales, 2
escala
nominal, 4
numerica, 4
ordinal, 4
espacio muestral, 69
esperanza matematica, 96
estadstica
descriptiva, 5
inferencial, 5, 213215, 217
estimacion, 214
por intervalo, 215
hip
otesis
alternativa, 237
bilateral, 238
nula, 237
unilateral, 238
histograma, 17
individuo, 3
inferencia
no parametrica, 214
parametrica, 214
intervalo de conanza
para el cociente de varianzas, 226
para la diferencia de medias, 227,
puntual, 215
experimento, 5
aleatorio, 5
Manuales Uex
determinstico, 5
286
frecuencia
absoluta, 12
acumulada, 13
marginal, 44
porcentual, 12
229
para la media, 218, 221
para la varianza, 223
matriz
de varianzas-covarianzas, 124
meda
muestral, 30
media, 96
armonica, 23
poblaci
on, 3
muestral, 21
probabilidad, 7178
mediana, 98
muestral, 22
medidas
caractersticas, 95
muestrales, 20
poblacional, vease medidas caractersticas
de asociacion, 5157, 123125
condicionada, 74
rango, 100
intercuartlico, 100
muestral, 27
muestral, 27
region
de aceptacion, 239
de centralizaci
on, 2024, 9699
de rechazo, 239
de la multiplicaci
on, 75
moda, 12
modelo, vease distribuci
on
de probabilidad, 137
continuo, 148167
discreto, 138147
multidimensional, 167173
muestra, 5, 186
aleatoria
relacionada, 203
aleatoria simple, 186
independiente, 187
nivel de signicaci
on, 239
observaci
on
directa, 1
indirecta, 3
p-valor, 243
percentil, vease cuantil
pias, 2
de Laplace, 72
resultado signicativo, 243
suceso, 69
elemental, 69
imposible, 70
independiente, 76
interseccion, 70
uni
on, 70
tabla
de contingencia, 44
de frecuencias, 12
teora
de errores aleatorios, 3
de la probabilidad, 5
de muestras, 185
teora de muestras, 5
teorema
central del lmite, 157
de la probabilidad total, 75
test de hipotesis, 214, 237244
Manuales Uex
287
Manuales Uex
288
valor
experimental, 239
variable aleatoria, 8495
continua, 9094
discreta, 8789
variables aleatorias
incorreladas, 124
independientes, 121123
variaciones
con repeticion, 283
sin repeticion, 282
varianza, 100
muestral, 28
vector
aleatorio, 114121
Lista de smbolos y
notaci
on
Smbolo
Signicado
x1 , . . . , xn
muestra de tama
no n
xi
i=1
sumatorio, es decir, x1 + + xn
n
s2
cuasidesviaci
on tpica muestral, es decir,
i=1
xi /n
n
i=1 (xi
x)2 /(n 1)
s2
rP
rS
AB
AB
AB
Ac
suceso imposible
suceso A incluido en el suceso B
suceso complementario del suceso A
Manuales Uex
289
p()
funcion de probabilidad
f ()
funci
on de densidad
aproximaci
on
desviaci
on tpica de una variable aleatoria
XY
XY
B(n, p)
distribuci
on binomial de par
ametros n y p
U (a, b)
distribuci
on uniforme continua de par
ametros a y b
N (, 2 )
zp
Manuales Uex
F ()
290
Signicado
distribuci
on normal de par
ametros y 2
cuantil de orden p del modelo normal estandar
2 (n)
distribuci
on 2 de Pearson con n grados de libertad
2p (n)
t(n)
distribuci
on t de Student con n grados de libertad
tp (n)
Signicado
cuantil de orden p del modelo t(n)
F (n, m)
distribuci
on F de Snedecor con n y m grados de libertad
Fp (n, m)
S2
H0
hip
otesis nula de un test de hip
otesis
H1
hip
otesis alternativa de un test de hip
otesis
pv
[]
Manuales Uex
Smbolo
291
Referencias
Ardanuy, R. & Martn, Q. (1999). Estadstica para ingenieros. Segunda
edici
on. Heperides.
Canavos, G. C. (1993). Probabilidad y estadstica. Aplicaciones y metodos.
McGraw-Hill.
ez, J., & Berne
, J. L. (1996). Teora de errores e
Chueca, M., Herra
instrumentaci
on. Paraninfo.
Crawley, M. J. (2005). Statistics: An introduction using R. Wiley.
Cuadras, C. (1982). Problemas de Probabilidad y Estadstica. PPU.
Garca, A. (2004). Bioestadstica b
asica. @becedario.
Harvey, B. R. (2006). Practical least squares and statistics for surveyors.
Third edition. School of Surveying and Spatial Information Systems.
Martn, A. & Luna del Castillo, J. D. (1990). Bioestadstica para las
ciencias de la salud. Ediciones Norma.
Martn, F. (1990). Geodesia y Cartografa matem
atica. Paraninfo.
Martn, F. J. & Ruiz-Maya, L. (1997a). Estadstica I: Probabilidad. AC.
Martn, F. J. & Ruiz-Maya, L. (1997b). Estadstica II: Inferencia. AC.
Mikhail, E. M. & Ackermann, F. (1976). Observations and least squares.
IEP-A Dun-Donnelley Publisher.
Mikhail, E. M., Bethel, J. S., & McGlone, J. C. (2001). Introduction
to modern photogrammetry. John Wiley & Sons.
measurements. Van Nostrand Reinhold Company.
Milton, J. S. & Arnold, J. C. (2004). Probabilidad y Estadstica con
aplicaciones para ingeniera y ciencias computacionales. McGraw-Hill.
Montgomery, D. C. & Runger, G. C. (1996). Probabilidad y Estadstica
aplicadas a la ingeniera. McGraw-Hill.
Manuales Uex
293
Manuales Uex
Taylor, J. R. (1982). An introduction to error analysis. The study of uncertainties in physical measurements. Oxford University Press.
Topping, J. (1975). Errors of observation and their treatment. John Wiley
& Sons.
Ugarte, M. D. & Militino, A. F. (2002). Estadstica aplicada con S-plus.
Universidad P
ublica de Navarra.
Walpole, R. E. & Myers, R. H. (1992). Probabilidad y Estadstica.
McGraw-Hill.
Wolf, P. R. (1997). Adjustment computations. Statistics and least squares
in surveying and GIS. Wiley Series.
294