Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 1 Repaso de Probabilidades y Estadìstica
Clase 1 Repaso de Probabilidades y Estadìstica
Pintarelli
Introducción
El campo de la estadística tiene que ver con la recopilación, análisis y uso de datos para tomar
decisiones y resolver problemas.
Cuando se recibe información en forma de datos es necesario obtener alguna conclusión a partir de
la información contenida en ellos.
Las técnicas estadísticas pueden emplearse para describir y comprender la variabilidad de los
datos. La variabilidad es el resultado de cambios en las condiciones bajo las que se hacen las
observaciones.
Por ejemplo, la medición obtenida a partir de una escala puede depender del lugar del panel en que
se coloque el objeto que se ha de medir. El muestreo también puede ser causa de variabilidad. Por
ejemplo, supóngase que un lote de 5000 circuitos integrados contiene exactamente 50 circuitos
defectuosos. Si se inspeccionan los 5000 dispositivos, y el proceso de inspección no tiene error en
la inspección o medición, entonces se encontrarán 50 circuitos defectuosos.
Pero supongamos que se selecciona una muestra de 100 dispositivos; es probable que alguno de
los dispositivos en la muestra esté defectuoso. Se espera que la muestra contenga alrededor de un
1% de circuitos defectuosos (ya que el lote contiene 50/5000 ×100 = 1% de artículos defectuosos).
Pero esta cantidad puede ser 0%, 2% o 5% de circuitos defectuosos, dependiendo de los
dispositivos específicos contenidos en la muestra. Por lo tanto el proceso de muestreo introduce
cierta variabilidad en los resultados observados en el sentido que la proporción de unidades
defectuosas puede cambiar de la proporción real a éstas.
El campo de la estadística y la probabilidad consiste en métodos tanto para describir y modelar la
variabilidad, como para tomar decisiones en presencia de ésta.
En la estadística inferencial lo que se desea hacer es tomar una decisión acerca de una población
en particular. El término población se refiere a la recolección de mediciones de todos los
elementos del universo con respecto al cual se quieren obtener conclusiones o tomar decisiones.
Por ejemplo, la población puede ser el lote de 5000 circuitos integrados del ejemplo anterior.
Supongamos que el fabricante está interesado en la ganancia del transistor de un circuito en
particular de cada uno de los dispositivos. Los distintos niveles que puede tener la ganancia del
transistor pueden considerarse como la población de interés. Por lo tanto cada valor de la
población es una medición numérica, como 5.10 o 5.24; en este caso los datos son variables o
datos numéricos.
Es posible que el fabricante esté interesado en determinar si el dispositivo produce o no una
ganancia que cumpla con algún requisito de diseño. En este caso la población se considera
formada por datos de atributo, en los que a cada dispositivo se le asigna el valor de uno si la
unidad no satisface el requisito de diseño, y cero si cumple con él.
En la mayoría de las aplicaciones de la estadística, los datos disponibles consisten de una muestra
de la población de interés. Esta muestra es un subconjunto de observaciones seleccionadas de una
población.
En el ejemplo de los circuitos integrados, supongamos que la muestra está formada por cinco
dispositivos seleccionados de un lote de 5000. Las ganancias del transistor observadas en estos
dispositivos son 5.10, 5.24, 5.13, 5.19 y 5.08. El interés puede centrarse en cuestiones como:
“¿la información contenida en la muestra lleva a la conclusión de que la ganancia del transistor es
menor que 5.50?”, o “¿cuánta confianza puede tenerse en que la ganancia del transistor se
1
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Los métodos para resumir y organizar datos se denominan estadística descriptiva. La mayor
parte del uso moderno de la estadística se dirige más hacia la inferencia que a la descripción. Por
ejemplo, un ingeniero que diseña un nuevo circuito de computadora fabricará una muestra
(prototipo) de ellos, y entonces querrá obtener conclusiones sobre la forma en que estos
dispositivos funcionarán una vez que se produzcan a gran escala.
Antes de estudiar las técnicas de la estadística inferencial, veremos los conceptos básicos de la
probabilidad. El conocimiento de este tema constituye la base que permite comprender la forma
en que se desarrollan las técnicas de la inferencia estadística y la toma de decisiones, por qué
funciona, y cómo pueden presentarse e interpretarse de manera correcta las conclusiones obtenidas
con estos procedimientos. La probabilidad es el lenguaje y la fundamentación matemática de la
estadística inferencial.
Si se mide la corriente que circula por un alambre de cobre delgado, lo que se está haciendo es un
experimento. Sin embargo, al repetir la medición durante varios días los resultados que se
obtienen son un poco diferentes debido a pequeñas variaciones en las variables que no están
controladas en el experimento, como son los cambios en la temperatura ambiente, ligeras
variaciones en el instrumento de medición y pequeñas impurezas en la composición química del
alambre en distintas partes, además de las variaciones en la fuente de corriente. En consecuencia,
se dice que este experimento (como muchos otros) tiene un componente aleatorio. En algunos
casos las variaciones aleatorias observadas son tan pequeñas en relación con las metas del
experimento, que pueden ignorarse. Sin embargo, la variación casi siempre está presente y su
magnitud puede llegar a ser tan importante a tal grado, que las conclusiones del experimento sean
no muy evidentes.
Sin importar con cuánto cuidado se diseñe y se realice un experimento, siempre se tendrán
variaciones. Se quiere comprender, cuantificar y modelar el tipo de variaciones que a menudo se
encuentran en la práctica. Cuando se incorpora la variación en el análisis, siempre pueden
obtenerse conclusiones fundamentales de los resultados que no se invaliden por la variación.
Experimentos aleatorios
2
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1-Se lo puede repetir bajo las mismas condiciones tantas veces como se desee.
2- No se puede predecir con exactitud el resultado de dicho experimento, pero se puede decir
cuáles son los posibles resultados del mismo.
3- A medida que el experimento se repite, los resultados individuales parecen ocurrir en forma
aparentemente caprichosa. Pero si el experimento se repite un gran número de veces, y
registramos la proporción de veces que ocurre un determinado resultado, veremos que esa
proporción tiende a estabilizarse en un valor determinado a medida que aumenta el número de
veces que se repite el experimento.
Por ejemplo, consideremos el experimento de lanzar un dado y observar el número de la cara
superior. Supongamos que tiramos el dado N veces, y sea n el número de veces que sale el
n
número 5 en los N tiros del dado. Entonces es la proporción de veces que sale el número 5 en
N
n
los N tiros. Si el dado es normal a medida que N aumenta, tiende a estabilizarse en un número
N
que es 1/6.
4- El resultado está determinado por factores que no se pueden controlar aún conocidos los
mismos.
A veces sucede que un experimento no es aleatorio estrictamente, pero resulta mucho más sencillo
estudiarlo como si fuera aleatorio. Por ejemplo, si tiramos una moneda y observamos qué lado
queda hacia arriba, el resultado sería predecible conociendo en forma precisa las velocidades
iniciales de traslación y rotación, y las elasticidades de los materiales del piso y de la moneda.
Pero la precisión con la que se necesitan conocer estos datos es casi imposible de obtener en la
realidad, por lo que es más conveniente tratar al experimento como aleatorio.
3
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Se llama evento o suceso a todo subconjunto del espacio muestral. Por ejemplo,
a) En el experimento dado en el ejemplo a), un evento de S sería A 2,4,6 pues A S .
Podemos expresar al evento A con palabras de la siguiente manera A: “sale un
número par”
También B 1,2,3 es un evento al que podemos expresar verbalmente como
B: “sale un número menor o igual que 3”
b) En el experimento dado en el ejemplo d), un evento de S sería
C c, c, c ; (c, c, s); (c, s, c); (s, c, c) , el que en palabras se puede expresar como
C: “salen por lo menos dos caras”
c) En el experimento dado en el ejemplo f), un evento de S sería D: “la lamparita
dura más de 1200 horas”, en notación de conjuntos D t R; t 1200
Interpretaciones de la probabilidad
4
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1- 0 f A 1
2- f A 1 si y solo si A ocurre cada vez en las n repeticiones
3- f A 0 si y solo si A no ocurre nunca en las n repeticiones
4- Si A y B son dos eventos mutuamente excluyentes entonces f AB f A f B
Cada vez que un espacio muestral esté formado por n posibles resultados
igualmente probables, la probabilidad de cada uno de ellos será 1/n.
Independencia de eventos
Dados dos eventos A y B , puede ocurrir que saber que A ocurrió modifica la probabilidad de
ocurrencia de B. Cuando ocurre que saber que A ocurrió no modifica la probabilidad de
ocurrencia de B se dice que A y B son eventos independientes.
Se puede probar que
A y B son independientes si y solo si P( A B) P( A) P( B)
Variables aleatorias
resultado probabilidad
(9,19) 1/9
(9,20) 1/9
(9,21) 1/9
5
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
(10,10) 1/9
(10,20) 1/9
(10,21) 1/9
(11,19) 1/9
(11,20) 1/9
(11,21) 1/9
Ahora lo que es importante para el ingeniero de este experimento es la suma de las dos
resistencias, en vez de sus valores individuales. Entonces se asigna a cada resultado un número
igual a la suma de las dos resistencias seleccionadas. Esta asignación se representa por la letra X y
se presenta en la siguiente tabla
resultado X probabilidad
(9,19) 28 1/9
(9,20) 29 1/9
(9,21) 30 1/9
(10,10) 29 1/9
(10,20) 30 1/9
(10,21) 31 1/9
(11,19) 30 1/9
(11,20) 31 1/9
(11,21) 32 1/9
La función X que asigna un valor numérico a cada resultado en el espacio muestral es una
variable aleatoria. En topografía una variable aleatoria puede ser: “la cantidad de veces que entra
el metro patrón entre dos marcas fijas o no.”
Se acostumbra anotar a las variables aleatorias con letras mayúsculas. Las letras X, Y y Z se usan
con más frecuencia.
Se puede calcular las probabilidades para las variables aleatorias de una manera obvia. En el
ejemplo anterior, el evento X = 29 corresponde con el evento {(9,20) , (10,19)} del espacio
muestral. Por lo tanto ( ) ,*( )( )+-
Hacemos una lista de los valores posibles de la variable aleatoria (v.a) X y determinamos la
probabilidad de cada uno de ellos:
X P(X = x)
28 1/9
29 2/9
30 3/9
31 2/9
32 1/9
La tabla anterior contiene toda la información necesaria para calcular cualquier probabilidad que
considere a la v.a. X. Es de destacar la simetría de la distribución.
P( X 0) Ps, s, s
1
8
P( X 1) Pc, s, s ; s, c, s ; s, s, c
3
8
P( X 2) Pc, c, s ; s, c, c ; c, s, c
3
8
P( X 3) Pc, c, c
1
8
Se puede presentar la distribución de probabilidad de X en una tabla de la siguiente forma
x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8
7
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
2-Se tira un dado normal. Sea X: “número que queda en la cara superior”
Entonces RX 1,2,3,4,5,6
La función de distribución de X es
x 1 2 3 4 5 6
p(x) 1/6 1/6 1/6 1/6 1/6 1/6
A estas distribuciones se las denomina uniformes ya que en todo su rango de ocurrencia la
probabilidad es constante. Al error de lectura en los instrumentos digitales se los suele modelizar
estadísticamente con esta distribución de probabilidades.
F ( x) P( X x) p( x )
xi x
i x
8
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
0 si x 0 0 si x 0
1 1
si 0 x 1
8 8 si 0 x 1
1 3 1
F ( x) si 1 x 2 F ( x) si 1 x 2
8 8
1 3 3 2
si 2 x 3 7 si 2 x 3
8 8 8 8
1 si x 3 1 si x 3
La gráfica de la F.d.a. de X es
Observación: la F.d.a. de X es una función escalonada, los puntos de “salto” coinciden con los
puntos del rango de X, y la magnitud del salto en x i es igual a P( X xi )
Sea X una v.a. discreta con rango . La esperanza , valor medio o valor esperado de X , lo anotamos
, y se define como
Ejemplos:
1- Sea la v.a. X: “número que queda en la cara de arriba al tirar un dado normal”
RX 1,2,3,4,5,6
6
Entonces E ( X ) xP ( X x)
x 1
1P( X 1) 2P( X 2) 3P( X 3) 4P( X 4) 5P( X 5) 6P( X 6)
9
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1 1 1 1 1 1 7
1 2 3 4 5 6 3.5
6 6 6 6 6 6 2
2- Se tira una moneda normal tres veces, sea la v.a. X: “número de caras obtenidas”
Entonces R X 0,1,2,3
Calculamos la esperanza de X
3
1 3 3 1 3
E ( X ) xP ( X x) 0 1 2 3 1.5
x 0 8 8 8 8 2
Observaciones:
1- La esperanza de una v.a. no tiene que coincidir necesariamente con algún valor del rango de la
variable
2- En el ejemplo 1 donde el rango es finito y equiprobable, la esperanza de X coincide con el
promedio de los valores del rango de X
3- Se puede interpretar a la esperanza de una v.a. como un promedio “pesado” o “ponderado” de
los valores del rango de la variable, donde el “peso” de cada x i es la probabilidad P( X xi )
4- Otra interpretación que se puede hacer de la esperanza es la siguiente: consideremos el
ejemplo1, supongamos que tiramos el dado muchas veces, N veces, y entonces obtenemos una
secuencia de N valores x1 , x2 ,....., x N donde cada x i es un número natural del 1 al 6. Supongamos
además que hacemos un promedio de esos N valores, y si llamamos ni al número de veces que
sale el número i tenemos que
Es decir si promediamos los N valores medidos de X, ese promedio tiende a E(X) cuando
N ,
ni
pues P( X i) cuando N es grande.
N
Esta última forma de ver la esperanza o valor esperado es la que adoptamos cuando promediamos
distintas observaciones.
x1 x2 .... x N
x
N
Más adelante veremos más propiedades del promedio.
x 1 2 3 4
p(x) 0.01 0.19 0.35 0.45
Suponga que el instructor tarda X minutos calificando un trabajo que consiste en X páginas.
Claramente X es otra variable aleatoria. ¿Cuál será su esperanza?, es decir ¿a qué es igual
E X ?
Para calcular la esperanza de una v.a. se necesita conocer su función de distribución de
probabilidad, por lo tanto habría que hallar previamente la distribución de probabilidad de la v.a.
Y X.
Está claro que si el rango de X es R X 1,2,3,4 entonces el rango de Y será RY 1, 2 , 3, 4
.
Además
P(Y 1) P( X 1) 0.01
P(Y 2 ) P( X 2) 0.19
P(Y 3) P( X 3) 0.35
P(Y 4 ) P( X 4) 0.45
Por lo tanto
EY 1 P(Y 1) 2 P(Y 2 ) 3 P(Y 3) 4 P(Y 4 )
1 P( X 1) 2 P( X 2) 3 P( X 3) 4 P( X 4) 1.78491
O sea
E (Y ) x P( X x)
x
Lo visto en este ejemplo se puede generalizar en el siguiente
Teorema: Si X es una v.a. discreta con rango RX y distribución de probabilidad p(x), entonces
la esperanza de cualquier función h(X) es igual a
Ejemplo:
Un negocio de computadoras ha comprado tres computadoras de cierto tipo a $500 cada una y las
venderá a $1000 cada una. El fabricante ha aceptado volver a comprar en $200 cualquier
computadora que no se haya vendido en un tiempo especificado.
Sea X: “número de computadoras vendidas” , y supongamos que la distribución de probabilidad de
X es
x 0 1 2 3
p(x) 0.1 0.2 0.3 0.4
11
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
3 3 3
E (Y ) 800 x 900P( X x) 800 xP ( X x) 900 P( X x) 800 E ( X ) 900
x 0 x 0 x 0
y calculando la esperanza de X , se llega al mismo resultado
Propiedades de la esperanza
E(aX b) aE( X ) b
E (X ) 1
Ejemplo:
En el ejemplo anterior donde Y 800 X 900
Directamente calculamos
E(Y ) 800E( X ) 900
Y
E( X ) 0 0.1 1 0.2 2 0.3 3 0.4 2
En consecuencia
E(Y ) 800E( X ) 900 800 2 900 700
12
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Observaciones:
1- Para cualquier constante a, E(aX ) aE ( X )
2- Para cualquier constante b, E( X b) E( X ) b
Ejemplo:
Si poseo el valor esperado de dos cotas, PfA y PfB el desnivel esperado será
E( PfB PfA) 1PfB 1PfA
La esperanza de una v.a. mide dónde está centrada la distribución de probabilidad. Pero
supongamos el siguiente ejemplo
Sean X e Y dos variables aleatorias con distribuciones dadas por
x -1 1 y -100 100
p(x) 0.5 0.5 p(y) 0.5 0.5
Es fácil verificar que E( X ) E(Y ) 0 , pero los valores que toma la v.a. Y están más “alejados”
de su esperanza que los valores de X.
Se busca una medida que refleje este hecho, se define entonces la varianza de una v.a.
Sea X una v.a. discreta con rango RX, función de distribución de probabilidad p(x) y esperanza
𝐸(𝑋) 𝜇,
Entonces la varianza de X, que anotamos 𝑉(𝑋) 𝜎 2 𝑜 𝜎𝑋2 es
13
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Observaciones:
1- La varianza de una v.a. nunca es negativa
2- La cantidad h( X ) X es el cuadrado de la desviación de X desde su media, y la
2
Ejemplo:
En el caso de las variables aleatorias X e Y nombradas anteriormente,
V ( X ) 1 0 0.5 1 0 0.5 1 y X 1
2 2
Otra forma de escribir la varianza de una v.a., que facilita los cálculos es
V ( X ) x p( x) x 2 2x 2 p( x) x 2 p( x) 2 xp ( x) 2 p ( x)
2
E( X 2 ) 2E( X ) 2 E( X 2 ) 2 2 2 E( X 2 ) 2
Por lo tanto
V ( X ) E( X 2 ) 2
Propiedades de la varianza
Las propiedades de la varianza de una v.a. son consecuencia de las propiedades de la esperanza de
una v.a.
Si X es una v.a. discreta con rango R X y distribución de probabilidad p(x), entonces la varianza de
cualquier función h(X) es igual a
V (aX b) a 2V ( X ) y aX b V (aX b) a X
Observaciones:
1- V (aX ) a 2V ( X )
2- V ( X b) V ( X )
Ejemplo:
14
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Sabemos ya que E ( X ) 2
En consecuencia
V (Y ) 800 2 V ( X ) 800 2 E( X 2 2 ) 800 2 5 2 2 800
Distribución binomial
Sea un experimento aleatorio. Sea A un evento asociado a y anotamos P( A) p .
Supongamos un experimento aleatorio 0 que cumple los siguientes requisitos:
1- se realizan n repeticiones independientes de , donde n se fija de antemano.
2- las repeticiones son idénticas, y en cada repetición de observamos si ocurre A o no ocurre A
(cuando A ocurre se dice que se obtuvo un “éxito”, caso contrario se obtuvo un “fracaso”)
3- la probabilidad de éxito es constante de una repetición a otra de , y es igual a p .
Se dice entonces que 0 es un experimento binomial
Ejemplos:
1- Se tira una moneda 4 veces en forma sucesiva e independiente, y observamos en cada tiro si
sale cara o no sale cara.
Entonces este es un experimento binomial pues:
sería el experimento “tirar una moneda”
A sería el evento “sale cara”
se repite en forma sucesiva e independiente n = 4 veces
P( A) p es la misma en cada tiro.
2- Se tiene una urna con 15 bolillas blancas y 5 verdes. Se extraen al azar con reemplazo tres
bolillas y se observa si la bolilla extraída es blanca.
Entonces este es un experimento binomial pues:
sería el experimento “extraer al azar una bolilla de la urna”
A sería el evento “se extrae bolilla blanca”
se repite en forma sucesiva e independiente n = 3 veces
15 3
P( A) es la misma en cada extracción.
20 4
El muestreo con reemplazo implica que las condiciones bajo las que se realiza el experimento no
se alteran en cada repetición. Es lo que debería suceder cuando realizamos nuestras observaciones.
15
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Los factores que determinan los resultados ,aunque no controlables, deberían estar presentes en
cada medición.
Una forma de ver el experimento binomial es no en función de colores o figuras sino de signos
con que ocurre un determinado fenómeno, por ejemplo la coincidencia de dos marcas o señales.
En nuestro caso los extremos de una cinta con el objeto a medir o cualquier situación similar.
1
C
2
C
3
C
4 C
1
C
2
1 1 1 1 1
P( X 0) P A A A A P( A ) P( A ) P( A ) P( A )
C C
3
4 4 4 4 4
C
4
por independencia
Para calcular la P( X 1) pensamos que hay cuatro casos posibles en los que se puede obtener
exactamente una cara, que la cara salga en el 1º tiro, o en el 2º o en el 3º o en el 4º tiro. Notar que
tenemos cuatro casos y eso es igual a la cantidad de formas en que podemos elegir entre los 4
4 4!
tiros uno de ellos en el cual sale cara, es decir tenemos 4 casos diferentes.
1 1!3!
P( X 1)
P A1 A2C A3C A4C P A1C A2 A3C A4C P A1C A2C A3 A4C
P AC
1 A2C A3C A 4
4 4!
Análogamente, para calcular P( X 2) tenemos 6 casos en los que salen
2 2!2!
exactamente dos caras, por lo tanto
4
P( X 2) P A1 A2 A3C A4C P A1 A2C A3 A4C p 2 (1 p) 2
2
16
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
4
P( X 3) p 3 (1 p) ; P( X 4) p 4
3
n
P( X k ) pk ( 1-p)n-k k 0,1,2,..., n
k
Notación: indicamos que X es una v.a. binomial con parámetros n y p con el símbolo
X ~ B(n, p)
Dado que los números P( X k ) corresponden a la distribución de una v.a., automáticamente
n
cumplen que P( X k ) 1
k 0
De todas formas se podría hacer una verificación algebraica utilizando la fórmula del binomio de
Newton
n n
n k
P ( X k ) p (1 p) nk p 1 p n 1
k 0 k 0 k
Ejemplos:
1- En el ejemplo anterior en el que se tira una moneda 4 veces, calcular la probabilidad de
obtener:
a) exactamente una cara
b) al menos una cara
c) a lo sumo una cara
Solución:
a) tenemos que la v.a. X: “número de caras obtenido” es B(4,0.25)
4 1 1
1 3 3
1 3
se pide P( X 1) 1 4 0.421875
1 4 4 4 4
b) la probabilidad de obtener al menos una cara es
4k
4 1 3
4 k
P( X 1) P( X 1) P( X 2) P( X 3) P( X 4)
k 1 k 4 4
4 0
4 1 1
0 4
3
P( X 1) 1 P( X 0) 1 1 1 1 0.421875 0.578125
0 4 4 4
c) la probabilidad de obtener a lo sumo una cara es
17
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
40 4 1
4 1 1 4 1 1
0 1
P( X k ) F (k ) F (k 1) k 1,2,..., n
2- Supongamos que el 20% de todos los ejemplares de un texto en particular fallan en una prueba
de resistencia a la encuadernación. Se seleccionan 15 ejemplares al azar.
Sea la v.a. X: “número de ejemplares que fallan en la prueba entre los 15 seleccionados”
a) ¿cuál es la probabilidad de que a lo sumo 8 fallen en la prueba?
b) ¿cuál es la probabilidad de que exactamente 8 fallen en la prueba?
c) ¿cuál es la probabilidad de que al menos 8 fallen en la prueba?
Solución:
a) Tenemos que X ~ B(15,0.2)
8
P( X 8) P( X k ) F (8) 0.999
k 0
por tabla de la F.d.a.
Observaciones:
1- Si X ~ B(1, p) entonces la v.a. X toma sólo dos valores 0 y 1 con probabilidades p y 1-p es
decir podemos escribir
18
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1
p = 0,01
0,8 n = 15
0,6
0,4
0,2
0
0 3 6 9 12 15
0,3
p = 0,2
0,25 n = 15
0,2
0,15
0,1
0,05
0
0 3 6 9 12 15
0,2
p = 0,5
0,16 n = 15
0,12
0,08
0,04
0
0 3 6 9 12 15
19
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
0,24
p = 0,7
0,2 n = 15
0,16
0,12
0,08
0,04
0
0 3 6 9 12 15
1
p = 0,995
0,8 n = 15
0,6
0,4
0,2
0
0 3 6 9 12 15
Esperanza y varianza
2
P(z=8) = . /
20
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
2) Para el caso anterior cuál es la probabilidad de que todas las mediciones tengan ese error.
P(z=10) = . /
P(z=0) = . /
1) controlo dos cintas poniéndolas apareadas. Debería encontrar tantas diferencias positivas
como negativas. Puedo evaluar la probabilidad de encontrar los r resultados encontrados. La idea
es que una baja probabilidad nos permita sostener que existe una diferencia sistemática entre
ambas. También puede aplicarse a dos miras.
2) tengo una red de anillos de nivelación. Debería tener tantos cierres positivos como negativos.
Sólo cuento la cantidad de signos positivos sin fijarme en la magnitud de los desvíos.
21
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Sea X una v.a. Decimos que es continua si existe una función no negativa f , definida sobre todos
los reales x , , tal que para cualquier conjunto B de números reales
P( X B) f ( x)dx
B
O sea que la probabilidad de que X tome valores en B se obtiene al integrar la función f sobre el
conjunto B.
A la función f la llamamos función densidad de probabilidad (f.d.p.).
Observaciones:
1- Como X debe tomar algún valor real, entonces debe cumplirse que
1 P( X ) f ( x)dx
b
P( X B) P(a X b) f ( x)dx
a
a
P( X a) f ( x)dx 0
a
Es decir la probabilidad que una v.a. continua tome algún valor fijado es cero. Por lo tanto,
para una v.a. continua
b
P(a X b) P(a X b) P(a X b) P(a X b) f ( x)dx
a
F ( x) P( X x) x
22
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
x
F ( x) P( X x) f (t )dt
x
Además
b b a
P(a X b) f ( x)dx f ( x)dx f ( x)dx F (b) F (a)
a
Observación:
Si X es una v.a. con f.d.p. f(x) y función de distribución acumulada F (x) entonces
dF ( x) d
x
f (t )dt f ( x) donde F (x) sea derivable
dx dx
Es decir, se puede obtener la función de densidad de X a partir de su F.d.a.
Para una v.a. discreta la E (X ) se definió como la suma de los xi p( xi ) . Si X es una v.a. continua
con f.d.p. f(x), se define E (X ) sustituyendo la sumatoria por integración y p( xi ) por f(x).
A menudo se desea calcular la esperanza de una función de X, Y = h(X), esto se puede hacer
hallando previamente la densidad de Y y luego calcular E(Y) aplicando la definición anterior.
Otra forma de calcular E(Y) sin hallar la densidad de Y está dada por el siguiente
23
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Teorema: Si X es una v.a. continua con f.d.p. f(x) y h(X) es cualquier función de X, entonces
E(aX b) aE( X ) b
Sea X una v.a. continua con f.d.p. f(x) y sea 𝐸(𝑋) 𝜇, entonces la varianza de X es
La interpretación de la varianza de una v.a. continua es la misma que para el caso discreto.
Además sigue valiendo la igualdad
V (X ) E X 2 2
Pues en la demostración hecha para el caso discreto si sustituyen las sumatorias por integrales.
Por la misma razón, también vale que
V (aX b) a 2V ( X ) y aX b a X
24
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1 x 2
1
2
f ( x) e x
2
Donde R y 0
Notación: X ~ N , 2
Para darse una idea de la forma de la gráfica notar que:
1- f (x) es simétrica alrededor de , es decir f ( x) f ( x) para todo x
2- lim f ( x) 0 (eje x asíntota horizontal)
x
d
3- Si planteamos f ( x) 0 x . Se pude verificar que en x la función tiene un
dx
máximo absoluto, f ( ) 1
2
2
d
4- Si planteamos f ( x) 0 x . Se puede verificar que en x y en
dx 2
x la función tiene dos puntos de inflexión, y además en el intervalo , la
función es cóncava hacia abajo y fuera de ese intervalo es cóncava hacia arriba
Observación:
Cuando varía la gráfica de la función se traslada, es un parámetro de posición.
Cuando aumenta, la gráfica se “achata”, cuando disminuye la gráfica se hace más
“puntiaguda”, se dice que es un parámetro de escala o dispersión.
En las siguientes figuras vemos cómo varía la gráfica de f(x) con la variación de los parámetros
25
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
0 1
2 1
- - - - - 3 1
0.4
0.3
0.2
0.1
-6 -4 -2 2 4 6
0 1
0 2
----- 0 4
Que a) es cierta se ve en la gráfica; para probar b) es necesario recurrir al cálculo en dos variables
(no lo demostramos).
Si 0 y 1 entonces se dice que X tiene distribución normal estándar. Se anota X ~ N 0,1
En este caso la f.d.p. se simboliza con (x) , es decir
26
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1
1 x2
( x) e 2
x
2
x 1
1 t2
( x) P( X x)
2
e 2
dt
Esta integral no puede expresarse en términos de funciones elementales, por lo tanto se calcula
(x) para valores específicos de x mediante una aproximación numérica.
Esto ya está hecho, existen tablas de la función de distribución acumulada de la normal estándar
para valores de x que oscilan en general entre -4 y 4, pues para valores de x menores que -4,
( x) 0 , y para valores de x mayores que 4, ( x) 1
Notar que como la (x) es simétrica con respecto al origen entonces
( x) P( X x) P( X x) 1 P( X x) 1 ( x)
-x 0 x
Por ejemplo, si X ~ N 0,1 entonces utilizando la tabla de la F.d.a. de X
a) P( X 1.26) (1.26) 0.89616
b) P( X 1.26) 1 P( X 1.26) 1 (1.26) 1 0.89616 0.10384
c) P( X 1.37) P( X 1.37) (1.37) 0.91465
d) P(1.25 X 0.37) P( X 0.37) P( X 1.25) (0.37) (1.25)
(0.37) 1 (1.25) 0.64431 (1 0.89435) 0.53866
e) ¿Para qué valor x se cumple que P( x X x) 0.95 ?
Tenemos que P( x X x) ( x) ( x) ( x) (1 ( x)) 2( x) 1
0.90 1
Por lo tanto 2( x) 1 0.95 ( x) 0.975
2
27
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
a) b)
1.26 1.26
c)
Una propiedad importante de la distribución normal es que si X ~ N , 2 entonces la v.a.
Y aX b con a y b números reales, a 0 , tiene también distribución normal pero con
parámetros a b y a 2 2 , es decir
X ~ N , 2 aX b ~ N(a b, a 2 2 ) (1)
X
si X ~ N ( , 2 ) entonces Y ~ N (0,1) (2)
1
Notar que Y se pude escribir como Y X es decir claramente Y es una función lineal
de X
1
Por lo tanto aplicamos el resultado (1) con a y b y llegamos a (2).
28
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Si X ~ N , 2 entonces la F.d.a. de X es
1 t
2
x
2
F ( x) P( X x) 1
e dt
2
F(x) no puede expresarse en términos de funciones elementales y sólo hay tablas de la F.d.a. de la
normal estándar.
Para calcular F(x) procedemos de la siguiente forma
Ejemplos:
1- Si X ~ N 3,9 entonces
a)
2 3 X 3 5 3 5 3 2 3 2 1
P(2 X 5) P 0.3779
3 3 3 3 3 3 3
X 3 0 3
b) P( X 0) P 1 (1) (1) 0.8413
3 3
6 X 3 6
c) P X 3 6 1 P X 3 6 1 P 6 X 3 6 1 P
3 3 3
1 2 2 21 (2) 0.0456
2- Hay dos niveles máquinas para cortar corchos destinados para usarse en botellas de vino. La
primera produce corchos con diámetros que están normalmente distribuidos con media de 3 cm y
desviación estándar de 0.1 cm. La segunda máquina produce corchos con diámetros que tienen
una distribución normal con media de 3.04 cm y desviación estándar de 0.02 cm. Los corchos
aceptables tienen diámetros entre 2.9 cm y 3.1 cm. ¿Cuál máquina tiene más probabilidad de
producir un corcho aceptable?
Solución:
Sean las variables aleatorias
X: “diámetro de un corcho producido por la máquina 1”
Y: “diámetro de un corcho producido por la máquina 2”
Entonces X ~ N 3,0.12
y Y ~ N 3.04,0.02 2
29
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
3- Supóngase que la resistencia a romperse (en Kgr) de fibras de yute está descrita por una v.a.
continua X normalmente distribuida con μ E X 165 Kgr y σ 2 V X 9 (Kgr)2.
suponiendo además que una muestra de esta fibra se considera defectuosa si X 162 . Cuál es la
probabilidad de que una fibra elegida al azar sea defectuosa?
Solución:
Deseamos conocer P X 162
X 165 162 165 X 165
P X 162 P P 1 1 ,
3 3 3
X 165
puesto que Z N 0,1 . Entonces
3
P X 162 1 1 1.
De la tabla tenemos 1 0.8413 1 1 1 0.1587 .
Es decir P X 162 0.1587 .
Observación:
Uno puede pensar en objetar el usar una distribución normal estándar para describir a la v.a. X que
representa la resistencia a romperse de la fibra ya que ésta es, obviamente, una cantidad no
negativa, mientras que una v.a. normalmente distribuida puede tomar valores que varían entre
y . Sin embargo al modelar el problema con una normal estándar (que aparentemente debería
ser invalidada como modelo por lo señalado) vemos que les estamos asignando al suceso X 0
una probabilidad prácticamente nula (ver también la figura siguiente):
X 165 0 165
P X 0 P 55 1 55 1 1 0 .
3 3
30
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1,5
f(x)
1,0
0,5
x [Kgr]
Vemos que el fenómeno estudiado se modela estadísticamente mediante una ecuación del tipo
1 t
2
x
2
F ( x) P( X x) 1
e dt
2
Pero luego, para su resolución realizamos el cambio de variable que conduce a la distribución
estandarizada
x 1
1 2t 2
( x) P( X x) e dt
2
En casos como estos se justifica usar la distribución normal para modelar situaciones en que la
variable aleatoria considerada puede tomar, por su significado, sólo valores positivos, aún cuando
la normal permita tomar valores tanto positivos como negativos por cuanto la probabilidad de que
la v.a. tome valores negativos es prácticamente nula.
La distribución normal explica cómo se distribuye la ocurrencia de un fenómeno determinado en
torno a un valor más probable o central más allá de los valores en sí mismos.
Sea entonces y
Anteriormente se estudiaron distribuciones de probabilidad para una sola variable aleatoria. Sin
embargo, a menudo es útil definir en un experimento aleatorio más de una variable aleatoria.
Por ejemplo, en la clasificación de señales transmitidas y recibidas, cada una de ellas puede
clasificarse como de baja, media o alta calidad. Incluso puede definirse una v.a. X igual al número
de señales de alta calidad recibidas, y otra v.a. Y igual al número de señales de baja calidad
recibidas. En otro ejemplo, la v.a. continua X puede denotar la longitud de una pieza moldeada por
inyección, y la v.a. continua Y puede ser el ancho de la pieza. Por ejemplo, si las especificaciones
31
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
para X e Y son (2.95 a 3.05) y (7.60 a 7.80) milímetros, respectivamente, entonces se puede tener
interés en la probabilidad de que una pieza cumpla con ambas especificaciones, o sea P( 2.95 < X
< 3.05 y 7.60 < Y < 7.80).
En general si X e Y son dos variables aleatorias discretas, la distribución de probabilidad que
define el comportamiento simultáneo de éstas se conoce como distribución de probabilidad
conjunta, que se anota p(x,y) . En el caso continuo se tiene la función de densidad conjunta que
se anota f(x,y) .
Independencia
Covarianza y correlación
Cuando se definen dos o más variables aleatorias en un espacio de probabilidad, es útil describir la
forma en que varían juntas; esto es, resulta útil tener una medida de la relación que existe entre las
variables. Una medida común de la relación que existe entre dos variables aleatorias es la
covarianza.
La covarianza está definida por la misma expresión para variables aleatorias discretas o continuas.
Este parámetro de dispersión conjunta será tenido en cuenta al preparar las observaciones para el
ajuste de la red en lo que llamaremos el modelado estadístico del trabajo.
En realidad más que la covarianza aquí nos interesa considerar una cantidad relacionada con σ XY
y que según veremos nos dará información sobre el grado de asociación que existe entre X e Y .
Más concretamente nos contará si existe algún grado de relación lineal entre X e Y . Esa cantidad
es el coeficiente de correlación lineal.
32
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
En el mismo sentido en que podemos tener una idea aproximada sobre la probabilidad de un
suceso A si repetimos el experimento y consideramos las ocurrencias de A en las n repeticiones,
así podemos tener también una primera idea sobre la existencia de una relación funcional,
específicamente una relación lineal, entre X e Y si consideramos un diagrama de dispersión.
Consiste en dibujar pares de valores xi , y j medidos de la variable aleatoria X ,Y en un sistema
de coordenadas. En la figura mostramos diversas situaciones posibles.
y y y
(xi yi)
0 x 0 x x
a b c
De la figura a se deduciría que entre X e Y no hay ningún tipo de relación funcional. La figura b
sugiere la posibilidad de que exista una relación funcional que corresponde a una parábola. La
figura c, por su parte, sugiere una relación lineal entre X e Y . Este último es el comportamiento
que nos interesa caracterizar. Con ese fin definimos el coeficiente de correlación lineal como
sigue:
entre X e Y como
En consecuencia:
Daremos una serie de propiedades de ρ XY que nos permitirán establecer más concretamente su
significado.
33
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Propiedad 1
Propiedad 2 :
Propiedad 3 :
Propiedad 4 :
entonces . Si es y si es .
para − −
y parámetros
− − −
34
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1)
2)
35
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
En algunos casos, se tienen definidas más de dos variables aleatorias en un experimento aleatorio.
Por ejemplo, supongamos que, en uno de los ejemplos anteriores, la calidad de cada bit recibido se
clasifica en cuatro clases: excelente, buena, aceptable o pobre anotadas respectivamente E, B, A y
P. Consideramos las variables aleatorias X1, X2, X3 y X4 que indican el número de bits que son E,
B, A y P respectivamente, en una transmisión de 20 bits. Aquí el interés está en la distribución
conjunta de cuatro variables aleatorias. La distribución de probabilidad conjunta estará
especificada por una función de cuatro variables p(x1,x2, x3, x4) = P(X1 = x1, X2 = x2 , X3 = x3, X4 =
x4). Dado que cada uno de los 20 bits clasificados cae en una de las cuatro clases, sólo los valores
de x1,x2, x3 y x4 que suman 20 reciben una probabilidad positiva.
En general si X1, X2, …,Xn son n variables aleatorias discretas entonces se tendrá una función de
distribución conjunta especificada por una función de n variables p(x1,x2, x3,…, xn)
En el caso de ser las variables aleatorias continuas, se tendrá una función de densidad de
probabilidad conjunta f(x1,x2, x3,…, xn).
La noción de independencia se generaliza al caso de más de dos variables aleatorias.
En el caso de las redes altimétricas nos encontraremos con un vector de observaciones con los
desniveles que integren la red. Cada desnivel estará acompañado por una varianza estimada según
la calidad del instrumental o método empleado. Como se dijo antes se supondrá que la
determinación de un desnivel en nada afecta a los demás.
Y su matriz de varianzas-covarianzas es
2
( ) ( )
2
con
( )
{
( )
Para nuestro caso las matrices de varianza covarianza de las observaciones serán matrices
diagonales con los términos
( )
36
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
( ) ,( − ( )) ( − ( ))-
o como
( ) , - − ( ( )) ( )
2) V(X) es una matriz simétrica y semidefinida positiva, siendo definida positiva si y solo
si no existe ninguna combinación lineal entre las variables X1, X2, … , Xn
Por lo tanto ( ) ( ) ( ) 2 ( 2) ( ) y
V(Y) = AT . V(X) . A =
2
2) 2
( 2 )( )( ∑ ∑
2
2 2
V(Y) = ∑ ∑ ( )
La v.a. n-dimensional X = (X1, X2, …,Xn) sigue una distribución normal n-dimensional de
parámetros ( 2 ) y ( ) , matriz simétrica y definida positiva, si su función
de densidad es
( ) [− ( − ) ( − ) ]
( )2 | |
para − . Se anota ~ ( )
37
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
( ) y ( )
38
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Error de medición
Una geóloga pesa una roca en una balanza. Toma cinco mediciones y obtiene los siguientes datos
en gramos: 251.3 252.5 250.8 251.1 250.4
Todas las mediciones son diferentes y es probable que ninguna sea igual a la masa “real” de la
roca. A la diferencia entre un valor medido y el valor “real” se lo llama error en el valor medido.
Por ejemplo supongamos que las mediciones de la roca se leían en una marca en una escala. Si la
balanza no estaba calibrada adecuadamente, cada medición estará lejos de su valor real en cierta
cantidad fija. Por lo tanto una calibración imperfecta aporta errores de la misma magnitud en cada
medición. La interpolación entre las marcas de graduación de la escala es otra fuente de error. La
magnitud del error debida a la interpolación quizá varíe entre mediciones y es probable que sea
positivo para algunas mediciones y negativo para otras. Es razonable suponer que a largo plazo el
promedio de los errores por interpolación será igual a cero.
En general, el error de una medición lo integran el error sistemático o sesgo, y el error aleatorio.
El primero presenta la parte del error que es igual ,o está funcionalmente determinada, para cada
medición, el segundo varía en forma aleatoria entre mediciones y, en promedio, será igual a cero
en el largo plazo. Algunas fuentes de error contribuyen con ambos tipos de error, el sesgo y el
error aleatorio.
Cualquier medición se puede considerar como la suma del valor real más las contribuciones de
cada uno de los dos componentes de error:
Como parte del error es aleatorio, es adecuado utilizar un modelo estadístico para estudiar los
errores de medición. Los sesgos se asocian a modelos funcionales. Por ejemplo los errores por
curvatura y refracción y la influencia del error del nivel. Se modela cada valor medido como una
variable aleatoria, tomada de una población de mediciones posibles. La media µ de la población
39
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
representa esa parte de la medición que es igual para toda medición. Por lo tanto µ es la suma del
valor real más el sesgo. El estudio de los modelos funcionales es lo que va a permitir que esta
componente sistemática sea lo menor posible. La desviación estándar σ de la población representa
la desviación estándar del error aleatorio. Ésta representa la variación debida al hecho de que cada
medición tiene un valor diferente por su error aleatorio. Intuitivamente σ constituye el tamaño de
un error aleatorio estándar( desviación estándar).
Se tiene interés en dos aspectos del proceso de medición. El primero es su exactitud. Ésta la
determina el sesgo, que es la diferencia entre la media µ de la medición y el valor “real” de ésta
última. Entre más pequeño es el sesgo, más exacto será el proceso de medición. Si la media µ es
igual al valor real, el sesgo será igual a cero, en este caso al proceso de medición se le llama
no sesgado.
El otro aspecto de interés en el proceso de medición es la precisión. Ésta constituye el grado con
que tienden a coincidir las mediciones repetidas de la misma cantidad. Si las mediciones repetidas
resultan cercanas entre sí todo el tiempo, la precisión es alta. Si son muy dispersas, la precisión es
baja. Por lo tanto la precisión se determina mediante la desviación estándar σ del proceso de
medición. Con frecuencia se llama a σ incertidumbre aleatoria del proceso de medición.
Valor medido ± σ
𝜎𝑎𝑋 |𝑎|𝜎𝑋
Ejemplo
El radio de un círculo mide 3.0 ± 0.1 cm. Calcule la circunferencia y determine la incertidumbre
de la circunferencia.
40
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Solución
Sea R el radio del círculo. El valor medido de R es de 3.0 cm y la incertidumbre es la desviación
estándar de esta medición, que es
La circunferencia está dada por .
La incertidumbre en C es la desviación estándar de C.
Entonces
| | ( )
Ejemplo
Un topógrafo mide el perímetro de un terreno rectangular. Toma medidas de dos lados adyacentes,
50.11 ± 0.05 m y 75.21 ± 0.08 m. Estas mediciones son independientes. Estime el perímetro del
terreno y determine la incertidumbre en la estimación.
Solución
Anotamos X = 50.11 y Y = 75.21 las dos mediciones.
El perímetro se estima como P = 2X + 2Y = 250.64 m y la incertidumbre en P es
2 2 ( 2) ( 2)
2 2 = 0.19 m
Mediciones repetidas
Una de las mejores maneras de reducir y/o verificar la incertidumbre es tomar varias mediciones
independientes y determinar el promedio de ellas.
Si se realizan muchas mediciones independientes de la misma cantidad, entonces el promedio de
éstas tiene la misma media de cada medición individual, pero la desviación estándar se reduce en
un factor igual a la raíz cuadrada del tamaño de la muestra. En otras palabras, el promedio de
varias mediciones repetidas tiene la misma exactitud y es más preciso que cualquier única
medición.
Ejemplo
Supongamos que en el ejemplo anterior el presupuesto para este proyecto es suficiente para hacer
14 mediciones más. Cada lado ya se ha medido una vez. Un ingeniero sugiere asignar las nuevas
mediciones a cada lado equitativamente, por lo que éste será medido ocho veces. Un segundo
ingeniero sugiere hacer las 14 mediciones en el lado más largo, ya que ese lado se mide con
incertidumbre más grande. Estime la incertidumbre en el perímetro bajo cada plan. ¿Con cuál plan
se obtiene la incertidumbre más pequeña?
Solución
Con el primer plan, sea ̅ el promedio de las ocho mediciones del lado más corto y sea ̅
el promedio de las ocho mediciones del lado más largo. El perímetro se estimará con ̅ ̅.
La incertidumbre en el perímetro con el primer plan es
41
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
2 2 2 2
2 ̅ 2̅
2
̅
2
̅ √ ( ) ( ) √ ( ) ( )
√ √ √ √
Con el segundo plan, el perímetro se estimará con ̅ , donde X es una sola medición del
lado más corto y ̅ es el promedio de las 15 mediciones del lado más largo.
La incertidumbre del perímetro con el segundo plan es
2 2
2 2 √ (
2 2̅ ̅ √ ( )2 ( ) )2 ( )
√ √
Ejemplo
Un topógrafo está midiendo el perímetro de un terreno rectangular. Mide los lados adyacentes, de
50.11 ± 0.05 m y 75.21 ± 0.08 m. Estas mediciones no son necesariamente independientes.
Determine con una estimación conservadora la incertidumbre del perímetro del terreno.
Solución
Anotamos X1 = 50.11 y X2 = 75.21 las dos mediciones.
El perímetro se estima como P = 2X1 + 2X2 = 250.64 m y la incertidumbre en P es
2 2 ( ) ( )
42
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
𝑑ℎ
𝜎 | | 𝜎𝑋
𝑑𝑋
𝑑
En la práctica, se evalúa la derivada en la medición observada X.
𝑑𝑋
Ejemplo
El radio R de un círculo mide 5.00 ± 0.01 cm. Estime el área del círculo y determine la
incertidumbre.
Solución
2 2 2
El área A está dada por . La estimación aproximada de A es
Ahora y ⁄
La incertidumbre de A será
( )( ) 2
| |
Con frecuencia se necesita estimar una cantidad como una función de varias mediciones.
𝑛
𝜕ℎ 2 2
𝜎 ( ) 𝜎𝑋𝑖
𝜕𝑋𝑖
𝑖
Ejemplo
Un desnivel se calcula con la suma de 2 desniveles de la misma precisión, determinada esta por
σ= ±0.002m. Cómo calculo la incertidumbre o desviación estándar del desnivel?
Solución
La estimación del desnivel es la suma de los desniveles parciales . Para calcular primero se
calculan las derivadas parciales de ℎ ℎ ℎ2
ℎ
ℎ
ℎ
ℎ2
Como
ℎ 2 ℎ 2
√( ) 2
( ) 2 2 2 2 2
ℎ ℎ2
44
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Entonces , esto es
Observaciones:
n n n n
1- Notar que E S n E X i E X i n y V S n V X i V X i n 2
i 1 i 1 i 1 i 1
S n
Por lo tanto Z n n es la v.a. S n estandarizada
n 2
S n n
S n n X
2- Notar que P z P n z P , por lo tanto también se puede
n
2
n 2
n
n
enunciar el Teorema central del límite de la siguiente forma
45
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Entonces , esto es
4- Para interpretar el significado del T.C.L., se generan (por computadora) n valores de una v.a.
exponencial con parámetro 0.5 , y se calcula el promedio de esos n valores. Esto se repite
1000 veces, por lo tanto tenemos 1000 valores de la v.a. X .
Hacemos un histograma de frecuencias de X , esto es, tomamos un intervalo (a, b) donde
“caen” todos los valores de X , y lo subdividimos en intervalos más chicos de igual longitud. La
frecuencia de cada subintervalo es la cantidad de valores de X que caen en dicho subintervalo.
Se grafican estas frecuencias obteniéndose los gráficos siguientes que se pueden considerar una
aproximación a la verdadera distribución de X .
Se observa que a medida que aumenta el valor de n los gráficos se van haciendo más simétricos,
pareciéndose a la gráfica de una distribución normal.
150
n=2
n=5
100
50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
46
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
40
n = 15 n = 30
30
20
10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Ejemplos:
1- Supóngase que 30 instrumentos electrónicos D1, D2, ......,D30, se usan de la manera siguiente:
tan pronto como D1 falla empieza a actuar D2. Cuando D2 falla empieza a actuar D3, etc.
Supóngase que el tiempo de falla de Di es una v.a. distribuida exponencialmente con parámetro
= 0.1 por hora. Sea T el tiempo total de operación de los 30 instrumentos. ¿Cuál es la
probabilidad de que T exceda 350 horas?
Solución:
Si X i : “tiempo de falla del instrumento Di ” i 1,2,...,30
Entonces X i ~ Exp(0.1) para i 1,2,...,30
30
El tiempo total de operación de los 30 instrumentos es T X i , donde
i 1
30
1
E (T ) E X i 30 E ( X i ) 30 300
i 1 0.1
30 1
V (T ) V X i 30 V ( X i ) 30 2 3000
i 1 0.1
T 300
Entonces por T.C.L. ~ N(0,1) aproximadamente pues n 30
3000
La probabilidad pedida es
T 300 350 300 350 300
P(T 350) P 1 1 0.9128 1 0.81859 0.18141
3000 3000 3000
T.C.L.
2- Suponga que el consumo de calorías por día de una determinada persona es una v.a. con media
3000 calorías y desviación estándar de 230 calorías. ¿Cuál es la probabilidad de que el promedio
de consumo de calorías diario de dicha persona en el siguiente año (365 días) sea entre 2959 y
3050?
47
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Solución:
Definimos las variables aleatorias
X i : “cantidad de calorías que una persona consume en el día i” i 1,2,...,365
Se sabe que E ( X i ) 3000 y V ( X i ) 230 2
1 365 2 230 2
Si X i
365 i 1
X entonces E ( X ) 3000 y V ( X )
n
365
La probabilidad pedida es
2959 3000 X 3000 3050 3000
P2959 X 3050 P
230 230 230
365 365 365
T.C.L.
3050 3000 2959 3000
230 4.15 3.40 1 0 1
230
365 365
Observaciones:
48
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
1- La aproximación normal a la distribución binomial funciona bien aun cuando n no sea muy
grande si p no está demasiado cerca de cero o de uno. En particular la aproximación normal a la
binomial es buena si n es grande , np 5 y n(1 p) 5 , pero es más efectivo aplicar esta
aproximación cuando np 10 y n(1 p) 10
0.175 0.2
0.15
n = 25
n = 15
0.125 0.15
p = 0.7
0.1
p = 0.5
0.1
0.075
0.05
0.05
0.025
5 10 15 20 25 2 4 6 8 10 12 14
49
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
0.35
0.08
0.3 n =15 n = 100
0.25 0.06
p = 0.9 p = 0.7
0.2
0.04
0.15
0.1
0.02
0.05
5 10 15 20 50 60 70 80 90 100
0.4
0.1
0.08
n = 150 n = 10
0.3
0.1
0.02
Ejemplos:
1- Sea X B(25,0.4). Hallar las probabilidades exactas de que X 8 y X 8 y comparar estos
resultados con los valores correspondientes encontrados por la aproximación normal.
Solución:
De la tabla de la F.d.a. de la binomial encontramos P( X 8) 0.274
Y P( X 8) P( X 8) P( X 7) 0.274 0.154 0.120
Ahora usamos la aproximación normal
X np 8.5 10
P( X 8) P( X 8.5) P 0.61 0.2709
np(1 p)
25 0.4 0.6
corrección por continuidad
Observar que el valor aproximado está muy cercano al valor exacto para P( X 8) 0.274
7.5 10 X 10 8.5 10 X 10
P( X 8) P7.5 X 8.5 P P 1.02 0.61
6 6 6 6
0.2709 0.1593 0.1170
50
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
Nuevamente este valor aproximado está muy cerca del valor real de P( X 8) 0.120
2- Suponga que el 10% de todos los ejes de acero producidos por cierto proceso están fuera de
especificaciones, pero se pueden volver a trabajar (en lugar de tener que enviarlos a la chatarra).
Considere una muestra aleatoria de 200 ejes y denote por X el número entre ellos que estén fuera
de especificaciones y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproximada) de que X
sea
a) a lo sumo 30?
b) menos de 30?
c) entre 15 y 25 (inclusive)?
Solución:
Sea la v.a. X: “número de ejes fuera de especificaciones”
Entonces X ~ B(200, 0.1) , además np 200 0.1 20 5 y n(1 p) 200 (1 0.1) 180 5
X np 30.5 20 30.5 20
P( X 30) P( X 30.5) P 2.474 0.993244
np(1 p)
18 18
b) La probabilidad pedida es P( X 30)
Al ser X una v.a. discreta con distribución binomial P( X 30) P( X 29)
29.5 20
P( X 29) P( X 29.5) 2.2391 0.98745
18
c)
25.5 20 14.5 20
P15 X 25 P14.5 X 25.5
18 18
1.2963 1.2963 21.2963 1 2 0.90147 1 0.80294
Solución:
Sea X: “número de clientes a los que no les agrada la nueva política de aceptación de cheques”
Entonces X ~ B(n, p) donde p es desconocido y es la verdadera proporción de clientes a los
que no les agrada la nueva política de aceptación de cheques. El gerente tomará una muestra de n
X X
clientes para “estimar” p con X ya que X es la proporción de clientes a los que no les
n n
agrada la nueva política de aceptación de cheques en la muestra de n clientes. Si no se toman a
X
todos los clientes, entonces X no será igual a p.
n
51
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
X
La pregunta es cuál debe ser n para que X se aleje del verdadero p en menos de 0.15 con
n
probabilidad 0.98 por lo menos, o sea para que P X p 0.15 0.98
Entonces planteamos
0.15n
P X p 0.15 P 0.15 X p 0.15 P
np(1 p)
X np
0.15n
np(1 p) np(1 p)
T.C.L.
0.15n
0.15n 2 0.15n 1 0.98
np(1 p) np(1 p) np(1 p)
0.15n 0.98 1
Por lo tanto 0.99
np(1 p) 2
2
2.33
Entonces debe cumplirse que 0.3 n 2.33 o sea n 60.3211
0.3
X
Es decir para suficientemente grande N (0,1)
En la práctica si 30 la aproximación es buena.
52
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
n
Pero además por T.C.L. si n es grande X
i 1
i tiene aproximadamente distribución normal con
parámetros n n 1 n y n 2 n 1 n
n
O sea la distribución de X
i 1
i que es exactamente Poisson con parámetro n, se puede aproximar
X n
con una N (n, n) , por lo tanto N (0,1) aproximadamente para valores de n suficientemente
n
grandes
En los gráficos siguientes se muestra para diferentes valores de cómo aproxima la distribución
N ( , ) a la distribución P( )
0.05 0.2
0.04
0.15
0.03
0.1
0.02
0.05
0.01
20 40 60 80 100 5 10 15 20 25 30
Ejemplo:
El número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil tiene una
distribución de Poisson con parámetro = 50. ¿Cuál es la probabilidad aproximada de que:
a) entre 35 y 70 infracciones se expidan en un día en particular?
b) el número total de infracciones expedidas durante una semana de 5 días sea entre 225 y 275?
Solución:
Sea X: “número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil”
Entonces X ~ P( ) donde 50
X 50
Como 50 entonces N (0,1) (aproximadamente)
50
a) la probabilidad pedida es
70 50 35 50
P35 X 70 2.8284 2.12132
50 50
0.997599 0.017 0.9805
b) Sea Y: “número total de infracciones expedidas durante una semana de 5 días”
Entonces Y ~ P( ) donde 50 5 250
La probabilidad pedida es
275 250 225 250
P225 Y 275 1.5811 1.5811
250 250
21.5811 1 2 0.94295 1 0.8859
53
Ajuste de redes altimétricas Prof. Claudio Justo Prof. María B. Pintarelli
54