Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADSTICA DESCRIPTIVA
Qu es la estadstica?
Cuando se habla de estadstica, se suele pensar en una relacin de datos numricos
presentada de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto
popular que existe sobre el trmino y que cada vez est ms extendido debido a la
influencia de nuestro entorno, ya que hoy da es casi imposible que cualquier medio de
difusin, peridico, radio, televisin, etc, no nos aborde diariamente con cualquier tipo
de informacin estadstica sobre accidentes de trfico, ndices de crecimiento de
poblacin, turismo, tendencias polticas, etc.
Ejemplo
Consideremos la poblacin formada por todos los estudiantes de la ESPOL (finita). La
altura media de todos los estudiantes es el parmetro . El conjunto formado por los
alumnos del Bsico es una muestra de dicha poblacin y la altura media de los
estudiantes que conforman esta muestra es el estadstico o estimador .
descriptiva, cuando los resultados del anlisis no procuran ir ms all del conjunto de
datos,
Variables estadsticas
Cuando hablemos de variable haremos referencia a un smbolo (X, Y, A, B,...) que
puede tomar cualquier modalidad (valor) de un conjunto determinado, que llamaremos
dominio de la variable o rango. En funcin del tipo del dominio de la variable se las
clasifica de la siguiente manera:
Variables cualitativas,
cuando las modalidades posibles son de tipo nominal (que no se puede contar).
Por ejemplo, una variable de color
Variables cuantitativas
son las que tienen por modalidades cantidades numricas con las que podemos
hacer operaciones aritmticas. Dentro de este tipo de variables podemos
distinguir dos grupos:
o Discretas,
cuando no admiten siempre una modalidad intermedia entre dos cualesquiera
de sus modalidades.
Ejemplo: el nmero X, obtenido en el lanzamiento repetido de un dado. Es
obvio que cada valor de la variable es un nmero natural
o Continuas,
cuando admiten una modalidad intermedia entre dos cualesquiera de sus
modalidades.
Ejemplo: la estatura X de un nio al nacer. En este caso los valores de las
variables son nmeros reales, es decir
Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece
como discreta. Este es el caso en que hay limitaciones en lo que concierne a la
precisin del aparato de medida de esa variable, es decir, si medimos la altura en
metros de personas con una regla que ofrece dos decimales de precisin,
podemos obtener
En realidad lo que ocurre es que con cada una de esas mediciones expresamos
que el verdadero valor de la misma se encuentra en un intervalo de radio
. Por tanto cada una de las observaciones de X representa ms bien un
intervalo que un valor concreto.
Tal como hemos citado anteriormente, las modalidades son las diferentes situaciones
posibles que puede presentar la variable. A veces stas son muy numerosas (ejemplo:
cuando una variable es continua) y conviene reducir su nmero, agrupndolas en una
cantidad inferior de clases. Estas clases deben ser construidas, tal como se estudiar ms
adelante, de modo que sean exhaustivas e incompatibles, es decir, cada modalidad debe
pertenecer a una y slo una de las clases.
Frecuencia absoluta
de la clase ci es el nmero ni, de observaciones que presentan una modalidad
perteneciente a esa clase.
Frecuencia relativa
de la clase ci es el cociente fi, entre las frecuencias absolutas de dicha clase y el
nmero total de observaciones, es decir
Obsrvese que fi es el tanto por uno de observaciones que estn en la clase ci.
Multiplicado por representa el porcentaje de la poblacin que comprende
esa clase.
c1 n1 N1 = n1
cj nj
ck nk Nk = n Fk = 1
n 1
Ejemplo
Calcular los datos que faltan en la siguiente tabla:
li-1 -- li ni fi Ni
0 -- 10 60 f1 60
10 -- 20 n2 0,4 N2
20 -- 30 30 f3 170
30 -- 100 n4 0,1 N4
100 -- 200 n5 f5 200
n
Solucin:
Sabemos que la ltima frecuencia acumulada es igual al total de observaciones, luego n
= 200.
Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia
relativa correspondiente:
Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:
ai = li - li-1
Interv. M. clase Frec. Abs. Frec. Rel. Frec. Abs. Acum. Frec. Rel. Acum.
C ni fi Ni Fi
l0 -- l1 C1 n1 N1 = n1 F1 = f1
lk-1 -- lk ck nk Nk=n Fk =1
n 1
Eleccin de intervalos para variables continuas
A la hora de seleccionar los intervalos para las variables continuas, se plantean varios
problemas como son el nmero de intervalos a elegir y sus tamaos respectivos. La
notacin ms comn que usaremos para un intervalo sea
El primer intervalo, l0 -- l1, podemos cerrarlo en el extremo inferior para no excluir la
observacin ms pequea, l0
Este arreglo usaremos en las pginas siguientes. El considerar los intervalos por el lado
izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que
expondremos.
El nmero de intervalos, k, a utilizar no est determinado de forma fija y por tanto
tomaremos un k que nos permita trabajar cmodamente y ver bien la estructura de los
datos; Como referencia nosotros tomaremos una de los siguientes valores aproximados:
.
La amplitud de cada intervalo: ai = li - li-1 suele tomarse constante, considerando la
Observacin
Podra ocurrir que la cantidad a fuese un nmero muy desagradable a la hora de escribir
los intervalos (Ej. a =10,325467). En este caso, es recomendable variar simtricamente
58 42 51 54 40 39 49
56 58 57 59 63 58 66
70 72 71 69 70 68 64
Agrupar los datos en una tabla estadstica.
Solucin:
En primer lugar hay que observar que si denominamos X a la variable peso de cada
persona esta es una variable de tipo cuantitativa y continua. Por tanto a la hora de ser
ordenados los resultados en una tabla estadstica, esto se ha de hacer agrupndolos en
intervalos de longitud conveniente. Esto nos lleva a perder cierto grado de precisin.
Para que la perdida de informacin no sea muy relevante seguimos el criterio de utilizar
Diagramas diferenciales:
Son aquellos en los que se representan frecuencias absolutas o relativas. En
ellos se representa el nmero o porcentaje de elementos que presenta una
modalidad dada.
Diagramas integrales:
Son aquellos en los que se representan el nmero de elementos que presentan
una modalidad inferior o igual a una dada. Se realizan a partir de las
frecuencias acumuladas, lo que da lugar a grficos crecientes, y es obvio que
este tipo de grficos no tiene sentido para variables cualitativas.
Segn hemos visto existen dos tipos de variables cuantitativas: discretas y continuas.
Vemos a continuacin las diferentes representaciones grficas que pueden realizarse
para cada una de ellas as como los nombres especficos que reciben.
Grficos para variables discretas
Cuando representamos una variable discreta, usamos el diagrama de barras cuando
pretendemos hacer una grfica diferencial. Las barras deben ser estrechas para
representar el que los valores que toma la variable son discretos. El diagrama integral o
acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de
diagrama de barras as como su diagrama integral correspondiente estn representados a
continuacin:
Ejemplo
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el nmero de caras, X,
obtenindose los siguientes resultados:
xi ni fi Ni Fi
0 1 1/8 1 1/8
1 3 3/8 4 4/8
2 3 3/8 7 7/8
3 1 1/8 8 8/8
n =8 1
Ejemplo
Clasificadas 12 familias por su nmero de hijos se obtuvo:
Nmero de hijos (xi) 1 2 3 4
Frecuencias (ni) 1 3 5 3
Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el
diagrama acumulativo creciente.
Intervalos ci ni Ni
0 -- 2 1 2 2
2 -- 4 3 1 3
4 -- 6 5 4 7
6 -- 8 7 3 10
8 - 10 9 2 12
12
Ejemplo
La siguiente distribucin se refiere a la duracin en horas (completas) de un lote de 500
tubos:
Duracin en horas Nmero de tubos
300 -- 500 50
500 -- 700 150
700 -- 1.100 275
ms de 1.100 25
Total 500
Determinar el nmero mnimo de tubos que tienen una duracin inferior a 900
horas.
El ltimo intervalo est abierto por el lmite superior. Dado que en l hay 25
observaciones puede ser conveniente cerrarlo con una amplitud razonable. Todos los
intervalos excepto el tercero tienen una amplitud de 200 horas, luego podramos cerrar
el ltimo intervalo en 1.300 horas.
Intervalos ai ni fi fi' Fi
300 -- 500 200 50 0,10 0,10 0,10
500 -- 700 200 150 0,30 0,30 0,40
700 -- 1.100 400 275 0,55 0,275 0,95
1.100 -- 1.300 200 25 0,05 0,05 1,00
n =500
Histograma. Obsrvese que la altura del histograma
en cada intervalo es fi' que coincide en todos con fi
salvo en el intervalo 700 -- 1.100 en el que
se ve que sumando frecuencias relativas, hasta las 900 horas de duracin hay
Como en total son 500 tubos, el nmero de tubos con una duracin igual o menor que
900 horas es , redondeando, 338 tubos.
Frecuencia relativa: .
Recorrido:
Amplitud: ai = li - li-1
Marca de clase:
Frecuencias rectificadas: ;
Los cuartiles, Ql, son un caso particular de los percentiles. Hay 3, y se definen como:
De forma anloga se definen los deciles como los valores de la variable que dividen a
las observaciones en 10 grupos de igual tamao. Ms precisamente, definimos D1,D2, ...,
D9 como:
Ejemplo
Dada la siguiente distribucin en el nmero de hijos de cien familias, calcular sus
cuartiles.
xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
n =100
Solucin: Aplicando las frmulas antes enunciadas para los cuartiles tenemos lo
siguiente:
1. Primer cuartil:
2. Segundo cuartil:
3. Tercer cuartil:
Ejemplo
Calcular los cuartiles en la siguiente distribucin de una variable continua:
li-1 - li ni Ni
0-1 10 10
1-2 12 22
2-3 12 34
3-4 10 44
4-5 7 51
n =51
Solucin:
1. Primer cuartil
2. Segundo cuartil:
3. Tercer cuartil
Ejemplo
Han sido ordenados los pesos de 21 personas en la siguiente tabla:
Intervalos f.a.
li-1 -- li ni
38 -- 45 3
45 -- 52 2
52 -- 59 7
59 -- 66 3
66 -- 73 6
21
Encontrar aquellos valores que dividen a los datos en 4 partes con el mismo nmero de
observaciones.
Solucin: Las cantidades que buscamos son los tres cuartiles: , y . Para
calcularlos, le aadimos a la tabla las columnas con las frecuencias acumuladas, para
localizar qu intervalos son los que contienen a los cuartiles buscados:
li-1 -- li ni Ni
38 -- 45 3 3
45 -- 52 2 5
52 -- 59 7 12
59 -- 66 3 15
66 -- 73 6 21
21
y se encuentran en el intervalo 52--59, ya que N3=12 es la
dos partes con el mismo nmero de observaciones, y , hace lo mismo, pues es deja a
dos cuartos de los datos por arriba y otros dos cuartos por abajo.
Ejemplo
La distribucin de una variable tiene su polgono acumulativo de frecuencias como se
presenta en la siguiente figura:
1. Elaborar una tabla estadstica con los siguientes elementos: intervalos, marcas de
clase, frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y
frecuencias relativa acumulada.
2. Cuntas observaciones tuvieron un valor inferior a 10, cuntas inferior a 8 y cuntas
fueron superior a 11.
3. Calcule las modas.
4. Determine los cuartiles.
Solucin:
4. Cuartiles:
Percentil Pl, Para una variable discreta, se define el percentil de orden k, como la
observacin, Pk, que deja - por debajo de s - el k % de la poblacin. Esta definicin nos
recuerda a la mediana, pues como consecuencia de la definicin es evidente que Med =
P50 . En el caso de una variable continua, el intervalo donde se encuentra ,
se calcula buscando el que deja - por debajo de s - al k % de las observaciones.
Cuartiles, Ql, son un caso particular de los percentiles. Hay 3, y se definen como: Q1 =
P25, Q2 = P50 = Med, Q3 = P75
Deciles, Dl, de forma anloga se definen como los valores de la variable que dividen a
las observaciones en 10 grupos de igual tamao.
Unidad 2
Obsrvese que los sucesos elementales son sucesos aleatorios compuestos por un
slo elemento. Por supuesto los sucesos aleatorios son ms generales que los
elementales, ya que son conjuntos que pueden contener no a uno slo, sino a una
infinidad de sucesos elementales - y tambin no contener alguno - Sucesos aleatorios
que aparecen con gran frecuencia en el clculo de probabilidades son los siguientes:
Suceso seguro: Es aquel que siempre se verifica despus del experimento aleatorio, es
decir, el mismo E
Suceso imposible: Es aquel que nunca se verifica como resultado del experimento
aleatorio. Como debe ser un subconjunto de E, la nica posibilidad es que el suceso
imposible sea el conjunto vaco
Suceso contrario a un suceso A: Tambin se denomina complementario de A y es el
suceso que se verifica si, como resultado del experimento aleatorio, no se verifica A. Se
acostumbra a denotar con el smbolo Ac.
aleatorio , y de su suceso
contrario
Ejemplo
Si realizamos el experimento aleatorio de lanzar un dado al aire, tenemos:
Unin:
Interseccin:
Diferencia:
Dados dos sucesos aleatorios , se llama suceso diferencia de A y B, y se
representa mediante , o bien A-B, al suceso aleatorio formado por todos los
sucesos elementales que pertenecen a A, pero no a B:
Diferencia simtrica:
mediante , al suceso aleatorio formado por todos los sucesos elementales que
pertenecen a A y no a B, y los que estn en B y no en A:
As:
B; en (d) .
Hay ciertas propiedades que relacionan la unin, interseccin y suceso contrario, que
son conocidas bajo el nombre de Leyes de Morgan:
Definicin
1) P() = 1
2) P(E) , E
3) P(E1 U E2) = P(E1) + P(E2), si E1,E2 , y E1 y E2 son mutuamente excluyentes
Proposicin
P() = 0
Demostracin
Proposicin
E , P(E) = 1 - P(Ec)
Demostracin
Proposicin
Demostracin
1) P() = 1
2) P(E) , E
3) P(E1 U E2) = P(E1) + P(E2), si E1,E2 , y E1 y E2 son mutuamente excluyentes.
Ejemplo
Se lanza un dado al aire Cul es la probabilidad de que salga el nmero 4? Si sabemos
que el resultado ha sido un nmero par, se ha modificado esta probabilidad?
Por otro lado, si ha salido un nmero par, de nuevo por la definicin de probabilidad de
Laplace tendramos
y entonces
que por supuesto coincide con el mismo valor que calculamos usando la definicin de
probabilidad de Laplace.
Observacin:
Obsrvese que segn la definicin de probabilidad condicionada, se puede escribir la
probabilidad de la interseccin de dos sucesos de probabilidad no nula como
Si entre dos sucesos no existe ninguna relacin cabe esperar que la expresin sabiendo
que no aporte ninguna informacin. De este modo introducimos el concepto de
independencia de dos sucesos A y B como:
Esta relacin puede ser escrita de modo equivalente, cuando dos sucesos son de
probabilidad no nula como
Probabilidad de Laplace
Ejemplo
Calcular la probabilidad de que al lanzar un dado se obtenga un nmero impar.
Solucin: El espacio muestral es . Vamos a llamar A, al suceso
informacin y se define
Probabilidad de Laplace: Si un experimento cualquiera puede dar lugar a un nmero
finito de resultados posibles, y no existe ninguna razn que privilegie unos resultados en
contra de otros, se calcula la probabilidad de un suceso aleatorio A, segn la regla de
Laplace como el cociente entre el nmero de casos favorables a A, y el de todos los
posibles resultados del experimento.
Hay algunos resultados importantes del clculo de probabilidades que son conocidos
bajo los nombres de teorema de la probabilidad compuesta, teorema de la
probabilidad total y finalmente el teorema de Bayes. Veamos cuales son estos teoremas,
pero previamente vamos a enunciar a modo de recopilacin, una serie de resultados
elementales cuya demostracin se deja como ejercicio para el lector (algunos ya han
sido demostrados anteriormente):
Proposicin
Ejemplo
En una universidad el 50% de los alumnos habla ingls, el 20% francs y el 5% los dos
idiomas Cul es la probabilidad de encontrar alumnos que hablen alguna lengua
extranjera?
Solucin:
Ejemplo
En una estacin de esqu, para navidad, la experiencia indica que hay un tiempo soleado
slo el de los das. Por otro lado, se ha calculado que cuando un da es soleado, hay
una probabilidad del 20% de que el da posterior tambin lo sea. Calcular la
probabilidad de que, en navidad, un fin de semana completo sea soleado.
Demostracin
Los teoremas que restan nos dicen como calcular las probabilidades de sucesos cuando
tenemos que el suceso seguro est descompuesto en una serie de sucesos incompatibles
de los que conocemos su probabilidad. Para ello necesitamos introducir un nuevo
2.-
Demostracin
cantidades , o lo que
es lo mismo,
Ejemplo
Se tienen dos urnas, y cada una de ellas contiene un nmero diferente de bolas blancas y
rojas:
Primera urna, U1: 3 bolas blancas y 2 rojas;
Segunda urna, U2: 4 bolas blancas y 2 rojas.
Se realiza el siguiente experimento aleatorio:
Se tira una moneda al aire y si sale cara se elige una bola de la primera urna, y si
sale sello de la segunda.
Cul es la probabilidad de que salga una bola blanca?
U1 U2
Como U1 y U2 forman un sistema incompatible y excluyente de sucesos (la bola
resultado debe provenir de una de esas dos urnas y de una slo de ellas), el teorema de
la probabilidad total nos permite afirmar entonces que
Teorema (Bayes)
Demostracin
Ejemplo
Se tienen tres urnas. Cada una de ellas contiene un nmero diferente de bolas blancas y
rojas:
Primera urna, U1: 3 bolas blancas y 2 rojas;
Segunda urna, U2: 4 bolas blancas y 2 rojas;
Tercera urna, U3: 3 bolas rojas.
Se realiza el siguiente experimento aleatorio:
Alguien elige al azar y con la misma probabilidad una de las tres urnas, y saca
una bola.
Si el resultado del experimento es que ha salido una bola blanca,
cul es la probabilidad de que provenga de la primera urna? Calcular lo mismo para las
otras dos urnas.
U1 U2 U3
1 1
y , respectivamente.
Teorema (Probabilidad total): Sea un sistema exhaustivo y
excluyente de sucesos. Entonces:
Sea un espacio muestral, una variable aleatoria X es una funcin que a cada
elemento de , le asigna un nmero real.
X: R
X() R,
mediante la v.a. X.
Observacin
Obsrvese que X est definido sobre el espacio muestral de sucesos E, mientras que f lo
est sobre el espacio de nmeros reales .
2. es continua a la derecha:
3. Adems,
Variables aleatorias continuas
Si una variable discreta toma los valores x1, ..., xk, las probabilidad de que al hacer un
experimento, X tome uno de esos valores es 1, de modo que cada posible valor xi
contribuye con una cantidad f(xi) al total:
Aun cuando la variable tomase un nmero infinito de valores, x1, x2, ..., no hay ningn
problema en comprobar que cada xi contribuye con una cantidad f(xi) al total de modo
que
Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades
de cada uno de los trminos en el sentido anterior, ya que el conjunto de valores que
puede tomar la variable es no numerable. En este caso, lo que generaliza de modo
natural el concepto de suma () es el de integral ( ). Por otro lado, para variables
continua, que se define como una funcin integrable, que verifica las dos
propiedades siguientes:
Observacin
Por ser f una funcin integrable, la probabilidad de un punto es nula:
y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea
abierto o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de
probabilidad nula:
Observacin
Dado un intervalo de la forma (a, b], tenemos que
tenemos la masa media de probabilidad por unidad de longitud en (a, b], es decir, su
densidad media de probabilidad. Si hacemos tender a hacia b, , la cantidad
es la densidad de probabilidad del punto b (que como hemos mencionado no se ha de
confundir con la probabilidad de b).
Proposicin
Distribuciones continuas La funcin de distribucin F, es no decreciente
Demostracin
Los sucesos
Sabemos que si X es una v.a. con ella se asocia una funcin de Distribucin si X es
discreta de Densidad de Probabilidad si X es continua.
Consideremos el caso en que ambas v.a. son discretas, se lanzan dos dados
sucesivamente, entonces
y\x 2 3 4 5 6 7 8 9 10 11 12 P(Y=y)
-5 0 0 0 0 0 1/36 0 0 0 0 0 1/36
-4 0 0 0 0 1/36 0 1/36 0 0 0 0 2/36
-3 0 0 0 1/36 0 1/36 0 1/36 0 0 0 3/36
-2 0 0 1/36 0 1/36 0 1/36 0 1/36 0 0 4/36
-1 0 1/36 0 1/36 0 1/36 0 1/36 0 1/36 0 5/36
0 1/36 0 1/36 0 1/36 0 1/36 0 1/36 0 1/36 6/36
1 0 1/36 0 1/36 0 1/36 0 1/36 0 1/36 0 5/36
2 0 0 1/36 0 1/36 0 1/36 0 1/36 0 0 4/36
3 0 0 0 1/36 0 1/36 0 1/36 0 0 0 3/36
4 0 0 0 0 1/36 0 1/36 0 0 0 0 2/36
5 0 0 0 0 0 1/36 0 0 0 0 0 1/36
P(X=x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 1
Derfinicin: X y Y son dos v.a. discretas consideradas de manera conjunta. Con ellos se
asocia una funcin f: R2 R, llamada su distribucin de probabilidades tal que
f(x, y) = P(X = x, Y = y)
Sea
cual es el valor de k que hace que esta funcin sea una funcin de distribucin de
probabilidades?
y\x 1 2 P(Y = y)
1 2/32 3/32 5/32
2 3/32 4/32 7/32
3 4/32 5/32 9/32
4 5/32 6/32 11/32
P(X = x) 14/32 18/32 1
Marginal de x
de forma anloga se realiza para obtener la marginal de y
Para las v.a. continuas se realiza el mismo proceso que las discretas con la diferencia
que ya no se utilizar el smbolo sino el de integracin debido a la diferencia de
valores que pueden tomar.
funcin de densidad de una v.a. continua, que se define como una funcin
el momento central de tercer orden es denominado sesgo y denota si los datos estn
agrupados de igual manera de un lado y de otro (insesgado) de la esperanza E[X] o
estn agrupados de un lado ms que de otro (sesgado).
Si los datos estn agrupados en una tabla, mp admite otra expresin equivalente:
Ejemplo
Es sencillo comprobar que los momentos de orden p impar, son siempre nulos en el caso
de variables simtricas, ya que para cada i que est a un lado de la media, con
Apoyndonos en este ndice, diremos que hay asimetra positiva si a3>0, y que la
asimetra es negativa si a3<0.
Los estadsticos de tendencia central o posicin nos indican donde se sita un grupo de
puntuaciones.
Las tres medidas ms usuales de tendencia central son: la media, la mediana y la moda.
En ciertas ocasiones estos tres estadsticos suelen coincidir, aunque generalmente no es
as. Cada uno de ellos presenta ventajas e inconvenientes.
La media
La media aritmtica de una variable estadstica es la suma de todos sus posibles
valores, ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de
una variable X es
X ni fi
x1 n1 f1
... ... ...
xk nk fk
la media es el valor que podemos escribir de las siguientes formas equivalentes:
Observacin
Proposicin
La suma de las diferencias de la variable con respecto a la media es nula, es decir,
Demostracin
Basta desarrollar la sumatoria para obtener
Este resultado nos indica que el error cometido al aproximar un valor cualquiera de la
variable, por ejemplo x1, mediante el valor central , es compensado por los dems
errores:
Si los errores se consideran con signo positivo, en este caso no pueden compensarse.
Esto ocurre si tomamos como medida de error alguna de las siguientes:
Ejemplo
0 - 10 1 5 5 -19 -19
10 - 20 2 15 30 -9 -18
20 - 30 4 25 100 +1 +4
30 - 40 3 35 105 +11 +33
n =10
La media aritmtica es:
Proposicin (Knig)
Para cualquier posible valor k que consideremos como candidato a medida central, lo
mejora en el sentido de los mnimos cuadrados, es decir
Demostracin
Sea . Veamos que el error cuadrtico cometido por k-es mayor que el de .
Demostracin
Observacin
A pesar de las buenas propiedades que ofrece la media, sta posee algunos
inconvenientes:
Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que todas
las observaciones intervienen en el clculo de la media, la aparicin de una observacin
extrema, har que la media se desplace en esa direccin. En consecuencia, no es
recomendable usar la media como medida central en las distribuciones muy asimtricas;
Depende de la divisin en intervalos en el caso de variables continuas.
Si consideramos una variable discreta, por ejemplo, el nmero de hijos en las familias
de Guayaquil el valor de la media puede no pertenecer al conjunto de valores de la
variable;
Clculo abreviado
Se puede utilizar la linealidad de la media para simplificar las operaciones necesarias
para su clculo mediante un cambio de origen y de unidad de medida. El mtodo
consiste en lo siguiente:
Medias generalizadas
En funcin del tipo de problema varias generalizaciones de la media pueden ser
consideradas. He aqu algunas de ellas aplicadas a unas observaciones x1, ..., xn:
La media geomtrica
, es la media de los logaritmos de los valores de la variable:
Luego
La media armnica
, se define como el recproco de la media aritmtica de los recprocos, es decir,
Por tanto,
La media cuadrtica
, es la raz cuadrada de la media aritmtica de los cuadrados:
La mediana
Consideramos una variable discreta X cuyas observaciones en una tabla estadstica han
sido ordenadas de menor a mayor. Llamaremos mediana, Med al primer valor de la
intervalo donde hemos encontrado que por debajo estn el de las observaciones.
Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas,
mediante interpolacin lineal (teorema de Thales) como se ve en la figura anterior
Observacin
Observacin
Entre las propiedades de la mediana, vamos a destacar las siguientes:
Defectos de la Mediana
El mayor defecto de la mediana es que tiene unas propiedades matemticas
complicadas, lo que hace que sea muy difcil de utilizar en inferencia
estadstica.
Es funcin de los intervalos escogidos.
Puede ser calculada aunque el intervalo inferior o el superior no tenga lmites.
La suma de las diferencias de los valores absolutos de n puntuaciones respecto a
su mediana es menor o igual que cualquier otro valor. Este es el equivalente al
teorema de Knig con respecto a la media, pero donde se considera como
medida de dispersin a:
Ejemplo
Sea X una variable discreta que ha presentado sobre una muestra las modalidades
Ejemplo
Obtener la media aritmtica y la mediana en la distribucin adjunta. Determinar
grficamente cul de los dos promedios es ms significativo.
li-1 - li ni
0 - 10 60
10 - 20 80
20 - 30 30
30 - 100 20
100 - 500 10
Solucin:
li-1 - li ni ai xi xi ni Ni
0 - 10 60 10 5 300 60 60
10 - 20 80 10 15 1.200 140 80
20 - 30 30 10 25 750 170 30
30 - 100 20 70 65 1.300 190 2,9
100 - 500 10 400 300 3.000 200 0,25
n =200
La media aritmtica es:
La primera frecuencia absoluta acumulada que supera el valor n/2=100 es Ni =140. Por
ello el intervalo mediano es [10;20). As:
La moda
Observacin
De la moda destacamos las siguientes propiedades:
Es muy fcil de calcular.
Puede no ser nica.
Es funcin de los intervalos elegidos a travs de su amplitud, nmero y lmites
de los mismos.
Aunque el primero o el ltimo de los intervalos no posean extremos inferior o
superior respectivamente, la moda puede ser calculada.
Ejemplo
Consideramos una tabla estadstica relativa a una variable continua, de la que nos dan
los intervalos, las marcas de clase ci, y las frecuencias absolutas, ni.
Intervalos ci ni
0 -- 2 1 2
2 -- 4 3 1
4 -- 6 5 4
6 -- 8 7 3
8 - 10 9 2
Para calcular la media podemos aadir una columna con las cantidades . La suma
de los trminos de esa columna dividida por n =12 es la media:
Intervalos ci ni Ni
02 1 2 2 2
24 3 1 3 3
46 5 4 7 20
68 7 3 10 21
8 10 9 2 12 18
12 64
Para el clculo de la moda, lo primero es encontrar los intervalos modales, buscando los
mximos relativos en la columna de las frecuencias absolutas, ni. Vemos que hay dos
modas, correspondientes a las modalidades i =1, i =3. En el primer intervalo modal,
(l0,1]=(0,2], la moda se calcula como
El segundo intervalo modal es (l2,l3]=(4;6], siendo la moda el punto perteneciente al
mismo que se obtiene como:
En este caso, como se ve en la figura siguiente, la moda no toma un valor nico, sino el
conjunto
Luego
Una medida razonable de la variabilidad podra ser la amplitud o rango, que se obtiene
restando el valor ms bajo de un conjunto de observaciones del valor ms alto. Es fcil
de calcular y sus unidades son las mismas que las de la variable, aunque posee varios
inconvenientes:
Desviacin media, Dm
Se define la desviacin media como la media de las diferencias en valor absoluto de los
valores de la variable a la media, es decir, si tenemos un conjunto de n observaciones,
x1, ..., xn, entonces
Si los datos estn agrupados en una tabla estadstica es ms sencillo usar la relacin
Como se observa, la desviacin media guarda las mismas dimensiones que las
observaciones. La suma de valores absolutos es relativamente sencilla de calcular, pero
esta simplicidad tiene un inconveniente: Desde el punto de vista geomtrico, la distancia
que induce la desviacin media en el espacio de observaciones no es la natural (no
permite definir ngulos entre dos conjuntos de observaciones). Esto hace que sea muy
engorroso trabajar con ella a la hora de hacer inferencia a la poblacin.
, pues sabemos que esa suma vale 0, ya que las desviaciones con
respecto a la media se compensan al haber trminos en esa suma que son de
signos distintos.
Para tener el mismo signo al sumar las desviaciones con respecto a la media
podemos realizar la suma con valores absolutos. Esto nos lleva a la Dm, pero
como hemos mencionado, tiene poco inters por las dificultades que presenta.
.Para datos agrupados en tablas, usando las notaciones establecidas en los captulos
Ejemplo
Solucin:
La varianza es:
Si entonces
Demostracin
Para cada observacin xi de X, , tenemos una observacin de Y que es por
Las consecuencias del anterior resultado eran de esperar: Si los resultados de una
medida son trasladados una cantidad b, la dispersin de los mismos no aumenta. Si
estos mismos datos se multiplican por una cantidad a <1, el resultado tender a
concentrarse alrededor de su media (menor varianza). Si por el contrario a>1 habr
mayor dispersin.
Otra propiedad fundamental de la varianza es la siguiente:
Proposicin
Dados r grupos, cada uno de ellos formado por ni observaciones de media y de
varianza . Entonces la varianza, , del conjunto de todas las
observaciones vale
Demostracin
Dicho de otro modo, pretendemos demostrar que la varianza total es igual a la media
de las varianzas ms la varianza de las medias. Comenzamos denotando mediante xij la
observacin j-sima en el i-simo grupo, donde y . Entonces
Observacin
Adems de las propiedades que hemos demostrado sobre la varianza (y por tanto sobre
la desviacin tpica), ser conveniente tener siempre en mente otras que enunciamos a
continuacin:
Ambas son sensibles a la variacin de cada una de las puntuaciones, es decir, si
una puntuacin cambia, cambia con ella la varianza. La razn es que si miramos
su definicin, la varianza es funcin de cada una de las puntuaciones.
Grados de libertad
Los grados de libertad de un estadstico calculado sobre n datos se refieren al nmero
de cantidades independientes que se necesitan en su clculo, menos el nmero de
restricciones que ligan a las observaciones y el estadstico. Es decir, normalmente n-1.
Ejemplo:
Sin embargo esas cantidades no son totalmente independientes, pues estn ligadas por
una restriccin:
Coeficiente de variacin
Hemos visto que las medidas de centralizacin y dispersin nos dan informacin sobre
una muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para
comparar dos poblaciones. Por ejemplo, si nos piden comparar la dispersin de los
pesos de las poblaciones de elefantes de dos circos diferentes, nos dar informacin
til.
El problema no deriva slo de que una de las medidas sea de longitud y la otra sea de
masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa,
de dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el
peso en toneladas de una poblacin de 100 elefantes con el correspondiente en
miligramos de una poblacin de 50 hormigas.
El problema no se resuelve tomando las mismas escalas para ambas poblaciones. Por
ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los
elefantes (toneladas). Si la ingeniera gentica no nos sorprende con alguna barbaridad,
lo lgico es que la dispersin de la variable peso de las hormigas sea prcticamente nula
(Aunque haya algunas que sean 1.000 veces mayores que otras!)
Basta dar una rpida mirada a la definicin del coeficiente de variacin, para ver que las
siguientes consideraciones deben ser tenidas en cuenta:
Slo se debe calcular para variables con todos los valores positivos. Todo ndice
de variabilidad es esencialmente no negativo. Las observaciones pueden ser
positivas o nulas, pero su variabilidad debe ser siempre positiva. De ah que slo
debemos trabajar con variables positivas, para la que tenemos con seguridad que
.
Observacin
Es importante destacar que los coeficientes de variacin sirven para comparar las
variabilidades de dos conjuntos de valores (muestras o poblaciones), mientras que si
deseamos comparar a dos individuos de cada uno de esos conjuntos, es necesario usar
los valores estandarizados.
Ejemplo
Dada la distribucin de edades (medidas en aos) en un colectivo de 100 personas,
obtener:
1. La variable estandarizada Z.
2. Valores de la media y varianza de Z.
3. Coeficiente de variacin de Z.
Horas trabajadas Num. empleados
0 -- 4 47
4 -- 10 32
10 -- 20 17
20 -- 40 4
100
Solucin:
queda:
li-1 -- li xi ni xi ni xi2 ni
0 -- 4 2 47 94 188
4 -- 10 7 32 224 1.568
10 -- 20 15 17 255 3.825
20 -- 40 30 4 120 3.600
n =100 693 9.181
A partir de estos valores podremos calcular los valores estandarizados para las marcas
de clase de cada intervalo y construir su distribucin de frecuencias:
zi ni zi ni zi2 ni
-0,745 47 -35,015 26,086
0,011 32 0,352 0,004
1,220 17 20,720 25,303
3,486 4 13,944 48,609
n =100 0,021 100,002
A pesar de que no se debe calcular el coeficiente de variacin sobre variables que
presenten valores negativos (y Z los presenta), lo calculamos con objeto de ilustrar el
porqu:
Desviacin media Dm: como la media de las diferencias en valor absoluto de los valores
Como se ve, la frmula es muy parecida a las de las varianzas. Es sencillo comprobar
que se verifica la siguiente expresin de , ms til en la prctica:
Proposicin
Si las observaciones no estn ordenadas en una tabla de doble entrada, entonces se tiene
que
o lo que es lo mismo
Ejemplo
Se han clasificado 100 familias segn el nmero de hijos varones ( ) o hembras ( ),
en la tabla siguiente:
0 1 2 3 4
0 4 6 9 4 1
1 5 10 7 4 2
2 7 8 5 3 1
3 5 5 3 2 1
4 2 3 2 1 0
1.
Hallar las medias, varianzas y desviaciones tpicas marginales.
2.
Qu nmero medio de hijas hay en aquellas familias que tienen 2 hijos?
3.
Qu nmero medio de hijos varones hay en aquellas familias que no tienen
hijas?
4.
Qu nmero medio de hijos varones tienen aquellas familias que a lo sumo
tienen 2 hijas?
5.
Hallar la covarianza
Solucin: En primer lugar, definimos las variables X = nmero de hijos varones, e Y =
nmero de hijas y construimos la tabla con las frecuencias marginales, y con otras
cantidades que nos son tiles en el clculo de medias y varianzas:
y1 y2 y3 y4 y5
0 1 2 3 4
4 6 9 4 1 24 0 0 0
5 10 7 4 2 28 28 28 44
7 8 5 3 1 24 48 96 62
5 5 3 2 1 16 48 144 63
2 3 2 1 0 8 32 128 40
0 32 52 42 20 146
El nmero medio de hijas en las familias con 2 hijos varones se obtiene calculando la
distribucin condicionada de
n3j n3j yj
7 0
8 8
5 10
3 9
1 4
24 31
Del mismo modo, el nmero medio de hijos varones de las familias sin hijas, se calcula
ni1 ni1 xi
4 0
5 5
7 14
5 15
2 8
23 42
El nmero medio de hijos varones en las familias que a lo sumo tienen dos hijas, se
calcula usando las marginales de la tabla obtenida a partir de las columnas y1, y2 e y3
4 6 9 19 19
5 10 7 22 22
7 8 5 20 40
5 5 3 13 39
2 3 2 7 28
81 129
La covarianza es:
Proposicin:
Demostracin:
Ntese que
entonces
Este importante resultado, por si slo, justifica el que sea una medida de
centralizacin y (o bien ) de dispersin de X y motiva la introduccin del concepto
de estandarizacin de variables aleatorias. Dada una v.a. X, definimos su v.a.
estandarizada, Z, como:
Consiste en realizar un experimento aleatorio una sola vez y observar si cierto suceso
ocurre o no, siendo p la probabilidad de que esto sea as (xito) y q = 1-p el que no lo
sea (fracaso). Es decir que nicamente puede tomar dos modalidades, es por ello que el
hecho de llamar xito o fracaso a los posibles resultados de las pruebas obedece ms
una tradicin literaria o histrica, en el estudio de las v.a., que a la situacin real que
pueda derivarse del resultado. Podramos por tanto definir este experimento mediante
una v.a. discreta X que toma los valores X =0 si el suceso no ocurre, y X =1 en caso
Un ejemplo tpico de este tipo de variables aleatorias consiste en lanzar una moneda al
aire y considerar la v.a.
Distribucin binomial
. Por ejemplo
Observacin
Es sencillo comprobar que realmente f es una ley de probabilidad, es decir,
.
Observacin
La distribucin binomial negativa tambin se puede definir como el nmero de pruebas
hasta la aparicin de r xitos. Como el nmero de pruebas contabiliza tanto los xitos
como los fracasos se tendra segn sta definicin que
Distribucin hipergeomtrica
Por claridad, consideremos el siguiente ejemplo: Tenemos una baraja de cartas
espaolas (N = 40 naipes), de las cuales nos vamos a interesar en el palo de oros (D =10
naipes de un mismo tipo). Supongamos que de esa baraja extraemos n = 8 cartas de una
vez (sin reemplazamiento) y se nos plantea el problema de calcular la probabilidad de
que hayan k = 2 oros (exactamente) en esa extraccin. La respuesta a este problema es
En lugar de usar como dato D es posible que tengamos la proporcin existente, p, entre
el nmero total de oros y el nmero de cartas de la baraja
Este ejemplo sirve para representar el tipo de fenmenos que siguen una ley de
distribucin hipergeomtrica. Diremos en general que una v.a. X sigue una distribucin
hipergeomtrica de parmetros, N, n y p, lo que representamos del modo
, si su funcin de probabilidad es
Observacin
Cuando el tamao de la poblacin (N) es muy grande, la ley hipergeomtrica tiende a
aproximarse a la binomial:
Una v.a. X posee una ley de distribucin de probabilidades del tipo Poisson cuando
Este tipo de leyes se aplican a sucesos con probabilidad muy baja de ocurrir,
obtenindose como la distribucin lmite de una sucesin de variable binomiales,
Geomtrica ( o de fracasos): Si X1, X2, ..., Xi, ... son una sucesin de v.a.
independientes de Bernoulli (p), entonces, una v.a. X posee una distribucin
geomtrica, , si esta es la suma del nmero de fracasos obtenidos hasta la
aparicin del primer xito en la sucesin . la ley de probabilidad de X es
Binomial negativa: Si X1, X2, ..., Xi, ... son una sucesin de v.a. independientes de
Bernoulli (p), entonces, se define la v.a. X como el nmero de fracasos obtenidos hasta
la aparicin de r xitos en la sucesin . En este caso se dice que X sigue una ley
de distribucin binomial negativa de parmetros r y p. Su ley de probabilidad es
Poisson (o de los sucesos raros): Este tipo de leyes se aplican a sucesos con
probabilidad muy baja de ocurrir, obtenindose como la distribucin lmite de una
sucesin de variable binomiales, es decir, una v.a. X posee una ley de distribucin de
Para realizar las deducciones de las frmulas para obtener los parmetros de las v.a.,
Distribucin de Bernoulli
Distribucin binomial
Su funcin caracterstica es
Distribucin de Poisson
La funcin caracterstica de es
Distribucin binomial
Ejemplo
Un mdico aplica un test a 10 alumnos de un colegio para detectar una enfermedad cuya
incidencia sobre una poblacin de nios es del . La sensibilidad del test es del
Solucin:
Sea X1 la v.a. que contabiliza el nmero de resultados positivos. Es claro que llamando
Si queremos calcular a cuantas personas les dar el test un resultado positivo aunque en
Es importante observar este resultado. Antes de hacer los clculos no era previsible que
si a una persona el test le da positivo, en realidad tiene una probabilidad
Ejemplo
Para tratar a un paciente de una afeccin de pulmn han de ser operados en operaciones
independientes sus 5 lbulos pulmonares. La tcnica a utilizar es tal que si todo va bien,
lo que ocurre con probabilidad de 7/11, el lbulo queda definitivamente sano, pero si no
es as se deber esperar el tiempo suficiente para intentarlo posteriormente de nuevo. Se
practicar la ciruga hasta que 4 de sus 5 lbulos funcionen correctamente. Cul es el
valor esperado de intervenciones que se espera que deba padecer el paciente? Cul es
la probabilidad de que se necesiten 10 intervenciones?
Solucin:
Este es un ejemplo claro de experimento aleatorio regido por una ley binomial negativa,
ya que se realizan intervenciones hasta que se obtengan 4 lbulos sanos, y ste es el
criterio que se utiliza para detener el proceso. Identificando los parmetros se tiene:
Luego
Luego el nmero esperado de intervenciones que deber sufrir el paciente es de 11. La
probabilidad de que el nmero de intervenciones sea Y =10, es la de que X =10 4 = 6.
Por tanto:
Un matrimonio quiere tener una hija, y por ello deciden tener hijos hasta el nacimiento
de una hija. Calcular el nmero esperado de hijos (entre varones y hembras) que tendr
el matrimonio. Calcular la probabilidad de que la pareja acabe teniendo tres hijos o ms.
Solucin:
Es claro que
Observacin
Ejemplo
Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p = 1/100.000. Calcular
la probabilidad de que en una ciudad con 500.000 habitantes haya ms de 3 personas
con dicha enfermedad. Calcular el nmero esperado de habitantes que la padecen.
Solucin:
Se dice que una v.a. X posee una distribucin uniforme en el intervalo [a, b],
distribucin de
Distribucin normal
La distribucin normal, recibe este nombre ya que una gran mayora de las v.a
continuas de la naturaleza siguen esta distribucin. Se dice que una v.a. X sigue una
distribucin normal de parmetros y , lo que representamos del modo
Observacin
Estos dos parmetros y coinciden adems con la media (esperanza) y la varianza
respectivamente de la distribucin como se demostrar ms adelante:
La forma de la funcin de densidad es la llamada campana de Gauss, de ah que en
algunas ocasiones se la denomine Gaussiana.
Para el lector es un ejercicio interesante comprobar que sta alcanza un nico mximo
(moda) en , que es simtrica con respecto al mismo, y por tanto
Estandarizacin
Se conoce por Estandarizacin al proceso de restar la media y dividir por su
desviacin tpica a una variable X. De este modo se obtiene una nueva variable
Esta nueva variable carece de unidades y permite hacer comparables dos medidas que
en un principio no lo son, por aludir a conceptos diferentes. As por ejemplo nos
podemos preguntar si un elefante es ms grueso que una hormiga determinada, cada uno
en relacin a su poblacin. Tambin es aplicable al caso en que se quieran comparar
individuos semejantes de poblaciones diferentes. Por ejemplo si deseamos comparar el
nivel acadmico de dos estudiantes de diferentes Universidades para la concesin de
una beca de estudios, en principio sera injusto concederla directamente al que posea
una nota media ms elevada, ya que la dificultad para conseguir una buena calificacin
puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de
uno de los estudiante y favorece al otro. En este caso, lo ms correcto es comparar las
calificaciones de ambos estudiantes, pero estandarizadas cada una de ellas por las
medias y desviaciones tpicas respectivas de las notas de los alumnos de cada
Universidad.
Observacin
Como se ha mencionado anteriormente, la ley de probabilidad normal la encontramos
en la mayora de los fenmenos que observamos en la naturaleza, por ello gran parte de
lo que resta del curso lo vamos a dedicar a su estudio y a el de las distribuciones
asociadas a ella. Sin embargo, a pesar de su utilidad, hay que apuntar un hecho negativo
para esta ley de probabilidad:
La funcin no posee primitiva conocida.
Las consecuencias desde el punto de vista prctico son importantes, ya que eso impide
el que podamos escribir de modo sencillo la funcin de distribucin de la normal, y nos
tenemos que limitar a decir que:
sin poder hacer uso de ninguna expresin que la simplifique. Afortunadamente esto no
impide que para un valor de x fijo, F(x) pueda ser calculado. De hecho puede ser
calculado con tanta precisin (decimales) como se quiera, pero para esto se necesita usar
tcnicas de clculo numrico y ordenadores. Para la utilizacin en problemas prcticos
de la funcin de distribucin F, existen ciertas tablas donde se ofrecen (con varios
decimales de precisin) los valores F(x) para una serie limitada de valores xi dados.
Normalmente F se encuentra tabulada para una distribucin Z, normal de media 0 y
varianza 1 que se denomina distribucin normal estandarizada:
Sean . Entonces
Este resultado puede ser utilizado del siguiente modo: Si , y nos interesa
calcular ,
1.
2.
Usamos la tabla de probabilidades para la normal estndar, relativa a la distribucin
3.
Como
Vamos ahora a demostrar algunas de las propiedades de la ley normal que hemos
mencionado anteriormente.
Proposicin
Sea . Entonces
Demostracin
Por ser la normal una ley de probabilidad se tiene que
es decir, esa integral es constante. Con lo cual, derivando la expresin anterior con
respecto a se obtiene el valor 0:
luego .
Luego
Se puede demostrar (teorema central del lmite) que una v.a. discreta con distribucin
aunque en realidad esta no da resultados muy precisos a menos que realmente n sea un
distribucin y el diagrama de
barras de una v.a. discreta de distribucin
Solucin:
Dada la dificultad numrica para calcular esa cantidad, y como la distribucin binomial
no est habitualmente tabulada hasta valores tan altos, vamos a utilizar su aproximacin
normal, XN. Pero hay que prestar atencin al hecho de que XN es una v.a. continua, y por
tanto la probabilidad de cualquier punto es cero. En particular,
Segn un estudio, la altura de los varones de cierta ciudad es una v.a. X, que podemos
considerar que se distribuye segn una ley de normalidad de valor esperado
y desviacin tpica . Dar un intervalo para el que tengamos
Solucin:
1.
Podemos tomar el percentil 50, ya que este valor deja por debajo suya a la mitad, 0,5, de
la masa de probabilidad. Este valor, x0,5, se definira como:
donde
Por tanto podemos decir que la mitad de la poblacin tiene una altura inferior a
. Este resultado era de esperar, ya que en la distribucin es simtrica y
habr una mitad de individuos con un peso inferior a la media y otro con un peso
superior (como se ve en la figura).
2.
3.
Para ello observamos que la mayor parte de probabilidad est concentrada siempre
alrededor de la media en las leyes normales. Entonces podemos tomar un intervalo que
donde x0,25 es el valor que deja por debajo de s al de la masa de probabilidad y x0,75
el que lo deja por encima (o lo que es lo mismo, el que deja por debajo al de las
observaciones). Del mismo modo que antes estos valores pueden ser buscados en una
tabla de la distribucin normal, tipificando en primera instancia para des estandarizar
despus:
donde
Anlogamente se calculara
donde
Por la simetra de la distribucin normal con respecto al origen, tenemos que z0,25= - z0,75.
Luego
En conclusin:
De entre los tres intervalos que se han calculado el que tiene ms inters es el ltimo, ya
que es simtrico con respecto a la media, y es el ms pequeo de todos los posibles (ms
preciso). Este ejemplo es en realidad una introduccin a unas tcnicas de inferencia
estadstica que trataremos posteriormente, conocidas con el nombre de clculo de
intervalos de confianza.
Distribucin Gamma
cuando
1.
2.
Si , entonces
La media es
la varianza es
Distribucin exponencial
Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que, el
tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en un
instante tf, no depende del tiempo transcurrido anteriormente en el que no ha pasado
nada.
Ejemplo
Solucin:
que transcurre hasta que el del material radiactivo se desintegra es el percentil 90,
t90, de la distribucin exponencial, es decir
Figura: Como el nmero de tomos
(observaciones) es extremadamente alto en
10 gramos de materia, el histograma puede
ser aproximado de modo excelente por la
funcin de densidad exponencial, y el
polgono de frecuencias acumuladas por la
funcin de distribucin.
Solucin:
Entonces
En segundo lugar
Luego como era de esperar, por ser propio a un mecanismo exponencial,
o sea, en la duracin que se espera que tenga el objeto, no influye en nada el tiempo que
en la actualidad lleva funcionando. Es por ello que se dice que la distribucin
exponencial no tiene memoria.
Distribucin Ji cuadrado:
Los percentiles de esta distribucin que aparecen con ms frecuencia en la prctica los
podemos encontrar en una tabla de probabilidades para la v.a. Ji cuadrado ( ).
, se tiene
Observacin
Ejemplo
2. Definimos el error acumulado como la suma de los cuadrados de todos los errores
(cantidades positivas):
Solucin:
De este modo, el valor esperado para E1 es 0, es decir, que los errores ei van a tender a
compensarse entre unos pacientes y otros. Obsrvese que si no fuese conocido a
priori, podramos utilizar E1, para obtener una aproximacin de
Sin embargo, el resultado E1 no nos indica en qu medida hay mayor o menor dispersin
en los errores con respecto al 0. En cuanto a E2 podemos afirmar lo siguiente:
En este caso los errores no se compensan entre s, y si no fuese conocido, podra ser
estimado de modo aproximado mediante
Sin embargo, no obtenemos ninguna informacin con respecto a .
En conclusin, E1 podra ser utilizado para calcular de modo aproximado , y E2 para
calcular de modo aproximado . Las dos cantidades tienen inters, y ninguna lo tiene
ms que la otra, pues ambas formas de medir el error nos aportan informacin.
Teorema (Cochran)
Distribucin Beta
y su varianza
Uniforme: Se dice que una v.a. X posee una distribucin uniforme en el intervalo [a,
b], , si su funcin de densidad es la siguiente: .
Con esta ley de probabilidad, la probabilidad de que al hacer un experimento aleatorio,
el valor de X este comprendido en cierto sub intervalo de [a, b] depende nicamente de
la longitud del mismo, no de su posicin.
Normal: Se dice que una v.a. X sigue una distribucin normal de parmetros y ,
lo que representamos del modo si su funcin de densidad es:
lmite) que una v.a. discreta con distribucin binomial, se puede aproximar
mediante una distribucin normal si n es suficientemente grande y p no est ni muy
prximo a 0 ni a 1.
Distribucin Gamma X es una v.a. Gamma con parmetros y , es decir
si y solo si
cuando
Para realizar las deducciones de las frmulas para obtener los parmetros de las v.a.,
Distribucin uniforme
La funcin caracterstica es
Como esta distribucin es muy simple, vamos a calcular sus momentos ms usuales
directamente a partir de la definicin, en lugar de usar la funcin caracterstica:
Distribucin normal
y calculamos
Como , deducimos que
Distribucin Gamma
Distribucin exponencial
Distribucin Normal
Ejemplo
Supongamos que cierto fenmeno pueda ser representado mediante una v.a.
de modo que
los valores 0.33 y 0.67 lo obtenemos de la tabla de la v.a. normal estndar, la forma de
leer los valores es la siguiente:
Observar que en la primera columna se tiene el primer decimal y en la primera fila se
tienen el segundo decimal del valor que se desea investigar.
Una vez que se tienen los valores estandarizados se realiza el proceso contrario al de la
estandarizacin, es decir, se multiplica este valor por la desviacin estndar y se le suma
el valor de la media, y as se obtendr la probabilidad de la variable X con media 45 y
desviacin estndar 81.