Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Notas
Indice
1. DEFINICIN DE VARIABLE ALEATORIA 2. DEFINICIN DE VARIABLES ALEATORIAS INDEPENDIENTES 3. VARIABLES ALEATORIAS DISCRETAS 4. VARIABLES ALEATORIAS CONTINUAS 5. VARIABLES ALEATORIAS MULTIDIMENSIONALES 6. TRANSFORMACIN DE VARIABLES 7. BIBLIOGRAFA 1 1 2 4 9 11 12
f ( x, y ) = f ( x ) f ( y )
cualesquiera que sean x e y . donde f designa a la funcin de densidad conjunta de la variable bivariante
( X ,Y )
Otra forma de exponer este concepto, pasa por considerar los sucesos A y B de la experiencia aleatoria, determinados por dos conjuntos de valores numricos de X e Y , respectivamente. La independencia de X e Y se traduce en la independencia entre A y B , es decir, la probabilidad de que tengan lugar los sucesos A y B simultneamente debe coincidir con el producto de la probabilidad de realizacin de A por la de B :
Pr ( A B ) = Pr ( A ) Pr ( B )
Esta definicin puede extenderse a k variables aleatorias Y1 , Y2 , est asegurada si
f ( y1 , y2 ,
cualesquiera que sean y1 , y2 , donde f
, yk ) = f1 ( y1 ) f 2 ( y2 )
, yk .
fi
Se pueden distinguir distintos tipos de variables aleatorias segn dos criterios de clasificacin: (a) Variables cuantitativas que son las que resultan de experimentos cuyos resultados son directamente numricos; (b) Variables cualitativas que son las que proceden de experimentos cuyos resultados expresan una cualidad no numrica que necesita ser cuantificada. Otra clasificacin ms operativa de las variables aleatorias sera: (a) Variable discreta: aquella que se define sobre un espacio muestral numerable, finito o infinito. Espacio numerable es aquel cuyos elementos se pueden ordenar, asignndoles a cada uno un nmero de la serie de los nmeros naturales (del 1 al n del 1 al I ). Todas las variables con un nmero finito de valores y todas las que tomen valores en nmeros enteros o racionales (fraccionarios), son variables discretas; (b) Variable continua: es aquella que se define sobre un espacio asimilable al conjunto de los nmeros reales, es decir, un espacio no numerable (o un espacio infinito de tipo C o infinito dos). En general, la regla de oro es que todas las variables que proceden de experimentos en los que se cuenta son discretas y todas las variables que proceden de experimentos en los que se mide son continuas. Se dice que hemos definido una variable aleatoria para un experimento aleatorio cuando hemos asociado un valor numrico a cada resultado del experimento. Sea E el espacio muestral asociado a un experimento. Se llama variable aleatoria a toda aplicacin del espacio muestral E en el conjunto de los nmeros reales (es decir, asocia a cada elemento de E un nmero real). Se utilizan letras maysculas X , Y , para designar variables aleatorias, y las respectivas minsculas, x, y, para designar valores concretos de las mismas. Si un experimento con espacio muestral E , tiene asociada la variable aleatoria X , es natural que se planteen preguntas como: cul es la probabilidad de que X tome un determinado valor? Esto nos lleva a establecer, por convenio, la siguiente notacin:
X < x representa el suceso "la variable aleatoria X toma un valor menor a x ", y Pr ( X < x ) representa la probabilidad de que la variable aleatoria X tome un valor menor a x X x representa el suceso "la variable aleatoria X toma un valor menor o igual a x ", y Pr ( X x ) representa la probabilidad de que la variable aleatoria X tome un valor menor o igual a x 3. Variables aleatorias discretas
Binomial Binomial negativa Geomtrica Hipergeomtrica Poisson Uniforme (discreta)
pieza tiene una probabilidad p de ser defectuosa; el tamao de un conjunto si ste es aleatorio y no demasiado grande; el nmero de artculos demandados en un almacn; el nmero de encuestados que estn a favor de determinada cuestin y un cuantioso etctera. Notacin y parmetros La notacin habitual es: X B ( n, p ) .
>0 .
= xi pi
i =1 2
Varianza
=
2
x
i =1
2 i
pi =
(x
i =1
2 i
2 ) pi
Desviacin tpica
=+
x
i =1
2 i
pi 2
( ,
X = a + ( b a ) X tendramos
A B C
Propiedades Es una distribucin de valores positivos siempre menores que B , cuya moda es A .
se distribuye U
distribucin de Cauchy
origen arbitrario corta a una recta (la distancia se considera desde el punto de corte de la recta que determina la distancia del origen a la recta) se distribuye con arreglo a esta distribucin cuando el ngulo que forma el segmento con la recta es arbitrario (esto es, igualmente posible entre
La distribucin de Cauchy se caracteriza por tener las colas (es simtrica) mucho ms largas que otras distribuciones simtricas (la normal o incluso la logstica) esto hace que tenga aplicacin durante la fase de validacin de un modelo cuando se quiere someter a ste a un gran nmero de valores extremos. Notacin y parmetros No es una distribucin demasiado conocida. Aunque pueda encontrarse con otra notacin, la habitual es
X C ( a, b ) ,
donde a
es el parmetro de escala
( > 0) .
fenmenos de espera, el hecho de que sea siempre positiva la liga a magnitudes como el tiempo para realizar una tarea o el tiempo hasta el fallo de un dispositivo, entre otras posibles aplicaciones. Estas aplicaciones se derivan del hecho de que puede considerarse como la probabilidad de que ocurran sucesos en un periodo
( 1 )
harn que ste finalmente deje de funcionar; que se lleven a cabo las k subtareas que componen una tarea principal con lo que sta puede considerarse terminada, etc.) Notacin y parmetros La notacin habitual es X Gamma ( , ) donde
( > 0) .
largo del tiempo. Si dicho crecimiento es directamente proporcional al valor actual de dicha magnitud entonces se dice que el crecimiento es exponencial, si adems de esto existe un techo que impide un crecimiento infinito la curva de la magnitud sobre el eje del tiempo es una curva logstica. Esto hace que esta distribucin se pueda emplear, genricamente, para representar el valor en un momento del tiempo de una magnitud de esas caractersticas. Otro motivo para su utilizacin es su gran parecido con la distribucin normal pero con la ventaja de tener una funcin de distribucin mucho ms sencilla lo que posibilita extraordinariamente su tratamiento analtico. Notacin y parmetros La notacin habitual es X Log ( , ) donde
( > 0) .
Pt = P0 e
donde: P0 es el precio inicial< es el crecimiento medio del mercado<
es la desviacin estndar del crecimiento del mercado; y es un trmino de error que absorbe la incertidumbre de los precios en todo momento.
En estas circunstancias, P se distribuye de forma logaritmonormal. t Puesto que la distribucin es siempre positiva, se emplea tambin para modelizar tiempos: tiempo hasta el fallo de un dispositivo; tiempo para llevar a cabo una tarea. Notacin y parmetros La notacin habitual es X LN donde
( , ) ,
2
( > 0 ) .
( , ) ,
2
( > 0 )
el tamao de las ciudades; el nmero de empleados de las empresas; las fluctuaciones de los precios en los mercados de valores, entre otras. En algunos textos la encontramos exclusivamente asociada a la distribucin de los ingresos de los individuos: "la probabilidad de que la renta de un individuo supere una cierta cantidad A es una variable aleatoria de Pareto ( = A ) ". En general, es una distribucin a tener en cuenta para modelizar una magnitud (positiva) cuando en sta se cumpla que un pequeo porcentaje de valores aparece un gran nmero de veces y es posible un elevado nmero de valores extremos aunque muy poco probables. Notacin y parmetros La notacin habitual es X Par ( , ) donde
ba
X = ( X 1,
, Xn )
X :E
Cada variable componente de una variable aleatoria n-dimensional es una variable aleatoria unidimensional que recibe el nombre de variable marginal: si
( X ,Y )
variables marginales a cada una de las variables componentes, X e Y , y a sus distribuciones respectivas, distribuciones marginales.
posibles pares de valores de la variable es finito o infinito numerable. Los pares de valores que tienen probabilidad positiva se llaman puntos de masa
Variables continuas Las variables aleatorias bidimensionales de tipo continuo son una extensin de las variables aleatorias (unidimensionales) continuas que hemos estudiado en el tema anterior: son aquellas que toman valores en el recinto del plano. Diremos que una variable aleatoria bidimensional existe una funcin f : que
2
( X ,Y )
( X , Y ) , F ( x, y ) , verifica
2
F ( x, y ) =
( f ( u, v ) dv ) du
x y
( x, y )
A esta funcin f ( x, y ) la llamaremos funcin de densidad de probabilidad conjunta o, simplemente, funcin de densidad conjunta. Distribuciones marginales Si
( X ,Y )
es una variable aleatoria bidimensional, llamaremos variables marginales a cada una de las
variables componentes, X e Y , y a sus distribuciones respectivas, distribuciones marginales. Intuitivamente, dos sucesos son independientes cuando el conocimiento de la ocurrencia de uno de ellos no modifica la probabilidad del otro. Este concepto se puede extender a variables aleatorias En este contexto, si
( X ,Y )
y , diremos que X e Y son variable aleatorias independientes cuando este conocimiento no modifica la distribucin de probabilidad de X . Esta idea se puede generalizar al caso de variables aleatorias n
dimensionales
( X ,Y )
Si
una variable aleatoria bidimensional: Entonces, X e Y son independientes si y solo si: es discreta con distribucin de probabilidad
( X ,Y )
{( x , y ) , p }; i, j
i i ij
se verifica que:
pi j = Pr ( X = xi , Y = y j ) = Pr ( X = xi ) Pr (Y = y j ) = pi p j
f ( x, y ) = f X ( x ) f Y ( y )
( x, y )
Si
( X ,Y )
( x, y )
Esta caracterizacin se extiende al caso de n variables y ya que va a ser de gran importancia en temas posteriores, se describe a continuacin. Teorema: Sea
( X 1,
Si
, X n son
, xn
( X 1, ( X 1,
, X n ) es discreta, Pr ( X 1 = x1 , , X n = xn ) = Pr ( X 1 = x1 ) , xn ) = f ( x1 ) f ( x2 )
10
Pr ( X n = xn ) f ( xn )
Si
6. Transformacin de variables
Cuando una variable no satisface las asunciones de normalidad, homogeneidad de varianzas o linealidad, puede ser til corregir la deficiencia usando una transformacin de la misma. Una transformacin es una funcin de un valor que define un nuevo valor. Su forma general es: y = f(x), donde f es la funcin de transformacin. Se distinguen dos categoras de transformacin: transformacin lineal y transformacin no lineal La transformacin lineal cambia la escala de la distribucin pero no la forma de la distribucin. Podemos de esta manera eliminar valores negativos. La transformacin no lineal cambia la distribucin para ajustarla a la distribucin normal y estabiliza la varianza. Hay distintos tipos de transformacin de las variables y entre ellos podemos citar los siguientes: Estandarizacin Z o zscores. Convierte todos los valores de la poblacin (o muestra) en medidas de desviacin estndar por encima o por debajo de la media. Estos valores transformados se llaman scores estndar o zscores. Un score estndar es la distancia de un valor a la media de la distribucin. La distribucin resultante de este proceso tiene una media de cero (0) y una desviacin estndar de uno (1). La estandarizacin Z no normaliza una distribucin; el tipo (o forma) de la distribucin permanece el mismo. El beneficio de este proceso es hacer variables con diferentes o diferentes unidades de medida o diferentes escalas de medida comparables. Cuando una transformacin Z se hace en una poblacin normal, la distribucin resultante se llama distribucin normal estndar o distribucin Z . Esta transformacin es comn en la regresin lineal. En la regresin lineal la pendiente ( b ) representa el coeficiente de correlacin no estandarizado, mientras que el coeficiente beta ( ) representa el coeficiente de correlacin estandarizado, por eso la b compara la misma variable en diferentes ecuaciones, mientras que la compara diferentes variables dentro de la misma ecuacin. Transformacin lineal. Traslada los datos a un nuevo origen por expansin (o contraccin) de la escala de medida. La distribucin no cambia. Tiene la forma general y = b x + a , donde a es la translacin o constante aditiva y b es la constante multiplicativa. La constante de translacin solamente agrega un valor constante a cada medida. Tiene el efecto de cambiar el origen del eje x . La constante multiplicativa expande (o contrae) la escala, tiene un efecto de escala. Transformacin logartmica o logaritmo ampliada: Se usa para normalizar una distribucin que tenga un sesgo positivo extremo. Tambin es apropiada para alguna poblacin cuando la varianza es proporcional a la media. Transformacin x : se usa para reducir sesgo negativo extremo. Transformacin x : se usa para corregir sesgo negativo. Transformacin raz cuadrada o raz cuadrada ampliada: reduce el sesgo positivo de tipo medio. Transformacin inversa
2 3
Podemos considerar tres transformaciones para normalidad, homogeneidad de varianzas y linealidad: transformacin logartmica, transformacin raz cuadrada y transformacin inversa. Para linealidad tambin podemos utilizar la transformacin cuadrtica x
( ).
2
11
7. Bibliografa
http://www.unavarra.es/estadistica/LE/Estadistica/ http://www.campusvirtual.uma.es/est_fisio/apuntes/ www.eumed.net/cursecon/libreria/2004/jsf/6.pdf www.uclm.es/profesorado/jmezo/estadistica/t2.pdf http://www.eumed.net/cursecon/libreria/drm/drm-estad.pdf http://www.eui.upm.es/~acorral/material/index.html http://www.utexas.edu/courses/schwab/sw388r7/SolvingProblems/ComputingTransformations.ppt http://www.colfa.utsa.edu/Sociology/masters/manip.html www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 200405/Apuntes estadistica/VA_continuas_1.pdf www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 200405/Apuntes estadistica/VA_continuas_2.pdf www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 200405/Apuntes estadistica/VA_discretas.pdf www.chups.fr/polys/biostats/poly/stats.pdf www.anu.edu.au/nceph/surfstat/surfstat-home/contents.html www.uvp5.univ-paris5.fr/staticmed/E-STAT/PlantStatPCEM1.htm www.eumed.net/libros/2006a/rmss/index.htm ftp.medprev.uma.es/libro/html.htm idea.uab.es/fklijn/bio/indexold.htm halweb.uc3m.es/omar/taller/TALLER.html
Libros
Martnez Gonzlez MA, De Irala Estvez J, Fauln Fajardo FJ. Bioestadstica amigable. Madrid: Daz de Santos, 2001 Spiegel, MR. Estadstica, 2 Edicin. Mxico: McGraw-Hill, 2000. Horra Navarro, J. Estadstica aplicada, 3 Edicin. Madrid: Daz de Santos, 2003 A.Martn Andres, J.de D. Luana del Castillo. Bioestadstica para las Ciencias de la Salud, 5 Edicin. Madrid: Norma, 2004
12