Está en la página 1de 12

VARIABLES ALEATORIAS

Notas
Indice
1. DEFINICIN DE VARIABLE ALEATORIA 2. DEFINICIN DE VARIABLES ALEATORIAS INDEPENDIENTES 3. VARIABLES ALEATORIAS DISCRETAS 4. VARIABLES ALEATORIAS CONTINUAS 5. VARIABLES ALEATORIAS MULTIDIMENSIONALES 6. TRANSFORMACIN DE VARIABLES 7. BIBLIOGRAFA 1 1 2 4 9 11 12

1. Definicin de variable aleatoria


Se dice que una funcin X : es una variable aleatoria si la "suerte" de realizacin de sus posibles valores puede establecerse con ayuda de los resultados de la experiencia aleatoria en estudio, cuyo espacio muestral es . Se trata, en definitiva, de una funcin que asigna un valor numrico a cada uno de los resultados de una experiencia aleatoria.

2. Definicin de variables aleatorias independientes


Dadas X e Y , variables aleatorias con funciones de densidad de probabilidad f X y fY , respectivamente, se dice que son independientes si:

f ( x, y ) = f ( x ) f ( y )
cualesquiera que sean x e y . donde f designa a la funcin de densidad conjunta de la variable bivariante

( X ,Y )

Otra forma de exponer este concepto, pasa por considerar los sucesos A y B de la experiencia aleatoria, determinados por dos conjuntos de valores numricos de X e Y , respectivamente. La independencia de X e Y se traduce en la independencia entre A y B , es decir, la probabilidad de que tengan lugar los sucesos A y B simultneamente debe coincidir con el producto de la probabilidad de realizacin de A por la de B :

Pr ( A B ) = Pr ( A ) Pr ( B )
Esta definicin puede extenderse a k variables aleatorias Y1 , Y2 , est asegurada si

, Yk , donde la independencia entre ellas


f k ( yk ) , Yk ) ;

f ( y1 , y2 ,
cualesquiera que sean y1 , y2 , donde f

, yk ) = f1 ( y1 ) f 2 ( y2 )

, yk .

designa la funcin de densidad conjunta de (Y1 , Y2 ,

fi

designa la funcin de densidad de Yi .

Se pueden distinguir distintos tipos de variables aleatorias segn dos criterios de clasificacin: (a) Variables cuantitativas que son las que resultan de experimentos cuyos resultados son directamente numricos; (b) Variables cualitativas que son las que proceden de experimentos cuyos resultados expresan una cualidad no numrica que necesita ser cuantificada. Otra clasificacin ms operativa de las variables aleatorias sera: (a) Variable discreta: aquella que se define sobre un espacio muestral numerable, finito o infinito. Espacio numerable es aquel cuyos elementos se pueden ordenar, asignndoles a cada uno un nmero de la serie de los nmeros naturales (del 1 al n del 1 al I ). Todas las variables con un nmero finito de valores y todas las que tomen valores en nmeros enteros o racionales (fraccionarios), son variables discretas; (b) Variable continua: es aquella que se define sobre un espacio asimilable al conjunto de los nmeros reales, es decir, un espacio no numerable (o un espacio infinito de tipo C o infinito dos). En general, la regla de oro es que todas las variables que proceden de experimentos en los que se cuenta son discretas y todas las variables que proceden de experimentos en los que se mide son continuas. Se dice que hemos definido una variable aleatoria para un experimento aleatorio cuando hemos asociado un valor numrico a cada resultado del experimento. Sea E el espacio muestral asociado a un experimento. Se llama variable aleatoria a toda aplicacin del espacio muestral E en el conjunto de los nmeros reales (es decir, asocia a cada elemento de E un nmero real). Se utilizan letras maysculas X , Y , para designar variables aleatorias, y las respectivas minsculas, x, y, para designar valores concretos de las mismas. Si un experimento con espacio muestral E , tiene asociada la variable aleatoria X , es natural que se planteen preguntas como: cul es la probabilidad de que X tome un determinado valor? Esto nos lleva a establecer, por convenio, la siguiente notacin:

X = x representa el suceso "la variable aleatoria X toma el valor x ", y Pr ( X = x ) representa la


probabilidad de dicho suceso

X < x representa el suceso "la variable aleatoria X toma un valor menor a x ", y Pr ( X < x ) representa la probabilidad de que la variable aleatoria X tome un valor menor a x X x representa el suceso "la variable aleatoria X toma un valor menor o igual a x ", y Pr ( X x ) representa la probabilidad de que la variable aleatoria X tome un valor menor o igual a x 3. Variables aleatorias discretas
Binomial Binomial negativa Geomtrica Hipergeomtrica Poisson Uniforme (discreta)

3.1. Distribucin binomial


Usos Una variable aleatoria Binomial representa el nmero de xitos que ocurren en n repeticiones independientes de un ensayo de Bernouilli cuya probabilidad de xito es p . As, se distribuyen de esta forma magnitudes como el nmero de piezas defectuosas en un lote de tamao n (moderado) cuando cada

pieza tiene una probabilidad p de ser defectuosa; el tamao de un conjunto si ste es aleatorio y no demasiado grande; el nmero de artculos demandados en un almacn; el nmero de encuestados que estn a favor de determinada cuestin y un cuantioso etctera. Notacin y parmetros La notacin habitual es: X B ( n, p ) .

3.2. Distribucin binomial negativa


Usos Una variable aleatoria binomial negativa representa el nmero de fracasos que ocurren hasta obtener el e-nsimo xito en la realizacin de ensayos de Bernouilli con probabilidad p de xito. As, el nmero de artculos examinados de un lote hasta que aparece el n-simo defectuoso; el nmero de candidatos a entrevistar cuando se quiere formar un equipo de n personas idneas para un puesto de trabajo; el nmero de melocotones que un cliente exigente manipula antes de conseguir un kilo de ellos que satisfagan sus criterios; etc. Notacin y parmetros La notacin habitual es X NegBin ( n, p ) o, a veces, X BN ( n, p ) .

3.3. Distribucin geomtrica


Usos Una variable aleatoria geomtrica representa el nmero de fracasos que ocurren hasta obtener el primer xito en la realizacin de ensayos de Bernouilli con probabilidad p de xito. As, el nmero de artculos examinados de un lote hasta que aparece el primer defectuoso; el nmero de candidatos a entrevistar cuando se quiere encontrar una nica persona idnea para un puesto de trabajo; el nmero de melones que un cliente exigente manosea antes de conseguir aqul que satisface sus criterios, etc. Notacin y parmetros La notacin habitual es X Geom ( p ) o, a veces, X G ( p ) .

3.4. Distribucin hipergeomtrica


Usos Una variable aleatoria hipergeomtrica representa el nmero de xitos que ocurrirn cuando de una poblacin en la que hay N objetos cuya eleccin se considera (arbitrariamente) un xito y M N objetos fracaso, se extrae una muestra, sin repeticin, de tamao n . Es importante notar que el muestreo se haga sin repeticin, es decir sin devolver los objetos al seno de la poblacin antes de cada ensayo, ya que esta caracterstica es la nica que diferencia esta distribucin de la distribucin binomial. Se distribuyen segn una hipergeomtrica magnitudes tales como el nmero de hombres (o de mujeres) que incluye una seleccin al azar de un grupo en el que ambos gneros estn presentes, el nmero de temas estudiados por un opositor que ha decidido estudiar slo unos cuantos del temario de su oposicin cuando el examen consta de varios temas, etc. Notacin y parmetros La notacin habitual es X HiperGeom ( n, N , M ) o tambin X H ( n, N , M ) . Todos los parmetros deben ser lgicamente positivos y representan: n el tamao de la muestra extrada; N el nmero de xitos que contiene la poblacin; M el nmero total de elementos de la poblacin.

3.5. Distribucin de Poisson


Usos Una variable aleatoria de Poisson es en realidad una variable aleatoria binomial llevada al lmite, es decir cuando n . (aunque basta con que sea suficientemente grande) y p 0 (aunque basta con que seasuficientemente pequeo). En general cualquier suceso raro" puede ser perfectamente modelizado por una variable aleatoria de Poisson. Ejemplos tpicos son el nmero de remaches defectuosos en un avin (porque un avin puede llegar a tener varios millones de ellos y al ser un mecanismo tan simple es realmente difcil que sea defectuoso); el nmero de erratas en un libro (que contiene un gran nmero de palabras que difcilmente estn mal escritas); el nmero de llegadas a un servicio ( o de llamadas a un callcenter) si la distribucin entre los tiempos es exponencial; el nmero de accidentes laborales en un mes en una gran empresa; el nmero de personas que entran en un supermercado en un minuto; el nmero de personas residentes en una gran ciudad que en un da sufren un infarto; etc. Notacin y parmetros La notacin habitual es X Poisson ( ) . El nico parmetro debe ser positivo:

>0 .

3.6. Distribucin uniforme (discreta)


Usos Esta variable aleatoria es el equivalente discreto de la de mismo nombre dentro de las distribuciones continuas. Se utiliza cuando un conjunto de posibles resultados es igualmente probable: el nmero de veces que aparecer cada una de las caras de un dado regular; el dgito final de los nmeros premiados en la lotera, etc. Notacin y parmetros La notacin habitual es X UD ( a, b ) . Se verifica que a X b y a < b .

3.7. Parmetros de una variable aleatoria discreta


Esperanza matemtica (media)

= xi pi
i =1 2

Varianza

=
2

x
i =1

2 i

pi =

(x
i =1

2 i

2 ) pi

Desviacin tpica

=+

x
i =1

2 i

pi 2

4. Variables aleatorias continuas


Beta Bradford Cauchy Exponencial Gamma Gumbel Logstica Logaritmo normal Normal Pareto Triangular Uniforme

4.1. Distribucin beta


Usos Debido a su gran flexibilidad se utiliza en situaciones en las que la ausencia de datos concretos no impide, sin embargo, tener una idea del comportamiento "global" de la variable aleatoria. Si suponemos conocidos, o razonablemente supuestos, valores tales como el mximo, mnimo, media o moda y el tipo de simetra (o asimetra), entonces es posible encontrar una distribucin Beta que se adapte a dichas suposiciones. Tambin se utiliza para simular la proporcin (o el nmero total) de productos defectuosos en un lote de fabricacin, la duracin de un proceso (en PERT/CPM), o la mediana de una muestra aleatoria. Notacin y parmetros La notacin habitual es X Be ( , ) o bien X Beta ( , ) , los dos parmetros son de forma

( ,

> 0 ) . En Excel la notacin es diferente y se basa en el hecho de que la distribucin puede se

fcilmente reescalada a un intervalo

X = a + ( b a ) X tendramos

( a, b ) ya que si X Be ( , ) 0 X 1 al hacer X Be ( , ) pero ahora con a X b . As, la notacin en Excel es

X Be ( , , a, b ) ; en este caso los parmetros a y b son de escala en la distribucin.


Propiedades

= la distribucin es simtrica y centrada; Si = = 1 se convierte en una distribucin uniforme;


Si Si X Be ( , ) 1 X Be ( , ) ;

Be (1, 2 ) es la distribucin triangular izquierda; Be ( 2,1) es la distribucin triangular derecha;


Be 1 , 1 es la distribucin arcoseno. 2 2

4.2. Distribucin de Bradford


Usos Su uso es muy restringido en simulacin, se trata de otra distribucin que, como la de Pareto, modeliza cualquier fenmeno en el que "slo unos pocos controlan una gran parte del todo". La distribucin de Bradford se aplica concretamente al nmero de referencias (bibliogrficas, en el trabajo original) a un determinado tema e intenta explicar un hecho observado por Samuel Bradford (1934) que puede definirse de esta manera: "un tercio de las referencias provienen de un reducido grupo de fuentes; otro tercio de un grupo menos reducido y el tercio restante de un disperso grupo de fuentes". Por ejemplo, encontradas 300 referencias sobre un tema, 100 se encuentran en un grupo de cinco revistas; otras 100 en un grupo de 25 y las restantes en un amplio grupo de 100 fuentes. Notacin y parmetros La notacin habitual es X Bradford ( A, B, C ) donde

A B C

es un parmetro de posicin; es un parmetro de escala, es un parmetro de forma

Propiedades Es una distribucin de valores positivos siempre menores que B , cuya moda es A .

4.3. Distribucin de Cauchy


Usos El cociente de dos cantidades normales estndar independientes sigue una distribucin de Cauchy, este hecho es suficiente para que esta distribucin deba ser tenida en cuenta a la hora de realizar simulaciones. De otra manera, si

se distribuye U

distribucin de Cauchy

( a = 0, b =1) . As, la distancia a la que un segmento de longitud infinita y con un



, . 2 2

, , entonces X = tg ( ) se distribuye segn una 2 2

origen arbitrario corta a una recta (la distancia se considera desde el punto de corte de la recta que determina la distancia del origen a la recta) se distribuye con arreglo a esta distribucin cuando el ngulo que forma el segmento con la recta es arbitrario (esto es, igualmente posible entre

La distribucin de Cauchy se caracteriza por tener las colas (es simtrica) mucho ms largas que otras distribuciones simtricas (la normal o incluso la logstica) esto hace que tenga aplicacin durante la fase de validacin de un modelo cuando se quiere someter a ste a un gran nmero de valores extremos. Notacin y parmetros No es una distribucin demasiado conocida. Aunque pueda encontrarse con otra notacin, la habitual es

X C ( a, b ) ,

donde a

es el parmetro de posicin ( < a < ) ; y es el parmetro de escala ( b > 0 ) (b>0).

4.4. Distribucin exponencial


Usos La distribucin exponencial es una de las ms utilizadas en simulacin, sus valores son siempre positivos lo que la liga fundamentalmente con la modelizacin de "tiempos", pero lo que la convierte en sumamente importante es el hecho de que se trata de la nica distribucin continua cuya tasa de fallo es constante, o dicho de otra forma, no tiene memoria. Esto supone que la magnitud simulada, el tiempo necesario para que se complete una tarea, el tiempo hasta el fallo de un dispositivo mecnico, el tiempo entre llegadas de los clientes a una cola, es independiente del instante del tiempo en que nos encontremos y por tanto del tiempo transcurrido hasta ese momento. Esta propiedad (conocida en la literatura anglosajona como memoryless property) es harto frecuente, determinados dispositivos electrnicos, por ejemplo, no sufren desgaste y por lo tanto prcticamente no envejecen por lo que su probabilidad de fallo no aumenta a lo largo de su vida til. Por otra parte, si el nmero de sucesos ocurridos en un intervalo de tiempo sigue una distribucin de Poisson, entonces el tiempo entre dos de estos sucesos se distribuye de forma exponencial. Notacin y parmetros La notacin habitual es X Exp ( ) donde

es el parmetro de escala

( > 0) .

4.5. Distribucin gamma


Usos La distribucin gamma es la generalizacin de algunas de las distribuciones ms usadas en la modelizacin de fenmenos para su simulacin: la exponencial, y la distribucin Erlang no son sino casos particulares (junto con la

2 ) de la distribucin gamma. Su empleo en simulacin / MonteCarlo est relacionado con los

fenmenos de espera, el hecho de que sea siempre positiva la liga a magnitudes como el tiempo para realizar una tarea o el tiempo hasta el fallo de un dispositivo, entre otras posibles aplicaciones. Estas aplicaciones se derivan del hecho de que puede considerarse como la probabilidad de que ocurran sucesos en un periodo

( 1 )

de tiempo (por ejemplo que fallen los k subsistemas de un dispositivo que

harn que ste finalmente deje de funcionar; que se lleven a cabo las k subtareas que componen una tarea principal con lo que sta puede considerarse terminada, etc.) Notacin y parmetros La notacin habitual es X Gamma ( , ) donde

( > 0 ) ; es un parmetro de escala, ( > 0 ) .


es un parmetro de forma,

4.6. Distribucin de Gumbel


Usos La distribucin Gumbel es tambin conocida como LogWeibull, Gomperzt o Fisher-Tippet. Es la distribucin de los valores extremos (mximo o mnimos) de una muestra suficientemente grande de variables aleatorias independientes de una misma distribucin. Notacin y parmetros La notacin habitual es X Gumbel ( , ) donde

es un parmetro de posicin, ( < < ) ; es un parmetro de forma,

( > 0) .

4.7. Distribucin logstica


Usos Aunque tericamente se trata de la distribucin de la media de los valores mximo y mnimo de una muestra de tamao n

( n ) , su utilizacin est ms relacionada con el crecimiento futuro de una magnitud a lo

largo del tiempo. Si dicho crecimiento es directamente proporcional al valor actual de dicha magnitud entonces se dice que el crecimiento es exponencial, si adems de esto existe un techo que impide un crecimiento infinito la curva de la magnitud sobre el eje del tiempo es una curva logstica. Esto hace que esta distribucin se pueda emplear, genricamente, para representar el valor en un momento del tiempo de una magnitud de esas caractersticas. Otro motivo para su utilizacin es su gran parecido con la distribucin normal pero con la ventaja de tener una funcin de distribucin mucho ms sencilla lo que posibilita extraordinariamente su tratamiento analtico. Notacin y parmetros La notacin habitual es X Log ( , ) donde

es un parmetro de posicin, ( < < ) ; es un parmetro de forma,

( > 0) .

4.8. Distribucin lognormal


Usos De la misma manera que la suma de un nmero (suficiente) de variables aleatorias positivas se distribuye de forma normal, el producto de un nmero (suficiente) de variables aleatorias positivas se distribuye de forma lognormal. As, numerosas magnitudes en las que en vez de la adicin est presente el producto, se modelizan a travs de esta distribucin; por ejemplo la evolucin de los precios P de un determinado t producto puede modelizarse de la forma siguiente:
2 t + t 2

Pt = P0 e
donde: P0 es el precio inicial< es el crecimiento medio del mercado<

es la desviacin estndar del crecimiento del mercado; y es un trmino de error que absorbe la incertidumbre de los precios en todo momento.

En estas circunstancias, P se distribuye de forma logaritmonormal. t Puesto que la distribucin es siempre positiva, se emplea tambin para modelizar tiempos: tiempo hasta el fallo de un dispositivo; tiempo para llevar a cabo una tarea. Notacin y parmetros La notacin habitual es X LN donde

( , ) ,
2

es el parmetro de escala; y es el parmetro de forma

( > 0 ) .

4.9. Distribucin normal


Usos En virtud del teorema central del lmite cualquier magnitud que sea suma de otras magnitudes, sean stas como sean, se distribuir de forma normal. Notacin y parmetros La notacin habitual es X N donde

( , ) ,
2

es el parmetro de posicin; y es el parmetro de escala

( > 0 )

4.10. Distribucin triangular


Usos Su uso es como aproximacin a la modelizacin de una magnitud aleatoria de la que no se cuenta con datos y nicamente puede aventurarse un mnimo y mximo absolutos y un valor modal

4.11. Distribucin de Pareto


Usos La distribucin de Pareto aparece asociada a multitud de magnitudes naturales. Es profusamente empleada para modelizar aspectos tales como: la distribucin de la renta de los individuos (cuando sta supera un cierto umbral ); las reclamaciones de seguros; la distribucin de recursos naturales en zonas geogrficas;

el tamao de las ciudades; el nmero de empleados de las empresas; las fluctuaciones de los precios en los mercados de valores, entre otras. En algunos textos la encontramos exclusivamente asociada a la distribucin de los ingresos de los individuos: "la probabilidad de que la renta de un individuo supere una cierta cantidad A es una variable aleatoria de Pareto ( = A ) ". En general, es una distribucin a tener en cuenta para modelizar una magnitud (positiva) cuando en sta se cumpla que un pequeo porcentaje de valores aparece un gran nmero de veces y es posible un elevado nmero de valores extremos aunque muy poco probables. Notacin y parmetros La notacin habitual es X Par ( , ) donde

( , > 0 ) ; y, adems indica el valor mnimo posible de la variable ( X < ) .


son ambos parmetros de escala

4.12. Distribucin uniforme


Usos Su uso es como aproximacin a la modelizacin de una magnitud aleatoria de la que no se cuenta con datos y nicamente puede aventurarse un mnimo y mximo absolutos no pudindose hacer conjeturas sobre su distribucin dentro de ese intervalo. Por otra parte es la base de la generacin del resto de variables aleatorias. Notacin y parmetros La notacin habitual es X U ( a, b ) , donde a es el parmetro de posicin; y determina la escala de la distribucin ( b > a ) .

ba

5. Variables aleatorias multidimensionales 5.1 Definicin


Sea E el espacio muestral asociado a un experimento aleatorio. Sea un espacio de sucesos asociado a E . Llamaremos variable aleatoria multidimensional o variable aleatoria n-dimensional a una funcin

X = ( X 1,

, Xn )

X :E

Cada variable componente de una variable aleatoria n-dimensional es una variable aleatoria unidimensional que recibe el nombre de variable marginal: si

( X ,Y )

es una variable aleatoria bidimensional, llamaremos

variables marginales a cada una de las variables componentes, X e Y , y a sus distribuciones respectivas, distribuciones marginales.

5.2. Variables aleatorias bidimensionales de tipo discreto y continuo


Variables discretas Diremos que una variable aleatoria

( X , Y ) es de tipo discreto o, simplemente, discreta si el conjunto de

posibles pares de valores de la variable es finito o infinito numerable. Los pares de valores que tienen probabilidad positiva se llaman puntos de masa

Variables continuas Las variables aleatorias bidimensionales de tipo continuo son una extensin de las variables aleatorias (unidimensionales) continuas que hemos estudiado en el tema anterior: son aquellas que toman valores en el recinto del plano. Diremos que una variable aleatoria bidimensional existe una funcin f : que
2

( X ,Y )

es de tipo continuo o, simplemente, continua si

no negativa tal que la funcin de distribucin de

( X , Y ) , F ( x, y ) , verifica
2

F ( x, y ) =

( f ( u, v ) dv ) du
x y

( x, y )

A esta funcin f ( x, y ) la llamaremos funcin de densidad de probabilidad conjunta o, simplemente, funcin de densidad conjunta. Distribuciones marginales Si

( X ,Y )

es una variable aleatoria bidimensional, llamaremos variables marginales a cada una de las

variables componentes, X e Y , y a sus distribuciones respectivas, distribuciones marginales. Intuitivamente, dos sucesos son independientes cuando el conocimiento de la ocurrencia de uno de ellos no modifica la probabilidad del otro. Este concepto se puede extender a variables aleatorias En este contexto, si

( X ,Y )

es una variable aleatoria bidimensional, y sabemos que Y ha tomado el valor

y , diremos que X e Y son variable aleatorias independientes cuando este conocimiento no modifica la distribucin de probabilidad de X . Esta idea se puede generalizar al caso de variables aleatorias n
dimensionales

5. 3. Independencia de variables aleatorias bi y ndimensionales


Teorema: Sea

( X ,Y )
Si

una variable aleatoria bidimensional: Entonces, X e Y son independientes si y solo si: es discreta con distribucin de probabilidad

( X ,Y )

{( x , y ) , p }; i, j
i i ij

{(xi ,yj ), pij}, i, jN,


2

se verifica que:

pi j = Pr ( X = xi , Y = y j ) = Pr ( X = xi ) Pr (Y = y j ) = pi p j
f ( x, y ) = f X ( x ) f Y ( y )

( x, y )

Si

( X ,Y )

es continua con funcin de densidad f ( x, y ) , se verifica que

( x, y )

Esta caracterizacin se extiende al caso de n variables y ya que va a ser de gran importancia en temas posteriores, se describe a continuacin. Teorema: Sea

( X 1,
Si

, X n ) una variable aleatoria ndimensional. Entonces, las variables X 1 ,

, X n son

independientes si y solo si se verifica x1 , x2 ,

, xn

( X 1, ( X 1,

, X n ) es discreta, Pr ( X 1 = x1 , , X n = xn ) = Pr ( X 1 = x1 ) , xn ) = f ( x1 ) f ( x2 )
10

Pr ( X n = xn ) f ( xn )

Si

, X n ) es continua con funcin de densidad f , f ( x1 , x2 ,

6. Transformacin de variables
Cuando una variable no satisface las asunciones de normalidad, homogeneidad de varianzas o linealidad, puede ser til corregir la deficiencia usando una transformacin de la misma. Una transformacin es una funcin de un valor que define un nuevo valor. Su forma general es: y = f(x), donde f es la funcin de transformacin. Se distinguen dos categoras de transformacin: transformacin lineal y transformacin no lineal La transformacin lineal cambia la escala de la distribucin pero no la forma de la distribucin. Podemos de esta manera eliminar valores negativos. La transformacin no lineal cambia la distribucin para ajustarla a la distribucin normal y estabiliza la varianza. Hay distintos tipos de transformacin de las variables y entre ellos podemos citar los siguientes: Estandarizacin Z o zscores. Convierte todos los valores de la poblacin (o muestra) en medidas de desviacin estndar por encima o por debajo de la media. Estos valores transformados se llaman scores estndar o zscores. Un score estndar es la distancia de un valor a la media de la distribucin. La distribucin resultante de este proceso tiene una media de cero (0) y una desviacin estndar de uno (1). La estandarizacin Z no normaliza una distribucin; el tipo (o forma) de la distribucin permanece el mismo. El beneficio de este proceso es hacer variables con diferentes o diferentes unidades de medida o diferentes escalas de medida comparables. Cuando una transformacin Z se hace en una poblacin normal, la distribucin resultante se llama distribucin normal estndar o distribucin Z . Esta transformacin es comn en la regresin lineal. En la regresin lineal la pendiente ( b ) representa el coeficiente de correlacin no estandarizado, mientras que el coeficiente beta ( ) representa el coeficiente de correlacin estandarizado, por eso la b compara la misma variable en diferentes ecuaciones, mientras que la compara diferentes variables dentro de la misma ecuacin. Transformacin lineal. Traslada los datos a un nuevo origen por expansin (o contraccin) de la escala de medida. La distribucin no cambia. Tiene la forma general y = b x + a , donde a es la translacin o constante aditiva y b es la constante multiplicativa. La constante de translacin solamente agrega un valor constante a cada medida. Tiene el efecto de cambiar el origen del eje x . La constante multiplicativa expande (o contrae) la escala, tiene un efecto de escala. Transformacin logartmica o logaritmo ampliada: Se usa para normalizar una distribucin que tenga un sesgo positivo extremo. Tambin es apropiada para alguna poblacin cuando la varianza es proporcional a la media. Transformacin x : se usa para reducir sesgo negativo extremo. Transformacin x : se usa para corregir sesgo negativo. Transformacin raz cuadrada o raz cuadrada ampliada: reduce el sesgo positivo de tipo medio. Transformacin inversa
2 3

( 1 x ) : reduce el sesgo positivo muy extremo.


N

Transformacin arco seno: corrige el sesgo positivo. Transformacin potencial x

( ) : corrige el sesgo positivo y/o negativo.

Transformacin seno hiperblico inverso

2 [: corrige la kurtosis positiva residual. x e e


x

Podemos considerar tres transformaciones para normalidad, homogeneidad de varianzas y linealidad: transformacin logartmica, transformacin raz cuadrada y transformacin inversa. Para linealidad tambin podemos utilizar la transformacin cuadrtica x

( ).
2

11

7. Bibliografa
http://www.unavarra.es/estadistica/LE/Estadistica/ http://www.campusvirtual.uma.es/est_fisio/apuntes/ www.eumed.net/cursecon/libreria/2004/jsf/6.pdf www.uclm.es/profesorado/jmezo/estadistica/t2.pdf http://www.eumed.net/cursecon/libreria/drm/drm-estad.pdf http://www.eui.upm.es/~acorral/material/index.html http://www.utexas.edu/courses/schwab/sw388r7/SolvingProblems/ComputingTransformations.ppt http://www.colfa.utsa.edu/Sociology/masters/manip.html www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 200405/Apuntes estadistica/VA_continuas_1.pdf www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 200405/Apuntes estadistica/VA_continuas_2.pdf www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 200405/Apuntes estadistica/VA_discretas.pdf www.chups.fr/polys/biostats/poly/stats.pdf www.anu.edu.au/nceph/surfstat/surfstat-home/contents.html www.uvp5.univ-paris5.fr/staticmed/E-STAT/PlantStatPCEM1.htm www.eumed.net/libros/2006a/rmss/index.htm ftp.medprev.uma.es/libro/html.htm idea.uab.es/fklijn/bio/indexold.htm halweb.uc3m.es/omar/taller/TALLER.html

Libros
Martnez Gonzlez MA, De Irala Estvez J, Fauln Fajardo FJ. Bioestadstica amigable. Madrid: Daz de Santos, 2001 Spiegel, MR. Estadstica, 2 Edicin. Mxico: McGraw-Hill, 2000. Horra Navarro, J. Estadstica aplicada, 3 Edicin. Madrid: Daz de Santos, 2003 A.Martn Andres, J.de D. Luana del Castillo. Bioestadstica para las Ciencias de la Salud, 5 Edicin. Madrid: Norma, 2004

12

También podría gustarte