Está en la página 1de 143

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin

Ignacio Vlez Pareja Decano Facultad de Ingeniera Industrial Politcnico Grancolombiano Bogot, Colombia Octubre, 2002

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Probabilidad y estadstica: Conceptos bsicos Conceptos bsicos de probabilidad

La necesidad de jugar es tan apremiante y su prctica tan placentera, que supongo que debe ser pecado. Heywood Broun (Citado por Thomas y Ronald Wonnacott) Debemos creer en la suerte. Porque, de qu otra manera se explica el xito de las personas que no nos gustan? Jean Cocteau (Citado por Thomas y Ronald Wonnacott)

Cuando se toman decisiones sobre resultados futuros que se conocen, la nica razn para que se cometa un error es que exista un error en el anlisis por parte del decisor. Esta situacin se conoce como certidumbre completa. Pero la realidad casi nunca es totalmente predecible. Por lo tanto, aunque el decisor haya hecho el anlisis correcto, siempre hay factores que no puede controlar y que influyen para que los resultados sean imprevistos. Cuando prevalecen estas condiciones se dice que se trabaja bajo incertidumbre y, por lo tanto, el decisor se ve obligado a asumir riesgos. Por ejemplo, que los resultados de sus decisiones no sean favorables. Una forma de hacerlo es medir el riesgo asociado a cada prediccin; riesgo que significa qu tantas posibilidades hay de que la decisin adoptada sea errnea. Con esa informacin el decisor tomar la

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

mejor determinacin y slo queda esperar para saber si el resultado es o no favorable. Por ms cuidado que se tenga en el anlisis, siempre existir la posibilidad de que el resultado sea desfavorable. Hay que aceptar que este tipo de anlisis es anticipado a priori y que se sabe que el resultado ser nico. Sin embargo, al hacer el anlisis a priori, hay que identificar el mayor nmero de resultados posibles y medir, para cada resultado, la probabilidad de que ocurra. Cuando se trabaja con decisiones bajo riesgo es necesario entonces introducir el concepto de probabilidad. Esta idea se utiliza en forma intuitiva y en el lxico corriente. As, por ejemplo, se habla de la probabilidad de que llueva o de que un candidato gane cierta eleccin. Estas son probabilidades subjetivas que, ante escasez de informacin, son vlidas. Deduccin e induccin Al abordar el problema de la probabilidad y hacer anlisis de tipo probabilstico, conviene distinguir entre un proceso deductivo y uno inductivo. Al estudiar la Teora de la probabilidad y los rudimentos de la estadstica, se est utilizando un proceso deductivo, esto es, que se parte de lo general para decir algo de lo particular. Por ejemplo, se conoce un universo de elementos y se desea saber cul es el comportamiento de un grupo reducido de observaciones tomadas de ese universo. En los estudios ms avanzados de la Estadstica se utiliza un mtodo inductivo, esto es, que a partir de la informacin obtenida de unos pocos
3

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

elementos de un universo una muestra se trata de encontrar las caractersticas de todo el universo. Una manera de recordar estas ideas es tener presente que la partcula de en deduccin indica hacia afuera y la partcula in que se encuentra en induccin indica hacia adentro. Esto es que la deduccin va del universo conocido (general) a la muestra desconocida (particular) hacia afuera del universo y la induccin va de la muestra conocida (particular) al universo desconocido (general) hacia adentro del universo. Grficamente:

Universo conocido

Muestra

Proceso deductivo

Universo desconocido

Muestra conocida

Proceso inductivo

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Cuando se utiliza la inferencia estadstica se est trabajando el concepto de induccin, o sea que de unas pocas observaciones se obtienen conclusiones sobre la totalidad del universo. El mejor ejemplo de este trabajo es el que hacen las firmas que realizan encuestas de opinin y las que miden el rating o la sintona de los programas de televisin: A partir de 500 o 1.000 observaciones, hacen afirmaciones sobre el

comportamiento de la totalidad de la poblacin. Probabilidad Supngase un experimento cualquiera, por ejemplo, el nmero dos en el lanzamiento de un dado. El conjunto de todos los resultados posibles se llama universo o espacio de la muestra, en este caso, los nmeros de 1 a 6 en el lanzamiento del dado en cuestin. Usualmente se utiliza el concepto de frecuencia para ilustrar el concepto de probabilidad. Supngase que se estudian n resultados de un experimento, de los cuales m se consideran ocurrencias exitosas de un resultado deseado, E y P(E) denota la probabilidad de ocurrencia de dicho resultado; la relacin entre el nmero de resultados exitosos nmero de resultados posibles n, m y el

es una medida aproximada de la

probabilidad de ese resultado, es decir:


P (E ) = m n

(1)

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Esto es rigurosamente cierto cuando formalmente, se deber escribir as:


P(E ) = lim m n

es muy grande. Ms

(2)

Donde: P(E): Probabilidad que el resultado E ocurra. E: Resultado que interesa analizar. M: Nmero de veces que ocurre E. n: Nmero de veces que se ejecuta el experimento.

Por ejemplo, si se desea saber cul es la probabilidad de ocurrencia de que aparezca el nmero 2 en la cara superior cuando se lanza un dado, se podran hacer lanzamientos seguidos y anotar cuntas veces aparece cada nmero, en particular el 2. Si esto se repite varias veces, entonces la relacin entre el nmero de veces que apareci el 2 y el nmero de lanzamientos ser un estimativo de la probabilidad. Esta frecuencia relativa tiende a un nmero; en el caso de un dado que no est cargado, esta frecuencia tiende a 1/6. Una variable aleatoria est definida por una funcin que asigna un valor de dicha variable aleatoria a cada punto del universo. Por ejemplo, la variable aleatoria puede ser el valor que aparezca en la cara superior del dado, o el cuadrado de este valor, etc. En este ejemplo, E=2, m es el

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

nmero de veces que aparece el nmero 2 y n es el nmero de lanzamientos. Propiedades bsicas de la probabilidad A continuacin se presentan algunas propiedades bsicas de la probabilidad. 1) La probabilidad de un resultado del universo es una cantidad menor o igual que uno y mayor o igual que cero. Esto se explica porque la probabilidad est definida por la proporcin entre un nmero de casos exitosos y el nmero total de casos. El nmero de casos exitosos es menor que el nmero total de casos.

Ejercicio Lanzar una moneda 50 veces. Construir y completar en la hoja de clculo la siguiente tabla de ejemplo:

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

A B 1 Lanzamiento Cara = 1 nmero (n) Sello = 0 2 3 4 5 6 7 8 9 10 11 1 2 3 4 5 6 7 8 9 10 0 1 1 0 1 1 1 0 0 0

C D Frecuencia Frecuencia acumulada relativa de caras (m) de caras (m/n) 0 0,00 1 0,50 2 0,67 2 0,50 3 0,60 4 0,67 5 0,71 5 0,63 5 0,56 5 0,50

Construir una grfica de los resultados con n en las abcisas y m/n en las ordenadas, como se ilustra a continuacin.
FRECUENCIA RELATIVA ACUMULADA DEL LANZAMIENTO DE UNA MONEDA

0,8 0,7 0,6 0,5 m/n 0,4 0,3 0,2 0,1 0 0 2 4 6 n 8 10 12

2) La probabilidad de un resultado que no puede ocurrir, o sea que no pertenece al universo, es cero.

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

3) La probabilidad del universo es uno. Es decir, la probabilidad de que ocurra alguno de los resultados de todo el conjunto posible de ellos es P(E1+E2+...+Em) y es igual a 1, donde (E1,E2,...,Em), son todos los resultados posibles, mutuamente excluyentes y exhaustivos del universo.

Se dice que unos resultados son mutuamente excluyentes cuando la ocurrencia de cualquiera de ellos elimina la ocurrencia de cualquier otro.

Todos los resultados posibles mi suman n, o sea: m1+m2+m3+...mk = n (3)

Si esta ecuacin se divide por n, entonces la suma de las frecuencias relativas es igual a 1. m1/n+m2/n+m3/n+...mk/n = n/n = 1 As pues en el lmite: P(E1)+P(E2)+P(E3)+...P(Ek) = 1 (5) (4)

4) Si E y F son resultados mutuamente excluyentes, o sea que slo uno de ellos puede ocurrir, entonces la probabilidad de que ocurra E o F es P(E+F) = P (E) + P(F). Nuevamente, en el lanzamiento de un dado de seis caras numeradas de 1 a 6, slo un nmero aparecer en la cara superior, por lo tanto, los resultados (E2) y (E6), o sea que aparezca 2 en un caso o que aparezca 6 en el otro, son resultados mutuamente excluyentes. La probabilidad de que ocurra E2 o E6 es de 1/6+1/6 o sea, 1/3.

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

5) Si E y F son resultados independientes, esto es, que la ocurrencia de uno no afecta la ocurrencia del otro, la probabilidad de que ocurran simultneamente P(EF), es P(E) x P(F). Tomando como ejemplo el dado de seis caras, el hecho que en el primer lanzamiento del dado aparezca un 2, no influye para que en el segundo lanzamiento aparezca cierto nmero; los lanzamientos son resultados independientes. Entonces, la probabilidad de que en el primer lanzamiento aparezca un 2 y en el segundo aparezca un 6 ser 1/6x1/6, o sea, 1/36.

Obsrvese

que

cuando

se

trata

de

resultados

mutuamente

excluyentes y se desea saber la probabilidad de que uno de los dos ocurra, se expresa con frases ligadas por o; en el caso de resultados

independientes y si se desea calcular la probabilidad de que ambos ocurran, las frases se ligan con y. Estas propiedades son formales pero coinciden con las nociones intuitivas de probabilidad. Eventos y sus probabilidades En la realidad los hechos no son tan simples como en el ejemplo del dado. Ocurren combinaciones que complican un poco la situacin. El clculo de sus probabilidades es ms complejo.

10

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Eventos y sus probabilidades La realidad es compleja y ocurren combinaciones de resultados; la combinacin de varios resultados origina un evento. A travs de un ejemplo se ilustrar esta idea. Ejemplo Supngase que se desea analizar los resultados de una inversin $1.000 a tres aos. El resultado de cada ao es la ocurrencia de un ingreso por valor de $600 o $0. Los resultados posibles son:

(NNN) = m1 (NNS) = m2 (NSN) = m3 (NSS) = m4 (SNN) = m5 (SSN) = m6 (SNS) = m7 (SSS) = m8 El orden de las letras se refiere ao 1, 2 3 y S indica si hay ingreso y N si no lo hay. (NSS) significa un flujo de caja como este: Ao Flujo de caja 0 -1.000 1 0 2 600 3 600

11

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Y as para los dems casos. Las probabilidades de que el resultado sea cero son:

P(N)1 = ,3 P(N)2 = ,3 P(N)3 = ,3

Se supone que los eventos son independientes entre s. Esto significa que el resultado positivo de un ao no influye en la probabilidad de que, en los aos siguientes, el resultado sea tambin positivo. Esto en la realidad puede que no ocurra. Sin embargo, para efectos del anlisis, se har caso omiso de esta consideracin. Entonces, las probabilidades asociadas a cada resultado combinado son:

1 2 3 4 5 6 7 8 9

A Evento combinado P(N)1 = P(N)2 = P(N)3 = (NNN) = m1 (NNS) = m2 (NSN) = m3 (NSS) = m4 (SNN) = m5

B Probabilidad total 30% 30% 30% =B1*B2*B3 [ 0,027] =B1*B2*(1-B3) [ 0,063] =B1*(1-B2)*B3 [ 0,063] =B1*(1-B2)*(1-B3) [ 0,147] =(1-B1)*B2*B3 [ 0,063] =(1-B1)*(1-B2)*B3 [ 0,147] =(1-B1)*B2*(1-B3) [ 0,147] =(1-B1)*(1-B2)*(1-B3)
12

10 (SSN) = m6 11 (SNS) = m7 12 (SSS) = m8

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

[ 0,343]

Estos resultados se denominarn puntos. Los eventos sern una combinacin cualquiera de puntos. As se puede pensar en el evento, por lo menos un ao con ingreso, el cual incluira los puntos m2, m3, m4, m5, m6, m7 y m8, o en el evento a lo sumo un ao con ingreso cero, el cual incluira los puntos m4, m6, m7 y m8.

Si la probabilidad de que ocurra el ingreso es diferente a 70%, hay que introducir los valores adecuados en los clculos. La probabilidad de estos eventos ser la suma de la probabilidad de los puntos. En el primer evento, la probabilidad ser de: 0,063+0,063+0,147+0,063+0,147+0,147+0,343 = 0,973 en el segundo caso de:

0,147+0,147+0,147+0,343 = 0,784 Diagramas de Venn Los resultados y sus combinaciones en eventos se pueden visualizar en forma grfica; estas grficas se conocen como diagramas de Venn y se introducirn mediante la continuacin del ejemplo anterior.

13

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Ejemplo Si se tienen los resultados m, entonces los eventos por lo menos un ao con ingreso, o a lo sumo un ao sin ingreso, se pueden ilustrar con una grfica o diagrama de Venn.

14

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Evento: por lo menos un m1 m2 m3 m4 m5 m6 m7 m8 ao con ingreso

m1 m2 m3 m4 m5 m6 m7 m8 Evento: mximo un ao sin ingreso

15

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Combinacin de eventos Puede ser que se deseen evaluar combinaciones de eventos en trminos probabilsticos. En ese caso se debe tener cuidado que no haya duplicaciones de puntos en los eventos combinados, puesto que al tener puntos duplicados las probabilidades se podran doblar. Por ejemplo, que ocurrieran los eventos: menos de dos aos con ingreso o el primero sin ingreso seguido por dos aos con ingresos. Para facilitar el anlisis se puede construir una tabla con algunos eventos posibles, as:

Evento A B C D E F G H

Descripcin

Todos sin ingreso. Todos con ingreso. Primero sin ingreso, resto con ingreso. Menos de dos aos con ingreso. Un slo ao con ingreso. Un slo ao sin ingreso. Por lo menos dos aos con ingreso. Por lo menos un ao con ingreso.

Resultados que Probabilidad incluye m1 0,027 m8 0,343 m4 el 0,147 m1,m2,m3,m5 m2,m3,m5 m6,m7 m4,m6,m7,m8 m2,m3,m4,m5,m6 ,m7,m8 0,216 0,189 0,294 0,784 0,973

Completar esta tabla con diez eventos adicionales.

Los eventos mencionados menos de dos aos con ingreso evento D y el primero sin ingreso el resto con ingreso evento C , contienen los
16

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

puntos m1, m2, m3, m5 y m4 respectivamente. Si se desea encontrar la probabilidad que de ocurra uno de los dos, entonces se dice que se halla la probabilidad de los eventos combinados D o C, en notacin matemtica,

P(D C ) . Esta combinacin de eventos contiene los puntos m1, m2, m3,
m4 y m5; su probabilidad es 0,363.

La notacin

( D C)

quiere decir que el nuevo evento contiene los

puntos que se encuentran en D, en C o en ambos. El nuevo evento se lee D unin C. En diagrama de Venn: Evento: menos de dos m1 m2 m3 m4 m5 m6 m7 m8 aos con ingreso (D).

17

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

m1 m2 m3 m4 m5 m6 m7 m8 Evento: ingreso, primero el resto sin con

ingreso (C).

Evento: menos de dos m1 m2 m3 m4 m5 m6 m7 m8 Evento: ingreso, primero el resto sin con aos con ingreso (D).

ingreso (C).

Combinacin de eventos C y D en ( D C)

Si se estipulara que deben ocurrir ambos eventos, o sea que ocurriera el evento menos de dos aos con ingreso evento D y adems ocurriera el evento el primero sin ingreso seguido por dos aos con ingreso evento C, se escribira como

( D C) . La notacin ( D C)
18

indica que

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

el nuevo evento D y C, contiene slo los elementos comunes a ambos. En este caso se ve claramente que no existen esos elementos comunes y se dice que es un conjunto vaco. Esto se puede verificar examinando los resultados mi y el diagrama de Venn.

Por no existir ningn resultado posible comn, su probabilidad es cero. El nuevo evento se lee D interseccin C.

Si se consideraran los eventos D y E, menos de dos aos con ingreso (m1,m2,m3,m5) y un slo ao con ingreso (m2,m3,m5), se tendra lo siguiente:

P( D E ) = P( m1, m2 , m3, m5) = 0,027+0,063+0,063+0,063 = 0,216

19

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

En diagrama de Venn: m1 m2 m3 m4 m5 m6 m7 m8 Evento: un solo ao con ingreso (m2, m3 m4) (E).

20

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

m1 m2 m3 m4 m5 m6 m7 m8

Evento: menos de dos aos con ingreso (m1, m2, m3, m5) (D).

m1 m2 m3 m4 m5 m6 m7 m8

Evento: menos de dos aos con ingreso (m1, m2, m3, m5) (D). Evento: un solo ao con ingreso (m2, m3 m4) (E).

Combinacin de eventos D o E en

(D E )

P( D E ) = P( m2, m3, m5) = 0,063+0,063+0,063 = 0,189

21

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Evento: menos de dos m1 m2 m3 m4 m5 m6 m7 m8 Evento: un solo ao con ingreso (m2, m3 m4) (E). aos con ingreso (m1, m2, m3, m5) (D).

Combinacin de eventos D y E en ( D E ) (sombreado fuerte).

Obsrvese que P( D E ) = P( m1, m2 , m3, m5) no es igual a 0,500+0,375, o sea a la suma de las probabilidades de los dos eventos, D y E. Si se sumaran las dos probabilidades, se estara contando dos veces la probabilidad asociada a los resultados comunes a los dos eventos. En forma matemtica esta precaucin se escribe as: P( D E ) = P( D) + P( E ) P( D E ) (6)

22

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Lo que en la prctica dice esta ecuacin, es que se le elimina una vez la probabilidad asociada a los resultados que estn en ambos eventos. Cuando los eventos -D y E, por ejemplo- son mutuamente excluyentes, entonces s se puede calcular la probabilidad de la unin de ellos como la suma:

P( D E ) = P( D) + P( E )

(7)

Esto es fcil de deducir, ya que cuando dos eventos son excluyentes, la unin de ellos es cero, porque no existen resultados comunes a ambos. Particiones y complementos Cuando un grupo de eventos (coleccin de un cierto nmero de puntos o resultados posibles) es mutuamente excluyente, se dice que no existen resultados posibles comunes entre ellos, es decir que ningn resultado o punto pertenece a ms de un evento. En el ejemplo de la inversin, se tiene que los eventos C, menos de dos aos con ingreso, y D primero sin ingreso y el resto con ingreso, son mutuamente excluyentes; es imposible que esos dos eventos puedan darse al mismo tiempo.

En diagrama de Venn:

23

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

m1 m2 m3 m4 m5 m6 m7 m8

Evento: menos de dos aos con ingreso (m1, m2, m3, m5) (D). Evento: ingreso, primero el resto sin con

ingreso (C).

Combinacin de eventos mutuamente excluyentes, C y D A partir de las posibilidades del ejemplo de la inversin a tres aos, identificar tres eventos mutuamente excluyentes y construir los diagramas de Venn correspondientes, para verificar su resultado. Cuando el conjunto de eventos mutuamente excluyentes es tal que cubre todos los resultados posibles del universo, entonces se les llama particiones. Esto significa que la unin de una coleccin de eventos mutuamente excluyentes y que conforman una particin es la totalidad del universo.

24

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

r1

r2

r3

r6 r5 r4 r7 r8

Particin de un universo Por otro lado, cuando un evento contiene exactamente los puntos o resultados que no estn en otro, y entre los dos se forma una particin, esto es, que entre los dos contienen todos los resultados posibles del universo, se dice que uno es el complemento del otro. Por ejemplo, el evento A todos sin ingreso y el evento H por lo menos un ao con ingreso, son complementarios entre s. Se dice que el evento A es el complemento del evento H. La notacin es la siguiente: A = H ; lo cual quiere decir que H es el complemento de A.. Es fcil concluir lo siguiente:
_

25

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

P ( A) + P A = 1

( )

A
A

Evento A y su complemento A

( )

Probabilidad Condicional y Probabilidad Conjunta Cuando se conoce que un evento ha ocurrido y se desea saber la probabilidad de que ocurra otro, dado que ocurri el primero, se dice que se calcula la probabilidad condicional. O sea que se puede hablar de calcular la probabilidad condicional que ningn ao tenga ingreso, dado que se sabe que en el primero no hubo. Al observar la tabla de los ocho casos posibles, se concluye que al condicionar los eventos al hecho, que el primero no tenga ingreso, en la realidad se recorta el universo y por eso las probabilidades cambian. El nuevo universo, cuando se sabe que en el primer ao no hubo ingresos queda as:

26

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

13 14 15 16 17

A Eventos condicionados a que en el ao no hubo ingresos. (NNN) = m1 (NNS) = m2 (NSN) = m3 (NSS) = m4

Si alguien quisiera apostar al hecho de que en ningn ao hubiera ingresos, tendra dos estimativos de la probabilidad diferentes: Antes de saber sobre el resultado de alguno de los aos y despus de tener alguna informacin sobre el primer ao. Una persona razonable, por ejemplo, le asignar probabilidad cero a los resultados m4, m5, m6 y m7, despus de saber que el primer ao no tuvo ingresos, ya que esos resultados son imposibles, puesto que en ellos el primer ao s tiene ingresos; as las cosas, los eventos posibles son m1, m2, m3 y m4 y de estos cuatro eventos, slo m1 interesa. A 5 (NNN) = m1 6 (NNS) = m2 7 (NSN) = m3 8 (NSS) = m4 9 Total B =B1*B2*B3 [ 0,027] =B1*B2*(1-B3) [ 0,063] =B1*(1-B2)*B3 [ 0,063] =B1*(1-B2)*(1-B3) [ 0,147] 0,30

Como los cuatro resultados tienen una probabilidad total de 0,30 y son los nicos posibles, se concluye que el evento m1 tiene probabilidad 0,09, o

27

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

sea 0,027/0,3. Se deduce fcilmente que la probabilidad ha sido aumentada y que este aumento debe ser proporcional en cada caso; esto es, que la probabilidad inicial de cada resultado debe ser dividida por la probabilidad total de los eventos que quedan al condicionar los eventos.

A B 13 Eventos condicionados a que el Probabilidad condicional que primero no tenga ingresos. ninguno tenga ingreso, dado que el primero no lo tiene. 14 (NNN) = m1 =B5/B18 [0,09] 15 (NNS) = m2 0,21 16 (NSN) = m3 0,21 17 (NSS) = m4 0,49 18 Probabilidad que el primero no =B5+B6+B7+B8 tenga ingresos. [0,300]

La notacin para la probabilidad condicional de un evento A, dado que ocurri otro B, se indica as:

P( A / B ) =

P( A B ) P (B )

(8)

Aqu se observa lo siguiente: El valor 0,027 de la celda B5 es el valor de la probabilidad P(primer ao ceron todos cero) y el denominador es la probabilidad P(primer ao cero), o sea que la probabilidad condicional es:

28

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

P("todoscero" /" primer aocero") =

P(" primer ao cero ""todos cero") P(" primer ao cero")

P("todos cero" /" primer ao cero") =

0,027 = 0,09 0,3

La expresin de la probabilidad condicional puede ser escrita de otra forma -en reversa- y se conoce como la regla multiplicativa, as:

P ( A B ) = P( B ) P( A / B ) Anlisis Bayesiano

(9)

La fortaleza de la teora de la probabilidad es la de reforzar el buen juicio o criterio y la experiencia, nunca los reemplaza. De hecho, ningn mtodo para tomar decisiones puede reemplazar ese criterio y experiencia. Los mtodos para la toma de decisiones se enriquecen con la experiencia del decisor y lo ayudan a tomar mejores decisiones. En los estudios de mercado se puede aplicar muy bien la idea del anlisis bayesiano. Esto consiste en hacer inferencias sobre unas causas, a partir de los efectos conocidos; aqu se aplica la idea presentada arriba de la probabilidad condicional. Se calcula la probabilidad a posteriori, despus de que se ha observado un efecto determinado. En otras palabras, el anlisis bayesiano o estadstica bayesiana se caracteriza por el hecho de revisar o ajustar una probabilidad a priori acerca de un determinado
29

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

parmetro a una probabilidad a posteriori ms confiable, basado en los resultados que ofrece la evidencia de una muestra o estudio adicional. A travs de dos ejemplos se ilustrar la idea del Anlisis Bayesiano, para despus introducir la presentacin de tipo matemtico y formal. Ejemplo En un estudio de mercado se tienen los siguientes clculos del mercado potencial para cierto producto: Mercado objetivo: Amas de casa. 1 2 3 4 5 B C Educacin Trabaja Primaria 30% 40% Secundaria 40% 60% Universitara 25% 90% Postgrado 5% 95% A

Si se hiciera un muestreo de esta poblacin y se escogiera una persona en forma aleatoria y se encuentra que est trabajando, cul es la probabilidad de que esta persona tuviera ttulo de postgrado? Una forma intuitiva de analizar esta situacin es la de estimar qu porcentajes de esas amas de casa trabajan (Efecto (E)) en cada categora de educacin (Causa (C)). En forma grfica se tiene:

30

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

No trabaja

5% 10% 40% 60%

95% 90% 60%

40%

Primaria 30%

Secundaria 40%

Universitaria 25% Postgrado 5%

Se podra esperar que de acuerdo con cada nivel de educacin y desempleo, hubiera entonces el siguiente porcentaje total de gente trabajando:

31

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

1 2 3 4 5 6 7

B C D Educacin Trabaja % Total trabajando Primaria. 30% 40% =B2*C2 [12%] Secundaria. 40% 60% =B3*C3 [24%] Universitaria. 25% 90% =B4*C4 [22,5%] Postgrado. 5% 95% =B5*C5 [4,75%] Total. =D2+D3+D4+D5 [63,25] Probabilidad que entre las =D5/D6 que estn trabajando, esa [7,51%] persona tenga ttulo de Postgrado.

Ejemplo Supngase ahora que se tiene una inversin que tiene un beneficio neto presente (valor presente) de $7 millones si ocurre el evento A1, y de -$3 millones si ocurre el evento A2. Las probabilidades a priori son P(A1) = 0,3 y P(A2) = 0,7. Esto significa que el valor esperado de la inversin es: E(A) = $7x0,3 -$3x0,7 = 0 millones Si no se invierte el valor esperado tambin sera cero. Si se contrata un estudio adicional sobre este proyecto, los resultados sera que si el resultado del estudio fuera B1, entonces esto significara que habra una ganancia A1 de $7 millones, y si el resultado del estudio fuera B2, significara que hay una prdida A2 de $3 millones. Si llegara a resultar A1 $7 millones el estudio resultara en B1 con una probabilidad de 0,8, y

32

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

si llegara a resultar A2 - $3 millones el estudio resultara en B2 con probabilidad 0,6. En resumen se tiene: Con esta informacin se puede mejorar el estimativo inicial que se tena para la probabilidad de A1 y de A2. El anlisis sera el siguiente: Si se espera que A1 ocurra el 30% de los casos y suponiendo que ello ocurriera, slo el 65% de las veces, el estudio indicar que s ocurrir B1; as mismo, si se espera que A2 ocurra el 70% de los casos, el estudio indicar que as ocurrir -B2- el 60% de las veces. En trminos de probabilidad condicional: P(A1) = 0,3 P(A2) = 0,7 P(B1|A1)= 0,65 P(B2|A1) = 1- P(B1|A1) = 1-0,65 = 0,35 P(B2|A2) = 0,6 P(B1|A2) = 1 - P(B2|A2) = 1 0,6 = 0,4 En forma tabular se tiene:
A 1 2 3 4 Estudio B1 Estudio B2 Por resultado, A1 o A2 B A1 65% 35% 30% C A2 40% 60% 70%

Obsrvese que los porcentajes suman 100% en sentido vertical, esto es, que los porcentajes asignados a los resultados del estudio son las probabilidades condicionales de que sus resultados sean B1 o B2, dado que la inversin producir A1 o A2. En cambio, los porcentajes asignados
33

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

por resultado del estudio no son probabilidades condicionales, sino incondicionales, esto es, que no dependen de si el resultado de la inversin es A1 o A2. Si el estudio resulta en B1, cul es la probabilidad de que en la realidad ocurra A1? Grficamente se tiene: A1 30% A2 70%

65% Estudio B1 40%

Estudio B2

35%

60%

A 1 2 3 4 5 Estudio B1 Estudio B2 Por resultado, A1 o A2 Proporcin de veces en que si A1 ocurre, el estudio diga que va a ocurrir A1 (B1) 6 Proporcin de veces en que si A2 ocurre, el estudio diga que va a ocurrir A1 (B1) 7 Proporcin de veces en que el estudio acierta en su prediccin. (Probabilidad de que el resultado sea A1 dado que el resultado del estudio es B1)

B A1 65% 35% 30% =B2*B4 [19,5%] =C2*C4 [28%] =B5/(B5+ B6) [41,05%]

C A2 40% 60% 70%

34

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Obsrvese que antes de obtener la informacin adicional, la probabilidad que se le asign al resultado A1 era 40%, probabilidad a priori; despus de contar con la informacin adicional que el estudio result en B1, esa probabilidad subi a 41,05%, probabilidad a posteriori o revisada. Ahora el valor esperado de esta inversin ser: E(A) = $7x0,4105-$3x(1-0,4105) = 2,8735-1,7685 = 1,1050 Lo que estos ejemplos ilustran es conocido como el Teorema de Bayes. En el primer ejemplo, se cuenta con la siguiente informacin: P(P) = 30%, P(S) = 40%, P(U)= 25% y P(Pos) = 5% proporciones (probabilidades) por tipo de educacin. P(T|P)= 40%, proporcin de amas de casa con primaria que trabaja y P(NT|P)=1-40% = 60%, proporcin de amas de casa con primaria que no trabaja. P(T|S)= 60%, proporcin de amas de casa con secundaria que trabaja y P(NT|S)=1-60% = 40%, proporcin de amas de casa con secundaria que no trabaja. P(T|U)= 25%, proporcin de amas de casa con universitaria que trabaja y P(NT|U)=1-25% = 75%, proporcin de amas de casa con universitaria que no trabaja. P(T|Pos)= 90%, proporcin de amas de casa con postgrado que trabaja y P(NT|P)=1-90% = 10%, proporcin de amas de casa con postgrado que no trabaja.

35

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

La probabilidad de que tenga ttulo de postgrado y de que est trabajando, en trminos de probabilidades condicionales se calcula a continuacin. La probabilidad de que tenga primaria y trabaje:
P ( P T ) = P (P ) P (T / P ) =30%x40%=

12%

La probabilidad de que tenga secundaria y trabaje:


P ( S T ) = P (S ) P (T / S ) =

40%x60% = 24%

La probabilidad de que tenga universitaria y trabaje:


P (U T ) = P (U ) P (T / U )

= 25%x90% = 22.5%

La probabilidad de que tenga postgrado y trabaje:


P ( Pos T ) = P ( Pos) P (T / Pos)

= 5%x95% = 4.75%

Si la persona seleccionada trabaja, podr haber cursado primaria, secundaria, universidad o postgrado y estas posibilidades son excluyentes, por lo tanto, esas probabilidades se pueden sumar y se obtiene la probabilidad, o proporcin de personas trabajando, as:
P (T ) = P (P ) xP(T / P ) + P ( S) xP(T / S ) + P (U) xP(T / U) + P ( Pos) P (T / Pos)

A esta probabilidad se le conoce como probabilidad marginal. Esta es la probabilidad de que est trabajando. Pero de las que estn trabajando slo interesan las que tienen postgrado y, de acuerdo con la probabilidad condicional, se tiene:

36

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

P (Pos | T )= P (Pos | T )=

P (Pos T ) P( ) T P (Pos ) P (T / Pos) P ( P ) xP(T / P ) + P (S ) xP(T / S) + P (U ) xP(T / U ) + P (Pos ) P (T / Pos )

En el ejemplo, usando directamente el Teorema de Bayes:

8 9

A Evento a analizar.

B C Probabilidades bsicas.

D F Probabilidades calculadas Probabilidad del evento (P, S, U, Pos) dado que trabaja =E10/D14 [18,97%] =D11/D14 [37,94%] +D12/D14 [35,57%] +D13/D14 [7,51%]

Probabilidad Probabilidad Probabilidad del evento. de que conjunta P(TnP), P(TnS), trabaje P(TnU) dado P(TnPos) el evento. 10 Primaria =B2 =C2 =B10*C10 [30%] [40%] [12%] 11 Secundaria =B3 =C3 =B11*C11 [40%] [60%] [24%] 12 Universitari =B4 =C4 =B12*C12 a [25%] [90%] [22,5%] 13 Postgrado =B5 =C5 =B13*C13 [5%] [95%] [4,75%] 14 Total. =D10+D11+D12+D13 [63,25%]

Obsrvese cmo las probabilidades o proporciones iniciales de los niveles educativos quedaron revisadas, despus de que se obtuvo la informacin de la persona seleccionada trabaja. Ntese que las probabilidades de la columnas B y C son datos conocidos o estimados y no dependen de la teora de la probabilidad; las probabilidades de las columnas D y E son calculadas, de acuerdo con la teora de la probabilidad. El anlisis bayesiano conduce a revisar las probabilidades asignadas tipo de educacin si se sabe el resultado de la muestra. En el segundo ejemplo, se cuenta con la siguiente informacin:
37

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

P(A1) = 30% y P(A2) = 70% proporciones (probabilidades) por resultados. P(B1|A1)= 65%, proporcin de veces que el estudio dice que va a resultar el evento A1, cuando en realidad va a ser A1. P(B2|A1)=1-65% = 35% proporcin de veces que el estudio se equivoca cuando en realidad el resultado va a ser A1. P(B2|A2)= 60%, proporcin de veces que el estudio dice que va a resultar el evento A2, cuando en realidad va a ser A2. P(B1|A2)=1-60% = 40% proporcin de veces que el estudio se equivoca cuando en realidad el resultado va a ser A2. La probabilidad que la inversin resulte en A1 si el estudio resulta en B1, en trminos de probabilidades condicionales se calcula a continuacin. La probabilidad de que el estudio resulte en B1 y ocurra A1:
P ( A1 B1) = P (A1) xP(B1 / A1 =30% )

65%= 19,5%

La probabilidad de que el estudio resulte en B2 y ocurra A1:


P ( A2 B1) = P (A 2) xP(B1 / A2) =

70%x40% = 28%

Si el estudio indica B1, esto puede ocurrir siendo cierto que ocurra A1 o siendo falso que ocurra A1, sino que ocurra A2 y estas posibilidades son excluyentes, por lo tanto, esas probabilidades se pueden sumar y se obtiene la probabilidad, o proporcin de veces que el estudio dice B1, as:
P ( B1) = P (A1) xP(B1 / A1 + P ( A2 )xP (B1 / A2) )

A esta probabilidad se le conoce como probabilidad marginal.

38

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Esta es la probabilidad de que este estudio resulte en B1. Pero de los resultados B1 slo interesa el que dice la verdad, y de acuerdo con la probabilidad condicional, se tiene:
P ( A1/ B1) = P ( A1/ B1) = P (B1 A1) P ( B1) P ( A1 xP( B1/ A1) ) P ( A1) xP(B 1/ A1) + P (A 2) xP(B1 / A2)

En el ejemplo, usando directamente el Teorema de Bayes:

A B 15 Evento a Probabilidades analizar. 16 Probabilidad del evento.

C bsicas. Probabilidad de que el estudio diga lo correcto dado el evento. =B2 [65%] =C3 [60%]

D F Probabilidades calculadas Probabilidad conjunta P(A1B1) P(A2B1) =B17*C17 [19,5%] =B18*(1-C18) [28%] =D17+D18 [47,5%] Probabilidad del evento (A1 o A2) que el y dado estudio dice B1 =D17/D19 [41,05%] =D18/D19 [58,95%]

17 A1 18 A2 19 Total.

=B4 [30%] =C4 [70%]

Obsrvese cmo las probabilidades o proporciones iniciales de los resultados de la inversin quedaron revisadas, despus de que se obtuvo la informacin de que el estudio dice B1. Ntese que las probabilidades de la columnas B y C son datos conocidos o estimados y no dependen de la teora de la probabilidad; las probabilidades de las columnas D y E son calculadas, de acuerdo con la teora de la probabilidad. El anlisis bayesiano conduce a revisar las probabilidades asignadas a los resultados de la inversin, dependiendo de los resultados del estudio.
39

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Ahora el valor esperado de esta inversin ser: E(A) = $7x0,4105-$3x(1-0,4105) = 2,8735-1,7685 = 1,1050 Ejemplo Supngase ahora que se tiene una urna con balotas blancas y verdes, y que, a su vez, estas tienen rayas y puntos. La distribucin es la siguiente:

A 1 2 3 4 Punteadas. Rayadas. % por color.

B Blancas 30% 80% 40%

C Verdes 70% 20% 60%

Obsrvese que los porcentajes suman 100% en sentido horizontal, esto es, que los porcentajes asignados a las balotas con puntos son las probabilidades condicionales que sean blancas o verdes, dado que la balota tenga puntos y lo mismo para las balotas con rayas. En cambio, los porcentajes asignados por color no son probabilidades condicionales, sino incondicionales, esto es, que no dependen de si son o no balotas con puntos o con rayas. Si se extrae una balota de esta urna, cul es la

probabilidad de que sea blanca, si la balota que ha salido es rayada? Grficamente se tiene:

40

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Blancas

Punteadas
Blancas 40% 3

Rayadas

Verdes 60%

Verde

A 1 2 3 4 5 6 7 Puntos. Rayas. % por color. Probabilidad blanca. Probabilidad verde. Probabilidad blanca.

B Blancas 30% 80% 40% que la rayada que ha salido sea =B3*B4 [32%] que la rayada que ha salido sea =C3*C4 [12%] que la rayada que ha salido sea =B5/(B5+B6) [72,73%]

C Verdes 70% 20% 60%

Obsrvese que antes de obtener la informacin adicional, la probabilidad (la proporcin que haba en la urna) que se le asign a una balota blanca
41

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

era de 40%; despus de contar con la informacin adicional de que la balota seleccionada era rayada, esa probabilidad ascendi a 72,73%. En el tercer ejemplo, las probabilidad de que sea rayada, en trminos de probabilidades condicionales, es: La probabilidad de que sea rayada y blanca: P ( B R ) = P( B ) P( R / B ) La probabilidad de que sea rayada y verde: P(V R ) = P(V ) P( R / V ) La balota ser rayada y blanca o rayada y verde; por lo tanto, esas probabilidades se pueden sumar y se obtiene la probabilidad de que sea rayada, as: P( R ) = P( B ) P( R / B ) + P(V ) P( R / V )

A esta probabilidad se le conoce como probabilidad marginal. Esta es la probabilidad de que sea rayada. De acuerdo con la probabilidad condicional, se tiene:
P ( B| R ) =
P (B | R ) =

( P( B R ) )
P( R )
P (B R ) P (B ) P (R | B ) + P (V ) P (R | V )

P (B | R ) =

P (B ) P (R / B ) P (B ) P (R | B ) + P (V ) P (R |V )

En el ejemplo, usando directamente el Teorema de Bayes:


42

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

A B C Evento a Probabilidades analizar. bsicas. 9 Probabilidad Probabilidad del evento. de rayada dado el evento blanca. 10 Blanca. =B4 =B3 [40%] [80%] 11 Verde. =C4 [60%] 12 Total. =B10+B11 [100%] 8

Probabilidad de rayada dado el evento verde.

Probabilidad conjunta P(BnR) y P(VnR). =B10*C10 [32%] =B11*D11 [12%] =D10+D11 [44%]

Probabilidad del evento dado que es rayada. =E10/E12 [72,73%] =E11/E12 [27,27%]

=C3 [20%]

Ntese que las probabilidades de la columnas B, C y D son datos conocidos o estimados y no dependen de la teora de probabilidad; las probabilidades de las columnas E y F son calculadas, de acuerdo con la teora de la probabilidad.

Independencia Estadstica Se dice que dos eventos son estadsticamente independientes cuando la ocurrencia de uno de ellos no afecta la probabilidad de ocurrencia del otro. Esto ocurre cuando se tienen ciertas combinaciones de probabilidades. Tcnica y formalmente se dice que un evento A es estadsticamente independiente de otro evento B si y slo si, se cumple la siguiente condicin:

43

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

P(A|B)=P(A)

(10)

Esta expresin es muy importante tenerla presente. Cuando se dice de independencia estadstica, se refiere en forma exclusiva a que se cumpla la anterior condicin. No se hace referencia a ninguna otra clase de independencia, por ejemplo, independencia fsica al poder lanzar un dado o una moneda, o independencia lgica de poder hacerlo en forma independiente, etc. Si esta condicin se cumple, entonces cuando dos eventos son estadsticamente independientes, la relacin conocida como regla

multiplicativa queda as:

P ( A B ) = P ( B ) P ( A)

(11)

Se comete un error con frecuencia, al aplicar la regla multiplicativa de eventos estadsticamente independientes, a eventos que no lo son. Hay que ser cuidadoso en su uso. Slo existe independencia estadstica cuando la ocurrencia de un evento, no afecta la probabilidad de ocurrencia del otro.

44

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Ejemplo Si en el ejemplo anterior se tuvieran los siguientes datos: 1 2 3 4 5 B C Blancas Verdes 12% 18% 28% 42% 40% 60% que sea rayada. =B3+C3 [70%] que sea rayada y blanca. =B3 [28%] que la rayada que ha salido, sea =B6/B5 [40%] A

Puntos. Rayas. % por color. Probabilidad

6 Probabilidad 7 Probabilidad blanca.

Es decir, que la probabilidad de que sea blanca a priori-, es 40%, y la probabilidad de que sea blanca, dado que sali rayada es tambin 40%, lo cual indica que con las probabilidades que se asignaron al ejemplo, en este ltimo caso, hay independencia estadstica entre el evento balotas rayada o punteada y balota verde o blanca.

Otra vez, no importa que conceptualmente el ser balota rayada no tiene nada que ver con ser balota blanca, sino que lo importante es que las probabilidades guarden ciertas proporciones entre s, para que se de la independencia estadstica. Se puede pensar en si un evento aporta o no, ms informacin de la que se tena, para considerar la independencia estadstica.

45

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Conceptos bsicos de estadstica


Hay gente que utiliza la Estadstica como un borracho utiliza el poste de la luz; ms para apoyarse que para iluminarse. Andrew Lang (Citado por Thomas y Ronald Wonnacott) Las cifras no mienten, pero los mentirosos s hacen clculos con ellas General Charles H. Grosvenor (Citado por Thomas y Ronald Wonnacott)

La estadstica es un mtodo cientfico de anlisis que se aplica a las ciencias sociales y naturales. Su principal utilizacin es la inferencia estadstica, esto es, que a partir de la informacin obtenida de una muestra -reducido nmero de observaciones de un universo- se hacen inferencias sobre la poblacin total. Este tema no es el objeto de este nivel introductorio y se tratar posteriormente. Estadstica Descriptiva Lo primero que se debe hacer con la informacin obtenida de una muestra, es reducirla a unas cuantas cifras que condensen o concentren la informacin ms importante. Estas cifras se conocen como las estadsticas de la muestra.

Obsrvese la diferencia entre Estadstica, rea del conocimiento que permite hacer inferencia sobre poblaciones, y la estadstica de una muestra, que es una cifra que describe a esa muestra o al universo. Tambin debe distinguirse entre la estadstica de una muestra y el

46

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

parmetro que describe a un universo. Lo que se calcula para una muestra son las estadsticas de la muestra que pueden servir para calcular o hacer una estimacin de los parmetros del universo. Supngase que se ha obtenido una muestra de la audiencia de una cierta poblacin y se indaga sobre hbitos de lectura. Si la muestra que se obtuvo es de 1.000 personas y 345 de ellas responden que no leen, entonces una forma de describir la muestra es diciendo que el 34,5% de ella no lee. Esta cifra puede ser utilizada para hacer una inferencia de la poblacin en cuanto a los hbitos de lectura. Ahora bien, los datos que se obtienen no pueden ser utilizados sin un previo anlisis y sin reserva. Por lo general, cuando se toma una muestra se incurre en algn tipo de error estadstico, el cual tiene que ver con el tamao de la muestra; intuitivamente es obvio que si se tiene un universo muy grande, a mayor informacin que se obtenga -mayor tamao de la muestra- ms cerca de la realidad van a estar las estadsticas de la muestra, comparadas con las estadsticas del universo. Los tcnicos reconocen entonces un margen de error, y se dice que un dato tiene un margen de error. Por ejemplo, los datos de preferencia de votos en una campaa electoral se expresan como que el 65% de la gente votar por el candidato A, con un margen de error de 5%. Esto es, que el verdadero valor se estima que est dentro del intervalo 60%-70% y esta afirmacin

47

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

tiene una determinada probabilidad de que sea cierta; se dice entonces que es un intervalo de P% de confianza (por ejemplo, 95% de confianza). Distribuciones de probabilidad Un universo tiene unas caractersticas estadsticas que, como se dijo arriba, pueden especificarse con unas cuantas cifras. As mismo, los universos tienen dos caractersticas bsicas: son discretos cuando los valores que toman las unidades que lo configuran toman valores finitos, por ejemplo, el nmero de aos en que los ingresos son cero, 0, 1, 2, 3, etc. o son continuos lo cual significa que pueden tomar un infinito nmero de valores, como puede ser el espesor de una lmina de acero o, con mucho rigor, la edad del ser humano. Histogramas y Tablas Una manera de visualizar la informacin de una muestra es tabularla o mostrar la grfica de los valores obtenidos. Caso discreto Suponga que se hace una muestra 6.400 viviendas de un pas. (Esto puede hacerse con facilidad si se tiene acceso a los formularios de un censo de poblacin o de una manera ms compleja, construyendo una muestra aleatoria de las 6.400 viviendas, localizndolas y visitndolas

48

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

para verificar los datos). La muestra indica que en las viviendas el nmero de habitaciones es de 1, 2, 3, 4, 5 6. En el archivo Estadstica.XLS en la hoja DISTRIVI se encuentran los valores de una muestra de 6.400 viviendas en trminos del nmero de habitaciones de cada vivienda. Estos datos estn en el rango A1:J640 y a ellos se hace referencia en la siguiente tabla. Se debe advertir que segn los manuales de Excel, esta funcin no puede manejar ms de 6.400 observaciones; sin embargo, el autor ha trabajado con 10.000 y se han obtenido resultados satisfactorios, excepto en la configuracin de la frmula. Para ilustrar el uso de la funcin se presenta un ejemplo:

Si se tienen los siguientes datos y se desea calcular cuntas veces aparecen viviendas con 1,2,3,4,5 o 6 habitaciones, se debe usar la funcin =FRECUENCIA(Datos;grupos) o en la Barra de Herramientas de Excel, se oprime Herramientas y aparece el men que se muestra a continuacin. All se escoge Anlisis de Datos. Esta opcin se explicar en detalle.

49

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Cuando se hace click con el Mouse en Anlisis de Datos, aparece el siguiente cuadro de dilogo:

All se selecciona Histograma y aparece el cuadro de dilogo siguiente:

50

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Se le debe indicar al programa en qu rango se hallan los datos, dnde insertar los grupos o rango de clases y cul ha de ser el rango de salida. Adems se debe indicar si se desea el porcentaje acumulado, adems del histograma de frecuencias absolutas y si se desea hacer una grfica. Hecho esto, se oprime el botn . Tambin se puede pedir que

construya una curva de Pareto, la cual consiste en ordenar los valores de mayor a menor frecuencia. Todo esto lo hace Excel en forma automtica. Con los datos del archivo Estadstica.XLS, en la hoja DISTRIVI se introdujeron los rangos en el cuadro de dilogo anterior. Los resultados con los datos anteriores son los siguientes:

51

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

En forma tabular: No de cuartos 1 2 3 4 5 6 y mayor... En forma grfica: Frecuencia 970 1.575 1.349 1.136 665 705 0 % acumulado 15,16% 39,77% 60,84% 78,59% 88,98% 100,00% 100,00%

Distribucin de las viviendas por nmero de cuartos


1.800 1.600 1.400 1.200 1.000 800 600 400 200 0
1 2 3 4 5 6 ym ay or ...

120% 100% 80% 60% 40% 20% 0% Frecuencia % acumulado

Frecuencia

No de cuartos

Cuando se usa la funcin frecuencia, el procedimiento es ms complicado y menos espectacular. En la barra de herramientas se encuentra el botn del Asistente de Funciones, el siguiente cuadro de dilogo:
52

al oprimirlo aparece

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

En este cuadro ya se seal las funciones Estadsticas y dentro de ellas se escogi Frecuencia. Cuando ya ha sido seleccionada la funcin que interesa, se oprime el botn y aparece este cuadro de dilogo:

53

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

En la casilla

se introduce el rango

donde se encuentran los datos; en el ejemplo, A1:T10. En la casilla se introduce el rango de los grupos en que se desea clasificar los datos; en el ejemplo, M3:M8. Al oprimir el botn aparece el resultado en la celda O3; a partir de esa celda

se debe sealar el rango O3:O8, inmediatamente, estando sobre la celda O3, se oprime F2 y simultneamente las teclas

CTRL+MAYUSCULAS+ENTRAR (en Windows) y COMANDO+ENTRAR (en Macintosh). As se convierte la funcin (frmula) FRECUENCIA, en una matriz y se obtiene el valor de la frecuencia de ocurrencia para cada grupo.

M N O 1 Nmero de Frecuencia absoluta acumulada. Frecuencia habitaciones. relativa. 2 3 1 {=FRECUENCIA(A1:J640;M3:M8)} =N3/$N$9 [937] [14,64%] 4 2 {=FRECUENCIA(A1:J640;M3:M8)} =N4/$N$9 [1,603] [25,05%] 5 3 {=FRECUENCIA(A1:J640;M3:M8)} =N5/$N$9 [1,363] [21,30%] 6 4 {=FRECUENCIA(A1:J640;M3:M8)} =N6/$N$9 [1,109] [17,33%] 7 5 {=FRECUENCIA(A1:J640;M3:M8)} =N7/$N$9 [650] [10,16%] 8 6 {=FRECUENCIA(A1:J640;M3:M8)} =N8/$N$9 [738] [11,53%] 9 TOTAL =SUMA(N3:N8) =SUMA(O3:O8) [6,400] [100,00%]

54

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Los valores obtenidos se pueden mostrar en una grfica que se llama histograma de frecuencia.

30,00% 25,00% 20,00%


%de viviendas

15,00% 10,00% 5,00% 0,00% 1 2 3 4 5 6

Nmero de habitaciones

En el archivo Estadstica.XLS en la hoja DISTRIVI construir la tabla y grfica anteriores. Caso continuo Nuevamente, si se toman los datos de un censo de poblacin y se obtiene una muestra de 2.000 personas, las edades se clasifican en intervalos y no en valores puntuales. Estrictamente, la edad de una persona se comporta como una variable continua, a pesar de que en la prctica la gente redondea su edad en nmeros enteros y casi nunca, o nunca, se dice que alguien tiene 22 aos, 3 meses, 27 das, 4 horas, etc. Tambin en la prctica nadie tiene la misma y exacta edad de otra persona. Por consiguiente carece de sentido hablar de valores concretos, antes bien, se habla de rangos de edad. Ms aun, en el caso de las edades, se

55

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

acostumbra a definir los rangos con extremos enteros, por ejemplo, se habla del grupo de edad de 0-4 aos o de 5-9 aos. La muestra indica que las personas tienen edades entre 0 y 100 aos (en la prctica, aunque se puede exceder esa cifra). La muestra se puede clasificar de acuerdo con los grupos de edad quinquenales (cinco aos) y su tabulacin se puede presentar as:

Grupos de Edad (aos) 0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89 90-94 95-99 100-104 105-109 Total

Frecuencia Frecuencia absoluta relativa 243 12,15% 251 24,70% 226 36,00% 231 47,55% 215 58,30% 176 67,10% 140 74,10% 121 80,15% 86 84,45% 75 88,20% 70 91,70% 60 94,70% 40 96,70% 35 98,45% 12 99,05% 9 99,50% 7 99,85% 1 99,90% 1 99,95% 0 99,95% 0 99,95% 1 100,00% 0 100,00%

56

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Siempre surge la pregunta de: cuntos intervalos se deben construir? La respuesta es que esto depende de los datos que se deseen analizar y no deben ser, ni muchos, ni pocos. Se puede considerar que entre 5 y 15 intervalos sera razonable. En cuanto al punto medio de cada intervalo, es preferible considerar un nmero entero. Si se analizan las edades de la muestra y de la poblacin de manera estricta, se tendra un patrn de muchos valores continuos con una concentracin en los primeros 40 aos, que se ira reduciendo a medida que se aumenta la edad. El histograma de frecuencias de las edades sera as, considerando el valor central de cada intervalo como el valor del mismo:

57

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

14,00% 12,00% 10,00% 8,00%


Frecuencia

6,00% 4,00% 2,00% 0,00%


2 7 12 17 22 27 32 37 42 47 52 57 62 67 72 77 82 87 92 97 102 107

Edades

En el archivo Estadstica.XLS y en la hoja DISTRIED construir la tabla y grfica anteriores. Mostrar tambin la grfica de la frecuencia relativa. Estadsticas de una distribucin Arriba se mencion que la distribucin de un universo se poda representar por las estadsticas de la muestra o del universo. Las estadsticas ms comunes son aquellas que muestran la tendencia central o valor alrededor del cual se agrupan los elementos del universo y el grado de dispersin. Estas dos ideas se ilustrarn con el caso discreto de las habitaciones de las viviendas de la muestra seleccionada.

58

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Tendencia central de la distribucin Con esta estadstica se trata de examinar hacia qu valor se concentran los valores de la distribucin. Las estadsticas ms conocidas que miden la tendencia central son: La moda, la mediana y la media o valor esperado. La moda La moda se define como el valor ms frecuente. Esto es, aquel valor que tiene mayor frecuencia. Debido a que los datos pueden agruparse de manera arbitraria en el caso de la distribucin continua la moda no es la mejor medida de tendencia central. Tambin puede suceder que haya dos modas iguales, en ese caso se dice que la distribucin es bimodal y se presenta una ambigedad. La forma ms fcil de determinar la moda es utilizando el histograma de frecuencias. Por medio del histograma de frecuencias de los ejemplos anteriores, identificar la moda. Excel tiene la frmula para ello, =MODA(Datos) pero est restringida a un nmero reducido de observaciones; para 400 observaciones calcula el valor, para 10.000 arroja error. La mediana La mediana es aquel valor que divide la distribucin en partes iguales, o sea que el nmero de observaciones por encima de la mediana es igual al nmero de observaciones por debajo de ella. Se conoce tambin como el valor medio o percentile 50.
59

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Con los datos de los ejemplos anteriores debe usted identificar la mediana. Excel tiene la frmula para ello, =MEDIANA(Datos). La media o valor esperado El valor esperado o media indica la tendencia central de los datos. Esto significa que es el valor alrededor del cual tienden a agruparse los datos de una distribucin. En el caso de una variable aleatoria discreta, se calcula multiplicando cada valor posible por su probabilidad y sumando sus resultados. En el caso de una variable aleatoria continua, se debe recurrir al concepto de integral que se estudia en el clculo integral. Generalmente se expresa por medio de la letra griega (parmetro) para el universo y por la notacin E( ) o X (estadstica) para una muestra.

Con los datos de los ejemplos anteriores calcular la media. En Excel la frmula es =PROMEDIO(Datos).

Medidas de la dispersin de la distribucin Las estadsticas que describen a una muestra o universo muestran qu tan dispersas estn las observaciones o los elementos del universo. Las ms comunes son la varianza, la desviacin estndar (es la raz cuadrada de la varianza) y el rango. Intuitivamente se puede pensar en medir las

60

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

diferencias entre cada observacin y el valor central, por ejemplo, el valor esperado o media. Eso va a producir valores negativos y positivos y al sumarse entre s deben cancelarse y producir el valor cero. Se puede obviar este inconveniente trabajando con el valor absoluto, en Excel, =DESVPROM(Datos) o con los cuadrados de las diferencias en Excel, =DESVIA2(Datos). Cuando se desea medir las variaciones entre dos o ms variables, entre s, entonces se habla de la covarianza. Varianza Una medida de la dispersin de unos datos es la varianza. Esta se calcula as:

2 =

(X
n i =1

(12)

O sea que es el promedio del cuadrado de las diferencias de cada dato con el promedio. Esta expresin se aplica para la distribucin y la muestra; cuando se refiere a la poblacin o universo, se utiliza la letra griega sigma 2 (parmetro) y s2 (estadstica), cuando se trata de la muestra. Sin embargo, cuando se trata de estimar la varianza de un universo o distribucin a partir de la varianza de una muestra de tamao n, entonces la frmula debe modificarse as:

2 =

(X
n i =1

n 1

(13)

61

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Con los datos de los ejemplos anteriores calcular la varianza de los datos obtenidos y de la distribucin o universo de donde procedieron esos datos. En Excel la frmula es =VAR(Datos) cuando se trata de medir la varianza de la muestra, y =VARP(Datos), cuando se trata, a partir de la muestra, calcular la varianza del universo. Desviacin estndar La desviacin estndar ( ) es la raz cuadrada de la varianza. Se puede demostrar que si X1, X2, X3....Xn son variables aleatorias independientes con media i y desviacin estndar i, entonces la suma de esas variables tendrn una distribucin normal con media i y desviacin estndar nx i2. Con los datos de los ejemplos anteriores, calcular la desviacin estndar de los datos obtenidos y de la distribucin o universo de donde procedieron esos datos. En Excel la frmula es =DESVEST(Datos), cuando se trata de medir la desviacin estndar de la muestra (con esta funcin se hace una estimacin del parmetrto del universo), y =DESVESTP(Datos), cuando se trata de calcular la desviacin estndar del universo, a partir de la totalidad de los datos de ese universo. (DESVEST parte de la hiptesis de que los argumentos representan la muestra de una poblacin. Si sus datos representan la poblacin total, utilice DESVESTP para calcular la desviacin estndar).

62

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Rango Otra manera de estimar la dispersin de unos datos es medir su rango. Esta es la diferencia entre el valor mximo y el valor mnimo. Con los datos de los ejemplos anteriores calcular el rango de los datos obtenidos. En Excel la frmula para el valor mximo es =MAX(Datos) y para el valor mnimo es =MIN(Datos). Covarianza La covarianza indica en qu medida dos variables se mueven al unsono. Si se observa el comportamiento de la rentabilidad de las acciones en la Bolsa, se encontrar que algunas de ellas aumentan al mismo tiempo y otras disminuyen mientras las otras aumentan. El clculo de la covarianza relaciona las diferencias entre las variables y sus medias, unas con otras, as:

=
2 ij

(X
n n i =1 j =1

Xi X j X j n

)(

)
(14)

ij = Pij (X i E ( X i ) )(X j E ( X j ) )
n n i =1 j =1

(15)

Tambin se puede expresar como:


ij = rij i j

(16)

El resultado del clculo de la covarianza es una tabla como la siguiente:

63

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

11 21 ... ... n1 12 22 ... ... ... ... ... ... ... ... ... ... ... ... nn1 1n ... ... n1n nn

(17)

Hay que observar que los datos de la diagonal son las varianzas de cada variable. Las dems son las covarianzas y son simtricas. Por ejemplo, si se desea saber cmo varan cuatro acciones de la Bolsa de Bogot, se tiene:

Mes CADENALCO ARGOS CONSTRUCEL PAZ DEL RIO 1 15,75% 16,63% 14,87% -3,91% 2 -0,47% -0,36% 9,42% -19,33% 3 -13,65% -7,77% -1,68% -36,61% 4 -17,00% -8,77% -14,81% -21,58% 5 18,87% 1,51% -25,58% 0,04% 6 11,78% 1,50% 8,57% -25,22% 7 9,00% 6,90% 11,42% -30,23% 8 -8,61% -6,54% -10,32% 0,00% 9 -5,31% -3,57% 1,71% 7,22% 10 -16,73% -11,06% 0,00% -2,25% 11 -13,21% -11,33% -1,88% 8,52% 12 12,65% 7,72% -28,44% 4,22%

64

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Relacin entre la rentabilidad de 4 acciones


30% 20%

Rentabilidad

10% 0% -10% -20% -30% -40% 0 2 4 6 t 8 10 12 14

CADENALCO ARGOS CONSTRUCEL PAZ DEL RIO

La covarianza se puede calcular en Excel con la opcin de men Herramientas y all se selecciona Anlisis de datos. En el cuadro de dilogo que aparece, se escoge Covarianza y se indica el rango donde estn los datos para los cuales se desea calcular la covarianza. La matriz de covarianza de las rentabilidades de las cuatro acciones es:

CADENALCO ARGOS CONSTRUCEL PAZ DEL RIO

CADENALCO 0,0182927 0,01022173 -0,00046223 0,00106384

ARGOS CONSTRUCEL PAZ DEL RIO 0,01022173 -0,00046223 0,00106384 0,00738926 0,00233332 -0,00041683 0,00233332 0,01999673 -0,00041683 -0,00041683 -0,00827034 0,02463414

La covarianza de Argos y Argos es su varianza; en forma similar, la covarianza entre Cadenalco y Cadenalco es su varianza. La covarianza de

65

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Construcel y Construcel es su varianza; en forma similar, la covarianza entre Paz del Ro y Paz del Ro es su varianza. En estas grficas se observa que mientras dos de las acciones tienden a seguir el mismo comportamiento (suben o bajan ambas) las otras dos se comportan de manera contraria (mientras una sube, la otra baja). La medida del grado de coincidencia en el comportamiento est dada por la covarianza entre ellas. Si se mezclan las cuatro acciones en partes iguales (si se construye un portafolio de las cuatro acciones por partes iguales), grficamente se tiene lo siguiente:

Relacin entre la rentabilidad de 4 acciones


30% 20%

Rentabilidad

10% 0% -10% -20% -30% -40% 0 2 4 6 t 8 10 12 14

CADENALCO ARGOS CONSTRUCEL PAZ DEL RIO Portafolio

Y los resultados de la media y la desviacin estndar son los siguientes:

66

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

PROMEDIO DESVEST

CADENALCO ARGOS CONSTRUCEL PAZ DEL RIO PORTAFOLIO -0,58% -1,26% -3,06% -9,93% -3,71% 12,95% 8,23% 13,54% 15,03% 6,74%

Obsrvese cmo se redujo la desviacin estndar (la variabilidad del portafolio), debido a la combinacin de cuatro variables (rentabilidad) y a la inclusin de acciones con covarianzas negativas. Correlacin El dato que proporciona la covarianza no es fcil de interpretar cuando se expresa en las unidades de las variables analizadas; se necesita un indicador que sea independiente de las unidades de las variables analizadas; para evitar este problema, se puede encontrar la correlacin o ndice de correlacin entre dos variables, escalndolo o normalizndolo con las desviaciones estndar, as:
rij = ij i j

(18)

Esta expresin se conoce como coeficiente de y est entre -1 y 1. Sirve para medir el grado de asociacin entre dos variables u observaciones. En el ejemplo de las acciones se tiene, para Construcel y Paz del Ro, desviaciones estndar:

67

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

CADENALCO ARGOS CONSTRUCEL PAZ DEL RIO

ARGOS CONSTRUCEL PAZ DEL RIO CADENALCO 0,0182927 0,01022173 -0,00046223 0,00106384 0,01022173 0,00738926 0,00233332 -0,00041683 -0,00046223 0,00233332 0,01999673 -0,00827034 0,00106384 - -0,00827034 0,02463414 0,00041683 CONSTRUCEL PAZ DEL RIO 0,01999673 0,02463414 0,14140981 0,15695266

Varianza Desviacin estndar

(c, p ) =

- 0,00827034 = -0,37262751 0,14140981 0.15695266

Este valor indica que estn correlacionadas negativamente; o sea, cuando la rentabilidad de una accin aumenta, la rentabilidad de la otra tiende a bajar. Variable aleatoria Una variable aleatoria es el valor que se le asigna a un determinado evento. Por ejemplo, en el ejemplo de la inversin a tres aos, se le puede asignar un valor monetario a cada evento y un Valor Presente Neto (VPN) a la inversin; el VPN es una variable aleatoria. Si se retoma el ejemplo de la inversin a tres aos, se haban previsto ciertos resultados y si se supone que cada ao sin ingreso se le asocia el valor cero y cada ao con ingreso se le asocia el valor $600, al ao sin ingreso se le asocia una probabilidad de 30% y se tiene una tasa de descuento de 20% anual, entonces se tiene lo siguiente:

68

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

1 2 3 4 5 6 7 8 9 10 11 12 13 14

A P(N)1= P(N)2= P(N)3= Valor de un ao con ingreso. Valor de un ao sin ingreso. Evento combinado. (NNN) = m1 (NNS) = m2 (NSN) = m3 (NSS) = m4 (SNN) = m5 (SSN) = m6 (SNS) = m7 (SSS) = m8

C 30% Inversin 30% $1,000 30% Tasa de descuento anual. $600 20% $0 Probabilidad total. Variable aleatoria (VPN). =B1*B2*B3 -1,000 [ 0,027] =B1*B2*(1-B3) =B4/(1+C4) ^3-C2 [ 0,063] [-537,04] =B1*(1-B2)*B3 =B4/(1+C4) ^2-C2 [ 0,063] [-444,44] =B4/(1+C4) ^2+B4/(1+C4) =B1*(1-B2)*(1-B3) [ 0,147] ^3-C2 [18,52] -333,33 =(1-B1)*B2*B3 [ 0,063] =(1-B1)*(1-B2)*B3 222,22 [ 0,147] =(1-B1)*B2*(1-B3) 129,63 [ 0,147] =(1-B1)*(1-B2)*(1-B3) 685,19 [ 0,343]

La distribucin de la variable aleatoria ser:

13 14 15 16 17 18 19 20 21 22

A Variable aleatoria (VPN) -1.000,00 -537,04 -444,44 -333,33 18,52 129,63 222,22 685,19 Total

B Probabilidad 2,7% 6,3% 6,3% 6,3% 14,7% 14,7% 14,7% 34,3% 100,0%

Con los datos de la tabla anterior construir el histograma que aparece a continuacin.

69

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Las variables aleatorias se representarn por X y los valores especficos por x. En el ejemplo X es el Valor Presente Neto (VPN) de la inversin a tres aos. Se dice entonces que esta variable aleatoria X toma los siguientes valores: X1= X2= X3= X4= X5= X6= X7= X8= -1.000,00 -537,04 -444,44 -333,,33 18,,52 129,63 222,22 685,19

En general, se escribira X=x. La probabilidad se escribira P(X=222,22), P(X=685,19), etc. Asociada a toda variable aleatoria existe una funcin de distribucin acumulada. Si se define el evento: variable aleatoria X menor o igual que b, como E = (X< b), entonces P(E) es la probabilidad de este evento y se
70

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

denomina probabilidad acumulada de b, F(b). La funcin acumulada de probabilidad es una funcin numrica definida para todos los valores posibles de b y tiene las siguientes propiedades: F(b) es una funcin no decreciente de b. Esto es, que a medida que b aumenta, F(b) aumenta o permanece igual y nunca disminuye. La variable aleatoria puede tomar valores entre menos infinito (-) y ms infinito (+). Por lo tanto: F( - ) = 0 y F( ) = 1 (19)

De acuerdo con estas definiciones y propiedades, se puede establecer el valor de la probabilidad que una variable aleatoria se encuentre entre dos valores dados como: P (a <X <b) = F(b) - F(a) (20)

Esto significa que cuando se tiene una variable continua, la probabilidad de un valor preciso es cero.

71

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

La distribucin de probabilidad discreta Una distribucin de probabilidad es discreta cuando para cada valor existe una probabilidad de ocurrencia. Ejemplos de fenmenos que se clasifican como discretos, son el valor del lanzamiento de un dado, de una moneda, el nmero de hijos de una pareja, etc. En trminos generales, la distribucin acumulada de esta clase de leyes probabilsticas est dada por:
F (b) = P ( x b) =

i =

P( x = x )
i

para todas las xi b

(21)

Esto significa que la probabilidad de que ocurra un valor menor o igual a b, es igual a la suma de todas las probabilidades de los valores de X menores que b. Por ejemplo, la probabilidad de que el resultado del lanzamiento de un dado de seis caras sea menor o igual que 3 es igual a la suma de las probabilidades de que el valor del lanzamiento sea 1, 2 3. Por otro lado, la media y la varianza se calculan as: Media de la poblacin: = xp( x )
x

(22)
2

Varianza de la poblacin: 2 = ( x ) p( x )
x

(23)

La Distribucin Binomial Existen muchas leyes de probabilidad discretas; la ms comn es la binomial. Esta distribucin se utiliza en situaciones con un nmero fijo de pruebas o ensayos, cuando los resultados de un ensayo son slo xito o
72

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

fracaso, cuando los ensayos son independientes y cuando la probabilidad de xito es constante durante todo el experimento. Por ejemplo, se puede calcular la probabilidad que dos de los prximos tres bebs que nazcan de un pareja sean hombres. A continuacin se muestran algunos fenmenos regidos por la distribucin binomial:

Fenmeno Lanzar moneda. Nacimientos una familia.

xito una Cara. en Nio.

Fracaso Sello. Nia.

p (probabilidad n (casos de xito) totales) 0,50 n lanzamientos. 0,50 Tamao de la familia. n lanzamientos.

r (xitos) Nmero de caras. Nmero de nios en la familia. Nmero de 8s. Perodos con ingresos. Nmero de terneras. Nmero de liberales en la muestra. Nmero de 1s. Aprobacin de la ley.

Lanzamiento de 3 8 dados. puntos. Resultado inversiones. de Ingreso.

21/216 Cualquier otro resultado. No ingreso. Asignada segn el caso.

Nacimientos de terneros. Escogencia de un votante en una encuesta de opinin poltica. Lanzamiento de un dado. Aprobacin de leyes en el Congreso.

Ternera. Liberal.

Ternero. Otros partidos.

Perodos futuros en que pueden ocurrir los ingresos. 0,50 Nmero de partos. Proporcin de Tamao de la Liberales en la muestra. poblacin. n lanzamientos. Nmero de congresistas.

1 punto. Cualquier 1/36 otro valor. Aprobad Rechazada Proporcin de a. . congresistas a favor de la ley.

La distribucin binomial tpica es el lanzamiento de una moneda: S = nmero de caras en n lanzamientos.

73

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Se dice que son n lanzamientos independientes y para cada lanzamiento hay un xito (cara) o un fracaso (sello) y las probabilidades son p para cara y (1-p) para sello. Si se tiene 1 dado, la distribucin binomial que rige este fenmeno se puede deducir examinando el caso mencionado de obtener cierto nmero de 1s en n lanzamientos. Si se estipula que sean tres 1s en 6 lanzamientos, los casos posibles en que aparecen tres 1s son:

AAAFFF AAFAFF AAFFAF AAFFFA AFAAFF

AFAFAF AFAFFA AFFAAF AFFAFA AFFFAA

FAAAFF FAAFAF FAAFFA FAFAAF FAFAFA

FAFFAA FFAAAF FFAAFA FFAFAA FFFAAA

El resultado acertado (1) se indicar con la letra A y no acertado (diferente a 1) se indicar con la letra F. La probabilidad de cualquier evento, por ejemplo AFFAFA, es: px(1-p)x(1-p)xpx(1-p)xp Esta probabilidad es igual para cualquiera de los eventos sealados, pues slo cambia el orden. Como estos eventos son excluyentes, entonces la probabilidad de obtener tres 1s en seis lanzamientos es la suma de cada una de esas probabilidades. O sea: 20x(1/6)3(1-1/6)3 = 20x(1/216)x(125/216) = 2,500/46,656 = 0,05358

74

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

En general para calcular el nmero de r casos exitosos de n intentos, en cualquier orden, se tiene:

Crn =

n! r!(n r )!

(24)

n se define como n factorial y es igual a 1x2x3x4...x(n-1)xn y el caso especial de 0 es igual a 1.

En

Excel

=DISTR.BINOM(num_xitos

(r);intentos

(n);prob

de

xito

(p);acumulado). En el argumento acumulado, falso=valor de la densidad de probabilidad verdadero= valor acumulado de la probabilidad. En el ejemplo, obtener tres unos en seis lanzamientos del dado:

A 19 p= 20 n= 21 r= 22 P=

B =1/6 [ 0,1667] 6 3 =DISTR.BINOM(B21;B20;B19 FALSO) [0,05358368]

Si se analizan todos los casos posibles, se tiene:

75

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

A B C D E 22 n r p ACUMULADO = VERDADERO ACUMULADO = FALSO 23 6 6 0.1667 =DISTR.BINOM(A23;B23;B23; =DISTR.BINOM(A23;B23;B23 VERDADERO) FALSO) 1 [2,1433E-05] 24 6 5 0.1667 =DISTR.BINOM(A24;B24;B24; =DISTR.BINOM(A24;B24;B24 VERDADERO) FALSO) [0,99997857] [0,000643] 25 6 4 0.1667 [0,99933556] 0,00803755 26 6 3 0.1667 0,99129801 0,05358368 27 6 2 0.1667 0,93771433 0,20093879 28 6 1 0.1667 0,73677555 0,40187757 29 6 0 0.1667 0,33489798 0,33489798 30 TOTAL 1
DISTRIBUCION BINOMIAL (NUMERO DE 1'S OBTENIDOS EN 6 LANZAMIENTOS DE UN DADO)

0,45 0,4 0,35 0,3 0,25 PROB. 0,2 0,15 0,1 0,05 0

NUMERO DE 1'S

Construir en la hoja de clculo la tabla y la grfica anteriores.

La distribucin binomial tiene los siguientes parmetros: Media = p Varianza = pq = p(1-p)

76

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

La distribucin de probabilidad continua Cuando la variable que se est analizando puede tomar cualquier valor entre - y de una manera continua, esto es, que se admite cualquier valor, entero o no dentro de esos lmites, entonces se dice que es una variable continua. A diferencia de la distribucin discreta, donde cada valor tiene asociada una probabilidad, en este caso cada valor tiene asociado un valor que se llama funcin de densidad de probabilidad. Esta funcin de densidad de probabilidad no es un histograma de frecuencia, sino de una curva. La probabilidad se le asigna a un rango de valores y se mide en trminos de la proporcin del rea bajo la curva entre esos dos valores y el rea total. La distribucin acumulada es en este caso:
F (b) = P( x b) =

P( x)dx

(25)

La media y la varianza sern: Media de la poblacin, = (26) Varianza de la poblacin, 2 =


+
+

xp( x)dx

( x ) p( x)dx
2

(27)

77

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

La Distribucin de Probabilidad Normal Tambin existen muchas leyes de probabilidad continuas; la ms conocida y frecuente es la que se conoce como distribucin normal o de Gauss. Esta ley de probabilidad rige muchos fenmenos de la naturaleza. Esta distribucin de probabilidad (funcin de densidad de probabilidad) se expresa as:
1 x 2
2

P ( x) =

(28)

Donde: x = Variable aleatoria con distribucin normal. e = Base de los logaritmos naturales, 2.71828183.
= Nmero pi 3.141516....
= Media de la distribucin.

= Desviacin estndar de la distribucin.

Esta distribucin tiene unas caractersticas que la hacen muy especial: La moda, la media y la mediana son iguales. Es simtrica alrededor de la media. La curva tiene dos puntos de inflexin en la media una desviacin estndar. Es asinttica en cero alejndose de media. El rea bajo la curva es igual a 1.

78

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Distribucin Normal
0.06 0.05 0.04 0.03 0.02 0.01 0 139.52 143.33 147.14 150.95 154.76 158.57 162.38 166.19 173.81 177.62 181.43 185.24 189.05 192.86 196.67 200.48 170 %

Altura de varones en cms

Hay un caso especial que consiste en estandarizar la distribucin normal; esto consiste en cambiar el origen de la distribucin y suponer que la media es cero y que la desviacin estndar es 1. Para lograr esto se hace la siguiente transformacin:
Z= x

(29)

Z es la variable normal estandarizada. Esto es muy utilizado cuando no se usan hojas de clculo. Con la normal estandarizada es como se calculan las tablas de la distribucin normal acumulada. Cuando se trabaja con distribuciones continuas se manejan reas, ya que se supone que cualquier valor puede ocurrir y que entonces los intervalos son infinitesimales. Sin embargo, para hablar de probabilidad se

79

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

debe referir a un intervalo y, como se estudi en las caractersticas de una variable aleatoria, la probabilidad entre - y es igual a 1. Como se dijo tambin arriba, cuando se trata de distribuciones continuas, la

probabilidad debe calcularse como el rea bajo la curva entre dos valores. El rea bajo la curva entre - y es 1. Todo esto significa que la probabilidad de un valor exacto, por ejemplo la probabilidad de que una persona tenga 32 aos, 7 meses, 4 das, 3 horas, 3 minutos 22 segundos (inclusive se puede llegar a expresar esto de manera infinetisimal) es cero, puesto que el rea entre dos valores iguales (esto es, el mismo valor) es cero. Muchos fenmenos de la naturaleza pueden ser descritos por la distribucin normal o de Gauss. Inclusive, algunos fenmenos que no siguen esta ley de probabilidad pueden ser analizados suponiendo que siguen esa distribucin, y los resultados, en trminos prcticos son bastantes aceptables. La distribucin normal tiene ciertas caractersticas que sirven para hacer ms fcil su manejo; una de ellas es la simetra ya mencionada y que el rea debajo de la curva es proporcional, independientemente del fenmeno que se est analizando y de los valores de sus parmetros (valor esperado o media y desviacin estndar) a la probabilidad de los valores que la limitan a cada lado.

80

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Esto significa que si se tiene informacin sobre el rea bajo la curva normal con parmetros
= 0 y = 1 esta informacin se puede utilizar

para otra distribucin normal con parmetros diferentes, si se hacen ciertas transformaciones. Ahora bien, esta transformacin era vlida cuando era necesario recurrir a tablas por la dificultad del clculo. Hoy, las hojas electrnicas como Excel, por ejemplo, traen funciones que no slo manejan la distribucin estandarizada con parmetros = 0 y = 1 -la funcin es =DISTR.NORM.ESTAND(z)- sino que tiene funciones que manejan directamente el valor de la probabilidad deseada, incluyendo los parmetros de la distribucin que se estudia. Para este caso, tambin se utiliza el Asistente de Funciones y se aplica la funcin Si se

=DISTR.NORM(Valor que interesa x;media;desv.estndar;acum).

escribe Acumulado en acum, entonces arroja el valor acumulado entre -

? y el valor que interesa, x; si no se escribe Acumulado, arroja el valor de


e
1 x 2
2

la densidad de probabilidad, o sea el valor de la funcin P ( x ) =

Ejemplo Si se tiene una distribucin normal con = 10 y = 3 y se desea calcular la probabilidad que la variable en cuestin tome un valor mayor que 16. Ahora bien, como se desea saber la probabilidad de que la variable sea mayor que 16 y lo que arroja la funcin es la probabilidad de que sea menor que 16, entonces se debe restar esta ltima de 1.

81

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

A 1 Valor x. 2 Media. 3 Desviacin estndar. 4 Probabilidad de que x sea menor que 16. 5 Probabilidad de que x sea mayor que 16.

B 16 10 3 =DISTR.NORM(B1;B2;B3;VERDADERO) [97,72%] =1-B4 [2,28%]

Si se estandariza, esto es que la media se convierte en 0 y la desviacin estndar en 1:


z= 16 10 =2 3

Esto es, se supone que la media se traslada a 0 y se calcula cuntas veces est = 3 en el intervalo entre 10 y 16. Esta transformacin equivale a trabajar con una distribucin normal con parmetros = 0 y = 1, y se debe calcular la probabilidad de que z sea mayor que 2. Si la probabilidad de que sea menor que 2 o 16 en el problema original entonces la

82

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

probabilidad que sea mayor que 2 -o sea, mayor que 16 en la variable original- ser 1 0,9773 = 0,0227 o sea 2,27%.

A 1 Valor x. 2 Media. 3 Desviacin estndar. 4 Probabilidad de que x sea menor que 16.

16 10 3 =DISTR.NORM(B1;B2;B3;VERDADERO) [97,72%] 5 Probabilidad de que x sea mayor que 16. =1-B4 [2,28%] 6 z =(B1-B2)/B3 [2] 7 Probabilidad de que z sea menor que 2. =DISTR.NORM.ESTAND(V17) [97,72%] 8 Probabilidad de que z sea mayor que 2. =1-B8 [2,28%]

Estadstica no paramtrica Hasta ahora nos hemos ocupado de distribuciones que nos permiten medir ciertas estadsticas tales como media, varianza, etc. Existen muchas situaciones en la realidad que requieren ms que todo verificar si ciertos resultados son independientes o si siguen determinada ley de probabilidad (distribucin de probabilidad). Tambin es necesario

encontrar herramientas que nos permitan evaluar resultados basados en ordinalidad, ms que en valores absolutos. De estos temas se ocupa esta seccin. La estadstica no paramtrica se utiliza cuando no se cumplen ciertas condiciones rigurosas, por ejemplo, en lo que se conoce como estadstica paramtrica se puede requerir que las muestras a estudiar sean independientes y que provengan de distribuciones normales con

83

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

varianzas iguales. Las pruebas de hiptesis no paramtricas son muy populares debido a dos razones: La primera, es que requieren suposiciones menos restrictivas que las paramtricas y con frecuencia los clculos son cortos y simples. La segunda, es el hecho de que las pruebas no paramtricas son las ms adecuadas cuando se trata de analizar informacin de muestras que slo pueden ser ordenadas. La distribucin 2 (chi cuadrado o ji cuadrado)
2 La distribucin es muy til para hacer pruebas de hiptesis, en

particular pruebas de bondad de ajuste. Algunas de ellas son las pruebas de normalidad (verificar si una variable tiene distribucin normal) y tablas de contingencia que permiten evaluar la independencia de los resultados. Esta distribucin tiene una formulacin tan poco amigable como la distribucin normal:

Y=

2 2 2 ! 2

( )(
2

2 ) / 2

(30)

2 Donde e es la base de los logaritmos naturales (2,7148...), es la

variable chi cuadrado y son los grados de libertad. La prueba 2 compara las frecuencias obtenidas de la variable con la frecuencia esperada de esa variable. Si las dos frecuencias son parecidas

84

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

no se rechaza la hiptesis de que la frecuencia observada procede de una distribucin dada. La forma general para estas pruebas es la siguiente:

i =1

(Fi f i )2
fi

(31)

Donde Fi es la frecuencia observada, fi es la frecuencia terica o esperada y k es el nmero de observaciones. En cada caso hay que definir el nmero de grados de libertad. Pruebas de normalidad Muchas pruebas estadsticas estn basadas en el supuesto de que la variable que se estudia tenga una distribucin normal. Aunque existen varias formas de hacer la prueba de normalidad, slo se va a presentar la que utiliza la distribucin chi cuadrado. En este caso, la frecuencia esperada es la que se obtiene de calcular el valor de la distribucin normal entre ciertos valores. Los grados de libertad son k-3. Esto se debe a que se tienen que cumplir tres condiciones en el proceso de ajuste:

f = F
i

X' = '2

Fi X i n Fi xi2 = n

(32)

Al tener que satisfacer esas tres condiciones se pierden tres grados de libertad por tanto, los grados de libertad para la prueba sern k-3.

85

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Ejemplo Con una distribucin normal cuya media sea 10 y la desviacin estndar fuera de 3, se han recolectado 250 observaciones de cierta variable y han sido clasificadas en los rangos que indica la siguiente tabla:

entre

Frecuencia absoluta observada

Frecuencia relativa Frecuencia relativa acumulada terica terica fi 0,00% 0,13% 2,28% 15,87% 50,00% 84,13% 97,72% 99,87%

Frecuencia absoluta observada Fi 0,34 5,35 33,98 85,34 85,34 33,98 5,35

-2 1 4 7 10 13 16

-2 1 4 7 10 13 16 19

1 6 33 110 75 15 10

0,13% 2,14% 13,59% 34,13% 34,13% 13,59% 2,14%

Para las pruebas de ajuste chi cuadrado se recomienda que por lo menos en cada intervalo o valor, haya por lo menos 5 observaciones. Por tanto, se fusionan los dos primeros intervalos.

86

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Entre

Frecuencia absoluta observada 7 33 110 75 15 10 Prueba chi cuadrado inversa (5%, 5)

-2 4 7 10 13 16 19

4 7 10 13 16 19 22

Frecuencia absoluta observada Fi 5,68751551 33,9762994 85,336185 85,3361851 33,9762994 5,3500237 11,0704826

Fi--fi

(Fi f i )2
fi
0,30287663 0,02797906 7,12832159 1,25195101 10,5985627 4,04152968 23,3512207

1,31248449 -0,975 24,663815 -10,3361851 -18,9762994 4,6499763

(Fi f i )
fi

Resultado
2

Si los parmetros se estiman a partir de los datos de la muestra, entonces se pierden 3 grados de libertad. Si los parmetros no se estiman, sino que se conocen desde el universo, entonces se pierde un grado de libertad. En este caso los parmetros se conocen, por tanto, el nmero de grados de libertad ser 5 (6-1). La Frecuencia relativa acumulada terica se calcula con la funcin de Excel =DISTR.NORM(valor de X (valor superior del rango); media;desviacin estndar;VERDADERO). VERDADERO indica que se est calculando el valor acumulado entre menos infinito y el valor superior del rango (X).

(Fi f i )2
La estadstica
fi

se debe calcular con base en las observaciones,

no en la frecuencia relativa. El valor mximo permisible del total es de 11,0704826 y se calcula con la funcin =PRUEBA.CHI.INV(probabilidad %; grados de libertad). En este ejemplo se utiliz un nivel de 5% y 5 grados de libertad. Como el resultado 23,3512207 es mucho menor que el permitido,
87

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

11,0704826, entonces se rechaza la hiptesis de que las observaciones provienen de una distribucin normal. Tablas de contingencia Las tablas de contingencia muestran asociaciones entre clasificaciones. La forma ms simple de tablas de contingencia es la llamada tablas 2x2. Todas las tablas de contingencia se pueden construir con una opcin en el men Datos de Excel, bajo Asistente de tablas dinmicas. Tablas 2x2 La siguiente tabla clasifica a una poblacin de adultos entre filiacin poltica y edad, as:

Edad Menor de 30 aos Mayor de 30 aos Total

Partido A Partido B Total 77 323 400 177 223 400 254 546 800

Lo que se pretende con el anlisis de las tablas de contingencia 2x2 es verificar si una clasificacin es independiente de la otra. Tiene algn efecto la edad de la poblacin en la escogencia de la filiacin poltica? Esto quiere decir que se trata de una prueba de independencia. Cuando un elemento se tabula como en la tabla anterior si las frecuencias de cada fila son proporcionales a las de las otras filas o si las frecuencias de cada columna son proporcionales a las de las otras

88

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

columnas, entonces las dos clasificaciones son independientes una de otra. Para calcular la frecuencia esperada de cada celda se toma el total de cada columna y se divide en la misma proporcin en que estn divididos los grandes totales de las filas. As, la celda Partido A menor de 30 aos, tendr como frecuencia esperada 254x400/800 = 127, y as las dems. Entonces las frecuencias esperadas para cada celda sern:

89

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Edad Menor de 30 aos Mayor de 30 aos Total

Partido A Partido B Total 127 273 400 127 273 400 254 546 800

El clculo de

i =1

(Fi f i )
fi

ser: (323-273)2/273 +(223-273)2/273 =

(77-127)2/127 + (177-127)2/127 57,7

Para determinar los grados de libertad se debe tener en cuenta cules son las restricciones que se imponen en la tabla 2x2. Estas son: f11 + f12 = Total de la fila 1 f21 + f22 = Total de la fila 2 f11 + f21 = Total de la columna 1 f12 + f22 = Total de la columna 2 Como una de ellas se puede obtener de las otras, entonces los grados de libertad que se pierden son 3 y los grados de libertad para la distribucin valen 1 (2-1)(2-1). El mximo valor permitido con un nivel de 5% es de 3,84, por tanto se rechaza la hiptesis de independencia y se dice que la edad s es determinante de la filiacin poltica.

90

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Tablas de contingencia rxc El anlisis de las tablas de contingencia se puede generalizar para cualquier nmero de grupos de clasificacin en los dos sentidos. En ese caso se dice que son tablas de contingencia rxc y los grados de libertad sern (r-1)x(c-1). El procedimiento es similar al presentado. Pruebas de signo y orden Estas son pruebas tpicas no paramtricas. Miran ms a las relaciones entre los valores que los valores mismos. Por ejemplo, lo importante no es si los valores de unas muestras son 2 y 5, sino que el valor de la muestra dos es ms alto que el de la uno. Prueba de signos Cuando se trata de medir la diferencia en la media de dos poblaciones en condiciones paramtricas, se requiere que las dos muestras sean independientes y que provengan de universos normales con igual varianza. Si alguna de estas dos condiciones no se cumple hay que usar una prueba no paramtrica llamada del signo. Esto es, se comparan los valores y se determina cul es el mayor y con base en el nmero de signos positivos (si fuera mayor) o negativos (si fuera menor o viceversa) se analiza la informacin. Ejemplo

91

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Se registra el promedio 25 estudiantes antes y despus de tomar un taller de mtodos de estudio. Se trata de estudiar si ese taller aumenta o no el promedio.

Efecto de un taller de mtodos de estudio sobre el rendimiento


Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Antes 3,7 3,7 3,55 3,4 3,7 3,5 3,6 3,7 3,45 3,4 3,55 3,45 3,65 3,35 3,55 3,6 3,6 3,6 3,45 3,65 3,35 3,4 3,45 3,6 3,7 despus Signo del cambio 3,8 + 3,5 3,6 + 3,35 3,65 3,55 + 3,65 + 3,8 + 3,5 + 3,5 + 3,6 + 3,6 + 3,45 3,4 + 3,65 + 3,65 + 3,5 3,6 No cambia 3,6 + 3,45 3,4 + 3,5 + 3,45 No cambia 3,75 + 3,65 1 0 1 0 0 1 1 1 1 1 1 1 0 1 1 1 0 0 1 0 1 1 0 1 0 16 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 1 23

Si el taller no tuviera efecto sobre el promedio se esperara que la mitad de las veces el promedio aumentara y la otra mitad disminuyera. Las muestras con igual valor de promedio se desechan.

92

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Para una muestra de 23, se espera que la media de cambios de signo sea de: Media: pxn 11,5. (np(1-p))1/2 2,39791576

La desviacin estndar sera:

Si la hiptesis es cierta, entonces el promedio debera ser

11,5. La

pregunta ahora es: Cul es la probabilidad de que el nmero de signos + sea de 16 o mayor? Usamos la normal con media 11,5 y desviacin estndar 2,39791576; probabilidad de que sea mayor 3,03%. Esto significa que la probabilidad de que esto ocurra por azar es de 3,03%. Si aceptamos un error de 5% el valor obtenido est dentro de ese margen de error y no rechazaramos la hiptesis de que tomar un curso de mtodos de estudio influye en el rendimiento. La binomial se puede aproximar a la normal cuando n>=10. Ejemplo Un panel debe hacer una prueba de sabor de dos productos. Le asigna 1 al sabor que prefiere y 1 al otro.

93

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Jurado A B C D E F G H I J K L

Sabor uno 1 1 0 1 1 1 0 1 1 0 1 0

Sabor dos 0 0 1 0 0 0 1 0 0 1 0 1

Signo del cambio + 1 + 1 0 + 1 + 1 + 1 0 + 1 + 1 0 + 1 0 8

1 1 1 1 1 1 1 1 1 1 1 1 12

Si no hubiera preferencia sobre los sabores se esperara que la mitad de las veces el panel prefiriera el uno y la otra mitad el dos. Las muestras con igual valor de calificacin se desechan. Para una muestra de 12 se espera que la media de cambios de signo sea: media pxn = 6; la desviacin estndar es desviacin estndar = (np(1p))1/2 = 1,73205081. Si la hiptesis es cierta, entonces el promedio signos positivos debera ser 6. La pregunta ahora es: Cul es la probabilidad de que el nmero de signos + sea de 8 o mayor? Usamos la normal con media 6 y desviacin estndar 1,7320508. Probabilidad de que sea mayor: 12,41%. Esto significa que la probabilidad de que esto ocurra por azar es de 12,41%.

94

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Si aceptamos un error de 5% el valor obtenido no est dentro de ese margen de error y rechazaramos la hiptesis de que no hay preferencia entre los jurados del panel por ningn sabor. La binomial se puede aproximar a la normal cuando n>=10 Prueba U de Mann-Whitney Cuando las muestras son independientes y tienen varianzas diferentes se puede utilizar esta prueba. Ejemplo Se aplica un cierto examen a estudiantes de la jornada diurna y ese mismo examen a estudiantes de la jornada nocturna. Se quiere probar si el rendimiento de los dos grupos es diferente o no. Nota 3,50 3,40 3,65 4,05 3,30 2,80 3,10 3,75 4,15 2,40 Jornada Diurno Diurno Diurno Diurno Diurno Diurno Diurno Diurno Diurno Diurno Nota 3,60 3,35 3,70 3,25 3,15 3,85 3,55 3,00 3,80 3,05 3,20 Jornada Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno

Esta prueba exige los siguientes pasos: Paso 1

95

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Asignar un orden a toda la muestra combinada (diurno y nocturno). As, 1 a la ms baja nota, 2 a la siguiente, etc. En el ejemplo, 1 a 2,4, 2 a 2,8, 3 a 3,0, etc.

Nota 2,40 2,80 3,00 3,05 3,10 3,15 3,20 3,25 3,30 3,35 3,40 3,50 3,55 3,60 3,65 3,70 3,75 3,80 3,85 4,05 4,15 Paso 2

Jornada Diurno Diurno Nocturno Nocturno Diurno Nocturno Nocturno Nocturno Diurno Nocturno Diurno Diurno Nocturno Nocturno Diurno Nocturno Diurno Nocturno Nocturno Diurno Diurno

Orden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

Se suman todos los rangos de cada grupo:

96

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Nota 2,40 2,80 3,10 3,30 3,40 3,50 3,65 3,75 4,05 4,15

Jornada Diurno Diurno Diurno Diurno Diurno Diurno Diurno Diurno Diurno Diurno R1

Orden 1 2 5 9 11 12 15 17 20 21 113

Nota 3,00 3,05 3,15 3,20 3,25 3,35 3,55 3,60 3,70 3,80 3,85

Jornada Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno Nocturno R2

Orden 3 4 6 7 8 10 13 14 16 18 19 118

n (n + 1) U = n1n2 + 1 1 R1 2
o:

(33)

n (n2 +1) U = n1n2 + 2 R2 2


Con la primera frmula, n1= 10, n2 = 11, R1 = 113 U= 52 Paso 4 Se determina la media y la desviacin estndar de U Media:

(34)

E (U ) =
Media: 55.

n1 n 2 2

(35)

97

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Desviacin estndar:

U =

n1n2(n1 +n2 +1) 12

(36)

Desviacin estndar:14,2009389 Si n1 y n2 son mayores que 8, entonces se puede aproximar a la normal. La probabilidad de que el valor de U>=52, sea producto del azar. Probabilidad U>= 52 58,37%. Si se acepta un nivel de error de 5%, entonces la prueba indicara que no hay evidencia de que el rendimiento es el mismo. Observaciones: 1) Si hay empates, los valores iguales reciben el rango promedio de sus rangos empatados (por ej. Si los valores 5 y 6 estn empatados ambos reciben entonces el rango 5,5) y la que sigue recibe el rango siguiente (por ej. 7) 2) U tiene distribucin aproximadamente normal slo cuando n1 y n2 son >= 8. Si esto no se cumple la normal no sirve. Prueba H de Kruskal-Wallis Es una generalizacin de la Prueba U de Mann-Whitney. Se utiliza para examinar la hiptesis nula de que varias muestras independientes pertenecen a poblaciones idnticas. Se asignan los ordenamientos a cada

98

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

observacin teniendo en cuenta todas las muestras. Al menor 1, al siguiente 2, etc. Con esos datos se calcula la estadstica H:
H= R2 12 R12 R22 + + L + k 3(n + 1) n(n + 1) n1 n2 nk

(37)

Donde k es el nmero de muestras, Rk es la suma de los rangos de la ksima muestra, y n es el nmero total de observaciones (n1+n2+...+nk) Si se supone que la hiptesis nula es verdadera y que cada muestra consiste de por lo menos 5 observaciones, H tiene una distribucin que se puede aproximar a la Chi-cuadrado con (k-1) grados de libertad. Ejemplo Se quiere probar una metodologa educativa con tres grupos de

estudiantes y se mide su mejora porcentual en el promedio acumulado:

Aumento Metodologa Aumento % Metodolog Aumento Metodolog a % a % 21,65% A 24,79% B 12,54% C 18,19% A 31,39% B 14,74% C 16,62% A 34,22% B 16,62% C 27,62% A 25,42% B 17,88% C 23,85% A 29,19% B 12,85% C 20,08% A 30,76% B 10,34% C 34,85% B 21,65% C 19,14% C 9,08% C

99

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Aumento % Met. Orden Aumento % Met. Orden Aumento % Met Orden 16,62% A 6,5 24,79% B 15 9,08% C 18,19% A 9 25,42% B 16 10,34% C 20,08% A 11 29,19% B 18 12,54% C 21,65% A 12,5 30,76% B 19 12,85% C 23,85% A 14 31,39% B 20 14,74% C 27,62% A 17 34,22% B 21 16,62% C 6,5 34,85% B 22 17,88% C 19,14% C 10 21,65% C 12,5 R1 70 R2 131 R3 52 n1 6 n3 7 n3 9 n= 22

H = 15,6327875 Valor de chi cuadrado a 1% = 9,21035104 Como H es mayor entonces se rechaza que las tres metodologas no tienen igual efectividad. Correlacin de orden El coeficiente de correlacin, como ya se sabe, va a permitir medir la asociacin entre dos variables, en este caso, de orden de una variable. En este caso se utilizar el coeficiente de correlacin de orden o rango de Spearman. Por ejemplo, para medir calificaciones de evaluacin de un grupo de personas o productos, a veces puede interesar si los evaluadores han sido coherentes en sus evaluaciones del mismo grupo de sujetos. Por ejemplo, la evaluacin que hace un director de departamento comparado con la evaluacin del decano. Ejemplo

100

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Tanto el decano como el director del departamento, han evaluado a los profesores y su resultado ha sido ordenado de acuerdo con las calificaciones de cada uno, as: Profesor A B C D E F G H I J Evaluacin de Decano Director 7 8 5 6 4 5 3 4 2 1 6 3 8 10 10 9 9 7 1 2

El coeficiente rs de Spearman est definido como: rs = 1 6 d 2

n n2 1

(38)

Donde n es el nmero de observaciones pareadas y d es la diferencia entre cada par de rangos. Profesor Decano Director d A 7 8 B 5 6 C 4 5 D 3 4 E 2 1 F 6 3 G 8 10 H 10 9 I 9 7 J 1 2 10 suma rs 0,85
101

d2 1 1 1 1 -1 -3 2 -1 -2 1 1 1 1 1 1 9 4 1 4 1 24

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Ejemplo Se quiere saber si existe alguna relacin entre la prueba del ICFES y el rendimiento de los estudiantes.

Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Promedio ponderado Puntaje ICFES 3,20 3,96 3,02 4,13 2,69 3,89 4,34 4,66 4,78 4,80 4,05 3,66 4,25 3,51 3,61 3,57 4,40 3,08 4,60 3,15 4,10 4,42 4,75 4,80 4,60 4,16

253 313 239 327 213 308 344 350 330 321 322 321 318 278 286 261 320 293 322 222 313 338 352 322 339 295

102

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Estudiante Promedio Puntaje ponderado ICFES 24 4,80 10 4,80 9 4,78 23 4,75 8 4,66 19 4,60 25 4,60 22 4,42 17 4,40 7 4,34 13 4,25 26 4,16 4 4,13 21 4,10 11 4,05 2 3,96 6 3,89 12 3,66 15 3,61 16 3,57 14 3,51 1 3,20 20 3,15 18 3,08 3 3,02 5 2,69

322 321 330 352 350 322 339 338 320 344 318 295 327 313 322 313 308 321 286 261 278 253 222 293 239 213

Orden Orden de puntaje d d2 de promedio 1 9 8 64 1 11,5 10,5 110,25 3 6 3 9 4 1 -3 9 5 2 -3 9 6,5 9 2,5 6,25 6,5 4 -2,5 6,25 8 5 -3 9 9 13 4 16 10 3 -7 49 11 14 3 9 12 18 6 36 13 7 -6 36 14 15,5 1,5 2,25 15 9 -6 36 16 15,5 -0,5 0,25 17 17 0 0 18 11,5 -6,5 42,25 19 20 1 1 20 22 2 4 21 21 0 0 22 23 1 1 23 25 2 4 24 19 -5 25 25 24 -1 1 26 26 0 0

N = 26 Suma total = 485,50. rs = 0,83.

Significancia estadstica de rs Hiptesis: No existe relacin entre los ordenamientos. Si n>=25, entonces se podra suponer distribucin normal. La media de rs es 0 y desviacin estndar es:

103

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

rs

1 n 1
(39)

= 0,19611614 Probabilidad de que rs sea mayor en valor absoluto que 0,83 = 2,11379E05. Esto significa que el coeficiente rs es significativo al 1%. Muestreo aleatorio En el archivo Estadstica.XLS hay una hoja que se llama aleatorio. All aparecen 1.000 nmeros aleatorios, entre 0 y 1. Un nmero aleatorio tiene como caracterstica que tiene igual probabilidad de salir que cualquier otro. Un ejemplo simple es una bolsa con 10 bolas numeradas del 0 al 9. Esos son 10 dgitos que si sacamos al azar cualquier bola, cualquiera de los nmeros tiene igual probabilidad de salir. En este caso, la probabilidad es de 1/10. Si se reemplaza la bola y siempre sacamos bolas de la bolsa con las 10 numeradas como se indic, estamos ante un mecanismo de generacin, nmeros aleatorios. Esta distribucin se conoce como distribucin uniforme. Cuando se hace el histograma de frecuencias de los 1.000 se encuentra lo siguiente:

104

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Rangos 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 y mayor... Y su grfica es:

Frecuencia absoluta 0 97 104 95 91 111 114 93 103 101 91 0

% acumulado ,00% 9,70% 20,10% 29,60% 38,70% 49,80% 61,20% 70,50% 80,80% 90,90% 100,00% 100,00%

Histograma de frecuencias de 1.000 observaciones de una distribucin uniforme


120 100 120% 100% 80% 60% 40% 20% 0%
0 0,1 0,2 ym ay 1 or ... 0,3 0,4 0,5 0,6 0,7 0,8 0,9

Frecuencia

80 60 40 20 0

Frecuencia % acumulado

Rango

105

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

En esta grfica se observa que la frecuencia es cercana a 100, por tratarse de una distribucin uniforme. Es fcil intuir que la media de esta distribucin es 0,5. Si se dibuja el histograma de frecuencias de los promedios de las muestras, se encuentra lo siguiente: Rangos 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 y mayor... Frecuencia absoluta 0 0 1 13 34 56 49 31 15 1 0 0 % acumulado ,00% ,00% ,50% 7,00% 24,00% 52,00% 76,50% 92,00% 99,50% 100,00% 100,00% 100,00%

Y en la grfica:
Histograma de frecuencias de las muestras
60 50 120% 100% 80% 60% 40% 20% 0%
0 0,1 0,2 ym ay 1 or ... 0,3 0,4 0,5 0,6 0,7 0,8 0,9

Frecuencia

40 30 20 10 0

Frecuencia % acumulado

Rango

106

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Si la muestra es de tamao 10, los resultados son los siguientes:

Clase 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 y mayor... En grfica:

Frecuencia % acumulado 0 ,00% 0 ,00% 0 ,00% 0 ,00% 17 17,00% 36 53,00% 35 88,00% 9 97,00% 3 100,00% 0 100,00% 0 100,00% 0 100,00%

Histograma
40 35 30 25 20 15 10 5 0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 y Clase 120,00% 100,00% 80,00% 60,00% 40,00% 20,00% ,00% Frecuencia % acumulado

Observe que ahora el histograma es ms estrecho. Qu ha sucedido? Pues que al tomar muestras de una distribucin uniforme, y al calcular,

Frecuencia

107

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

adems, el promedio de cada muestra, ste tiende a comportarse como una distribucin normal. Esta es una propiedad muy importante que se debe tener en cuenta. Se puede observar adems que el rango de variacin es mucho menor para los promedios de las muestras que para los datos originales. Esto se puede apreciar en la siguiente tabla:

Rangos 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 y mayor...

Muestras % Frecuencia acumulado absoluta 0 ,00% 0 ,00% 1 ,50% 13 7,00% 34 24,00% 56 52,00% 49 76,50% 31 92,00% 15 99,50% 1 100,00% 0 100,00% 0 100,00%

Valores originales Frecuencia % acumulado absoluta 0 ,00% 97 9,70% 104 20,10% 95 29,60% 91 38,70% 111 49,80% 114 61,20% 93 70,50% 103 80,80% 101 90,90% 91 100,00% 0 100,00%

Observado esto, se puede plantear una ley estadstica que dice que la distribucin de probabilidad del promedio de las muestras tomadas de una distribucin cualquiera, tiende a ser normal con media igual a la media de la distribucin original, y la desviacin estndar igual a la desviacin estndar de la distribucin original dividida por la raz cuadrada del tamao de la muestra.
108

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Con los datos disponibles se tiene: Desviacin estndar total de observaciones: 0,28472219. Desviacin estndar de la muestra: 0,13323466. Promedio del total de observaciones: 0,4977773. Promedio de la muestra: 0,4977773.

Los valores tericos de la media y de la desviacin estndar de la distribucin uniforme son:


Media = Valor mximo + valor mnimo 1 0 = = 0,5 2 2 Valor mximo valor mnimo 1 Desviacin estndar = = = 0,28867513 12 12

Los valores no coinciden exactamente porque los de la tabla fueron calculados de una muestra de 1.000 observaciones y no es el universo total.
Desviacin estndar del promedio de la muestra x = n = 0,28867513 5 = 0,12909944

Cuando se toma una muestra, se espera entonces que los resultados obtenidos por la muestra flucten alrededor de su media y que cerca del 100% de los valores se encuentren entre X 3 x . Esta variacin hacia arriba o hacia abajo de la media es el error permitido, y ste puede ser definido a voluntad. De manera que se puede construir una tabla que muestre el porcentaje de las muestras que caen entre dos valores:

109

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Entre X X

% observaciones 68,27 95,45 99,73

X 2 X X 3 X

Esto indica la confiabilidad del muestreo.

De modo que es posible

definir la confiabilidad del muestreo (95%, 90%, etc.), el error (e) que se acepta y, conociendo (o calculando aproximadamente) la desviacin estndar de la poblacin, se puede definir el tamao de la muestra. Si se denomina el nmero de desviaciones estndar por arriba y por debajo de la media como Z, entonces se puede expresar el error como:
error e = Z X = Z Z n= e2
2 2

(40)

Este valor de n es vlido cuando se tiene una poblacin infinita, de modo que no hay agotamiento del universo. Cuando se trata de una poblacin finita, se incurre en agotamiento del universo y la probabilidad de la primera muestra es diferente de todas las subsiguientes. En el caso de un universo finito de tamao N, es necesario hacer un ajuste, as:
Tamao de la muestra n m = n n 1 + N

(41)

110

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Hay un caso de especial inters y es la distribucin binomial que rige experimentos tales como encuestas de opinin o de mercado, donde el resultado a medir es un porcentaje. En ese caso, se sabe ya que los parmetros de la distribucin son p y pq. Entonces el clculo del tamao de la muestra ser:

error e = Z p = Z Z p(1 p ) n= e2
2

p (1 p) n

(42)

En este caso el error e es un porcentaje en relacin con el porcentaje que se desea medir. Como no siempre se puede calcular el valor de p, se adopta una posicin conservadora para p. Con p=0,5 se garantiza la mxima varianza, por tanto, el clculo de n resulta el mayor posible, dados unos niveles de error y de confiabilidad. Por ejemplo, si se desea hacer una encuesta sobre un universo finito de 400 elementos, se desea una confiabilidad de 95% y se acepta un error en el clculo de la respuesta a una determinada pregunta de 2%. Entonces esto debe interpretarse as: el valor de Z debe ser tal que el rea bajo la curva normal sea 95%, pues cobija valores por encima y por debajo de la media. Esto quiere decir que se debe encontrar un Z tal que el rea desde menos infinito y Z sea de 97,5%. Esto se encuentra con la funcin de Excel

111

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

=DISTR.NORM.ESTAND.INV(0,975). Y arroja como resultado 1,96. De aqu sale el famoso 1,96!. Por otro lado, decir que se acepta un error de 2% significa que si la respuesta a la pregunta indica 10%, el verdadero valor est entre 8% y 12%, con una probabilidad de 95%. Con estos datos, el tamao de la muestra, si el universo fuera infinito, sera de 2.401. Para un universo finito de 400 elementos, el tamao sera de 343. En la siguiente tabla se puede observar que a medida que el decisor est dispuesto a tolerar un mayor error, entonces la muestra se reduce, tanto para el universo infinito como para el finito (400 elementos en este ejemplo):

Muestra (n) universo Muestra (nm) universo finito N=400 infinito 1% 9.603,61861 384,005788 2% 2.400,90465 342,875599 3% 1.067,06873 290,938989 4% 600,226163 240,036178 5% 384,144744 195,956039 Un anlisis similar puede hacerse fijando el error y variando la Error confiabilidad. Se deja esto como ejercicio al lector. Qu se espera del tamao de la muestra si se desea ms confiabilidad? menos

confiabilidad? En ltimas todo termina siendo un problema de costos: Cunto se est dispuesto a pagar (por hacer una encuesta con mayor o menor cobertura) por reducir el error o aumentar la confiabilidad.

112

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Mtodos de pronstico
...Aureliano salt once pginas para no perder el tiempo en hechos demasiado conocidos, y empez a descifrar el instante que estaba viviendo, descifrndolo a medida que lo viva, profetizndose a s mismo en el acto de descifrar la ltima pgina de los pergaminos,... GABRIEL GARCA MRQUEZ, CIEN AOS DE SOLEDAD

La Humanidad ha tratado siempre de predecir el futuro. Basta recordar todos los intentos de las tribus primitivas de controlar -prediciendo- los fenmenos naturales o el orculo de Delfos en Grecia. As mismo, los decisores se enfrentan da a da con la necesidad de tomar decisiones hoy con consecuencias futuras; desearan, sin duda, tener, como Aureliano Buenda, los pergaminos de Melquades que les describieran, hoja por hoja, da por da, las consecuencias de sus decisiones del momento. Sin embargo, esto no ha sido posible hasta ahora, pero hay quienes ofrecen bolas de cristal y muchos otros mtodos mientras aparecen los pergaminos.

Las tcnicas de pronstico son una herramienta necesaria para la planeacin macro y microeconmica. Para el caso del gerente su quehacer bsico es la toma de decisiones con consecuencias futuras y por lo tanto debe elaborar estimativos de lo que suceder en el futuro. Por otro lado, debe prever escenarios que le permitan anticiparse a las posibles eventualidades que le indicarn la conveniencia o inconveniencia de una
113

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

alternativa. En particular para analizar decisiones de inversin es necesario hacer estimativos de muy diversas variables: precios, tasas de inters, volmenes de venta o de produccin, etc., por lo tanto, es necesario que el analista conozca, por lo menos la existencia de ciertas tcnicas que le ayuden en esta tarea.

Para elaborar pronsticos se pueden encontrar dos grandes clases de modelos: causales y de series de tiempo. Los primeros tratan de encontrar las relaciones de causalidad entre diferentes variables, de manera que conociendo o prediciendo alguna o algunas de ellas, se pueda encontrar el valor de otra. En el segundo caso no interesa encontrar esas relaciones, sino que se requiere solamente encontrar los posibles valores que asumir una determinada variable. En todos los casos siempre se hace uso de la informacin histrica, ya sea para predecir el comportamiento futuro o para suponer que el comportamiento histrico se mantendr hacia el

futuro y sobre esta base hacer los estimativos. Aqu se estudiarn algunos mtodos de pronstico de series de tiempo. No se pretende ser exhaustivo sobre el tema porque el alcance de este texto no lo considera y porque adems, existen textos especializados sobre pronsticos (ver bibliografa al final del captulo).

114

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Se debe tener presente que no existe ningn mtodo de pronstico infalible; lo que hacen estos procedimientos es estimar un valor posible, pero siempre sujeto a errores. Si el fenmeno que se va a pronosticar

fuera determinstico, solo bastara utilizar la ley matemtica que lo rige y predecir con exactitud el resultado; este sera el caso de fenmenos fsicos, como por ejemplo la cada libre de un cuerpo. En el proceso de toma de decisiones se involucra el comportamiento humano, por ejemplo, a travs de las decisiones de los individuos a quienes est dirigida un determinado producto o servicio; las decisiones del mercado estn compuestas por muchsimas decisiones individuales, imposibles de predecir con exactitud.

La mayora de los datos incluyen combinaciones de estas tendencias y se deben generar procedimientos para separarlos. Existen otras clases de pronsticos denominados cualitativos o de pronstico tecnolgico, tales como el Mtodo Delphi. Este mtodo busca, a travs de mltiples rondas o iteraciones donde se comparte la informacin, encontrar consenso sobre valores o escenarios posibles.

Se hace nfasis en que no hay un mtodo de pronstico perfecto, aunque se podra construir un modelo que ajuste perfectamente los datos que se tienen de un fenmeno; sin embargo, esto no es recomendable puesto que el elemento aleatorio o de error siempre estar presente y ser

115

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

impredecible y es mejor identificar los patrones predecibles y asumir el error que se presente que tratar de introducir en el modelo el elemento error que, se repite, es completamente impredecible e inevitable. En otras palabras, cualquier estimativo implica un cierto grado de error inevitable.

Existen muchos mtodos de pronstico y en esta nota no se har una revisin exhaustiva de ellos. Adems, para calificar la bondad de cada uno de ellos se debe acudir al mtodo de los mnimos cuadrados, esto es, se considera el mejor mtodo aquel que minimiza la suma de los cuadrados de los errores (diferencias entre el valor estimado y el observado). Mtodos de Suavizacin Dentro de los mtodos de suavizacin se pueden considerar tres categoras: a) Promedios mviles, b) suavizacin exponencial y c) otros. Promedios mviles. Esta tcnica consiste en tomar un grupo de valores observados, calcularle el promedio y utilizarlo como pronstico para el siguiente perodo. Slo sirve para pronosticar un slo perodo: el siguiente. Se debe especificar el nmero de observaciones que se tomarn; se llama mvil porque siempre se toman las N ltimas observaciones para hacer el pronstico.

116

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Se pueden considerar promedios mviles simples y promedios mviles lineales. En el primer caso se toman los N ltimos datos y se calcula el promedio; en el segundo caso se construyen adems promedios de los promedios y con ellos se establece una ecuacin lineal que permite elaborar el pronstico.

Para el caso de los promedios mviles simples, algebricamente se representa as:

Ft+1 = (Xt + Xt-1 +...+ Xt-N+1)/N

Ft +1

i = t N +1

X
N

Este mtodo puede utilizarse cuando se sabe que los datos son estacionarios. La ventaja sobre el promedio total es que permite ajustar el valor de N para que responda al comportamiento de los datos.

Ejemplo: Compras realizadas por los clientes que entran a una tienda. Se va a utilizar el promedio mvil con N= 3.

117

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

AO 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982

COMPRAS 10 11 15 11 15 11 9 14 11 16 12 14

PRONOSTICO 10.00 10.50 12.00 12.33 13.67 12.33 11.67 11.33 11.33 13.67 13.00 14.00

Suavizacin exponencial Existen muchos mtodos de suavizacin exponencial: simple, de tasa de respuesta de adaptacin, mtodo de Brown de un solo parmetro, mtodo de Holt de dos parmetros, mtodo cuadrtico de Brown, etc. Aqu se considerarn un mtodo de suavizacin: suavizacin exponencial simple. Suavizacin exponencial simple. Este mtodo consiste en asignar un peso a la ltima informacin (dato) disponible y al ltimo pronstico, el cual, a su vez, contiene la informacin pasada, as:

Ft+1 = ? Xt + (1- )Ft

118

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Para F2, se tiene:

F2 = F1

Otra forma de expresar el pronstico es:

Ft+1 = Ft + e

donde e es el error incurrido en el ltimo pronstico.

Ejemplo: Datos de demanda de un producto Se utilizar suavizacin exponencial simple con a = .3

CLIENTE 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982

DESPACHOS 628 424 613 620 974 550 487 408 691 872 738 767

PRONOSTICO 628.00 566.80 580.66 592.46 706.92 659.85 607.99 547.99 590.90 675.23 694.06 715.94

119

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Los mtodos hasta aqu presentados son muy adecuados para pronosticar el siguiente perodo; no se recomiendan para hacer

predicciones a largo plazo. Otros mtodos de suavizacin Solo se mencionarn otros mtodos de suavizacin existentes y no menos importantes: mtodo de control de adaptacin de Chow, mtodo de suavizacin de tres parmetros de Box y Jenkins, mtodo multiplicativo de Winter y el sistema de monitoreo de Trigg. Mtodos de Tendencia Uno de los mtodos ms conocidos, pero tambin de los ms mal utilizados es la regresin lineal. En cualquier curso de Presupuesto es tema obligado. Sin embargo, como se mencion, se tiende a utilizar este procedimiento. En cualquier caso en que se utilice un modelo, es necesario validarlo: esto es, verificar si los supuestos del modelo coinciden con la realidad. Y esto no es lo que hace la mayora de los usuarios. La regresin lineal implica por lo menos, distribucin normal de los errores de la variable dependiente, que no estn correlacionados y para utilizarlo con validez estadstica, adems debe contarse con un tamao de muestra n de por lo menos 30 datos histricos. Cuntos cursos de finanzas y de presupuestos en particular no se hacen invitando a los estudiantes a utilizar la regresin lineal con 3 5 datos!!! Otro supuesto obvio es que la

120

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

tendencia observada de los datos puede ser descrita por una recta. Sin embargo, este supuesto se puede obviar haciendo las substituciones necesarias, por ejemplo, si se considera que una variable tiene un comportamiento exponencial (no lineal), estos datos podran linealizarse calculando el logaritmo de los datos y proyectar el logaritmo. Despus se halla el antilogaritmo y esa sera la proyeccin. La idea de la regresin lineal es hallar una recta que cumpla con un requisito bsico comn para muchos mtodos de pronstico: la suma de los cuadrados de la diferencia entre el valor estimado y el observado es mnima. Por eso se llama tambin mtodo de mnimos cuadrados. En general, se trata de encontrar (en el caso de la regresin lineal), una recta que cumpla esa condicin y que se expresa as:

Y = a + b1X1 + b2X2 + b3X3+... +bnXn + e

Donde Y = variable dependiente Xj = variable independiente e = error a = intercepcin con el eje de las abcisas (y) bj = coeficiente de cada variable Xj El caso particular de una variable independiente la frmula ser:

121

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Y = a + bX + e

Excel presenta varias alternativas para calcular proyecciones de variables que tienen un comportamiento lineal. Mtodos de Descomposicin Un mtodo de pronstico es el de descomposicin, para analizar series de tiempo. Un paso importante en el proceso de determinar el mtodo de series de tiempo adecuado es considerar los diferentes patrones que se encuentran en los datos. Se pueden identificar cuatro patrones tpicos: horizontal o estacionaria, estacional, cclico y de tendencia. 1. Se presenta un patrn horizontal o estacionario (H) cuando los datos fluctan alrededor de un valor promedio constante. Las ventas que no aumentan ni disminuyen con el tiempo, es un ejemplo de este tipo de comportamiento. 2. Se presenta un patrn estacional (E) cuando los datos estn afectados por factores que se repiten con cierta frecuencia (trimestral, mensual o en determinadas fechas, por ejemplo, Navidad, Semana Santa, etc.). 3. Un patrn cclico (C) se presenta debido a efectos econmicos de largo plazo y generalmente asociados con el ciclo econmico. La construccin de vivienda puede ser un ejemplo de este tipo.

122

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

4.

Existe un patrn de tendencia (T) cuando existe un aumento o disminucin secular de los datos. Las ventas de la mayora de las firmas presentan este comportamiento.

Los mtodos de descomposicin suponen que los datos contienen patrones estacionales, cclicos y de tendencia; una funcin que representa esta relacin puede ser la siguiente:

dato = patrn + error. = f(tendencia, estacionalidad, ciclo) + error. Xt = f(Tt, Et, Ct, Ert) donde Xt es el dato al perodo t. Tt es el componente de tendencia en el perodo t. Et es el componente o ndice de estacionalidad del perodo t. Ct es el componente cclico del perodo t. y Ert es el error del perodo t.

El procedimiento general para aislar los diversos componentes es el siguiente y se aplica a los diferentes mtodos de descomposicin. 1) Con los datos disponibles calcule el promedio con un N igual a la longitud de la estacionalidad (12 meses, 6 meses, 4 trimestres, o 7 das,

123

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

por ejemplo). Con esto se elimina la estacionalidad y el error, por lo tanto en el promedio mvil se encuentra slo la tendencia y el ciclo. 2) Separe el resultado de 1) -el promedio mvil- de los datos. Lo que queda es la estacionalidad y el error. 3) Asle los factores estacionales promedindolos para cada perodo que constituyen el perodo completo de estacionalidad (cada mes, semestre o trimestre, por ejemplo). 4) Identifique la forma de la tendencia con los resultados de 1) (lineal, exponencial, etc.) y calcule su valor para cada uno de los perodos para los cuales se tienen datos. 5) Separe el resultado de 4) de los resultados de 1) para obtener el factor cclico. 6) Separe la estacionalidad, la tendencia y el ciclo de los datos para obtener el error. Este mtodo es til cuando se considera que existe una tendencia y estacionalidad. La estacionalidad se puede identificar en los datos si se observan ciertos "picos" o "baches" en los datos con regularidad; por ejemplo, si encuentra que el consumo de gaseosa es siempre mayor en los das sbados y domingos y menor en los das jueves, se podra sospechar que existe una estacionalidad asociada a esos das de la semana. Por otro lado, se puede llegar a la conclusin acerca de la existencia de la estacionalidad deducindola a partir del comportamiento del negocio; por

124

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

ejemplo, antes de examinar cualquier dato, se podra pensar que la venta de juguetes o de calendarios y agendas van a presentar picos en los tres ltimos meses del ao. Obsrvese que se habla de estacionalidad cuando los perodos de anlisis son menores de un ao. Por ejemplo, semestres, trimestres o meses en relacin con un ao; quincenas, dcadas o semanas en relacin con mes; das de la semana con relacin a la misma. Esto es, si los datos son anuales, por ejemplo, no tiene sentido pensar en la existencia de un patrn estacional. Uno de los modelos de descomposicin ms utilizados es el

multiplicativo, o sea, Xt = Tt x Et x Ct x Ert Al aplicar los seis pasos propuestos se tiene: 1) y 2) Calcule el promedio mvil y asle los factores estacionales: Mt = Tt x Ct

Xt T E t Ct Ert = t Mt Tt Ct
La expresin anterior asla la estacionalidad y el error. 3) El siguiente paso es eliminar el error de los valores obtenidos con la ltima expresin. Los modelos clsicos de descomposicin utilizan el enfoque del promedio medial. Para calcular el promedio medial se toman todos los datos de promedio mvil para cada perodo (mes, trimestre, etc.) y se eliminan los valores extremos, con los datos restantes se calcula el

125

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

promedio. Los datos obtenidos para cada perodo se ajustan al 100% multiplicando el promedio medial por 100 x nmero de perodos/suma de todos los promedios mediales 4) y 5) Los pasos finales es el de calcular la tendencia y separarla del ciclo. Se identifica el patrn de la tendencia y se calcula el valor de ella para cada uno de los perodos para los cuales se tienen datos. En este modelo se elimina as:

Mt Tt Ct = = Ct Tt f (a , b, c... t )
donde a,b,c... son las constantes de la regresin y t es el perodo correspondiente. En el caso de una regresin lineal se tendra:

Mt TC = t t = Ct Tt a + b(t )
6) Con estos factores, estacionalidad, tendencia y ciclo, se puede estimar el error.

Ert =

Xt Tt E t Ct

Ejemplo: Se va a estudiar el comportamiento del Indice de Ventas a Precios Corrientes del Comercio Detallista Alimentos y Bebidas 1975-1983 y se va a hacer una proyeccin utilizando el mtodo de descomposicin. (Los datos estn tabulados ms adelante). Se va a fraccionar la informacin de 1975
126

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

a 1982 para hacer una proyeccin de los siguientes doce meses (de 1983), para evaluar la bondad del mtodo.

Indice de ventas a precios corrientes del comercio detallista1 Alimentos y bebidas 1975-1982
Dato Mes Indice Dato Mes Indice Dato Mes real (1) real (1) real 1 Ene 75 1,738 25 Ene 77 2,939 49 Ene 79 2 Feb 3 Mar 4 Abr 5 May 6 Jun 7 Jul 8 Ago 9 Sep 10 Oct 11 Nov 12 Dic 13 Ene 76 14 Feb 15 Mar 16 Abr 17 May 18 Jun 19 Jul 20 Ago 21 Sep 22 Oct 23 Nov 24 Dic 1,983 2,240 2,138 2,330 2,333 2,320 2,364 2,463 2,579 2,545 4,091 2,224 2,459 2,657 2,858 2,832 2,782 3,025 3,002 3,151 3,283 3,355 5,296 26 Feb 27 Mar 28 Abr 29 May 30 Jun 31 Jul 32 Ago 33 Sep 34 Oct 35 Nov 36 Dic 37 Ene 78 38 Feb 39 Mar 40 Abr 41 May 42 Jun 43 Jul 44 Ago 45 Sep 46 Oct 47 Nov 48 Dic 3,320 3,623 3,765 3,812 4,157 4,100 4,135 4,220 4,313 4,440 6,909 4,009 4,577 5,039 4,717 4,969 5,283 5,209 5,250 5,597 5,449 5,704 9,154 50 Feb 51 Mar 52 Abr 53 May 54 Jun 55 Jul 56 Ago 57 Sep 58 Oct 59 Nov 60 Dic 61 Ene 80 62 Feb 63 Mar 64 Abr 65 May 66 Jun 67 Jul 68 Ago 69 Sep 70 Oct 71 Nov 72 Dic Indice Dato Mes (1) real 5,236 73 Ene 81 6,037 6,608 6,426 6,614 6,986 7,017 7,322 7,658 7,661 8,070 10,877 7,242 7,955 9,149 8,670 9,561 9,636 9,790 10,182 10,441 11,184 11,562 14,628 74 Feb 75 Mar 76 Abr 77 May 78 Jun 79 Jul 80 Ago 81 Sep 82 Oct 83 Nov 84 Dic 85 Ene 82 86 Feb 87 Mar 88 Abr 89 May 90 Jun 91 Jul 92 Ago 93 Sep 94 Oct 95 Nov 96 Dic Indice (1) 10,058 10,997 12,133 12,182 12,916 13,032 13,379 13,955 14,185 14,984 14,825 18,964 13,959 14,873 16,568 16,972 17,023 17,237 18,034 17,789 18,168 19,031 18,234 24,379

Fuente DANE

127

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

ndice de ventas a precios corrientes del comercio detallista Alimentos y bebidas 1983 (para comparacin)
Dato Mes real 97 Ene 83 98 Feb 99 Mar 100 Abr 101 May 102 Jun 103 Jul 104 Ago 105 Sep 106 Oct 107 Nov 108 Dic Indice (1) 17,176 18,327 21,819 19,627 20,969 22,046 22,068 21,949 22,630 23,609 22,573 29,583

Lo primero que se requiere es observar el patrn de los datos. Para esto se grafican los datos en el tiempo, as:

128

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Indice de Ventas
25,000

20,000

15,000

10,000

5,000

0 EA J O EA J O EA J O E A J O EA JO EA J OE A JO EA J O Mes

Lo primero que se observa en esta grfica es que hay una tendencia (crecimiento) y una estacionalidad (picos y valles). Otra informacin que se deduce de la grfica es que la tendencia no parece lineal; por lo tanto, se puede explorar la posibilidad de linealizar los datos a travs de una transformacin logartmica. Esto es, se va a trabajar no con los datos, sino con su logaritmo natural. Al graficar los datos as transformados, se obtiene lo siguiente:

129

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Logaritmo del Indice


12

10

0 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 Mes

La transformacin linealiz los datos, lo cual puede facilitar su tratamiento numrico. Sin embargo, la estacionalidad, ni el error se han perdido. Este resultado se hubiera podido visualizar utilizando la opcin de grfica semilogartmica que ofrece Excel; como se trata de hacer clculos, se hizo explcito el tratamiento logartmico de los datos y despus de eso se grafic el logaritmo natural (ln) de los datos originales. Se calcula el promedio mvil de 12 meses -para incluir todo el ciclo de estacionalidady se obtienen los siguientes resultados:

130

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

ndice de ventas a precios corrientes del comercio detallista Alimentos y bebidas 1975-1983
Mes
ln del Promedio mvil Indice CxT (3) (2) 75-76 7.460 7.592 7.714 7.668 7.754 7.755 7.749 7.768 7.809 7.855 7.842 8.317 7.707 7.808 7.885 7.958 7.949 7.931 8.015 8.007 8.055 8.097 8.118 8.575 #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A 7.774 7.794 7.812 7.826 7.851 7.867 7.881 7.904 7.923 7.944 7.964 7.987 ln del Promedio mvil Indice CxT (3) (2) 77-78 7.986 8.108 8.195 8.234 8.246 8.333 8.319 8.327 8.348 8.369 8.398 8.841 8.009 8.032 8.057 8.083 8.106 8.130 8.164 8.189 8.216 8.240 8.263 8.286 ln del Indice (2) Promedio mvil CxT (3) ln del Indice (2) Promedio mvil CxT (3)

79-80 8.563 8.706 8.796 8.768 8.797 8.852 8.856 8.899 8.944 8.944 8.996 9.294 8.888 8.982 9.121 9.068 9.165 9.173 9.189 9.228 9.253 9.322 9.355 9.591 8.577 8.599 8.622 8.645 8.670 8.694 8.717 8.742 8.770 8.796 8.825 8.853 8.868 8.895 8.918 8.945 8.970 9.001 9.027 9.055 9.083 9.109 9.140

81-82 9.216 9.305 9.404 9.408 9.466 9.475 9.501 9.544 9.560 9.615 9.604 9.850 9.544 9.607 9.715 9.739 9.742 9.755 9.800 9.786 9.807 9.854 9.811 9.195 9.222 9.249 9.273 9.301 9.326 9.351 9.377 9.403 9.429 9.453 9.474 9.496 9.523 9.548 9.574 9.602 9.625 9.648 9.673 9.693 9.714 9.734 9.751

Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic

8.296 8.429 8.525 8.459 8.511 8.572 8.558 8.566 8.630 8.603 8.649 9.122

8.309 8.334 8.361 8.389 8.407 8.430 8.450 8.469 8.489 8.513 8.532 8.553

9.170 10.101

El promedio mvil contiene, entonces, la tendencia (T) y el ciclo (C). Al dividir el dato original por el promedio mvil, el resultado entonces contendr la estacionalidad (Est) y el error (Err). Como el ciclo es un movimiento de largo plazo y de alguna manera la tendencia T, calculada como una regresin lineal, es un promedio, se puede suponer que la tendencia (T) calculada, elimina el ciclo C. Al examinar el comportamiento del promedio mvil, se observa una casi perfecta linealidad de los datos.
131

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Promedio mvil del logaritmo natural del Indice


10 9 8 7 6 5 4 3 2 1 0 E A J O E A J O E A J O E A J O E A J O E A J O E A J O Mes

Por lo tanto, se le puede proyectar por medio de una regresin lineal. Excel tiene varios modos de trabajar la proyeccin lineal. Aqu se ha escogido la funcin =PRONOSTICO(valor de x;matriz y;matriz x) que es muy sencilla.

132

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Indice de ventas a precios corrientes del comercio detallista alimentos y bebidas 1975-1983
EstxErr Tendencia EstxErr Tendencia EstxErr Tendencia EstxErr Tendencia (4) T (4) T (4) T (4) T =(2)/(3) calculada =(2)/(3) calculada =(2)/(3) calculada =(2)/(3) calculada (5) (5) (5) (5) 76 76 77-78 77-78 79-80 79-80 81-82 81-82 0.997 1.009 1.017 1.019 1.017 1.025 1.019 1.017 1.016 1.016 1.016 1.067 0.991 1.002 1.009 1.017 1.013 1.008 1.017 1.013 1.017 1.019 1.019 1.074

8.015 8.039 8.064 8.088 8.113 8.137 8.162 8.186 8.211 8.235 8.260 8.284 8.308 8.333 8.357 8.382 8.406 8.431 8.455 8.480 8.504 8.529 8.553 8.577

0.998 1.012 1.020 1.014 1.015 1.018 1.016 1.018 1.020 1.017 1.019 1.050 1.002 1.010 1.023 1.014 1.022 1.019 1.018 1.019 1.019 1.023 1.024 1.046

8.602 8.626 8.651 8.675 8.700 8.724 8.749 8.773 8.798 8.822 8.847 8.871 8.895 8.920 8.944 8.969 8.993 9.018 9.042 9.067 9.091 9.116 9.140 9.165

1.002 1.009 1.017 1.015 1.018 1.016 1.016 1.018 1.017 1.020 1.016 1.040 1.005 1.009 1.017 1.017 1.015 1.014 1.016 1.012 1.012 1.014 1.008 1.036

9.189 9.213 9.238 9.262 9.287 9.311 9.336 9.360 9.385 9.409 9.434 9.458 9.483 9.507 9.531 9.556 9.580 9.605 9.629 9.654 9.678 9.703 9.727 9.752

7.721 7.746 7.770 7.795 7.819 7.844 7.868 7.893 7.917 7.942 7.966 7.990

0.999 1.011 1.020 1.008 1.012 1.017 1.013 1.011 1.017 1.011 1.014 1.066

133

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

ndice de ventas a precios corrientes del comercio detallista Alimentos y bebidas 1975-1983
Mes Ciclo C (6) =(3)/(5) Ciclo C (6) =(3)/(5) Ciclo C (6) =(3)/(5) Ciclo C (6) =(3)/(5) Ciclo C (6) =(3)/(5) Ciclo C (6) =(3)/(5) Ciclo C (6) =(3)/(5)

1976 Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic 1.007 1.006 1.005 1.004 1.004 1.003 1.002 1.001 1.001 1.000 1.000 1.000

1977 0.999 0.999 0.999 0.999 0.999 0.999 1.000 1.000 1.001 1.001 1.000 1.000

1978 1.000 1.000 1.000 1.001 1.000 1.000 0.999 0.999 0.998 0.998 0.998 0.997

1979 0.997 0.997 0.997 0.996 0.997 0.997 0.996 0.996 0.997 0.997 0.998 0.998

1980 0.997 0.997 0.997 0.997 0.997 0.998 0.998 0.999 0.999 0.999 1.000 1.001

1981 1.001 1.001 1.001 1.001 1.002 1.002 1.002 1.002 1.002 1.002 1.002 1.002

1982 1.001 1.002 1.002 1.002 1.002 1.002 1.002 1.002 1.002 1.001 1.001 1.000

Ciclo de largo plazo

1.008 1.006 1.004 1.002 1 0.998 0.996 0.994 0.992 0.99 E A J O E A J O E A J O E A J O E A J O E A J O E A J O mes

134

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Indice de estacionalidad
promedio ajuste a 12 en total 76 E F M A M J J A S O N D 77 78 79 80 81 82 0.9993 1.0089 1.0176 1.0148 1.0158 1.0167 1.0163 1.0154 1.0166 1.0171 1.0166 1.0540 12.2093 0.9822 0.9916 1.0002 0.9974 0.9984 0.9992 0.9989 0.9980 0.9992 0.9997 0.9992 1.0360 12.0000

0.9914 0.9972 0.9985 0.9984 1.0022 1.0023 1.0051 1.0017 1.0094 1.0113 1.0124 1.0097 1.0090 1.0089 1.0093 1.0171 1.0196 1.0202 1.0228 1.0167 1.0175 1.0168 1.0187 1.0084 1.0143 1.0137 1.0146 1.0173 1.0125 1.0173 1.0123 1.0146 1.0218 1.0178 1.0146 1.0082 1.0249 1.0169 1.0181 1.0192 1.0160 1.0135 1.0169 1.0190 1.0129 1.0159 1.0179 1.0161 1.0157 1.0131 1.0168 1.0114 1.0179 1.0191 1.0177 1.0117 1.0167 1.0160 1.0166 1.0198 1.0188 1.0166 1.0118 1.0192 1.0157 1.0106 1.0168 1.0235 1.0197 1.0144 1.0194 1.0164 1.0137 1.0194 1.0236 1.0159 1.0079 1.0736 1.0669 1.0665 1.0498 1.0459 1.0397 1.0359 SUMA

Indice de Estacionalidad
1.04 1.03 1.02 1.01 1 0.99 0.98 0.97 0.96 0.95 ene feb mar abr may jun jul ago sep oct nov dic Mes

Para preparar un pronstico se multiplica el valor de la tendencia calculada por el ndice de estacionalidad y por el factor cclico que se estime. Para estimar el factor cclico se debe tener un cierto conocimiento del devenir de la economa y no es calculable en forma directa como puede
135

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

ser la tendencia o la estacionalidad; esta estimacin del ciclo se basa en la informacin disponible sobre la economa, la observacin del ciclo y en algn grado es un estimativo de tipo subjetivo. Una posibilidad es examinar la tendencia que muestre la grfica, como aparece a

continuacin. En el caso del ejemplo, si se desea pronosticar el ao 1983 se tiene:

1983 Dato Tendencia No E F M A M J J A S O N D 97 98 99 100 101 102 103 104 105 106 107 108

Ciclo

Estacionalidad

9.7760 1.0000 9.8005 1.0001 9.8249 1.0002 9.8494 1.0003 9.8739 1.0004 9.8983 1.0005 9.9228 1.0006 9.9472 1.0007 9.9717 1.0007 9.9962 1.0008 10.0206 1.0009 10.0451 1.0010

Proyeccin del dato o ndice Proyeccin del logaritmo (antilogaritmo) TxCxEst (ln) 0.9822 9.6021 14,796.11 0.9916 1.0002 0.9974 0.9984 0.9992 0.9989 0.9980 0.9992 0.9997 0.9992 1.0360 9.7197 9.8286 9.8268 9.8622 9.8956 9.9176 9.9338 9.9710 10.0013 10.0217 10.4169 16,641.62 18,557.58 18,524.29 19,191.01 19,842.59 20,284.25 20,615.41 21,395.81 22,055.93 22,508.78 33,420.56

(El ltimo dato que se utiliz para calcular la tendencia fue el nmero 96 (diciembre de 1982); por lo tanto, el mes de enero de 1983 corresponde al 97. Los promedios mviles que se utilizan en este mtodo pueden ser centrados o no. Si el nmero de trminos en el promedio mvil es impar la colocacin del promedio mvil no tiene problema pues se sita en (N+1)/2.

136

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Si es par, se tendra que colocar medio perodo rezagado o medio perodo adelantado. Se puede comparar grficamente el resultado de algunas proyecciones, incluida sta que se acaba de calcular.

Indice real vs varias proyecciones

35,000 30,000 25,000 Real 20,000 15,000 10,000 5,000 0 E F M A M J J mes A S O N D Prom mvil Descomp Regresin

Una forma analtica de evaluar qu tan buena es una proyeccin es calcular la suma de los cuadrados de los errores. Entre varios mtodos, se considerar mejor aquel que presente menor suma de los cuadrados de los errores. Si se consideran los mtodos de regresin lineal para proyectar los siguientes doce meses, o el promedio mvil, para proyectar los mismos doce meses, pero uno a la vez, o sea, que al finalizar enero se proyecta febrero, y as sucesivamente, se obtiene lo siguiente:

137

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Real

Prom mvil

Reg lineal

Descomp

Ene 97 98 99 Feb Mar

17,176 17,689 16,628 18,327 17,957 16,807 21,819 18,245 16,986 19,627 18,682 17,166 20,969 18,904 17,345 22,046 19,233 17,524 22,068 19,633 17,704 21,949 19,969 17,883 22,630 20,316 18,062 23,609 20,688 18,242 22,573 21,069 18,421 29,583 21,431 18,601

14,796 16,642 18,558 18,524 19,191 19,843 20,284 20,615 21,396 22,056 22,509 33,421 Suma de cuadrados

Prom mvil (Cuadrado de los errores) 263,084 136,900 12,774,667 892,238 4,265,602 7,915,782 5,928,008 3,918,750 5,354,210 8,532,728 2,260,763 66,455,104 118,697,835

Reg lineal Descomp (Cuadrado (Cuadrado de los de los errores) errores) 300,807 5,663,877 2,310,689 23,355,292 6,058,331 13,133,406 20,445,233 19,046,913 16,531,651 20,862,510 28,806,686 17,237,629 120,614,402 288,703,547 2,840,509 10,636,882 1,215,977 3,161,261 4,855,031 3,181,753 1,778,459 1,523,223 2,412,033 4,124 14,726,872 52,000,000

100 Abr 101 May 102 Jun 103 Jul 104 Ago 105 Sep 106 Oct 107 Nov 108 Dic

Con estos datos se concluye que el mejor mtodo de pronstico en este caso particular es el de descomposicin por tener menor suma de cuadrado de los errores. Debe observarse que este es un anlisis a posteriori suponiendo que se est en diciembre de 1982 y se hacen las proyecciones (con excepcin del promedio mvil que debe hacerse mes a mes); despus se espera a diciembre de 1983 para ver qu tal resultaron las proyecciones. De modo que el anlisis de los mnimos cuadrados slo podra hacerse en diciembre de 1983. El uso de los mtodos de pronsticos depara sorpresas y deben explorarse muy bien las cifras. Lo que se ha hecho en este ejemplo es relativamente sencillo, porque se conocen unas cifras (1983) contra las cuales comparar la bondad del pronstico; sin embargo, el problema reside en que en la realidad obviamente no se sabe qu tan bueno va a resultar el

138

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

pronstico hacia el futuro. Se sugiere al lector que trabaje los datos de los ltimos cuatro aos y deber encontrar que el pronstico que se obtiene es mejor que con todos los datos. Esto puede ocurrir porque al considerar la totalidad de los datos el modelo tiene en cuenta tendencias o hechos que ya no afectan a la situacin actual; en otras palabras, replica un patrn que ya no es vlido.

Referencias Drake, Alwin W. Fundamentals of Applied Probability Theory, McGrawHill Book Co., 1967. Makridakis, S., S.C. Wheelwright, Forecasting. Methods and Applications, John Wiley, 1978. Existe tercera edicin, 1998). Wonnacott, Thomas H., Ronald J. Wonnacot, Introductory Statistics for Business and Economics, 2 ed., John Wiley, 1977. Zuwaylif, Fadil H., Estadstica general aplicada, Addison-Wesley

Iberoamericana, 1987.
EJERCICIOS

1. Suponga que una empresa de encuestas encuentra la siguiente informacin acerca de si se favorece o no la legalizacin del consumo de droga. La muestra se ha dividido segn la siguiente tabla:

139

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Menor de 30 aos. Mayor de 30 aos.

A favor 26% 19%

En contra 21% 34%

Si se escoge un individuo en forma aleatoria, cul es la probabilidad que sea A favor de la legalizacin? A favor de la legalizacin, si es menor de 30 aos? A favor de la legalizacin, si es mayor de 30 aos? 2. Una universidad matricula 10.000 estudiantes, de los cuales 4.950 son mujeres y 5.050 son hombres. Si la Facultad de Ingeniera tiene 20% de las mujeres y 35% de los hombres, si se escoge a un estudiante de manera aleatoria, cul es la probabilidad que sea mujer? que sea hombre?

3. Simule el lanzamiento de un dado de seis caras utilizando la frmula =ALEATORIO de Excel. Esta frmula arroja nmeros menores que 1, cuya caracterstica es que los dgitos que lo conforman provienen de un universo en el cual los dgitos de 0 a 9 tienen igual probabilidad de aparecer. Para simular el lanzamiento de un dado de seis caras con valores de 1 a 6, descarte los dgitos 7, 8, 9 y 0.

140

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Construya la grfica en cada caso, calcule la media, la varianza y la desviacin estndar de la muestra y del universo, para los siguientes casos: Para 25 casos. Para 100 casos. Para 500 casos. Para diez millones de casos (haga un estimativo basado en la informacin de los casos anteriores). 5. Para una perinola de siete caras, donde a cada cara se le asigna un nmero de 1 a 7, calcule en forma analtica, esto es, sin hacer lanzamientos, la media y la varianza del valor que aparece en la cara sobre la cual reposa la perinola al haber sido lanzada. Cul es la probabilidad de obtener el valor 5 en la base? Cul es la probabilidad de obtener un valor menor que 6?

141

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Conceptos bsicos de probabilidad .................................................... 2 Deduccin e induccin ............................................................................. 3 Probabilidad ............................................................................................. 5 Propiedades bsicas de la probabilidad .....................................................7 Eventos y sus probabilidades ...................................................................10 Eventos y sus probabilidades ........................................................... 11 Diagramas de Venn .......................................................................... 13 Combinacin de eventos................................................................... 16 Particiones y complementos ............................................................. 23 Probabilidad Condicional y Probabilidad Conjunta ................................. 26 Anlisis Bayesiano....................................................................................29 Independencia Estadstica ...................................................................... 43 Conceptos bsicos de estadstica ..................................................... 46 Estadstica Descriptiva ........................................................................... 46 Distribuciones de probabilidad ............................................................... 48 Histogramas y Tablas ...............................................................................48 Caso discreto ................................................................................... 48 Caso continuo.................................................................................. 55 Estadsticas de una distribucin ............................................................ 58 Tendencia central de la distribucin .........................................................59 La moda........................................................................................... 59 La mediana ...................................................................................... 59 La media o valor esperado ................................................................ 60 Medidas de la dispersin de la distribucin..............................................60 Varianza .......................................................................................... 61 Desviacin estndar ......................................................................... 62 Rango .............................................................................................. 63 Covarianza....................................................................................... 63 Correlacin ...................................................................................... 67 Variable aleatoria ................................................................................... 68 La distribucin de probabilidad discreta ................................................. 72 La Distribucin Binomial ...........................................................................72 La distribucin de probabilidad continua................................................ 77 La Distribucin de Probabilidad Normal....................................................78 Estadstica no paramtrica ..................................................................... 83 La distribucin 2 (chi cuadrado o ji cuadrado).........................................84 Pruebas de normalidad .................................................................... 85 Tablas de contingencia ..................................................................... 88 Tablas 2x2 .................................................................................... 88 Tablas de contingencia rxc ........................................................................91 Pruebas de signo y orden ..........................................................................91

142

Apuntes de Probabilidad y Estadstica para Ingeniera y Administracin Ignacio Vlez Pareja

Prueba de signos.............................................................................. 91 Prueba U de Mann-Whitney ............................................................. 95 Prueba H de Kruskal-Wallis ............................................................. 98 Correlacin de orden ...................................................................... 100 Significancia estadstica de rs ......................................................... 103 Muestreo aleatorio................................................................................ 104 Rangos ................................................................................. 106 Rangos ................................................................................. 108 Frecuencia absoluta ............................................................. 108 Mtodos de pronstico.......................................................................... 113 Mtodos de Suavizacin ....................................................................... 116 Promedios mviles. ..................................................................................116 Suavizacin exponencial .........................................................................118 Suavizacin exponencial simple. .............................................................118 Otros mtodos de suavizacin.................................................................120 Mtodos de Tendencia ......................................................................... 120 Mtodos de Descomposicin ................................................................. 122 Referencias .......................................................................................... 139 EJERCICIOS ............................................................................................139

143

También podría gustarte