Está en la página 1de 10

INTRODUCCIÓN A LA ESTADÍSTICA

2do SEMESTRE 2020


PRÁCTICO 2

Aclaración
(*) Ejercicio de dificultad alta.
(**) Ejercicio de gran dificultad (optativos).

1. Un estudio sobre la relación entre el nivel de ingresos y la preferencia por una de tres marcas de automóvi-
les en la Ciudad de Buenos Aires arroja los siguientes datos (las cifras están expresadas en unidades de
mil e indican el número de personas que caen en cada categorı́a):

Nivel de ingresos
Bajo Medio Alto
Chev 10 13 2
VW 20 12 8
Fiat 10 15 10

Suponé que se elegirá una persona al azar del grupo de individuos que participó del estudio. Definı́ los
siguientes eventos: C = la marca del auto es Chevrolet, W = la marca del auto es VW, F = la marca
del auto es Fiat, A = el individuo tiene nivel de ingresos alto, M = el individuo tiene nivel de ingresos
medio, B = el individuo tiene nivel de ingresos bajo.

Calculá:
(a) P (F∣ A).
(b) P (M ∣ Cc ).
(c) P (M ∣ W).
(d) P (B ∪ M ∣ W).
(e) P (M ∣ W ∪ F).
(f) Suponé ahora que un cliente se presenta en una consecionaria ubicada en la Ciudad de Buenos
Aires. La consecionaria recaba información sobre el nivel de ingresos del cliente y decide que tiene
nivel de ingresos medios. El gerente de la consecionaria concluye que la probabilidad de que el
cliente prefiera un FIAT es 0.375. ¿Qué cálculo realizó el gerente para arribar a esta cifra? ¿Bajo
que supuestos el cálculo realizado es la probabilidad de que el cliente prefiera un FIAT?.
2. Si se sabe que una pareja tiene dos hijos de los cuales la mayor es mujer, ¿cuál es la probabilidad de que
la hija menor sea mujer?

1
3. El código de R que se muestra a continuación simula las situaciones inciertas en los dos problemas en
los que calculamos la probabilidad condicional de dos hijas mujeres dadas distintas evidencias que se
discutieron en una clase teórica.

# Primero d e b e s i n s t a l a r l o s p a q u e t e s t i d y v e r s e y l u e g o c a r g a r las librerias


# g g p l o t 2 , t i b b l e y r e s h a p e 2 usando l o s comandos

i n s t a l l . packages ( ” t i d y v e r s e ” )
l i b r a r y ( tibble )
l i b r a r y ( ggplot2 )
l i b r a r y ( reshape2 )

# Ahora d e f i n i m o s l a f u n c i o n do s . h i j o s ( n ) que g e n e r a l a t a b l a d e l
# e j e r c i c i o 3 con n f i l a s

d o s . h i j o s <− f u n c t i o n ( n ) {
h i j o 1 <− f a c t o r ( sample ( c ( ”m” , ”v” ) , n , r e p l a c e=T ) )
h i j o 2 <− f a c t o r ( sample ( c ( ”m” , ”v” ) , n , r e p l a c e=T ) )
h i j o s <− t i b b l e ( h i j o 1 = h i j o 1 , h i j o 2 =h i j o 2 )
s o r t e a d o <− a p p l y ( h i j o s , 1 , f u n c t i o n ( x ) sample ( x , s i z e =1) )
a l . m e n o s . u n a . m u j e r <− h i j o 1==”m” | h i j o 2==”m”
d o s . m u j e r e s <− h i j o 1==”m” & h i j o 2==”m”
t a b l a <− t i b b l e ( h i j o 1 = h i j o 1 , h i j o 2 =h i j o 2 , m . 1 . o . 2 = a l . m e n o s . u n a . m u j e r ,
h i j o . c a l l e = s o r t e a d o , m .2= d o s . m u j e r e s )
tabla
}

# Ahora d e f i n i m o s l a f u n c i o n g r a f i c o s ( t a b l a ) que p a r a l o s d a t o s
# de ” t a b l a ” , g e n e r a e l g r a f i c o con l a s do s f r e c u e n c i a s r e l a t i v a s condicionales
# como en e l e j e r c i c i o 3 .

g r a f i c o s <− f u n c t i o n ( t a b l a ) {
n . s o r t e a d o <− cumsum ( t a b l a [ ” h i j o . c a l l e ” ] == ”m” )
n . a l . m e n o s . u n a . m u j e r <−cumsum ( t a b l a [ ”m. 1 . o . 2 ” ] == T )
n . d o s . m u j e r e s <−cumsum ( t a b l a [ ”m. 2 ”]== T )
f r e c . d a d a . s o r t e a d o <− n . d o s . m u j e r e s / n . s o r t e a d o
f r e c . d a d a . a l . m e n o s . u n a . m u j e r <− n . d o s . m u j e r e s / n . a l . m e n o s . u n a . m u j e r
f r e c <− t i b b l e ( a l . m e n o s . u n a . m u j e r = f r e c . d a d a . a l . m e n o s . u n a . m u j e r ,
encuentro . calle = frec . dada . sorteado ,
n = 1: length ( n . sorteado ) )
f r e c . m <− m e l t ( f r e c , i d . v a r s =”n” ,
m e a s u r e . v a r s = c ( ” a l . menos . una . mujer ” , ” e n c u e n t r o . c a l l e ” ) )
g g p l o t ( f r e c . m , a e s ( n , v a l u e , c o l o r = v a r i a b l e ) )+
g e o m l i n e ( )+
l a b s ( c o l o u r=” f r e c u e n c i a r e l a t i v a dado ” ,
x=” numero de f a m i l i a s ” ,
y=” f r e c u e n c i a r e l a t i v a ” )
}

# Para g e n e r a r una t a b l a de 10 f i l a s usa e l comando

t a b l a <− d o s . h i j o s ( 1 0 )

# Para g e n e r a r el g r a f i c o de f r e c u e n c i a s r e l a t i v a s u sa e l comando

graficos ( tabla )

La función dos.hijos(n) produce una tabla con datos de n familias de dos hijos, con los sexos de
los dos hijos generados al azar.
La función graficos(tabla) produce un gráfico con dos frecuencias relativas condicionales distin-
tas.
La tabla tiene n filas (cada fila corresponde a una familia) y cinco columnas.
Las dos primeras columnas, llamadas hijo1 e hijo2, registran los sexos del hijo mayor y el hijo
menor respectivamente (v = varon, m = mujer).
La tercer columna, llamada m.1.o.2, registra TRUE si al menos uno de los hijos es mujer y FALSE
si los dos hijos son varones.
La cuarta columna, llamada hijo.calle, registra el sexo de uno de los dos hijos elegido al azar con
probabilidad 1/2 entre los dos hijos.

2
La quinta columna, llamada m.2, registra TRUE si los dos hijos son mujeres y FALSE en caso
contrario.
Por ejemplo, un llamado a los comandos;

t a b l a <− d o s . h i j o s ( 1 0 )
tabla
graficos ( tabla )

produjo la siguiente tabla y su correspondiente gráfico:

3
(a) Considerá los eventos:

B1 = “Al menos dos hijas son mujeres”


B2 = “Hoy me cruce con uno de los hijos de la f amilia y resulto ser mujer”.

Para la familia de la fila 5 de la tabla, ¿se verifica B1 ?, ¿se verifica B2 ? Usando esta observación,
intentá convencerte de por qué la probabilidad condicional de dos hijas mujeres dado B1 es menor
que la probabilidad condicional de dos hijas mujeres dado B2 .
(b) Llamando nuevamente a los tres comandos anteriormente indicados, R devuelve una nueva tabla
y un nuevo gráfico. Aquı́ abajo se muestra el nuevo gráfico pero no la nueva tabla. Tu tarea es
completar, a partir del nuevo gráfico, todos los elementos de la nueva tabla que puedas deducir.

(c) Con los comandos siguientes se obtiene un nuevo gráfico:

t a b l a <− d o s . h i j o s ( 1 0 0 0 )
graficos ( tabla )

4
¿A qué valores convergen las dos frecuencias relativas?. ¿Por qué convergen a valores distintos?
4. Se realizó un sondeo de 500 parejas para averiguar su nivel de ingreso. La siguiente tabla registra los
resultados del sondeo. Asi, por ejemplo, en 212 parejas se registró qué marido y mujer ganan ambos
menos de 30000$ al mes.

Esposo
Esposa Menos de 30000$ Más de 30000$
Menos de 30000$ 212 198
Más de 30000$ 36 54
Si una pareja es elegida al azar entre las 500 que participaron en el sondeo,
(a) ¿Cuál es la probabilidad de que el esposo gane menos de 30000 pesos?
(b) ¿Cuál es la probabilidad de que la mujer gane menos de 30000$ dado que su marido gana mas de
30000 pesos?
(c) ¿Cuál es la probabilidad de que el marido gane menos de 30000 pesos dado que su mujer gana mas
de 30000 pesos
5. Demostrá las siguientes afirmaciones:
(a) Si P (A∣B) = P (A∣B c ) entonces P (A∣B) = P (A)
(b) Si P (A∣B) = P (A) entonces P (A∣B) = P (A∣B c )
6. Para el ejercicio anterior, proveé tres ejemplos de experimentos o situaciones inciertas y eventos A y B
para los que es razonable asumir que P (A∣B) = P (A∣B c ) .
7. Sea C el evento de que Juan Pérez es culpable de un cierto robo. Con las evidencias recogidas hasta
el momento, el fiscal del caso le asigna un cierto valor a la probabilidad P (C) de que Juan Pérez sea
culpable. Un ayudante del fiscal descubre que un cierto evento A ha ocurrido y corrige la probabilidad del
fiscal, calculando ahora P (C∣A) y obteniendo que P (C∣A) > P (C) , o sea que la evidencia A es evidencia
en contra de la inocencia del acusado. Sin comunicarse con este ayudante, otro ayudante recoge otra
evidencia B, y calcula la nueva probabilidad como P (C∣B) obteniendo también que P (C∣B) > P (C) .
Ambos ayudantes presentan las evidencias recogidas al fiscal, quien re-calcula la probabilidad como
P (C∣A ∩ B) . Sin embargo, el fiscal obtiene ahora que P (C∣A ∩ B) < P (C) calculando entonces que
conocer que ambos A y B ocurrieron disminuye la probabilidad de culpabilidad de Juan Pérez.
¿Es posible este resultado? De ser ası́, da un ejemplo de A y B que verifiquen lo expuesto; de lo contrario,
explica cuál fue el error en el cálculo del fiscal.
8. Demostrá que si P (A) = 1, entonces P (A∣B) = 1 para cualquier B tal que P (B) > 0. Proveé una
interpretación intuitiva de este resultado.
9. Demostrá que si P (A∣B) = P (B∣A) entonces P (A) = P (B) .
10. La siguiente es una historia real. En 1998, la señora Sally Clark fue juzgada en Estados Unidos por
asesinato de sus dos hijos. Sus hijos habian nacido sin ningún problema orgánico detectable pero sin
embargo murieron casi inmediatamente después de haber nacido. Durante el juicio, un testigo experto en
probabilidad presentado por la fiscalı́a calculó que la probabilidad de que dos recién nacidos e hijos de una
misma madre mueran de muerte súbita es 1/73,000,000. El experto entonces adujo que la probabilidad
de que la señora Clark fuera inocente era 1/73,000,000.
Sally Clark fue declarada culpable de asesinato y enviada a la cárcel, en una medida debido al testimonio
del experto. La señora Clark pasó más de tres años en prisión antes de que su condena fuera revocada
debido a que nuevos expertos explicaron el error en la lógica del experto presentado por la fiscalı́a. La
protesta por el mal uso de la probabilidad en el caso de Sally Clark llevó a la revisión de cientos de otros
casos en que se utilizó una lógica defectuosa similar.

5
¿Cuál fue el error en la lógica del experto presentado por la fiscalı́a?. ¿Qué probabilidad deberı́a haber
calculado el experto y por qué sabemos casi con certeza que la probabilidad que deberı́a haber calculado
no es igual a la que calculó?
Cuando pienses tu respuesta ten presente que la probabilidad de que dos recién nacidos hijos de una
misma madre mueran de muerte súbita igual a 1/73,000,000 es aproximadamente correcta.

11. Una mujer fue asesinada. La investigación del caso ha dado a luz evidencia de que la mujer habı́a tenido
una larga historia de abuso por parte del marido. El abogado defensor argumenta que la evidencia de
abuso debe ser excluı́da del caso por razones de irrelevancia, ya que sólo 1 de cada 10000 maridos son
abusadores.
¿Debe el juez aceptar el argumento del abogado defensor? Explique su respuesta indicando con precisión
qué probabilidad representa la tasa de 1 en 10000 y qué probabilidad es relevante para el caso en cuestión.

12. De acuerdo a las estadı́sticas recogidas por una cierta universidad, de los estudiantes que ingresaron hace
cuatro años, el 35 % de los alumnos recibieron becas. El 82 % de los que recibieron becas se graduaron y
el 44 % de los que no recibieron becas se graduaron. Considerá el primer alumno de la lista alfabética de
todos los estudiantes que inciaron estudios en la universidad hace cuatro años, ¿cuál es la probabilidad
de que se haya graduado?

13. Es diciembre, y mañana voy a visitar una ciudad de la cual desconozco su pronóstico meteorológico; sólo
tengo la información que proveen las guı́as turı́sticas. Las cuales indican que durante el mes de diciembre:
El 60 % de los dı́as son lluviosos.
En el 80 % de los dı́as lluviosos, el dı́a siguiente también es lluvioso.
En el 30 % de los dı́as soleados, el dı́a siguiente es lluvioso
(a) ¿Cuál es la probabilidad de que me toquen dos dı́as soleados?
(b) ¿Cuál es la probabilidad de que me toque al menos un dı́a soleado?
14. Demostrá que si P (A∣C) < P (B∣C) y P (A∣C c ) < P (B∣C c ) entonces P (A) < P (B) . Además de dar
la demostración matemática, describı́ intuitivamente qué dice este resultado en términos de evidencia y
probabilidad.
15. Paradoja de Simpson. Las siguientes tablas registran el número de alumnos que solicitaron ingreso
a una cierta universidad el año pasado desagregados por sexo, carrera, y si fueron aceptados o no.

Mujeres
Ciencias Ciencias
sociales exactas
Aceptados 700 100
Rechazados 200 0

Hombres
Ciencias Ciencias
sociales exactas
Admitido 20 810
Rechazados 80 90
Considerá ahora elegir un alumno al azar entre los que solicitaron ingreso el año pasado y definı́ los
siguientes eventos

I = “El alumno ingreso a la universidad”


V = “El alumno es varon”.

6
Luego de publicar estas tablas la universidad recibe una denuncia por discriminación. El argumento
empleado es el siguiente; supongamos que elegimos un alumno al azar entre los que solicitaron ingreso
el año pasado. Con los eventos anteriormente definidos es posible verificar que

P (I∣V ) > P (I∣V c ) (1)

Luego la frecuencia con la que los varones sean admitidos es mayor que la frecuencia con la que las
mujeres sean admitidas.
La universidad contrata a un experto en estadı́stica para que la asesore en cómo responder a la demanda,
quien define el evento

C = “La carrera que solicito entrar el alumno es ciencias sociales”,

y calcula que

P (I∣V, C) < P (I∣V c , C)


P (I∣V, C c ) < P (I∣V c , C c )

A partir de esto, el experto argumenta que la demanda es infundada porque la frecuencia de admisión,
desagregada por carrera, es mayor entre las mujeres que entre los hombres.
(a) Calculá las probabilidades condicionales calculadas por los denunciantes y por el experto. Corroborá
que efectivamente se verifican las desigualdades.
(b) ¿Quién te parece que tiene razón, el experto o los denunciantes? ¿Hubo o no hubo discriminación?
¿Cómo se podrı́a explicar que el orden de la desigualdad (1) se revierte al desagregar por tipo de
carrera?
Al fenómeno de reversión del sentido de una desigualdad al desagregar se lo conoce como La paradoja
de Simpson.
16. Resolvé el siguiente problema de dos formas distintas, siendo una de ellas la regla de multiplicación.
En la sala de espera de mi médico hay una pila de 15 revistas entre las cuales hay cuatro que ya leı́. Si
agarro las dos primeras revistas de la pila, ¿Cuál es la probabilidad de que entre las dos revistas que
agarro,
(a) no haya ninguna de las que ya leı́?
(b) las haya leı́do a todas?
(c) haya leı́do una?

17. En la clase de Introducción a la Estadistica del año pasado hubo 300 inscriptos, 216 aprobaron el parcial
y el 90 % de los que aprobaron el parcial también aprobaron el final. ¿Cuál es la probabilidad de que el
primer alumno de la lista alfabética de los alumnos de la clase haya aprobado ambos exámenes?
18. Leı́ en un folleto que el 80 % de los autobuses de la compañı́a Riviera que hacen el recorrido de Buenos
Aires a Mar del Plata parten sin retraso y el 72 % de los autobuses parten y arriban sin retraso.
Acabo de salir hacia Mar del Plata en un autobús de la compañı́a Riviera que partió a horario desde
Buenos Aires. ¿Cuál es la probabilidad de que arribe a horario?
19. (*) Como parte de una estrategia de promoción, una tienda online invita a sus clientes a anotarse en
un sorteo por un viaje todo incluido para dos personas al Caribe. El sorteo se hará un dı́a determinado
de un bolillero con bolillas numeradas con el código de cliente de cada participante. La siguiente tabla
provee información sobre el número de clientes que se registraron para participar del sorteo, clasificados
de acuerdo a si han sido clientes por menos o más de un año y si han hecho más o menos de dos compras
durante el último año:

7
Dos o menos Mas de dos
compras compras
Menos de un año 216 264
Más de un año 384 1056

Con el objetivo de aumentar las chances de que salga sorteado un cliente de menos de un año, la tienda
hará trampa y en vez de incluir en el bolillero una bolilla por cada cliente, incluirá m bolillas por cada
cliente de menos de un año y n bolillas por cada cliente de mas de un año, de modo tal que la probabilidad
de que salga sorteado un cliente de menos de un año sea 7 veces mayor que la de que salga sorteado un
cliente de mas de un año.
(a) ¿Cuáles pueden ser n y m?
(b) Para el sorteo con trampa,
¿Cuál es la probabilidad de que salga sorteado un cliente de menos de un año que hizo más de
dos compras durante el último año?
¿Cuál es la probabilidad de que salga sorteado un cliente de menos de un año si alguien nos
informa que el ganador es un cliente que hizo más de dos compras durante el último año?
20. El juego de Monty Hall. En un certamen televisivo hay tres ventanas cerradas. Detrás de cada una
de dos ventanas hay un florero y detrás de la ventana restante hay un sobre con un millón de pesos.
El concursante abrirá una ventana y se quedará con lo que haya detrás de ella. El juego consiste en los
siguientes pasos:
El concursante elige una ventana pero no la abre.
El conductor -que sabe en que ventana esta el premio- abre una ventana que tiene un florero entre
las que no fueron elegidas por el consursante (en caso de que las dos ventanas disponibles tengan
floreros, elige la ventana al azar tirando una moneda).
Finalmente el concursante puede elegir abrir la ventana que habı́a elegido inicialmente o la ventana
que dejó sin abrir el conductor.
Si el concursante está al tanto de que el conductor nunca abrirá la ventana con el premio de un millón de
pesos, calculá la probabilidad de ganar el millón de pesos para cada una de las siguientes estrategias y
decidı́ cuál es la preferible o si son todas igualmente deseables. Además, describı́ intuitivamente usando
la interpretación frecuentista, la probabilidad de cada estrategia.
(a) El concursante siempre abre la ventana que eligió incialmente.
(b) (*) El concursante siempre abre la ventana que dejó sin abrir el conductor
(c) (**) El concursante tira una moneda balanceada y si sale cara abre la ventana elegida inicialmente
y si sale seca abre la ventana que dejó sin abrir el conductor.
(d) (**) El concursante tira un dado balanceado, y si cae en 1 abre la ventana elegida inicialmente, de
lo contrario abre la ventana que dejó sin abrir el conductor.
(e) (**) El concursante tira un dado balanceado, y si sale 2,3,4,5 o 6 abre la ventana elegida inicialmente,
de lo contrario abre la ventana que dejó sin abrir el conductor.
(f) Optativo. El concursante tira una moneda “pesada” con probabilidad p de que salga cara. Si sale cara
abre la ventana elegida inicialmente y si sale seca abre la ventana que dejó sin abrir el conductor.
21. (*) El juego de Monty Hall modificado. Suponé ahora que en vez de tres ventanas hay 1000 venta-
nas. El concursante elige inicialmente una ventana y el conductor Monty abre 998 ventanas, todas ellas
con floreros, es decir siempre asegurándose que ninguna de las ventanas que abra tenga el premio mayor.
Si todas las 999 ventanas a su disposición tienen floreros, elige cual no abrir al azar.
Calculá la probabilidad de ganar el millón de pesos para las estrategias (a) y (c) del ejercicio ante-
rior. Nuevamente, describi intuitivamente la probabilidad de cada estrategia usando la interpretación
frecuentista.

8
22. (*) Un investigador conducirá un sondeo con el objetivo de estimar el porcentaje de gente en la población
que consume drogas ilı́citas. Preocupado de que mucha gente mentirá si se le pregunta directamente
“¿Ha consumido drogas ilı́citas alguna vez?” el investigador usará un método de sondeo conocido como
de respuesta aleatoria. A continuación se realiza una descripción del método:
Un sombrero tiene muchos papelitos, todos del mismo tamaño y forma.
En algunos de ellos dice la frase “He consumido drogas ilegales” y en los restantes dice “No he
consumido drogas ilegales”.
El entrevistado saca un papelito al azar del sombrero y sin mostrarle la pregunta escrita en el
papelito a su entrevistador, contesta diciendo “Si, es cierto” o “No, no es cierto” a la afirmación
que lee en el papelito (el entrevistado no tiene ninguna razón para mentir porque el entrevistador
no sabe a qué afirmación esta respondiendo el entrevistado.
Este proceso se repite con todos los participantes del sondeo, reponiendo el ticket en el sombrero
cada vez la respesta fue emitida.
Sea p la proporción de tickets con la afirmación “He consumido drogas ilegales” (el entrevistador, por
supuesto, conoce el valor de p ya que él es quien preparó el sombrero y los tickets), sea q la probabilidad
de que un participante responda “Si, es cierto” y sea r la proporción de gente que consume drogas
ilegales.
Asumiendo que los participantes del sondeo fueron elegidos al azar entre todos los habitantes de la
población, expresá a r en función de q y p. ¿Para qué te sirve expresar a r en función de q y p? ¿Cómo
usarı́as esta expresión junto con los datos del sondeo para estimar el porcentaje de gente que consume
drogas ilı́citas?

23. Optativo. (**) Muchas compañı́as que ofrecen servicios en la web usan un tipo de experimento aleatori-
zado llamado “bandido de dos brazos” -en inglés, “two-arm bandit”- para averiguar cómo los usuarios de
la web reaccionan a dos distintos tipos de estı́mulos, A y B (por ejemplo, para averiguar cómo reaccionan
frente a dos tipos distintos de propagandas en la web).
A cada usuario se le presenta uno de los dos tipos de estı́mulos, siendo este elegido mediante algún
mecanismo en el que intervenga el azar para garantizar objetividad en el estı́mulo asignado. Para cada
usuario, se designa al resultado del ensayo como “Éxito” si el usuario reacciona positivamente al estı́mulo
(por ejemplo, si clickea en la ventana de la propaganda), de lo contrario se lo designa como “Fracaso”.
Un método para la asignación aleatoria del estı́mulo es mediante el ası́ llamado “método totalmente alea-
torio” que consiste simplemente en tirar una moneda balanceada y en caso de que caiga cara asignar al
usuario el estı́mulo A y en caso de que caiga seca asignar el estı́mulo B. Sin embargo, esta asignación no
es la usada habitualmente porque, como probarás en uno de los incisos de este problema, no maximiza
la probabilidad incondicional de cliquear en la propaganda.
Los analistas han estudiado distintos métodos para asignar aleatoriamente los estı́mulos a los usuarios
de modo de maximizar la probabilidad incondicional de cliqueo. Uno de los métodos propuestos es el ası́
llamado “siga al ganador ” que consiste en lo siguiente:
Para la asignación del primer usuario, se tira una moneda balanceda. Si cae cara se le presenta al
usuario el estı́mulo A y si sale seca, el estı́mulo B.
La asignación del usuario n + 1 depende de la respuesta del usuario n. Si la respuesta del ensayo
con el usuario n fue “Éxito”, entonces al usuario n + 1 se le asigna el mismo estı́mulo que al usuario
n. De lo contrario, se le asigna el estı́mulo que no recibió el usuario n.
Sean a y b las probabilidades de éxito frente a los estimulos A y B respectivamente y supongamos que
a =/ b. Para el método “siga al ganador ”, sea pn la probabilidad de éxito del ensayo con el usuario n y
sea an la probabilidad de que el tratamiento A es asignado al usuario n.
(a) Para el método “totalmente aleatorio” probar que la probabilidad de éxito del ensayo con cualquier
usuario es constante e igual a p∗ = (a + b) /2.

9
(b) Para el método “siga al ganador ” probar las siguientes igualdades:

pn = (a − b)an + b
an+1 = (a + b − 1)an + 1 − b,

y deducir a partir de estas dos igualdades que

pn+1 = (a + b − 1)pn + a + b − 2ab

(c) Asumiendo que p∗∗ = lı́mn→∞ pn existe, calcular p∗∗ y demostrar que p∗∗ > p∗ .
Notar que este resultado demuestra que “a la larga”, es decir cuando el numero de usuarios n es
grande, la probabilidad de cliqueo es mayor bajo el método “siga al ganador ” que bajo el método
“totalmente aleatorio”.

10

También podría gustarte