Tarea 1

1
Precisión de un Intervalo de Confianza

Guía practica de R para determinar
Intervalos de confianza
Santiago de Cali, Septiembre 22 de 2009
Intervalo de Confianza para una distribución

Confidence interval for a distribution
Constanza Raque Bastidas *, Diana Sofía Orbes Lasso**,

Diana Katherine Zape Lozada***
UNIVERSIDAD DEL VALLE, DEPARTAMENTO DE ESTADÍSTICA, CALI
....................................................
Resumen
Tomando como Base el libro Bayesian Computation with R, se desea

hallar un intervalo de confianza del 95% para observaciones que
tienen distribución Normal con un tamaño de muestra n, y
desviación estándar σ, llevando a cabo cierta cantidad de
simulaciones en R mediante una serie de comandos donde se quiere
comparar la potencia respecto a el aumento o disminución en el
valor de los parámetros para la respectiva distribucion. También es
utilizado el estudio de Monte Carlo para simular muestras de
diferentes tamaños, observando si el tamaño de muestra y valor de
la potencia es de gran determinación en la precisión del intervalo
de confianza.
Palabras claves: Intervalo de Confianza, Método Monte Carlo
Abstract
Keywords: Interval of Confidence , Method Monte Carlo
Constanza Raquel Bastidas

constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
2
1. Introducción
Un intervalo de confianza representa el nivel de confiabilidad
que tiene el estudio realizado, es decir que tanto en términos
de porcentaje se acertara de los estudios realizados en las
mismas condiciones. Supondremos observaciones con
distribución normal, con tamaños de muestra variables y un
valor de los parametros determinado o calculado.
Intervalo de Confianza:
μx≠μy (la media de X es diferente a la media de Y)
Para un intervalo de confianza del 95%, donde el intervalo de

confianza para esta dado por:
li=(mean(x)-mean(y))-(t*Sp*(sqrt(1/m)+(1/n)))
ls=(mean(x)-mean(y))+(t*Sp*(sqrt(1/m)+(1/n)))
2. Procedimiento
Inicialmente se ha generado de manera independiente dos muestras
aleatorias de cada una de las dos poblaciones objeto de estudio
(X~N(media=0, varianza=2), Y~N(media≠0, varianza=2),).
Seguidamente hemos construido un intervalo del 95% de confianza
para la diferencia de medias de las dos poblaciones. Se ha repetido
estos pasos un número grande de veces (digamos 10.000 veces) y
hemos calculado la potencia simulada de la prueba.
De acuerdo con la simulación hecha anteriormente, donde se han

generado dos muestras aleatorias con distribución normal y medias
diferentes (igual varianza), se ha realizado la prueba T y creado un
intervalo de confianza respectivo para comprobar la diferencia de
medias entre las dos poblaciones, es decir:
Ho: μx=μy (la media de X es igual a la media de Y)

Ha: μx≠μy (la media de X es diferente a la media de Y)

3
Además se implemento el método de Monte Carlo en el cual

se considera además del tamaño de muestra y el valor de la
proporción, la precisión que se obtiene al simular 10000 veces
para cada tamaño de muestra n y su correspondiente valor de
parametros, con el fin de comparar los resultados obtenidos a
medida que el tamaño de muestra aumenta y la convergencia
respecto al valor de la diferencia entre las medias.
Se establece un grado de confiabilidad del 95% para ambos

casos.
3. Resultados
3.1 Intervalo de Confianza para la distribución

con diferentes parámetros.
b. Ahora utilizaremos los siguientes escenarios
i) N(0, 1) vs. N(1, 1) ii) N(0, 1) vs. N(10, 1) iii)

N(0, 1) vs. N(100,1)
Como se observa para los tres primeros escenarios en donde ocurre

una diferencia entre las medias de las dos muestras, para los
diferentes puntos se observa las respectivas potencias y valor de
beta no se ve muy alterado ya que lo que cambia son las dimensiones
lo que es de esperar se ya que el aumento de la media en una de las
muestras el intervalo gira en torno a este valor. En los casos
presentados anteriormente se observa la probabilidad de no
rechazar dado que debe rechazar la H o= las medias de las dos
poblaciones son iguales es igual a cero ya que la diferencia entre las
medias es más grande respecto a la de punto i). Por ende para estos
dos caso se estaría rechazando Ho sabiendo que se debe rechazar por
la diferencia entre la media de las dos muestras. Adicionalmente ya
que la potencia de la prueba está definida como 1-β y este resultado
es igual a uno, se refiere a la probabilidad de rechazar la H 0 por ende
identificamos que en estas muestras hay diferencias significativas
entre sus medias, esto es de esperarse ya que las distribuciones
fueron generadas con medias diferentes pero entre mayor sea la
diferencia entre las medias de las muestras la prueba será más
potente y será más sensible a detectar los rechazos.

4
Ahora notemos para los siguientes tres escenarios el mismo aumento

entre la diferencia de medias y adicionalmente una aumento en la
varianza de las muestras donde σ2=10.
iv) N(0, 1) vs. N(1,10) v) N(0, 1) vs. N(10,10) vi)

N(0, 1) vs. N(100,10)
Ahora bien analizamos estos otros tres escenarios ya que la

diferencia de los tres escenarios primeros es el aumento en la
varianza de las distribuciones iv) v) vi) por ende la prueba ba a ser
más sensible en sentido contrario cuando aumenta su varianza; para
el caso 1 iv) en la simulación realizada es la distribución que
presenta una menor probabilidad de rechazar la H 0 por ende en el
intervalo construido para probar la diferencia entre las medias de las
dos poblaciones contiene más números cero respecto a los anteriores
tres nombrados al inicio (i), ii), y iii)) y aumentara la probabilidad
de cometer el error tipo II, ya que al yo aumentar la varianza estoy
interactuando al igual con la precisión y exactitud; respecto a la
exactitud se identifica que podría cometerse el error tipo II; para
este caso concreto se presenta una disminución en la potencia de la
prueba de un 18,23% por ende la probabilidad de cometer el error
tipo II ya no es cero sino la mencionada es esta mencionada para el
caso iv) en los casos siguientes v) y vi) ya que el aumento de la
media en una de las poblaciones la prueba lo detecta con facilidad
por el motivo que la diferencia de medias es muy grande; los
resultados para estos caso es de la potencia igual a 1 y la
probabilidad de cometer el error tipo II es cero por ende el intervalo
de confianza construido no va a contener ningún cero que representa
la no diferencia entre medias de las dos poblaciones y la potencia de
la prueba es muy buena ya que para todos los datos construidos con
esa distribución y esos parámetros establecidos todas las unidades
me rechazan la H0 por ende no hay diferencia de medias entre las
dos distribuciones que es lo que se esperaba.

5
Grafico 1.1 curva característica de operación
A continuación se observa el grafico de la curva característica y

algunos valores calculados en donde se observa como la potencia de
la prueba crece a medida que la diferencia entre las medias de las
dos muestras es cada vez más grande por ende esta es directamente
proporcional, esto prueba entre mas aumente la varianza de la
distribución, menor será el acenso a uno de la potencia (en donde se
afirman que todos han sido rechazos de la Ho), es decir se demora en
crecer y por ende la probabilidad de cometer el error tipo II que los
no rechazados de verdad deberían ser rechazados es mayor y.
3.2 Intervalo de Confianza para las diferentes

distribuciones con diferentes parámetros.
1
2 2
L | N (  L ,  ) |  
2
 
L
1
2 2
D     | N (  D , D2 ) |
 

6
Y efectuaremos las siguientes comparaciones
Para generar las distribuciones asimétricas con los parámetros

requeridos hacemos uso de las propiedades de la esperanza y la
varianza en donde identificamos que:
vii) N(0, 1) vs. L(1,1)
 2  12 
E[ L]  E | N (  L ,  L ) |  E   
   
 2
1
2
2
1
2
1  E | N (  L ,  L ) |      L  1  
   
 2  12 
Var [ L]  Var | N (  L ,  L ) |  Var   
   
1  Var | N (  L ,  L ) |   L  1 y así para cada escenario
De acuerdo a las simulaciones hechas por el paquete R las

distribuciones presentan la ausencia del error tipo II ya que el β =
la probabilidad de no rechazos a la H 0 dado que debe haber rechazos
porque existe diferencia de medias entre las muestras, hallado es
cero, por ende todos los intervalos de confianza construidos con un
nivel de confianza del 95% para las dos muestras con sus respectivas
distribuciones y parámetros no contienen el valor cero lo que dice,
que cero es no hay diferencia de medias entre las muestras. Por ende
la prueba será muy potente y para esta distribución con sus
respectivos parámetros será igual a 1, es decir que inmediatamente
se identificara con esta distribución y estos parámetros que hay
diferencias significativas entre sus medias análogamente, con una
significancia del 5%, el valor de la diferencia de medias entre estas
dos distribuciones, no tomara el valor de cero.
viii) N(0, 1) vs. L(10,1) ix) N(0, 1) vs. L(10,10)
x) L(0, 1) vs. D(1,1)

7
 2  12 
E[ L]  E | N (  L ,  L ) |  E   
   
 2
1
2
2
1
2
0  E | N (  L ,  L ) |     L   
   
 2  12 
Var [ L]  Var | N (  L ,  L ) |  Var   
   
1  Var | N (  L ,  L ) |   L  1
 2  12 
E[ D ]  E     E | N (  D ,  D ) |

  
 2
1
2
2
1
2
1    E | N (  D ,  D ) |   D    1
   
 2  12 
Var [ D ]  Var     Var | N (  D ,  D ) |
   
1  Var | N (  D ,  D ) |   D  1
xi) L(0, 1) vs. D (10,1)
xii) L(0, 1) vs. D(10,10)

8
4. Conclusiones
 Por medio de las diferentes simulaciones realizadas en donde

varían la distribución tamaños de muestra y sus diferentes
parametros se identifico los diferentes movimientos o valores
que puede tomar la potencia de la prueba o el error tipo II ya
que identificando estas probabilidades nos ayudan a tomar una
decisión correcta o con mayor certeza respecto a un hipótesis o
problema planteado.
 A medida que la diferencia entre los valores generados para

probar la hipótesis nula en este caso la diferencia de medias a
medida que aumenta aumenta el valor de la potencia de la
prueba y por ende disminuye la probabilidad de cometer el
error tipo II.
 Al hacer un incremento en la varianza de las distribuciones

nuestras estimaciones serán menos precisas y exactas por
ende se observa un crecimiento lento en la potencia de la
prueba.
Referencias
Albert, J. (2007) Bayesian Computation with R, Springer.

Correa, J. C. y González, N. (2002) Introducción al R, Universidad
Nacional de
Colombia, Sede Medellín.

9


Tarea 1

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea 1

Cargado por

Copyright:

Formatos disponibles

1

Precisión de un Intervalo de Confianza

Intervalo de Confianza para una distribución

Constanza Raque Bastidas *, Diana Sofía Orbes Lasso**,

Tomando como Base el libro Bayesian Computation with R, se desea

Palabras claves: Intervalo de Confianza, Método Monte Carlo

Keywords: Interval of Confidence , Method Monte Carlo

Constanza Raquel Bastidas

Para un intervalo de confianza del 95%, donde el intervalo de

De acuerdo con la simulación hecha anteriormente, donde se han

Ho: μx=μy (la media de X es igual a la media de Y)

Constanza Raquel Bastidas

Además se implemento el método de Monte Carlo en el cual

Se establece un grado de confiabilidad del 95% para ambos

3.1 Intervalo de Confianza para la distribución

b. Ahora utilizaremos los siguientes escenarios

i) N(0, 1) vs. N(1, 1) ii) N(0, 1) vs. N(10, 1) iii)

Como se observa para los tres primeros escenarios en donde ocurre

Constanza Raquel Bastidas

Ahora notemos para los siguientes tres escenarios el mismo aumento

iv) N(0, 1) vs. N(1,10) v) N(0, 1) vs. N(10,10) vi)

Ahora bien analizamos estos otros tres escenarios ya que la

Constanza Raquel Bastidas

Grafico 1.1 curva característica de operación

A continuación se observa el grafico de la curva característica y

3.2 Intervalo de Confianza para las diferentes

Constanza Raquel Bastidas

Y efectuaremos las siguientes comparaciones

Para generar las distribuciones asimétricas con los parámetros

vii) N(0, 1) vs. L(1,1)

De acuerdo a las simulaciones hechas por el paquete R las

viii) N(0, 1) vs. L(10,1) ix) N(0, 1) vs. L(10,10)

x) L(0, 1) vs. D(1,1)

Constanza Raquel Bastidas

xi) L(0, 1) vs. D (10,1)

xii) L(0, 1) vs. D(10,10)

Constanza Raquel Bastidas

 Por medio de las diferentes simulaciones realizadas en donde

 A medida que la diferencia entre los valores generados para

 Al hacer un incremento en la varianza de las distribuciones

Albert, J. (2007) Bayesian Computation with R, Springer.

Constanza Raquel Bastidas

Constanza Raquel Bastidas

También podría gustarte