Está en la página 1de 9

1

Precisión de un Intervalo de Confianza


Guía practica de R para determinar
Intervalos de confianza
Santiago de Cali, Septiembre 22 de 2009

Intervalo de Confianza para una distribución


Confidence interval for a distribution

Constanza Raque Bastidas *, Diana Sofía Orbes Lasso**,


Diana Katherine Zape Lozada***
UNIVERSIDAD DEL VALLE, DEPARTAMENTO DE ESTADÍSTICA, CALI

....................................................

Resumen

Tomando como Base el libro Bayesian Computation with R, se desea


hallar un intervalo de confianza del 95% para observaciones que
tienen distribución Normal con un tamaño de muestra n, y
desviación estándar σ, llevando a cabo cierta cantidad de
simulaciones en R mediante una serie de comandos donde se quiere
comparar la potencia respecto a el aumento o disminución en el
valor de los parámetros para la respectiva distribucion. También es
utilizado el estudio de Monte Carlo para simular muestras de
diferentes tamaños, observando si el tamaño de muestra y valor de
la potencia es de gran determinación en la precisión del intervalo
de confianza.

Palabras claves: Intervalo de Confianza, Método Monte Carlo

Abstract

Keywords: Interval of Confidence , Method Monte Carlo

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
2

1. Introducción
Un intervalo de confianza representa el nivel de confiabilidad
que tiene el estudio realizado, es decir que tanto en términos
de porcentaje se acertara de los estudios realizados en las
mismas condiciones. Supondremos observaciones con
distribución normal, con tamaños de muestra variables y un
valor de los parametros determinado o calculado.

Intervalo de Confianza:
μx≠μy (la media de X es diferente a la media de Y)

Para un intervalo de confianza del 95%, donde el intervalo de


confianza para esta dado por:

li=(mean(x)-mean(y))-(t*Sp*(sqrt(1/m)+(1/n)))

ls=(mean(x)-mean(y))+(t*Sp*(sqrt(1/m)+(1/n)))

2. Procedimiento
Inicialmente se ha generado de manera independiente dos muestras
aleatorias de cada una de las dos poblaciones objeto de estudio
(X~N(media=0, varianza=2), Y~N(media≠0, varianza=2),).
Seguidamente hemos construido un intervalo del 95% de confianza
para la diferencia de medias de las dos poblaciones. Se ha repetido
estos pasos un número grande de veces (digamos 10.000 veces) y
hemos calculado la potencia simulada de la prueba.

De acuerdo con la simulación hecha anteriormente, donde se han


generado dos muestras aleatorias con distribución normal y medias
diferentes (igual varianza), se ha realizado la prueba T y creado un
intervalo de confianza respectivo para comprobar la diferencia de
medias entre las dos poblaciones, es decir:

Ho: μx=μy (la media de X es igual a la media de Y)


Ha: μx≠μy (la media de X es diferente a la media de Y)

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
3

Además se implemento el método de Monte Carlo en el cual


se considera además del tamaño de muestra y el valor de la
proporción, la precisión que se obtiene al simular 10000 veces
para cada tamaño de muestra n y su correspondiente valor de
parametros, con el fin de comparar los resultados obtenidos a
medida que el tamaño de muestra aumenta y la convergencia
respecto al valor de la diferencia entre las medias.

Se establece un grado de confiabilidad del 95% para ambos


casos.

3. Resultados

3.1 Intervalo de Confianza para la distribución


con diferentes parámetros.

b. Ahora utilizaremos los siguientes escenarios

i) N(0, 1) vs. N(1, 1) ii) N(0, 1) vs. N(10, 1) iii)


N(0, 1) vs. N(100,1)

Como se observa para los tres primeros escenarios en donde ocurre


una diferencia entre las medias de las dos muestras, para los
diferentes puntos se observa las respectivas potencias y valor de
beta no se ve muy alterado ya que lo que cambia son las dimensiones
lo que es de esperar se ya que el aumento de la media en una de las
muestras el intervalo gira en torno a este valor. En los casos
presentados anteriormente se observa la probabilidad de no
rechazar dado que debe rechazar la H o= las medias de las dos
poblaciones son iguales es igual a cero ya que la diferencia entre las
medias es más grande respecto a la de punto i). Por ende para estos
dos caso se estaría rechazando Ho sabiendo que se debe rechazar por
la diferencia entre la media de las dos muestras. Adicionalmente ya
que la potencia de la prueba está definida como 1-β y este resultado
es igual a uno, se refiere a la probabilidad de rechazar la H 0 por ende
identificamos que en estas muestras hay diferencias significativas
entre sus medias, esto es de esperarse ya que las distribuciones
fueron generadas con medias diferentes pero entre mayor sea la
diferencia entre las medias de las muestras la prueba será más
potente y será más sensible a detectar los rechazos.

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
4

Ahora notemos para los siguientes tres escenarios el mismo aumento


entre la diferencia de medias y adicionalmente una aumento en la
varianza de las muestras donde σ2=10.

iv) N(0, 1) vs. N(1,10) v) N(0, 1) vs. N(10,10) vi)


N(0, 1) vs. N(100,10)

Ahora bien analizamos estos otros tres escenarios ya que la


diferencia de los tres escenarios primeros es el aumento en la
varianza de las distribuciones iv) v) vi) por ende la prueba ba a ser
más sensible en sentido contrario cuando aumenta su varianza; para
el caso 1 iv) en la simulación realizada es la distribución que
presenta una menor probabilidad de rechazar la H 0 por ende en el
intervalo construido para probar la diferencia entre las medias de las
dos poblaciones contiene más números cero respecto a los anteriores
tres nombrados al inicio (i), ii), y iii)) y aumentara la probabilidad
de cometer el error tipo II, ya que al yo aumentar la varianza estoy
interactuando al igual con la precisión y exactitud; respecto a la
exactitud se identifica que podría cometerse el error tipo II; para
este caso concreto se presenta una disminución en la potencia de la
prueba de un 18,23% por ende la probabilidad de cometer el error
tipo II ya no es cero sino la mencionada es esta mencionada para el
caso iv) en los casos siguientes v) y vi) ya que el aumento de la
media en una de las poblaciones la prueba lo detecta con facilidad
por el motivo que la diferencia de medias es muy grande; los
resultados para estos caso es de la potencia igual a 1 y la
probabilidad de cometer el error tipo II es cero por ende el intervalo
de confianza construido no va a contener ningún cero que representa
la no diferencia entre medias de las dos poblaciones y la potencia de
la prueba es muy buena ya que para todos los datos construidos con
esa distribución y esos parámetros establecidos todas las unidades
me rechazan la H0 por ende no hay diferencia de medias entre las
dos distribuciones que es lo que se esperaba.

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
5

Grafico 1.1 curva característica de operación

A continuación se observa el grafico de la curva característica y


algunos valores calculados en donde se observa como la potencia de
la prueba crece a medida que la diferencia entre las medias de las
dos muestras es cada vez más grande por ende esta es directamente
proporcional, esto prueba entre mas aumente la varianza de la
distribución, menor será el acenso a uno de la potencia (en donde se
afirman que todos han sido rechazos de la Ho), es decir se demora en
crecer y por ende la probabilidad de cometer el error tipo II que los
no rechazados de verdad deberían ser rechazados es mayor y.

3.2 Intervalo de Confianza para las diferentes


distribuciones con diferentes parámetros.

1
2 2
L | N (  L ,  ) |  
2

 
L

1
2 2
D     | N (  D , D2 ) |
 

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
6

Y efectuaremos las siguientes comparaciones

Para generar las distribuciones asimétricas con los parámetros


requeridos hacemos uso de las propiedades de la esperanza y la
varianza en donde identificamos que:

vii) N(0, 1) vs. L(1,1)

 2  12 
E[ L]  E | N (  L ,  L ) |  E   
   

 2
1
2
2
1
2
1  E | N (  L ,  L ) |      L  1  
   
 2  12 
Var [ L]  Var | N (  L ,  L ) |  Var   
   
1  Var | N (  L ,  L ) |   L  1 y así para cada escenario

De acuerdo a las simulaciones hechas por el paquete R las


distribuciones presentan la ausencia del error tipo II ya que el β =
la probabilidad de no rechazos a la H 0 dado que debe haber rechazos
porque existe diferencia de medias entre las muestras, hallado es
cero, por ende todos los intervalos de confianza construidos con un
nivel de confianza del 95% para las dos muestras con sus respectivas
distribuciones y parámetros no contienen el valor cero lo que dice,
que cero es no hay diferencia de medias entre las muestras. Por ende
la prueba será muy potente y para esta distribución con sus
respectivos parámetros será igual a 1, es decir que inmediatamente
se identificara con esta distribución y estos parámetros que hay
diferencias significativas entre sus medias análogamente, con una
significancia del 5%, el valor de la diferencia de medias entre estas
dos distribuciones, no tomara el valor de cero.

viii) N(0, 1) vs. L(10,1) ix) N(0, 1) vs. L(10,10)

x) L(0, 1) vs. D(1,1)

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
7

 2  12 
E[ L]  E | N (  L ,  L ) |  E   
   
 2
1
2
2
1
2
0  E | N (  L ,  L ) |     L   
   
 2  12 
Var [ L]  Var | N (  L ,  L ) |  Var   
   
1  Var | N (  L ,  L ) |   L  1

 2  12 
E[ D ]  E     E | N (  D ,  D ) |

  
 2
1
2
2
1
2
1    E | N (  D ,  D ) |   D    1
   
 2  12 
Var [ D ]  Var     Var | N (  D ,  D ) |
   
1  Var | N (  D ,  D ) |   D  1

xi) L(0, 1) vs. D (10,1)

xii) L(0, 1) vs. D(10,10)

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
8

4. Conclusiones

 Por medio de las diferentes simulaciones realizadas en donde


varían la distribución tamaños de muestra y sus diferentes
parametros se identifico los diferentes movimientos o valores
que puede tomar la potencia de la prueba o el error tipo II ya
que identificando estas probabilidades nos ayudan a tomar una
decisión correcta o con mayor certeza respecto a un hipótesis o
problema planteado.

 A medida que la diferencia entre los valores generados para


probar la hipótesis nula en este caso la diferencia de medias a
medida que aumenta aumenta el valor de la potencia de la
prueba y por ende disminuye la probabilidad de cometer el
error tipo II.

 Al hacer un incremento en la varianza de las distribuciones


nuestras estimaciones serán menos precisas y exactas por
ende se observa un crecimiento lento en la potencia de la
prueba.

Referencias

Albert, J. (2007) Bayesian Computation with R, Springer.


Correa, J. C. y González, N. (2002) Introducción al R, Universidad
Nacional de
Colombia, Sede Medellín.

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com
9

Constanza Raquel Bastidas


constanzabm81@hotmail.com
Diana Sofía Orbes Lasso totyorbes@hotmail.com
Diana Katherine Zape beyonce699@hotmail.com

También podría gustarte