Está en la página 1de 33

21/6/10

Inferencia Estadstica
Distribucin Muestral del Promedio

POBLACIN P : proporcin
: promedio : desviacin estndar

Parmetros

p : proporcin : promedio : desviacin estndar

Estadsticos

MUESTRA

21/6/10

Error de Muestreo Ejemplo

Poblacin

Muestras Posibles

=2 = 0,816

1 1 1 2 2 2 3 3 3

1 2 3 2 1 3 3 1 2

Distribucin Uniforme

21/6/10

Distribucin de una muestra aleatoria de 100 medias de muestras de una distribucin uniforme (0,1)
n = 5 n = 25

n = 50

n = 200

Distribucin Exponencial

21/6/10

Distribucin de una muestra aleatoria de 100 medias de muestras de una distribucin exponencial
n = 5 n = 25

n = 200 n = 50

Distribucin Normal (0,1)

21/6/10

Distribucin de una muestra aleatoria de 100 medias de muestras de una distribucin normal
n = 5 n =25

n = 50

n = 100

Teorema Central del Lmite


Si se extrae una muestra aleatoria de n observaciones, de una poblacin que Iene una media nita y una varianza entonces, si n es lo bastante grande, la distribucin de muestreo de la media de la muestra se puede aproximar con una distribucin normal

21/6/10

Inferencia Estadstica
1. Estimacin de Parmetros 2. Dcimas de Hiptesis

poblacin muestra

La estimacin de parmetros se basa en la teora de probabilidades y slo es posible cuando se conoce la distribucin muestral de la estadstica

PARAMETROS

MUESTRA

Como varia, cambia, se distribuye la estadstica, de muestra en muestra

21/6/10

Distribucin Muestral del Promedio


es normal con media y desviacin estndar

Observacin: Si la desviacin estndar ( ) de la variable de inters X se desconoce, lo que ocurre frecuentemente, se reemplaza por s (Desviacin Estndar muestral)

es t-student (n-1) grados de libertad con media

y desviacin estndar

Distribucin muestral de la proporcin P


Sea: la proporcin de una caracterstica observada en una poblacin donde: A = N de observaciones con la caracterstica en la poblacin N = tamao de la poblacin Q = 1- P La distribucin de la proporcin muestral
es aproximadamente normal con media y varianza

a = n de observaciones con la caracterstica en la muestra n = tamao de la muestra

21/6/10

Ejemplo
Se toma una muestra de 20 observaciones. El promedio de la muestra es 18 y la D.E. es 5. Cul es la probabilidad de que el promedio de la muestra? a) Sea menor de 16 b) Est entre 16,6 y 19,3 c) Sea mayor que 17,2

Por el Teorema Central del Lmite, podemos decir:

21/6/10

Estimacin Puntual y por Intervalos de Confianza


Estimacin puntual, los datos muestrales determinan una estimacin del valor del parmetro

Estimacin por intervalo, se determina un conjunto de valores que en forma probable contiene el valor del parmetro

Ventajas y desventajas de la estimacin puntual

La probabilidad que el estimador obtenido con los datos de una muestra coincida con el verdadero valor del parmetro es muy pequea La estimacin puntual es precisa pero poco confiable Estas razones llevan a buscar un procedimiento de estimacin que consiste en determinar un conjunto de valores (pequeo) que contenga el valor del parmetro con una alta probabilidad

21/6/10

Propiedades de los intervalos

1. Contener el parmetro 2. Lo ms angosto posible

Ejemplo
Para un estudio se desea estimar la edad promedio en que los pacientes son trasplantados de rin. Para ello se toma una muestra aleatoria de 60 pacientes que deben recibir un rin y se les consulta la edad

10

21/6/10

Ejemplo
1. No es necesario que la variable edad al momento de ser trasplantados posea distribucin normal 2. Queremos hacer una inferencia con respecto al promedio 3. Nos importa como varira el promedio de muestra en muestra

Ejemplo
Se toma una muestra y se obitene

Si conocemos la distribucin de muestreo del promedio, entonces sabemos que:

11

21/6/10

99% 95% 68%

Puesto que no concemos la desviacin estandar de la variable edad en la poblacin, usaremos la desviacion estndar obtenida en la muestra. Por lo tanto el error de muestreo del promedio queda:

Luego, si yo quiero afirmar que de 100 muestras posibles de seleccionar al azar, puedo estar en un 95 de ellas seguro de que el promedio de edad, de los pacientes traspalantados estarn dentro del intervalo..debo calcular:

99% 95% 68%

12

21/6/10

En conclusin
Si hubesemos tomado 100 muestras aleatorias de tamao 60, puedo asegurar que en un 95 de sas muestras, la edad promedio de los pacientes trasplantados de rin est entre: 41,4 y 48,6 aos

Y si quisiera estar seguro en 99 de 100 muestras ?

99% 95% 68%

I.C. 99% [40.2 ; 49.7] Pero : I.C. 95% [41.4 ; 48.6]

13

21/6/10

Evaluacin de los Intervalos : Confianza o seguridad y precisin de las estimaciones En la construccin de un Intervalo de Confianza es necesario tener presente:
La confianza o seguridad La precisin que est dado por :

Ejemplo mediante simulacin

14

21/6/10

Promedios de 100 muestras al azar de tamao n=16

Se gracan los 100 promedio

15

21/6/10

Para cada promedio se construye in IC al 95%

Ejercicio
Se desea estimar el porcentaje de escolares de 10 a 14 aos que presentan defectos visuales en una poblacion X. Se toma una m.a. De tamao n=650 nios y se encuentra a 52 ios con defectos visuales. Determinar: La estimacin puntual del parmetro Estimacin por un I. de C. de 95% y 99% Comparar la confianza y la precisin de estos intervalos: Establecer conclusiones. Calcular nuevamente los intervalos para una muestra de tamao n=1200 nios Calcular la seguridad y precisin para estos nuevos intervalos. Establecer conclusiones y comparar los resultados con los intervalos obtenidos en 3.

1. 2. 3. 4. 5.

16

21/6/10

I. de confianza

T. de muestra n = 104

Confianza 0.95

Precisin

n = 104

0.99

I. de confianza

T. de muestra n = 1200 n = 1200

Confianza 0.95 0.99

Precisin

I. de confianza

T. de muestra n = 104 n = 1200

Confianza 0.95 0.95

Precisin

I. de confianza

T. de muestra n = 104 n = 1200

Confianza 0.99 0.99

Precisin

1. Un I.de C. tiene mayor precisin si su amplitud es menor que el de otro construido con los mismos fines. 2. Si se aumenta la confianza de un intervalo disminuye la precisin y viceversa 3. Un aumento de la precisin sin disminuir la confianza se logra aumentando el tamao de la muestra.

17

21/6/10

Dcimas de Hiptesis

Resumen BELLO S., Sergio, MICHALLAND H., Susana, SOTO I., Marina et al. Tabaquismo en funcionarios de educacin. Rev. chil. enferm. respir., jul. 2004, vol.20, no.3, p.131-138. Introduccin: Se realiz un estudio descriptivo y transversal para conocer la prevalencia de tabaquismo y actitudes en funcionarios del sector educacin. Metodologia: Para esto se distribuy una encuesta autoaplicada y annima en 235 establecimientos educacionales del pas (132 escuelas, 14 liceos y 87 jardines infantiles). Resultados: El anlisis de 3.270 encuestas mostr una prevalencia de tabaquismo de 38,9%, siendo las mujeres ms fumadoras que los hombres (37,3% vs 34,6%). La prevalencia de tabaquismo es mayor entre los 20 y 44 aos. Los ms fumadores son los paradocentes (57,6%) y administrativos (48,8%); mientras que los menos fumadores son los directivos (22,2%) y profesores (32,6%). Dos tercios de los fumadores son consumidores diarios, con un consumo promedio ( DE) 5,7 4,3 cigarrillos/da. Slo 0,3% fuma ms de 20 cigarrillos/da y 13,5% consume el primer cigarrillo en los primeros 30 minutos luego de despertar. El 74,1% de los funcionarios no permite que se fume en su hogar y el 92,3% est de acuerdo en que se restringa fumar en sus lugares de trabajo. Los datos de esta encuesta sugieren que los funcionarios de educacin son menos fumadores que la poblacin general y que los funcionarios de salud, lo que favorece el desarrollo de polticas de ambientes libres del humo de tabaco

18

21/6/10

Ejemplo
Se hace la misma encuesta a 15 establecimientos educacionales de la RM (5 escuelas 8 liceos y 2 jardines infanIles). El anlisis de 357 encuestas, mostr una prevalencia de tabaquismo de 46%

1. Lo que se sabe, lo convencional es que P=38,9% 2. Nuevos experimentos indicarian que la prevalencia ha aumentado p=46%

Hiptesis
1. La hiptesis nula, denotada por H0, es lo convencional, lo aceptado hasta el momento 2. La hiptesis alternativa, denotada por H1, es una alternativa a la hiptesis nula; implica cambio, sobre lo que se encuentra pre-establecido, es lo que el investigador espera que sea cierto

19

21/6/10

Hiptesis
H0 : La prevalencia de tabaquismo es 38,9% H1: La prevalencia de tabaquismo en la RM es mayor a 38,9% (46%)

Luego
Los datos que obtenemos de una muestra sern estadsticamente significativos, cuando con una probabilidad razonablemente alta podemos rechazar H0

20

21/6/10

Ho: La prevalencia de tabaquismo es 38,9%


POBLACION

Verdadera
Muestra

Falsa
Error Tipo II Acierto

Verdadera Falsa

Acierto Error Tipo I

H1: La prevalencia de tabaquismo es mayor a 38,9% (46%)

0,95

0,05

0,99

0,01

21

21/6/10

z 0 1,645 2,78

Definicines
1. Reginde Rechazo: corresponde al para los cuales rechazamos H0 conjunto de valores

2. Regin de Aceptacin: es el conjunto de valores para los cuales aceptamos H0

22

21/6/10

Regin de aceptacin

Regin de rechazo

Valor crtico z 0 1,645 2,78

Definicines
Valor crtico: es el valor que marca el punto inicial del conjunto de valores de la regin de rechazo Valor-p: es la probabilidad exacta de cometer el Error Tipo I

23

21/6/10

H0

H1

1-

Error Tipo I y p-value


Entendemos que a menor valor-p, mayor es la evidencia de los datos en contra de la hiptesis nula H0 Si el valor-p es <= ;rechazamos H0 Si el valor-p es >= ;aceptamos H0

24

21/6/10

Regin de Rechazo
Una regin de rechazo se llama unilateral o de una cola si el conjunto de valores extremos estn todos en una direccin ya sea a la derecha (cola superior) o a la izquierda (cola inferior) Una regin de rechazo se llama bilateral o de dos colas si el conjunto de valores extremos est en las dos direcciones derecha e izquierda.

Ejemplo
Los usuarios de una mquina dispensadora de caf han hecho llegar sus quejas al administrador, diciendo que los vasos con capacidad de 200 cc , estan siendo llenados con una cantidad inferior a la informada. Para asegurar a sus clientes la calidad del servicio, decide hacer una investigacin. Para lo cual plantea las siguientes hiptesis

25

21/6/10

Ejemplo
H0 El contenido Promedio de los vasos es al menos 200cc Region de Rechazo Unilateral
H1 : El contenido Promedio de los vasos es mayor de 200cc H2 : El contenido Promedio de los vasos es menor de 200cc

H0:=200

H1 :>200

H2 :<200

H0:=200

26

21/6/10

Ejemplo
H0 El contenido Promedio de los vasos es al menos 200cc Region de Rechazo Bilateral H3 : El contenido Promedio de los vasos es diferente de 200cc

H3: <200

H0: =200

H1: >200

si no tenemos informacin y no sabemos en que direccin puede ocurrir, se consideran ambos sentidos. La decisin debe tomarse antes de elegir la muestra aleatoria

27

21/6/10

No olvidar las fuentes de error


Error Tipo I rechazar la hiptesis nula H0, cuando sta es verdadera Error tipo II no rechazamos (aceptamos) la hiptesis nula H0 cuando esta es falsa

Etapas de una Dcima


1. Enunciado del problema y planteamiento de la Hiptesis 2. Eleccin del nivel de significacin 3. Estadstica de prueba 4. Determinacin de la regin de Rechazo 5. Resultados y Conclusiones

28

21/6/10

Dcima para una Proporcin


Ejemplo:

La tasa de letalidad de la fiebre tifoidea antes del uso de la cloromicetina era de 10%. Para probar la eficiencia de este medicamento se tomo una muestra de 100 pacientes a los cuales se les trato con cloromicetina. De este grupo, fallecieron por fiebre tifoidea slo dos de ellos. Basndose en esta experiencia y utilizando un nivel de significacin de 5% se puede afirmar que la cloromicetina disminuye la tasa de letalidad por fiebre tifoidea?

1. Hiptesis
H0 : La tasa de letalidad por fiebre tifoidea no se altera con el uso de la cloromicetina H1 : La tasa de letalidad por fiebre tifoidea disminuye con el tratamiento de cloromicetina

H0 : P=0.1

versus H1 : P<0.1

29

21/6/10

2.

Nivel de Significacin

Segn el problema = 0.05

3.

Estadstica de Prueba

5.

Clculo

7.

Conclusion

30

21/6/10

Dcima para una media


Ejemplo
Se sabe que el promedio a nivel nacional de das de estada en un hospital fue en 1980 de 10.9 das. Con el objetivo de analizar si la situacin en determinado hospital es similar a la del pas, se decidi estudiar lo que ocurre en dicho centro hospitalario en un determinado

En un muestra de 222 pacientes se obtuvo un promedio de 10.7 con una d.e. de 6,9
periodo.

1. Hiptesis
H0 : El promedio de das de hospitalizacin es el mismo que el del pas H1 : El promedio de das de hospitalizacin es menor al del pas

H0 : u =10.9

versus H1 : u< 10.9

31

21/6/10

2.

Nivel de Significacin

Segn el problema =0.05

3.

Estadstica de Prueba

5.

Clculo

7.

Conclusion

Observacin: Si la desviacin estndar ( ) de la variable de inters X se desconoce, lo que ocurre frecuentemente, se reemplaza por s (Desviacin Estndar muestral)

Lo anterior implica que la distribucion muestral ahora es es t-student con (n-1) grados de libertad

32

21/6/10

33

También podría gustarte