Está en la página 1de 41

INFERENCIA ESTADISTICA

Eduardo Vergara Wekselman Mdico Epidemiologo

INFERENCIA ESTADISTICA
Poblacin Objetivo

Inferencia estadstica

Muestreo

Muestra

Investigador

La inferencia estadstica se refiere a los mtodos y/o procesos para obtener conclusiones acerca de poblaciones, basados en la informacin muestral.

POBLACION MUESTRA X1,...........,XN

X1....,Xn

INTRODUCCIN
Antes de realizar cualquier inferencia estadstica es necesario identificar la distribucin de probabilidad de la variable aleatoria que se pretende analizar. Algunos instrumentos para ello son: Histograma, rango de la variable. Grficos de caja Pruebas de ajuste a una distribucin (Test de Kolmogorov-Smirnoff). Para llevar a cabo estos contrates en SPSS seguiremos: Analizar la opcin Pruebas no parametricas p K-S de una muestra donde se debe seleccionar como distribucin de prueba: Normal

La media muestral y la desviacin estndar son buenos estimadores puntuales de la media y la desviacin estndar de la poblacin.

Dado que los datos son las observaciones de una variable aleatoria, estos estimadores son a la vez variables aleatorias. Por lo tanto tienen una determinada distribucin, que en el caso de la media es Normal.

As pues podemos calcular un intervalo de valores [a,b] tales que

P ( a e X e b)

=C

GRFICA DE UN INTERVALO DE CONFIANZA


Grficamente: para una normal tipificada, un intervalo de confianza del 95% se puede representar como:

La probabilidad de que una


95%

variable normal tipificada tome valores en el intervalo

2.5%

[-1.96,1.96] es del 95%.


2.5%

Intervalo de confianza:

Intervalo construido bajo condiciones tales que con una cierta probabilidad

(usualmente 95%) contenga al parmetro deseado

Intervalo calculado de acuerdo a principios tales que 95 de cada 100 intervalos similarmente construidos contendrn el valor del parmetro

Uno puede tener 95% de confianza en afirmar que ese intervalo contiene el valor real del parmetro

INFERENCIA ESTADISTICA
Definicin de Inferencia de Estadstica:

Es un proceso por medio del cul se elaboran conclusiones probabilsticas en relacin a una poblacin, valindose de la informacin proporcionada por una muestra de esa poblacin.

Problemas a resolver mediante la inferencia estadstica


1. Conocer la proporcin de estudiantes que fuman cigarrillos de la Facultad de Medicina de la USMP 2. Un investigador esta interesado en comparar la efectividad de dos medicamentos en el tratamiento de la Malaria AREAS DE LA INFERENCIA ESTADISTICA 1. 2. Estimacin de parmetros (Resuelve Problema 1) Prueba de Hiptesis (Resuelve problema 2)

TIPOS DE ESTIMACIN POR PARAMETROS La estimacin por parmetros es de dos tipos 1. 2. Estimacin por punto Estimacin por intervalo

Estimacin por punto de parmetros


Lo proporcionan sus respectivos estadsticos que se calculan en base a la Muestra, es decir: Parmetros Estadsticos _ n Q x = 7 xi i=1 n n _ W2 s2 = 7 (xi - x)2 i=1 n - 1 _ _ Q1 - Q2 x1 - x2 P P1 - P2 p = a/n, donde a es el nmero de unidades que poseen el atributo de inters en la muestra p1 - p2 .

Estimacin:


Puntual: Puntual: Determina que posible valor del parmetro de la poblacin es ms consistente con los datos observados en la muestra. Ejemplo: el clculo de una tasa de incidencia, un RR o un promedio

Por intervalo: Cuantifica la incertidumbre o variabilidad que tiene una intervalo: estimacin. Ejemplo: el clculo de un intervalo de confianza

Ejemplo 1 Estimacin de una media aritmtica Q


Se tiene inters en estimar la estatura media de los alumnos de la Facultad

de Medicina de la USMP. Para tal efecto se recurre a una muestra aleatoria de 36 alumnos y se obtienen los siguientes resultados: _ x = 170 cm y s = 20cm.

La estatura media de los alumnos est representado por Q (que es el parmetro de la poblacin) y la estimacin por punto de este parmetro est dado por :

_ x = 170 cm.

En relacin al ejemplo 1, construiremos un intervalo de confianza del 95% para la estatura promedio ( Q) de los estudiantes de medicina.

Grado de confianza del 95% le corresponde un Z=1.96 _ __ Error estndar ES (x) = 20/36 = 3.33 Por consiguiente: L1= 170 1.96*3.33 = 163.5 L2= 170 + 1.96*3.33 = 176.5
[163.5 , 176.5]

La estatura promedio de los estudiantes de la Facultad de Medicina de la USMP est oscilando entre 163.5 y 176.5 cm con grado de confianza 95%

Ejemplo 2 Estimacin de una proporcin P Inters: Estimar la proporcin de nios desnutridos menores de 5 aos de una determinada comunidad. Seleccionamos una muestra de 100 nios menores de 5 aos y se determina que 45 estn desnutridos. Se quiere estimar una proporcin de poblacin P = A/N, donde, A: n de nios menores de 5 aos desnutridos en la poblacin y N: n de nios menores de 5 aos en la poblacin. El estimador es: p = a/n donde a es el nmero de nios desnutridos en la muestra y n es el tamao de muestra. Por consiguiente, p = 45/100 = 0.45. proporcin estimada de nios desnutridos menores de 5 aos en la comunidad es de 0.45

Estimacin por intervalo


Consiste en determinar dos valores numricos L1 y L2 y que con un cierto

grado de confianza se espera que el valor del parmetro est comprendida entre dichos valores.
Intervalo de confianza para la media Q En este caso los valores L1 y L2 seran:

_ _ L1 = x - Z ES (x) _ _ L2 = x + Z ES (x)
Donde:

Ejemplo 2 Se desea estimar el tiempo promedio de estancia hospitalaria para cierto tipo de pacientes. Se toma una muestra de 25 historias clnicas y se calcula Dx =5,7 y s = 4,5 das. Estimar Q con 95% de confianza.

Solucin: En este caso no se conoce

luego el modelo de estimacin, ser:


L.S

Q = Dx

t n-1

s n L.I.

Donde t n-1 es el coeficiente de confiabilidad, cuyo valor se obtiene de la tabla de distribucin t de Student con n-1 grados de libertad para el nivel de confianza deseado. Algunas caractersticas de la distribucin t de Student son:
 La distribucin tiene forma acampanada.  Es simtrica respecto al punto t=0  Forma cola rpidamente a la derecha e izquierda; por lo tanto t es ms

variable que Z
 La forma de la distribucin cambia conforme el valor de n. Es decir, para

cada grado de libertad (n-1) existe una curva simtrica.


 A medida que n aumenta, t se aproxima a la normal Z.

Z : Es un coeficiente de confianza y cuyo valor depende del grado de

confianza (G.C.) que se establece, es decir: G.C. : 90% Z : 1.64 95% 1.96 99% 2.57

_ _ ES(x) : es el error estndar de x y se define como: _ _ ES(x) = s/n , donde s es la desviacin estndar de la muestra
Nota El coeficiente Z se utiliza cuando tamao de muestra n > 30.

Luego de la tabla t se obtiene para un nivel de significacin de 0,05 bilateral: t24 = 2,064
Q = 5,7 s 2,064 4,5 25

7,56 das 3,84 das

Interpretacin: La probabilidad de que el tiempo promedio de estancia hospitalaria, en la poblacin de pacientes, se encuentre entre 3.84 y 7.56, es de 0,95.

Intervalo de confianza para la proporcin P


L1 = p - z pq/n L2 = p + zpq/n donde q = 1 - p. pq/n = ES(p), nos indica el estimador del error estndar de la

proporcin de la muestra p

Segn la informacin que se dispone, se construye un intervalo del 95% para P: Para una confianza del 95%, Z = 1.96 Reemplazando valores se tiene:

____________ L1 = 0.45 - 1.96 * 0.45(0.55)/100 = 0.352 ____________ L2 = 0.45 + 1.96 * 0.45(0.55)/100 = 0.548.
La proporcin de nios menores de 5 aos desnutridos en dicha comunidad

est entre 0.352 y 0.548 con una confianza del 95%.


Nota Se utiliza el coeficiente de confianza Zw/2 si np y n(1-p) >5.

Prueba de hiptesis

Es una tcnica estadstica que se sigue para decidir si rechazamos o no una hiptesis estadstica en base a la informacin de una muestra.

Hiptesis estadstica:
Es una afirmacin de lo que creemos sobre una poblacin. Por lo general,

est hiptesis se refiere a los parmetros de la poblacin acerca de los cuales se quiere hacer la afirmacin. (En la practica, se tiene idea de la distribucin de la variable que se est estudiando)

Ejemplo 1: Un investigador pretende estudiar en forma comparativa la eficacia de dos tratamientos (o procedimientos experimentales) para determinar cul es el mejor

Hiptesis de investigacin
 Es una respuesta tentativa al problema planteado. Ella est basado

en la Observacin o en algn sistema terico.

Caracterstica de la Hiptesis
 Plantearse conceptual y operativamente.  Ser claras y precisas.  Ser especficas  Referirse a situaciones empricas y objetivas (no juicios de valor)

Tipos de hiptesis estadstica


Hiptesis nula (Ho) tambin se le denomina hiptesis de la no diferencia y se establece para ser rechazada o desacreditada. Considerando el ejemplo establecido en la hiptesis estadstica , las hiptesis nula que les corresponde es: Ho: QA - QB = 0 (Tratamiento A no difiere de B) Hiptesis alterna (H1) son todas las dems suposiciones o alternativas al problema para contrastar Ho. La hiptesis alterna H1 puede ser uni o bilateral. Con respecto al ejemplo, se tiene: H1: QA - QB > 0, (indica que tratamiento A es mejor que el tratamiento B. Ha unilateral a la derecha)

Nivel de significancia: E En realidad


Ho verdadero Decisin estadstica Rechazar Ho Error tipo I (E) Decisin correcta (1-E) Ho Falso Decisin correcta (1-) Error tipo II ()

No rechazar Ho

Cuando se toma una decisin estadstica, podemos cometer el error tipo I o tipo II. E = P(error tipo I) = P( Rechazar Ho / Ho es verdadero) E puede ser manejada por el investigador, por consiguiente puede establecer su valor, es decir, E=0.001, 0.01 , 0.05 E nos indica el nivel de significacin de la prueba, porque permite diferenciar la regin de rechazo y no rechazo de la prueba. 1- E indica el grado de confianza de la prueba. = P(error tipo II) = P(No rechazar Ho / Ho falso) no se maneja directamente por el investigador. E y estn relacionados y ambos disminuyen su valor si incrementamos el tamao de muestra o si mejoremos el diseo del estudio. 1-= P(rechazar Ho/Ho es falso), tambin se denomina potencia de prueba. Valor mnimo que puede tomar es del 80%.

Mostraremos estas cuatro probabilidades utilizando la distribucin de medias y una prueba unilateral.
H0 H1

(1-E

(1- F

F F

Q0
Zona de no rechazo de H0

E _ E xc

Q
Zona de rechazo de H0

_ xi

Identificacin de Hiptesis Estadsticas


Hiptesis nula Ho Hiptesis de Igual La que contrastamos Hiptesis Alternativa H1 Hiptesis de Diferencia Niega a H0 (y creemos que es mejor ).
Bilateral Unilateral

H 0 : H1 :

p ! 50% ! , e , u
p { 50%

{,

, "

Contrastes: unilateral y bilateral

Bilateral

H1: Q{70

Unilateral

Unilateral

H1: Q<70

H1: Q>70

Regin crtica y nivel de significacin


Regin crtica
Valores menos probables
Nivel de significacin: a Nmero pequeo: 1% , 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H0 cuando es cierta

E=5%

Reg. Crit. Crit.

Reg. Crit.

No rechazo H0
,Q=70

Significacin : p
El contraste es estadsticamente significativo cuando p<

E
Se rechaza H0: Q=40 Se acepta H1: Q>40

X ! 85

ERROR TIPO I y ERROR TIPO II


Hiptesis Nula Decisin H0 cierta H0 falsa

No Rechazar H0 Rechazar H0

(1- )
Nivel de confianza Error Tipo II

(1- )
Error Tipo I Potencia

Fuente.- Schefler. Bioestadstica.

Realidad Decisin
Ninguna Diferencia Diferencia

Ninguna Diferencia Diferencia

(1- ) (1- )
Fuente.- Norman y Streiner. Bioestadstica.

Decisin

Realidad H0 cierta
Correcto

H0 Falsa
Error de tipo II
El tratamiento si tiene efecto pero no lo percibimos. Probabilidad

No Rechazo H0

El tratamiento no tiene efecto y as se decide.

Rechazo H0
(Acepto H1)

Error de tipo I
El tratamiento no tiene efecto pero se decide que s. Probabilidad

Correcto
El tratamiento tiene efecto y el experimento lo confirma.

Fuente.- F. J. Barn Lpez. Universidad de Mlaga.

Pasos de una Prueba de Hiptesis


a. Planteamiento de Hiptesis: H0 y H1 b. Nivel de Significacin ( = 0.05 = 0.01) c. Contraste estadstico (segn escalas de medicin y diseo) d. Significacin (resultado de p) e. Decisin (Rechazar H0 No Rechazar H0) f. Conclusin (conduce a la decisin clnica terica)

Resumen: a, p y criterio de rechazo

a Estadsticos de contraste

U de Mann-Whitney W de Wilcoxon Z Sig. asintt. (bilateral)

Edad del encuestado 259753,500 462319,500 -2,317 ,021

a. Variable de agrupacin: Sexo del encuestado

Sobre el criterio de rechazo Contraste significativo = p menor que a

a. Estudio sobre nivel de hemoglobina en sangre y exposicin a la baja presin de oxigeno en la altura. b. Se tiene que en la poblacin general la media es 15.80 g /100 ml y con una desviacin de 5 g/100 ml. En los hallazgos muestrales se hallo una media de 15.96 g/100 ml. c. Planteando una hiptesis Bilateral: H0 = d. Nivel de Significancia al 5% e. Estadsticos: EE = 0.05; Z = x f. P es altamente significativo g. Rechazar la H0 h. Conclusin (conduce a la decisin clnica terica) / EE = 3.20
m

También podría gustarte