Está en la página 1de 27

V. I NFERENCIA ESTADSTICA .

V.1. Concepto de inferencia estadstica.


Es el procedimiento por medio del cual se llega a conclusiones acerca de una poblacin con base en
la informacin que se obtiene a partir de una muestra seleccionada de esa poblacin.

V.2. Estadstica paramtrica y no-paramtrica.


a) Estadstica paramtrica es la que requiere que los elementos que integran las muestras
contengan parmetros medibles.

La estadstica paramtrica clsica plantea tres tipos de problemas:

1. Estimacin puntual en la que pretendemos dar un valor al parmetro a estimar.


2. Estimacin por intervalos (buscamos un intervalo de confianza)
3. Contrastes de hiptesis donde buscamos contrastar informacin acerca del parmetro.

b) La Estadstica no paramtrica es una rama de la Estadstica que estudia las pruebas y modelos
estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su
distribucin no puede ser definida a priori, pues son los datos observados los que la determinan.
La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos
se ajusten a una distribucin normal o cuando el nivel de medida empleado no sea, como
mnimo, de intervalo

V.3. Estadstica univariada y multivariada. Estimacin de parmetros por intervalos de


confianza.
a) Concepto de Estadstica univariada

Cuando el anlisis presenta caracterstica por caracterstica, aisladamente, estaremos en presencia


de un anlisis estadstico univariado. Ejemplo, cuando decimos que una persona pesa 95 kg.
independientemente de cualquier otra caracterstica estaremos en presencia de anlisis univariado.

El anlisis univariado es el anlisis bsico. Los estadsticos bsicos que conocemos, como la media, la
mediana, la moda, la varianza, los porcentajes, entre otros, miden una variable. Es decir, fueron
hechos univariados.

Este tipo de anlisis ha sido muy criticado ya que en la realidad se presentan interconectados. Por
ejemplo existe una relacin entre el peso y la talla de las personas o entre el inters y el rendimiento
escolar, etc.

b) Concepto de Estadstica multivariada

Este anlisis consiste en determinar las relaciones existentes entre dos o ms variables.

En general se les clasifica en dos grandes grupos

1. Mtodos explicativos como la regresin lineal, anlisis discriminante, entre otros.

2. Mtodos descriptivos como anlisis de conglomerados, anlisis factorial, etc.

Este tipo de anlisis ha avanzado mucho y hoy ocupa el corazn del anlisis estadstico avanzado.

1
c) Estimacin de parmetros por intervalos de confianza.

Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona
informacin sobre el valor del parmetro. Por ejemplo la media muestral es un estimador de la
media poblacional, la proporcin observada en la muestra es un estimador de la proporcin en la
poblacin.

Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Sin embargo es ms
til es la estimacin por intervalos en la que calculamos dos valores entre los que se encontrar el
parmetro, con un nivel de confianza fijado de antemano.

Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al
parmetro que se est estimando.

Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del
parmetro. Se indica por 1- y habitualmente se da en porcentaje (1-) %. Hablamos de nivel de
confianza y no de probabilidad ya que una vez extrada la muestra, el intervalo de confianza
contendr al verdadero valor del parmetro o no, lo que sabemos es que si repitisemos el proceso
con muchas muestras podramos afirmar que el (1-) % de los intervalos as construidos contendra
al verdadero valor del parmetro.

Los factores que determinan el ancho del intervalo de confianza son:

1. El tamao de la muestra (n)


2. La varianza
3. El nivel deseado de confianza

Los valores de varias medidas descriptivas calculadas para las poblaciones, se llaman parmetros.
Para las muestras, estas mismas medidas descriptivas se llaman estadsticas.

Es costumbre simbolizar las estadsticas con letras romanas y los parmetros con letras griegas.

Estadstica Parmetro
Media aritmtica
Varianza S 2
Desvo estndar S
Coeficiente de correlacin R

2
C.1. Intervalo de confianza para la media

Valor de Z 1.15 1.28 1.44 1.65 1.96 2 2.58


Nivel de confianza 75% 80% 85% 90% 95% 95.5% 99%

Ejemplo 1.

Supongamos que se estudia en nivel de glucosa en sangre en la poblacin cuyos valores aparecen en
el recuadro (N=20). Seleccionamos de forma aleatoria 5 muestras tamao n=5 elaboramos, en cada
caso, el intervalo de confianza para el nivel medio de glucemia (nivel de confianza el 95 %)
Observemos los resultados.

108 118 121 125 118 117 109 127 123 133
112 120 136 115 129 110 113 125 124 117

120
Media
Muestra 1

123 125 118 125 113

Intervalo muestra 1 = 125.38 116.22

3
Muestra 2

124 110 115 133 112

Intervalo muestra 2 = 127.19 110.40

Muestra 3
125 113 117 123 124
Comando
Parmetro
en Excel
Promedio Media 120.4
Var Varianza 26.8
Desviacin
Desvest 5.17687164
estndar
Intervalo
Intervalo.
de 4.53764468 Max 124.937645 Min 115.862355
Confianza
confianza

Muestra 4
133 110 136 125 110
Comando
Parmetro
en Excel
Promedio Media 122.8
Var Varianza 152.7
Desviacin
Desvest 12.3571841
estndar
Intervalo
Intervalo.
de 12.1098179 Max 134.909818 Min 110.690182
Confianza
confianza

4
Ejemplo 2.

Para una muestra de 81 habitantes de cierta poblacin se obtuvo una estatura media de 167 cm. Por
estudios anteriores se sabe que la desviacin tpica de la altura de la poblacin es de 8 cm.
Construye un intervalo de confianza para la estatura media de la poblacin al 95%

La media de la estatura de la poblacin est entre 168.74 y 165.26 cm

Ejemplo 3.

Para conocer el peso promedio de un grupo de personas se tomo una muestra de 38 personas. La
media muestral result ser de 74,3 kg.

Construya un intervalo de confianza del 98% para la media de la poblacin, si la desviacin estndar
es 14 kg.

El valor de tablas que encierra el 98% de la distribucin Z es 2,33

5
V.4. Tamao de muestra para estimar medias

Un problema tpico es determinar el tamao muestral mnimo para que el intervalo de confianza
para la proporcin con un nivel de confianza dado tenga un error (amplitud) menor o igual a una
cantidad conocida para encontrar el tamao de la muestra

Donde:

E.- es el error admisible

Z.- es el valor normal estndar correspondiente al nivel de confianza deseado

s.- Es la desviacin estndar de la muestra

Valor de Z 1.15 1.28 1.44 1.65 1.96 2 2.58


Nivel de confianza 75% 80% 85% 90% 95% 95.5% 99%

Un estudiante de Administracin desea determinar la cantidad media que ganan al mes lo miembros
de los consejos ciudadanos de las grandes ciudades. El error a calcular la media debe ser inferior a
$100, con un nivel de confianza del 95%. El estudiante encontr un informe del departamento de
trabajo en el que la desviacin estndar es de $1000 Cul es el tamao de la muestra que se
requiere?

n= ?

E= $100

Z= Confianza 95% = 1.96

s = Desviacin estndar = $1000

Un grupo consumidor desea estimar la media del cargo de electricidad por familia en Julio con un
error de $5 usando un nivel de confianza de 99%. La desviacin estndar es estimada de estudios
similares la cual es de $20. Qu tan grande debe ser la muestra?

6
V.5. Concepto de hiptesis estadstica.
Una prueba de hiptesis estadstica es una conjetura de una o ms poblaciones. Nunca se
sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se examine
la poblacin entera. Esto por su puesto sera imprctico en la mayora de las situaciones. En su lugar,
se toma una muestra aleatoria de la poblacin de inters y se utilizan los datos que contiene tal
muestra para proporcionar evidencia que confirme o no la hiptesis. La evidencia de la muestra que
es un constante con la hiptesis planteada conduce a un rechazo de la misma mientras que la
evidencia que apoya la hiptesis conduce a su aceptacin.

Definicin de prueba de hiptesis estadstica es que cuantifica el proceso de toma de decisiones.

Por cada tipo de prueba de hiptesis se puede calcular una prueba estadstica apropiada. Esta
prueba estadstica mide el acercamiento del valor de la muestra (como un promedio) a la hiptesis
nula. La prueba estadstica, sigue una distribucin estadstica bien conocida (normal, etc.) o se puede
desarrollar una distribucin para la prueba estadstica particular.

La distribucin apropiada de la prueba estadstica se divide en dos regiones: una regin de rechazo y
una de no rechazo. Si la prueba estadstica cae en esta ltima regin no se puede rechazar la
hiptesis nula y se llega a la conclusin de que el proceso funciona correctamente.

Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor crtico en la
distribucin estadstica que divide la regin del rechazo (en la cual la hiptesis nula no se puede
rechazar). A hora bien el valor crtico depende del tamao de la regin de rechazo.

IDENTIFICACIN DE HIPTESIS

Hiptesis nula H0 Hiptesis alternativa H1

La que contrastamos Niega H0 (y creemos que es mejor)


Los datos pueden mostrar evidencia
Los datos pueden refutarla
a favor
No debera ser rechazada sin una No debera ser aceptada sin una gran
buena razn evidencia a favor

H0: p =, , H1: p , <, >

Ejemplo 1.-

Problema La osteoporosis est relacionada con el sexo?

Solucin:

Traducir a lenguaje estadstico p=50%

Establecer su opuesto: p 50%

Seleccionar la hiptesis nula: H0= p=50%

7
Ejemplo 2.-

Problema El colesterol medio para la dieta mediterrnea es de 6mmol/l?

Solucin:

Traducir a lenguaje estadstico =6

Establecer su opuesto: 6

Seleccionar la hiptesis nula: H0= =6

V.6. Tipos de error.

Si rechazamos una hiptesis cuando debiera ser aceptada diremos que se ha cometido
un error de tipo I. Por otra parte si aceptamos una hiptesis que debiera ser rechazada, diremos que
se ha cometido un error de tipo II. En ambos casos se ha producido un juicio errneo.

Para que las reglas de decisin sean buenas, deben disearse de modo que minimicen los
errores de decisin, y no es una cuestin sencilla, porque para cualquier tamao de la muestra, un
intento de disminuir un tipo de error suele ir acompaado de un crecimiento del otro tipo. En la
prctica un tipo de error puede ser ms grave que el otro, y debe alcanzarse un compromiso que
disminuya el error ms grave, la nica forma de disminuir ambos a la vez es aumentar el tamao de
la muestra, que no siempre es posible.

Hiptesis
H0 H0
Decisin verdadera falsa

Decisin incorrecta
Aceptar
Decisin correcta Error tipo II
H0
Probabilidad

Decisin incorrecta
Rechazar
Error de tipo I Decisin correcta
H0
Probabilidad

8
Riesgos al tomar decisiones

Ejemplo 1: se juzga a un individuo por la presunta comisin de un delito.

H0: Hiptesis nula: Es inocente

Todos son inocentes hasta que se demuestre lo contrario.


Rechazarla por error tiene graves consecuencias

H1: Hiptesis alternativa: Es culpable

No debera ser aceptada sin una gran evidencia a favor


Rechazarla por error tiene consecuencias consideradas menos graves que la anterior

Realidad
Inocente Culpable
Error
Inocente Ok
Menos grave
Veredicto
Error
Culpable Ok
Muy grave

Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados.

H0: Hiptesis nula: No especulativa

El nuevo tratamiento no tiene efecto


Rechazarla por error tiene graves consecuencias

H1: Hiptesis alternativa: Especulativa

El nuevo tratamiento es til.


Rechazarla por error tiene consecuencias consideradas menos graves que la anterior

Realidad
H0 Cierta H0 Falsa
Error de tipo II
Correcto
El tratamiento si tiene efecto
Acepto H0 El tratamiento no tiene efecto
pero no lo percibimos
y as se decide
Probabilidad
Error de tipo I
Correcto
El tratamiento no tiene efecto
Rechazo H0 El tratamiento tiene efecto y el
pero se decide que si
experimento lo confirma
Probabilidad

9
NIVEL DE SIGNIFICANCIA

Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a
correr el riesgo de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se
denota por , se suele especificar antes de la muestra, de manera que los resultados no influyan en
nuestra eleccin.

En la prctica es frecuente un nivel de significancia de 0.05 0.01, si bien se usan otros


valores. Si, por ejemplo, se escoge un nivel de significancia del 5% 0.05 al disear una regla de
decisin entonces hay unas cinco oportunidades entre cien de rechazar la hiptesis cuando debiera
haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisin
correcta. En tal caso decimos que la hiptesis ha sido rechazada al nivel de significancia 0.05 lo cual
quiere decir que la hiptesis tiene una probabilidad del 5% de ser falsa.

V.7. Metodologa.

1. Expresar la hiptesis nula


2. Expresar la hiptesis alternativa
3. Especificar el nivel de significancia
4. Determinar el tamao de la muestra
5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo.
6. Determinar la prueba estadstica.
7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.
8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.
9. Determinar la decisin estadstica.
10. Expresar la decisin estadstica en trminos del problema.

10
V.8. Algunas pruebas de hiptesis.

a) Para una media poblacional.


Mientras el tamao de muestra (n) sea mayor que 30, se estima la desviacin estndar poblacional
() por medio de la desviacin estndar muestral (s) y se usa los valores de Z

Valor de Z 1.15 1.28 1.44 1.65 1.96 2 2.58


Nivel de confianza 75% 80% 85% 90% 95% 95.5% 99%

so = Desviacin estndar

= media poblacional n= tamao de la muestra

Ejemplo 1. La duracin promedio de las llantas producidas por una fbrica de llantas, segn
experiencias registradas es de 46.050 Km. Se desea probar si el promedio poblacional ha cambiado;
para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una duracin promedio de
45.050 Km. con una desviacin estndar de 3.070 Km, usando un 95% de confianza.

Ho= = 46.050 H1= 46.050

n= 60 =

1-= 0.95= 1.96 s= 3.070

Si z es mayor a 1.96 o menor a -1,96 se rechaza H0

Por lo tanto si z= a -2.52 se rechaza H0. Por consiguiente, con una confiabilidad del 95 por ciento se
acepta que la duracin promedio de las llantas ha cambiado.

11
Ejemplo 2. Ciertos investigadores pretenden saber si es posible concluir que la media del IMC
para la poblacin de la que se extrajo la muestra n es 35

Individuo IMC 8 24
1 23 9 32
2 25 10 57
3 21 11 23
4 37 12 26
5 39 13 31
6 21 14 45
7 23

Media 30.5
Varianza 113.192308
Desviacin 10.6391874

1. Expresar la hiptesis nula


H0: = 35

2. Expresar la hiptesis alternativa


H1: 35

3. Especificar el nivel de significancia


= 0.05

4. Determinar el tamao de la muestra


n=14

5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo.
Dado que la muestra es menor de 30 se usan los valores de t en lugar de z
Grados de libertad (gl)= n-1 por lo tanto 14-1=13
Dado que se tiene una prueba bilateral se pone /2= 0.5/2= 0.025. Estos valores aparecen
en la tabla de t (ane o). Buscaremos el valor que se encuentre entre gl=13 y t= 1- = 1-
0.025 = 0.975 . Lo que corresponde a 2.1604 y -2.1604

6. Determinar la prueba estadstica.

12
7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.
A partir de los datos de la muestra se calcula una media igual a 30.5 y una desviacin
estndar de 10.6392. Al sustituir estos datos en la ecuacin se obtiene

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.


-1.58 cae en la regin de no rechazo

9. Determinar la decisin estadstica.


No se rechaza H0 ya que -1.58 cae en la regin de no rechazo

10. Expresar la decisin estadstica en trminos del problema.


Con base en estos datos se puede decir que la media de la poblacin de la cual se extrajo la
muestra puede ser 35.

13
Ejemplo 3. Los siguientes datos son la circunferencia craneal (CC)(en centmetros) de 15 nios
recin nacidos

Individuo CC 6 34.13 12 34.19


1 33.38 7 33.99 13 33.97
2 34.34 8 33.85 14 32.73
3 33.46 9 34.45 15 34.05
4 32.15 10 34.1
5 33.95 11 34.23

Media 33.798 Varianza 0.39727429 Desviacin 0.63029698


1. Expresar la hiptesis nula
H0: = 34.5

2. Expresar la hiptesis alternativa


H1: 34.5

3. Especificar el nivel de significancia


= 0.05

4. Determinar el tamao de la muestra


n=15

5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo.
Dado que la muestra es menor de 30 se usan los valores de t en lugar de z
Grados de libertad (gl)= n-1 por lo tanto 15-1=14
Dado que se tiene una prueba bilateral se pone /2= 0.5/2= 0.025. Estos valores aparecen
en la tabla de t (ane o). Buscaremos el valor que se encuentre entre gl=14 y t= 1- = 1-
0.025 = 0.975. Lo que corresponde a 2.1448 y -2.1448

6. Determinar la prueba estadstica.

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.


A partir de los datos de la muestra se calcula una media igual a 30.5 y una desviacin
estndar de 10.6392. Al sustituir estos datos en la ecuacin se obtiene

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.


-4.31 cae en la regin de rechazo

9. Determinar la decisin estadstica.


Se rechaza H0 ya que -4.31 cae en la regin de rechazo

10. Expresar la decisin estadstica en trminos del problema. Con base en estos datos se puede
decir que la media de la poblacin de la cual se extrajo la muestra no puede ser 34.5.

14
Ejemplo 4. Ciertos investigadores condujeron un estudio para examinar los datos
correspondientes a la farmacocintica de la gentamicina en tres poblaciones mayores de 18 aos:
pacientes con leucemia aguda, pacientes con otros padecimientos malignos no leucmicos y
pacientes sin enfermedad maligna oculta. Entre las estadsticas reportadas por los investigadores
estaba el valor 59.1 como media inicial calculada, con una desviacin estndar de 25.6 para una
muestra de 211 pacientes. Se pretende saber si es posible concluir que la media para la poblacin de
individuos que presenta el mismo cuadro patolgico es menor que 60. Sea =0.10

1. Expresar la hiptesis nula


H0: < 60

2. Expresar la hiptesis alternativa


H1: > 60

3. Especificar el nivel de significancia


= 0.10

4. Determinar el tamao de la muestra


n=211

5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo.
Dado que la muestra es mayor de 30 se usan los valores de z. Lo que corresponde a 1.65 y -1.65

6. Determinar la prueba estadstica.

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.


A partir de los datos de la muestra se calcula una media igual a 59.1 y una desviacin estndar de 25.6. Al
sustituir estos datos en la ecuacin se obtiene

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.


-0.510 cae en la regin de no rechazo

9. Determinar la decisin estadstica.


No se rechaza H0 ya que -0.510 no cae en la regin de rechazo

10. Expresar la decisin estadstica en trminos del problema.


Con base en estos datos se puede decir que la media de la poblacin de la cual se extrajo la muestra puede
ser menor de 60.

15
ANTES DE CONTINUAR.
Se podrn encontrar pruebas de 1 o 2 colas.
Sabremos que es de 1 cola cuando la hiptesis alterna (H1) establece una direccin, como;

H1: EL ingreso medio de las mujeres ( m) es menor al H1: El ingreso medio de las mujeres es mayor que el
ingreso medio de los hombres ( h) H1: m < h de los hombres. H1: m > h

Si H1 tiene el signo (menor que) <, la prueba de significancia es de cola izquierda.

Si H1 tiene el signo (mayor que) >, la prueba de significancia es de cola derecha.

Una prueba es de 2 colas cuando no se establece una direccin especifica de la hiptesis alterna (H1) como;

H0: el ingreso medio de las mujeres es igual al ingreso H1: El ingreso medio de las mujeres no es igual al
medio de los hombres H0: m = h ingreso medio de los hombres H0: m h

Si H1 es planteada de manera que incluya ambos extremos de la distribucin muestral, la prueba de significancia es
de dos colas.

Nivel de confianza 75% 80% 85% 90% 95% 95.5% 99%


Valor de Z
1.15 1.28 1.44 1.65 1.96 2 2.58
(Bilateral)

Nivel de confianza 90% 95% 99% 99.5%


Valor de Z
1.28 1.645 2.33 2.58
(Unilateral)

Cuando usemos valores menores a n=30 o no conozcamos las varianzas de la poblacin el valor de
confianza ser el de t y no el de z.

El valor de t se calcula Grados de libertad (gl) = n-1 y confianza = 1-

16
b) Para la diferencia de dos medias poblacionales.
La prueba de hiptesis que involucra la diferencia entre las medias de dos poblaciones que se utiliza con ms
frecuencia para determinar si es razonable o no concluir que las dos son distintas entre s, se usa la siguiente
formula.

Ejemplo 1. Un equipo de investigadores desea saber si los datos que han recolectado proporcionan la evidencia
suficiente para indicar una diferencia entre las concentraciones medias de acido rico en el suero de individuos
normales e individuos con sndrome de Down. Los datos en la lecturas de acido rico en el suero de 12 individuos
con sndrome de Down y 15 individuos sanos. Las medias son = 4.5 mg/100ml y = 3.4 mg/ml. Con varianza
igual a 1 para la poblacin con sndrome de Down y de 1.5 para la poblacin sana.

1. Expresar la hiptesis nula


H0: 1 - 2 = 0

2. Expresar la hiptesis alternativa


H1: 1 - 2 0

3. Especificar el nivel de significancia


= 0.05

4. Determinar el tamao de la muestra


n1=12 n2= 15

5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Lo que corresponde a
1.96 (Bilateral)

6. Determinar la prueba estadstica.

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.


2.57 cae en la regin de rechazo

9. Determinar la decisin estadstica.


Se rechaza H0 ya que 2.57 cae en la regin de rechazo al ser mayor que 1.96

10. Expresar la decisin estadstica en trminos del problema.


Con base en estos datos hay indicios de que las medias de las poblaciones son diferentes.

17
Ejemplo 2. Un estudio tiene como objetivo examinar las caractersticas de destruccin pulmonar en personas
que fuman cigarros antes de desarrollar un marcado enfisema pulmonar. En la tabla se muestran las calificaciones
producidas, para nueve personas que no fuman y 16 fumadores. Se pretende saber si es posible concluir, con base
en los datos, que las personas que s fuman, en general, tienen los pulmones ms daados que las persona no
fumadoras, como lo indican las mediciones.

No fumadores 18.1 6 10.8 11 7.7 17.9 8.5 13 18.9


16.6 13.9 11.3 26.5 17.4 15.3 15.8 12.3 18.6
Fumadores
12 24.1 16.5 21.8 16.3 23.4 18.8

Varianza
Media

No fumadores 12.4333333 23.515

Fumadores 17.5375 20.0278333


1. Expresar la hiptesis nula H0: 1 = 2

2. Expresar la hiptesis alternativa H1: 1 2

3. Especificar el nivel de significancia = 0.05

4. Determinar el tamao de la muestra n1=9 n2= 16

5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo.
Cuando son dos poblaciones se usa n1+n2 -2 = grados de libertad y /2=precisin=2.0687 (bilateral)

6. Determinar la prueba estadstica. t

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.


2.602 cae en la regin de rechazo

9. Determinar la decisin estadstica.


Se rechaza H0 ya que 2.602 cae en la regin de rechazo al ser mayor que 2.0687

10. Expresar la decisin estadstica en trminos del problema.


Con base en estos datos se puede concluir que las dos medias son diferentes, es decir, se concluye que, las
personas que si fuman tienen los pulmones ms daados que las que no lo hacen.

18
Ejemplo 3. Un artculo publicado en una revista describe el desarrollo de una herramienta para medir las
barreras para promover la salud entre personas discapacitadas. Los autores afirman que los problemas de barreras
sobresalen especialmente de personas discapacitadas que las experimentan en situaciones como: empleo,
transporte, educacin entre otros. Para medir esto, los investigadores desarrollaron la escala de barreras en las
actividades de promocin de la salud en personas discapacitadas. Se obtuvieron los siguientes resultados al aplicar la
escala a una muestra de 132 discapacitados (D) y a 137 personas no discapacitadas (ND)

Muestra Calificacin media Desviacin estndar


D 31.83 7.93
ND 25.07 4.80

1. Expresar la hiptesis nula


H0: 1 - 2 0

2. Expresar la hiptesis alternativa


H1: 1 - 2 > 0

3. Especificar el nivel de significancia


= 0.01

4. Determinar el tamao de la muestra


n1=132 n2= 137

5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo.
Sea = 0.01 El valor de z ser 2.33 (Unilateral)

6. Determinar la prueba estadstica.

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.


8.42 cae en la regin de rechazo

9. Determinar la decisin estadstica.


Se rechaza H0 ya que 8.42 cae en la regin de rechazo al ser mayor que 2.58.

10. Expresar la decisin estadstica en trminos del problema.


Estos datos indican que en promedio las personas con discapacidad califican ms alto en la escala de barreras que
las personas sin discapacidad.

19
Para una proporcin poblacional.

El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con datos cualitativos.

q= 1 p

P0= proporcin de xitos de la hiptesis nula.

n= tamao de la muestra x= numero de xitos en la muestra

Ejemplo 1. En una investigacin de consumidores de drogas intravenosas en una ciudad grande, se encontraron
a 18 de 423 individuos con VIH positivo. Se pretende saber si es posible concluir que al menos de 5% de los
consumidores de drogas intravenosas en la poblacin muestreada tienen VIH positivo. Utilizando 95% de
confianza. (Uni)

H0: p 0.05 H1: p < 0.05

q= 1 p = 1- 0.05 = 0.95

No se rechaza H0 porque -0.70 Mayor que -1.645

Se concluye que la proporcin de la poblacin que tiene VIH positivo posiblemente sea 0.05 o ms.

Ejemplo 2. En un artculo publicado se describen los resultados de una encuesta de salud aplicada a 119
convictos varones de 50 aos de edad y mayores residentes de las instalaciones de un centro de readaptacin
social del estado. Se encontr que 21.6% de los encuestados dijeron tener antecedentes de enfermedades
venreas. Con base en estos hallazgos Es posible concluir que en la poblacin muestreada ms de 15% tiene
antecedentes de enfermedades venreas? Sea = 0.05

H0: p 0.15 H1: p 0.15

q= 1 p = 1- 0.15 = 0.85

No se rechaza H0 porque -0.88 es mayor que -1.96

Se concluye que en la poblacin la proporcin de personas posiblemente sea 0.15 o ms tiene antecedentes
venreas.

20
Ejemplo 3. Se encontr que el 66% de los nios en una muestra de 670 completaron toda serie de vacunas
contra la hepatitis B Es posible concluir que, con base en estos datos, en la poblacin muestreada, ms de 60%
tienen la serie completa de vacunas contra la hepatitis B? Sea = 0.05 (Uni)

H0: p > 0.60 H1: p < 0.60

q= 1 p = 1- 0.66 = 0.34

Se rechaza H0 porque 3.06 es mayor que 1.645

Se concluye que la poblacin de nios de donde fue tomada la muestra menos del 60% tiene la serie completa de
vacunas contra la Hepatitis B.

21
c) Para la diferencia de dos proporciones poblacionales.

Ejemplo 1. En un estudio de cuidados nutricionales en asilos para ancianos se encontraron que entre 55
pacientes con hipertensin, 24 tenan una dieta con restriccin de sodio. De 149 pacientes sin hipertensin, 36
tenan una dieta sin sodio. Es posible concluir que, en las poblaciones muestreadas, la proporcin de pacientes con
dieta restringida en sodio es mayor entre pacientes con hipertensin que entre pacientes sin hipertensin? Sea =
0.05. El valor crtico de z es 1.645. (Prueba Unilateral)

Se supone que los pacientes estudiados forman una muestral aleatoria independientemente extrada de
poblaciones con y sin hipertensin. (Uni)

H0: pH p H1: pH > p

pH es la proporcin de la poblacin de pacientes hipertensos con dietas bajas en sal y p es la proporcin de la


poblacin de pacientes sin hipertensin con dietas bajas en sal.

Se rechaza H0 porque 2.7 > 1.645

La proporcin de pacientes con dieta restringida en sodio es mayor entre los pacientes hipertensos que entre los
pacientes sin hipertensin.

22
Ejemplo 2. La mayora de las personas que dejan de fumar, se quejan de que al hacerlo suben de peso, se diseo
una nueva tcnica para prevenir que la gente suba de peso, la cual compararon contra otras dos condiciones que
incluan una condicin control de tratamiento estndar ideada para representar la atencin estndar del sobrepeso
inducido por dejar de fumar. Una de las hiptesis de los investigadores era que las tasas de abstinencia de tabaco
seran mayores con la nueva tcnica que las registradas en las otras dos condiciones. De 53 individuos asignados a la
nueva condicin, 11 dejaron de fumar al final de 52 semanas. 19 de los 54 asignados a la condicin de control se
abstuvieron hasta el final del mismo periodo. ofrecen estos datos suficiente evidencia para apoyar, con un nivel de
significancia de 0.05, la hiptesis de los investigadores?

El valor crtico de z es 1.645. (Prueba Unilateral)

H0: p1 > p2 las tasas de abstinencia de tabaco seran mayores con la nueva tcnica que las registradas en las otras
dos condiciones H1: p1 > p2

p1 es la proporcin de la poblacin de pacientes asignados a la nueva condicin y p2 es la proporcin de la poblacin


de pacientes control.

Se acepta H0 dado que -1.666 es menor que 1.645

Los datos presentados presentan suficiente evidencia para apoyar a los investigadores.

Ejemplo 3. Ciertas investigaciones sugieren que entre pacientes con depresin unipolar primaria se registra una
tasa alta de alcoholismo. Una investigacin realizada profundiza en esta posible relacin. Entre 210 familias de
mujeres con depresin unipolar primaria grave, los investigadores encontraron que el alcoholismo estaba presente
en 89. Entre 299 familias catalogadas como familias de control en la investigacin, el alcoholismo estuvo presente en
94. Ofrecen estos datos suficiente evidencia para concluir que el alcoholismo es ms probable de encontrar en
familias con integrantes que tienen depresin unipolar? Sea = 0.05. (Uni)

No se rechaza H0 porque 2.65 es mayor (>) a 1.645

23
d) Para poblaciones pareadas.
En el anlisis referente a la diferencia entre las medias de dos poblaciones, se supone que las muestras son
independientes. Un mtodo que se utiliza con frecuencia para averiguar la eficacia de un tratamiento o
procedimiento experimental es aquel que hace uso de observaciones relacionadas que resultan de muestras no
independientes. Una prueba de hiptesis que se basa en este tipo de datos se conoce como prueba de
comparaciones por parejas o de poblaciones pareadas.

Con frecuencia sucede que las diferencias reales no existen entre dos poblaciones con respecto al a variable de
inters, pero la presencia de fuentes extraas de variacin pueden causar rechazo de la hiptesis nula.

Por ejemplo, supongamos que se pretende comparar dos protectores solares para la piel. . Existen al menos dos
maneras de llevar a cabo el experimento. Un mtodo sera seleccionar una muestra aleatoria simple e independiente
que recibiera el protector solar A y una segunda que muestra aleatoria simple e independiente que recibiera el
protector solar B. Se pide a todos los individuos que salgan a broncearse a la luz del sol durante un tiempo
especfico, y despus se mide el dao causado por el sol. Suponga que se aplica este mtodo, pero inadvertidamente
la mayora de los individuos que recibieron el protector solar A tienen piel oscura y por naturaleza son menos
sensibles a los rayos solares. Digamos que al terminar el experimento, se encuentra que los individuos que
recibieron el protector solar A tienen menos dao provocado por la luz del sol. So sera posible saber si tuvieron
menos dao porque el protector solar A fue ms eficaz que el protector solar B o porque la naturaleza de su piel
oscura es menos sensible al sol.

Una mejor manera de disear el experimento sera seleccionar slo una muestra aleatoria simple de individuos y que
cada uno de ellos se les aplicaran ambos protectores solares. Por ejemplo, se asignaran aleatoriamente los
protectores solares al lado derecho o izquierdo de la espalda de cada individuo de manera que recibieran ambos
productos. Despus de un tiempo especifico se exposicin se mediran los daos provocados por la luz del sol, en
cada mitad de la espalda. Si la mitad de la espalda que recibi protector solar A tiende estar menos daado, puede
atribuirse con ms confianza el resultado al protector solar, porque en cada caso ambos protectores fueron
aplicados en una misma piel.

El objetivo en pruebas de comparacin por parejas es eliminar un mximo nmero de fuentes de variacin extraa
haciendo parejas similares con respecto a tantas variables como sea posible.

d= diferencia de media muestral

= diferencia de la media muestral propuesta

24
Ejemplo 1. Nancy Stearns condujo un estudio para determinar la prdida de peso, la composicin corporal, la
distribucin de grasa corporal, la tasa metablica en reposo en individuos obesos antes y despus de 12 semanas de
tratamiento con dieta muy baja en caloras, y comparar la hidrodensitometria con el anlisis de impedancia
bioelctrica. Los 17 individuos (nueve mujeres y ocho hombres) que participaron en el estudio eran pacientes
externos de un programa de tratamiento con base hospitalaria para la obesidad. Los pesos de las mujeres antes y
despus del tratamiento se muestra en la tabla. se pretende saber si estos datos ofrecen suficiente evidencia que
permita concluir q el tratamiento es eficaz para reducir el pero en mujeres obesas.

Pesos (Kg.) de mujeres obesas antes (A) y despus (D) del tratamiento de 12 semanas
A 117.3 111.4 98.6 104.3 105.4 100.4 81.7 89.5 78.2
D 83.3 85.9 75.8 82.9 82.3 77.7 62.7 69.0 63.9

1. Expresar la hiptesis nula 3. Especificar el nivel de significancia


H0: d 0 = 0.05
(A D) H0: d 0
4. Determinar el tamao de la muestra
2. Expresar la hiptesis alternativa n1=9
H1: d < 0
(A D) H1: d < 0
5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo.
Sea = 0.05. El valor crtico de t es -1.8595 (uni) -1.8595

6. Determinar la prueba estadstica

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.Lo primero es obtener
las diferencias entre los pesos antes y despus. Las diferencias se pueden obtener de dos maneras: Primero, se
resta el peso de antes de despus (D - A): segundo se resta el peso de despus al peso de antes (A D).

Pesos (Kg.) de mujeres obesas antes (A) y despus (D) del tratamiento Totales
A 117.3 111.4 98.6 104.3 105.4 100.4 81.7 89.5 78.2
D 83.3 85.9 75.8 82.9 82.3 77.7 62.7 69 63.9
D-A -34 -25.5 -22.8 -21.4 -23.1 -22.7 -19 -20.5 -14.3 -203.3
2
(D - A) 1156 650.25 519.84 457.96 533.61 515.29 361 420.25 204.49 4818.69

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.


-12.7395 cae en la regin de rechazo, por lo tanto se rechaza H0

9. Determinar la decisin estadstica. Se rechaza H0

10. Expresar la decisin estadstica en trminos del problema.


Se puede concluir que el programa de dieta es eficaz

25
Ejemplo 2. Un artculo publicado por Kashima et al. (A-12) describe una investigacin relacionada con los padres
de nios con retraso mental, en la cual se presenta informacin sobre la enseanza de autocuidados en un programa
apoyado en diferentes medios de comunicacin, principalmente a travs de videotapes y manuales de instruccin.
Como parte del estudio, participaron 17 familias en el programa de capacitacin impartido por personal con amplia
experiencia en proyectos de capacitacin paterna. Antes y despus del programa de capacitaci6n, se aplico una
prueba de comportamiento y descripcin a cada jefe de familia o padre principal. EI examen evala el conocimiento
de los principios de modificacin del comportamiento. Una calificacin alta indica mayor conocimiento. Las
siguientes calificaciones corresponden a las pruebas de los jefes de familia, antes y despus del programa de
capacitacin:
Es posible concluir, con base en estos datos, que el programa de capacitacin aumenta el conocimiento respecto a
los principios de modificacin del comportamiento? Sea =0.01
H0: Ca < Cd H1: Ca > Cd

Calificaciones antes y despus de la capacitacin Total


Antes 7 6 10 16 8 13 8 14 16 11 12 13 9 10 17 8 5
Despus 11 14 16 17 9 15 9 17 20 12 14 15 14 15 18 15 9
D-A 4 8 6 1 1 2 1 3 4 1 2 2 5 5 1 7 4 57
2
(D - A) 16 64 36 1 1 4 1 9 16 1 4 4 25 25 1 49 16 273

t= gl (n-1) =16; =0.01 (uni)

Se rechaza H0 porque 6.111 > 2.583

26
Ejemplo 3. EI propsito de una de las investigaciones realizadas es evaluar la influencia del bloqueo extradural
para la operacin cesrea en diversas variables hemodinmicas maternas y fetales, simultneamente, y determinar
si el bloqueo modifica la funcin del miocardio fetal. Los individuos estudiados eran ocho parturientas sanas con 38 a
42 semanas de embarazo de un solo feto, sin complicaciones, que serian sometidas a operacin cesrea con
anestesia para bloqueo extradural. Los siguientes datos corresponden a los valores inferiores de esta variable en las
dos etapas:

Ofrecen suficiente evidencia estos datos, con un nivel de significacin de 0.05, para indicar que, bajo condiciones
similares y generales, la media de la presin arterial diastlica en las madres es diferente en las dos etapas?

H0 = E1 = E2 H1 = E1 E2 (Bilateral)

Medidas de la presin arterial diastlica Total


E1 70 87 72 70 73 66 63 57
E2 79 87 73 77 80 64 64 60
E2 - E1 9 0 1 7 7 -2 1 3 26
2
(E2 - E1) 81 0 1 49 49 4 1 9 194

T= gl=8-1=7; =0.05/2 =0.025 1-0.025= 0.975

No se rechaza H0 porque 2.324 < 2.3646

27

También podría gustarte