Está en la página 1de 20

Prueba

respecto de
medias

Herramientas
Matemáticas V
– Estadística II

1
Prueba respecto de medias

Pruebas de estimadores

Prueba de hipótesis para la media poblacional con varianza


Prueba de hipótesis conocida
para una media

Este punto del Prueba Z


programa se desarrolla
en la unidad 9 del
texto de Berenson y Dado que esta es la prueba más sencilla, es la que se utilizará para explicar
Levine (1996), dado el proceso general de prueba de hipótesis que complementa lo tratado en la
que los autores toman Unidad 2, siguiendo el orden presentado en la bibliografía básica.
este primer caso para
explicar los aspectos
generales del
procedimiento de Prueba de hipótesis para la media poblacional
prueba de hipótesis.
Ten presente que este
procedimiento se Varianza conocida
replicará en cada una
de las pruebas que
siguen en el programa. Prueba Z

Supongamos que queremos someter a prueba una hipótesis referida a la


edad de emigración promedio de los ciudadanos de determinado país.
Expertos en la problemática de la emigración refieren que, para la corriente
migratoria que se analiza, la edad promedio es de 25 años. Se conoce que la
varianza de esta variable es de 3,5 años2. Se tomó una muestra de 24
emigrantes seleccionados al azar en un período de 6 meses y se obtuvo que
la edad promedio era de 22 años. Con una significación α = 0,05, ¿puede
considerarse verdadera la hipótesis?

En este caso estamos analizando una prueba bilateral, porque se trata de


someter a prueba una igualdad estricta frente a una desigualdad.

Sigamos cada uno de los pasos planteados:

1) Establecer la hipótesis nula:


 Ho: µ = 25 años. Es decir, la edad promedio al momento de emigrar es de
25 años.

2) Establecer la hipótesis alternativa:

2
 Ho: µ ≠ 25 años. Es decir, la edad promedio al momento de emigrar es
distinta de 25 años.

3) Seleccionar el nivel de significación:


 Se trabajará con α = 0,05.

4) Definir el tamaño de la muestra:


 La muestra de trabajo consta de 24 casos.

5) Establecer qué estadístico muestral, con distribución conocida, se


utilizará en la prueba:
 Como se conoce la varianza, se trabajará con el estadístico Z:

6) Calcular el o los valores críticos, identificando así las zonas de rechazo y


no rechazo (lo cual deriva en disponer de una regla de decisión):
 Como se pidió trabajar con una significación de 0,05, los valores críticos
de Z serán -1,96 y 1,96.

Así, quedará determinada la siguiente regla de decisión (indicada también en


la siguiente figura):

 Si el estadístico muestral resultante es inferior a -1,96 o si es mayor a 1,96,


se rechazará la hipótesis nula.
 Si el estadístico muestra es mayor a -1,96 y menor a 1,96, entonces no se
rechaza la hipótesis nula.

Figura 1: Determinación de zona de rechazo y no rechazo, en la distribución


normal estándar

Título principal

3
7) Determinación de zona de rechazo y no rechazo, en la distribución normal
estándar:
 Bajo Ho cierta:

8) Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de


prueba obtenido con los datos muestrales:
 El valor del estadístico muestral se ubica en la zona crítica o zona de
rechazo.

9) Tomar la decisión estadística con base en la regla de decisión:


 Se debe rechazar la Ho.

10) Indicar la conclusión del problema:


 Con la evidencia muestral disponible, no puede suponerse que la edad
promedio de emigración sea de 25 años.

Casos de pruebas de hipótesis: uno y dos extremos

En los casos en los cuales queremos someter a prueba una hipótesis referida
a la igualdad del parámetro a determinado valor contra la hipótesis
alternativa de desigualdad de ese valor, tanto si la evidencia muestral tiene
valores muy elevados o como si son reducidos respecto del parámetro,
sospechamos de la veracidad de la hipótesis nula y optaremos por
rechazarla. Por lo tanto, en estos casos situamos la probabilidad de rechazar
una hipótesis nula siendo cierta (significación) en los extremos superior e
inferior de la distribución que estamos considerando.

Este tipo de prueba se conoce como prueba de dos extremos o de dos colas.
En tales casos, el nivel de significación se reparte entre ambas colas (α/2 en
cada una).

4
Figura 2:

Fuente: elaboración propia.

Cuando estamos sometiendo a prueba una hipótesis nula con una


desigualdad contra su complemento, todo el riesgo se ubica en uno de los
extremos. Estas son las pruebas de un extremo o una cola.

Figura 3:

Fuente: elaboración propia.

5
Figura 4:

Fuente: elaboración propia.

Vinculación entre la prueba de hipótesis y la estimación por


intervalos

Tanto las pruebas de hipótesis como la estimación por intervalos se derivan


de los conceptos que permiten hacer inferencia a partir de una muestra.

Un aspecto que suele generar confusión cuando enfrentamos por primera


vez los procedimientos de prueba de hipótesis y estimación es la
equivalencia de los valores correspondientes a los límites de los intervalos
de confianza y los valores críticos que delimitan las zonas de rechazo y no
rechazo (en términos no estandarizados); en definitiva, los valores que
forman parte del intervalo de valores que se estiman también son los que
hacen, numéricamente, aceptables la hipótesis nula.

6
Pese a esta especie de dualidad, los propósitos de ambos tipos de
procedimientos son sustancialmente diferentes en el marco de las
correspondientes investigaciones que los enmarcan.

Valor p

Otra manera en la que puede abordarse y resolverse una prueba de hipótesis


es determinar el nivel de significación que tiene asociado el valor resultante
del estadístico con los datos muestrales.

El valor p es la probabilidad de obtener un estadístico igual o mayor que el


valor muestral, siendo la hipótesis nula cierta.

Weiers, en su texto de Introducción a la estadística para negocios (2005),


indica la siguiente analogía en una prueba de salto en alto: “equivale a que
Ud. saltara tan alto como pudiera sin tener que pasar sobre una barra, y que
luego los jueces le indicaran a qué altura la habría rebasado si la barra
estuviera en el lugar” (p. 432).

Esta modalidad de resolución es de gran practicidad en el caso de contar con


resultados procesados a través de software estadístico, que aproxima
numéricamente el cálculo de probabilidad implicado y arroja para la muestra
el valor p (o p-valor, como también se lo conoce). Simplemente, el
investigador compara esa significación con la que considera para su
investigación (el valor α) y, si el valor p supera al α, entonces no se rechaza
la hipótesis nula; en cambio, si α es mayor que p, entonces se rechaza la
hipótesis nula.

Obviamente, esta regla de decisión se relaciona con el hecho de que, si la


significación del estadístico muestral es mayor que α, entonces ese valor se
encuentra en la zona de rechazo, y viceversa.

Siguiendo al texto de la materia, los pasos correspondientes a una prueba


de hipótesis utilizando el valor p se sintetizan de la siguiente manera:

1) Establecer la hipótesis nula.


2) Establecer la hipótesis alternativa.
3) Seleccionar el nivel de significación (α).
4) Considerar el tamaño de la muestra.
5) Determinar la prueba y el estadístico que se utilizarán.
6) Calcular el estadístico con los datos muestrales.
7) Estimar el valor p para el estadístico muestral:
 Considerar la distribución bajo hipótesis nula cierta.
 Utilizar un gráfico de la distribución y ubicar el valor del estadístico
muestral calculado.

7
 Calcular la probabilidad deseada ayudándonos con las tablas o programa
estadístico apropiado.
8) Comparar el valor p con α.
9) Tomar la decisión estadística.
10) Elaborar la conclusión.

Prueba t para una Prueba de hipótesis para la media poblacional con


media
varianza desconocida
Esta prueba sigue el
mismo procedimiento
estudiado en la Prueba t
prueba z, pero
utilizando el Un docente sostiene la idea de que el promedio de horas de estudio de sus
estadístico t, tal como alumnos ha sido inferior a 3 horas diarias en la semana previa a una
lo vimos en el Módulo
1. Revisa en detalle el
evaluación. Para comprobar su idea previa, realiza una breve encuesta
tema en el capítulo 12 anónima y obtiene la siguiente información a partir de una muestra de 15
(apartado 12.3) del alumnos tomados al azar del total (muy elevado) de los alumnos de las 10
texto de Berenson y divisiones que tiene a su cargo:
Levine (1996).
Tabla 1:

8
En este caso estamos analizando una prueba unilateral porque se plantea
una desigualdad.

Sigamos cada uno de los pasos planteados:

1) Establecer la hipótesis nula:


 Ho: µ ≥ 3 horas.

Nota cómo se seleccionó la hipótesis nula. Si bien se sostiene que la cantidad


de horas de estudio promedio fue inferior a esa cantidad, se utiliza en la
hipótesis nula la afirmación complementaria porque incluye la igualdad. Y
en particular, si se encuentra evidencia que permita refutar la hipótesis nula,
haberla planteado de esta manera nos permite un resultado más sólido.

2) Establecer la hipótesis alternativa:


 Ho: µ < 3 horas.

3) Seleccionar el nivel de significación:


 Se trabajará con α = 0,05.

4) Definir el tamaño de la muestra de trabajo:


 La muestra consta de 15 casos.

5) Establecer qué estadístico muestral, con distribución conocida, se


utilizará en la prueba:
 Como se desconoce la varianza, se trabajará con el estadístico t, con n-1
grados de libertad:

6) Calcular el o los valores críticos, identificando así las zonas de rechazo y


no rechazo (lo cual deriva en disponer de una regla de decisión):
 Como se pidió trabajar con una significación de 0,05, el valor crítico de t
con 14 grados de libertad es -1,7613.

9
Luego quedará determinada la siguiente regla de decisión (indicada también
en la siguiente figura):

 Si el estadístico muestral resultante es inferior a -1,7613, se rechazará la


hipótesis nula.
 Si el estadístico muestral es mayor a -1,7613, entonces no se rechaza la
hipótesis nula.

Figura 5: Determinación de zona de rechazo y no rechazo en la distribución


t

7) A partir de los datos muestrales, obtener el valor del estadístico muestral:


 Bajo Ho cierta:

8) Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de


prueba obtenido con los datos muestrales:
 El valor del estadístico muestral se ubica en la zona de no rechazo.

9) Tomar la decisión estadística con base en la regla de decisión:


 No se debe rechazar la Ho.

10) Indicar la conclusión del problema:

10
 Con la evidencia muestral disponible, no puede descartarse que el
promedio de horas de estudio haya sido mayor o igual a 3.

Prueba para diferencias de Pruebas para diferencias de medias


medias

Existen varias pruebas para En muchas ocasiones necesitamos conocer si existe diferencia en las
contrastar hipótesis sobre características de dos poblaciones de interés.
diferencias de medias,
teniendo en cuenta algunas
Es habitual, cuando se obtienen medidas de resumen de muestras
condiciones. Ten
precaución en identificar correspondientes a dos poblaciones, preguntarse si realmente hay una
correctamente cada caso. diferencia significativa entre ellas o si podrían considerarse iguales, pese a la
Estas pruebas se diferencia muestral observada (quizá derivada del azar). Para poder
desarrollan en detalle en el responder este tipo de preguntas, las pruebas de hipótesis vinculadas con
Capítulo 13 (apartados
dos medias brindan una herramienta de gran aplicación en diversos usos de
13.1, 13.2, 13.3, 13.4, 13.9)
del texto de Berenson y investigación y toma de decisiones.
Levine (1996).
Pruebas para muestras independientes y dependientes:
diferencias entre ambos tipos de muestras

En el caso de las pruebas sobre diferencias de medias, podemos enfrentar


alguna de las siguientes situaciones, dependiendo de qué tipo de diseño de
investigación se utilizó:

1) Muestras independientes.
2) Muestras relacionadas o apareadas.

La selección del tipo de comparación que se realice está fundamentalmente


asociada con el problema que se enfrente y el tipo de dato del que se
disponga a partir de un experimento, observación o encuesta.

Se dice que las muestras son independientes si la aparición o selección de


un individuo en una muestra no tiene ninguna relación con la aparición o
selección de ningún individuo o elemento en la otra muestra. Este caso se
aplica cuando los individuos de cada una de las muestras pertenecen a dos
poblaciones distintas, cuya diferencia de medias es el propósito principal de
la prueba.

Cuando las dos muestras se han construido de manera que la inclusión de


un individuo en una de las muestras condiciona la selección de otro en la
otra muestra o cuando se analiza repetidamente información

11
(generalmente, a lo largo del tiempo) sobre un mismo individuo, decimos
que son muestras relacionadas o apareadas.

En el caso de muestras independientes, consideraremos dos pruebas de


hipótesis referidas a las diferencias entre medias de ambas muestras,
teniendo en cuenta qué supuestos corresponda aplicar.

Prueba de diferencia de medias para muestras


independientes

Caso de varianza conjunta

Consideremos el siguiente problema: una marca de combustibles ha


desarrollado un nuevo combustible premium que reemplazaría al que se
produce actualmente, para lo cual quiere analizar si realmente hay una
diferencia en cuanto a rendimiento. Se contrata a un experto en
combustibles para determinar si existe alguna diferencia entre estos
combustibles de la marca en el mismo modelo de automóvil. El combustible
A, que se está evaluando para considerar su introducción en el mercado, se
probó en 20 autos, y se calculó una media muestral de 14 km por litro (con
una desviación estándar de 2 km por litro), mientras que el combustible B,
que se probó en 10 automóviles, produjo una media de rendimiento de 13,2
km por litro, con una desviación estándar de 2,1 km por litro. Suponiendo
varianzas iguales, ¿existe evidencia de que el nuevo combustible (A) supera
al que se produce en la actualidad?

Veamos paso a paso cómo comprobamos esta hipótesis.

1) Establecer la hipótesis nula:


 Ho: μ1 − μ2 ≤ 0.

Vamos a llamar muestra 1 a la correspondiente al nuevo combustible (A) y 2


a la del combustible que se produce actualmente. Dado que nos interesa ver
si el nuevo combustible tiene más rendimiento que el actual, en la hipótesis
nula planteamos el estado de la naturaleza que, si se puede, se descartará
con evidencia muestral contundente.

2) Establecer la hipótesis alternativa:


 H1: μ1 − μ2 > 0.

3) Seleccionar el nivel de significación:


 Se trabajará con α = 0,05.

4) Definir el tamaño de la muestra:

12
 Las muestras de trabajo constan de 20 casos y 10 casos respectivamente.

5) Establecer qué estadístico muestral, con distribución conocida, se


utilizará en la prueba:
 El estadístico tiene distribución t, con n1+n2-2 grados de libertad:

Donde la varianza conjunta se construye de la siguiente manera a partir de


las varianzas muestrales de cada muestra respectiva:

6) Calcular el o los valores críticos, identificando así las zonas de rechazo y


no rechazo (lo cual deriva en disponer de una regla de decisión):
 Como se pidió trabajar con una significación de 0,05, el valor crítico de t
con 28 grados de libertad es de 1,701.

Luego quedará determinada la siguiente regla de decisión (indicada también


en la siguiente figura):

 Si el estadístico muestral resultante es mayor a 1,701, se rechazará la


hipótesis nula.
 Si el estadístico muestral es menor a 1,701, entonces no se rechaza la
hipótesis nula.

Figura 6: Determinación de zona de rechazo y no rechazo en la distribución


t

13
7) A partir de los datos muestrales, obtener el valor del estadístico muestral:

Donde:

8) Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de


prueba obtenido con los datos muestrales:
 El valor del estadístico muestral (t = 1,01602) se ubica en la zona de no
rechazo.

9) Tomar la decisión estadística con base en la regla de decisión:


 No se debe rechazar la Ho.

14
10) Indicar la conclusión del problema:
 Con la evidencia muestral disponible, no puede descartarse que el
rendimiento del nuevo combustible sea igual o menor que el combustible
actual.

Prueba de diferencia de medias para muestras


independientes

Caso de varianzas separadas

Cuando no podemos asumir que las dos poblaciones tienen iguales


varianzas, adoptamos esta prueba. Vamos a desarrollar también un ejemplo
en este caso:

El dueño de una veterinaria desea comprobar si existe diferencia en la


cantidad total de dinero gastada por mes entre los dueños de perros y los
dueños de gatos. Se consideró una muestra de individuos que solo poseía
una de estas mascotas, considerando animales (tanto perros como gatos) de
un rango de peso de 3 a 5 kilos. En el caso de los dueños de gatos, se obtuvo
una media muestral de $19,16 por semana, para una muestra de 26 casos,
con una desviación estándar de $8,52. En la muestra de 37 dueños de perros,
se estimó que, en promedio, gastan $26,47 por semana, con una desviación
estándar de $9,45. ¿Existe una diferencia significativa en el gasto promedio?

1) Establecer la hipótesis nula:


 Ho: μ1 − μ2 = 0.

Vamos a llamar muestra 1 a la correspondiente a los dueños de gatos y 2 a


la muestra de dueños de perros. Planeamos una prueba bilateral, ya que se
desea saber si existe o no diferencia.

2) Establecer la hipótesis alternativa:


 H1: μ1 − μ2 ≠ 0.

3) Seleccionar el nivel de significación:


 Se trabajará con α = 0,05.

4) Definir el tamaño de la muestra:


 Las muestras de trabajo constan de 26 casos de dueños de gatos y 37
casos de dueños de perros.

5) Establecer qué estadístico muestral, con distribución conocida, se


utilizará en la prueba:

15
 El estadístico tiene distribución t, con v grados de libertad:

Donde v está dado por

6) Calcular el o los valores críticos, identificando así las zonas de rechazo y


no rechazo (lo cual deriva en disponer de una regla de decisión):
 Aproximemos, en primer lugar, el valor de v:

 Se procede a tomar la parte entera del valor obtenido de v: 57.


 Como se pidió trabajar con una significación de 0,05, los valores críticos
de t con 57 grados de libertad son -2 y 2.

Luego quedará determinada la siguiente regla de decisión (indicada también


en la siguiente figura):

16
 Si el estadístico muestral resultante es menor a -2 o mayor a 2, se
rechazará la hipótesis nula.
 Si el estadístico muestral es mayor a -2 y menor a 2, entonces no se
rechaza la hipótesis nula.

Figura 7: Determinación de zona de rechazo y no rechazo, en la distribución


t

Se sombrean en el gráfico las zonas de rechazo de la hipótesis.

7) A partir de los datos muestrales, obtener el valor del estadístico muestral:


 Bajo Ho cierta:

8) Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de


prueba obtenido con los datos muestrales:
 El valor del estadístico muestral se ubica en la zona de rechazo.

9) Tomar la decisión estadística con base en la regla de decisión:


 Se debe rechazar la Ho.

10) Indicar la conclusión del problema:

17
 Con la evidencia muestral disponible, no puede sostenerse la idea de que
los dueños de perros y gatos gastan lo mismo semanalmente en sus
mascotas.

Prueba de diferencia de medias para muestras relacionadas

El caso de las muestras relacionadas es de amplia utilización cuando se


necesita disponer de comparaciones entre sujetos con mínima variabilidad
entre sí o en pruebas sucesivas repetidas (estudios “antes y después” sobre
un mismo sujeto). En este caso, analizamos la diferencia específica para el
par de observaciones apareadas, que denominaremos D.

Esta diferencia, para cada par de datos que estamos estudiando, representa
las diferencias uno a uno. Por ejemplo, si es un estudio entre gemelos, en el
cual a uno de los gemelos de cada conjunto de hermanos gemelos que se
está estudiando se le aplicó un tratamiento cuyo efecto se quiere
comprobar, la diferencia D es la medida de la distancia en la variable de
respuesta para ambos sujetos. Justamente, lo que se pretende someter a
prueba es la existencia o no de tal diferencia entre los sujetos que fueron
sometidos a tratamiento y los que no, aun en los casos en los que los sujetos
poseen gran homogeneidad entre sí.

El promedio muestral de tales diferencias se obtiene considerando todas las


D para los n pares de sujetos de estudio:

Denotaremos D μ a la diferencia poblacional que se somete a prueba.

La prueba se lleva a cabo con el mismo procedimiento utilizado previamente


para los diversos casos de pruebas de hipótesis.

Las hipótesis nula y alternativa en este caso serán:

 Ho: 0 = D μ.
 H1: 0 ≠ D μ.

El estadístico de prueba será:

18
Este estadístico posee n-1 grados de libertad.

Para el cálculo de la desviación estándar muestral, se deberá considerar la


siguiente fórmula:

19
Referencias
Berenson, M. L. y Levine, D. M. (1996). Estadística para administración y
economía (6.a ed.). México D. F., MX: Prentice Hall Hispanoamericana.

Weiers, R. (2005). Introducción a la estadística para negocios (5.a ed.).


México D. F., MX: Thompson.

20

También podría gustarte