Está en la página 1de 23

Prueba respecto de medias

Pruebas de estimadores

Referencias
LECCIÓN 1 de 2

Pruebas de estimadores

Prueba de hipótesis para la media poblacional con varianza conocida

Prueba Z

Prueba de hipótesis para una media

Este punto del programa se desarrolla en la unidad 9 del texto de Berenson y Levine (1996), dado que
los autores toman este primer caso para explicar los aspectos generales del procedimiento de prueba
de hipótesis. Ten presente que este procedimiento se replicará en cada una de las pruebas que siguen
en el programa.

Dado que esta es la prueba más sencilla, es la que se utilizará para explicar el proceso general de prueba de hipótesis que complementa lo tratado en la Unidad 2,
siguiendo el orden presentado en la bibliografía básica.

Supongamos que queremos someter a prueba una hipótesis referida a la edad de emigración promedio de los ciudadanos de determinado país. Expertos en la
problemática de la emigración refieren que, para la corriente migratoria que se analiza, la edad promedio es de 25 años. Se conoce que la varianza de esta variable es
de 3,5 años. Se tomó una muestra de 24 inmigrantes seleccionados al azar en un período de 6 meses y se obtuvo que la edad promedio era de 22 años. Con una
significación α = 0,05, ¿puede considerarse verdadera la hipótesis?

En este caso estamos analizando una prueba bilateral, porque se trata de someter a prueba una igualdad estricta frente a una desigualdad.

Sigamos cada uno de los pasos planteados:

1 Establecer la hipótesis nula:

Ho: μ = 25 años. Es decir, la edad promedio al momento de emigrar es de 25 años.


2 Establecer la hipótesis alternativa:

Ho: μ ≠ 25 años. Es decir, la edad promedio al momento de emigrar es distinta de 25 años.

3 Seleccionar el nivel de significación:

Se trabajará con α = 0,05.

4 Definir el tamaño de la muestra:

La muestra de trabajo consta de 24 casos.

5 Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba:

Como se conoce la varianza, se trabajará con el estadístico Z:

6 Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una regla de decisión):

Como se pidió trabajar con una significación de 0,05, los valores críticos de Z serán -1,96 y 1,96.

Así, quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura):

Si el estadístico muestral resultante es inferior a -1,96 o si es mayor a 1,96, se rechazará la hipótesis nula.

Si el estadístico muestra es mayor a -1,96 y menor a 1,96, entonces no se rechaza la hipótesis nula.

Figura 1. Determinación de zona de rechazo y no rechazo, en la distribución normal estándar


Fuente: XXXXXXXX

7 Determinación de zona de rechazo y no rechazo, en la distribución normal estándar:

Bajo Ho cierta:

8 Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales:

El valor del estadístico muestral se ubica en la zona crítica o zona de rechazo.

9 Tomar la decisión estadística con base en la regla de decisión:

Se debe rechazar la Ho.


10 Indicar la conclusión del problema:

Con la evidencia muestral disponible, no puede suponerse que la edad promedio de emigración sea de 25 años.

Casos de pruebas de hipótesis: uno y dos extremos

En los casos en los cuales queremos someter a prueba una hipótesis referida a la igualdad del parámetro a determinado valor contra la hipótesis alternativa de
desigualdad de ese valor, tanto si la evidencia muestral tiene valores muy elevados o como si son reducidos respecto del parámetro, sospechamos de la veracidad de la
hipótesis nula y optaremos por rechazarla. Por lo tanto, en estos casos situamos la probabilidad de rechazar una hipótesis nula siendo cierta (significación) en los
extremos superior e inferior de la distribución que estamos considerando.

Este tipo de prueba se conoce como prueba de dos extremos o de dos colas. En tales casos, el nivel de significación se reparte entre ambas colas (α/2 en cada una).

Figura 2.

Fuente: elaboración propia.

Cuando estamos sometiendo a prueba una hipótesis nula con una desigualdad contra su complemento, todo el riesgo se ubica en uno de los extremos. Estas son las
pruebas de un extremo o una cola.

Figura 3.
Fuente: elaboración propia.

Figura 4.

Fuente: elaboración propia.


Vinculación entre la prueba de hipótesis y la estimación por intervalos

Tanto las pruebas de hipótesis como la estimación por intervalos se derivan de los conceptos que permiten hacer inferencia a partir de una muestra.

Un aspecto que suele generar confusión cuando enfrentamos por primera vez los procedimientos de prueba de hipótesis y estimación es la equivalencia de los valores
correspondientes a los límites de los intervalos de confianza y los valores críticos que delimitan las zonas de rechazo y no rechazo (en términos no estandarizados); en
definitiva, los valores que forman parte del intervalo de valores que se estiman también son los que hacen, numéricamente, aceptables la hipótesis nula.

Pese a esta especie de dualidad, los propósitos de ambos tipos de procedimientos son sustancialmente diferentes en el marco de las correspondientes investigaciones
que los enmarcan.

Valor p

Otra manera en la que puede abordarse y resolverse una prueba de hipótesis es determinar el nivel de significación que tiene asociado el valor resultante del
estadístico con los datos muestrales.

El valor p es la probabilidad de obtener un estadístico igual o mayor que el valor muestral, siendo la hipótesis nula cierta.

Weiers, en su texto de Introducción a la estadística para negocios (2005), indica la siguiente analogía en una prueba de salto en alto: “equivale a que Ud. saltara tan
alto como pudiera sin tener que pasar sobre una barra, y que luego los jueces le indicaran a qué altura la habría rebasado si la barra estuviera en el lugar” (p. 432).

Esta modalidad de resolución es de gran practicidad en el caso de contar con resultados procesados a través de software estadístico, que aproxima numéricamente el
cálculo de probabilidad implicado y arroja para la muestra el valor p (o p-valor, como también se lo conoce). Simplemente, el investigador compara esa significación
con la que considera para su investigación (el valor α) y, si el valor p supera al α, entonces no se rechaza la hipótesis nula; en cambio, si α es mayor que p, entonces se
rechaza la hipótesis nula.

Obviamente, esta regla de decisión se relaciona con el hecho de que, si la significación del estadístico muestral es mayor que α, entonces ese valor se encuentra en la
zona de rechazo, y viceversa.

Siguiendo al texto de la materia, los pasos correspondientes a una prueba de hipótesis utilizando el valor p se sintetizan de la siguiente manera:

1 Establecer la hipótesis nula.

2 Establecer la hipótesis alternativa.

3 Seleccionar el nivel de significación (α).

4 Considerar el tamaño de la muestra.

5 Determinar la prueba y el estadístico que se utilizarán.


6 Calcular el estadístico con los datos muestrales.

7 Estimar el valor p para el estadístico muestral:

Considerar la distribución bajo hipótesis nula cierta.

Utilizar un gráfico de la distribución y ubicar el valor del estadístico muestral calculado.

Calcular la probabilidad deseada ayudándonos con las tablas o programa estadístico apropiado.

8 Comparar el valor p con α.

9 Tomar la decisión estadística.

10 Elaborar la conclusión.

Prueba de hipótesis para la media poblacional con varianza desconocida

Prueba t para una media

Esta prueba sigue el mismo procedimiento estudiado en la prueba z, pero utilizando el estadístico t,
tal como lo vimos en el Módulo 1. Revisa en detalle el tema en el capítulo 12 (apartado 12.3) del texto
de Berenson y Levine (1996).

Prueba t

Un docente sostiene la idea de que el promedio de horas de estudio de sus alumnos ha sido inferior a 3 horas diarias en la semana previa a una evaluación. Para
comprobar su idea previa, realiza una breve encuesta anónima y obtiene la siguiente información a partir de una muestra de 15 alumnos tomados al azar del total (muy
elevado) de los alumnos de las 10 divisiones que tiene a su cargo:

Tabla 1.

Alumno (muestra) Cantidad de horas que estudió en la semana previa a la evaluación


Alumno (muestra) Cantidad de horas que estudió en la semana previa a la evaluación

1 3
2 6
3 7
4 2
5 1
6 0,5
7 1
8 2
9 2,5
10 2
11 1
12 2
13 3
14 2
15 0,5

En este caso estamos analizando una prueba unilateral porque se plantea una desigualdad.

Sigamos cada uno de los pasos planteados:

1 Establecer la hipótesis nula:

Ho: μ ≥ 3 horas.

 Nota cómo se seleccionó la hipótesis nula. Si bien se sostiene que la cantidad de horas de estudio promedio fue inferior a esa cantidad,
se utiliza en la hipótesis nula la afirmación complementaria porque incluye la igualdad. Y en particular, si se encuentra evidencia que
permita refutar la hipótesis nula, haberla planteado de esta manera nos permite un resultado más sólido.

2 Establecer la hipótesis alternativa:

Ho: μ < 3 horas.

3 Seleccionar el nivel de significación:

Se trabajará con α = 0,05.


4 Definir el tamaño de la muestra de trabajo:

La muestra consta de 15 casos.

5 Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba:

Como se desconoce la varianza, se trabajará con el estadístico t, con n-1 grados de libertad:

6 Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una regla de decisión):

Como se pidió trabajar con una significación de 0,05, el valor crítico de t con 14 grados de libertad es -1,7613.

Luego quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura):

Si el estadístico muestral resultante es inferior a -1,7613, se rechazará la hipótesis nula.

Si el estadístico muestral es mayor a -1,7613, entonces no se rechaza la hipótesis nula.

Figura 5. Determinación de zona de rechazo y no rechazo en la distribución t


Fuente: XXXXXXXXXXXX

7 A partir de los datos muestrales, obtener el valor del estadístico muestral:

Bajo Ho cierta:

8 Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales:

El valor del estadístico muestral se ubica en la zona de no rechazo.

9 Tomar la decisión estadística con base en la regla de decisión:

No se debe rechazar la Ho.


10 Indicar la conclusión del problema:

Con la evidencia muestral disponible, no puede descartarse que el promedio de horas de estudio haya sido mayor
o igual a 3.

Pruebas para diferencias de medias

Prueba para diferencias de medias

Existen varias pruebas para contrastar hipótesis sobre diferencias de medias, teniendo en cuenta
algunas condiciones. Ten precaución en identificar correctamente cada caso. Estas pruebas se
desarrollan en detalle en el Capítulo 13 (apartados 13.1, 13.2, 13.3, 13.4, 13.9) del texto de Berenson y
Levine (1996).

En muchas ocasiones necesitamos conocer si existe diferencia en las características de dos poblaciones de interés.

Es habitual, cuando se obtienen medidas de resumen de muestras correspondientes a dos poblaciones, preguntarse si realmente hay una diferencia significativa entre
ellas o si podrían considerarse iguales, pese a la diferencia muestral observada (quizá derivada del azar). Para poder responder este tipo de preguntas, las pruebas de
hipótesis vinculadas con dos medias brindan una herramienta de gran aplicación en diversos usos de investigación y toma de decisiones.

Pruebas para muestras independientes y dependientes: diferencias entre ambos tipos de muestras

En el caso de las pruebas sobre diferencias de medias, podemos enfrentar alguna de las siguientes situaciones, dependiendo de qué tipo de diseño de investigación se
utilizó:

1 Muestras independientes.

2 Muestras relacionadas o apareadas.

La selección del tipo de comparación que se realice está fundamentalmente asociada con el problema que se enfrente y el tipo de dato del que se disponga a partir de
un experimento, observación o encuesta.
Se dice que las muestras son independientes si la aparición o selección de un individuo en una muestra no tiene ninguna relación con la aparición o selección de
ningún individuo o elemento en la otra muestra. Este caso se aplica cuando los individuos de cada una de las muestras pertenecen a dos poblaciones distintas, cuya
diferencia de medias es el propósito principal de la prueba.

Cuando las dos muestras se han construido de manera que la inclusión de un individuo en una de las muestras condiciona la selección de otro en la otra muestra o
cuando se analiza repetidamente información (generalmente, a lo largo del tiempo) sobre un mismo individuo, decimos que son muestras relacionadas o apareadas.

En el caso de muestras independientes, consideraremos dos pruebas de hipótesis referidas a las diferencias entre medias de ambas muestras, teniendo en cuenta qué
supuestos corresponda aplicar.

Prueba de diferencia de medias para muestras independientes

Caso de varianza conjunta

Consideremos el siguiente problema: una marca de combustibles ha desarrollado un nuevo combustible premium que reemplazaría al que se produce actualmente,
para lo cual quiere analizar si realmente hay una diferencia en cuanto a rendimiento. Se contrata a un experto en combustibles para determinar si existe alguna
diferencia entre estos combustibles de la marca en el mismo modelo de automóvil. El combustible A, que se está evaluando para considerar su introducción en el
mercado, se probó en 20 autos, y se calculó una media muestral de 14 km por litro (con una desviación estándar de 2 km por litro), mientras que el combustible B, que
se probó en 10 automóviles, produjo una media de rendimiento de 13,2 km por litro, con una desviación estándar de 2,1 km por litro. Suponiendo varianzas iguales,
¿existe evidencia de que el nuevo combustible (A) supera al que se produce en la actualidad?

Veamos paso a paso cómo comprobamos esta hipótesis.

1 Establecer la hipótesis nula:

Ho: μ1 − μ2 ≤ 0.

Vamos a llamar muestra 1 a la correspondiente al nuevo combustible (A) y 2 a la del combustible que se produce actualmente. Dado que nos interesa ver si el nuevo
combustible tiene más rendimiento que el actual, en la hipótesis nula planteamos el estado de la naturaleza que, si se puede, se descartará con evidencia muestral
contundente.

2 Establecer la hipótesis alternativa:

H1: μ1 − μ2 > 0.

3 Seleccionar el nivel de significación:


Se trabajará con α = 0,05.

4 Definir el tamaño de la muestra:

Las muestras de trabajo constan de 20 casos y 10 casos respectivamente.

5 Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba:

El estadístico tiene distribución t, con n1+n2-2 grados de libertad:

Donde la varianza conjunta se construye de la siguiente manera a partir de las varianzas muestrales de cada muestra respectiva:

6 Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una regla de decisión):

Como se pidió trabajar con una significación de 0,05, el valor crítico de t con 28 grados de libertad es de 1,701.

Luego quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura):

Si el estadístico muestral resultante es mayor a 1,701, se rechazará la hipótesis nula.

Si el estadístico muestral es menor a 1,701, entonces no se rechaza la hipótesis nula.


Figura 6. Determinación de zona de rechazo y no rechazo en la distribución t

Fuente: XXXXXXXXXX

7 A partir de los datos muestrales, obtener el valor del estadístico muestral:

Donde:
8 Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales:

El valor del estadístico muestral (t = 1,01602) se ubica en la zona de no rechazo.

9 Tomar la decisión estadística con base en la regla de decisión:

No se debe rechazar la Ho.

10 Indicar la conclusión del problema:

Con la evidencia muestral disponible, no puede descartarse que el rendimiento del nuevo combustible sea igual o
menor que el combustible actual.

Prueba de diferencia de medias para muestras independientes

Caso de varianzas separadas

Cuando no podemos asumir que las dos poblaciones tienen iguales varianzas, adoptamos esta prueba. Vamos a desarrollar también un ejemplo en este caso:

 El dueño de una veterinaria desea comprobar si existe diferencia en la cantidad total de dinero gastada por mes entre los dueños de perros y los
dueños de gatos. Se consideró una muestra de individuos que solo poseía una de estas mascotas, considerando animales (tanto perros como
gatos) de un rango de peso de 3 a 5 kilos. En el caso de los dueños de gatos, se obtuvo una media muestral de $19,16 por semana, para una
muestra de 26 casos, con una desviación estándar de $8,52. En la muestra de 37 dueños de perros, se estimó que, en promedio, gastan $26,47
por semana, con una desviación estándar de $9,45. ¿Existe una diferencia significativa en el gasto promedio?
1 Establecer la hipótesis nula:

Ho: μ1 − μ2 = 0.

Vamos a llamar muestra 1 a la correspondiente a los dueños de gatos y 2 a la muestra de dueños de perros. Planeamos una prueba bilateral, ya que se desea saber si
existe o no diferencia.

2 Establecer la hipótesis alternativa:

H1: μ1 − μ2 ≠ 0.

3 Seleccionar el nivel de significación:

Se trabajará con α = 0,05.

4 Definir el tamaño de la muestra:

Las muestras de trabajo constan de 26 casos de dueños de gatos y 37 casos de dueños de perros.

5 Establecer qué estadístico muestral, con distribución conocida, se utilizará en la prueba:

El estadístico tiene distribución t, con v grados de libertad:


6 Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una regla de decisión):

Aproximemos, en primer lugar, el valor de v:

Se procede a tomar la parte entera del valor obtenido de v: 57.


Como se pidió trabajar con una significación de 0,05, los valores críticos de t con 57 grados de libertad son -2 y 2.

Luego quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura):

Si el estadístico muestral resultante es menor a -2 o mayor a 2, se rechazará la hipótesis nula.

Si el estadístico muestral es mayor a -2 y menor a 2, entonces no se rechaza la hipótesis nula.

Figura 7. Determinación de zona de rechazo y no rechazo, en la distribución t

Fuente: XXXXXXX

Se sombrean en el gráfico las zonas de rechazo de la hipótesis.

7 A partir de los datos muestrales, obtener el valor del estadístico muestral:

Bajo Ho cierta:
8 Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales:

El valor del estadístico muestral se ubica en la zona de rechazo.

9 Tomar la decisión estadística con base en la regla de decisión:

Se debe rechazar la Ho.

10 Indicar la conclusión del problema:

Con la evidencia muestral disponible, no puede sostenerse la idea de que los dueños de perros y gatos gastan lo
mismo semanalmente en sus mascotas.

Prueba de diferencia de medias para muestras relacionadas

El caso de las muestras relacionadas es de amplia utilización cuando se necesita disponer de comparaciones entre sujetos con mínima variabilidad entre sí o en
pruebas sucesivas repetidas (estudios “antes y después” sobre un mismo sujeto). En este caso, analizamos la diferencia específica para el par de observaciones
apareadas, que denominaremos D.

Di = Xil - Xi2

Esta diferencia, para cada par de datos que estamos estudiando, representa las diferencias uno a uno. Por ejemplo, si es un estudio entre gemelos, en el cual a uno de
los gemelos de cada conjunto de hermanos gemelos que se está estudiando se le aplicó un tratamiento cuyo efecto se quiere comprobar, la diferencia D es la medida
de la distancia en la variable de respuesta para ambos sujetos. Justamente, lo que se pretende someter a prueba es la existencia o no de tal diferencia entre los sujetos
que fueron sometidos a tratamiento y los que no, aun en los casos en los que los sujetos poseen gran homogeneidad entre sí.
El promedio muestral de tales diferencias se obtiene considerando todas las D para los n pares de sujetos de estudio:

Denotaremos D μ a la diferencia poblacional que se somete a prueba.

La prueba se lleva a cabo con el mismo procedimiento utilizado previamente para los diversos casos de pruebas de hipótesis.

Las hipótesis nula y alternativa en este caso serán:

Ho: 0 = D μ.

H1: 0 ≠ D μ.

El estadístico de prueba será:

Este estadístico posee n-1 grados de libertad.

Para el cálculo de la desviación estándar muestral, se deberá considerar la siguiente fórmula:


Para profundizar los temas de la lectura te recomiendo que leas la siguiente publicación:

Tolerancia dialítica en pacientes diabéticos.pdf


97.4 KB
LECCIÓN 2 de 2

Referencias

Berenson, M. L. y Levine, D. M. (1996). Estadística para administración y economía (6.a ed.). México D. F., MX: Prentice Hall Hispanoamericana.

Weiers, R. (2005). Introducción a la estadística para negocios (5.a ed.). México D. F., MX: Thompson.

También podría gustarte