Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pruebas de estimadores
Referencias
LECCIÓN 1 de 2
Pruebas de estimadores
Prueba Z
Este punto del programa se desarrolla en la unidad 9 del texto de Berenson y Levine (1996), dado que
los autores toman este primer caso para explicar los aspectos generales del procedimiento de prueba
de hipótesis. Ten presente que este procedimiento se replicará en cada una de las pruebas que siguen
en el programa.
Dado que esta es la prueba más sencilla, es la que se utilizará para explicar el proceso general de prueba de hipótesis que complementa lo tratado en la Unidad 2,
siguiendo el orden presentado en la bibliografía básica.
Supongamos que queremos someter a prueba una hipótesis referida a la edad de emigración promedio de los ciudadanos de determinado país. Expertos en la
problemática de la emigración refieren que, para la corriente migratoria que se analiza, la edad promedio es de 25 años. Se conoce que la varianza de esta variable es
de 3,5 años. Se tomó una muestra de 24 inmigrantes seleccionados al azar en un período de 6 meses y se obtuvo que la edad promedio era de 22 años. Con una
significación α = 0,05, ¿puede considerarse verdadera la hipótesis?
En este caso estamos analizando una prueba bilateral, porque se trata de someter a prueba una igualdad estricta frente a una desigualdad.
6 Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una regla de decisión):
Como se pidió trabajar con una significación de 0,05, los valores críticos de Z serán -1,96 y 1,96.
Así, quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura):
Si el estadístico muestral resultante es inferior a -1,96 o si es mayor a 1,96, se rechazará la hipótesis nula.
Si el estadístico muestra es mayor a -1,96 y menor a 1,96, entonces no se rechaza la hipótesis nula.
Bajo Ho cierta:
8 Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales:
Con la evidencia muestral disponible, no puede suponerse que la edad promedio de emigración sea de 25 años.
En los casos en los cuales queremos someter a prueba una hipótesis referida a la igualdad del parámetro a determinado valor contra la hipótesis alternativa de
desigualdad de ese valor, tanto si la evidencia muestral tiene valores muy elevados o como si son reducidos respecto del parámetro, sospechamos de la veracidad de la
hipótesis nula y optaremos por rechazarla. Por lo tanto, en estos casos situamos la probabilidad de rechazar una hipótesis nula siendo cierta (significación) en los
extremos superior e inferior de la distribución que estamos considerando.
Este tipo de prueba se conoce como prueba de dos extremos o de dos colas. En tales casos, el nivel de significación se reparte entre ambas colas (α/2 en cada una).
Figura 2.
Cuando estamos sometiendo a prueba una hipótesis nula con una desigualdad contra su complemento, todo el riesgo se ubica en uno de los extremos. Estas son las
pruebas de un extremo o una cola.
Figura 3.
Fuente: elaboración propia.
Figura 4.
Tanto las pruebas de hipótesis como la estimación por intervalos se derivan de los conceptos que permiten hacer inferencia a partir de una muestra.
Un aspecto que suele generar confusión cuando enfrentamos por primera vez los procedimientos de prueba de hipótesis y estimación es la equivalencia de los valores
correspondientes a los límites de los intervalos de confianza y los valores críticos que delimitan las zonas de rechazo y no rechazo (en términos no estandarizados); en
definitiva, los valores que forman parte del intervalo de valores que se estiman también son los que hacen, numéricamente, aceptables la hipótesis nula.
Pese a esta especie de dualidad, los propósitos de ambos tipos de procedimientos son sustancialmente diferentes en el marco de las correspondientes investigaciones
que los enmarcan.
Valor p
Otra manera en la que puede abordarse y resolverse una prueba de hipótesis es determinar el nivel de significación que tiene asociado el valor resultante del
estadístico con los datos muestrales.
El valor p es la probabilidad de obtener un estadístico igual o mayor que el valor muestral, siendo la hipótesis nula cierta.
Weiers, en su texto de Introducción a la estadística para negocios (2005), indica la siguiente analogía en una prueba de salto en alto: “equivale a que Ud. saltara tan
alto como pudiera sin tener que pasar sobre una barra, y que luego los jueces le indicaran a qué altura la habría rebasado si la barra estuviera en el lugar” (p. 432).
Esta modalidad de resolución es de gran practicidad en el caso de contar con resultados procesados a través de software estadístico, que aproxima numéricamente el
cálculo de probabilidad implicado y arroja para la muestra el valor p (o p-valor, como también se lo conoce). Simplemente, el investigador compara esa significación
con la que considera para su investigación (el valor α) y, si el valor p supera al α, entonces no se rechaza la hipótesis nula; en cambio, si α es mayor que p, entonces se
rechaza la hipótesis nula.
Obviamente, esta regla de decisión se relaciona con el hecho de que, si la significación del estadístico muestral es mayor que α, entonces ese valor se encuentra en la
zona de rechazo, y viceversa.
Siguiendo al texto de la materia, los pasos correspondientes a una prueba de hipótesis utilizando el valor p se sintetizan de la siguiente manera:
Calcular la probabilidad deseada ayudándonos con las tablas o programa estadístico apropiado.
10 Elaborar la conclusión.
Esta prueba sigue el mismo procedimiento estudiado en la prueba z, pero utilizando el estadístico t,
tal como lo vimos en el Módulo 1. Revisa en detalle el tema en el capítulo 12 (apartado 12.3) del texto
de Berenson y Levine (1996).
Prueba t
Un docente sostiene la idea de que el promedio de horas de estudio de sus alumnos ha sido inferior a 3 horas diarias en la semana previa a una evaluación. Para
comprobar su idea previa, realiza una breve encuesta anónima y obtiene la siguiente información a partir de una muestra de 15 alumnos tomados al azar del total (muy
elevado) de los alumnos de las 10 divisiones que tiene a su cargo:
Tabla 1.
1 3
2 6
3 7
4 2
5 1
6 0,5
7 1
8 2
9 2,5
10 2
11 1
12 2
13 3
14 2
15 0,5
En este caso estamos analizando una prueba unilateral porque se plantea una desigualdad.
Ho: μ ≥ 3 horas.
Nota cómo se seleccionó la hipótesis nula. Si bien se sostiene que la cantidad de horas de estudio promedio fue inferior a esa cantidad,
se utiliza en la hipótesis nula la afirmación complementaria porque incluye la igualdad. Y en particular, si se encuentra evidencia que
permita refutar la hipótesis nula, haberla planteado de esta manera nos permite un resultado más sólido.
Como se desconoce la varianza, se trabajará con el estadístico t, con n-1 grados de libertad:
6 Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una regla de decisión):
Como se pidió trabajar con una significación de 0,05, el valor crítico de t con 14 grados de libertad es -1,7613.
Luego quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura):
Bajo Ho cierta:
8 Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales:
Con la evidencia muestral disponible, no puede descartarse que el promedio de horas de estudio haya sido mayor
o igual a 3.
Existen varias pruebas para contrastar hipótesis sobre diferencias de medias, teniendo en cuenta
algunas condiciones. Ten precaución en identificar correctamente cada caso. Estas pruebas se
desarrollan en detalle en el Capítulo 13 (apartados 13.1, 13.2, 13.3, 13.4, 13.9) del texto de Berenson y
Levine (1996).
En muchas ocasiones necesitamos conocer si existe diferencia en las características de dos poblaciones de interés.
Es habitual, cuando se obtienen medidas de resumen de muestras correspondientes a dos poblaciones, preguntarse si realmente hay una diferencia significativa entre
ellas o si podrían considerarse iguales, pese a la diferencia muestral observada (quizá derivada del azar). Para poder responder este tipo de preguntas, las pruebas de
hipótesis vinculadas con dos medias brindan una herramienta de gran aplicación en diversos usos de investigación y toma de decisiones.
Pruebas para muestras independientes y dependientes: diferencias entre ambos tipos de muestras
En el caso de las pruebas sobre diferencias de medias, podemos enfrentar alguna de las siguientes situaciones, dependiendo de qué tipo de diseño de investigación se
utilizó:
1 Muestras independientes.
La selección del tipo de comparación que se realice está fundamentalmente asociada con el problema que se enfrente y el tipo de dato del que se disponga a partir de
un experimento, observación o encuesta.
Se dice que las muestras son independientes si la aparición o selección de un individuo en una muestra no tiene ninguna relación con la aparición o selección de
ningún individuo o elemento en la otra muestra. Este caso se aplica cuando los individuos de cada una de las muestras pertenecen a dos poblaciones distintas, cuya
diferencia de medias es el propósito principal de la prueba.
Cuando las dos muestras se han construido de manera que la inclusión de un individuo en una de las muestras condiciona la selección de otro en la otra muestra o
cuando se analiza repetidamente información (generalmente, a lo largo del tiempo) sobre un mismo individuo, decimos que son muestras relacionadas o apareadas.
En el caso de muestras independientes, consideraremos dos pruebas de hipótesis referidas a las diferencias entre medias de ambas muestras, teniendo en cuenta qué
supuestos corresponda aplicar.
Consideremos el siguiente problema: una marca de combustibles ha desarrollado un nuevo combustible premium que reemplazaría al que se produce actualmente,
para lo cual quiere analizar si realmente hay una diferencia en cuanto a rendimiento. Se contrata a un experto en combustibles para determinar si existe alguna
diferencia entre estos combustibles de la marca en el mismo modelo de automóvil. El combustible A, que se está evaluando para considerar su introducción en el
mercado, se probó en 20 autos, y se calculó una media muestral de 14 km por litro (con una desviación estándar de 2 km por litro), mientras que el combustible B, que
se probó en 10 automóviles, produjo una media de rendimiento de 13,2 km por litro, con una desviación estándar de 2,1 km por litro. Suponiendo varianzas iguales,
¿existe evidencia de que el nuevo combustible (A) supera al que se produce en la actualidad?
Ho: μ1 − μ2 ≤ 0.
Vamos a llamar muestra 1 a la correspondiente al nuevo combustible (A) y 2 a la del combustible que se produce actualmente. Dado que nos interesa ver si el nuevo
combustible tiene más rendimiento que el actual, en la hipótesis nula planteamos el estado de la naturaleza que, si se puede, se descartará con evidencia muestral
contundente.
H1: μ1 − μ2 > 0.
Donde la varianza conjunta se construye de la siguiente manera a partir de las varianzas muestrales de cada muestra respectiva:
6 Calcular el o los valores críticos, identificando así las zonas de rechazo y no rechazo (lo cual deriva en disponer de una regla de decisión):
Como se pidió trabajar con una significación de 0,05, el valor crítico de t con 28 grados de libertad es de 1,701.
Luego quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura):
Fuente: XXXXXXXXXX
Donde:
8 Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales:
Con la evidencia muestral disponible, no puede descartarse que el rendimiento del nuevo combustible sea igual o
menor que el combustible actual.
Cuando no podemos asumir que las dos poblaciones tienen iguales varianzas, adoptamos esta prueba. Vamos a desarrollar también un ejemplo en este caso:
El dueño de una veterinaria desea comprobar si existe diferencia en la cantidad total de dinero gastada por mes entre los dueños de perros y los
dueños de gatos. Se consideró una muestra de individuos que solo poseía una de estas mascotas, considerando animales (tanto perros como
gatos) de un rango de peso de 3 a 5 kilos. En el caso de los dueños de gatos, se obtuvo una media muestral de $19,16 por semana, para una
muestra de 26 casos, con una desviación estándar de $8,52. En la muestra de 37 dueños de perros, se estimó que, en promedio, gastan $26,47
por semana, con una desviación estándar de $9,45. ¿Existe una diferencia significativa en el gasto promedio?
1 Establecer la hipótesis nula:
Ho: μ1 − μ2 = 0.
Vamos a llamar muestra 1 a la correspondiente a los dueños de gatos y 2 a la muestra de dueños de perros. Planeamos una prueba bilateral, ya que se desea saber si
existe o no diferencia.
H1: μ1 − μ2 ≠ 0.
Las muestras de trabajo constan de 26 casos de dueños de gatos y 37 casos de dueños de perros.
Luego quedará determinada la siguiente regla de decisión (indicada también en la siguiente figura):
Fuente: XXXXXXX
Bajo Ho cierta:
8 Verificar en qué zona (de rechazo o de no rechazo) cayó el estadístico de prueba obtenido con los datos muestrales:
Con la evidencia muestral disponible, no puede sostenerse la idea de que los dueños de perros y gatos gastan lo
mismo semanalmente en sus mascotas.
El caso de las muestras relacionadas es de amplia utilización cuando se necesita disponer de comparaciones entre sujetos con mínima variabilidad entre sí o en
pruebas sucesivas repetidas (estudios “antes y después” sobre un mismo sujeto). En este caso, analizamos la diferencia específica para el par de observaciones
apareadas, que denominaremos D.
Di = Xil - Xi2
Esta diferencia, para cada par de datos que estamos estudiando, representa las diferencias uno a uno. Por ejemplo, si es un estudio entre gemelos, en el cual a uno de
los gemelos de cada conjunto de hermanos gemelos que se está estudiando se le aplicó un tratamiento cuyo efecto se quiere comprobar, la diferencia D es la medida
de la distancia en la variable de respuesta para ambos sujetos. Justamente, lo que se pretende someter a prueba es la existencia o no de tal diferencia entre los sujetos
que fueron sometidos a tratamiento y los que no, aun en los casos en los que los sujetos poseen gran homogeneidad entre sí.
El promedio muestral de tales diferencias se obtiene considerando todas las D para los n pares de sujetos de estudio:
La prueba se lleva a cabo con el mismo procedimiento utilizado previamente para los diversos casos de pruebas de hipótesis.
Ho: 0 = D μ.
H1: 0 ≠ D μ.
Referencias
Berenson, M. L. y Levine, D. M. (1996). Estadística para administración y economía (6.a ed.). México D. F., MX: Prentice Hall Hispanoamericana.
Weiers, R. (2005). Introducción a la estadística para negocios (5.a ed.). México D. F., MX: Thompson.