Está en la página 1de 23

MÓDULO

Área: NEGOCIOS

2 Curso: ESTADÍSTICA APLICADA


Módulo: Pruebas de Hipótesis
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA

Pruebas de Hipótesis
Índice

Introducción ......................................................................................................................................................... 1
1. Prueba de Hipótesis .......................................................................................................................................... 2
1.1 Definición ..................................................................................................................................................................... 2
1.2 Tipos de Hipótesis ........................................................................................................................................................ 4
1.3 Etapas para establecer una prueba de hipótesis ......................................................................................................... 6
1.4 Error Tipo 1 y Error Tipo 2 ........................................................................................................................................... 7
1.5 Nivel de Significancia () ............................................................................................................................................. 7
1.6 Procedimiento General de Inferencia.......................................................................................................................... 8
1.7 Distribución Normal Estándar...................................................................................................................................... 9
2. Contraste para la media de una población normal con varianza conocida ..................................................... 9
3. Contraste para la media de una población normal con varianza desconocida .............................................. 13
3.1 Caso de muestras Grandes (n >30) ............................................................................................................................ 13
3.2 Caso de Muestras Pequeñas (n ≤30) ......................................................................................................................... 13
4. Contraste para la igualdad de medias de dos poblaciones ............................................................................ 14
4.1 Con varianzas poblacionales conocidas ..................................................................................................................... 15
4.2 Con varianzas poblacionales desconocidas pero iguales........................................................................................... 15
a. Muestras grandes .................................................................................................................................................... 16
b. Muestras pequeñas ................................................................................................................................................. 16
5. Prueba de hipótesis para dos varianzas poblacionales .................................................................................. 17
6. Aplicación en Excel ......................................................................................................................................... 18
6.1 Aplicación a diferencia de medias ............................................................................................................................. 18
Cierre .................................................................................................................................................................. 20
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA

Pruebas de Hipótesis
Mapa de Contenido

Definición

Tipos de Hipótesis

Etapas para establecer una


prueba de hipótesis

Prueba de Hipótesis Error Tipo 1 y Error Tipo 2

Contraste para la media de una


población normal con varianza Nivel de Significancia ()
conocida

Procedimiento General de
Inferencia
Pruebas de Hipótesis

Distribución Normal Estándar

Caso de muestras Grandes (n


>30)
Contraste para la media de una
población normal con varianza
desconocida
Caso de Muestras Pequeñas (n
≤30)

Con varianzas poblacionales


conocidas
Contraste para la igualdad de
Muestras grandes
medias de dos poblaciones
Con varianzas poblacionales
desconocidas pero iguales
Prueba de hipótesis para dos
Muestras pequeñas
varianzas poblacionales

Aplicación a diferencia de
Aplicación en Excel
medias
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 1

Pruebas de Hipótesis
Resultado de Formula correctamente una pregunta sobre una característica de la población en términos
Aprendizaje del de una prueba de hipótesis y aplica de manera precisa los métodos estadísticos a los datos
de una muestra e interpreta correctamente los resultados.
Módulo/Unidad:

Introducción
El uso de técnicas estadísticas para proyectar una gran cantidad de fenómenos es de amplio y creciente uso:
encuestas para predecir candidatos ganadores antes de las elecciones, proyecciones del valor de una acción o
del tipo de cambio de aquí a un mes más, el crecimiento económico o el nivel de inflación para el próximo año,
entre otras. Ahora bien, en muchos casos se ha cuestionado el real aporte de estas estimaciones en sus propios
campos o áreas de negocios, sin embargo, muchas veces se omite un factor muy relevante y es qué tan
confiables son las estimaciones y sobre todo, las conclusiones que se realizan a partir de ejercicios prácticos.

Es razonablemente fácil estimar algunos parámetros como


promedios o niveles de ciertas categorías, por ejemplo, en
una encuesta para predecir quien será el candidato
ganador de una elección podemos realizar una encuesta
sobre un cierto número de personas y en función de sus
resultados aseverar que el candidatos A está muy por
sobre el candidato B y sin embargo, en la elección se
concreta el resultado opuesto. ¿Qué pasó? La primera
respuesta es que las estadísticas no sirven, sin embargo, la
respuesta correcta es: las estadísticas mal implementadas
pueden llevar a conclusiones erradas, esto no quiere decir
que las estimaciones bien implementadas no tengan un
margen de error, pero es fundamental entender que el
proceso de estimación de parámetros ya descrito en el
módulo anterior debe cumplir un procedimiento que
certifique de alguna forma la validez de los resultados.

El procedimiento de validar resultados sobre parámetros estimados se conoce como prueba de hipótesis y es
el tema principal a tratar en este módulo.

Siguiendo con el ejemplo de los candidatos, si una encuesta establece que un candidato A tiene el 35% de las
preferencias y el candidato B tiene el 38% de las preferencias, ¿Podemos necesariamente concluir que uno
está definitivamente en mejor condición que otro? ¿Cómo podemos construir una concluir una conclusión
responsable al respecto?

Similar pregunta se puede plantear si comparamos categorías de otros ámbitos como las ventas de una
empresa versus otra, de un nuevo producto versus el anterior modelo, etc.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 2

Pruebas de Hipótesis
Las aplicaciones de análisis de datos, incluyendo Excel, incorporan el cálculo automático de ciertos estadísticos
que nos permiten construir estas conclusiones sin necesidad de plantear cálculos complejos, puesto que estos
ya están desarrollados dejándole al analista la tarea de interpretar sus resultados.

1. Prueba de Hipótesis
1.1 Definición
Una hipótesis es básicamente una afirmación acerca de un hecho asociado a un
fenómeno de interés, por ejemplo:
• Si el precio de la carne de vacuno sube, las personas compraran menos carne de
vacuno.
• Si el crecimiento económico aumenta por sobre el 4%, el nivel de desempleo
disminuirá.
• Si la empresa aumenta la inversión en publicidad en x%, las ventas se elevarán en y%.
La inferencia estadística es el proceso de usar la información de una muestra de datos pertenecientes a una
población mayor y con dicha muestra tener la capacidad de sacar conclusiones que son válidas y con un grado
suficiente de confiablidad tal, que nos permitan tomar decisiones acertadas en el ámbito de os negocios u otra
área de desarrollo. El proceso que tenemos que llevar a cabo para saber si la información de nuestra muestra
es suficiente para afirmar o no nuestra aseveración se conoce como prueba de hipótesis.

IMPORTANTE

La capacidad de construir afirmaciones asociadas a niveles de certeza a partir de mediciones objetivas y


técnicas de general aceptación es una muy valiosa herramienta, puesto que muchos de los problemas en
el ámbito de los negocios, de la ingeniería y muchas otras áreas pueden plantearse como problemas de
prueba de hipótesis.

Suponga que se tiene interés en la relación existente entre la variación del precio del dólar y la variación del
precio del cobre. A partir de una muestra podemos calcular el valor promedio de esta relación, que en teoría
esperaríamos que fuera negativo dado que el aumento del valor del cobre implica una mayor oferta de la divisa
ajustando a la baja su precio. Luego queremos testear si el valor obtenido es o no significativamente distinto
de cero.
Ho; µ= 0
H1; µ≠0
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 3

Pruebas de Hipótesis
En una prueba de hipótesis surgen necesariamente dos hipótesis que son mutuamente excluyentes:

Hipótesis Nula Hipótesis Alternativa,


Representada por Ho, esta es la Representada por H1, es la
afirmación sobre una o más afirmación contradictoria a Ho, y
características de poblaciones ésta es la hipótesis de interés de
que al inicio se supone cierta (es la persona que está elaborando
decir, la "creencia a priori"). la prueba de hipótesis

Lo anterior significa que en la práctica nuestra hipótesis de trabajo, aquella que queremos demostrar, en
realidad se obtiene en forma indirecta, esto es, si quiero saber si el precio del cobre afectará el tipo de cambio
debo considerar las siguientes hipótesis:

Hipótesis Nula Hipótesis Alternativa


El precio del cobre no El precio del cobre
afectara el tipo de no afectara el tipo de
cambio cambio

Luego, si todo sale como esperamos, llegaremos a la conclusión de que la hipótesis nula (que es la cual sobre
la cual se realiza la prueba estadística) es rechazada, esto es, rechazamos que no exista relación entre ambas
variables con lo que por oposición, podemos inferir que si existe una relación.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 4

Pruebas de Hipótesis
1.2 Tipos de Hipótesis
A continuación, podemos ver que existen dos tipos generales de hipótesis que podemos proponer:

Hipótesis Simples Hipótesis Compuestas

• Se refieren a un sólo • Se refieren a un rango


valor del parámetro del parámetro

1) Hipótesis Simples:

H o :  = o
Prueba de 2 colas
H1 :   o

2) Hipótesis Compuestas:

H o :   o
Prueba de la cola izquierda de la distribución
H1 :    o

H o :   o
Prueba de cola derecha de la distribución
H1 :    o

IMPORTANTE

Es importante recordar que las hipótesis siempre son aseveraciones respecto de la población o
distribución bajo estudio, no proposiciones sobre la muestra. Recordemos que en general solo tendremos
acceso a una muestra de datos pero no a la población completa. La lógica es que a partir de una muestra
de datos podremos concluir respecto de una población no conocida.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 5

Pruebas de Hipótesis
El valor del parámetro de la población especificado en la hipótesis nula se puede determinar de la siguiente
forma:

Puede obtenerse a partir de alguna teoría o


Puede ser resultado de alguna experiencia modelo que se relaciona con el fenómeno
previa o del conocimiento del proceso, bajo estudio. En este caso, el objetivo de la
entonces el objetivo de la prueba de prueba de hipótesis es verificar la teoría o
hipótesis comúnmente es determinar si el modelo, por ejemplo la teoría plantea que
valor del parámetro se ha alterado, por un aumento del desempleo se explica por
ejemplo, respecto de un estudio previo. una caída en el crecimiento económico por
debajo del crecimiento potencial.

Cuando el valor del parámetro se provee desde una


propuesta de carácter externo, tales como
especificaciones de ingeniería o de obligaciones de
contratos. En este caso, el objetivo de la prueba de
hipótesis es corroborar el cumplimiento de lo
comprometido. Por ejemplo, el contenido de grasas
saturadas en los productos es menor a 10mg por
cada unidad.

El proceso de prueba de hipótesis va a depender del uso de la información que podamos obtener en una
muestra aleatoria desde una población de interés. Si esta información es coherente con la hipótesis, se
concluye que ésta es verdadera; en caso contrario, si esta información es inconsistente con la hipótesis, se
concluye que esta es falsa. La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia
que podemos obtener desde la muestra avala que Ho es incorrecta. Si la muestra no contradice decididamente
a Ho, se continúa asumiendo la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un
ejercicio de prueba de hipótesis será rechazar o no rechazar la hipótesis nula, como ya lo mencionamos la
hipótesis real del analista está plasmada en la hipótesis alternativa pero en la práctica su conclusión se asume
cierta desde el rechazo de la aseveración contraria.

IMPORTANTE

Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse
con total seguridad, a menos que pueda examinarse toda la población, lo que suele ser imposible.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 6

Pruebas de Hipótesis
1.3 Etapas para establecer una prueba de hipótesis
Los siguientes son los pasos que debemos seguir en la construcción de una prueba de hipótesis:

Formular
Definir con correctamente Determinar el
Definir los las hipótesis
claridad el Establecer una estadístico de
supuestos respecto del Decisión y
problema y regla de prueba
respecto de los análisis que se conclusiones
nivel de decisión (estadístico de
datos lleva a cabo
significancia contraste)

1. Definir con claridad el problema y el nivel de significancia, esto es, el nivel de error que estamos
dispuestos a asumir, es importante que esta definición sea previa al testeo dado que de otra forma
corremos el peligro de acomodar el nivel de significancia al resultado obtenido.
2. Definir los supuestos respecto de los datos tales como asumir normalidad o no en la distribución, si la
varianza se asume o no como conocida, cuál será el tamaño mínimo de la muestra, y otros que podrán
depender de cada ejercicio.
3. Formular correctamente las hipótesis respecto del análisis que se lleva a cabo, como ya revisamos
tenemos las siguientes opciones:

H o :  = o H o :   o H o :   o
H1 :    o H1 :    o H1 :    o

4. Establecer una regla de decisión: esta etapa es crucial para determinar cuál es la región de aceptación
y de rechazo de las hipótesis planteadas.
5. Determinar el estadístico de prueba o también conocido como estadístico de contraste, se realiza de
acuerdo a los datos y las suposiciones que se establecieron. En general la teoría estadística nos plantea
que estadístico de contraste debemos usar en cada caso por lo que esta etapa es una consecuencia de
los supuestos establecido en los pasos previos.
6. Decisión y Conclusiones. En función de los resultados se puede obtener los resultados esperados o
no.0 En caso de no obtener los resultados se pueden definir pasos a seguir como replantear la
hipótesis, ampliar la muestra u otro. Siempre cuidando no establecer reglas de decisión más laxas con
tal de conseguir nuestro objetivo puesto que eso sería acomodar el proceso.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 7

Pruebas de Hipótesis
1.4 Error Tipo 1 y Error Tipo 2
El proceso de prueba de hipótesis, como casi todo en el área de estadística, no está exento de errores,
considerando la información disponible, estamos sujetos a cometer dos tipos de errores:

Error Tipo 1 • Rechazar un H0que es cierto

Error Tipo 2 • Aceptar un H0 que es falso

A continuación, representamos ambas posibilidades en conjunto con las combinaciones acertadas en el


proceso de prueba de hipótesis:

DECISIÓN

CONDICIÓN REAL RECHAZAR H0 NO RECHAZAR H0

H0CIERTA ERROR TIPO 1 ACIERTO

H0FALSA ACIERTO ERROR TIPO 2

El cruce de las decisiones tomadas y la condición real de la población bajo estudio nos presenta cuatro
alternativas:

• Si la hipótesis nula es cierta y se acepta, la decisión es correcta.


• Si la hipótesis nula es cierta y se rechaza ésta, se comete un error tipo 1.
• Si la hipótesis alternativa es cierta y se acepta la hipótesis nula, se comete un error tipo 2.
• Si la hipótesis alternativa es falsa y se rechaza la hipótesis nula, la decisión es correcta.

1.5 Nivel de Significancia ()


Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de rechazar H 0,
denotada por la letra griega  (alfa). A este nivel se le conoce como nivel de significancia de la prueba de
hipótesis.

Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeño de , esto
dependerá de cada caso, no será lo mismo si estamos estableciendo la relación de un precio con las ventas a
que si testeamos la existencia de efectos secundarios de un remedio sobre una población enferma.

El valor predefinido de  (1%, o 5% por ejemplo), se utiliza para construir una región de rechazo o región crítica
de la distribución del parámetro como veremos más adelante.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 8

Pruebas de Hipótesis
SABER MÁS

Una región crítica o de rechazo es una parte de la curva de la distribución de probabilidades del parámetro
donde se rechazará la hipótesis nula. La región critica o de rechazo puede ser de una o de dos colas
dependiendo de la hipótesis alternativa.

1.6 Procedimiento General de Inferencia


Veamos ahora el procedimiento general para establecer el rechazo o no de una hipótesis general. Aplicando
los conceptos previamente definidos podemos construir la región de rechazo, que está dada por la zona
coloreada del siguiente gráfico, donde el valor que define el inicio de la zona de rechazo está dado por el nivel
de significancia previamente establecido .

Luego el valor que toma el estadístico de prueba o de contraste (en la tabla se asume z, pero puede t o el que
corresponda según la variable a testear) determinará si se rechaza o no la hipótesis nula:

Hipotesis Grafico Regla de desición


H o :   o Si Z>Z, entonces se
H1 :    o rechaza la H0.

H o :   o Si Z<Z, entonces se
H1 :    o rechaza la H0.

H o :  = o Si Z>|Z|, entonces se
H1 :    o recjaza la H0.

Para explicar de mejor forma centrémonos en el primer caso, ahora bien el proceso se resumen en comparar
dos numeros: z y z, donde le primero es fruto de los datos muestrales y corresponde al estadistico de
contraste. El segundo valor a comparar es z, este es fruto del nivel de significancia  y se determina entonces
a partir de la distribución supuestamente conocida del parámetro, lo que indica que a priori conocemos todos
los valores de este estadístico para todos los nivles de confianza. Ahora conocidos estos dos valores
simplemente aplicamos la comparacion y sacamos la conclusion según la regla definida en la tabla anterior.

A continuación, se presentan los parámetros más utilizados en el proceso de prueba de hipótesis:

Parámetro Estadístico de Prueba


Media () 𝑋̅
Diferencia de Medias (2-1) 𝑋̅2 − 𝑋̅1
Varianza 2 S2
Proporción  P
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 9

Pruebas de Hipótesis
1.7 Distribución Normal Estándar
El Teorema Central del Límite es extremadamente útil dado que establece que a medida que el tamaño de la
muestra aumenta, la media aritmética de un conjunto de variables aleatorias tenderá hacia una distribución
normal estándar (de tipo Gaussiana), aunque la distribución de la población de la cual provienen las
observaciones no lo sea.
Esta propiedad de las muestras es fundamental puesto que le da
sustento a uno de los pilares más relevantes en la inferencia
estadística que es el uso intensivo de la distribución normal como
asumida.

Esta característica nos permite usar estadísticos muestrales para


hacer inferencias con respecto a los parámetros de la población sin
tener información sobre la forma de la distribución de la población,
nos basta la que podamos obtener de la muestra.

Si la distribución de X es Gaussiana:

Si 𝑋 ∼ 𝑁(𝜇, 𝜎 2 ), y si 𝑋̅es la media muestral basada en una muestra aleatoria simple de la distribución de X:

𝜎2
𝑋̅ ∼ 𝑁 (𝜇, )
𝑛

De manera equivalente podemos encontrar la expresión para la distribución estandarizada:

𝑋̅ − 𝜇
∼ 𝑁(0,1)
𝜎⁄√𝑛

La construcción de la distribución estandarizada será de utilidad en los apartados siguientes para facilitar la
inferencia a partir de información muestral. La ventaja es que conocemos todos los valores de la distribución
asociados a cada nivel de significancia posible.

2. Contraste para la media de una población normal


con varianza conocida
Ahora distinguiremos los principales procedimientos de test de hipótesis detallando las singularidades de los
problemas más comunes en la práctica.

Partiremos con el análisis que es probablemente el más común y es el test para una media poblacional. En
los ejemplos que hemos dado justamente estamos testeando este tipo de problema. Por ejemplo, cuando
estamos interesados en la relación entre el precio del cobre y el tipo de cambio, lo hacemos respecto de su
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 10

Pruebas de Hipótesis
valor medio, en el entendido que dicha relación estará sujeta a muchos otros factores ausentes de nuestro
análisis. Lo que queremos saber entonces es que dicha relación es, en promedio, distinta de cero.

Supongamos ahora que aspiramos contrastar la hipótesis de que la media μ de una población normal, toma un
valor determinado μo, y que además la varianza 2de la población es conocida, este último sin duda es un
supuesto ya que en la práctica esto es poco probable. En este caso supongamos que la hipótesis nula y la
alternativa se establecen como:

Ho:(µ = µo)
Ha:(µ ≠ µo)

Para efectos de la prueba de hipótesis se genera un estadístico de prueba o contraste a partir de una muestra
aleatoria de tamaño n. Si asumimos que la distribución de la media muestral sigue una distribución normal
con media  y desviación estándar σ/√n, esto es: N (µ, σ/√n). Entonces, si 𝑋̅ es la media de una muestra de
tamaño n, entonces podemos construir una variable estandarizada, esto es una variable que sabemos que
tiene una distribución normal con media cero y desviación estándar unitaria (igual a uno)

𝑋̅ − 𝜇0
𝑍= 𝜎
⁄ 𝑛

IMPORTANTE

La ventaja de construir una variable estandarizada es que sabemos a priori los valores que toma su función
de densidad por lo que podemos establecer valores críticos de decisión con facilidad, para esto existen
tablas de valores disponibles en cualquier libro de estadística y por supuesto en la web.

El nivel de significancia, como ya lo mencionamos, será un nivel fijo establecido con anterioridad, el cual
generalmente tomará los valores 10%, 5% o 1%, lo cual dependerá del criterio del analista o de las
circunstancias del estudio.

Sobre la región crítica podemos indicar que si la hipótesis nula fuese cierta y µ = µo, cabe esperar que la media
muestral 𝑋̅ se distribuya en torno al valor µo. Es decir, 𝑋̅ ± 𝜇0 tendrá un valor elevado para que existan
evidencias de que la hipótesis nula pueda ser rechazada, donde la variable Z tomará un valor absoluto grande;
así pues, la región crítica estará formada por los valores de Z elevados, ya sea que sean positivos o negativos.
Para especificar cuándo se consideran elevados, teniendo en cuenta la distribución de Z, serán aquellos que
sean mayores, en valor absoluto, que 𝑍𝛼⁄2 , en el contraste bilateral (dos colas), o que 𝑍𝛼 , en el contraste
unilateral (una cola).
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 11

Pruebas de Hipótesis
Si la hipótesis nula fuese Ho (µ ≥ µo), entonces dejarían de pertenecer a la región crítica los valores positivos
grandes, y el contraste es, en éste caso, unilateral.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 12

Pruebas de Hipótesis
Ejemplo:

A un proceso de producción de piezas mecánicas se le realizan ajustes por lo que


el administrador del proceso está interesado en saber si los ajustes han significado
alteraciones en las métricas de producción, en particular cree que tal vez se ha
aumentado el peso de las piezas producidas. Originalmente se producían piezas
estándar de un peso medio de 5 gramos y una desviación estándar de 0.1 gramos.
Se toma una muestra aleatoria de 16 piezas y se comprueba que el peso medio es
de 5,038 gramos.

Realizamos un test de hipótesis al 5% de significancia:

𝐻0 : 𝜇 = 𝜇0 = 5
𝐻1 : 𝜇 = 𝜇0 > 5

La regla de decisión es rechazar H0 a favor de H1 si:

𝑋̅ − 𝜇0
> 𝑧𝛼
𝜎⁄√𝑛

Del enunciado se desprenden los siguientes datos:

𝑋̅ = 5,038
𝜇0 = 5
𝜎 = 0.1
𝑛 = 16
̅
𝑋 − 𝜇0 5.038 − 5
= = 1.52
𝜎⁄√𝑛 0.1⁄√16

Para un nivel de confianza, la tabla de la distribución z nos entrega un valor de z0.05= 1.645.

Luego como 1.52 no es mayor que 1.645 no podemos rechazar la hipótesis nula al 95% de confianza
concluyendo que no hay aumento significativo del peso de las piezas en el proceso productivo.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 13

Pruebas de Hipótesis
3. Contraste para la media de una población normal
con varianza desconocida
Este caso es muy parecido al anteriormente desarrollado, con la sola diferencia de que asumimos una condición
más realista respecto de los datos en términos de que ya no asumimos que la varianza de los datos es conocida,
sino que asumimos que en efecto no la conocemos si bien podemos estimar una aproximación a partir de la
muestra.

Esta es una visión más conservadora de abordar el test de hipótesis y por ende sus resultados serán algo más
exigentes con los datos disponible, aunque en la práctica la diferencia no suele ser mucha, esto es, en la
mayoría de los casos que lleguemos a una cierta conclusión asumiendo varianza conocida, también llegaremos
a la misma conclusión asumiendo varianza desconocida.

Adicionalmente, haremos una leve distinción dependiendo del tamaño de la muestra, asumiremos una
muestra pequeña y una grande donde el punto de corte es de 30 observaciones. Por cierto, que este es un
nivel general dado que en algunos casos 30 puede ser una gran muestra de datos o parecer insignificante, por
ejemplo considerar una muestra de 30 años de crecimiento económico puede parecer más de que suficiente
en tanto si hablamos del precio diario del dólar una muestra de 30 días es claramente insuficiente. En
conclusión, esta distinción es solo referencial.

3.1 Caso de muestras Grandes (n >30)


Si el tamaño de la muestra es suficientemente grande (n > 30), procedemos a utilizar como estimador de la
varianza poblacional la cuasi-varianza muestral que aquí denotamos por la letra s. Luego se construye un
estadístico de prueba o contraste similar al que se consideró en el caso de varianza conocida; esto es:

𝑋̅ − 𝜇0
𝑍= 𝑠
⁄ 𝑛

Luego sabemos que es una variable que sigue una distribución normal estándar N(0,1), por lo que el
razonamiento es idéntico al caso anterior.

3.2 Caso de Muestras Pequeñas (n ≤30)


En el caso de muestras de menor tamaño, la distribución de la variable difiere manifiestamente de una
distribución normal como hemos asumido hasta ahora. La nueva distribución a utilizar se conoce como la “t
de Student”, la cual es similar en términos generales a la normal en términos de su forma gausiana, sin embargo
esta distribución se ajusta a un nuevo parámetro conocido a como los grados de libertad de la distribución,
esta innovación es para ajustar la distribución al tamaño de la muestra por lo que los grados de libertad en este
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 14

Pruebas de Hipótesis
caso están definidos como (n-1). Luego ésta variable t, así construida, puede utilizarse con un estadístico de
prueba o contraste.
𝑋̅ − 𝜇0
𝑡=𝑠
⁄ −1
√𝑛

La región crítica, en éste caso, estará determinada por los valores de la variable t que sean excesivamente
grandes en valor absoluto, si el contraste es bilateral, y para especificar el nivel de cuando pueden considerarse
grandes, teniendo en cuenta la distribución de la variable t, que sigue una distribución t con n-1 grados de
libertad, serán aquellos valores mayores que tα/2,n-1 en el contraste bilateral, o que tα,n-1 en el contraste
unilateral. En forma similar a la distribución normal, estos valores críticos suelen encontrarse en tablas
incluidas en los libros de estadística o en material de la web.

4. Contraste para la igualdad de medias de dos


poblaciones
Supongamos ahora que nuestro interés no está ya sobre un set de datos o una sola variable sino que lo que
queremos saber está relacionado a dos variables o dos poblaciones, en términos más generales queremos
saber si podemos o no asumir que existen o no diferencia significativas entre dos grupos de interés.

Por ejemplo, podríamos querer testear si existen diferencias entre hombres y mujeres en el resultado de una
prueba en particular, o si existen diferencias en un grupo de enfermos antes y después de aplicarles un
tratamiento médico en base a un nuevo fármaco.

En términos generales, consideraremos dos poblaciones, P1 y P2, con distribuciones asumidas como normales
con medias 1 y 2 y varianzas 1y 2 respectivamente, de las cuales podemos obtener muestras de tamaños
n1 y n2 respectivamente.

P1 P2 Hipótesis nula
Ho (1- 2 = 0)
Media 1 Media 2
Concluir si las dos
poblaciones tienen
Varianza Varianza la misma media
1 2 poblacional para la Hipótesis
variable interés alternativa
N1 N2 H1(1- 2< 0)
(tamaño) (tamaño) H1(1- 2> 0)
H1(1- 2≠ 0)
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 15

Pruebas de Hipótesis
Por supuesto que también podríamos testear que la diferencia entre estas poblaciones es mayor a cierto valor
o no, por ejemplo, queremos testear si es cierto el rumor de que los hombres en cierta empresa tienen sueldos
mayores a las mujeres en x pesos.

4.1 Con varianzas poblacionales conocidas


Al igual que en el caso del contraste de medias, asumiremos primero que las varianzas son conocidas, lo cual, es
un supuesto que en algunos casos podemos asumir.

La teoría nos dice que la diferencia de dos distribuciones normales se distribuye también de forma normal con
media igual a la diferencia de las medias, y la varianza será igual a la suma de las varianzas, por lo que la variable
𝑋̅1 − 𝑋̅2 sera una variable que se distribuye normal con los siguientes parámetros:

𝜎12 𝜎22
(𝑋̅1 − 𝑋̅2 )~𝑁 (𝜇1 − 𝜇2 , √ + )
𝑛1 𝑛2

Por lo que, en el caso particular de conocer las varianzas poblacionales, podemos utilizar como estadístico de
prueba o contraste la siguiente variable Z construida:

̅̅̅
𝑋1 − ̅̅̅
𝑋2
𝑍=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2

En el caso de que la hipótesis nula es verdadera, es decir µ1 = µ2, se distribuye normal estándar N(0,1), y por
lo tanto, puede utilizarse como estadístico de prueba, como ya hemos mencionado la ventaja es que
conocemos su distribución y por ende todos los puntos críticos apara cualquier nivel de significancia.

La región crítica estará formada por los valores de Z elevados, tanto positivos como negativos. Para especificar
cuándo se consideran elevados, teniendo en cuenta la distribución de Z, serán aquellos que sean mayores, en
valor absoluto, que Zα/2, en el contraste bilateral, o que zα en el contraste unilateral.

4.2 Con varianzas poblacionales desconocidas pero iguales


Ahora dejamos de lado el supuesto de las varianzas conocidas y lo replanteamos como varianzas desconocidas,
pero asumimos que son iguales. Esto implica una nueva construcción de test estadístico de prueba. Para el
caso nuevamente haremos una distinción respecto de los tamaños de muestras disponibles.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 16

Pruebas de Hipótesis
a. Muestras grandes
Si las muestras tienen tamaño grande, aunque no se conozca la varianza poblacional, se trabaja como si se
conociese utilizando en lugar de la varianza poblacional, su estimador la cuasivarianza muestral, por lo que la
distribución de la diferencia de medias es ahora:

1 1
(𝑋̅1 − 𝑋̅2 )~𝑁 (𝜇1 − 𝜇2 , 𝑠̂ √ + )
𝑛1 𝑛2

Donde las variables 𝑠̂12 y 𝑠̂22 corresponden a las varianzas muestrales de las muestras 1 y 2 respectivamente y
en conjunto permiten estimar la cuasivarianza muestral que permite estimar la volatilidad de la diferencia de
muestras que estamos analizando.

(𝑛1 − 1)𝑠̂12 + (𝑛2 − 1)𝑠̂22


𝑠̂ = √
𝑛1 + 𝑛2 − 2

Por lo que la variable construida para prueba o contraste corresponde a:

(𝑋̅1 − 𝑋̅2 )
𝑍=
1 1
𝑠̂ √ +
𝑛1 𝑛2

Se distribuye como una distribución normal estándar, razón por la cual la utilizaremos como estadístico de
prueba o contraste. La región crítica se determina igual que en los apartados anteriores, es decir, para los
valores de z mayores, en valor absoluto, que zα/2 (contraste bilateral), o que zα(contraste unilateral),
rechazaremos la hipótesis nula.

b. Muestras pequeñas
Si las muestras son pequeñas (n1 + n2 < 30), entonces construimos la siguiente variable:

(𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )


𝑡=
1 1
𝑠̂ √ +
𝑛1 𝑛2

Donde el valor del estimador 𝑠̂ está dado por:

(𝑛1 − 1)𝑠̂12 + (𝑛2 − 1)𝑠̂22


𝑠̂ = √
𝑛1 + 𝑛2 − 2
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 17

Pruebas de Hipótesis
Si la hipótesis nula es cierta, el estadístico de prueba o contraste que utilizaremos es:

(𝑋̅1 − 𝑋̅2 )
𝑡=
1 1
𝑠̂ √ +
𝑛1 𝑛2

El cual se distribuye como una distribución t de Student con n1+n2-2 grados de libertad, cabe mencionar que
esta distribución es muy similar a la normal.

La región crítica viene determinada por los valores de esta variable t, que son mayores en valor absoluto que
tα/2 en el contraste bilateral, o bien los valores de t, que son mayores en valor absoluto que tα en el contraste
unilateral.

5. Prueba de hipótesis para dos varianzas


poblacionales
Si bien las pruebas más comunes recaen sobre variables asociadas a medias de poblaciones en estudio, es
común en ciertos problemas que la variable de interés sea la varianza. En particular podemos estar interesados
en saber si la volatilidad de una variable es mayor a la volatilidad de otra variable, esto es común por ejemplo
en el estudio del rendimiento de activos financieros donde la volatilidad de los retornos de un activo está
asociado a su nivel de riesgo, por lo que vital importancia para conocer si una acción, bono u otro activo es
más o menos riesgoso que otro. Para este tipo de problemas acudimos al contraste de diferencia de varianzas.

El planteamiento de las hipótesis sobre la diferencia de varianzas es algo especial por el hecho de que las
varianzas no son aditivas y el esbozo de igualdad entre varianzas de la hipótesis nula no se puede hacer como
una igualdad a cero (𝜎22 − 𝜎12 = 0), sino como de igualdad entre varianzas (𝜎22 = 𝜎12 ), o igualando a uno el
ratio entre varianzas (𝜎22 /𝜎12 = 1).Las hipótesis es la siguiente:

𝐻0 : 𝜎22 = 𝜎12
𝜎22 ≠ 𝜎12
𝐻1 : 𝜎22 > 𝜎12
𝜎22 < 𝜎12

Para efectos de definir el nivel de significancia se utiliza la distribución F(n1,n2, ) el cual sigue una distribución
𝑠2
conocida como F. Como estadístico de contraste se usa la razón de las varianzas muestrales, 𝐹0 = 2⁄ 2 . Que
𝑠1
también sigue la distribución F, la cual en este caso tiene dos indicadores de grados de libertad: (n2-1) en el
numerador y (n1-1) en el denominador. El proceso de contraste de hipótesis es similar a los ya revisados
previamente.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 18

Pruebas de Hipótesis
6. Aplicación en Excel
Siguiendo con la aplicación del complemento de análisis de datos en el módulo uno del curso, ahora podemos
aplicar dicha herramienta a los conceptos desarrollados en este módulo.

6.1 Aplicación a diferencia de medias


Primero simulamos la construcción de dos variables aleatorias, X1 y X2, cuyos valores estarán entre los rangos
de (100,200) y (120,210) respectivamente:

Ahora realizaremos el test respecto de la diferencia de medias utilizando el complemento de análisis de datos:

Luego consideramos la alternativa de diferencia de medias asumiendo varianzas iguales (para el caso del este
ejemplo):
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 19

Pruebas de Hipótesis
Luego debemos entregar los datos y parámetros al programa:

Ingreso de los datos

Diferencia de medias
de la hipótesis, si la
hipótesis es que las
medias son iguales,
entonces la diferencia
es cero como en este
caso de significancia,
Nivel
el sistema entrega el
nivel de 5% por default
pero se puede ajustar.

El resultado, que se muestra en una nueva hoja es el siguiente:

Estadístico de
contraste

Valor critico asociado


al nivel de
significancia .

El resultado entrega una serie de datos, sin embargo, los datos relevantes son los comentados en la figura,
esto es, el estadístico t y el estadístico de contraste, dado que este último es menor al de contraste podemos
rechazar la hipótesis nula de igualdad de medias lo que es equivalente a decir que dada la información
podemos afirmar que ambas variables tienen medias significativamente distintas. El alumno puede ahora crear
ahora otras variables para probar otras hipótesis y entender mejor la lógica de aceptación y rechazo bajo
variables controladas.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 20

Pruebas de Hipótesis
Cierre
El primer módulo abordo conceptos de estadística descriptiva que son esenciales para iniciar un análisis de
datos. Este módulo aborda una segunda etapa en el mismo camino y que se trata de establecer la significancia
estadística de los parámetros calculados de tal forma de establecer entregarle una base que permita saber que
tan confiables son los resultados que estamos obteniendo, y más importante, que tan validas son las
conclusiones que podemos obtener a partir de los datos que manejamos. Es fundamental tener en cuenta la
necesidad de esta segunda etapa en el análisis de datos.

En primer lugar, abordamos el procedimiento en términos generales abordando los principales conceptos que
lo integran: Hipótesis nula y alternativa, hipótesis simples y compuestas, Error tipo 1 y 2, nivel de significancia
y distribución estandarizada. Es importante estar familiarizado con todos estos conceptos previos a realizar las
pruebas en el software elegido para poder realizar la entrada de datos correcta y asimismo una apropiada
interpretación de los resultados.

En el segundo punto del módulo se establece el procedimiento para el test de hipótesis para la media de una
población, primero asumiendo varianza conocida y luego levantando dicho supuesto. Luego se aborda el
procedimiento para contrastar dos medias obtenidas desde dos poblaciones distintas. El tercer procedimiento
aborda el contraste de dos varianzas obtenidas de muestras de dos poblaciones distintas. En cada caso se
abordan las hipótesis que subyacen a l problema de estimación para luego definir cuáles son los supuestos de
y distribuciones lo que implica la elección de un estadístico de prueba o contraste que será utilizado para la
prueba de hipótesis, dichos supuestos estarán asociados a asumir el conocimiento o no de la varianza real
como asimismo si el número de observaciones o tamaño muestral es suficientemente grande o no.

Finalmente se revisa las aplicaciones de Microsoft Excel para abordar estos problemas con facilidad dadas las
funciones contenidas en el software que permiten realizar los cálculos en forma muy rápida y sacar
conclusiones.

APORTE A TU FORMACIÓN

La capacidad de analizar datos para tomar decisiones es algo cada vez más trascendente en la labor diaria
de los profesionales independiente de la labor en que se desempeñan. Sin embargo, realizar inferencia
estadística va mucho más allá de calcular algunos estadísticos descriptivos como la media y construir
gráficos.

Si bien lo anterior es un paso necesario para entender el comportamiento de los datos, es necesario
agregar una dimensión que nos permita establecer la fortaleza de las conclusiones que podemos
establecer: ¿es realmente el aumento en las ventas una tendencia significativa o sólo está dentro del
margen de error? ¿Existe realmente una diferencia entre el gasto que realizan hombre y mujeres en
nuestra marca? Entre otras preguntas que podemos responder apresuradamente a partir de comparar
estimaciones puntuales o con una respuesta académicamente elaborada incorporando las pruebas de
hipótesis que se han establecido en este módulo.

También podría gustarte