Documentos de Académico
Documentos de Profesional
Documentos de Cultura
M2 - Estadística Aplicada
M2 - Estadística Aplicada
Área: NEGOCIOS
Pruebas de Hipótesis
Índice
Introducción ......................................................................................................................................................... 1
1. Prueba de Hipótesis .......................................................................................................................................... 2
1.1 Definición ..................................................................................................................................................................... 2
1.2 Tipos de Hipótesis ........................................................................................................................................................ 4
1.3 Etapas para establecer una prueba de hipótesis ......................................................................................................... 6
1.4 Error Tipo 1 y Error Tipo 2 ........................................................................................................................................... 7
1.5 Nivel de Significancia () ............................................................................................................................................. 7
1.6 Procedimiento General de Inferencia.......................................................................................................................... 8
1.7 Distribución Normal Estándar...................................................................................................................................... 9
2. Contraste para la media de una población normal con varianza conocida ..................................................... 9
3. Contraste para la media de una población normal con varianza desconocida .............................................. 13
3.1 Caso de muestras Grandes (n >30) ............................................................................................................................ 13
3.2 Caso de Muestras Pequeñas (n ≤30) ......................................................................................................................... 13
4. Contraste para la igualdad de medias de dos poblaciones ............................................................................ 14
4.1 Con varianzas poblacionales conocidas ..................................................................................................................... 15
4.2 Con varianzas poblacionales desconocidas pero iguales........................................................................................... 15
a. Muestras grandes .................................................................................................................................................... 16
b. Muestras pequeñas ................................................................................................................................................. 16
5. Prueba de hipótesis para dos varianzas poblacionales .................................................................................. 17
6. Aplicación en Excel ......................................................................................................................................... 18
6.1 Aplicación a diferencia de medias ............................................................................................................................. 18
Cierre .................................................................................................................................................................. 20
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA
Pruebas de Hipótesis
Mapa de Contenido
Definición
Tipos de Hipótesis
Procedimiento General de
Inferencia
Pruebas de Hipótesis
Aplicación a diferencia de
Aplicación en Excel
medias
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 1
Pruebas de Hipótesis
Resultado de Formula correctamente una pregunta sobre una característica de la población en términos
Aprendizaje del de una prueba de hipótesis y aplica de manera precisa los métodos estadísticos a los datos
de una muestra e interpreta correctamente los resultados.
Módulo/Unidad:
Introducción
El uso de técnicas estadísticas para proyectar una gran cantidad de fenómenos es de amplio y creciente uso:
encuestas para predecir candidatos ganadores antes de las elecciones, proyecciones del valor de una acción o
del tipo de cambio de aquí a un mes más, el crecimiento económico o el nivel de inflación para el próximo año,
entre otras. Ahora bien, en muchos casos se ha cuestionado el real aporte de estas estimaciones en sus propios
campos o áreas de negocios, sin embargo, muchas veces se omite un factor muy relevante y es qué tan
confiables son las estimaciones y sobre todo, las conclusiones que se realizan a partir de ejercicios prácticos.
El procedimiento de validar resultados sobre parámetros estimados se conoce como prueba de hipótesis y es
el tema principal a tratar en este módulo.
Siguiendo con el ejemplo de los candidatos, si una encuesta establece que un candidato A tiene el 35% de las
preferencias y el candidato B tiene el 38% de las preferencias, ¿Podemos necesariamente concluir que uno
está definitivamente en mejor condición que otro? ¿Cómo podemos construir una concluir una conclusión
responsable al respecto?
Similar pregunta se puede plantear si comparamos categorías de otros ámbitos como las ventas de una
empresa versus otra, de un nuevo producto versus el anterior modelo, etc.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 2
Pruebas de Hipótesis
Las aplicaciones de análisis de datos, incluyendo Excel, incorporan el cálculo automático de ciertos estadísticos
que nos permiten construir estas conclusiones sin necesidad de plantear cálculos complejos, puesto que estos
ya están desarrollados dejándole al analista la tarea de interpretar sus resultados.
1. Prueba de Hipótesis
1.1 Definición
Una hipótesis es básicamente una afirmación acerca de un hecho asociado a un
fenómeno de interés, por ejemplo:
• Si el precio de la carne de vacuno sube, las personas compraran menos carne de
vacuno.
• Si el crecimiento económico aumenta por sobre el 4%, el nivel de desempleo
disminuirá.
• Si la empresa aumenta la inversión en publicidad en x%, las ventas se elevarán en y%.
La inferencia estadística es el proceso de usar la información de una muestra de datos pertenecientes a una
población mayor y con dicha muestra tener la capacidad de sacar conclusiones que son válidas y con un grado
suficiente de confiablidad tal, que nos permitan tomar decisiones acertadas en el ámbito de os negocios u otra
área de desarrollo. El proceso que tenemos que llevar a cabo para saber si la información de nuestra muestra
es suficiente para afirmar o no nuestra aseveración se conoce como prueba de hipótesis.
IMPORTANTE
Suponga que se tiene interés en la relación existente entre la variación del precio del dólar y la variación del
precio del cobre. A partir de una muestra podemos calcular el valor promedio de esta relación, que en teoría
esperaríamos que fuera negativo dado que el aumento del valor del cobre implica una mayor oferta de la divisa
ajustando a la baja su precio. Luego queremos testear si el valor obtenido es o no significativamente distinto
de cero.
Ho; µ= 0
H1; µ≠0
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 3
Pruebas de Hipótesis
En una prueba de hipótesis surgen necesariamente dos hipótesis que son mutuamente excluyentes:
Lo anterior significa que en la práctica nuestra hipótesis de trabajo, aquella que queremos demostrar, en
realidad se obtiene en forma indirecta, esto es, si quiero saber si el precio del cobre afectará el tipo de cambio
debo considerar las siguientes hipótesis:
Luego, si todo sale como esperamos, llegaremos a la conclusión de que la hipótesis nula (que es la cual sobre
la cual se realiza la prueba estadística) es rechazada, esto es, rechazamos que no exista relación entre ambas
variables con lo que por oposición, podemos inferir que si existe una relación.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 4
Pruebas de Hipótesis
1.2 Tipos de Hipótesis
A continuación, podemos ver que existen dos tipos generales de hipótesis que podemos proponer:
1) Hipótesis Simples:
H o : = o
Prueba de 2 colas
H1 : o
2) Hipótesis Compuestas:
H o : o
Prueba de la cola izquierda de la distribución
H1 : o
H o : o
Prueba de cola derecha de la distribución
H1 : o
IMPORTANTE
Es importante recordar que las hipótesis siempre son aseveraciones respecto de la población o
distribución bajo estudio, no proposiciones sobre la muestra. Recordemos que en general solo tendremos
acceso a una muestra de datos pero no a la población completa. La lógica es que a partir de una muestra
de datos podremos concluir respecto de una población no conocida.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 5
Pruebas de Hipótesis
El valor del parámetro de la población especificado en la hipótesis nula se puede determinar de la siguiente
forma:
El proceso de prueba de hipótesis va a depender del uso de la información que podamos obtener en una
muestra aleatoria desde una población de interés. Si esta información es coherente con la hipótesis, se
concluye que ésta es verdadera; en caso contrario, si esta información es inconsistente con la hipótesis, se
concluye que esta es falsa. La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia
que podemos obtener desde la muestra avala que Ho es incorrecta. Si la muestra no contradice decididamente
a Ho, se continúa asumiendo la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un
ejercicio de prueba de hipótesis será rechazar o no rechazar la hipótesis nula, como ya lo mencionamos la
hipótesis real del analista está plasmada en la hipótesis alternativa pero en la práctica su conclusión se asume
cierta desde el rechazo de la aseveración contraria.
IMPORTANTE
Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse
con total seguridad, a menos que pueda examinarse toda la población, lo que suele ser imposible.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 6
Pruebas de Hipótesis
1.3 Etapas para establecer una prueba de hipótesis
Los siguientes son los pasos que debemos seguir en la construcción de una prueba de hipótesis:
Formular
Definir con correctamente Determinar el
Definir los las hipótesis
claridad el Establecer una estadístico de
supuestos respecto del Decisión y
problema y regla de prueba
respecto de los análisis que se conclusiones
nivel de decisión (estadístico de
datos lleva a cabo
significancia contraste)
1. Definir con claridad el problema y el nivel de significancia, esto es, el nivel de error que estamos
dispuestos a asumir, es importante que esta definición sea previa al testeo dado que de otra forma
corremos el peligro de acomodar el nivel de significancia al resultado obtenido.
2. Definir los supuestos respecto de los datos tales como asumir normalidad o no en la distribución, si la
varianza se asume o no como conocida, cuál será el tamaño mínimo de la muestra, y otros que podrán
depender de cada ejercicio.
3. Formular correctamente las hipótesis respecto del análisis que se lleva a cabo, como ya revisamos
tenemos las siguientes opciones:
H o : = o H o : o H o : o
H1 : o H1 : o H1 : o
4. Establecer una regla de decisión: esta etapa es crucial para determinar cuál es la región de aceptación
y de rechazo de las hipótesis planteadas.
5. Determinar el estadístico de prueba o también conocido como estadístico de contraste, se realiza de
acuerdo a los datos y las suposiciones que se establecieron. En general la teoría estadística nos plantea
que estadístico de contraste debemos usar en cada caso por lo que esta etapa es una consecuencia de
los supuestos establecido en los pasos previos.
6. Decisión y Conclusiones. En función de los resultados se puede obtener los resultados esperados o
no.0 En caso de no obtener los resultados se pueden definir pasos a seguir como replantear la
hipótesis, ampliar la muestra u otro. Siempre cuidando no establecer reglas de decisión más laxas con
tal de conseguir nuestro objetivo puesto que eso sería acomodar el proceso.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 7
Pruebas de Hipótesis
1.4 Error Tipo 1 y Error Tipo 2
El proceso de prueba de hipótesis, como casi todo en el área de estadística, no está exento de errores,
considerando la información disponible, estamos sujetos a cometer dos tipos de errores:
DECISIÓN
El cruce de las decisiones tomadas y la condición real de la población bajo estudio nos presenta cuatro
alternativas:
Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeño de , esto
dependerá de cada caso, no será lo mismo si estamos estableciendo la relación de un precio con las ventas a
que si testeamos la existencia de efectos secundarios de un remedio sobre una población enferma.
El valor predefinido de (1%, o 5% por ejemplo), se utiliza para construir una región de rechazo o región crítica
de la distribución del parámetro como veremos más adelante.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 8
Pruebas de Hipótesis
SABER MÁS
Una región crítica o de rechazo es una parte de la curva de la distribución de probabilidades del parámetro
donde se rechazará la hipótesis nula. La región critica o de rechazo puede ser de una o de dos colas
dependiendo de la hipótesis alternativa.
Luego el valor que toma el estadístico de prueba o de contraste (en la tabla se asume z, pero puede t o el que
corresponda según la variable a testear) determinará si se rechaza o no la hipótesis nula:
H o : o Si Z<Z, entonces se
H1 : o rechaza la H0.
H o : = o Si Z>|Z|, entonces se
H1 : o recjaza la H0.
Para explicar de mejor forma centrémonos en el primer caso, ahora bien el proceso se resumen en comparar
dos numeros: z y z, donde le primero es fruto de los datos muestrales y corresponde al estadistico de
contraste. El segundo valor a comparar es z, este es fruto del nivel de significancia y se determina entonces
a partir de la distribución supuestamente conocida del parámetro, lo que indica que a priori conocemos todos
los valores de este estadístico para todos los nivles de confianza. Ahora conocidos estos dos valores
simplemente aplicamos la comparacion y sacamos la conclusion según la regla definida en la tabla anterior.
Pruebas de Hipótesis
1.7 Distribución Normal Estándar
El Teorema Central del Límite es extremadamente útil dado que establece que a medida que el tamaño de la
muestra aumenta, la media aritmética de un conjunto de variables aleatorias tenderá hacia una distribución
normal estándar (de tipo Gaussiana), aunque la distribución de la población de la cual provienen las
observaciones no lo sea.
Esta propiedad de las muestras es fundamental puesto que le da
sustento a uno de los pilares más relevantes en la inferencia
estadística que es el uso intensivo de la distribución normal como
asumida.
Si la distribución de X es Gaussiana:
Si 𝑋 ∼ 𝑁(𝜇, 𝜎 2 ), y si 𝑋̅es la media muestral basada en una muestra aleatoria simple de la distribución de X:
𝜎2
𝑋̅ ∼ 𝑁 (𝜇, )
𝑛
𝑋̅ − 𝜇
∼ 𝑁(0,1)
𝜎⁄√𝑛
La construcción de la distribución estandarizada será de utilidad en los apartados siguientes para facilitar la
inferencia a partir de información muestral. La ventaja es que conocemos todos los valores de la distribución
asociados a cada nivel de significancia posible.
Partiremos con el análisis que es probablemente el más común y es el test para una media poblacional. En
los ejemplos que hemos dado justamente estamos testeando este tipo de problema. Por ejemplo, cuando
estamos interesados en la relación entre el precio del cobre y el tipo de cambio, lo hacemos respecto de su
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 10
Pruebas de Hipótesis
valor medio, en el entendido que dicha relación estará sujeta a muchos otros factores ausentes de nuestro
análisis. Lo que queremos saber entonces es que dicha relación es, en promedio, distinta de cero.
Supongamos ahora que aspiramos contrastar la hipótesis de que la media μ de una población normal, toma un
valor determinado μo, y que además la varianza 2de la población es conocida, este último sin duda es un
supuesto ya que en la práctica esto es poco probable. En este caso supongamos que la hipótesis nula y la
alternativa se establecen como:
Ho:(µ = µo)
Ha:(µ ≠ µo)
Para efectos de la prueba de hipótesis se genera un estadístico de prueba o contraste a partir de una muestra
aleatoria de tamaño n. Si asumimos que la distribución de la media muestral sigue una distribución normal
con media y desviación estándar σ/√n, esto es: N (µ, σ/√n). Entonces, si 𝑋̅ es la media de una muestra de
tamaño n, entonces podemos construir una variable estandarizada, esto es una variable que sabemos que
tiene una distribución normal con media cero y desviación estándar unitaria (igual a uno)
𝑋̅ − 𝜇0
𝑍= 𝜎
⁄ 𝑛
√
IMPORTANTE
La ventaja de construir una variable estandarizada es que sabemos a priori los valores que toma su función
de densidad por lo que podemos establecer valores críticos de decisión con facilidad, para esto existen
tablas de valores disponibles en cualquier libro de estadística y por supuesto en la web.
El nivel de significancia, como ya lo mencionamos, será un nivel fijo establecido con anterioridad, el cual
generalmente tomará los valores 10%, 5% o 1%, lo cual dependerá del criterio del analista o de las
circunstancias del estudio.
Sobre la región crítica podemos indicar que si la hipótesis nula fuese cierta y µ = µo, cabe esperar que la media
muestral 𝑋̅ se distribuya en torno al valor µo. Es decir, 𝑋̅ ± 𝜇0 tendrá un valor elevado para que existan
evidencias de que la hipótesis nula pueda ser rechazada, donde la variable Z tomará un valor absoluto grande;
así pues, la región crítica estará formada por los valores de Z elevados, ya sea que sean positivos o negativos.
Para especificar cuándo se consideran elevados, teniendo en cuenta la distribución de Z, serán aquellos que
sean mayores, en valor absoluto, que 𝑍𝛼⁄2 , en el contraste bilateral (dos colas), o que 𝑍𝛼 , en el contraste
unilateral (una cola).
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 11
Pruebas de Hipótesis
Si la hipótesis nula fuese Ho (µ ≥ µo), entonces dejarían de pertenecer a la región crítica los valores positivos
grandes, y el contraste es, en éste caso, unilateral.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 12
Pruebas de Hipótesis
Ejemplo:
𝐻0 : 𝜇 = 𝜇0 = 5
𝐻1 : 𝜇 = 𝜇0 > 5
𝑋̅ − 𝜇0
> 𝑧𝛼
𝜎⁄√𝑛
𝑋̅ = 5,038
𝜇0 = 5
𝜎 = 0.1
𝑛 = 16
̅
𝑋 − 𝜇0 5.038 − 5
= = 1.52
𝜎⁄√𝑛 0.1⁄√16
Para un nivel de confianza, la tabla de la distribución z nos entrega un valor de z0.05= 1.645.
Luego como 1.52 no es mayor que 1.645 no podemos rechazar la hipótesis nula al 95% de confianza
concluyendo que no hay aumento significativo del peso de las piezas en el proceso productivo.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 13
Pruebas de Hipótesis
3. Contraste para la media de una población normal
con varianza desconocida
Este caso es muy parecido al anteriormente desarrollado, con la sola diferencia de que asumimos una condición
más realista respecto de los datos en términos de que ya no asumimos que la varianza de los datos es conocida,
sino que asumimos que en efecto no la conocemos si bien podemos estimar una aproximación a partir de la
muestra.
Esta es una visión más conservadora de abordar el test de hipótesis y por ende sus resultados serán algo más
exigentes con los datos disponible, aunque en la práctica la diferencia no suele ser mucha, esto es, en la
mayoría de los casos que lleguemos a una cierta conclusión asumiendo varianza conocida, también llegaremos
a la misma conclusión asumiendo varianza desconocida.
Adicionalmente, haremos una leve distinción dependiendo del tamaño de la muestra, asumiremos una
muestra pequeña y una grande donde el punto de corte es de 30 observaciones. Por cierto, que este es un
nivel general dado que en algunos casos 30 puede ser una gran muestra de datos o parecer insignificante, por
ejemplo considerar una muestra de 30 años de crecimiento económico puede parecer más de que suficiente
en tanto si hablamos del precio diario del dólar una muestra de 30 días es claramente insuficiente. En
conclusión, esta distinción es solo referencial.
𝑋̅ − 𝜇0
𝑍= 𝑠
⁄ 𝑛
√
Luego sabemos que es una variable que sigue una distribución normal estándar N(0,1), por lo que el
razonamiento es idéntico al caso anterior.
Pruebas de Hipótesis
caso están definidos como (n-1). Luego ésta variable t, así construida, puede utilizarse con un estadístico de
prueba o contraste.
𝑋̅ − 𝜇0
𝑡=𝑠
⁄ −1
√𝑛
La región crítica, en éste caso, estará determinada por los valores de la variable t que sean excesivamente
grandes en valor absoluto, si el contraste es bilateral, y para especificar el nivel de cuando pueden considerarse
grandes, teniendo en cuenta la distribución de la variable t, que sigue una distribución t con n-1 grados de
libertad, serán aquellos valores mayores que tα/2,n-1 en el contraste bilateral, o que tα,n-1 en el contraste
unilateral. En forma similar a la distribución normal, estos valores críticos suelen encontrarse en tablas
incluidas en los libros de estadística o en material de la web.
Por ejemplo, podríamos querer testear si existen diferencias entre hombres y mujeres en el resultado de una
prueba en particular, o si existen diferencias en un grupo de enfermos antes y después de aplicarles un
tratamiento médico en base a un nuevo fármaco.
En términos generales, consideraremos dos poblaciones, P1 y P2, con distribuciones asumidas como normales
con medias 1 y 2 y varianzas 1y 2 respectivamente, de las cuales podemos obtener muestras de tamaños
n1 y n2 respectivamente.
P1 P2 Hipótesis nula
Ho (1- 2 = 0)
Media 1 Media 2
Concluir si las dos
poblaciones tienen
Varianza Varianza la misma media
1 2 poblacional para la Hipótesis
variable interés alternativa
N1 N2 H1(1- 2< 0)
(tamaño) (tamaño) H1(1- 2> 0)
H1(1- 2≠ 0)
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 15
Pruebas de Hipótesis
Por supuesto que también podríamos testear que la diferencia entre estas poblaciones es mayor a cierto valor
o no, por ejemplo, queremos testear si es cierto el rumor de que los hombres en cierta empresa tienen sueldos
mayores a las mujeres en x pesos.
La teoría nos dice que la diferencia de dos distribuciones normales se distribuye también de forma normal con
media igual a la diferencia de las medias, y la varianza será igual a la suma de las varianzas, por lo que la variable
𝑋̅1 − 𝑋̅2 sera una variable que se distribuye normal con los siguientes parámetros:
𝜎12 𝜎22
(𝑋̅1 − 𝑋̅2 )~𝑁 (𝜇1 − 𝜇2 , √ + )
𝑛1 𝑛2
Por lo que, en el caso particular de conocer las varianzas poblacionales, podemos utilizar como estadístico de
prueba o contraste la siguiente variable Z construida:
̅̅̅
𝑋1 − ̅̅̅
𝑋2
𝑍=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2
En el caso de que la hipótesis nula es verdadera, es decir µ1 = µ2, se distribuye normal estándar N(0,1), y por
lo tanto, puede utilizarse como estadístico de prueba, como ya hemos mencionado la ventaja es que
conocemos su distribución y por ende todos los puntos críticos apara cualquier nivel de significancia.
La región crítica estará formada por los valores de Z elevados, tanto positivos como negativos. Para especificar
cuándo se consideran elevados, teniendo en cuenta la distribución de Z, serán aquellos que sean mayores, en
valor absoluto, que Zα/2, en el contraste bilateral, o que zα en el contraste unilateral.
Pruebas de Hipótesis
a. Muestras grandes
Si las muestras tienen tamaño grande, aunque no se conozca la varianza poblacional, se trabaja como si se
conociese utilizando en lugar de la varianza poblacional, su estimador la cuasivarianza muestral, por lo que la
distribución de la diferencia de medias es ahora:
1 1
(𝑋̅1 − 𝑋̅2 )~𝑁 (𝜇1 − 𝜇2 , 𝑠̂ √ + )
𝑛1 𝑛2
Donde las variables 𝑠̂12 y 𝑠̂22 corresponden a las varianzas muestrales de las muestras 1 y 2 respectivamente y
en conjunto permiten estimar la cuasivarianza muestral que permite estimar la volatilidad de la diferencia de
muestras que estamos analizando.
(𝑋̅1 − 𝑋̅2 )
𝑍=
1 1
𝑠̂ √ +
𝑛1 𝑛2
Se distribuye como una distribución normal estándar, razón por la cual la utilizaremos como estadístico de
prueba o contraste. La región crítica se determina igual que en los apartados anteriores, es decir, para los
valores de z mayores, en valor absoluto, que zα/2 (contraste bilateral), o que zα(contraste unilateral),
rechazaremos la hipótesis nula.
b. Muestras pequeñas
Si las muestras son pequeñas (n1 + n2 < 30), entonces construimos la siguiente variable:
Pruebas de Hipótesis
Si la hipótesis nula es cierta, el estadístico de prueba o contraste que utilizaremos es:
(𝑋̅1 − 𝑋̅2 )
𝑡=
1 1
𝑠̂ √ +
𝑛1 𝑛2
El cual se distribuye como una distribución t de Student con n1+n2-2 grados de libertad, cabe mencionar que
esta distribución es muy similar a la normal.
La región crítica viene determinada por los valores de esta variable t, que son mayores en valor absoluto que
tα/2 en el contraste bilateral, o bien los valores de t, que son mayores en valor absoluto que tα en el contraste
unilateral.
El planteamiento de las hipótesis sobre la diferencia de varianzas es algo especial por el hecho de que las
varianzas no son aditivas y el esbozo de igualdad entre varianzas de la hipótesis nula no se puede hacer como
una igualdad a cero (𝜎22 − 𝜎12 = 0), sino como de igualdad entre varianzas (𝜎22 = 𝜎12 ), o igualando a uno el
ratio entre varianzas (𝜎22 /𝜎12 = 1).Las hipótesis es la siguiente:
𝐻0 : 𝜎22 = 𝜎12
𝜎22 ≠ 𝜎12
𝐻1 : 𝜎22 > 𝜎12
𝜎22 < 𝜎12
Para efectos de definir el nivel de significancia se utiliza la distribución F(n1,n2, ) el cual sigue una distribución
𝑠2
conocida como F. Como estadístico de contraste se usa la razón de las varianzas muestrales, 𝐹0 = 2⁄ 2 . Que
𝑠1
también sigue la distribución F, la cual en este caso tiene dos indicadores de grados de libertad: (n2-1) en el
numerador y (n1-1) en el denominador. El proceso de contraste de hipótesis es similar a los ya revisados
previamente.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 18
Pruebas de Hipótesis
6. Aplicación en Excel
Siguiendo con la aplicación del complemento de análisis de datos en el módulo uno del curso, ahora podemos
aplicar dicha herramienta a los conceptos desarrollados en este módulo.
Ahora realizaremos el test respecto de la diferencia de medias utilizando el complemento de análisis de datos:
Luego consideramos la alternativa de diferencia de medias asumiendo varianzas iguales (para el caso del este
ejemplo):
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 19
Pruebas de Hipótesis
Luego debemos entregar los datos y parámetros al programa:
Diferencia de medias
de la hipótesis, si la
hipótesis es que las
medias son iguales,
entonces la diferencia
es cero como en este
caso de significancia,
Nivel
el sistema entrega el
nivel de 5% por default
pero se puede ajustar.
Estadístico de
contraste
El resultado entrega una serie de datos, sin embargo, los datos relevantes son los comentados en la figura,
esto es, el estadístico t y el estadístico de contraste, dado que este último es menor al de contraste podemos
rechazar la hipótesis nula de igualdad de medias lo que es equivalente a decir que dada la información
podemos afirmar que ambas variables tienen medias significativamente distintas. El alumno puede ahora crear
ahora otras variables para probar otras hipótesis y entender mejor la lógica de aceptación y rechazo bajo
variables controladas.
Área: NEGOCIOS M2
Curso: ESTADÍSTICA APLICADA Pág. 20
Pruebas de Hipótesis
Cierre
El primer módulo abordo conceptos de estadística descriptiva que son esenciales para iniciar un análisis de
datos. Este módulo aborda una segunda etapa en el mismo camino y que se trata de establecer la significancia
estadística de los parámetros calculados de tal forma de establecer entregarle una base que permita saber que
tan confiables son los resultados que estamos obteniendo, y más importante, que tan validas son las
conclusiones que podemos obtener a partir de los datos que manejamos. Es fundamental tener en cuenta la
necesidad de esta segunda etapa en el análisis de datos.
En primer lugar, abordamos el procedimiento en términos generales abordando los principales conceptos que
lo integran: Hipótesis nula y alternativa, hipótesis simples y compuestas, Error tipo 1 y 2, nivel de significancia
y distribución estandarizada. Es importante estar familiarizado con todos estos conceptos previos a realizar las
pruebas en el software elegido para poder realizar la entrada de datos correcta y asimismo una apropiada
interpretación de los resultados.
En el segundo punto del módulo se establece el procedimiento para el test de hipótesis para la media de una
población, primero asumiendo varianza conocida y luego levantando dicho supuesto. Luego se aborda el
procedimiento para contrastar dos medias obtenidas desde dos poblaciones distintas. El tercer procedimiento
aborda el contraste de dos varianzas obtenidas de muestras de dos poblaciones distintas. En cada caso se
abordan las hipótesis que subyacen a l problema de estimación para luego definir cuáles son los supuestos de
y distribuciones lo que implica la elección de un estadístico de prueba o contraste que será utilizado para la
prueba de hipótesis, dichos supuestos estarán asociados a asumir el conocimiento o no de la varianza real
como asimismo si el número de observaciones o tamaño muestral es suficientemente grande o no.
Finalmente se revisa las aplicaciones de Microsoft Excel para abordar estos problemas con facilidad dadas las
funciones contenidas en el software que permiten realizar los cálculos en forma muy rápida y sacar
conclusiones.
APORTE A TU FORMACIÓN
La capacidad de analizar datos para tomar decisiones es algo cada vez más trascendente en la labor diaria
de los profesionales independiente de la labor en que se desempeñan. Sin embargo, realizar inferencia
estadística va mucho más allá de calcular algunos estadísticos descriptivos como la media y construir
gráficos.
Si bien lo anterior es un paso necesario para entender el comportamiento de los datos, es necesario
agregar una dimensión que nos permita establecer la fortaleza de las conclusiones que podemos
establecer: ¿es realmente el aumento en las ventas una tendencia significativa o sólo está dentro del
margen de error? ¿Existe realmente una diferencia entre el gasto que realizan hombre y mujeres en
nuestra marca? Entre otras preguntas que podemos responder apresuradamente a partir de comparar
estimaciones puntuales o con una respuesta académicamente elaborada incorporando las pruebas de
hipótesis que se han establecido en este módulo.