Está en la página 1de 25

Análisis cuantitativo para

la gestión empresarial
Inferencia estadística

Sesión 3
Análisis Cuantitativo para la Gestión Empresarial

ÍNDICE

3. Inferencia estadística................................................................................................................. 3

3.1. Inferencia estadística......................................................................................................3

3.2. Estimación puntual..........................................................................................................3

3.3. Estimador puntual...........................................................................................................4

3.4. Intervalos de confianza....................................................................................................4

3.5. Desviación estándar de la población conocida σ................................................................5

3.6. Desviación estándar poblacional σ desconocida . . ............................................... 10

Referencias................................................................................................................................... 25

Sesión 3 2
Análisis Cuantitativo para la Gestión Empresarial

3. Inferencia estadística

3.1. Inferencia estadística

La inferencia estadística es el procedimiento mediante el cual se sintetizan conclusiones de una población a partir
de la información contenida en una muestra extraída de esa población (Llinás Solano, 2017). Cabe aclarar que se
utilizan muestras para obtener inferencias estadísticas, pues obtener inferencias de la población completa resulta
impráctico y, en ocasiones, imposible pues la población puede ser demasiado grande, por ello es válido analizar
muestras de esa población. Ahora bien, si consideramos que cuando se requiere información de la población solo
disponemos de datos de una muestra, caemos en cuenta de la necesidad de medios para procesar los datos dispo-
nibles de una muestra y obtener información de la población.

Existen dos tipos de inferencia estadística: la estimación y la prueba de hipótesis. La estadística inferencial implica
técnicas para asignar magnitudes de parámetros estadísticos por medio de inferencia estadística llamadas estimación.

3.2. Estimación puntual

Cualquier inferencia sobre una población debe basarse, necesariamente, en estadísticos muestrales, es decir, en
funciones de la información muestral. La elección apropiada de estos estadísticos dependerá de cuál sea el pará-
metro de interés de la población; pero como el verdadero parámetro suele desconocerse en sí, un objetivo será
estimar su valor.

La estimación estadística es el proceso mediante el cual intentamos determinar el valor de un parámetro de la pobla-
ción sin realizar un censo y a partir de la información de una muestra. Una estimación, en esencia, es el valor numérico
que asignamos a un parámetro y el estimador es el estadístico de la muestra utilizado para hacer una estimación.

Para la estimación de un parámetro desconocido, se deben considerar dos tipos de estimaciones: estimación puntual
y estimación por intervalo. El primer tipo se calcula con base en los datos de la muestra, un valor representativo o
con el más representativo. En el segundo, se intenta determinar un intervalo o rango de valores del cual estamos
casi seguros que contiene el verdadero parámetro.

Sesión 3 3
Análisis Cuantitativo para la Gestión Empresarial

3.3. Estimador puntual

Un estimador puntual de un parámetro poblacional es una función de la muestra que da como resultado un único
valor. Un valor particular de un estimador puntual se llama estimación puntual del parámetro.

Para el caso de los métodos estadísticos de investigación, Rodríguez Franco y Rodríguez Jiménez (2016) indican que
la media muestral x es un estimador de la media poblacional μ. La varianza muestral s2 es un estimador de la varian-
za σ2, la desviación estándar de la muestra s y la desviación estándar de la población σ, la proporción muestral ρ y
la proporción de la población π. De modo que ya se conocen estimaciones de esos parámetros, son estimaciones
puntuales. Se denominan así porque ofrecen un único valor como estimación del parámetro de interés. Por ejemplo,
si en una muestra de 50 ingenieros egresados en los últimos cinco años se encuentra que su calificación promedio
es x =07.5, disponemos de una media muestral; entonces, se podría realizar la suposición tentativa de que en los
últimos cinco años, el promedio con el que todos los ingenieros que egresaron debe acercarse a 7.5. Con esta expre-
sión imprecisa, se estaría haciendo una estimación de la media poblacional μ. Pero esta estimación es deficiente,
ya que no se conoce cuán cerca puede estar la verdadera nota promedio de 7.5, esta es la que se denominaría una
estimación puntual.

3.4. Intervalos de confianza

De acuerdo con Rodríguez Franco y Rodríguez Jiménez (2016), una estimación más completa de los parámetros se
denomina estimación por intervalo; la cual consiste en ofrecer no ya un número como en la estimación puntual, sino
un intervalo del cual se tiene cierto grado de certeza (o se deposita cierta confianza) que contenga el parámetro. Así,
en lugar de afirmar que el promedio con que egresa el total de ingenieros debe ser cercano al 7.5, se construirá un
intervalo que dirá, por ejemplo, “hay una confianza del 95% en que el intervalo [7.20;7.90] contiene al promedio con
que egresaron los ingenieros de determinada facultad”. Tal como se observa, en esta forma se registran dos núme-
ros, los límites de un intervalo, del que esperamos contenga el parámetro que estimamos. Se dice “esperamos que
se contenga” porque no hay certeza absoluta de que se encuentre allí, hay una confianza que puede ser expresada,
por ejemplo, del 95% que puede elegirse.

Bologna (2018) explica que para mejorar la calidad de las estimaciones puntuales se construyen los intervalos de
confianza. Debido a que la muestra ha sido obtenida de manera aleatoria, la media muestral es una variable aleato-
ria, cuya distribución tiene media μ y una desviación estándar σx=σ/n; además, a medida que aumenta el tamaño
de la muestra, esa distribución tiende a ser normal, es decir, que será tanto más cercana a una distribución normal
cuanto más grande sea n. Para fines prácticos, una muestra de 30 casos se considera suficiente como para usar la
distribución normal en la distribución de x. Si la muestra es más pequeña no se puede utilizar inmediatamente la
distribución normal, sino que se debería utilizar la distribución t de Student.

Sesión 3 4
Análisis Cuantitativo para la Gestión Empresarial

3.5. Desviación estándar de la población conocida σ

Sweeney, Williams y Anderson (2016) explican que un intervalo de confianza se calcula con el empleo de dos esta-
dísticos: la media muestral x y la desviación estándar σ; la desviación estándar es un estadístico importante porque
mide la dispersión o la amplitud de una población o de una muestra. Cuando se calcula un intervalo de confianza,
se utiliza la desviación estándar para estimar el rango del intervalo de confianza. Para demostrar la idea del inter-
valo de confianza, se comienza con una suposición simple: que conocemos el valor de la desviación estándar de
la población, σ. Conocerla permite simplificar el desarrollo del intervalo de confianza, porque podemos utilizar la
distribución normal.

Teniendo en cuenta que la distribución muestral de la media es la distribución de todas las medias muestrales, x,
con tamaño de la muestra, n, de una población. Se conoce la desviación estándar de la población, σ. A partir de
esta información y del teorema central del límite sabemos que la distribución muestral sigue una distribución de
probabilidad normal con una media μ y una desviación estándar σ/ n. Este valor recibe el nombre de error estándar.

Los resultados del teorema central del límite permiten afirmar lo siguiente con respecto a los intervalos de confianza
utilizando el estadístico z:

1. El 95 % de las medias muestrales seleccionadas de una población se encontrará dentro de 1.96 errores estándares
(desviación estándar de las medias muestrales de la media poblacional, μ).

2. El 99 % de las medias muestrales se encontrará a 2.58 errores estándares de la media poblacional.

Los intervalos calculados de esta manera proporcionan ejemplos de los niveles de confianza y reciben el nombre de
intervalo de confianza de 95% e intervalo de confianza de 99%. Por lo tanto, 95% y 99% son los niveles de confianza
y se refieren al porcentaje de intervalos similarmente construidos que incluirían el parámetro a calcular.

¿Cómo se obtienen los valores de 1.96 y 2.58? En el caso del intervalo de confianza de 95%, observa el siguiente
diagrama y consulta la tabla normal estandarizada para determinar los valores z adecuados. Localiza 0.4750 (que
refiere 0.95/2=0.475; 0.95 se divide entre dos porque la tabla tiene valores de un sólo lado) en el cuerpo de la tabla.
Lee los valores de la columna y el renglón correspondientes. El valor es 1.96. Por lo tanto, la probabilidad de hallar
un valor Z entre 0 y 1.96 es de 0.4750. Asimismo, la probabilidad de encontrar un valor Z en el intervalo entre 0 y
−1.96 también es de 0.4750. Al combinar ambos valores, la probabilidad de estar en el intervalo −1.96 y 1.96 es de
0.9500. El valor z del nivel de confianza de 90% se determina de forma similar. Este es de 1.65.

Sesión 3 5
Análisis Cuantitativo para la Gestión Empresarial

En el caso de un nivel de confianza de 99%, el valor Z es de 2.58

Fuente: Sweeney, D. J.; Williams, T. A., y Anderson, D. R. (2016).

¿Cómo determinar el intervalo de confianza de 95%? La amplitud del intervalo se determina por medio del
nivel de confianza y de la magnitud del error estándar de la media. Ya descrito, la forma de encontrar el
valor Z de un nivel de confianza particular. El error estándar de la media indica la variación de la distribu-
ción de las medias muestrales. Se trata, en realidad, de la desviación estándar de la distribución muestral
de medias. La fórmula es la siguiente:

Donde:

σ x es el símbolo del error estándar de la media. Se utiliza la letra griega sigma porque se trata de un valor
poblacional, y el subíndice recuerda que se refiere a la distribución de las medias muestrales.

Sesión 3 6
Análisis Cuantitativo para la Gestión Empresarial

σ es la desviación estándar poblacional.

n es el número de observaciones en la muestra.

La magnitud del error estándar se ve afectada por dos valores. El primero es la desviación estándar de la
población. Mientras mayor sea la desviación estándar de la población, σ, mayor será σ/ n. Si la población
es homogénea, de modo que genere una desviación estándar poblacional pequeña, el error estándar
también será pequeño. Sin embargo, la cantidad de observaciones de la muestra también afecta al error
estándar. Una muestra grande generará un error estándar pequeño en la estimación, lo que indicará que
hay menos variabilidad en las medias muestrales.

En el caso de intervalos de confianza del 95 % se aplica la siguiente fórmula:

De manera similar, un intervalo de confianza de 99% se calcula con:

Propiamente no hay restricción a los niveles de confianza de 95% y 99%. Es posible seleccionar cualquier
nivel de confianza entre 0% y 100% y determinar el valor correspondiente de Z.

Los valores de Z más utilizados son:

Valores Z Nivel de confianza Nivel de significancia

1.65 90% 0.10 ó 10%

1.96 95% 0.05 ó 5 %

2.58 99% 0.01 ó 1%

En general, un intervalo de confianza de la media poblacional, cuando se conoce la desviación estándar


poblacional, se calcula con la siguiente fórmula:

Intervalo de confianza de la media poblacional con σ conocida

Sesión 3 7
Análisis Cuantitativo para la Gestión Empresarial

En esta fórmula, Z depende del nivel de confianza. Por consiguiente, con un nivel de confianza de 92%, el
valor Z es de 1.75. El valor de Z proviene de la tabla normal estandarizada. Esta tabla se basa en la mitad
de la distribución normal, por lo que 0.9200/2 = 0.4600. El valor más próximo en el cuerpo de la tabla es
de 0.4599, y el valor Z correspondiente es de 1.75. Con frecuencia, también se utiliza el nivel de confianza
de 90%. En este caso, se desea que el área entre 0 y Z sea de 0.4500, que se determina con la operación
0.9000/2. Para determinar el valor Z con este nivel de confianza, descienda por la columna izquierda de
la tabla normal estandarizada hasta 1.6, y después recorra las columnas con los encabezamientos 0.04 y
0.05. El área correspondiente al valor Z de 1.64 es 0.4495, y de 1.65, 0.4505. Para proceder con cautela,
utilice 1.65. Intente buscar los siguientes niveles de confianza y verifique sus respuestas con los valores
correspondientes de Z indicados a la derecha.

Nivel de confianza Probabilidad media más cercana Valor Z

80% .3997 1.28


94% .4699 1.88
96% .4798 2.05

Fuente: Sweeney, D. J.; Williams, T. A., y Anderson, D. R. (2016).

Ejemplo:

Un corporativo desea información acerca del ingreso medio de los gerentes de la industria del menudeo.
Una muestra aleatoria de 256 gerentes revela una media muestral de $45420. La desviación estándar de
esta muestra es de $2050. A la corporación le gustaría responder las siguientes preguntas:

1. ¿Cuál es la media de la población?

2. ¿Cuál es un conjunto de valores razonable de la media poblacional?

3. ¿Cómo se deben interpretar estos resultados?

En general, las distribuciones de los salarios e ingresos tienen un sesgo positivo, pues unos cuántos in-
dividuos ganan considerablemente más que otros, lo cual sesga la distribución en dirección positiva. Por
fortuna, el teorema central del límite estipula que, si se selecciona una muestra grande, la distribución de
las medias muestrales tenderá a seguir la distribución normal. En este caso, una muestra de 256 gerentes
es lo bastante grande para suponer que la distribución muestral tenderá a seguir la distribución normal.

Sesión 3 8
Análisis Cuantitativo para la Gestión Empresarial

Así, las respuestas a estas preguntas son:

Respuestas:

1. ¿Cuál es la media de la población? En este caso se ignora. Sí se sabe que la media de la muestra es de
$45420. De ahí que la mejor estimación del valor de población sea el estadístico de la muestra correspon-
diente. Por consiguiente, la media de la muestra de $45420 constituye un estimador puntual de la media
poblacional desconocida.

2. ¿Cuál es el conjunto de valores razonable de la media poblacional? La corporación decide utilizar un


nivel de confianza de 95%. Para determinar el intervalo de confianza correspondiente, se aplica la fórmula:

Es costumbre redondear estos puntos extremos a $45169 y $45671. Estos puntos extremos reciben el
nombre de límites de confianza. El grado de confianza o nivel de confianza es de 95%, y el intervalo de
confianza abarca de $45169 a $45671. Con frecuencia, ±$251 se conoce como margen de error.

¿Cómo se deben interpretar estos resultados? Suponga que selecciona varias muestras de 256 gerentes,
tal vez varios cientos. Para cada muestra, calcula la media y después construye un intervalo de confianza
de 95%, como en la sección anterior. Puede esperar que alrededor de 95% de estos intervalos de confianza
contenga la media de la población. Cerca de 5% de los intervalos no contendrán el ingreso medio pobla-
cional, μ.

Error estándar de la media ayuda a determinar qué tan lejos puede estar la media muestral de la media
poblacional se calcula con la siguiente fórmula:

Siendo σ desviación estándar de la población y n tamaño de la muestra

Ejemplo:

En una muestra aleatoria simple de 50 artículos de una población, en la que σ=6, la media muestral fue 32,
considerar un nivel de confianza del 90%:

a. Determinar el error estándar de la media.

Sesión 3 9
Análisis Cuantitativo para la Gestión Empresarial

b. Determinar el margen de error de la media.

c. Determinar el intervalo de confianza de la media identificando el límite inferior y superior.

Respuestas:

a. Se aplica la fórmula de error estándar de la media sustituyendo los valores correspondientes:

b. Para el margen de error de la media se aplica la fórmula, que es la parte que se le agrega o disminuye
a la media muestral al definir el intervalo de confianza.

Para Z de 90% se tiene un valor de 1.95 se obtiene de la tabla de distribución normal estandarizada.

c. Para el intervalo se aplica la fórmula correspondiente que propiamente considera el concepto de error
estándar de la muestra y el margen de error

Límite inferior 32-1.655=30.345

Límite superior 32+1.655=33.66

Intervalo [límite inferior : límite superior] [30.345 : 33.66]

3.6. Desviación estándar poblacional σ desconocida

Obando López y Arango Londoño (2019) describen que en muchos casos de muestreo no se conoce la
desviación estándar de la población σ, pero se utiliza la desviación estándar de la muestra para estimar la
desviación estándar poblacional. Es decir, se utiliza s, la desviación estándar de la muestra, para estimar
σ, la desviación estándar de la población. Como no se conoce σ, no se puede utilizar la distribución Z. Sin

Sesión 3 10
Análisis Cuantitativo para la Gestión Empresarial

embargo, hay una solución: utilizar la desviación estándar de la media y sustituir la distribución Z con la
distribución t.

La distribución t es una distribución de probabilidad continua, con muchas características similares a las
de la distribución Z. con el siguiente estadístico:

Aquí, s es un estimador de σ. Observe que la distribución t es más plana y que se extiende más que la dis-
tribución normal estándar. Esto se debe a que la desviación estándar de la distribución t es mayor que la
distribución normal estándar.

Las siguientes características de la distribución t se basan en el supuesto de que la población de interés


es de naturaleza normal, o casi normal:

• Como en el caso de la distribución z, es una distribución continua.

• Como en el caso de la distribución z, tiene forma de campana y es simétrica.

• No existe una distribución t, sino una familia de distribuciones t. Todas las distribuciones t tienen
una media de 0, y sus desviaciones estándares difieren de acuerdo con el tamaño de la muestra, n.
Existe una distribución t para un tamaño de muestra de 20, otro para un tamaño de muestra de 22,
etc. La desviación estándar de una distribución t con 5 observaciones es mayor que en el caso de una
distribución t con 20 observaciones.

• La distribución t se extiende más y es más plana por el centro que la distribución normal estándar.
Sin embargo, conforme se incrementa el tamaño de la muestra, la distribución t se aproxima a la
distribución normal estándar, pues los errores que se cometen al utilizar s para estimar σ disminuyen
con muestras más grandes.

Como la distribución t de Student posee mayor dispersión que la distribución z, el valor de t en un nivel de
confianza dado tiene una magnitud mayor que el valor z correspondiente.

Fórmula para determinar el intervalo de confianza de la media poblacional con σ desconocida:

Sesión 3 11
Análisis Cuantitativo para la Gestión Empresarial

Pasos para crear un intervalo de confianza de la media poblacional con una desviación estándar desconocida:

1. Suponga que la población muestreada es normal o aproximadamente normal. De acuerdo con el teo-
rema central del límite, sabemos que este supuesto es cuestionable en el caso de muestras pequeñas,
y es de mayor validez en el de muestras más grandes.

2. Estime la desviación estándar de la población σ con la desviación estándar de la muestra (s).

3. Utilice la distribución t en lugar de la distribución z.

Aclaración: La decisión de utilizar t o z se basa en el hecho de que se conozca σ, la desviación estándar


poblacional. Si se conoce, se utiliza z. Si no se conoce, se debe utilizar t.

Al final de estas notas se anexa una tabla t-Student y una tabla de distribución normal estandarizada, si-
milares a las que se anexan en diversos textos de estadística.

Para su uso, gl se refiere a grados de libertad en la que al tamaño de la muestra tenemos que descontarle
la unidad

gl = n-1

Ejemplo:

Esto es si la muestra es de 25 y un nivel de confianza de 90% corresponde una t= 1.711. Esto se localiza en
la columna gl 25-1= 24 y en la fila superior refiere el 90% de confianza.

Ejemplo:

Si en una muestra aleatoria simple, con n= 54, la media muestral fue 22.5 y la desviación estándar muestral
4.4, calcula lo siguiente:

a) Calcula un intervalo de confianza de 90% para la media poblacional.

b) Como no se dispone de la σ, desviación estándar de la población, utilizamos la desviación estándar de


la muestra s, que es igual a 4.4 y la distribución t

n=54 entonces gl = 54-1 = 53

Sesión 3 12
Análisis Cuantitativo para la Gestión Empresarial

En la tabla t-student ubicamos, en la primera columna, 53 y un nivel de confianza del 90%, al cual le corres-
ponde un valor t= 1.674. Luego aplicamos la fórmula para el intervalo de confianza cuando σ es desconocida
sustituyendo valores tenemos:

Intervalo de confianza [21.498 : 23.5002]

Tener en cuenta que n es el tamaño de la muestra y que los grados de libertad se utilizaron solo para iden-
tificar en la tabla el valor de t

Prueba de hipótesis

De acuerdo a Sweeney, Williams y Anderson (2016), las pruebas de hipótesis son otra herramienta estadística
que ofrece la inferencia para obtener conclusiones acerca de determinados parámetros de la población. La
hipótesis es una afirmación relativa a un parámetro de la población sujeta a verificación. En la mayoría de
los casos, la población es tan grande que no es viable estudiarla por completo, pero una opción para medir
o estimar un parámetro de la población es tomar una muestra de ella. Por lo tanto, así se pone a prueba
una declaración para determinar si la muestra apoya o no la declaración en lo concerniente a la población.

Asimismo, Romero Ramos (2016) afirma que la prueba de hipótesis comienza con una suposición, lla-
mada hipótesis, que hacemos acerca de un parámetro de población. Después recolectamos datos de la
muestra, producimos estadísticas muestrales y usamos esta información para decidir qué tan probable
es que nuestro parámetro de población hipotético sea correcto. Digamos que suponemos un cierto valor
para una media de población. Para probar la validez de esa suposición recolectamos datos de muestra y
determinamos la diferencia entre el valor hipotético y el valor real de la media de la muestra. Después
juzgamos si la diferencia obtenida es significativa o no. Mientras más pequeña sea la diferencia, mayor
será la probabilidad de que nuestro valor hipotético para la media sea correcto. Mientras mayor sea la
diferencia, más pequeña será la probabilidad.

Sweeney, Williams y Anderson (2016) refieren que las pruebas de hipótesis para medias poblacionales y
medias muestrales pueden ser de tres formas: en dos se emplean desigualdades en la hipótesis nula, en la
tercera se aplica una igualdad en la hipótesis nula. En las pruebas de hipótesis para la media poblacional,
μo denota el valor hipotético, por ello debemos elegir una de las formas siguientes:

Sesión 3 13
Análisis Cuantitativo para la Gestión Empresarial

H 0 : μPμ o H 0 : μOμ o H 0 : μ=μ o

H 1 : μ<μ o H 1 : μ>μ o H 1 : μKμ o

A las dos primeras formas se les denomina pruebas de una cola, a la tercera prueba de dos colas. Como
se observa los signos (P, O o =) deben aparecer siempre en la hipótesis nula. Al elegir la forma adecuada
de Ho y H 1 hay que tener en mente que la hipótesis alternativa a menudo es lo que la prueba trata de de-
mostrar. Por lo tanto, preguntarse si el usuario busca evidencias en apoyo de μ<μ o , μ>μ o , μ=μ o ayudará a
determinar H 1 .

Sweeney, Williams y Anderson (2016), afirman que existe un procedimiento de cinco pasos que sistematiza
la prueba de una hipótesis; al llegar al paso 5, se está en posibilidades de rechazar o no la hipótesis. Sin
embargo, la prueba de hipótesis, como la emplean los especialistas en estadística, no prueba que algo es
verdadero de la forma en que un matemático demuestra un enunciado. Más bien, proporciona un tipo de
prueba más allá de toda duda razonable, como en el sistema judicial. De ahí que existan reglas específicas
de evidencia o procedimientos. A continuación de lista el procedimiento a seguir.

Procedimiento de la prueba de hipótesis

Paso 1. Se establecen la hipótesis nula (H 0 ) y la hipótesis alternativa (H 1 ).

Paso 2. Se selecciona el nivel de significancia, es decir, α.

Paso 3. Se selecciona el estadístico de prueba adecuado.

Paso 4. Se formula la regla de decisión con base en los pasos 1, 2 y 3, anteriores.

Paso 5. Se toma una decisión en lo que se refiere a la hipótesis nula con base en la información de la mues-
tra. Se interpretan los resultados de la prueba.

Paso 1. Se establece la hipótesis nula (H 0 ) y la hipótesis alternativa (H 1 )

Se establece la hipótesis que se debe probar. Esta hipótesis a probar recibe el nombre de hipótesis nula
y se designa H 0 , y se lee “H subíndice cero”. La letra mayúscula H representa la hipótesis, y el subíndice
cero implica que “no hay diferencia”. En términos generales, la hipótesis nula se formula para realizar una
prueba, que o se rechaza o se comprueba. Es una afirmación que no se rechaza, a menos que la información
de la muestra ofrezca evidencia convincente de que es falsa.

Sesión 3 14
Análisis Cuantitativo para la Gestión Empresarial

Cabe hacer hincapié en que, si la hipótesis nula no se rechaza con base en los datos de la muestra, no es
posible decir que la hipótesis nula sea verdadera. En otras palabras, el hecho de no rechazar una hipótesis
no prueba que H 0 sea verdadera, sino que no rechazamos H 0 . Para probar sin lugar a dudas que la hipóte-
sis nula es verdadera, sería necesario conocer el parámetro poblacional. Para determinarlo deberíamos
probar, entrevistar o contar cada elemento de la población; algo que no resulta factible. La alternativa
consiste en tomar una muestra de la población.

Debe destacarse que, al seleccionar una muestra de una población, el estadístico de la muestra suele ser
numéricamente distinto del parámetro poblacional hipotético.

La hipótesis nula es el enunciado relativo al valor de un parámetro poblacional que se formula con el fin
de probar evidencia numérica.

La hipótesis alternativa describe lo que se concluirá si se rechaza la hipótesis nula. Se representa H 1 y se


lee “H subíndice uno”. También se le conoce como hipótesis de investigación. La hipótesis alternativa se
acepta si la información de la muestra ofrece suficiente evidencia estadística para rechazar la hipótesis nula.

La hipótesis alternativa es el enunciado que se acepta si los datos de la muestra ofrecen suficiente eviden-
cia para rechazar la hipótesis nula.

Con H 1 se identifica si estamos analizando un problema de una o dos colas; si es de una cola, podemos
identificar si es de cola derecha o de cola izquierda.

Grafico si H 1 : contiene el signo < (menor que) es cola izquierda. En el caso de prueba de hipótesis de una
media, la de la muestra es < que la media poblacional μ:

Sesión 3 15
Análisis Cuantitativo para la Gestión Empresarial

Grafico si H 1 : contiene el signo > (mayor que) es cola izquierda. En el caso de prueba de hipótesis de una
media, la de la muestra es >que la media poblacional μ:

Grafico si H 1 : contiene el signo K (desigualdad) es un problema de dos colas:

Paso 2. Se selecciona un nivel de significancia

Tras establecer las hipótesis nula y alternativa, se determina el nivel de significancia. Este consiste en la
probabilidad de rechazar la hipótesis nula cuando es verdadera y se expresa con la letra griega alfa, α. En
ocasiones también se conoce como nivel de riesgo; este quizá sea un término más adecuado porque se
trata del riesgo que se corre al rechazar la hipótesis nula cuando es verdadera. No existe ningún nivel de
significancia que se aplique a todas las pruebas. Se toma la decisión de utilizar el nivel de 0.05 (expresado
con frecuencia como nivel de 5%), nivel de 0.01, nivel de 0.10 o cualquier otro nivel entre 0 y 1. En el caso
de proyectos de investigación relacionados con los consumidores, se acostumbra elegir el nivel de 0.05; el
nivel de 0.01 se prefiere con relación al control de calidad, y el nivel de 0.10 se aplica en encuestas políti-
cas. Usted, como investigador, debe elegir el nivel de significancia antes de formular una regla de decisión
y recopilar los datos de la muestra.

Sesión 3 16
Análisis Cuantitativo para la Gestión Empresarial

De manera similar a los casos de intervalos de confianza, se puede obtener los valores Z de la tabla de curva
normal estandarizada. Los valores más utilizados se presentan a continuación, pero pueden ser calculados
para diferentes niveles de significancia o niveles de confianza. Observa que el nivel de significancia es el
complemento del nivel de confianza para completar el 100%. El nivel de confianza suele expresarse en
porcentaje.

Valores Z Nivel de confianza Nivel de significancia

1.65 90% 0.10 o 10%

1.96 95% 0.05 o 5 %

2.58 99% 0.01 o 1%

Por ejemplo, para el caso de requerir nivel de confianza de 85% implicaría un nivel de significancia del 15%
o de 0.15, que es el complemento del 100%. El valor Z se determina en la tabla normal estandarizada, de
la cual se muestra a continuación la parte correspondiente. Como la tabla refiere solo los valores de un
lado o sea 50%. Se divide 85%/2= 42.5%. Se localiza en la sección de porcentajes el valor más próximo es
0.4251, del lado izquierdo le corresponde el valor de 1.4 y en la parte superior se observa la aproximación
a la centésima 0.04 por lo que le corresponde valor de 1.44.

Paso 3. Se selecciona el estadístico de prueba

Hay diversos estadísticos de prueba. En este apartado se utilizan Z y t. El estadístico de prueba es el valor
calculado a partir de la información de la muestra, para determinar si se rechaza la hipótesis nula. La prue-
ba de hipótesis de la media (μ), cuando se conoce σ y el tamaño de la muestra es grande (esto es, mayor o
igual que 30), el estadístico de prueba Z se calcula de la siguiente manera:

Prueba de la media cuando se conoce σ

Si la muestra fuera menor que 30, se utilizaría la distribución t con grados de libertad=GL=n−1, de manera
similar a los intervalos de confianza.

Paso 4. Se formula la regla de decisión con base en los pasos 1, 2 y 3, anteriores

Una regla de decisión es un enunciado sobre las condiciones específicas en que se rechaza la hipótesis nula
y aquellas en las que no se rechaza. La región o área de rechazo define la ubicación de todos esos valores,

Sesión 3 17
Análisis Cuantitativo para la Gestión Empresarial

que son tan grandes o tan pequeños que la probabilidad de que ocurran en una hipótesis nula verdadera
es muy remota. En general, H 0 se rechaza si el intervalo de confianza no incluye el valor hipotético. Si el
intervalo de confianza incluye el valor hipotético, no se rechaza H 0 . Así, la región de no rechazo en una
prueba de hipótesis equivale al valor poblacional propuesto en el intervalo de confianza. La diferencia
fundamental entre un intervalo de confianza y la región de no rechazo en una prueba de hipótesis depen-
de de que el intervalo se centre en torno al estadístico de la muestra, como x, al intervalo de confianza o
alrededor de 0, como en la prueba de hipótesis.

Valor crítico es el punto de división entre la región en que se rechaza la hipótesis nula y aquella en la que
se acepta.

Obando López y Arango Londoño (2019) aclaran que es importante tener presente que cuando se acep-
ta una hipótesis nula con base en la información de la muestra, en realidad se está diciendo que no hay
evidencia estadística para rechazarla. Con esto no se está afirmando que la hipótesis nula sea cierta. La
única forma de probar una hipótesis nula es conocer el parámetro, y eso no es posible cuando se trata
de muestreo. Así, aceptamos la hipótesis nula y asumimos como si fuera cierta, simplemente porque no
podemos encontrar evidencia para rechazarla.

Paso 5. Se toma una decisión en lo que se refiere a la hipótesis nula con base en la información de la muestra

Bologna (2018) explica detalladamente que el quinto paso, último en la prueba de hipótesis, consiste en
calcular el estadístico de la prueba, comparándola con el valor crítico y tomar la decisión de rechazar o
no la hipótesis nula. La zona de rechazo H 0 es el conjunto de valores extremos de la distribución, donde
es poco probable encontrar los valores muestrales si H 0 es verdadera. La zona de aceptación de H 0 es el
conjunto de valores centrales de la distribución, donde es más probable encontrar los valores muestrales
si H 0 es verdadera.

Resumen de los pasos de la prueba de hipótesis:

Paso 1. Se establecen la hipótesis nula (H 0 ) y la hipótesis alternativa (H 1 ).

Paso 2. Se selecciona el nivel de significancia, es decir, α.

Paso 3. Se selecciona el estadístico de prueba adecuado.

Paso 4. Se formula una regla de decisión con base en los pasos 1, 2 y 3, anteriores.

Paso 5. Se toma una decisión en lo que se refiere a la hipótesis nula con base en la información de la mues-
tra. Se interpretan los resultados de la prueba.

Sesión 3 18
Análisis Cuantitativo para la Gestión Empresarial

Ejemplo 1

En principio, se sugiere considerar los pasos del procedimiento, identificar si se trata de un problema de
una cola o de dos e identificar si se puede utilizar la distribución normal o la distribución t- student.

El departamento de quejas de una empresa de servicio de cable registró que cada ventanilla de atención
al público atiende diariamente 15 casos, en promedio, con una desviación estándar de 3.3. Para verificar
los procedimientos de atención a clientes, realizó una muestra aleatoria en 35 ventanillas y detectó que
estas atendían en promedio 13 casos, con un nivel de significancia de 0.10. ¿Se puede concluir que estas
ventanillas que atienden las quejas de los usuarios es menor a 15 casos?

Se formula la hipótesis nula H 0 y la hipótesis alternativa H 1 .

H 0 : μP15

H 1 : μ<15

(Se debe tomar en cuenta que la media de la población podría ser mayor, por tal situación se utiliza P
(mayor o igual); asimismo, tomar en cuenta que debido a que μ (media poblacional) es mayor que x (media
muestral) en H 1 se usa < (menor que).

El nivel de significancia de 0.10 equivale a una Zcrítica o Zα de 1.65.

Sesión 3 19
Análisis Cuantitativo para la Gestión Empresarial

Debido a que Z calculado es menor que la Zcrítica, se encuentra en la zona de rechazo de H 0 por lo que se
acepta H 1 (cuando se rechaza H 0 se acepta H 1 ).

Decisión: rechazar H 0

Conclusión: El número de casos que se atienden en las ventanillas de quejas, con un nivel de significancia
del 0.10, es menor a 15 casos.

Ejemplo 2

Una estación de radio considera que su nivel de audiencia es de 6000 radioescuchas por día, con una des-
viación estándar de 630 radioescuchas. Supón que la muestra que se tomó es de 40 días y se registró que
en promedio la cantidad de radioescuchas es de 6200.

¿Se podría concluir que la estación de radio diariamente tiene más de 6000 radioescuchas, con un nivel
de confianza de 99%?

Se formula la hipótesis nula H 0 y la hipótesis alternativa H 1 .

H 0 : μO6000

H 1 : μ>6000

Se debe tomar en cuenta que en H 1 se debido a que x (media muestral = 6200) es mayor que μ (media po-
blacional = 6000), en H 1 se utiliza (>) y en H 0 se utiliza el signo contrario.

El nivel de confianza de 99% equivale a un nivel de significancia de 1%, o bien, 0.01, lo que representa una
Zcrítica o Zα de 2.58 (en caso de no ser un nivel de confianza convencional se tendría que determinar con
la tabla de distribución normal estandarizada).

Debido a que Z calculado es menor que Zcrítica se encuentra en la zona de rechazo de H 0 , por lo que se
acepta H 1 (cuando se rechaza H 0 se acepta H 1 ).

Sesión 3 20
Análisis Cuantitativo para la Gestión Empresarial

Decisión: debido a que Z calculado se encuentra en la zona de no rechazo de H 0 , se decide no rechazar H 0 .

Conclusión: Se acepta H 0 . El número de radioescuchas promedio de confianza del 0.99% es menor o


igual a 6000.

Ejemplo

Si en una comunidad el consumo anual per cápita de leche es 73 L con una desviación estándar σ=17.5,
y en una muestra de 56 personas, la media muestral del consumo anual es de 74.5 L, elabore una
prueba de hipótesis para determinar si el consumo de leche per cápita es mayor o menor con α= 0.177.

Se formula la hipótesis nula H 0 y la hipótesis alternativa H 1 .

H 0 : μO73

H 1 : μ>73

Se debe tomar en cuenta que en H 1 , debido a que x (media muestral = 74.5) es mayor que μ (media
poblacional= 73), en H 1 se utiliza (>) y en H 0 se utiliza el signo contrario.

Para el Zcrítico

1-0.177 = 0.8223

0.8223/2 = 0.4111

Sesión 3 21
Análisis Cuantitativo para la Gestión Empresarial

En la tabla normal estandarizada el valor más cercano es 0.4115, al que le corresponde Z de 1.35 (1.3 en
la columna de la izquierda y la centésima le corresponde 5).

Zcrítico = 1.35

Debido a que 0.6414 se encuentra en la zona de no rechazo de H 0 se acepta H 0 . Esto es la media pobla-
cional, si es menor que o igual que 73 probado, con una muestra aleatoria de 56 personas y un nivel de
significancia de 0.177.

Sesión 3 22
Análisis Cuantitativo para la Gestión Empresarial

Sesión 3 23
Análisis Cuantitativo para la Gestión Empresarial

Sesión 3 24
Análisis Cuantitativo para la Gestión Empresarial

Referencias

Anderson, D., Sweeney, D. y Williams, T. (2016). Estadística para negocios y economía (12a. ed.). México: Cengage
Learning.

Bologna, E. (2018). Métodos estadísticos de investigación. Argentina: Editorial Brujas.

Llinás, H. (2017). Estadística Inferencial. Barranquilla. Colombia: Universidad del Norte.

Obando, J. y Arango, N. (2019). Probabilidad y estadística. Colombia: Fondo Editorial EIA.

Rodríguez, J. y Rodríguez, E. (2016). Estadística para administración (2a. ed.). México: Grupo Editorial Patria.

Sesión 3 25

También podría gustarte