Está en la página 1de 66

Dirección de Educación a Distancia

Apartado Postal, 1874, San Salvador, El Salvador


Tel: 2251-8200 ext: 1743
Sumario

13. Muestreo y distribuciones muestrales .................................................. 5


13.1 Diseños muestrales ........................................................................ 5
13.1.1 Tipos de muestreo aleatorio .......................................................... 7
13.2 Distribuciones muestrales .............................................................. 13
13.2.1 Error de muestreo ..................................................................... 13
13.2.3 Distribución muestral de proporciones .......................................... 16
13.3 Teorema del límite central ............................................................. 18
13.3.1 Aplicación del teorema del límite central para distribuciones muestrales
de medias ....................................................................................... 23
13.3.2 Aplicación del teorema del límite central para distribuciones muestrales
de proporciones ............................................................................... 24
14. Estimación estadística .................................................................... 26
14.1 Tipos de estimación ...................................................................... 27
14.2 Estimación puntual ....................................................................... 28
14.3 Estimación por intervalo ................................................................ 30
14.3.1 Intervalos de confianza para estimar medias poblacionales .............. 31
14.3.2 Intervalos de confianza para estimar proporciones poblacionales....... 38
14.4 Elección del tamaño de una muestra ............................................... 41
14.4.1 Tamaño de la muestra para estimar una media poblacional .............. 41
14.4.2 Tamaño de la muestra para estimar una proporción poblacional ........ 43
15. Prueba de hipótesis ........................................................................ 46
15.1 Generalidades de la prueba de hipótesis .......................................... 47
15.1.1 Tipos de hipótesis ...................................................................... 47
15.1.2 Nivel de significancia de la prueba ................................................ 49
15.1.3 Tipos de errores en prueba de hipótesis ........................................ 49
15.1.4 Tipos de pruebas de hipótesis ...................................................... 50
15.1.5 Procedimiento para probar hipótesis ............................................. 50
15.2 Prueba de hipótesis referente a una media poblacional ....................... 51
15.3 Prueba de hipótesis referente a una proporción poblacional ................. 52
16. Muestreo pequeño ......................................................................... 55
16.1 La distribución t de Student ........................................................... 55
16.1.1 Propiedades matemáticas de la distribución t ................................. 58
16.1.2 Uso de la tabla t ........................................................................ 59
16.2 Intervalos de confianza para muestras pequeñas (𝜎 desconocida) ........ 60
16.3 Prueba de hipótesis para muestras pequeñas (𝜎 desconocida) ............. 61
Clase 13| Muestreo y
distribuciones muestrales
Las 13 clases que hemos estudiado hasta ahora nos han proporcionado los
conocimientos y competencias necesarias para entender la inferencia estadística
y cómo puede aplicarse en situaciones prácticas.

En la primera unidad abordamos el uso de la estadística descriptiva para realizar


caracterizaciones gráficas y numéricas para un conjunto de datos. En las
unidades II y III estudiamos probabilidad y distribuciones de probabilidad, que
son las bases de la inferencia estadística, rama de la estadística que se ocupa
del uso de los conceptos de probabilidad para manejar la incertidumbre en la
toma de decisiones y la predicción de sucesos futuros.

La inferencia estadística se encarga de tomar decisiones o realizar predicciones


acerca de parámetros, es decir, las medidas numéricas que caracterizan a una
población.

Los métodos para hacer inferencias acerca de parámetros poblacionales pueden


agruparse en dos categorías:

• Estimación: predecir o generalizar el valor del parámetro partiendo de


un estadístico.
• Prueba de hipótesis: tomar una decisión acerca del valor de un
parámetro, con base en alguna idea preconcebida acerca de cuál podría
ser su valor (Mendenhall, 2010).

Antes de abordar de lleno estos dos métodos, comenzaremos estudiando


algunos fundamentos de muestreo y distribuciones muestrales, tópicos
fundamentales para la comprensión de los procedimientos y pruebas de la
estadística inferencial.

4
13. Muestreo y distribuciones muestrales
Todo estudio estadístico está asociado a un conjunto de referencia llamado
población. Cuando las poblaciones son muy grandes o infinitas, una investigación
sobre la totalidad de sus individuos resulta prácticamente imposible, o al menos
impráctica. Por ello es un procedimiento muy usual analizar un subconjunto
representativo de la población (al cual se le denomina muestra), y a partir de la
información obtenida de la muestra, hacer inferencias o sacar conclusiones
respecto a la población de donde se obtuvo (Hernández, 2015).

Existen diversas razones prácticas para preferir el análisis de una muestra por
sobre el estudio de toda una población. A continuación, se presentan algunas de
esas razones:

• Establecer contacto con toda la población puede requerir mucho tiempo.


• El costo de estudiar la totalidad de elementos de una población puede ser
prohibitivo.
• Puede ser imposible verificar de manera física a todos los elementos de la
población.
• Algunas pruebas son de naturaleza destructiva.

13.1 Diseños muestrales


Los diseños muestrales pueden definirse como los distintos procedimientos
existentes para extraer muestras a partir de una población con el propósito de
conocer sus características promedio.

El proceso de muestreo se inicia definiendo el marco de muestreo; es decir,


una lista de elementos que conforman la población. Los marcos de muestreo son
fuentes de datos, por ejemplo: listas de población, directorios o mapas. Las
muestras se obtienen a partir de los marcos de muestreo. Si un marco excluye
a ciertas partes de la población, pueden obtenerse resultados sesgados o
imprecisos (Levine, 2014).

5
Después de seleccionar un marco, se debe obtener una muestra de este. Existen
2 métodos para seleccionar muestras:

• Muestreo no aleatorio o no probabilístico. La selección muestral se


realiza sin intervención de la aleatoriedad. Se emplea el conocimiento y
la opinión personal para identificar a los elementos de la población que
deben incluirse en la muestra.

• Muestreo aleatorio o probabilístico. Todos los elementos de la


población tienen la oportunidad de ser escogidos para la muestra. La
selección de los elementos de la población que deben incluirse en la
muestra depende del azar.

Un tipo común de muestreo no probabilístico es el muestreo deliberado o por


conveniencia, en el cual se seleccionan los elementos que son fáciles, poco
costosos o convenientes de obtener (Levine, 2014). Por ejemplo, si
seleccionamos neumáticos apilados en un almacén, sería más conveniente
obtener muestras de los neumáticos ubicados en la parte superior de una pila
que los ubicados en la parte inferior de la misma. Por la comodidad o facilidad
en tomar la muestra se sacrifica cierto grado de representatividad de las
características poblacionales.

Otro tipo de muestreo no probabilístico es el muestro de juicio en el cual se


obtienen las opiniones de expertos en la materia los cuales deciden quién estará
o no incluido en la muestra. Aunque es probable que los expertos estén bien
informados, no es posible generalizar sus resultados a la población (Levine,
2014).

El muestreo no probabilístico puede tener muchas ventajas, como la


conveniencia, la rapidez y el bajo costo; sin embargo, su falta de precisión
debido al sesgo de la selección y al hecho de que no es posible utilizar los
resultados para hacer inferencias estadísticas supera por mucho esas ventajas.

Siempre que sea posible, se deben utilizar métodos de muestreo probabilísticos.


Las muestras probabilísticas permiten hacer inferencias acerca de la población
de interés. Los cuatro tipos de muestreo probabilístico más utilizados son: el

6
muestreo aleatorio simple, el muestreo sistemático, el muestreo estratificados y
el muestreo por conglomerados (ver figura 51). Estos métodos de muestreo
varían en cuanto al costo, exactitud y complejidad (Levine, 2014).

Muestreo
Muestreo no deliberado
aleatorio o no
probabilistico Muestreo de
juicio

Muestreo
Tipos de
aleatorio
muestreo
simple

Muestreo
Muestreo sistemático
aleatorio o
probabilistico Muestreo
estratificado

Muestreo por
conglomerados

Figura 51. Tipos de muestreo. Fuente: Elaboración propia

13.1.1 Tipos de muestreo aleatorio


a) Muestreo aleatorio simple

En este tipo de muestreo aleatorio todos y cada uno de los elementos de la


población tienen igual probabilidad de ser incluidos en la muestra. Además, toda
muestra aleatoria de igual tamaño, tomada de una población dada, tiene la
misma probabilidad de ser tomada.

En este tipo de muestreo se utiliza 𝑛 para representar el tamaño de la muestra


y 𝑁 para representar el tamaño de la población.

7
Consideremos la siguiente situación: se tiene una población de cuatro
profesionales recién graduados de la ingeniería mecatrónica (𝑁 = 4) y se quieren
muestras de dos ingenieros a la vez (𝑛 = 2) para entrevistarlos. Existen 𝑁 𝐶𝑛

muestras posibles; es decir, en este caso habría 4 𝐶2 = 6 muestras posibles. Si


nombramos a los 4 profesionales como A, B, C y D, estas muestras son:

AB AC AD
BC BD CD

Cada una de estas muestras tiene 1/6 de probabilidad de ser escogida.

¿Cómo escoger una muestra aleatoria simple?

Uno de los métodos más sencillos consiste en enumerar todos los elementos de
la población, escribir los números en fichas o bolas, poner luego estos objetos
numerados en una caja, bolsa o urna y mezclarlos completamente. Finalmente,
se sacan, uno a uno, los 𝑛 objetos deseados (Bonilla, 2016).

Otro método, más técnico y confiable, consiste en usar números aleatorios. Estos
números pueden generarse mediante programas de computadora o mediante
una tabla de números aleatorios (la mayoría de los libros de estadística incluyen
una en sus apéndices).

La tabla 46 muestra un ejemplo de tabla de números aleatorios. Para aprender


a usar esta tabla, supongamos que hay 800 empleados en una compañía y desea
entrevistar una muestra de 10 de ellos escogidos al azar.

Podríamos obtener una muestra aleatoria al asignar a cada empleado un número


desde 000 a 799, consultando la tabla 46 y escogiendo un método sistemático
para seleccionar números de tres dígitos. En este caso, podríamos hacer lo
siguiente:

1. Elegir arbitrariamente un punto desde el cual comenzar a leer la tabla. Para


este caso usaremos la quinta columna y sexta fila.

8
Tabla 46: Tabla de números aleatorios

Fuente: Anderson (2008)

2. Recorrer de arriba hacia abajo los bloques de números de la tabla partiendo


del punto de inicio escogido en el paso anterior. Para este caso leeremos sólo
los primeros 3 dígitos en cada fila, es decir:

42048
38733
47327
82242
37636
49539

Los números escogidos son: 420, 387, 473, 376, 495, 439, 371, 110, 454 y 552.

9
Nótese que después del 473 sigue el 822, el cual no se tomó porque los
elementos de la población están numerados del 000 al 799. Si al estar leyendo
la tabla, apareciera un número repetido este también tendría que omitirse.

3. Si llegáramos hasta el final de la columna y aun no tenemos los 𝑛 elementos,


entonces podemos avanzar hasta la siguiente columna y seguir leyendo de arriba
hacia abajo.

b) Muestreo sistemático

A veces la población a ser muestreada está ordenada, por ejemplo, una lista
alfabetizada de personas con licencias de conducir, una lista de usuarios de la
compañía de energía eléctrica por direcciones de servicio o una lista de clientes
por números de cuenta. En estas y otras situaciones, se escoge un elemento al
azar de los primeros 𝑘 elementos y, a continuación, cada 𝑘-ésimo elemento de
ahí en adelante se incluye en la muestra.

Una muestra aleatoria sistemática involucra la selección aleatoria de uno de


los primeros 𝑘 elementos de una población ordenada y luego la selección
sistemática de cada 𝑘-ésimo elemento de ahí en adelante.

Inicialmente se separan los 𝑁 elementos de la población en 𝑛 grupos de 𝑘


elementos, donde:

𝑁
𝑘=
𝑛
𝑁
recibe el nombre de razón de muestreo. Si el resultado del cociente no es un
𝑛

entero, entonces debe redondearse al entero más cercano. Para seleccionar una
muestra sistemática, se elige al azar el primer elemento a ser seleccionado de
los primeros 𝑘 elementos de la población. Luego se seleccionan los 𝑛 − 1
elementos restantes eligiendo cada k-ésimo elemento sucesivo de la población.

Para seleccionar una muestra sistemática de 𝑛 = 40 elementos de una población


de 𝑁 = 800 empleados se divide la población de 800 en 40 grupos, cada uno con
𝑁 800
𝑘= 𝑛
= 40
= 20 empleados. Luego se selecciona un número al azar de los

primeros 20 individuos y se incluye cada vigésimo individuo después de la

10
primera selección en la muestra. Por ejemplo, si el primer número aleatorio que
se elige es 005, las selecciones siguientes serían 025, 045, 065, 085, 105, 125,
…, 765 y 785.

Cuando se utiliza el muestreo sistemático, existe la posibilidad de que resulten


sesgos graves de selección si existe un patrón en la población (Levine, 2014).
Para evitar la ineficiencia del muestreo aleatorio simple y el posible sesgo de
selección del muestreo sistemático, podemos utilizar los métodos de muestreo
estratificado o muestreo por conglomerados.

c) Muestreo estratificado

En el muestreo estratificado la población se divide en grupos homogéneos a


partir de alguna característica con el propósito de garantizar que cada grupo se
encuentre representado en la muestra. A los grupos también se les denomina
estratos. Por ejemplo, los estudiantes de UDB virtual se pueden agrupar por
carreras, genero, situación laboral, etc.

Una vez definidos los estratos, se aplica el muestreo aleatorio simple en cada
grupo o estrato con el fin de formar la muestra. La cantidad de elementos que
se toman de cada estrato debe ser correspondiente a la proporción de este en
relación con la población completa.

El muestreo por estratos puede ser más efectivo si se trata de poblaciones


heterogéneas. Al hacer la estratificación, los grupos se establecen de tal manera
que los elementos tiendan a ser uniformes en cada grupo, y los grupos tiendan
a ser diferentes entre sí (Bonilla, 2016).

d) Muestreo por conglomerados

En el siguiente video se presenta un ejemplo sobre cómo


distribuir la muestra entre los distintos grupos en un
muestreo estratificado.

Manuel Luque. (2 de mayo de 2020). PROBLEMA


MUESTREO ALEATORIO ESTRATIFICADO. [archivo de
video]. Recuperado de https://youtu.be/DkcYhbBK8HA

11
En el muestreo por conglomerados la población se divide en grupos o
conglomerados a partir de los límites naturales geográficos o de otra clase. A
continuación, se selecciona una muestra aleatoria de estos conglomerados,
asumiendo que cada uno de ellos es representativo de la población.

Considere el siguiente ejemplo: se está realizando una investigación de mercado


con la intención de determinar el número promedio de televisores por casa en
el municipio de Santa Tecla. Para hacer un muestreo por conglomerados
podríamos usar un mapa de la ciudad para dividir el territorio en colonias y luego
escoger cierto número de estas (conglomerados) para entrevistar a sus
habitantes.

Un procedimiento de muestreo por conglomerados bien diseñado puede producir


una muestra más precisa a un costo considerablemente menor que el de un
muestreo aleatorio simple. Para lograr los mejores resultados en un diseño
muestral por conglomerados, las diferencias entre ellos se hacen tan pequeñas
como sea posible; mientras que, las diferencias entre los elementos individuales
dentro de cada conglomerado se hacen tan grandes como sea posible. Lo ideal
sería que cada conglomerado fuera una miniatura de toda la población y, por
tanto, un solo conglomerado podría ser una muestra satisfactoria (Bonilla,
2016).

Tanto en el muestreo estratificado como en el de conglomerados, la población


se divide en grupos bien definidos. Usamos el muestreo estratificado cuando
cada grupo tiene una pequeña variación dentro de sí mismo, pero hay una amplia
variación de un grupo a otro. Usamos el muestreo por conglomerados en el caso
opuesto, cuando hay una variación considerable dentro de cada grupo, pero los
grupos son esencialmente similares entre sí (Levin, 2004).

12
13.2 Distribuciones muestrales
Cuando se selecciona una muestra aleatoria de una población, las medidas
numéricas descriptivas (media, varianza, desviación típica, etc.) que se calculen
de la muestra se denominan estadísticos. Si tomamos varias muestras
aleatorias de una población, los estadísticos resultantes para cada muestra no
necesariamente serán iguales, y lo más probable es que variarán de una muestra
a otra; es decir, estos estadísticos son variables aleatorias. Las distribuciones de
probabilidad para estadísticos se llaman distribuciones muestrales.

La distribución muestral de un estadístico es la


distribución de probabilidad para los posibles valores del
estadístico, que resulta cuando muestras aleatorias de
tamaño 𝑛 se sacan repetidamente de la población
(Mendenhall, 2010).

13.2.1 Error de muestreo


Las muestras se emplean habitualmente para determinar características de la
población (parámetros). Por ejemplo, con la media de una muestra se puede
inferir la media de la población; sin embargo, como la muestra es solo una
porción representativa de la población, es poco probable que su media sea
exactamente igual a la media poblacional. De igual forma, es poco probable que
la desviación típica de la muestra sea exactamente igual a la desviación típica
de la población. Por lo tanto, puede esperarse que exista una diferencia entre
un estadístico de la muestra y el parámetro de la población correspondiente.
Esta diferencia recibe el nombre de error de muestreo.

El error de muestreo es la diferencia entre el estadístico de


una muestra y el parámetro de la población correspondiente.

13
13.2.2 Distribución muestral de medias
Una distribución muestral de medias se define como el
conjunto de todas las medias que se pueden calcular en
todas las muestras posibles que se pueden extraer de una
determinada población (Bonilla, 2016).

𝑁
En una población finita de tamaño 𝑁, podemos tener ( 𝑛 ) muestras diferentes
𝑁
de un mismo tamaño 𝑛. Supongamos que ( 𝑛 ) = 𝑟, y que 𝑚1 , 𝑚2 , 𝑚3 , … , 𝑚𝑟 son

las 𝑟 muestras diferentes. Si ahora calculamos en cada muestra la media


muestra 𝑥̅ , obtendremos un conjunto de 𝑟 valores promedio {𝑥̅1 , 𝑥̅2 , 𝑥̅3 , … , 𝑥̅𝑟 }
respectivamente para cada muestra 𝑚1 , 𝑚2 , 𝑚3 , … , 𝑚𝑟 . A la distribución de este
conjunto de valores {𝑥̅1 , 𝑥̅2 , 𝑥̅3 , … , 𝑥̅𝑟 } se le llama distribución muestral de la
media.

Propiedades de la distribución

La distribución de los valores promedio 𝑥̅𝑖 , correspondientes a muestras de un


mismo tamaño 𝑛, extraídas de una población cualquiera con media 𝜇 y desviación
típica 𝜎, tiene las siguientes propiedades:

a) La media de todas las medias en las muestras 𝜇𝑥̅ es igual a la media de la


población 𝜇.

𝜇𝑥̅ = 𝜇

b) La desviación típica de todas las medias 𝜎𝑥̅ (la desviación típica de la


distribución muestral) recibe el nombre de error estándar de la media y se
define de la siguiente manera:

• En una población infinita (o muestreo con reemplazo)


𝜎
𝜎𝑥̅ =
√𝑛
• En una población finita (o muestreo sin reemplazo)

𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁 − 1

14
Observe que el error estándar de la media disminuye cuando 𝑛 aumenta.

𝑁−𝑛
Nota: a la expresión √ se le conoce como factor de corrección para
𝑁−1
poblaciones finitas.
Ejemplo. Una familia tiene 5 hijos, cuyas edades son: 16, 13, 10, 7 y 4 años,
respectivamente. Tome todas las muestras posibles de edades de tamaño 𝑛 = 2 y
verifique las propiedades de la distribución muestral de medias.

Solución
Tabla 47: Cálculos poblacionales Cálculos poblacionales
𝒙 (𝒙 − 𝝁) 𝟐
∑ 𝑥 50
4 36 𝜇= = = 10
𝑁 5
7 9
10 0 (𝑥 − 𝜇)2 90
13 9 𝜎=√ = √ = √18
𝑁 5
16 36
50 90
Fuente: Elaboración propia
Tabla 48: Cálculos en las muestras
Muestra ̅
𝒙 ̅ − 𝝁𝒙̅ )𝟐
(𝒙
Cálculos en las muestras
(4,7) 5.5 20.25
(4,10) 7.0 9 𝑟 = ( 52 ) = 10 → Número de muestras
(4,13) 8.5 2.25
(4,16) 10 0 ∑ 𝑥̅ 100
𝜇𝑥̅ = = = 10
(7,10) 8.5 2.25 𝑟 10
(7,13) 10 0
(𝑥̅ − 𝜇𝑥̅ )2 67.5
(7,16) 11.5 2.25 𝜎𝑥̅ = √ =√ = √6.75
2.25 𝑟 10
(10,13) 11.5
(10,16) 13 9
(13,16) 14.5 20.25
∑ 90 67.5
Fuente: Elaboración propia

Al utilizar los valores obtenidos podemos comprobar las propiedades de la


distribución:

1) 𝜇𝑥̅ = 𝜇 = 10

𝜎 𝑁−𝑛 √18 5−2


2) √ = √ = √6.75 = 𝜎𝑥̅
√𝑛 𝑁−1 √2 5−1

15
13.2.3 Distribución muestral de proporciones
El objetivo de muchas encuestas por muestreo es establecer la proporción (o
porcentaje) de individuos de una determinada población que poseen una
característica específica (Hernández, 2015). Por ejemplo, el porcentaje de
personas que votará en la próxima elección de alcaldes y diputados, la
proporción de individuos que estarían de acuerdo en que se aprobara el aborto
terapéutico, el porcentaje de artículos defectuosos producidos por cierta
máquina, etc.

Llamemos 𝑋 a la variable aleatoria del número de individuos de una población


que posee una característica determinada. Además, llamemos 𝑃 a la proporción
teórica poblacional de individuos que tienen dicha característica.

Si se toman todas las muestras posibles de un mismo tamaño 𝑛 y en cada


𝑥
muestra se cuenta el número 𝑥 de éxitos, entonces 𝑝̂ 𝑖 = sería la proporción de
𝑛

éxitos en una muestra específica (ver figura 52).

Figura 52. Distribución muestral de proporciones. Fuente: elaboración propia

La distribución de valores del conjunto resultante {𝑝̂1 , 𝑝̂ 2 , 𝑝̂ 3 , … , 𝑝̂𝑟 } se llama


distribución muestral de proporciones y sus propiedades son simétricas a las de
la distribución muestral de medias.

16
Al registrar los éxitos y los fracasos en una muestra de tamaño 𝑛, si escribimos
1 cuando se obtiene un éxito y 0 cuando se obtiene un fracaso, obtendríamos
una secuencia como la siguiente:

0, 1, 1, 1, 0, 1, 0, … , 0

La media aritmética de esta secuencia de valores sería:

∑ 𝑥 0 + 1 + 1 + 1 + 0 + 1 + 0 + ⋯ + 0 𝑥1
𝑥̅ = = =
𝑛 𝑛 𝑛

donde 𝑥1 es el número de éxitos en las 𝑛 observaciones. La media obtenida es


la proporción de éxitos en la muestra; por tanto, la distribución muestral de
proporciones es, en términos prácticos, una distribución muestral de medias.

Propiedades de la distribución

La distribución de los valores de proporción de éxito 𝑝̂ 𝑖 , correspondientes a


muestras de un mismo tamaño 𝑛, extraídas de una población binomial con
proporción de éxitos 𝑃, tiene las siguientes propiedades:

a) La media de todas las proporciones en las muestras 𝜇𝑝̂ es igual a la proporción

de la población 𝑃.

𝜇𝑝̂ = 𝑃

b) La desviación típica de todas las proporciones 𝜎𝑝̂ (la desviación típica de la

distribución muestral) recibe el nombre de error estándar de la proporción y


se define de la siguiente manera:

• En una población infinita (o muestreo con reemplazo)

𝑝̂ (1 − 𝑝̂ )
𝜎𝑝̂ = √
𝑛
• En una población finita (o muestreo sin reemplazo)

𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛
𝜎𝑥̅ = √ √
𝑛 𝑁−1

17
13.3 Teorema del límite central
El teorema del límite central es, probablemente, el más importante de toda la
estadística inferencial, pues asegura que toda distribución muestral se aproxima
a la normal al incrementarse el tamaño de la muestra, sin importar la forma de
la distribución de la población.

Suponga que se tira un dado balanceado 𝑛 = 1 vez. La variable aleatoria 𝑥 es el


número observado en la cara superior. Esta variable aleatoria conocida puede
tomar seis valores, cada uno con probabilidad 1/6 y su distribución de
probabilidad se muestra en la figura 53. La forma de la distribución es plana o
uniforme y simétrica alrededor de la media 𝜇 = 3.5, con una desviación estándar
𝜎 = 1.71.

Figura 53. Distribución de probabilidad en el lanzamiento de 𝑛 = 1 dado.


Fuente: por Mendenhall (2010)

Ahora, tomemos un tamaño de muestra 𝑛 = 2 de esta población; es decir,


tiramos dos veces el dado y registramos la suma de los números de las dos caras
superiores, ∑ 𝑥 = 𝑥1 + 𝑥2 . La figura 54 muestra los 36 posibles resultados, cada
uno con probabilidad 1/36. Las sumas están tabuladas y cada una de las posibles
sumas está dividida entre 𝑛 = 2 para obtener un promedio. El resultado es la
distribución muestral de 𝑥̅ que se ve en la figura 55. Observe la considerable

18
diferencia en la forma de la distribución muestral. Ahora tiene casi forma de
montículo, pero todavía es simétrica alrededor de la media 𝜇 = 3.5.

Figura 54. Sumas de las caras superiores de 𝑛 = 2 dados.


Fuente: por Mendenhall (2010)

Figura 55. Distribución muestral de 𝑥̅ para 𝑛 = 2 dados.


Fuente: por Mendenhall (2010)

Usando una herramienta de simulación por computadora, se generaron las


distribuciones muestrales de 𝑥̅ cuando 𝑛 = 3 y 𝑛 = 4. Para 𝑛 = 3, la distribución
muestral de la figura 56a muestra, con toda claridad, la forma de montículo de

19
la distribución normal, todavía centrada en 𝜇 = 3.5. La figura 56b muestra
espectacularmente que la distribución de 𝑥̅ es aproximadamente normal con
base en una muestra de sólo 𝑛 = 4. Este fenómeno es el resultado del teorema
del límite central.

Figura 56. Distribución muestral de 𝑥̅ para a) 𝑛 = 3 dados, b) 𝑛 = 4 dados.


Fuente: por Mendenhall (2010)

Teorema del límite central

A medida que el tamaño de la muestra se vuelve lo suficientemente grande, la


distribución muestral de la media se distribuye de manera aproximadamente
normal, sin importar la forma de la distribución de los valores individuales en la
población.

¿Qué tamaño de muestra es lo suficientemente grande? Se ha hecho una gran


cantidad de investigación estadística respecto a esto. Como regla general, los
expertos en estadística han encontrado que, para muchas distribuciones
poblacionales, cuando el tamaño de muestra es de al menos 30 (𝑛 ≥ 30), la
distribución muestral de la media es aproximadamente normal. Sin embargo, es
posible aplicar el teorema del límite central incluso para tamaños de muestra
más pequeños si la distribución poblacional tiene una forma aproximadamente
de campana (Levine, 2014).

20
En resumen, el teorema del límite central se cumple en las siguientes
condiciones:

a) Si las muestras se toman de una población con distribución normal,


entonces la distribución muestral de la media será también normal,
independientemente del tamaño de la muestra.
b) Si no se conoce la forma de la distribución de probabilidad de la población,
o si se sabe que no es normal, entonces es necesario que el tamaño de la
muestra sea de por lo menos 30 observaciones para garantizar que la
distribución muestral de la media sea aproximadamente normal.

En la figura 57 se ilustra la aplicación del teorema del límite central a diferentes


poblaciones para distintos tamaños de muestra (𝑛 = 2, 𝑛 = 6 𝑦 𝑛 = 30).

21
Figura 57. Aplicación del teorema del límite central para distintas poblaciones.
Fuente: por Lind (2012)

La importancia del teorema del límite central radica en el hecho que nos permite
usar estadísticos de muestra para hacer inferencias con respecto a los
parámetros de población, sin saber sobre la forma de la distribución de esa
población más que lo que podamos obtener de la muestra (Levin,2004).

22
13.3.1 Aplicación del teorema del límite central
para distribuciones muestrales de medias
En cualquier investigación, no es práctico obtener todas las medias muestrales;
sino que basta con tomar una sola muestra aleatoria de la población en estudio
y aplicar el teorema del límite central para realizar inferencias.

Teorema del límite central aplicado a una distribución muestral de medias

Si 𝑥̅ es la media de una muestra aleatoria de tamaño 𝑛 tomada de una población


con media 𝜇 y con desviación típica 𝜎, entonces la forma del límite de la
distribución

𝑥̅ − 𝜇
𝑍=
𝜎𝑥̅

a medida en que 𝑛 → ∞, es la distribución normal estándar.

El denominador de la expresión anterior 𝜎𝑥̅ recibe el nombre de error estándar


y se define así:

𝜎
𝜎𝑥̅ =
√𝑛
Cuando se trabaja con poblaciones finitas y, además, el tamaño de la muestra
𝑛
tomada representa al menos el 5% de la población (𝑁 ≥ 0.05) es preciso usar el

𝑁−𝑛
factor de corrección para poblaciones finitas √ 𝑁−1 de modo que el error estándar

estaría dado por:

𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁−1

23
Tabla 49: Condiciones para el cálculo del error estándar de la media

Para poblaciones infinitas Para poblaciones finitas de tamaño 𝑁

𝜎 𝑛 𝜎 𝑛 𝜎 𝑁−𝑛
𝜎𝑥̅ = Si < 0.05 → 𝜎𝑥̅ = Si ≥ 0.05 → 𝜎𝑥̅ = √
√𝑛 𝑁 √𝑛 𝑁 √𝑛 𝑁−1

Fuente: Elaboración propia

En el siguiente video se presentan algunos ejemplos de la


aplicación del teorema del límite central en el cálculo de
probabilidades asociadas con distribuciones muestrales de
medias.

Gonzalo Calderón. (4 de abril de 2020). TEOREMA DEL


LÍMITE CENTRAL. [archivo de video]. Recuperado de
https://drive.google.com/file/d/1Jhwu5dodidHOTyyhZT_6
RKIDxTSuBJEq/view?usp=sharing

13.3.2 Aplicación del teorema del límite central


para distribuciones muestrales de proporciones

Teorema del límite central aplicado a una distribución muestral de


proporciones

La distribución muestral de 𝑝̂ se aproximará a la distribución normal estándar,


haciendo

𝑝̂ − 𝑃
𝑍=
𝜎𝑝̂

siempre que el tamaño de la muestra sea grande.

24
En el caso de 𝑝̂ , se considera que el tamaño de la muestra es grande cuando se
cumplen las dos condiciones siguientes:

a) 𝑛𝑃 > 5
b) 𝑛(1 − 𝑃) > 5

En la expresión anterior, 𝑃 es la proporción poblacional y 𝜎𝑝̂ es el error

estándar, que para el caso de las proporciones, se define así:

𝑃𝑄
𝜎𝑝̂ = √
𝑛

Al igual que en el caso de la distribución muestral de medias, en la distribución


muestral de proporciones puede ser necesario aplicar el factor de corrección para
poblaciones finitas en los problemas en los que se conozca el tamaño de la
población 𝑁 a partir de la cual se obtuvo la muestra (ver tabla 50).
Tabla 50: Condiciones para el cálculo del error estándar de la proporción

Para poblaciones Para poblaciones finitas de tamaño 𝑁


infinitas

𝑛 𝑃𝑄 𝑁−𝑛
𝑃𝑄 𝑛 𝑃𝑄 Si ≥ 0.05 → 𝜎𝑝̂ = √ 𝑛 √ 𝑁−1
𝜎𝑝̂ = √ Si < 0.05 → 𝜎𝑝̂ = √ 𝑁
𝑛 𝑁 𝑛

Dónde:
𝑃 = Proporción poblacional 𝑄 =1−𝑃

Fuente: Elaboración propia

En el siguiente video se presenta un ejemplo sobre la


aplicación del teorema del límite central para proporciones

Guillermo Calderón. (19 de agosto de 2020). Teorema del


límite central para proporciones. [archivo de video].
Recuperado de https://youtu.be/jgmqU7NONi0

25
Clase 14| Estimación
Estadística
14. Estimación estadística
En la clase anterior se abordaron las distintas estrategias con las que puede
seleccionarse una muestra a partir de una población para luego calcular medias,
desviaciones típicas y otros estadísticos muestrales. Estos estadísticos son las
herramientas que se usarán en estadística inferencial para hacer
generalizaciones acerca de una población usando la información contenida en
una muestra.

Hasta este punto debemos estar bien conscientes de que las poblaciones son
generalmente muy grandes como para ser estudiadas en su totalidad. Esto
requiere que se seleccionen muestras que nos permitan obtener información
(estadísticos) que se pueda utilizar más adelante para hacer inferencias sobre
las poblaciones (ver figura 58).

Figura 58. La estimación de parámetros en el proceso estadístico.


Fuente: Elaboración propia

26
La estimación estadística es un proceso que consiste en
usar un estadístico muestral para predecir o generalizar el
correspondiente parámetro poblacional desconocido.

En el proceso de estimación, el estadístico estima al parámetro, tal y como se


muestra en la tabla 51.

Tabla 51: Simbología usada para estadísticos y parámetros en la estimación

Característica Estadístico Parámetro Error de estimación


(estimador)

Media 𝑥̅ 𝜇 | 𝑥̅ − 𝜇 |

Desviación típica 𝑠 𝜎 |𝑠−𝜎|

Proporción 𝑝̂ 𝑃 | 𝑝̂ − 𝑃 |

En general 𝜃̂ 𝜃 | 𝜃̂ − 𝜃 |

Fuente: Elaboración propia

Nota: se acostumbra a poner un acento circunflejo (^) sobre el símbolo del


parámetro, para denotar al estimador.

14.1 Tipos de estimación


La estimación de un parámetro poblacional 𝜃 se puede realizar de dos formas:

• Estimación puntual. Con base en datos muestrales, se calcula un solo


número 𝜃̂ para estimar el parámetro poblacional 𝜃.
• Estimación por intervalo. Consiste en calcular un intervalo de valores
dentro del cual se esperaría encontrar el verdadero valor del parámetro.

Los procedimientos de estimación tanto puntuales como de intervalo usan


información dada por la distribución muestral del estimador específico que se
haya escogido para usarse (Mendenhall, 2010).

27
14.2 Estimación puntual
Para que un estadístico sea considerado un “buen estimador” puntual del
parámetro que va a estimar, debe cumplir con tres características:

a) Estimador insesgado. 𝜃̂ es un estimador insesgado de 𝜃, si su esperanza


matemática es igual al parámetro que se está estimando; es decir, si
𝐸[𝜃̂] = 𝜃. Esta condición garantiza que la distribución muestral del
estimador puntual esté centrada sobre el valor del parámetro a ser
estimado; es decir, el estimador 𝜃̂ no debe subestimar o sobreestimar al
parámetro de interés 𝜃.0

Las distribuciones muestrales para un estimador insesgado y estimador sesgado


se ven en la figura 59. La distribución muestral para el estimador sesgado está
corrida a la derecha del verdadero valor del parámetro. Este estimador sesgado
es más probable que uno insesgado para sobreestimar el valor del parámetro
(Mendenhall, 2010).

Figura 59. Distribuciones para estimadores sesgados e insesgados.


Fuente: por Mendenhall (2010)

b) Estimador eficiente. La dispersión (medida por la varianza) de la


distribución muestral debe ser tan pequeña como sea posible. Esto
asegura que, con una alta probabilidad, una estimación individual caerá
cerca del valor verdadero del parámetro (Mendenhall, 2010).

28
En la figura 60 se muestra la distribución muestral de dos estimadores: uno con
una varianza pequeña y el otro con una varianza significativamente más alta.

Figura 60. Comparación de la variabilidad de un estimador.


Fuente: por Mendenhall (2010)

c) Estimador consistente. 𝜃̂ es un estimador consistente de 𝜃, si su


varianza disminuye al aumentar el tamaño de la muestra. Esta condición
garantiza que el error en la estimación disminuya en la medida en que
aumenta el tamaño de la muestra.

En las distribuciones de muestreo de la media y de la proporción, tenemos dos


ejemplos de estimadores que cumplen con las características mencionadas.

Si 𝑥̅ es la media de una muestra grande de tamaño 𝑛, y se utiliza como


estimador puntual de la media poblacional 𝜇, entonces:

• De 𝐸[ 𝑥̅ ] = 𝜇 se concluye que 𝑥̅ es un estimador insesgado de 𝜇.


𝜎2
• De 𝑉𝑎𝑟(𝑥̅ ) = 𝑛
deducimos que 𝑥̅ es consistente, ya que la varianza del

estimador disminuye al aumentar el tamaño de la muestra.

Conclusión: 𝑥̅ es un buen estimador puntual del parámetro 𝜇.


𝑥
De manera similar podemos proceder en la proporción muestral de éxitos 𝑝̂ = 𝑛

utilizada para estimar el parámetro binomial 𝑃.

𝑥 1 1
• 𝐸[ ̂𝑝 ] = 𝐸 [𝑛] = 𝑛 𝐸[𝑥] = 𝑛 (𝑛𝑃) = 𝑃 , 𝑝̂ es un estimador insesgado de 𝑃.

29
𝑥 1 𝑛𝑃𝑄 𝑃𝑄
• 𝑉𝑎𝑟(𝑝̂ ) = 𝑉𝑎𝑟 ( ) = 𝑉𝑎𝑟(𝑥) = = , 𝑝̂ es un estimador consistente ya
𝑛 𝑛2 𝑛2 𝑛

que su varianza disminuye al aumentar el tamaño de la muestra 𝑛.

Conclusión: 𝑝̂ es un buen estimador puntual del parámetro 𝑃.

Ejemplo. Una variable aleatoria X sigue una ley normal con 𝜎 = 1.2 y media 𝜇
desconocida. Si las observaciones: 6.1, 7.2, 8.4, 7.6, 5.6, 7.8, 6.3, 9.1, 7.1, 8.8
constituyen una muestra aleatoria de esa población, encuentre un estimador
puntual para 𝜇.

Solución

La media de la muestra es:


∑ 𝑥 6.1 + 7.2 + 8.4 + 7.6 + 5.6 + 7.8 + 6.3 + 9.1 + 7.1 + 8.8 74
𝑥̅ = = = = 7.4
𝑛 10 10
De acuerdo con lo que hemos señalado, 𝑥̅ es el mejor estimador puntual de 𝜇 que
podemos tener, por tanto:

𝜇 = 𝑥̅ = 7.4 es nuestra estimación puntual

El error estándar de la media es:


𝜎 1.2
𝜎𝑥̅ = = = 0.38
√𝑛 √10
Si hubiéramos tenido 100 observaciones en lugar de 10, el error estándar se
1.2
reduciría a 𝜎𝑥̅ = = 0.12 y la estimación de 𝜇 mediante 𝑥̅ hubiese sido mucho
√100

más precisa y confiable.

14.3 Estimación por intervalo


La estimación de un parámetro a través de un único valor (𝑃 mediante 𝑝̂ o 𝜇
mediante 𝑥̅ ) tiene la desventaja de no disponer de un indicador que señale el
grado de confianza de la estimación (Hernández, 2015).

30
Un procedimiento alternativo de estimación consiste en calcular un intervalo
dentro del cual, considerando cierto riesgo, se esperaría encontrar el verdadero
valor del parámetro.

Si 𝜃 es el parámetro que se va a estimar, el riesgo es la probabilidad de que el


intervalo no contenga ese parámetro. El riesgo se denota por la letra griega 𝛼 y
sus valores usuales son: 1%, 5% y 10%.

La probabilidad complementaria (1 − 𝛼) se llama nivel de confianza del


intervalo y representa la probabilidad de que el intervalo contenga el parámetro
desconocido. Los límites del intervalo, 𝐿1 y 𝐿2 , se denominan límites de
confianza y el intervalo entre los límites, [𝐿1 , 𝐿2 ] , se llama intervalo de
confianza.

De acuerdo con lo anterior, tenemos que:

𝑃(𝐿1 ≤ 𝜃 ≤ 𝐿2 ) = 1 − 𝛼

Por ejemplo, cuando trabajamos con un nivel de confianza del 90% (1 − 𝛼 = 0.90),
esperamos, con un 90% de probabilidad, que el intervalo construido contenga
el verdadero valor del parámetro, y asumimos un riesgo del 10% de que no lo
contenga.

14.3.1 Intervalos de confianza para estimar


medias poblacionales
En el caso de un intervalo de confianza para estimar 𝜇, mediante una muestra
de tamaño grande de tamaño 𝑛 (𝑛 ≥ 30), podemos asociar el siguiente esquema:

31
Figura 61. Límites de confianza para estimar 𝜇.
Fuente: Elaboración propia.

Por el teorema del límite central sabemos que 𝑥̅ es aproximadamente normal


𝜎 𝑥̅ −𝜇
𝑁 (𝜇, ) y, en consecuencia, 𝑍 = 𝜎 es 𝑁(0,1).
√𝑛
√𝑛

Si estandarizamos los límites 𝐿1 y 𝐿2 , obtenemos:

𝑃 (−𝑍𝛼 ≤ 𝑍 ≤ 𝑍𝛼 ) = 1 − 𝛼
2 2

𝑥̅ − 𝜇
𝑃 (−𝑍𝛼 ≤ 𝜎 ≤ 𝑍𝛼2 ) = 1 − 𝛼
2
√𝑛

Al aislar el parámetro 𝜇, en el centro de la desigualdad, tenemos:

𝜎 𝜎
𝑃 (𝑥̅ − 𝑍𝛼 ≤ 𝜇 ≤ 𝑥̅ + 𝑍𝛼 )= 1−𝛼
2 √𝑛 2 √𝑛

En síntesis, la fórmula para calcular un intervalo de confianza para estimar 𝜇 con


un nivel de confianza de (1 − 𝛼) es:

𝜎
𝜇: 𝑥̅ ± 𝑍𝛼 ( )
2 √𝑛

32
El valor de 𝑍𝛼 depende exclusivamente del nivel de confianza con el que se esté
2

trabajando. En la tabla 52 se muestra el detalle del cálculo de 𝑍𝛼 para los tres


2

niveles de confianza más usuales: 90%, 95% y 99%.

Tabla 52: 𝑍𝛼 para los niveles de confianza más usuales


2

Nivel de confianza: 90% Nivel de confianza: 95% Nivel de confianza: 99%

Fuente: Elaboración propia

Para obtener los valores mostrados en la tabla 52, debemos dividir entre 2 el
nivel de confianza y luego buscar en la tabla normal el valor de 𝑍 que le
corresponde a esa área.
𝜎
Recordemos que 𝜎𝑥̅ = es el error estándar de la media y depende
√𝑛

exclusivamente de la distribución muestral y no del nivel de confianza del


intervalo que se está calculando.

Al multiplicar el error estándar 𝜎𝑥̅ por el 𝑍𝛼 , obtenemos el error muestral 𝐸.


2

𝜎
𝐸 = 𝑍𝛼 𝜎𝑥̅ = 𝑍𝛼
2 2 √𝑛
En la medida en que se aumenta el nivel de confianza, se aumenta también el
valor de 𝑍𝛼 y por tanto también el error muestral. Esto hace que el intervalo
2

tenga un rango más amplio y que, en consecuencia, exista una mayor


probabilidad de que el intervalo contenga al parámetro 𝜇.

Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99%,
en todos los problemas sobre estimaciones. Después de todo, parece ser que un

33
alto nivel de confianza significa un alto grado de precisión en lo que a la
estimación concierne. En la práctica, sin embargo, altos niveles de confianza
producen intervalos de confianza grandes, y éstos, de hecho, dan estimaciones
bastante imprecisas (Levin, 2004).

En resumen, tenemos:

𝜎
𝜎𝑥̅ = 𝐸𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 =
√𝑛
𝜎
𝐸 = 𝐸𝑟𝑟𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑍𝛼 ( )
2 √𝑛
𝜎 𝜎
𝜇 = [ 𝑥 − 𝑍𝛼 ( ) , 𝑥̅ + 𝑍𝛼 ( )]
2 √𝑛 2 √𝑛

A continuación, se presentan 3 ejemplos del cálculo de intervalos de confianza


en los que se pretenden abarcar las diferentes variantes existentes en el cálculo
de intervalos de confianza para estimar 𝜇.

CASO I. Desviación típica poblacional 𝝈 conocida

Cuando se conoce el valor de 𝜎 (por registros históricos o especificaciones de


𝜎
fabricantes) emplearemos siempre la expresión 𝜎𝑥̅ = sin importar el tamaño
√𝑛

de la muestra.

Ejemplo. La concentración promedio de zinc que se obtiene de una muestra de


36 sitios diferentes de un rio es de 2.6 gramos por mililitro. Si se sabe que la
desviación estándar de la concentración media del rio es de 0.3 gramos por
mililitro.

a) Calcule una estimación puntual para la concentración promedio de zinc en el


rio.

b) Calcule los intervalos de confianza del 95% y del 99% para estimar la
concentración de zinc en el rio

Solución

Datos: 𝑥̅ = 2.6 𝑔𝑟/𝑚𝑙 , 𝜎 = 0.3 𝑔𝑟/𝑚𝑙 , 𝑛 = 36

34
Una primera observación importante es que el enunciado del problema NO indica
que la desviación típica se haya obtenido a partir de la muestra; por tanto,
debemos asumir que se trata de una desviación típica poblacional 𝜎.

a) Sabemos que 𝑥̅ es el mejor estimador puntual para 𝜇, por lo tanto, para


determinar una estimación puntual de la concentración promedio de zinc en el rio,
simplemente debemos hacer:

𝜇 = 𝑥̅ = 2.6 𝑔𝑟/𝑚𝑙

b) Nivel de confianza de 95%

Cálculo del intervalo

𝜎
𝜇 = 𝑥 ± 𝑍𝛼 ( )
2 √𝑛
0.3
𝜇 = 2.6 ± 1.96 ( )
√36
0.3 0.3
𝜇 = [2.6 − 1.96 ( ) , 2.6 + 1.96 ( )]
Figura 62. Cálculo de 𝑍𝛼 . √36 √36
2
Fuente: Elaboración propia. 𝜇 ∈ [ 2.502, 2.698 ] 𝑔𝑟/𝑚𝑙

Nivel de confianza del 99%

Cálculo del intervalo

𝜎
𝜇 = 𝑥 ± 𝑍𝛼 ( )
2 √𝑛
0.3
𝜇 = 2.6 ± 2.575 ( )
√36
0.3 0.3
𝜇 = [2.6 − 2.575 ( ) , 2.6 + 2.575 ( )]
Figura 63. Cálculo de 𝑍𝛼 . √36 √36
2
Fuente: Elaboración propia. 𝜇 ∈ [ 2.4713, 2.7288 ] 𝑔𝑟/𝑚𝑙

35
En el ejemplo anterior puede observarse que, al aumentar el nivel de confianza
también aumenta la amplitud del intervalo.

CASO II. Desviación típica poblacional 𝝈 desconocida

Cuando no se conoce la desviación típica poblacional 𝜎 puede ocurrir cualquiera


de las siguientes situaciones:

a) Si se tiene una muestra grande (𝑛 ≥ 30)

En esta situación, el teorema del límite central nos habilita para usar 𝑠 como un
estimador puntual de 𝜎; es decir, podemos hacer:

∑(𝑥𝑖 − 𝑥̅ )2
𝜎=𝑠=√
𝑛−1

b) Si se tiene una muestra pequeña (𝑛 < 30)

En este caso no podremos realizar la estimación puntual 𝜎 = 𝑠 y 𝑥̅ ya no


obedecería a la distribución normal sino a la distribución 𝑡 de student (esta
distribución se abordará en la clase 16).

Ejemplo. Para estimar el tiempo promedio que emplea al montar cierto tipo de
componente de computadora, un ingeniero industrial de una compañía electrónica
midió el tiempo de montaje a 40 técnicos. La media que obtuvo fue de 12.73
minutos y una desviación estándar de 2.06 minutos.

a) Calcular el error estándar de la media


b) Hallar un intervalo de confianza del 90% para la media poblacional

Solución

Datos: 𝑥̅ = 12.73 𝑚𝑖𝑛 , 𝑠 = 2.06 𝑚𝑖𝑛 , 𝑛 = 40

El enunciado del ejercicio nos proporciona la desviación típica muestral 𝑠; sin


embargo, como estamos trabajando con una muestra grande, podemos usar 𝑠
como un estimador puntual de 𝜎. Por tanto:

𝜎 = 𝑠 = 2.06 min → ya que 𝑛 ≥ 30

𝜎 2.06
a) 𝜎𝑥̅ = = = 0.3257
√𝑛 √40

36
b) Nivel de confianza de 90%

Cálculo del intervalo

𝜎
𝜇 = 𝑥 ± 𝑍𝛼 ( )
2 √𝑛
2.06
𝜇 = 12.73 ± 1.645 ( )
√40
[12.73 − 0.5358, 12.73 + 0.5358]
Figura 63. Cálculo de 𝑍𝛼 .
2
𝜇 ∈ [ 12.1942, 13.2658 ] 𝑚𝑖𝑛
Fuente: Elaboración propia.

CASO III. Población finita


𝑛
Cuando se conoce el tamaño de la población 𝑁 y además 𝑁
≥ 0.05, entonces es

necesario multiplicar el error estándar por el factor de corrección para


poblaciones finitas, tal y como vimos en la clase anterior.

𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁−1

En el siguiente video se presenta un ejemplo sobre cómo


calcular intervalos de confianza usando el factor de
corrección para poblaciones finitas.

Guillermo Calderón. (19 de agosto de 2020). Intervalos de


confianza para estimar medias poblacionales. [archivo de
video]. Recuperado de https://youtu.be/9gxTITRNFLg

37
14.3.2 Intervalos de confianza para estimar
proporciones poblacionales
De acuerdo con la distribución
muestral para proporciones

𝑝̂ − 𝑃
𝑍=
√𝑃𝑄
𝑛

se distribuye de manera
aproximadamente normal
estándar cuando el tamaño de la Figura 64. Límites de confianza para estimar 𝑃.
muestra 𝑛 es grande. Fuente: Elaboración propia

Como no se conoce el valor del parámetro 𝑃, entonces debe usarse el estimador


𝑝̂ en la expresión anterior.

El procedimiento para determinar una expresión de intervalo de confianza para


𝑃, con un nivel de confianza (1 − 𝛼), es similar al que seguimos para la media 𝜇.

Al estandarizar los límites 𝐿1 y 𝐿2 de la figura 64, se obtiene:

𝑃 (−𝑍𝛼 ≤ 𝑍 ≤ 𝑍𝛼 ) = 1 − 𝛼
2 2

𝑝̂ − 𝑃
𝑃 −𝑍𝛼 ≤ ≤ 𝑍𝛼 =1−𝛼
√𝑝̂ 𝑞̂
2 2
( 𝑛 )

Al aislar el parámetro 𝑃, en el centro de la desigualdad, se tiene:

𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝑃 (𝑝̂ − 𝑍𝛼 √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍𝛼 √ ) = 1 − 𝛼
2 𝑛 2 𝑛

En síntesis, la fórmula para calcular un intervalo de confianza para estimar 𝑃 con


un nivel de confianza de (1 − 𝛼) es:

̂ 𝑞̂
𝑝
𝑃: 𝑝̂ ± 𝑍𝛼 √
2 𝑛
38
𝑝̂ 𝑞̂
Recordemos que 𝜎𝑝̂ = √ es el error estándar de la proporción y depende
𝑛

exclusivamente de la distribución muestral y no del nivel de confianza del


intervalo que se está calculando.
𝑛
Cuando se conoce el tamaño de la población 𝑁 y además 𝑁
≥ 0.05, entonces es

necesario multiplicar el error estándar por el factor de corrección para


poblaciones finitas, tal y como lo hicimos en los intervalos de confianza para
estimar 𝜇.

̂ 𝑞̂
𝑝 𝑁−𝑛
𝜎𝑝̂ = √ √
𝑛 𝑁−1

Al multiplicar el error estándar 𝜎𝑝̂ por el 𝑍𝛼 , obtenemos el error muestral 𝐸.


2

𝑝̂ 𝑞̂
𝐸 = 𝑍𝛼 𝜎𝑝̂ = 𝑍𝛼 √
2 2 𝑛

Ejemplo. Los resultados de una prueba de matemáticas, aplicada a una muestra


de 400 bachilleres recién graduados, mostró que 43% no podía despejar
correctamente una variable específica de una fórmula dada.

a) Determine la estimación puntual de la proporción de recién graduados de


bachillerato que no saben despejar una variable.

b) Hallar un intervalo de confianza del 93% para la proporción de la población de


bachilleres que no saben despejar una variable.

c) ¿Cuál es el margen de error asociado con la estimación en b)?

Solución

Datos: 𝑝̂ = 0.43 , 𝑞̂ = 1 − 𝑝̂ = 0.57 , 𝑛 = 400

a) Sabemos que 𝑝̂ es el mejor estimador puntual para 𝑃, por lo tanto, para


determinar una estimación puntual de la proporción de bachilleres recién
graduados que no saben despejar una variable, simplemente debemos hacer:

39
𝑃 = 𝑝̂ = 0.43

b) Intervalo de confianza del 93%

Cálculo del intervalo

̂ 𝑞̂
𝑝
𝑃 = 𝑝̂ ± 𝑍𝛼 √
2 𝑛

(0.43)(0.57)
𝑃 = 0.43 ± 1.81 √
Figura 65. Cálculo de 𝑧𝛼 .
400
2
Fuente: Elaboración propia. 𝑃 = [0.43 − 0.0448, 0.43 + 0.0480]

P ∈ [ 0.3852, 0.4748 ]

c) El error muestral es:

𝑝̂ 𝑞̂ (0.43)(0.57)
𝐸 = 𝑍𝛼 √ = 1.81 √ = 0.0448 ≅ 4.5%
2 𝑛 400

En el siguiente video se presenta un ejemplo del cálculo de


un intervalo de confianza para estimar proporciones
poblacionales.

Guillermo Calderón. (19 de agosto de 2020). Intervalos de


confianza para estimar proporciones poblacionales.
[archivo de video]. Recuperado de
https://youtu.be/anFopLvhXhc

40
14.4 Elección del tamaño de una muestra
Antes de llevar a cabo una investigación por muestreo, el investigador debe
conocer el tamaño de la muestra con la cual trabajará. La elección del tamaño
de la muestra es un procedimiento muy importante puesto que el uso de una
muestra demasiado grande implica costos elevados y no siempre aportará mayor
exactitud en los resultados; por otra parte, el tamaño de la muestra es
demasiado pequeño se puede llegar a resultados no válidos o poco significativos.

En general, la elección del tamaño adecuado de una muestra dependerá de los


siguientes factores técnicos:

1. El margen de error máximo (error muestral) que tolerará el investigador.


2. El nivel de confianza deseado.
3. La variabilidad o dispersión de la población en estudio.

El margen de error que un investigador puede tolerar depende de qué tan crítico
es el parámetro que se está estimando. Algunas tareas extremadamente
delicadas requieren de resultados exactos: los procedimientos médicos vitales
de los cuales dependen vidas humanas, o la producción de piezas de una
máquina que deba cumplir medidas precisas, pueden tolerar sólo un pequeño
error. En otros casos, los errores más grandes pueden tener consecuencias
menos graves (Webster, 2001).

14.4.1 Tamaño de la muestra para estimar una


media poblacional
El error muestral en el cálculo de un intervalo para estimar 𝜇 con un nivel de
confianza de (1 − 𝛼) es:

𝜎
𝐸 = 𝑍𝛼 ( )
2 √𝑛

41
Al despejar 𝑛 de esta expresión, se obtiene:

2
𝑍𝛼 𝜎
2
𝑛=( )
𝐸

Si el resultado de este cálculo no es un número entero, entonces debe


redondearse al entero inmediato superior.

En la expresión anterior, 𝐸 es el error máximo que el investigador está dispuesto


a aceptar (error muestral) y el valor de 𝑧𝛼 depende exclusivamente del nivel de
2

confianza que se va a usar para calcular la estimación por intervalo. Nótese que
para usar esta ecuación es necesario contar con el valor de la desviación
estándar poblacional 𝜎 (de registros históricos); sin embargo, cuando este valor
no se conozca, puede estimarse mediante la desviación estándar muestral 𝑠,
utilizando una muestra piloto de cualquier tamaño razonable (𝑛 ≥ 30).

En el caso de una población finita de tamaño 𝑁, el error muestral incluye al


factor de corrección, así:

𝜎 𝑁−𝑛
𝐸 = 𝑍𝛼 √
2 √𝑛 𝑁−1

Despejemos 𝑛 de esta expresión:

𝜎2 𝑁 − 𝑛 Elevando al cuadrado ambos términos


𝐸2 = 𝑍2 ( )
𝑛 𝑁−1

𝐸 2 𝑛(𝑁 − 1) = 𝑍 2 𝜎 2 (𝑁 − 𝑛)
𝐸 2 𝑛(𝑁 − 1) = 𝑍 2 𝜎 2 𝑁 − 𝑍 2 𝜎 2 𝑛
Distribuyendo el producto del miembro
𝐸 2 𝑛(𝑁 − 1) + 𝑍 2 𝜎 2 𝑛 = 𝑍 2 𝜎 2 𝑁 derecho
𝑛[𝐸 2 (𝑁 − 1) + 𝑍 2 𝜎 2 ] = 𝑍 2 𝜎 2 𝑁 Factor común 𝑛 en el miembro izquierdo

𝑍2𝜎2𝑁
𝑛= 2
𝐸 (𝑁 − 1) + 𝑍 2 𝜎 2

42
Ejemplo. Se quiere estimar mediante muestreo el kilometraje promedio de los
vehículos en uso de varios ministerios públicos. De registros anteriores se ha
obtenido que un estimador aceptable de la desviación estándar de la población es
de 8600 kilómetros. Se desea que el error de la estimación no sea mayor de 1200
kilómetros para un nivel de confianza del 90%.

a) Determinar el tamaño de la muestra apropiado

b) Determinar el tamaño de la muestra si sabemos que la población es de 930


vehículos

Solución

Datos: 𝜎 = 8600 𝑘𝑚 , 𝐸 = 1200 𝑘𝑚 , (1 − 𝛼) = 0.90

a) Para un nivel de confianza del 90% el valor de 𝑍𝛼 que debe usarse es 1.645
2

(ver tabla 52), por lo tanto:

𝑍𝛼 𝜎 2 1.645 × 8600 2
𝑛=( 2 ) =( ) = 138.98 ≅ 139
𝐸 1200

b) Con 𝑁 = 930, se tiene:

𝑍2𝜎 2𝑁 (1.645)2 (8600)2 (930)


𝑛= = = 121.02 ≅ 122
𝐸 2 (𝑁 − 1) + 𝑍 2 𝜎 2 12002 (930 − 1) + (1.645)2 (8600)2

Nótese que al conocer el tamaño de la población 𝑁, el tamaño de la muestra 𝑛


disminuye (manteniendo constantes los otros datos). Piense cómo cambiaría el
tamaño de la muestra 𝑛 al aumentar el nivel de confianza al 95% o al reducir el
error muestral a 1000 kilómetros.

14.4.2 Tamaño de la muestra para estimar una


proporción poblacional
Partimos de la expresión del error muestral que usamos para calcular intervalos
de confianza para estimar proporciones poblacionales:

43
𝑝̂ 𝑞̂
𝐸 = 𝑍𝛼 √
2 𝑛

Al despejar el tamaño de la muestra 𝑛, se obtiene:

𝑍 2 𝑝̂ 𝑞̂
𝑛=
𝐸2

Esta fórmula requiere el valor de los estimadores 𝑝̂ y 𝑞̂. Si no se dispone de estos


valores, pueden obtenerse mediante una muestra piloto. Si no fuera posible
realizar un muestreo piloto, entonces se puede asumir que 𝑝̂ = 0.5 y
𝑞̂ = 1 − 𝑝̂ = 0.5; con esto se asegura el máximo tamaño de la muestra, ya que el
producto 𝑝̂ × 𝑞̂ alcanza su valor máximo cuando 𝑝̂ y 𝑞̂ valen 0.5.

En el caso de una población finita de tamaño 𝑁, el error muestral incluye al


factor de corrección, así:

𝑝̂ 𝑞̂ 𝑁 − 𝑛
𝐸 = 𝑍𝛼 √ √
2 𝑛 𝑁−1

Despejemos 𝑛 de esta expresión:

𝑝̂ 𝑞̂ 𝑁−𝑛 Elevando al cuadrado ambos términos


𝐸2 = 𝑍2 ( )( )
𝑛 𝑁−1

𝐸 2 𝑛(𝑁 − 1) = 𝑍 2 (𝑝̂ 𝑞̂)(𝑁 − 𝑛)


𝐸 2 𝑛(𝑁 − 1) = 𝑍 2 𝑝̂ 𝑞̂ 𝑁 − 𝑍 2 𝑝̂ 𝑞̂ 𝑛 Distribuyendo el producto del miembro derecho
2 2 2
𝐸 𝑛(𝑁 − 1) + 𝑍 𝑝̂ 𝑞̂ 𝑛 = 𝑍 𝑝̂ 𝑞̂ 𝑁
𝑛[𝐸 2 (𝑁 − 1) + 𝑍 2 𝑝̂ 𝑞̂] = 𝑍 2 𝑝̂ 𝑞̂ 𝑁 Factor común 𝑛 en el miembro izquierdo

𝑍 2 𝑝̂ 𝑞̂ 𝑁
𝑛=
𝐸 2 (𝑁 − 1) + 𝑍 2 𝑝̂ 𝑞̂

44
Ejemplo. Un ingeniero industrial labora en el departamento de control de calidad
de una empresa y está interesado en saber el porcentaje de artículos defectuosos
de la producción mensual de la empresa. Para ello decide tomar una muestra
aleatoria de la producción mensual de artículos de tal manera que el error de
estimación no sea mayor del 4% con una probabilidad del 95%. Determine cuál
debe ser el tamaño de la muestra, si:

a) No se dispone de ninguna información.

b) Se sabe que la proporción de artículos defectuosos de los meses anteriores ha


sido del 12%.

c) Se sabe que la proporción de artículos defectuosos de los meses anteriores ha


sido del 12% y que la producción mensual es de 𝑁 = 500 artículos.

Solución

Datos: 𝐸 = 0.04 , (1 − 𝛼) = 0.95

a) Para un nivel de confianza del 95% el valor de 𝑍𝛼 que debe usarse es 1.96 (ver
2

tabla 52). Dado que no tenemos información sobre las estimaciones iniciales,
usamos 𝑝̂ = 0.5 𝑦 𝑞̂ = 0.5

𝑍 2 𝑝̂ 𝑞̂ (1.96)2 (0.5)(0.5)
𝑛= = = 600.25 ≅ 601
𝐸2 (0.04)2

b) Usando los estimadores 𝑝̂ = 0.12 𝑦 𝑞̂ = 1 − 𝑝̂ = 0.88, tenemos:

𝑍 2 𝑝̂ 𝑞̂ (1.96)2 (0.12)(0.88)
𝑛= = = 253.55 ≅ 254
𝐸2 (0.04)2

c) Al usar los estimadores 𝑝̂ 𝑦 𝑞̂ y el tamaño de la población 𝑁 = 500, se tiene:

𝑍 2 𝑝̂ 𝑞̂ 𝑁 (1.96)2 (0.12)(0.88)(500)
𝑛= = = 168.46 ≅ 169
𝐸 2 (𝑁 − 1) + 𝑍 2 𝑝̂ 𝑞̂ 0.042 (500 − 1) + (1.96)2 (0.12)(0.88)
En este problema podemos observar que la incorporación de algún conocimiento
previo sobre la población puede disminuir sensiblemente el tamaño de la
muestra.

45
Clase 15| Prueba de hipótesis
15. Prueba de hipótesis
Habitualmente el problema al que se enfrentan los científicos e ingenieros no es
tanto la estimación de un parámetro poblacional, sino el diseño de un
procedimiento de decisión que se base en datos experimentales y que pueda
producir una conclusión acerca de algún sistema científico. Por ejemplo, un
ingeniero quizás tenga que decidir, con base en datos muestrales, si hay alguna
diferencia en la productividad de dos tipos de máquinas; o tal vez un
investigador médico puede decidir, con base en evidencia experimental, si el
consumir bebidas alcohólicas incrementa el riesgo de sufrir diabetes en los seres
humanos. En cada uno de estos casos el científico o ingeniero postula o
conjetura algo acerca de un sistema, para después utilizar datos experimentales
y tomar una decisión basada en ellos.

Una hipótesis estadística o simplemente hipótesis es


una conjetura o aseveración sobre el valor de uno o varios
parámetros poblacionales o sobre la forma de una
distribución de probabilidad completa (Devore, 2008).

Algunos ejemplos de hipótesis estadísticas son:

▪ El promedio del coeficiente intelectual de los estudiantes de la Universidad


Don Bosco es de 104.

▪ La proporción de objetos defectuosos producidos por cierto proceso nunca


es superior al 8%.

▪ Cálculo de varias variables es la asignatura que más dificultad presenta al


estudiante de ingeniería de la UDB.

▪ El rendimiento académico promedio de los grupos nocturnos es inferior al


rendimiento promedio de los grupos diurnos en la facultad de ingeniería
de la UDB.

46
Con los ejemplos anteriores, puede observar que las hipótesis, tal como están
formuladas, son meras suposiciones, y que, por lo tanto, tienen que someterse
a comprobación, ya que estas pueden ser o no verdaderas.

Un medio seguro para probar una hipótesis es investigar a toda la población; sin
embargo, esto es impráctico en la mayoría de las situaciones y a veces casi
imposible.

La estrategia más razonable es tomar una muestra aleatoria de la población en


estudio, y con base en la información proporcionada por esta muestra se podrá
decidir, con un determinado nivel de confianza, si la hipótesis se acepta o se
rechaza. A este procedimiento se le denomina prueba de hipótesis.

15.1 Generalidades de la prueba de hipótesis

15.1.1 Tipos de hipótesis


Desde el punto de vista metodológico, una prueba de hipótesis estadística se
formula planteando dos hipótesis:

▪ Hipótesis nula: es la hipótesis que el investigador se propone a rechazar.


Esta hipótesis representa una “creencia previa” o el “statu quo” y es
aceptada provisionalmente como verdadera. Se simboliza por 𝐻0 .

▪ Hipótesis alternativa: constituye “la teoría” que el investigador está


interesado en probar o aceptar. Se simboliza por 𝐻1 .

Ambas hipótesis son complementarias, ya que el rechazo de una supone la


aceptación de la otra.

La hipótesis nula es la que se somete a prueba y se mantiene como verdadera,


mientras no existan evidencias que demuestren que es falsa. La hipótesis
alternativa o hipótesis alterna se aceptará como verdadera cuando los resultados
de la muestra evidencien que la nula es falsa (Hernández, 2015).

47
El razonamiento empleado en una prueba de hipótesis es similar a un juicio en
un tribunal. Al procesar a una persona por robo (en la analogía, esta sería la
hipótesis nula), el tribunal debe decidir entre inocencia y culpabilidad. Cuando
el juicio se inicia, se supone que la persona acusada es inocente. El proceso
recaba y presenta toda evidencia disponible en un intento para contradecir la
hipótesis de inocencia y por tanto obtener una condena. Si hay evidencia
suficiente contra inocencia, el tribunal rechazará la hipótesis de inocencia y
declarará culpable al demandado. Si el proceso no presenta suficiente evidencia
para demostrar que el demandado es culpable, el tribunal le hallará no culpable
(Mendenhall, 2010). Note que esto no demuestra que el demandado es inocente,
sino sólo que no hubo evidencia suficiente para concluir que el demandado era
culpable.

Ejemplo. Formular la hipótesis nula 𝐻0 y la hipótesis alterna 𝐻1 en cada una de


las siguientes situaciones.

a) Una máquina debe llenar y empacar bolsas de dos libras de azúcar refinada.
Se cree que las bolsas contienen menos de esa cantidad.

𝐻0 : 𝜇 = 2
𝐻1 : 𝜇 < 2
b) Una firma independiente, que realiza encuestas de opinión, asegura que el
candidato del partido X cuenta con el 35% del electorado. No obstante, el partido
del candidato quiere probar que el porcentaje es mayor.

𝐻0 : 𝑃 = 0.35
𝐻1 : 𝑃 > 0.35
c) Una máquina elabora piezas mecánicas cuyo diámetro debe ser de 4 mm. Se
sospecha que la máquina no está funcionando correctamente.

𝐻0 : 𝜇 = 4
𝐻1 : 𝜇 ≠ 4
d) El rendimiento promedio de cada manzana cultivada, medido en quintales de
producción, es diferente cuando se utiliza el fertilizante X o el fertilizante Y.

𝐻0 : 𝜇𝑥 = 𝜇𝑦
𝐻1 : 𝜇𝑥 ≠ 𝜇𝑦

48
Nótese que, en todos estos ejemplos, la hipótesis nula 𝐻0 representa la creencia
previa sobre el parámetro poblacional y tradicionalmente contiene alguna
referencia de un signo de igualdad como “=”, “≥”, “≤”.

La formulación correcta de las hipótesis es un paso fundamental en el proceso


de prueba. Una estrategia que se puede sugerir consiste en razonar y plantear
inicialmente la hipótesis alternativa.

15.1.2 Nivel de significancia de la prueba


La lógica que se sigue en prueba de hipótesis es muy particular. La hipótesis
nula 𝐻0 recibe el favor de la prueba, en el sentido que se le asigna una
probabilidad muy alta de no rechazo. La hipótesis alterna 𝐻1 recibe el rigor de la
prueba, y se le asigna una probabilidad de aceptación muy baja (Hernández,
2015).

Estas probabilidades son, al igual que las hipótesis, complementarias. Se


acostumbra a denotar por (1 − 𝛼) a la probabilidad de aceptar 𝐻0 y por 𝛼 a la
probabilidad de aceptar 𝐻1 . Al valor 𝛼 se le denomina “nivel de significancia
de la prueba” y técnicamente se interpreta como la probabilidad de rechazar
𝐻0 cuando esta es verdadera.

Los niveles usuales de significancia para las pruebas son: 10%, 5% y 1% o lo


que es lo mismo, 𝛼 = 0.10, 𝛼 = 0.05 y 𝛼 = 0.01.

15.1.3 Tipos de errores en prueba de hipótesis


Al tomar la decisión de aceptar o rechazar la hipótesis nula 𝐻0 pueden cometerse
dos tipos de errores.

▪ Error tipo I: rechazar la hipótesis nula cuando es verdadera (error 𝛼).

▪ Error tipo II: aceptar la hipótesis nula cuando realmente no es verdadera


(error 𝛽).

49
La probabilidad de cometer un error tipo I se llama nivel de significancia.

Tabla 53: Tipos de errores en prueba de hipótesis

Fuente: por Lind (2012)

15.1.4 Tipos de pruebas de hipótesis


El tipo de prueba de hipótesis depende básicamente de la hipótesis alterna 𝐻1 .

• La prueba de hipótesis 𝐻0 : 𝜃 = 𝜃0 contra 𝐻1 : 𝜃 ≠ 𝜃0 se denomina prueba


bilateral o de dos colas.
• La prueba de hipótesis 𝐻0 : 𝜃 = 𝜃0 contra 𝐻1 : 𝜃 < 𝜃0 se denomina prueba
unilateral de cola a la izquierda.
• La prueba de hipótesis 𝐻0 : 𝜃 = 𝜃0 contra 𝐻1 : 𝜃 > 𝜃0 se denomina prueba
unilateral de cola a la derecha.

15.1.5 Procedimiento para probar hipótesis


En esta asignatura usaremos un procedimiento en 4 pasos para probar cualquier
tipo de hipótesis:

1. Planteamiento de las hipótesis. Debe formularse la hipótesis nula 𝐻0 y


la hipótesis alterna 𝐻1 . Recuerde que la hipótesis nula siempre debe
contener el signo de igualdad (=, ≤ 𝑜 ≥).

2. Definir límites de aceptación y rechazo. La curva normal


correspondiente a la distribución muestral de 𝜃̂ se divide en dos zonas: la

50
zona de aceptación y la zona de rechazo. La zona de rechazo tiene un
área correspondiente a 𝛼 (el nivel de significancia) y su posición en la
curva normal está dada por la hipótesis alterna 𝐻1 . El valor de 𝑍 que está
en la frontera de ambas zonas se conoce como valor critico o valor
frontera.

3. Calcular el estadístico de contraste. Usando los datos de la muestra


se calcula el estadístico de contraste o estadístico de prueba y se ubica en
la curva normal.

4. Tomar una decisión. Se verifica la ubicación del estadístico de contraste


en la curva normal para tomar la decisión de rechazar o aceptar la
hipótesis nula.

15.2 Prueba de hipótesis referente a una media


poblacional
En esta sección discutiremos el procedimiento de prueba de hipótesis referente
a una media poblacional con una desviación típica 𝜎 conocida. En la tabla 54 se
presentan los 4 pasos de la prueba de hipótesis referente a medias poblacionales
para cada uno de los 3 tipos posibles de prueba.

Tabla 54: Prueba de hipótesis referente a una media poblacional

Pruebas bilaterales Pruebas unilaterales con Pruebas unilaterales con


cola a la izquierda cola a la derecha

1. Planteamiento de la hipótesis

𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 > 𝜇0
2. Definir límites de aceptación y rechazo

51
3. Calcular estadístico de contraste

𝑋̅ − 𝜇0
𝑍𝑐 = 𝜎
√𝑛

4. Tomar una decisión

Aceptar 𝐻0 si: |𝑍𝑐 | ≤ |𝑍𝛼⁄ | Aceptar 𝐻0 si: 𝑍𝑐 ≥ 𝑍𝛼 Aceptar 𝐻0 si: 𝑍𝑐 ≤ 𝑍𝛼


2

Rechazar 𝐻0 si: 𝑍𝑐 < 𝑍𝛼 Rechazar 𝐻0 si: 𝑍𝑐 > 𝑍𝛼


Rechazar 𝐻0 si: |𝑍𝑐 | > |𝑍𝛼⁄ |
2

Fuente: Elaboración propia

En la siguiente lista de reproducción se presentan algunos


ejemplos sobre prueba de hipótesis referente a medias
poblacionales

Guillermo Calderón. (20 de agosto de 2020). Prueba de


hipótesis referente a medias poblacionales. [archivo de
video]. Recuperado de
https://www.youtube.com/playlist?list=PLtqGwSACq5Q3_
h0_fjEf4HlKQ6IGTVAvy

15.3 Prueba de hipótesis referente a una


proporción poblacional
Para realizar pruebas de hipótesis referentes a proporciones poblacionales
usaremos el mismo procedimiento en cuatro pasos que estudiamos en la sección
anterior.

52
En este caso, el estadístico de contraste estaría dado por:

𝑝̂ − 𝑃0
𝑍𝑐 =
√𝑃0 𝑄0
𝑛

Ejemplo. Un fabricante de arandelas afirma que al menos el 95% de su


producción cumple con las especificaciones requeridas. Si se examinan una
muestra de 150 piezas y encontramos que 12 de ellas resultaron defectuosas,
¿podemos decir que el dato muestral proporciona suficiente evidencia para
rechazar la afirmación del fabricante? Utilice un nivel de significancia del 5%.

Solución

Sea: 𝑋 = Número de arandelas que cumplen la especificación


𝑥 150−12
Datos: 𝑛 = 150 , 𝑝̂ = 𝑛 = 150
= 0.92

1. Planteamiento de la hipótesis

Inicialmente aceptamos como válida la afirmación del fabricante y estamos


interesados en rechazar dicha afirmación, por tanto:

𝐻0 : 𝑃 ≥ 0.95 (al menos 95%)

𝐻1 : 𝑃 < 0.95

53
2. Definir límites de aceptación y rechazo

La hipótesis alterna 𝐻1 nos indica que


debemos realizar una prueba con cola a
la izquierda.

Nótese que el valor de 𝑍𝛼 debe ser


negativo puesto que esta en la cola
izquierda de la curva normal.
Figura 65. Cálculo de 𝑍𝛼 .
En la figura 65 podemos ver que Fuente: Elaboración propia.

𝑍𝛼 = −1.645

3. Calcular estadístico de contraste

𝑝̂ − 𝑃0 0.92 − 0.95
𝑍𝑐 = = = −1.69
𝑃0 𝑄0
√ √(0.95)(0.05)
𝑛 150

4. Tomar una decisión.

Dado que 𝑍𝑐 < 𝑍𝛼 rechazamos la hipótesis nula 𝐻0

−1.69 < −1.645

Esto también puede concluirse al observar que el estadístico de prueba 𝑍𝑐 = −1.69


se ubica en la zona de rechazo.

Conclusión: Al 5% de significancia, se rechaza la afirmación del fabricante,


menos del 95% de la producción cumplen las especificaciones.

Otra metodología para probar hipótesis es el uso del “p


valor”. En el siguiente video se explica qué es el p-valor y
como usarlo en una prueba de hipótesis.

KhanAcademyEspañol. (12 de febrero de 2018). Valores P


y pruebas de significancia. [archivo de video]. Recuperado
de https://youtu.be/bBfDemiDgP4

54
Clase 16| Muestreo pequeño
16. Muestreo pequeño
En las dos clases anteriores estudiamos métodos de estimación de parámetros
y prueba de hipótesis, con base en muestras grandes (𝐧 ≥ 𝟑𝟎); sin embargo, en
ciertos escenarios es necesario hacer inferencias usando muestras pequeñas por
razones de tiempo y reducción de costos. Por ejemplo, para un fabricante
automotriz que esté probando la resistencia al impacto de los autos en su último
modelo, destruir a propósito 30 vehículos de lujo puede volverse muy costoso e
innecesario; para un laboratorio médico que quiere probar su nueva vacuna
contra un virus, encontrar 30 personas dispuestas a actuar como conejillo de
indias puede resultar muy complicado.

En muchos casos una muestra grande no es posible. En estos casos, los


procedimientos vistos para muestras grandes resultan inadecuados y se requiere
de otros procedimientos de estimación y pruebas de hipótesis. En esta clase
abordaremos varios procedimientos basados en pruebas pequeñas (𝒏 < 𝟑𝟎).
Estos procedimientos están muy relacionados con los de muestras grandes ya
vistos en las clases anteriores. En particular, estudiaremos los procedimientos
de estimación por intervalos y prueba de hipótesis sobre medias poblacionales.

16.1 La distribución t de Student


Si 𝑋̅ es la media de una muestra grande de tamaño 𝑛 de una población con media
𝜇 y desviación típica 𝜎, entonces el teorema del límite central especifica que el
𝑋̅−𝜇
estadístico 𝑍 = 𝜎 es exactamente normal estándar. Además, la desviación
⁄ 𝑛

∑(𝑥𝑖 −𝑥̅ )2
estándar muestral 𝑠 = √ 𝑛−1
estará cerca de la desviación estándar poblacional

𝑋̅ −𝜇
𝜎 y, por lo tanto, el estadístico 𝑍 = 𝑠 es aproximadamente normal estándar,
⁄ 𝑛

55
por lo que se pueden buscar las probabilidades relacionadas con esta cantidad
en la tabla normal estándar (tabla 𝑍).

¿Qué se puede hacer si 𝑋̅ es la media de una muestra pequeña (𝑛 < 30) extraída
de una población con 𝜎 desconocida? En este caso, 𝑠 podría no estar cercano a
𝜎, y 𝑋̅ puede no ser aproximadamente normal. Si no se sabe nada sobre la
población de la que se extrajo la muestra, entonces no hay ningún método fácil
para hacer inferencias; sin embargo, si la población es aproximadamente
normal, 𝑋̅ lo será incluso cuando el tamaño de la muestra 𝑛 sea pequeño. Lo
𝑋̅−𝜇
anterior propicia que aún se pueda usar el estadístico 𝑠 , pero debido a que 𝑠
⁄ 𝑛

puede no estar cercana a 𝜎, esta cantidad NO tendrá distribución normal


estándar. En su lugar, tiene la distribución 𝒕 de Student con 𝑛 − 1 grados de
libertad.

La distribución 𝑡 de Student fue desarrollada en 1908 por William Gossett, un


estadístico que trabajó en la cervecería Guinness, en Dublin Irlanda. La dirección
de la cervecería consideró que el descubrimiento era información privada y
prohibió a Gossett que lo publicara. Aun así, él lo publicó, usando el seudónimo
“estudiante” (Navidi, 2006).

Distribución 𝒕 de Student

La distribución t es una familia de distribuciones de probabilidad similar, y cada


una depende de un parámetro conocido como grados de libertad.

Los grados de libertad (𝒗) se definen como el número de observaciones que se


pueden escoger libremente.

𝑣 =𝑛−1

La distribución t se utiliza cuando se cumplen las 3 condiciones siguientes:

1. La muestra es pequeña (𝑛 < 30).

2. 𝜎 es desconocida.

3. La población de la que se extrajo la muestra es normal o casi normal.

56
Si 𝜎 es conocida, la distribución 𝑍 se usa inclusive si la muestra es pequeña.
Además, si no puede asumirse una población normal, debe aumentarse el
tamaño de la muestra para utilizar la distribución Z.

La decisión de utilizar un estadístico 𝑍 o 𝑡 es crucial. La figura 66 muestra las


situaciones en las que debe usarse uno u otro.

Figura 66. Selección del estadístico apropiado para estimar 𝜇.


Fuente: Elaboración propia

57
16.1.1 Propiedades matemáticas de la
distribución t
Algunas propiedades matemáticas de la distribución 𝑡 son:
▪ Al igual que la distribución 𝑍, la distribución 𝑡 tiene una media de cero, es
simétrica respecto a la media y oscila entre −∞ y +∞.
𝑣+1

𝑡2 1
▪ La función de densidad de la distribución 𝑡 es 𝑓(𝑡) = 𝐴 (1 + 𝑣
)

donde 𝑣 = 𝑛 − 1 son los grados de libertad de la distribución. La constante


𝐴 hace que el área bajo el gráfico sea igual a la unidad.

▪ Para cada valor de 𝑣, existe una particular distribución de probabilidad de


t.

▪ La curva de la función de densidad de t tiene forma de campana con su


centro en 0. En general, esta curva está más esparcida que la curva 𝑍;
pero a medida en que 𝑣 aumenta la secuencia de curvas de t tienden a la
curva normal estándar (figura 67).

Figura 67. Comparación de la distribución normal estándar con las


distribuciones 𝑡 para 10 y 20 grados de libertad. Fuente: por Anderson (2008)

58
16.1.2 Uso de la tabla t
Los valores críticos 𝑡(𝛼, 𝑣) para los grados de libertad adecuados se encuentran
en la tabla de la distribución 𝑡 (ver tabla 55). Esta tabla difiere en su construcción
de la tabla 𝑍 que usamos antes. Las columnas de la tabla presentan algunos
valores para el área 𝛼 de la cola derecha o izquierda de la curva 𝑡. Las filas de
la tabla representan los grados de libertad 𝑣. Los valores críticos se encuentran
en las celdas de la tabla.
Por ejemplo:
𝑡(0.05, 17) = 1.74
significa que para 𝑣 = 17
grados de libertad,
𝑃(𝑡 ≥ 1.74) = 0.05

Figura 68. Uso de la tabla 𝑡.


Fuente: Elaboración propia

Tabla 55: Fragmento de la tabla t

Fuente: Elaboración propia

59
16.2 Intervalos de confianza para muestras
pequeñas (𝜎 desconocida)
Para construir el intervalo con un nivel de
confianza 1 − 𝛼 y con 𝑣 = 𝑛 − 1 grados de
libertad, emplearemos la siguiente
expresión:
𝑠
𝜇 = 𝑋̅ ± 𝑡(𝛼/2,𝑣)
√𝑛
La expresión para calcular la desviación Figura 69. Intervalos de confianza
estándar muestral es: con la distribución 𝑡.
∑(𝑥𝑖 − 𝑥̅ ) Fuente: por Navidi (2008)
𝑠=√
𝑛−1

Ejemplo. Un químico realizó 8 mediciones independientes del punto de fusión del


tungsteno. Obtuvo una media muestral de 3,410.14 ºC con una desviación típica
de 1,018 ºC.
a) Determine un intervalo de confianza de 95% para el punto de fusión del
tungsteno.
b) Determine un intervalo de confianza del 98% para el punto de fusión del
tungsteno.
Solución

Datos: 𝑥̅ = 3410.14 ℃ , 𝑠 = 1018 ℃ , 𝑛 = 8


Tenemos una muestra pequeña (𝑛 < 30) y no conocemos la desviación típica
poblacional 𝜎. Asumiendo que la población tiene un comportamiento

60
aproximadamente normal, debemos emplear una distribución 𝑡 con 𝑣 = 8 − 1 = 7
grados de libertad.
a) Nivel de confianza del 95%

Cálculo del intervalo


𝑠
𝜇 = 𝑋̅ ± 𝑡(0.025,7)
√𝑛
1018
𝜇 = 3410.14 ± 2.365 ( )
√8
𝜇 = 3410.14 ± 851.20
Figura 70. Cálculo de 𝑡𝛼 . 𝜇 ∈ [ 2558.94, 4261.34 ] ℃
2
Fuente: Elaboración propia.

b) Nivel de confianza del 98%

Cálculo del intervalo


𝑠
𝜇 = 𝑋̅ ± 𝑡(0.01,7)
√𝑛
1018
𝜇 = 3410.14 ± 2.998 ( )
√8
𝜇 = 3410.14 ± 1079.03
Figura 71. Cálculo de 𝑡𝛼 .
2 𝜇 ∈ [ 2331.11, 4489.17 ] ℃
Fuente: Elaboración propia.

16.3 Prueba de hipótesis para muestras


pequeñas (𝜎 desconocida)
Para probar hipótesis respecto a medias poblacionales usando muestras
pequeñas usaremos la misma metodología en 4 pasos que se presentó en la
clase anterior, con las siguientes diferencias:
• En el paso 2 (determinación de los límites de aceptación y rechazo), el
valor frontera o valor crítico ya no lo obtendremos de la tabla normal
estándar 𝑍 sino de la tabla 𝑡.

61
• El cálculo del estadístico de contraste del paso 3 se realizará mediante la
siguiente expresión:
𝑋̅ − 𝜇0
𝑡𝑐 = 𝑠
√𝑛

En el siguiente video se presenta un ejemplo de prueba de


hipótesis referente a medias poblacionales usando la
distribución t.

Guillermo Calderón. (20 de agosto de 2020). Prueba de


hipótesis con la distribución t. Ejemplo 1. [archivo de
video]. Recuperado de https://youtu.be/xEgBmYctF4U

Ejemplo. En un cultivo de maíz se utilizó una nueva mezcla de fertilizantes. Las


longitudes (en centímetros) de una muestra de 10 mazorcas fueron las siguientes:

18.5 22.4 21.7 24.3 22.1

21.6 18.9 20.4 18.7 20.3

Si en el pasado la longitud promedio de las mazorcas se establecía en 20 cm,


¿podría decirse que la nueva mezcla ha mejorado usa medida? Use un nivel de
significancia del 5%.

Solución

Datos: 𝑛 = 10 , 𝑣 = 10 − 1 = 9 , 𝛼 = 0.05
∑ 𝑥 208.9
𝑥̅ = = = 20.89
𝑛 10

∑(𝑥𝑖 − 𝑥̅ )
𝑠=√ = 1.8735
𝑛−1

1. Planteamiento de la hipótesis

Inicialmente tomamos como válido que el promedio de longitud es de 20 cm y


pretendemos verificar si la nueva mezcla mejora esa medida, por tanto:

𝐻0 : 𝜇 = 20 𝑐𝑚 (la medida permanece sin cambio)

62
𝐻1 : 𝜇 > 20 𝑐𝑚 (la medida mejora)

2. Definir límites de aceptación y rechazo

La hipótesis alterna 𝐻1 nos indica que debemos realizar una prueba con cola a la
derecha.

En la figura 72 podemos ver que

𝑡𝛼 = 𝑡(0.05,9) = 1.833

Figura 65. Cálculo de 𝑍𝛼 .


Fuente: Elaboración propia.

Figura 72. Zona de rechazo y aceptación


Fuente: Elaboración propia.

3. Calcular estadístico de contraste

𝑋̅ − 𝜇0 20.89 − 20
𝑡𝑐 = 𝑠 = = 1.502
1.8735
√𝑛 √10

4. Tomar una decisión.

Dado que 𝑡𝑐 ≤ 𝑡𝛼 aceptamos la hipótesis nula 𝐻0

1.502 ≤ 1.833

Esto también puede concluirse al observar que el estadístico de contraste


𝑡𝑐 = 1.502 se ubica en la zona de aceptación.

Conclusión: al 5% de significancia, la medida permanece igual. La nueva mezcla


NO ha mejorado la medida.

En el siguiente video se presenta otro ejemplo de prueba


de hipótesis referente a medias poblacionales usando la
distribución t.

Guillermo Calderón. (20 de agosto de 2020). Prueba de


hipótesis con la distribución t. Ejemplo 2. [archivo de
video]. Recuperado de https://youtu.be/fm3NBJEPQb0

63
Referencias citadas en UNIDAD 4
• Anderson, D. & Williams, T. (2008). Estadística para administración y
economía (décima edición). México: Cengage Learning Editores.

• Bonilla, G. (2015). Estadística: Elementos de estadística descriptiva y


probabilidad (segunda edición). El Salvador: UCA editores.

• Hernández, J. (2015). Elementos de probabilidad y estadística. El Salvador:


UCA editores.

• Levin, R. & Rubin, D. (2004). Estadística para administración y economía


(séptima edición). México: Pearson Educación.

• Levine, D. & Krehbiel, C. (2014). Estadística para administración (sexta


edición). México: Pearson Educación.

• Lind, D. & Marchal, W. (2012). Estadística aplicada a los negocios y la


economía (Decimoquinta edición). Estados Unidos: McGraw-Hill.

• Mendenhall, W. & Beaver, R. (2010). Introducción a la probabilidad y


estadística (Décima tercera edición). Estados Unidos: Cengage Learning.
• Navidi, W. (2006). Estadística para ingenieros y científicos. Estados Unidos:
McGraw-Hill.
• Webster, A. (2000). Estadística aplicada a los negocios y la economía
(tercera edición). Estados Unidos: McGraw-Hill.

Videos enlazados
• Manuel Luque. (2 de mayo de 2020). PROBLEMA MUESTREO ALEATORIO
ESTRATIFICADO. [archivo de video]. Recuperado de
https://youtu.be/DkcYhbBK8HA

• Gonzalo Calderón. (4 de abril de 2020). TEOREMA DEL LÍMITE CENTRAL.


[archivo de video]. Recuperado de
https://drive.google.com/file/d/1Jhwu5dodidHOTyyhZT_6RKIDxTSuBJEq
/view?usp=sharing

• Guillermo Calderón. (19 de agosto de 2020). Teorema del límite central


para proporciones. [archivo de video]. Recuperado de
https://youtu.be/jgmqU7NONi0

64
• Guillermo Calderón. (19 de agosto de 2020). Intervalos de confianza para
estimar medias poblacionales. [archivo de video]. Recuperado de
https://youtu.be/9gxTITRNFLg

• Guillermo Calderón. (19 de agosto de 2020). Intervalos de confianza para


estimar proporciones poblacionales. [archivo de video]. Recuperado de
https://youtu.be/anFopLvhXhc

• Guillermo Calderón. (20 de agosto de 2020). Prueba de hipótesis


referente a medias poblacionales. [archivo de video]. Recuperado de
https://www.youtube.com/playlist?list=PLtqGwSACq5Q3_h0_fjEf4HlKQ6
IGTVAvy

• Guillermo Calderón. (20 de agosto de 2020). Prueba de hipótesis con la


distribución t. Ejemplo 1. [archivo de video]. Recuperado de
https://youtu.be/xEgBmYctF4U

• Guillermo Calderón. (20 de agosto de 2020). Prueba de hipótesis con la


distribución t. Ejemplo 2. [archivo de video]. Recuperado de
https://youtu.be/fm3NBJEPQb0

• KhanAcademyEspañol. (12 de febrero de 2018). Valores P y pruebas de


significancia. [archivo de video]. Recuperado de
https://youtu.be/bBfDemiDgP4

65
Glosario de los términos citados en la
UNIDAD 4

Conjetura Juicio u opinión formada a partir de indicios o datos


incompletos o supuestos.
Estadístico Cantidad numérica calculada con los datos de una
muestra.
Estimador Estadístico al que se le exigen ciertas condiciones para
que pueda calcular con ciertas garantías algunos
parámetros de una población.
Parámetro Cantidad numérica calculada con todos los datos de
una población.
Población Población formada por elementos con valores muy
heterogénea desiguales respecto a una variable de intereses.
Población infinita Población de la que no se conoce el tamaño y no se
tiene la posibilidad de contar o construir un marco
muestral (listado en el que encontramos las unidades
elementales que componen la población)
Valor crítico Valor de la distribución muestral que separa la zona de
aceptación de la zona de rechazo en una prueba de
hipótesis estadística.

66

También podría gustarte