Estadistica Aplicada

Dirección de Educación a Distancia
Apartado Postal, 1874, San Salvador, El Salvador

Tel: 2251-8200 ext: 1743
Sumario
13. Muestreo y distribuciones muestrales .................................................. 5

13.1 Diseños muestrales ........................................................................ 5
13.1.1 Tipos de muestreo aleatorio .......................................................... 7
13.2 Distribuciones muestrales .............................................................. 13
13.2.1 Error de muestreo ..................................................................... 13
13.2.3 Distribución muestral de proporciones .......................................... 16
13.3 Teorema del límite central ............................................................. 18
13.3.1 Aplicación del teorema del límite central para distribuciones muestrales
de medias ....................................................................................... 23
13.3.2 Aplicación del teorema del límite central para distribuciones muestrales
de proporciones ............................................................................... 24
14. Estimación estadística .................................................................... 26
14.1 Tipos de estimación ...................................................................... 27
14.2 Estimación puntual ....................................................................... 28
14.3 Estimación por intervalo ................................................................ 30
14.3.1 Intervalos de confianza para estimar medias poblacionales .............. 31
14.3.2 Intervalos de confianza para estimar proporciones poblacionales....... 38
14.4 Elección del tamaño de una muestra ............................................... 41
14.4.1 Tamaño de la muestra para estimar una media poblacional .............. 41
14.4.2 Tamaño de la muestra para estimar una proporción poblacional ........ 43
15. Prueba de hipótesis ........................................................................ 46
15.1 Generalidades de la prueba de hipótesis .......................................... 47
15.1.1 Tipos de hipótesis ...................................................................... 47
15.1.2 Nivel de significancia de la prueba ................................................ 49
15.1.3 Tipos de errores en prueba de hipótesis ........................................ 49
15.1.4 Tipos de pruebas de hipótesis ...................................................... 50
15.1.5 Procedimiento para probar hipótesis ............................................. 50
15.2 Prueba de hipótesis referente a una media poblacional ....................... 51
15.3 Prueba de hipótesis referente a una proporción poblacional ................. 52
16. Muestreo pequeño ......................................................................... 55
16.1 La distribución t de Student ........................................................... 55
16.1.1 Propiedades matemáticas de la distribución t ................................. 58
16.1.2 Uso de la tabla t ........................................................................ 59
16.2 Intervalos de confianza para muestras pequeñas (𝜎 desconocida) ........ 60
16.3 Prueba de hipótesis para muestras pequeñas (𝜎 desconocida) ............. 61
Clase 13| Muestreo y
distribuciones muestrales
Las 13 clases que hemos estudiado hasta ahora nos han proporcionado los
conocimientos y competencias necesarias para entender la inferencia estadística
y cómo puede aplicarse en situaciones prácticas.
En la primera unidad abordamos el uso de la estadística descriptiva para realizar

caracterizaciones gráficas y numéricas para un conjunto de datos. En las
unidades II y III estudiamos probabilidad y distribuciones de probabilidad, que
son las bases de la inferencia estadística, rama de la estadística que se ocupa
del uso de los conceptos de probabilidad para manejar la incertidumbre en la
toma de decisiones y la predicción de sucesos futuros.
La inferencia estadística se encarga de tomar decisiones o realizar predicciones

acerca de parámetros, es decir, las medidas numéricas que caracterizan a una
población.
Los métodos para hacer inferencias acerca de parámetros poblacionales pueden

agruparse en dos categorías:
• Estimación: predecir o generalizar el valor del parámetro partiendo de

un estadístico.
• Prueba de hipótesis: tomar una decisión acerca del valor de un
parámetro, con base en alguna idea preconcebida acerca de cuál podría
ser su valor (Mendenhall, 2010).
Antes de abordar de lleno estos dos métodos, comenzaremos estudiando

algunos fundamentos de muestreo y distribuciones muestrales, tópicos
fundamentales para la comprensión de los procedimientos y pruebas de la
estadística inferencial.
4
13. Muestreo y distribuciones muestrales
Todo estudio estadístico está asociado a un conjunto de referencia llamado
población. Cuando las poblaciones son muy grandes o infinitas, una investigación
sobre la totalidad de sus individuos resulta prácticamente imposible, o al menos
impráctica. Por ello es un procedimiento muy usual analizar un subconjunto
representativo de la población (al cual se le denomina muestra), y a partir de la
información obtenida de la muestra, hacer inferencias o sacar conclusiones
respecto a la población de donde se obtuvo (Hernández, 2015).
Existen diversas razones prácticas para preferir el análisis de una muestra por
sobre el estudio de toda una población. A continuación, se presentan algunas de
esas razones:
• Establecer contacto con toda la población puede requerir mucho tiempo.

• El costo de estudiar la totalidad de elementos de una población puede ser
prohibitivo.
• Puede ser imposible verificar de manera física a todos los elementos de la
población.
• Algunas pruebas son de naturaleza destructiva.
13.1 Diseños muestrales

Los diseños muestrales pueden definirse como los distintos procedimientos
existentes para extraer muestras a partir de una población con el propósito de
conocer sus características promedio.
El proceso de muestreo se inicia definiendo el marco de muestreo; es decir,

una lista de elementos que conforman la población. Los marcos de muestreo son
fuentes de datos, por ejemplo: listas de población, directorios o mapas. Las
muestras se obtienen a partir de los marcos de muestreo. Si un marco excluye
a ciertas partes de la población, pueden obtenerse resultados sesgados o
imprecisos (Levine, 2014).
5
Después de seleccionar un marco, se debe obtener una muestra de este. Existen
2 métodos para seleccionar muestras:
• Muestreo no aleatorio o no probabilístico. La selección muestral se

realiza sin intervención de la aleatoriedad. Se emplea el conocimiento y
la opinión personal para identificar a los elementos de la población que
deben incluirse en la muestra.
• Muestreo aleatorio o probabilístico. Todos los elementos de la

población tienen la oportunidad de ser escogidos para la muestra. La
selección de los elementos de la población que deben incluirse en la
muestra depende del azar.
Un tipo común de muestreo no probabilístico es el muestreo deliberado o por

conveniencia, en el cual se seleccionan los elementos que son fáciles, poco
costosos o convenientes de obtener (Levine, 2014). Por ejemplo, si
seleccionamos neumáticos apilados en un almacén, sería más conveniente
obtener muestras de los neumáticos ubicados en la parte superior de una pila
que los ubicados en la parte inferior de la misma. Por la comodidad o facilidad
en tomar la muestra se sacrifica cierto grado de representatividad de las
características poblacionales.
Otro tipo de muestreo no probabilístico es el muestro de juicio en el cual se

obtienen las opiniones de expertos en la materia los cuales deciden quién estará
o no incluido en la muestra. Aunque es probable que los expertos estén bien
informados, no es posible generalizar sus resultados a la población (Levine,
2014).
El muestreo no probabilístico puede tener muchas ventajas, como la

conveniencia, la rapidez y el bajo costo; sin embargo, su falta de precisión
debido al sesgo de la selección y al hecho de que no es posible utilizar los
resultados para hacer inferencias estadísticas supera por mucho esas ventajas.
Siempre que sea posible, se deben utilizar métodos de muestreo probabilísticos.

Las muestras probabilísticas permiten hacer inferencias acerca de la población
de interés. Los cuatro tipos de muestreo probabilístico más utilizados son: el
6
muestreo aleatorio simple, el muestreo sistemático, el muestreo estratificados y
el muestreo por conglomerados (ver figura 51). Estos métodos de muestreo
varían en cuanto al costo, exactitud y complejidad (Levine, 2014).
Muestreo
Muestreo no deliberado
aleatorio o no
probabilistico Muestreo de
juicio
Muestreo
Tipos de
aleatorio
muestreo
simple
Muestreo
Muestreo sistemático
aleatorio o
probabilistico Muestreo
estratificado
Muestreo por
conglomerados
Figura 51. Tipos de muestreo. Fuente: Elaboración propia
13.1.1 Tipos de muestreo aleatorio

a) Muestreo aleatorio simple
En este tipo de muestreo aleatorio todos y cada uno de los elementos de la

población tienen igual probabilidad de ser incluidos en la muestra. Además, toda
muestra aleatoria de igual tamaño, tomada de una población dada, tiene la
misma probabilidad de ser tomada.
En este tipo de muestreo se utiliza 𝑛 para representar el tamaño de la muestra

y 𝑁 para representar el tamaño de la población.
7
Consideremos la siguiente situación: se tiene una población de cuatro
profesionales recién graduados de la ingeniería mecatrónica (𝑁 = 4) y se quieren
muestras de dos ingenieros a la vez (𝑛 = 2) para entrevistarlos. Existen 𝑁 𝐶𝑛
muestras posibles; es decir, en este caso habría 4 𝐶2 = 6 muestras posibles. Si

nombramos a los 4 profesionales como A, B, C y D, estas muestras son:
AB AC AD
BC BD CD
Cada una de estas muestras tiene 1/6 de probabilidad de ser escogida.
¿Cómo escoger una muestra aleatoria simple?
Uno de los métodos más sencillos consiste en enumerar todos los elementos de
la población, escribir los números en fichas o bolas, poner luego estos objetos
numerados en una caja, bolsa o urna y mezclarlos completamente. Finalmente,
se sacan, uno a uno, los 𝑛 objetos deseados (Bonilla, 2016).
Otro método, más técnico y confiable, consiste en usar números aleatorios. Estos
números pueden generarse mediante programas de computadora o mediante
una tabla de números aleatorios (la mayoría de los libros de estadística incluyen
una en sus apéndices).
La tabla 46 muestra un ejemplo de tabla de números aleatorios. Para aprender

a usar esta tabla, supongamos que hay 800 empleados en una compañía y desea
entrevistar una muestra de 10 de ellos escogidos al azar.
Podríamos obtener una muestra aleatoria al asignar a cada empleado un número

desde 000 a 799, consultando la tabla 46 y escogiendo un método sistemático
para seleccionar números de tres dígitos. En este caso, podríamos hacer lo
siguiente:
1. Elegir arbitrariamente un punto desde el cual comenzar a leer la tabla. Para

este caso usaremos la quinta columna y sexta fila.
8
Tabla 46: Tabla de números aleatorios
Fuente: Anderson (2008)
2. Recorrer de arriba hacia abajo los bloques de números de la tabla partiendo

del punto de inicio escogido en el paso anterior. Para este caso leeremos sólo
los primeros 3 dígitos en cada fila, es decir:
42048
38733
47327
82242
37636
49539
…
Los números escogidos son: 420, 387, 473, 376, 495, 439, 371, 110, 454 y 552.
9
Nótese que después del 473 sigue el 822, el cual no se tomó porque los
elementos de la población están numerados del 000 al 799. Si al estar leyendo
la tabla, apareciera un número repetido este también tendría que omitirse.
3. Si llegáramos hasta el final de la columna y aun no tenemos los 𝑛 elementos,

entonces podemos avanzar hasta la siguiente columna y seguir leyendo de arriba
hacia abajo.
b) Muestreo sistemático
A veces la población a ser muestreada está ordenada, por ejemplo, una lista
alfabetizada de personas con licencias de conducir, una lista de usuarios de la
compañía de energía eléctrica por direcciones de servicio o una lista de clientes
por números de cuenta. En estas y otras situaciones, se escoge un elemento al
azar de los primeros 𝑘 elementos y, a continuación, cada 𝑘-ésimo elemento de
ahí en adelante se incluye en la muestra.
Una muestra aleatoria sistemática involucra la selección aleatoria de uno de

los primeros 𝑘 elementos de una población ordenada y luego la selección
sistemática de cada 𝑘-ésimo elemento de ahí en adelante.
Inicialmente se separan los 𝑁 elementos de la población en 𝑛 grupos de 𝑘

elementos, donde:
𝑁
𝑘=
𝑛
𝑁
recibe el nombre de razón de muestreo. Si el resultado del cociente no es un
𝑛
entero, entonces debe redondearse al entero más cercano. Para seleccionar una
muestra sistemática, se elige al azar el primer elemento a ser seleccionado de
los primeros 𝑘 elementos de la población. Luego se seleccionan los 𝑛 − 1
elementos restantes eligiendo cada k-ésimo elemento sucesivo de la población.
Para seleccionar una muestra sistemática de 𝑛 = 40 elementos de una población

de 𝑁 = 800 empleados se divide la población de 800 en 40 grupos, cada uno con
𝑁 800
𝑘= 𝑛
= 40
= 20 empleados. Luego se selecciona un número al azar de los
primeros 20 individuos y se incluye cada vigésimo individuo después de la
10
primera selección en la muestra. Por ejemplo, si el primer número aleatorio que
se elige es 005, las selecciones siguientes serían 025, 045, 065, 085, 105, 125,
…, 765 y 785.
Cuando se utiliza el muestreo sistemático, existe la posibilidad de que resulten

sesgos graves de selección si existe un patrón en la población (Levine, 2014).
Para evitar la ineficiencia del muestreo aleatorio simple y el posible sesgo de
selección del muestreo sistemático, podemos utilizar los métodos de muestreo
estratificado o muestreo por conglomerados.
c) Muestreo estratificado
En el muestreo estratificado la población se divide en grupos homogéneos a

partir de alguna característica con el propósito de garantizar que cada grupo se
encuentre representado en la muestra. A los grupos también se les denomina
estratos. Por ejemplo, los estudiantes de UDB virtual se pueden agrupar por
carreras, genero, situación laboral, etc.
Una vez definidos los estratos, se aplica el muestreo aleatorio simple en cada
grupo o estrato con el fin de formar la muestra. La cantidad de elementos que
se toman de cada estrato debe ser correspondiente a la proporción de este en
relación con la población completa.
El muestreo por estratos puede ser más efectivo si se trata de poblaciones

heterogéneas. Al hacer la estratificación, los grupos se establecen de tal manera
que los elementos tiendan a ser uniformes en cada grupo, y los grupos tiendan
a ser diferentes entre sí (Bonilla, 2016).
d) Muestreo por conglomerados
En el siguiente video se presenta un ejemplo sobre cómo

distribuir la muestra entre los distintos grupos en un
muestreo estratificado.
Manuel Luque. (2 de mayo de 2020). PROBLEMA

MUESTREO ALEATORIO ESTRATIFICADO. [archivo de
video]. Recuperado de https://youtu.be/DkcYhbBK8HA
11
En el muestreo por conglomerados la población se divide en grupos o
conglomerados a partir de los límites naturales geográficos o de otra clase. A
continuación, se selecciona una muestra aleatoria de estos conglomerados,
asumiendo que cada uno de ellos es representativo de la población.
Considere el siguiente ejemplo: se está realizando una investigación de mercado

con la intención de determinar el número promedio de televisores por casa en
el municipio de Santa Tecla. Para hacer un muestreo por conglomerados
podríamos usar un mapa de la ciudad para dividir el territorio en colonias y luego
escoger cierto número de estas (conglomerados) para entrevistar a sus
habitantes.
Un procedimiento de muestreo por conglomerados bien diseñado puede producir

una muestra más precisa a un costo considerablemente menor que el de un
muestreo aleatorio simple. Para lograr los mejores resultados en un diseño
muestral por conglomerados, las diferencias entre ellos se hacen tan pequeñas
como sea posible; mientras que, las diferencias entre los elementos individuales
dentro de cada conglomerado se hacen tan grandes como sea posible. Lo ideal
sería que cada conglomerado fuera una miniatura de toda la población y, por
tanto, un solo conglomerado podría ser una muestra satisfactoria (Bonilla,
2016).
Tanto en el muestreo estratificado como en el de conglomerados, la población

se divide en grupos bien definidos. Usamos el muestreo estratificado cuando
cada grupo tiene una pequeña variación dentro de sí mismo, pero hay una amplia
variación de un grupo a otro. Usamos el muestreo por conglomerados en el caso
opuesto, cuando hay una variación considerable dentro de cada grupo, pero los
grupos son esencialmente similares entre sí (Levin, 2004).
12
13.2 Distribuciones muestrales
Cuando se selecciona una muestra aleatoria de una población, las medidas
numéricas descriptivas (media, varianza, desviación típica, etc.) que se calculen
de la muestra se denominan estadísticos. Si tomamos varias muestras
aleatorias de una población, los estadísticos resultantes para cada muestra no
necesariamente serán iguales, y lo más probable es que variarán de una muestra
a otra; es decir, estos estadísticos son variables aleatorias. Las distribuciones de
probabilidad para estadísticos se llaman distribuciones muestrales.
La distribución muestral de un estadístico es la

distribución de probabilidad para los posibles valores del
estadístico, que resulta cuando muestras aleatorias de
tamaño 𝑛 se sacan repetidamente de la población
(Mendenhall, 2010).
13.2.1 Error de muestreo

Las muestras se emplean habitualmente para determinar características de la
población (parámetros). Por ejemplo, con la media de una muestra se puede
inferir la media de la población; sin embargo, como la muestra es solo una
porción representativa de la población, es poco probable que su media sea
exactamente igual a la media poblacional. De igual forma, es poco probable que
la desviación típica de la muestra sea exactamente igual a la desviación típica
de la población. Por lo tanto, puede esperarse que exista una diferencia entre
un estadístico de la muestra y el parámetro de la población correspondiente.
Esta diferencia recibe el nombre de error de muestreo.
El error de muestreo es la diferencia entre el estadístico de

una muestra y el parámetro de la población correspondiente.
13
13.2.2 Distribución muestral de medias
Una distribución muestral de medias se define como el
conjunto de todas las medias que se pueden calcular en
todas las muestras posibles que se pueden extraer de una
determinada población (Bonilla, 2016).
𝑁
En una población finita de tamaño 𝑁, podemos tener ( 𝑛 ) muestras diferentes
𝑁
de un mismo tamaño 𝑛. Supongamos que ( 𝑛 ) = 𝑟, y que 𝑚1 , 𝑚2 , 𝑚3 , … , 𝑚𝑟 son
las 𝑟 muestras diferentes. Si ahora calculamos en cada muestra la media

muestra 𝑥̅ , obtendremos un conjunto de 𝑟 valores promedio {𝑥̅1 , 𝑥̅2 , 𝑥̅3 , … , 𝑥̅𝑟 }
respectivamente para cada muestra 𝑚1 , 𝑚2 , 𝑚3 , … , 𝑚𝑟 . A la distribución de este
conjunto de valores {𝑥̅1 , 𝑥̅2 , 𝑥̅3 , … , 𝑥̅𝑟 } se le llama distribución muestral de la
media.
Propiedades de la distribución
La distribución de los valores promedio 𝑥̅𝑖 , correspondientes a muestras de un

mismo tamaño 𝑛, extraídas de una población cualquiera con media 𝜇 y desviación
típica 𝜎, tiene las siguientes propiedades:
a) La media de todas las medias en las muestras 𝜇𝑥̅ es igual a la media de la

población 𝜇.
𝜇𝑥̅ = 𝜇
b) La desviación típica de todas las medias 𝜎𝑥̅ (la desviación típica de la

distribución muestral) recibe el nombre de error estándar de la media y se
define de la siguiente manera:
• En una población infinita (o muestreo con reemplazo)

𝜎
𝜎𝑥̅ =
√𝑛
• En una población finita (o muestreo sin reemplazo)
𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁 − 1
14
Observe que el error estándar de la media disminuye cuando 𝑛 aumenta.
𝑁−𝑛
Nota: a la expresión √ se le conoce como factor de corrección para
𝑁−1
poblaciones finitas.
Ejemplo. Una familia tiene 5 hijos, cuyas edades son: 16, 13, 10, 7 y 4 años,
respectivamente. Tome todas las muestras posibles de edades de tamaño 𝑛 = 2 y
verifique las propiedades de la distribución muestral de medias.
Solución
Tabla 47: Cálculos poblacionales Cálculos poblacionales
𝒙 (𝒙 − 𝝁) 𝟐
∑ 𝑥 50
4 36 𝜇= = = 10
𝑁 5
7 9
10 0 (𝑥 − 𝜇)2 90
13 9 𝜎=√ = √ = √18
𝑁 5
16 36
50 90
Fuente: Elaboración propia
Tabla 48: Cálculos en las muestras
Muestra ̅
𝒙 ̅ − 𝝁𝒙̅ )𝟐
(𝒙
Cálculos en las muestras
(4,7) 5.5 20.25
(4,10) 7.0 9 𝑟 = ( 52 ) = 10 → Número de muestras
(4,13) 8.5 2.25
(4,16) 10 0 ∑ 𝑥̅ 100
𝜇𝑥̅ = = = 10
(7,10) 8.5 2.25 𝑟 10
(7,13) 10 0
(𝑥̅ − 𝜇𝑥̅ )2 67.5
(7,16) 11.5 2.25 𝜎𝑥̅ = √ =√ = √6.75
2.25 𝑟 10
(10,13) 11.5
(10,16) 13 9
(13,16) 14.5 20.25
∑ 90 67.5
Al utilizar los valores obtenidos podemos comprobar las propiedades de la

distribución:
1) 𝜇𝑥̅ = 𝜇 = 10
𝜎 𝑁−𝑛 √18 5−2

2) √ = √ = √6.75 = 𝜎𝑥̅
√𝑛 𝑁−1 √2 5−1
15
13.2.3 Distribución muestral de proporciones
El objetivo de muchas encuestas por muestreo es establecer la proporción (o
porcentaje) de individuos de una determinada población que poseen una
característica específica (Hernández, 2015). Por ejemplo, el porcentaje de
personas que votará en la próxima elección de alcaldes y diputados, la
proporción de individuos que estarían de acuerdo en que se aprobara el aborto
terapéutico, el porcentaje de artículos defectuosos producidos por cierta
máquina, etc.
Llamemos 𝑋 a la variable aleatoria del número de individuos de una población

que posee una característica determinada. Además, llamemos 𝑃 a la proporción
teórica poblacional de individuos que tienen dicha característica.
Si se toman todas las muestras posibles de un mismo tamaño 𝑛 y en cada

𝑥
muestra se cuenta el número 𝑥 de éxitos, entonces 𝑝̂ 𝑖 = sería la proporción de
𝑛
éxitos en una muestra específica (ver figura 52).
Figura 52. Distribución muestral de proporciones. Fuente: elaboración propia
La distribución de valores del conjunto resultante {𝑝̂1 , 𝑝̂ 2 , 𝑝̂ 3 , … , 𝑝̂𝑟 } se llama

distribución muestral de proporciones y sus propiedades son simétricas a las de
la distribución muestral de medias.
16
Al registrar los éxitos y los fracasos en una muestra de tamaño 𝑛, si escribimos
1 cuando se obtiene un éxito y 0 cuando se obtiene un fracaso, obtendríamos
una secuencia como la siguiente:
0, 1, 1, 1, 0, 1, 0, … , 0
La media aritmética de esta secuencia de valores sería:
∑ 𝑥 0 + 1 + 1 + 1 + 0 + 1 + 0 + ⋯ + 0 𝑥1
𝑥̅ = = =
𝑛 𝑛 𝑛
donde 𝑥1 es el número de éxitos en las 𝑛 observaciones. La media obtenida es

la proporción de éxitos en la muestra; por tanto, la distribución muestral de
proporciones es, en términos prácticos, una distribución muestral de medias.
Propiedades de la distribución
La distribución de los valores de proporción de éxito 𝑝̂ 𝑖 , correspondientes a

muestras de un mismo tamaño 𝑛, extraídas de una población binomial con
proporción de éxitos 𝑃, tiene las siguientes propiedades:
a) La media de todas las proporciones en las muestras 𝜇𝑝̂ es igual a la proporción
de la población 𝑃.
𝜇𝑝̂ = 𝑃
b) La desviación típica de todas las proporciones 𝜎𝑝̂ (la desviación típica de la
distribución muestral) recibe el nombre de error estándar de la proporción y

se define de la siguiente manera:
• En una población infinita (o muestreo con reemplazo)
𝑝̂ (1 − 𝑝̂ )
𝜎𝑝̂ = √
𝑛
• En una población finita (o muestreo sin reemplazo)
𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛
𝜎𝑥̅ = √ √
𝑛 𝑁−1
17
13.3 Teorema del límite central
El teorema del límite central es, probablemente, el más importante de toda la
estadística inferencial, pues asegura que toda distribución muestral se aproxima
a la normal al incrementarse el tamaño de la muestra, sin importar la forma de
la distribución de la población.
Suponga que se tira un dado balanceado 𝑛 = 1 vez. La variable aleatoria 𝑥 es el

número observado en la cara superior. Esta variable aleatoria conocida puede
tomar seis valores, cada uno con probabilidad 1/6 y su distribución de
probabilidad se muestra en la figura 53. La forma de la distribución es plana o
uniforme y simétrica alrededor de la media 𝜇 = 3.5, con una desviación estándar
𝜎 = 1.71.
Figura 53. Distribución de probabilidad en el lanzamiento de 𝑛 = 1 dado.

Fuente: por Mendenhall (2010)
Ahora, tomemos un tamaño de muestra 𝑛 = 2 de esta población; es decir,

tiramos dos veces el dado y registramos la suma de los números de las dos caras
superiores, ∑ 𝑥 = 𝑥1 + 𝑥2 . La figura 54 muestra los 36 posibles resultados, cada
uno con probabilidad 1/36. Las sumas están tabuladas y cada una de las posibles
sumas está dividida entre 𝑛 = 2 para obtener un promedio. El resultado es la
distribución muestral de 𝑥̅ que se ve en la figura 55. Observe la considerable
18
diferencia en la forma de la distribución muestral. Ahora tiene casi forma de
montículo, pero todavía es simétrica alrededor de la media 𝜇 = 3.5.
Figura 54. Sumas de las caras superiores de 𝑛 = 2 dados.

Figura 55. Distribución muestral de 𝑥̅ para 𝑛 = 2 dados.

Usando una herramienta de simulación por computadora, se generaron las

distribuciones muestrales de 𝑥̅ cuando 𝑛 = 3 y 𝑛 = 4. Para 𝑛 = 3, la distribución
muestral de la figura 56a muestra, con toda claridad, la forma de montículo de
19
la distribución normal, todavía centrada en 𝜇 = 3.5. La figura 56b muestra
espectacularmente que la distribución de 𝑥̅ es aproximadamente normal con
base en una muestra de sólo 𝑛 = 4. Este fenómeno es el resultado del teorema
del límite central.
Figura 56. Distribución muestral de 𝑥̅ para a) 𝑛 = 3 dados, b) 𝑛 = 4 dados.

Teorema del límite central
A medida que el tamaño de la muestra se vuelve lo suficientemente grande, la

distribución muestral de la media se distribuye de manera aproximadamente
normal, sin importar la forma de la distribución de los valores individuales en la
población.
¿Qué tamaño de muestra es lo suficientemente grande? Se ha hecho una gran

cantidad de investigación estadística respecto a esto. Como regla general, los
expertos en estadística han encontrado que, para muchas distribuciones
poblacionales, cuando el tamaño de muestra es de al menos 30 (𝑛 ≥ 30), la
distribución muestral de la media es aproximadamente normal. Sin embargo, es
posible aplicar el teorema del límite central incluso para tamaños de muestra
más pequeños si la distribución poblacional tiene una forma aproximadamente
de campana (Levine, 2014).
20
En resumen, el teorema del límite central se cumple en las siguientes
condiciones:
a) Si las muestras se toman de una población con distribución normal,

entonces la distribución muestral de la media será también normal,
independientemente del tamaño de la muestra.
b) Si no se conoce la forma de la distribución de probabilidad de la población,
o si se sabe que no es normal, entonces es necesario que el tamaño de la
muestra sea de por lo menos 30 observaciones para garantizar que la
distribución muestral de la media sea aproximadamente normal.
En la figura 57 se ilustra la aplicación del teorema del límite central a diferentes

poblaciones para distintos tamaños de muestra (𝑛 = 2, 𝑛 = 6 𝑦 𝑛 = 30).
21
Figura 57. Aplicación del teorema del límite central para distintas poblaciones.
Fuente: por Lind (2012)
La importancia del teorema del límite central radica en el hecho que nos permite
usar estadísticos de muestra para hacer inferencias con respecto a los
parámetros de población, sin saber sobre la forma de la distribución de esa
población más que lo que podamos obtener de la muestra (Levin,2004).
22
13.3.1 Aplicación del teorema del límite central
para distribuciones muestrales de medias
En cualquier investigación, no es práctico obtener todas las medias muestrales;
sino que basta con tomar una sola muestra aleatoria de la población en estudio
y aplicar el teorema del límite central para realizar inferencias.
Teorema del límite central aplicado a una distribución muestral de medias
Si 𝑥̅ es la media de una muestra aleatoria de tamaño 𝑛 tomada de una población

con media 𝜇 y con desviación típica 𝜎, entonces la forma del límite de la
distribución
𝑥̅ − 𝜇
𝑍=
𝜎𝑥̅
a medida en que 𝑛 → ∞, es la distribución normal estándar.
El denominador de la expresión anterior 𝜎𝑥̅ recibe el nombre de error estándar

y se define así:
𝜎
𝜎𝑥̅ =
√𝑛
Cuando se trabaja con poblaciones finitas y, además, el tamaño de la muestra
𝑛
tomada representa al menos el 5% de la población (𝑁 ≥ 0.05) es preciso usar el
𝑁−𝑛
factor de corrección para poblaciones finitas √ 𝑁−1 de modo que el error estándar
estaría dado por:
𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁−1
23
Tabla 49: Condiciones para el cálculo del error estándar de la media
Para poblaciones infinitas Para poblaciones finitas de tamaño 𝑁
𝜎 𝑛 𝜎 𝑛 𝜎 𝑁−𝑛
𝜎𝑥̅ = Si < 0.05 → 𝜎𝑥̅ = Si ≥ 0.05 → 𝜎𝑥̅ = √
√𝑛 𝑁 √𝑛 𝑁 √𝑛 𝑁−1
En el siguiente video se presentan algunos ejemplos de la

aplicación del teorema del límite central en el cálculo de
probabilidades asociadas con distribuciones muestrales de
medias.
Gonzalo Calderón. (4 de abril de 2020). TEOREMA DEL

LÍMITE CENTRAL. [archivo de video]. Recuperado de
https://drive.google.com/file/d/1Jhwu5dodidHOTyyhZT_6
RKIDxTSuBJEq/view?usp=sharing
13.3.2 Aplicación del teorema del límite central

para distribuciones muestrales de proporciones
Teorema del límite central aplicado a una distribución muestral de

proporciones
La distribución muestral de 𝑝̂ se aproximará a la distribución normal estándar,

haciendo
𝑝̂ − 𝑃
𝑍=
𝜎𝑝̂
siempre que el tamaño de la muestra sea grande.
24
En el caso de 𝑝̂ , se considera que el tamaño de la muestra es grande cuando se
cumplen las dos condiciones siguientes:
a) 𝑛𝑃 > 5
b) 𝑛(1 − 𝑃) > 5
En la expresión anterior, 𝑃 es la proporción poblacional y 𝜎𝑝̂ es el error
estándar, que para el caso de las proporciones, se define así:
𝑃𝑄
𝜎𝑝̂ = √
𝑛
Al igual que en el caso de la distribución muestral de medias, en la distribución

muestral de proporciones puede ser necesario aplicar el factor de corrección para
poblaciones finitas en los problemas en los que se conozca el tamaño de la
población 𝑁 a partir de la cual se obtuvo la muestra (ver tabla 50).
Tabla 50: Condiciones para el cálculo del error estándar de la proporción
Para poblaciones Para poblaciones finitas de tamaño 𝑁

infinitas
𝑛 𝑃𝑄 𝑁−𝑛
𝑃𝑄 𝑛 𝑃𝑄 Si ≥ 0.05 → 𝜎𝑝̂ = √ 𝑛 √ 𝑁−1
𝜎𝑝̂ = √ Si < 0.05 → 𝜎𝑝̂ = √ 𝑁
𝑛 𝑁 𝑛
Dónde:
𝑃 = Proporción poblacional 𝑄 =1−𝑃
En el siguiente video se presenta un ejemplo sobre la

aplicación del teorema del límite central para proporciones
Guillermo Calderón. (19 de agosto de 2020). Teorema del

límite central para proporciones. [archivo de video].
Recuperado de https://youtu.be/jgmqU7NONi0
25
Clase 14| Estimación
Estadística
14. Estimación estadística
En la clase anterior se abordaron las distintas estrategias con las que puede
seleccionarse una muestra a partir de una población para luego calcular medias,
desviaciones típicas y otros estadísticos muestrales. Estos estadísticos son las
herramientas que se usarán en estadística inferencial para hacer
generalizaciones acerca de una población usando la información contenida en
una muestra.
Hasta este punto debemos estar bien conscientes de que las poblaciones son
generalmente muy grandes como para ser estudiadas en su totalidad. Esto
requiere que se seleccionen muestras que nos permitan obtener información
(estadísticos) que se pueda utilizar más adelante para hacer inferencias sobre
las poblaciones (ver figura 58).
Figura 58. La estimación de parámetros en el proceso estadístico.

26
La estimación estadística es un proceso que consiste en
usar un estadístico muestral para predecir o generalizar el
correspondiente parámetro poblacional desconocido.
En el proceso de estimación, el estadístico estima al parámetro, tal y como se

muestra en la tabla 51.
Tabla 51: Simbología usada para estadísticos y parámetros en la estimación
Característica Estadístico Parámetro Error de estimación

(estimador)
Media 𝑥̅ 𝜇 | 𝑥̅ − 𝜇 |
Desviación típica 𝑠 𝜎 |𝑠−𝜎|
Proporción 𝑝̂ 𝑃 | 𝑝̂ − 𝑃 |
En general 𝜃̂ 𝜃 | 𝜃̂ − 𝜃 |
Nota: se acostumbra a poner un acento circunflejo (^) sobre el símbolo del

parámetro, para denotar al estimador.
14.1 Tipos de estimación

La estimación de un parámetro poblacional 𝜃 se puede realizar de dos formas:
• Estimación puntual. Con base en datos muestrales, se calcula un solo

número 𝜃̂ para estimar el parámetro poblacional 𝜃.
• Estimación por intervalo. Consiste en calcular un intervalo de valores
dentro del cual se esperaría encontrar el verdadero valor del parámetro.
Los procedimientos de estimación tanto puntuales como de intervalo usan

información dada por la distribución muestral del estimador específico que se
haya escogido para usarse (Mendenhall, 2010).
27
14.2 Estimación puntual
Para que un estadístico sea considerado un “buen estimador” puntual del
parámetro que va a estimar, debe cumplir con tres características:
a) Estimador insesgado. 𝜃̂ es un estimador insesgado de 𝜃, si su esperanza

matemática es igual al parámetro que se está estimando; es decir, si
𝐸[𝜃̂] = 𝜃. Esta condición garantiza que la distribución muestral del
estimador puntual esté centrada sobre el valor del parámetro a ser
estimado; es decir, el estimador 𝜃̂ no debe subestimar o sobreestimar al
parámetro de interés 𝜃.0
Las distribuciones muestrales para un estimador insesgado y estimador sesgado

se ven en la figura 59. La distribución muestral para el estimador sesgado está
corrida a la derecha del verdadero valor del parámetro. Este estimador sesgado
es más probable que uno insesgado para sobreestimar el valor del parámetro
(Mendenhall, 2010).
Figura 59. Distribuciones para estimadores sesgados e insesgados.

b) Estimador eficiente. La dispersión (medida por la varianza) de la

distribución muestral debe ser tan pequeña como sea posible. Esto
asegura que, con una alta probabilidad, una estimación individual caerá
cerca del valor verdadero del parámetro (Mendenhall, 2010).
28
En la figura 60 se muestra la distribución muestral de dos estimadores: uno con
una varianza pequeña y el otro con una varianza significativamente más alta.
Figura 60. Comparación de la variabilidad de un estimador.

c) Estimador consistente. 𝜃̂ es un estimador consistente de 𝜃, si su

varianza disminuye al aumentar el tamaño de la muestra. Esta condición
garantiza que el error en la estimación disminuya en la medida en que
aumenta el tamaño de la muestra.
En las distribuciones de muestreo de la media y de la proporción, tenemos dos

ejemplos de estimadores que cumplen con las características mencionadas.
Si 𝑥̅ es la media de una muestra grande de tamaño 𝑛, y se utiliza como

estimador puntual de la media poblacional 𝜇, entonces:
• De 𝐸[ 𝑥̅ ] = 𝜇 se concluye que 𝑥̅ es un estimador insesgado de 𝜇.

𝜎2
• De 𝑉𝑎𝑟(𝑥̅ ) = 𝑛
deducimos que 𝑥̅ es consistente, ya que la varianza del
estimador disminuye al aumentar el tamaño de la muestra.
Conclusión: 𝑥̅ es un buen estimador puntual del parámetro 𝜇.

𝑥
De manera similar podemos proceder en la proporción muestral de éxitos 𝑝̂ = 𝑛
utilizada para estimar el parámetro binomial 𝑃.
𝑥 1 1
• 𝐸[ ̂𝑝 ] = 𝐸 [𝑛] = 𝑛 𝐸[𝑥] = 𝑛 (𝑛𝑃) = 𝑃 , 𝑝̂ es un estimador insesgado de 𝑃.
29
𝑥 1 𝑛𝑃𝑄 𝑃𝑄
• 𝑉𝑎𝑟(𝑝̂ ) = 𝑉𝑎𝑟 ( ) = 𝑉𝑎𝑟(𝑥) = = , 𝑝̂ es un estimador consistente ya
𝑛 𝑛2 𝑛2 𝑛
que su varianza disminuye al aumentar el tamaño de la muestra 𝑛.
Conclusión: 𝑝̂ es un buen estimador puntual del parámetro 𝑃.
Ejemplo. Una variable aleatoria X sigue una ley normal con 𝜎 = 1.2 y media 𝜇
desconocida. Si las observaciones: 6.1, 7.2, 8.4, 7.6, 5.6, 7.8, 6.3, 9.1, 7.1, 8.8
constituyen una muestra aleatoria de esa población, encuentre un estimador
puntual para 𝜇.
Solución
La media de la muestra es:

∑ 𝑥 6.1 + 7.2 + 8.4 + 7.6 + 5.6 + 7.8 + 6.3 + 9.1 + 7.1 + 8.8 74
𝑥̅ = = = = 7.4
𝑛 10 10
De acuerdo con lo que hemos señalado, 𝑥̅ es el mejor estimador puntual de 𝜇 que
podemos tener, por tanto:
𝜇 = 𝑥̅ = 7.4 es nuestra estimación puntual
El error estándar de la media es:

𝜎 1.2
𝜎𝑥̅ = = = 0.38
√𝑛 √10
Si hubiéramos tenido 100 observaciones en lugar de 10, el error estándar se
1.2
reduciría a 𝜎𝑥̅ = = 0.12 y la estimación de 𝜇 mediante 𝑥̅ hubiese sido mucho
√100
más precisa y confiable.
14.3 Estimación por intervalo

La estimación de un parámetro a través de un único valor (𝑃 mediante 𝑝̂ o 𝜇
mediante 𝑥̅ ) tiene la desventaja de no disponer de un indicador que señale el
grado de confianza de la estimación (Hernández, 2015).
30
Un procedimiento alternativo de estimación consiste en calcular un intervalo
dentro del cual, considerando cierto riesgo, se esperaría encontrar el verdadero
valor del parámetro.
Si 𝜃 es el parámetro que se va a estimar, el riesgo es la probabilidad de que el

intervalo no contenga ese parámetro. El riesgo se denota por la letra griega 𝛼 y
sus valores usuales son: 1%, 5% y 10%.
La probabilidad complementaria (1 − 𝛼) se llama nivel de confianza del

intervalo y representa la probabilidad de que el intervalo contenga el parámetro
desconocido. Los límites del intervalo, 𝐿1 y 𝐿2 , se denominan límites de
confianza y el intervalo entre los límites, [𝐿1 , 𝐿2 ] , se llama intervalo de
confianza.
De acuerdo con lo anterior, tenemos que:
𝑃(𝐿1 ≤ 𝜃 ≤ 𝐿2 ) = 1 − 𝛼
Por ejemplo, cuando trabajamos con un nivel de confianza del 90% (1 − 𝛼 = 0.90),
esperamos, con un 90% de probabilidad, que el intervalo construido contenga
el verdadero valor del parámetro, y asumimos un riesgo del 10% de que no lo
contenga.
14.3.1 Intervalos de confianza para estimar

medias poblacionales
En el caso de un intervalo de confianza para estimar 𝜇, mediante una muestra
de tamaño grande de tamaño 𝑛 (𝑛 ≥ 30), podemos asociar el siguiente esquema:
31
Figura 61. Límites de confianza para estimar 𝜇.
Fuente: Elaboración propia.
Por el teorema del límite central sabemos que 𝑥̅ es aproximadamente normal

𝜎 𝑥̅ −𝜇
𝑁 (𝜇, ) y, en consecuencia, 𝑍 = 𝜎 es 𝑁(0,1).
√𝑛
√𝑛
Si estandarizamos los límites 𝐿1 y 𝐿2 , obtenemos:
𝑃 (−𝑍𝛼 ≤ 𝑍 ≤ 𝑍𝛼 ) = 1 − 𝛼
2 2
𝑥̅ − 𝜇
𝑃 (−𝑍𝛼 ≤ 𝜎 ≤ 𝑍𝛼2 ) = 1 − 𝛼
2
√𝑛
Al aislar el parámetro 𝜇, en el centro de la desigualdad, tenemos:
𝜎 𝜎
𝑃 (𝑥̅ − 𝑍𝛼 ≤ 𝜇 ≤ 𝑥̅ + 𝑍𝛼 )= 1−𝛼
2 √𝑛 2 √𝑛
En síntesis, la fórmula para calcular un intervalo de confianza para estimar 𝜇 con

un nivel de confianza de (1 − 𝛼) es:
𝜎
𝜇: 𝑥̅ ± 𝑍𝛼 ( )
2 √𝑛
32
El valor de 𝑍𝛼 depende exclusivamente del nivel de confianza con el que se esté
2
trabajando. En la tabla 52 se muestra el detalle del cálculo de 𝑍𝛼 para los tres

2
niveles de confianza más usuales: 90%, 95% y 99%.
Tabla 52: 𝑍𝛼 para los niveles de confianza más usuales

2
Nivel de confianza: 90% Nivel de confianza: 95% Nivel de confianza: 99%
Para obtener los valores mostrados en la tabla 52, debemos dividir entre 2 el
nivel de confianza y luego buscar en la tabla normal el valor de 𝑍 que le
corresponde a esa área.
𝜎
Recordemos que 𝜎𝑥̅ = es el error estándar de la media y depende
√𝑛
exclusivamente de la distribución muestral y no del nivel de confianza del

intervalo que se está calculando.
Al multiplicar el error estándar 𝜎𝑥̅ por el 𝑍𝛼 , obtenemos el error muestral 𝐸.

2
𝜎
𝐸 = 𝑍𝛼 𝜎𝑥̅ = 𝑍𝛼
2 2 √𝑛
En la medida en que se aumenta el nivel de confianza, se aumenta también el
valor de 𝑍𝛼 y por tanto también el error muestral. Esto hace que el intervalo
2
tenga un rango más amplio y que, en consecuencia, exista una mayor

probabilidad de que el intervalo contenga al parámetro 𝜇.
Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99%,
en todos los problemas sobre estimaciones. Después de todo, parece ser que un
33
alto nivel de confianza significa un alto grado de precisión en lo que a la
estimación concierne. En la práctica, sin embargo, altos niveles de confianza
producen intervalos de confianza grandes, y éstos, de hecho, dan estimaciones
bastante imprecisas (Levin, 2004).
En resumen, tenemos:
𝜎
𝜎𝑥̅ = 𝐸𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 =
√𝑛
𝜎
𝐸 = 𝐸𝑟𝑟𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑍𝛼 ( )
2 √𝑛
𝜎 𝜎
𝜇 = [ 𝑥 − 𝑍𝛼 ( ) , 𝑥̅ + 𝑍𝛼 ( )]
2 √𝑛 2 √𝑛
A continuación, se presentan 3 ejemplos del cálculo de intervalos de confianza

en los que se pretenden abarcar las diferentes variantes existentes en el cálculo
de intervalos de confianza para estimar 𝜇.
CASO I. Desviación típica poblacional 𝝈 conocida
Cuando se conoce el valor de 𝜎 (por registros históricos o especificaciones de

𝜎
fabricantes) emplearemos siempre la expresión 𝜎𝑥̅ = sin importar el tamaño
√𝑛
de la muestra.
Ejemplo. La concentración promedio de zinc que se obtiene de una muestra de

36 sitios diferentes de un rio es de 2.6 gramos por mililitro. Si se sabe que la
desviación estándar de la concentración media del rio es de 0.3 gramos por
mililitro.
a) Calcule una estimación puntual para la concentración promedio de zinc en el

rio.
b) Calcule los intervalos de confianza del 95% y del 99% para estimar la
concentración de zinc en el rio
Solución
Datos: 𝑥̅ = 2.6 𝑔𝑟/𝑚𝑙 , 𝜎 = 0.3 𝑔𝑟/𝑚𝑙 , 𝑛 = 36
34
Una primera observación importante es que el enunciado del problema NO indica
que la desviación típica se haya obtenido a partir de la muestra; por tanto,
debemos asumir que se trata de una desviación típica poblacional 𝜎.
a) Sabemos que 𝑥̅ es el mejor estimador puntual para 𝜇, por lo tanto, para

determinar una estimación puntual de la concentración promedio de zinc en el rio,
simplemente debemos hacer:
𝜇 = 𝑥̅ = 2.6 𝑔𝑟/𝑚𝑙
b) Nivel de confianza de 95%
Cálculo del intervalo
𝜎
𝜇 = 𝑥 ± 𝑍𝛼 ( )
2 √𝑛
0.3
𝜇 = 2.6 ± 1.96 ( )
√36
0.3 0.3
𝜇 = [2.6 − 1.96 ( ) , 2.6 + 1.96 ( )]
Figura 62. Cálculo de 𝑍𝛼 . √36 √36
2
Fuente: Elaboración propia. 𝜇 ∈ [ 2.502, 2.698 ] 𝑔𝑟/𝑚𝑙
Nivel de confianza del 99%
𝜎
𝜇 = 𝑥 ± 𝑍𝛼 ( )
2 √𝑛
0.3
𝜇 = 2.6 ± 2.575 ( )
√36
0.3 0.3
𝜇 = [2.6 − 2.575 ( ) , 2.6 + 2.575 ( )]
Figura 63. Cálculo de 𝑍𝛼 . √36 √36
2
Fuente: Elaboración propia. 𝜇 ∈ [ 2.4713, 2.7288 ] 𝑔𝑟/𝑚𝑙
35
En el ejemplo anterior puede observarse que, al aumentar el nivel de confianza
también aumenta la amplitud del intervalo.
CASO II. Desviación típica poblacional 𝝈 desconocida
Cuando no se conoce la desviación típica poblacional 𝜎 puede ocurrir cualquiera

de las siguientes situaciones:
a) Si se tiene una muestra grande (𝑛 ≥ 30)
En esta situación, el teorema del límite central nos habilita para usar 𝑠 como un
estimador puntual de 𝜎; es decir, podemos hacer:
∑(𝑥𝑖 − 𝑥̅ )2
𝜎=𝑠=√
𝑛−1
b) Si se tiene una muestra pequeña (𝑛 < 30)
En este caso no podremos realizar la estimación puntual 𝜎 = 𝑠 y 𝑥̅ ya no

obedecería a la distribución normal sino a la distribución 𝑡 de student (esta
distribución se abordará en la clase 16).
Ejemplo. Para estimar el tiempo promedio que emplea al montar cierto tipo de
componente de computadora, un ingeniero industrial de una compañía electrónica
midió el tiempo de montaje a 40 técnicos. La media que obtuvo fue de 12.73
minutos y una desviación estándar de 2.06 minutos.
a) Calcular el error estándar de la media

b) Hallar un intervalo de confianza del 90% para la media poblacional
Solución
Datos: 𝑥̅ = 12.73 𝑚𝑖𝑛 , 𝑠 = 2.06 𝑚𝑖𝑛 , 𝑛 = 40
El enunciado del ejercicio nos proporciona la desviación típica muestral 𝑠; sin

embargo, como estamos trabajando con una muestra grande, podemos usar 𝑠
como un estimador puntual de 𝜎. Por tanto:
𝜎 = 𝑠 = 2.06 min → ya que 𝑛 ≥ 30
𝜎 2.06
a) 𝜎𝑥̅ = = = 0.3257
√𝑛 √40
36
b) Nivel de confianza de 90%
𝜎
𝜇 = 𝑥 ± 𝑍𝛼 ( )
2 √𝑛
2.06
𝜇 = 12.73 ± 1.645 ( )
√40
[12.73 − 0.5358, 12.73 + 0.5358]
Figura 63. Cálculo de 𝑍𝛼 .
2
𝜇 ∈ [ 12.1942, 13.2658 ] 𝑚𝑖𝑛
CASO III. Población finita

𝑛
Cuando se conoce el tamaño de la población 𝑁 y además 𝑁
≥ 0.05, entonces es
necesario multiplicar el error estándar por el factor de corrección para

poblaciones finitas, tal y como vimos en la clase anterior.
𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁−1
En el siguiente video se presenta un ejemplo sobre cómo

calcular intervalos de confianza usando el factor de
corrección para poblaciones finitas.
Guillermo Calderón. (19 de agosto de 2020). Intervalos de

confianza para estimar medias poblacionales. [archivo de
video]. Recuperado de https://youtu.be/9gxTITRNFLg
37
14.3.2 Intervalos de confianza para estimar
proporciones poblacionales
De acuerdo con la distribución
muestral para proporciones
𝑝̂ − 𝑃
𝑍=
√𝑃𝑄
𝑛
se distribuye de manera
aproximadamente normal
estándar cuando el tamaño de la Figura 64. Límites de confianza para estimar 𝑃.
muestra 𝑛 es grande. Fuente: Elaboración propia
Como no se conoce el valor del parámetro 𝑃, entonces debe usarse el estimador

𝑝̂ en la expresión anterior.
El procedimiento para determinar una expresión de intervalo de confianza para

𝑃, con un nivel de confianza (1 − 𝛼), es similar al que seguimos para la media 𝜇.
Al estandarizar los límites 𝐿1 y 𝐿2 de la figura 64, se obtiene:
𝑃 (−𝑍𝛼 ≤ 𝑍 ≤ 𝑍𝛼 ) = 1 − 𝛼
2 2
𝑝̂ − 𝑃
𝑃 −𝑍𝛼 ≤ ≤ 𝑍𝛼 =1−𝛼
√𝑝̂ 𝑞̂
2 2
( 𝑛 )
Al aislar el parámetro 𝑃, en el centro de la desigualdad, se tiene:
𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝑃 (𝑝̂ − 𝑍𝛼 √ ≤ 𝑃 ≤ 𝑝̂ + 𝑍𝛼 √ ) = 1 − 𝛼
2 𝑛 2 𝑛
En síntesis, la fórmula para calcular un intervalo de confianza para estimar 𝑃 con

un nivel de confianza de (1 − 𝛼) es:
̂ 𝑞̂
𝑝
𝑃: 𝑝̂ ± 𝑍𝛼 √
2 𝑛
38
𝑝̂ 𝑞̂
Recordemos que 𝜎𝑝̂ = √ es el error estándar de la proporción y depende
𝑛
exclusivamente de la distribución muestral y no del nivel de confianza del

intervalo que se está calculando.
𝑛
Cuando se conoce el tamaño de la población 𝑁 y además 𝑁
≥ 0.05, entonces es
necesario multiplicar el error estándar por el factor de corrección para

poblaciones finitas, tal y como lo hicimos en los intervalos de confianza para
estimar 𝜇.
̂ 𝑞̂
𝑝 𝑁−𝑛
𝜎𝑝̂ = √ √
𝑛 𝑁−1
Al multiplicar el error estándar 𝜎𝑝̂ por el 𝑍𝛼 , obtenemos el error muestral 𝐸.

2
𝑝̂ 𝑞̂
𝐸 = 𝑍𝛼 𝜎𝑝̂ = 𝑍𝛼 √
2 2 𝑛
Ejemplo. Los resultados de una prueba de matemáticas, aplicada a una muestra

de 400 bachilleres recién graduados, mostró que 43% no podía despejar
correctamente una variable específica de una fórmula dada.
a) Determine la estimación puntual de la proporción de recién graduados de

bachillerato que no saben despejar una variable.
b) Hallar un intervalo de confianza del 93% para la proporción de la población de

bachilleres que no saben despejar una variable.
c) ¿Cuál es el margen de error asociado con la estimación en b)?
Solución
Datos: 𝑝̂ = 0.43 , 𝑞̂ = 1 − 𝑝̂ = 0.57 , 𝑛 = 400
a) Sabemos que 𝑝̂ es el mejor estimador puntual para 𝑃, por lo tanto, para

determinar una estimación puntual de la proporción de bachilleres recién
graduados que no saben despejar una variable, simplemente debemos hacer:
39
𝑃 = 𝑝̂ = 0.43
b) Intervalo de confianza del 93%
̂ 𝑞̂
𝑝
𝑃 = 𝑝̂ ± 𝑍𝛼 √
2 𝑛
(0.43)(0.57)
𝑃 = 0.43 ± 1.81 √
Figura 65. Cálculo de 𝑧𝛼 .
400
2
Fuente: Elaboración propia. 𝑃 = [0.43 − 0.0448, 0.43 + 0.0480]
P ∈ [ 0.3852, 0.4748 ]
c) El error muestral es:
𝑝̂ 𝑞̂ (0.43)(0.57)
𝐸 = 𝑍𝛼 √ = 1.81 √ = 0.0448 ≅ 4.5%
2 𝑛 400
En el siguiente video se presenta un ejemplo del cálculo de

un intervalo de confianza para estimar proporciones
poblacionales.
Guillermo Calderón. (19 de agosto de 2020). Intervalos de

confianza para estimar proporciones poblacionales.
[archivo de video]. Recuperado de
https://youtu.be/anFopLvhXhc
40
14.4 Elección del tamaño de una muestra
Antes de llevar a cabo una investigación por muestreo, el investigador debe
conocer el tamaño de la muestra con la cual trabajará. La elección del tamaño
de la muestra es un procedimiento muy importante puesto que el uso de una
muestra demasiado grande implica costos elevados y no siempre aportará mayor
exactitud en los resultados; por otra parte, el tamaño de la muestra es
demasiado pequeño se puede llegar a resultados no válidos o poco significativos.
En general, la elección del tamaño adecuado de una muestra dependerá de los

siguientes factores técnicos:
1. El margen de error máximo (error muestral) que tolerará el investigador.

2. El nivel de confianza deseado.
3. La variabilidad o dispersión de la población en estudio.
El margen de error que un investigador puede tolerar depende de qué tan crítico
es el parámetro que se está estimando. Algunas tareas extremadamente
delicadas requieren de resultados exactos: los procedimientos médicos vitales
de los cuales dependen vidas humanas, o la producción de piezas de una
máquina que deba cumplir medidas precisas, pueden tolerar sólo un pequeño
error. En otros casos, los errores más grandes pueden tener consecuencias
menos graves (Webster, 2001).
14.4.1 Tamaño de la muestra para estimar una

media poblacional
El error muestral en el cálculo de un intervalo para estimar 𝜇 con un nivel de
confianza de (1 − 𝛼) es:
𝜎
𝐸 = 𝑍𝛼 ( )
2 √𝑛
41
Al despejar 𝑛 de esta expresión, se obtiene:
2
𝑍𝛼 𝜎
2
𝑛=( )
𝐸
Si el resultado de este cálculo no es un número entero, entonces debe

redondearse al entero inmediato superior.
En la expresión anterior, 𝐸 es el error máximo que el investigador está dispuesto

a aceptar (error muestral) y el valor de 𝑧𝛼 depende exclusivamente del nivel de
2
confianza que se va a usar para calcular la estimación por intervalo. Nótese que
para usar esta ecuación es necesario contar con el valor de la desviación
estándar poblacional 𝜎 (de registros históricos); sin embargo, cuando este valor
no se conozca, puede estimarse mediante la desviación estándar muestral 𝑠,
utilizando una muestra piloto de cualquier tamaño razonable (𝑛 ≥ 30).
En el caso de una población finita de tamaño 𝑁, el error muestral incluye al

factor de corrección, así:
𝜎 𝑁−𝑛
𝐸 = 𝑍𝛼 √
2 √𝑛 𝑁−1
Despejemos 𝑛 de esta expresión:
𝜎2 𝑁 − 𝑛 Elevando al cuadrado ambos términos

𝐸2 = 𝑍2 ( )
𝑛 𝑁−1
𝐸 2 𝑛(𝑁 − 1) = 𝑍 2 𝜎 2 (𝑁 − 𝑛)
𝐸 2 𝑛(𝑁 − 1) = 𝑍 2 𝜎 2 𝑁 − 𝑍 2 𝜎 2 𝑛
Distribuyendo el producto del miembro
𝐸 2 𝑛(𝑁 − 1) + 𝑍 2 𝜎 2 𝑛 = 𝑍 2 𝜎 2 𝑁 derecho
𝑛[𝐸 2 (𝑁 − 1) + 𝑍 2 𝜎 2 ] = 𝑍 2 𝜎 2 𝑁 Factor común 𝑛 en el miembro izquierdo
𝑍2𝜎2𝑁
𝑛= 2
𝐸 (𝑁 − 1) + 𝑍 2 𝜎 2
42
Ejemplo. Se quiere estimar mediante muestreo el kilometraje promedio de los
vehículos en uso de varios ministerios públicos. De registros anteriores se ha
obtenido que un estimador aceptable de la desviación estándar de la población es
de 8600 kilómetros. Se desea que el error de la estimación no sea mayor de 1200
kilómetros para un nivel de confianza del 90%.
a) Determinar el tamaño de la muestra apropiado
b) Determinar el tamaño de la muestra si sabemos que la población es de 930

vehículos
Solución
Datos: 𝜎 = 8600 𝑘𝑚 , 𝐸 = 1200 𝑘𝑚 , (1 − 𝛼) = 0.90
a) Para un nivel de confianza del 90% el valor de 𝑍𝛼 que debe usarse es 1.645
2
(ver tabla 52), por lo tanto:
𝑍𝛼 𝜎 2 1.645 × 8600 2
𝑛=( 2 ) =( ) = 138.98 ≅ 139
𝐸 1200
b) Con 𝑁 = 930, se tiene:
𝑍2𝜎 2𝑁 (1.645)2 (8600)2 (930)

𝑛= = = 121.02 ≅ 122
𝐸 2 (𝑁 − 1) + 𝑍 2 𝜎 2 12002 (930 − 1) + (1.645)2 (8600)2
Nótese que al conocer el tamaño de la población 𝑁, el tamaño de la muestra 𝑛

disminuye (manteniendo constantes los otros datos). Piense cómo cambiaría el
tamaño de la muestra 𝑛 al aumentar el nivel de confianza al 95% o al reducir el
error muestral a 1000 kilómetros.
14.4.2 Tamaño de la muestra para estimar una

proporción poblacional
Partimos de la expresión del error muestral que usamos para calcular intervalos
de confianza para estimar proporciones poblacionales:
43
𝑝̂ 𝑞̂
𝐸 = 𝑍𝛼 √
2 𝑛
Al despejar el tamaño de la muestra 𝑛, se obtiene:
𝑍 2 𝑝̂ 𝑞̂
𝑛=
𝐸2
Esta fórmula requiere el valor de los estimadores 𝑝̂ y 𝑞̂. Si no se dispone de estos

valores, pueden obtenerse mediante una muestra piloto. Si no fuera posible
realizar un muestreo piloto, entonces se puede asumir que 𝑝̂ = 0.5 y
𝑞̂ = 1 − 𝑝̂ = 0.5; con esto se asegura el máximo tamaño de la muestra, ya que el
producto 𝑝̂ × 𝑞̂ alcanza su valor máximo cuando 𝑝̂ y 𝑞̂ valen 0.5.
En el caso de una población finita de tamaño 𝑁, el error muestral incluye al

factor de corrección, así:
𝑝̂ 𝑞̂ 𝑁 − 𝑛
𝐸 = 𝑍𝛼 √ √
2 𝑛 𝑁−1
Despejemos 𝑛 de esta expresión:
𝑝̂ 𝑞̂ 𝑁−𝑛 Elevando al cuadrado ambos términos

𝐸2 = 𝑍2 ( )( )
𝑛 𝑁−1
𝐸 2 𝑛(𝑁 − 1) = 𝑍 2 (𝑝̂ 𝑞̂)(𝑁 − 𝑛)

𝐸 2 𝑛(𝑁 − 1) = 𝑍 2 𝑝̂ 𝑞̂ 𝑁 − 𝑍 2 𝑝̂ 𝑞̂ 𝑛 Distribuyendo el producto del miembro derecho
2 2 2
𝐸 𝑛(𝑁 − 1) + 𝑍 𝑝̂ 𝑞̂ 𝑛 = 𝑍 𝑝̂ 𝑞̂ 𝑁
𝑛[𝐸 2 (𝑁 − 1) + 𝑍 2 𝑝̂ 𝑞̂] = 𝑍 2 𝑝̂ 𝑞̂ 𝑁 Factor común 𝑛 en el miembro izquierdo
𝑍 2 𝑝̂ 𝑞̂ 𝑁
𝑛=
𝐸 2 (𝑁 − 1) + 𝑍 2 𝑝̂ 𝑞̂
44
Ejemplo. Un ingeniero industrial labora en el departamento de control de calidad
de una empresa y está interesado en saber el porcentaje de artículos defectuosos
de la producción mensual de la empresa. Para ello decide tomar una muestra
aleatoria de la producción mensual de artículos de tal manera que el error de
estimación no sea mayor del 4% con una probabilidad del 95%. Determine cuál
debe ser el tamaño de la muestra, si:
a) No se dispone de ninguna información.
b) Se sabe que la proporción de artículos defectuosos de los meses anteriores ha

sido del 12%.
c) Se sabe que la proporción de artículos defectuosos de los meses anteriores ha

sido del 12% y que la producción mensual es de 𝑁 = 500 artículos.
Solución
Datos: 𝐸 = 0.04 , (1 − 𝛼) = 0.95
a) Para un nivel de confianza del 95% el valor de 𝑍𝛼 que debe usarse es 1.96 (ver
2
tabla 52). Dado que no tenemos información sobre las estimaciones iniciales,
usamos 𝑝̂ = 0.5 𝑦 𝑞̂ = 0.5
𝑍 2 𝑝̂ 𝑞̂ (1.96)2 (0.5)(0.5)
𝑛= = = 600.25 ≅ 601
𝐸2 (0.04)2
b) Usando los estimadores 𝑝̂ = 0.12 𝑦 𝑞̂ = 1 − 𝑝̂ = 0.88, tenemos:
𝑍 2 𝑝̂ 𝑞̂ (1.96)2 (0.12)(0.88)
𝑛= = = 253.55 ≅ 254
𝐸2 (0.04)2
c) Al usar los estimadores 𝑝̂ 𝑦 𝑞̂ y el tamaño de la población 𝑁 = 500, se tiene:
𝑍 2 𝑝̂ 𝑞̂ 𝑁 (1.96)2 (0.12)(0.88)(500)
𝑛= = = 168.46 ≅ 169
𝐸 2 (𝑁 − 1) + 𝑍 2 𝑝̂ 𝑞̂ 0.042 (500 − 1) + (1.96)2 (0.12)(0.88)
En este problema podemos observar que la incorporación de algún conocimiento
previo sobre la población puede disminuir sensiblemente el tamaño de la
muestra.
45
Clase 15| Prueba de hipótesis
15. Prueba de hipótesis
Habitualmente el problema al que se enfrentan los científicos e ingenieros no es
tanto la estimación de un parámetro poblacional, sino el diseño de un
procedimiento de decisión que se base en datos experimentales y que pueda
producir una conclusión acerca de algún sistema científico. Por ejemplo, un
ingeniero quizás tenga que decidir, con base en datos muestrales, si hay alguna
diferencia en la productividad de dos tipos de máquinas; o tal vez un
investigador médico puede decidir, con base en evidencia experimental, si el
consumir bebidas alcohólicas incrementa el riesgo de sufrir diabetes en los seres
humanos. En cada uno de estos casos el científico o ingeniero postula o
conjetura algo acerca de un sistema, para después utilizar datos experimentales
y tomar una decisión basada en ellos.
Una hipótesis estadística o simplemente hipótesis es

una conjetura o aseveración sobre el valor de uno o varios
parámetros poblacionales o sobre la forma de una
distribución de probabilidad completa (Devore, 2008).
Algunos ejemplos de hipótesis estadísticas son:
▪ El promedio del coeficiente intelectual de los estudiantes de la Universidad

Don Bosco es de 104.
▪ La proporción de objetos defectuosos producidos por cierto proceso nunca

es superior al 8%.
▪ Cálculo de varias variables es la asignatura que más dificultad presenta al

estudiante de ingeniería de la UDB.
▪ El rendimiento académico promedio de los grupos nocturnos es inferior al

rendimiento promedio de los grupos diurnos en la facultad de ingeniería
de la UDB.
46
Con los ejemplos anteriores, puede observar que las hipótesis, tal como están
formuladas, son meras suposiciones, y que, por lo tanto, tienen que someterse
a comprobación, ya que estas pueden ser o no verdaderas.
Un medio seguro para probar una hipótesis es investigar a toda la población; sin
embargo, esto es impráctico en la mayoría de las situaciones y a veces casi
imposible.
La estrategia más razonable es tomar una muestra aleatoria de la población en

estudio, y con base en la información proporcionada por esta muestra se podrá
decidir, con un determinado nivel de confianza, si la hipótesis se acepta o se
rechaza. A este procedimiento se le denomina prueba de hipótesis.
15.1 Generalidades de la prueba de hipótesis
15.1.1 Tipos de hipótesis

Desde el punto de vista metodológico, una prueba de hipótesis estadística se
formula planteando dos hipótesis:
▪ Hipótesis nula: es la hipótesis que el investigador se propone a rechazar.

Esta hipótesis representa una “creencia previa” o el “statu quo” y es
aceptada provisionalmente como verdadera. Se simboliza por 𝐻0 .
▪ Hipótesis alternativa: constituye “la teoría” que el investigador está

interesado en probar o aceptar. Se simboliza por 𝐻1 .
Ambas hipótesis son complementarias, ya que el rechazo de una supone la

aceptación de la otra.
La hipótesis nula es la que se somete a prueba y se mantiene como verdadera,

mientras no existan evidencias que demuestren que es falsa. La hipótesis
alternativa o hipótesis alterna se aceptará como verdadera cuando los resultados
de la muestra evidencien que la nula es falsa (Hernández, 2015).
47
El razonamiento empleado en una prueba de hipótesis es similar a un juicio en
un tribunal. Al procesar a una persona por robo (en la analogía, esta sería la
hipótesis nula), el tribunal debe decidir entre inocencia y culpabilidad. Cuando
el juicio se inicia, se supone que la persona acusada es inocente. El proceso
recaba y presenta toda evidencia disponible en un intento para contradecir la
hipótesis de inocencia y por tanto obtener una condena. Si hay evidencia
suficiente contra inocencia, el tribunal rechazará la hipótesis de inocencia y
declarará culpable al demandado. Si el proceso no presenta suficiente evidencia
para demostrar que el demandado es culpable, el tribunal le hallará no culpable
(Mendenhall, 2010). Note que esto no demuestra que el demandado es inocente,
sino sólo que no hubo evidencia suficiente para concluir que el demandado era
culpable.
Ejemplo. Formular la hipótesis nula 𝐻0 y la hipótesis alterna 𝐻1 en cada una de

las siguientes situaciones.
a) Una máquina debe llenar y empacar bolsas de dos libras de azúcar refinada.
Se cree que las bolsas contienen menos de esa cantidad.
𝐻0 : 𝜇 = 2
𝐻1 : 𝜇 < 2
b) Una firma independiente, que realiza encuestas de opinión, asegura que el
candidato del partido X cuenta con el 35% del electorado. No obstante, el partido
del candidato quiere probar que el porcentaje es mayor.
𝐻0 : 𝑃 = 0.35
𝐻1 : 𝑃 > 0.35
c) Una máquina elabora piezas mecánicas cuyo diámetro debe ser de 4 mm. Se
sospecha que la máquina no está funcionando correctamente.
𝐻0 : 𝜇 = 4
𝐻1 : 𝜇 ≠ 4
d) El rendimiento promedio de cada manzana cultivada, medido en quintales de
producción, es diferente cuando se utiliza el fertilizante X o el fertilizante Y.
𝐻0 : 𝜇𝑥 = 𝜇𝑦
𝐻1 : 𝜇𝑥 ≠ 𝜇𝑦
48
Nótese que, en todos estos ejemplos, la hipótesis nula 𝐻0 representa la creencia
previa sobre el parámetro poblacional y tradicionalmente contiene alguna
referencia de un signo de igualdad como “=”, “≥”, “≤”.
La formulación correcta de las hipótesis es un paso fundamental en el proceso

de prueba. Una estrategia que se puede sugerir consiste en razonar y plantear
inicialmente la hipótesis alternativa.
15.1.2 Nivel de significancia de la prueba

La lógica que se sigue en prueba de hipótesis es muy particular. La hipótesis
nula 𝐻0 recibe el favor de la prueba, en el sentido que se le asigna una
probabilidad muy alta de no rechazo. La hipótesis alterna 𝐻1 recibe el rigor de la
prueba, y se le asigna una probabilidad de aceptación muy baja (Hernández,
2015).
Estas probabilidades son, al igual que las hipótesis, complementarias. Se

acostumbra a denotar por (1 − 𝛼) a la probabilidad de aceptar 𝐻0 y por 𝛼 a la
probabilidad de aceptar 𝐻1 . Al valor 𝛼 se le denomina “nivel de significancia
de la prueba” y técnicamente se interpreta como la probabilidad de rechazar
𝐻0 cuando esta es verdadera.
Los niveles usuales de significancia para las pruebas son: 10%, 5% y 1% o lo

que es lo mismo, 𝛼 = 0.10, 𝛼 = 0.05 y 𝛼 = 0.01.
15.1.3 Tipos de errores en prueba de hipótesis

Al tomar la decisión de aceptar o rechazar la hipótesis nula 𝐻0 pueden cometerse
dos tipos de errores.
▪ Error tipo I: rechazar la hipótesis nula cuando es verdadera (error 𝛼).
▪ Error tipo II: aceptar la hipótesis nula cuando realmente no es verdadera

(error 𝛽).
49
La probabilidad de cometer un error tipo I se llama nivel de significancia.
Tabla 53: Tipos de errores en prueba de hipótesis
Fuente: por Lind (2012)
15.1.4 Tipos de pruebas de hipótesis

El tipo de prueba de hipótesis depende básicamente de la hipótesis alterna 𝐻1 .
• La prueba de hipótesis 𝐻0 : 𝜃 = 𝜃0 contra 𝐻1 : 𝜃 ≠ 𝜃0 se denomina prueba

bilateral o de dos colas.
• La prueba de hipótesis 𝐻0 : 𝜃 = 𝜃0 contra 𝐻1 : 𝜃 < 𝜃0 se denomina prueba
unilateral de cola a la izquierda.
• La prueba de hipótesis 𝐻0 : 𝜃 = 𝜃0 contra 𝐻1 : 𝜃 > 𝜃0 se denomina prueba
unilateral de cola a la derecha.
15.1.5 Procedimiento para probar hipótesis

En esta asignatura usaremos un procedimiento en 4 pasos para probar cualquier
tipo de hipótesis:
1. Planteamiento de las hipótesis. Debe formularse la hipótesis nula 𝐻0 y

la hipótesis alterna 𝐻1 . Recuerde que la hipótesis nula siempre debe
contener el signo de igualdad (=, ≤ 𝑜 ≥).
2. Definir límites de aceptación y rechazo. La curva normal

correspondiente a la distribución muestral de 𝜃̂ se divide en dos zonas: la
50
zona de aceptación y la zona de rechazo. La zona de rechazo tiene un
área correspondiente a 𝛼 (el nivel de significancia) y su posición en la
curva normal está dada por la hipótesis alterna 𝐻1 . El valor de 𝑍 que está
en la frontera de ambas zonas se conoce como valor critico o valor
frontera.
3. Calcular el estadístico de contraste. Usando los datos de la muestra

se calcula el estadístico de contraste o estadístico de prueba y se ubica en
la curva normal.
4. Tomar una decisión. Se verifica la ubicación del estadístico de contraste

en la curva normal para tomar la decisión de rechazar o aceptar la
hipótesis nula.
15.2 Prueba de hipótesis referente a una media

poblacional
En esta sección discutiremos el procedimiento de prueba de hipótesis referente
a una media poblacional con una desviación típica 𝜎 conocida. En la tabla 54 se
presentan los 4 pasos de la prueba de hipótesis referente a medias poblacionales
para cada uno de los 3 tipos posibles de prueba.
Tabla 54: Prueba de hipótesis referente a una media poblacional
Pruebas bilaterales Pruebas unilaterales con Pruebas unilaterales con

cola a la izquierda cola a la derecha
1. Planteamiento de la hipótesis
𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 > 𝜇0
2. Definir límites de aceptación y rechazo
51
3. Calcular estadístico de contraste
𝑋̅ − 𝜇0
𝑍𝑐 = 𝜎
√𝑛
4. Tomar una decisión
Aceptar 𝐻0 si: |𝑍𝑐 | ≤ |𝑍𝛼⁄ | Aceptar 𝐻0 si: 𝑍𝑐 ≥ 𝑍𝛼 Aceptar 𝐻0 si: 𝑍𝑐 ≤ 𝑍𝛼

2
Rechazar 𝐻0 si: 𝑍𝑐 < 𝑍𝛼 Rechazar 𝐻0 si: 𝑍𝑐 > 𝑍𝛼

Rechazar 𝐻0 si: |𝑍𝑐 | > |𝑍𝛼⁄ |
2
En la siguiente lista de reproducción se presentan algunos

ejemplos sobre prueba de hipótesis referente a medias
poblacionales
Guillermo Calderón. (20 de agosto de 2020). Prueba de

hipótesis referente a medias poblacionales. [archivo de
video]. Recuperado de
https://www.youtube.com/playlist?list=PLtqGwSACq5Q3_
h0_fjEf4HlKQ6IGTVAvy
15.3 Prueba de hipótesis referente a una

proporción poblacional
Para realizar pruebas de hipótesis referentes a proporciones poblacionales
usaremos el mismo procedimiento en cuatro pasos que estudiamos en la sección
anterior.
52
En este caso, el estadístico de contraste estaría dado por:
𝑝̂ − 𝑃0
𝑍𝑐 =
√𝑃0 𝑄0
𝑛
Ejemplo. Un fabricante de arandelas afirma que al menos el 95% de su

producción cumple con las especificaciones requeridas. Si se examinan una
muestra de 150 piezas y encontramos que 12 de ellas resultaron defectuosas,
¿podemos decir que el dato muestral proporciona suficiente evidencia para
rechazar la afirmación del fabricante? Utilice un nivel de significancia del 5%.
Solución
Sea: 𝑋 = Número de arandelas que cumplen la especificación

𝑥 150−12
Datos: 𝑛 = 150 , 𝑝̂ = 𝑛 = 150
= 0.92
Inicialmente aceptamos como válida la afirmación del fabricante y estamos

interesados en rechazar dicha afirmación, por tanto:
𝐻0 : 𝑃 ≥ 0.95 (al menos 95%)
𝐻1 : 𝑃 < 0.95
53
La hipótesis alterna 𝐻1 nos indica que

debemos realizar una prueba con cola a
la izquierda.
Nótese que el valor de 𝑍𝛼 debe ser

negativo puesto que esta en la cola
izquierda de la curva normal.
En la figura 65 podemos ver que Fuente: Elaboración propia.
𝑍𝛼 = −1.645
𝑝̂ − 𝑃0 0.92 − 0.95
𝑍𝑐 = = = −1.69
𝑃0 𝑄0
√ √(0.95)(0.05)
𝑛 150
4. Tomar una decisión.
Dado que 𝑍𝑐 < 𝑍𝛼 rechazamos la hipótesis nula 𝐻0
−1.69 < −1.645
Esto también puede concluirse al observar que el estadístico de prueba 𝑍𝑐 = −1.69

se ubica en la zona de rechazo.
Conclusión: Al 5% de significancia, se rechaza la afirmación del fabricante,

menos del 95% de la producción cumplen las especificaciones.
Otra metodología para probar hipótesis es el uso del “p

valor”. En el siguiente video se explica qué es el p-valor y
como usarlo en una prueba de hipótesis.
KhanAcademyEspañol. (12 de febrero de 2018). Valores P

y pruebas de significancia. [archivo de video]. Recuperado
de https://youtu.be/bBfDemiDgP4
54
Clase 16| Muestreo pequeño
16. Muestreo pequeño
En las dos clases anteriores estudiamos métodos de estimación de parámetros
y prueba de hipótesis, con base en muestras grandes (𝐧 ≥ 𝟑𝟎); sin embargo, en
ciertos escenarios es necesario hacer inferencias usando muestras pequeñas por
razones de tiempo y reducción de costos. Por ejemplo, para un fabricante
automotriz que esté probando la resistencia al impacto de los autos en su último
modelo, destruir a propósito 30 vehículos de lujo puede volverse muy costoso e
innecesario; para un laboratorio médico que quiere probar su nueva vacuna
contra un virus, encontrar 30 personas dispuestas a actuar como conejillo de
indias puede resultar muy complicado.
En muchos casos una muestra grande no es posible. En estos casos, los

procedimientos vistos para muestras grandes resultan inadecuados y se requiere
de otros procedimientos de estimación y pruebas de hipótesis. En esta clase
abordaremos varios procedimientos basados en pruebas pequeñas (𝒏 < 𝟑𝟎).
Estos procedimientos están muy relacionados con los de muestras grandes ya
vistos en las clases anteriores. En particular, estudiaremos los procedimientos
de estimación por intervalos y prueba de hipótesis sobre medias poblacionales.
16.1 La distribución t de Student

Si 𝑋̅ es la media de una muestra grande de tamaño 𝑛 de una población con media
𝜇 y desviación típica 𝜎, entonces el teorema del límite central especifica que el
𝑋̅−𝜇
estadístico 𝑍 = 𝜎 es exactamente normal estándar. Además, la desviación
⁄ 𝑛
√
∑(𝑥𝑖 −𝑥̅ )2
estándar muestral 𝑠 = √ 𝑛−1
estará cerca de la desviación estándar poblacional
𝑋̅ −𝜇
𝜎 y, por lo tanto, el estadístico 𝑍 = 𝑠 es aproximadamente normal estándar,
⁄ 𝑛
√
55
por lo que se pueden buscar las probabilidades relacionadas con esta cantidad
en la tabla normal estándar (tabla 𝑍).
¿Qué se puede hacer si 𝑋̅ es la media de una muestra pequeña (𝑛 < 30) extraída
de una población con 𝜎 desconocida? En este caso, 𝑠 podría no estar cercano a
𝜎, y 𝑋̅ puede no ser aproximadamente normal. Si no se sabe nada sobre la
población de la que se extrajo la muestra, entonces no hay ningún método fácil
para hacer inferencias; sin embargo, si la población es aproximadamente
normal, 𝑋̅ lo será incluso cuando el tamaño de la muestra 𝑛 sea pequeño. Lo
𝑋̅−𝜇
anterior propicia que aún se pueda usar el estadístico 𝑠 , pero debido a que 𝑠
⁄ 𝑛
√
puede no estar cercana a 𝜎, esta cantidad NO tendrá distribución normal

estándar. En su lugar, tiene la distribución 𝒕 de Student con 𝑛 − 1 grados de
libertad.
La distribución 𝑡 de Student fue desarrollada en 1908 por William Gossett, un

estadístico que trabajó en la cervecería Guinness, en Dublin Irlanda. La dirección
de la cervecería consideró que el descubrimiento era información privada y
prohibió a Gossett que lo publicara. Aun así, él lo publicó, usando el seudónimo
“estudiante” (Navidi, 2006).
Distribución 𝒕 de Student
La distribución t es una familia de distribuciones de probabilidad similar, y cada

una depende de un parámetro conocido como grados de libertad.
Los grados de libertad (𝒗) se definen como el número de observaciones que se

pueden escoger libremente.
𝑣 =𝑛−1
La distribución t se utiliza cuando se cumplen las 3 condiciones siguientes:
1. La muestra es pequeña (𝑛 < 30).
2. 𝜎 es desconocida.
3. La población de la que se extrajo la muestra es normal o casi normal.
56
Si 𝜎 es conocida, la distribución 𝑍 se usa inclusive si la muestra es pequeña.
Además, si no puede asumirse una población normal, debe aumentarse el
tamaño de la muestra para utilizar la distribución Z.
La decisión de utilizar un estadístico 𝑍 o 𝑡 es crucial. La figura 66 muestra las

situaciones en las que debe usarse uno u otro.
Figura 66. Selección del estadístico apropiado para estimar 𝜇.

57
16.1.1 Propiedades matemáticas de la
distribución t
Algunas propiedades matemáticas de la distribución 𝑡 son:
▪ Al igual que la distribución 𝑍, la distribución 𝑡 tiene una media de cero, es
simétrica respecto a la media y oscila entre −∞ y +∞.
𝑣+1
−
𝑡2 1
▪ La función de densidad de la distribución 𝑡 es 𝑓(𝑡) = 𝐴 (1 + 𝑣
)
donde 𝑣 = 𝑛 − 1 son los grados de libertad de la distribución. La constante

𝐴 hace que el área bajo el gráfico sea igual a la unidad.
▪ Para cada valor de 𝑣, existe una particular distribución de probabilidad de

t.
▪ La curva de la función de densidad de t tiene forma de campana con su

centro en 0. En general, esta curva está más esparcida que la curva 𝑍;
pero a medida en que 𝑣 aumenta la secuencia de curvas de t tienden a la
curva normal estándar (figura 67).
Figura 67. Comparación de la distribución normal estándar con las

distribuciones 𝑡 para 10 y 20 grados de libertad. Fuente: por Anderson (2008)
58
16.1.2 Uso de la tabla t
Los valores críticos 𝑡(𝛼, 𝑣) para los grados de libertad adecuados se encuentran
en la tabla de la distribución 𝑡 (ver tabla 55). Esta tabla difiere en su construcción
de la tabla 𝑍 que usamos antes. Las columnas de la tabla presentan algunos
valores para el área 𝛼 de la cola derecha o izquierda de la curva 𝑡. Las filas de
la tabla representan los grados de libertad 𝑣. Los valores críticos se encuentran
en las celdas de la tabla.
Por ejemplo:
𝑡(0.05, 17) = 1.74
significa que para 𝑣 = 17
grados de libertad,
𝑃(𝑡 ≥ 1.74) = 0.05
Figura 68. Uso de la tabla 𝑡.

Tabla 55: Fragmento de la tabla t
59
16.2 Intervalos de confianza para muestras
pequeñas (𝜎 desconocida)
Para construir el intervalo con un nivel de
confianza 1 − 𝛼 y con 𝑣 = 𝑛 − 1 grados de
libertad, emplearemos la siguiente
expresión:
𝑠
𝜇 = 𝑋̅ ± 𝑡(𝛼/2,𝑣)
√𝑛
La expresión para calcular la desviación Figura 69. Intervalos de confianza
estándar muestral es: con la distribución 𝑡.
∑(𝑥𝑖 − 𝑥̅ ) Fuente: por Navidi (2008)
𝑠=√
𝑛−1
Ejemplo. Un químico realizó 8 mediciones independientes del punto de fusión del

tungsteno. Obtuvo una media muestral de 3,410.14 ºC con una desviación típica
de 1,018 ºC.
a) Determine un intervalo de confianza de 95% para el punto de fusión del
tungsteno.
b) Determine un intervalo de confianza del 98% para el punto de fusión del
tungsteno.
Solución
Datos: 𝑥̅ = 3410.14 ℃ , 𝑠 = 1018 ℃ , 𝑛 = 8

Tenemos una muestra pequeña (𝑛 < 30) y no conocemos la desviación típica
poblacional 𝜎. Asumiendo que la población tiene un comportamiento
60
aproximadamente normal, debemos emplear una distribución 𝑡 con 𝑣 = 8 − 1 = 7
grados de libertad.
a) Nivel de confianza del 95%

𝑠
𝜇 = 𝑋̅ ± 𝑡(0.025,7)
√𝑛
1018
𝜇 = 3410.14 ± 2.365 ( )
√8
𝜇 = 3410.14 ± 851.20
Figura 70. Cálculo de 𝑡𝛼 . 𝜇 ∈ [ 2558.94, 4261.34 ] ℃
2
b) Nivel de confianza del 98%

𝑠
𝜇 = 𝑋̅ ± 𝑡(0.01,7)
√𝑛
1018
𝜇 = 3410.14 ± 2.998 ( )
√8
𝜇 = 3410.14 ± 1079.03
Figura 71. Cálculo de 𝑡𝛼 .
2 𝜇 ∈ [ 2331.11, 4489.17 ] ℃
16.3 Prueba de hipótesis para muestras

pequeñas (𝜎 desconocida)
Para probar hipótesis respecto a medias poblacionales usando muestras
pequeñas usaremos la misma metodología en 4 pasos que se presentó en la
clase anterior, con las siguientes diferencias:
• En el paso 2 (determinación de los límites de aceptación y rechazo), el
valor frontera o valor crítico ya no lo obtendremos de la tabla normal
estándar 𝑍 sino de la tabla 𝑡.
61
• El cálculo del estadístico de contraste del paso 3 se realizará mediante la
siguiente expresión:
𝑋̅ − 𝜇0
𝑡𝑐 = 𝑠
√𝑛
En el siguiente video se presenta un ejemplo de prueba de

hipótesis referente a medias poblacionales usando la
distribución t.

hipótesis con la distribución t. Ejemplo 1. [archivo de
video]. Recuperado de https://youtu.be/xEgBmYctF4U
Ejemplo. En un cultivo de maíz se utilizó una nueva mezcla de fertilizantes. Las

longitudes (en centímetros) de una muestra de 10 mazorcas fueron las siguientes:
18.5 22.4 21.7 24.3 22.1
21.6 18.9 20.4 18.7 20.3
Si en el pasado la longitud promedio de las mazorcas se establecía en 20 cm,

¿podría decirse que la nueva mezcla ha mejorado usa medida? Use un nivel de
significancia del 5%.
Solución
Datos: 𝑛 = 10 , 𝑣 = 10 − 1 = 9 , 𝛼 = 0.05
∑ 𝑥 208.9
𝑥̅ = = = 20.89
𝑛 10
∑(𝑥𝑖 − 𝑥̅ )
𝑠=√ = 1.8735
𝑛−1
Inicialmente tomamos como válido que el promedio de longitud es de 20 cm y

pretendemos verificar si la nueva mezcla mejora esa medida, por tanto:
𝐻0 : 𝜇 = 20 𝑐𝑚 (la medida permanece sin cambio)
62
𝐻1 : 𝜇 > 20 𝑐𝑚 (la medida mejora)
La hipótesis alterna 𝐻1 nos indica que debemos realizar una prueba con cola a la
derecha.
En la figura 72 podemos ver que
𝑡𝛼 = 𝑡(0.05,9) = 1.833

Figura 72. Zona de rechazo y aceptación

𝑋̅ − 𝜇0 20.89 − 20
𝑡𝑐 = 𝑠 = = 1.502
1.8735
√𝑛 √10
4. Tomar una decisión.
Dado que 𝑡𝑐 ≤ 𝑡𝛼 aceptamos la hipótesis nula 𝐻0
1.502 ≤ 1.833
Esto también puede concluirse al observar que el estadístico de contraste

𝑡𝑐 = 1.502 se ubica en la zona de aceptación.
Conclusión: al 5% de significancia, la medida permanece igual. La nueva mezcla

NO ha mejorado la medida.
En el siguiente video se presenta otro ejemplo de prueba

de hipótesis referente a medias poblacionales usando la
distribución t.

hipótesis con la distribución t. Ejemplo 2. [archivo de
video]. Recuperado de https://youtu.be/fm3NBJEPQb0
63
Referencias citadas en UNIDAD 4
• Anderson, D. & Williams, T. (2008). Estadística para administración y
economía (décima edición). México: Cengage Learning Editores.
• Bonilla, G. (2015). Estadística: Elementos de estadística descriptiva y

probabilidad (segunda edición). El Salvador: UCA editores.
• Hernández, J. (2015). Elementos de probabilidad y estadística. El Salvador:

UCA editores.
• Levin, R. & Rubin, D. (2004). Estadística para administración y economía

(séptima edición). México: Pearson Educación.
• Levine, D. & Krehbiel, C. (2014). Estadística para administración (sexta

edición). México: Pearson Educación.
• Lind, D. & Marchal, W. (2012). Estadística aplicada a los negocios y la

economía (Decimoquinta edición). Estados Unidos: McGraw-Hill.
• Mendenhall, W. & Beaver, R. (2010). Introducción a la probabilidad y

estadística (Décima tercera edición). Estados Unidos: Cengage Learning.
• Navidi, W. (2006). Estadística para ingenieros y científicos. Estados Unidos:
McGraw-Hill.
• Webster, A. (2000). Estadística aplicada a los negocios y la economía
(tercera edición). Estados Unidos: McGraw-Hill.
Videos enlazados
• Manuel Luque. (2 de mayo de 2020). PROBLEMA MUESTREO ALEATORIO
ESTRATIFICADO. [archivo de video]. Recuperado de
https://youtu.be/DkcYhbBK8HA
• Gonzalo Calderón. (4 de abril de 2020). TEOREMA DEL LÍMITE CENTRAL.

[archivo de video]. Recuperado de
https://drive.google.com/file/d/1Jhwu5dodidHOTyyhZT_6RKIDxTSuBJEq
/view?usp=sharing
• Guillermo Calderón. (19 de agosto de 2020). Teorema del límite central

para proporciones. [archivo de video]. Recuperado de
https://youtu.be/jgmqU7NONi0
64
• Guillermo Calderón. (19 de agosto de 2020). Intervalos de confianza para
estimar medias poblacionales. [archivo de video]. Recuperado de
https://youtu.be/9gxTITRNFLg
• Guillermo Calderón. (19 de agosto de 2020). Intervalos de confianza para

estimar proporciones poblacionales. [archivo de video]. Recuperado de
https://youtu.be/anFopLvhXhc
• Guillermo Calderón. (20 de agosto de 2020). Prueba de hipótesis

referente a medias poblacionales. [archivo de video]. Recuperado de
https://www.youtube.com/playlist?list=PLtqGwSACq5Q3_h0_fjEf4HlKQ6
IGTVAvy
• Guillermo Calderón. (20 de agosto de 2020). Prueba de hipótesis con la

distribución t. Ejemplo 1. [archivo de video]. Recuperado de
https://youtu.be/xEgBmYctF4U
• Guillermo Calderón. (20 de agosto de 2020). Prueba de hipótesis con la

distribución t. Ejemplo 2. [archivo de video]. Recuperado de
https://youtu.be/fm3NBJEPQb0
• KhanAcademyEspañol. (12 de febrero de 2018). Valores P y pruebas de

significancia. [archivo de video]. Recuperado de
https://youtu.be/bBfDemiDgP4
65
Glosario de los términos citados en la
UNIDAD 4
Conjetura Juicio u opinión formada a partir de indicios o datos

incompletos o supuestos.
Estadístico Cantidad numérica calculada con los datos de una
muestra.
Estimador Estadístico al que se le exigen ciertas condiciones para
que pueda calcular con ciertas garantías algunos
parámetros de una población.
Parámetro Cantidad numérica calculada con todos los datos de
una población.
Población Población formada por elementos con valores muy
heterogénea desiguales respecto a una variable de intereses.
Población infinita Población de la que no se conoce el tamaño y no se
tiene la posibilidad de contar o construir un marco
muestral (listado en el que encontramos las unidades
elementales que componen la población)
Valor crítico Valor de la distribución muestral que separa la zona de
aceptación de la zona de rechazo en una prueba de
hipótesis estadística.
66

Estadistica Aplicada

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Aplicada

Cargado por

Copyright:

Formatos disponibles

Dirección de Educación a Distancia

Apartado Postal, 1874, San Salvador, El Salvador

13. Muestreo y distribuciones muestrales .................................................. 5

En la primera unidad abordamos el uso de la estadística descriptiva para realizar

La inferencia estadística se encarga de tomar decisiones o realizar predicciones

Los métodos para hacer inferencias acerca de parámetros poblacionales pueden

• Estimación: predecir o generalizar el valor del parámetro partiendo de

Antes de abordar de lleno estos dos métodos, comenzaremos estudiando

• Establecer contacto con toda la población puede requerir mucho tiempo.

13.1 Diseños muestrales

El proceso de muestreo se inicia definiendo el marco de muestreo; es decir,

• Muestreo no aleatorio o no probabilístico. La selección muestral se

• Muestreo aleatorio o probabilístico. Todos los elementos de la

Un tipo común de muestreo no probabilístico es el muestreo deliberado o por

Otro tipo de muestreo no probabilístico es el muestro de juicio en el cual se

El muestreo no probabilístico puede tener muchas ventajas, como la

Siempre que sea posible, se deben utilizar métodos de muestreo probabilísticos.

Figura 51. Tipos de muestreo. Fuente: Elaboración propia

13.1.1 Tipos de muestreo aleatorio

En este tipo de muestreo aleatorio todos y cada uno de los elementos de la

En este tipo de muestreo se utiliza 𝑛 para representar el tamaño de la muestra

muestras posibles; es decir, en este caso habría 4 𝐶2 = 6 muestras posibles. Si

Cada una de estas muestras tiene 1/6 de probabilidad de ser escogida.

¿Cómo escoger una muestra aleatoria simple?

La tabla 46 muestra un ejemplo de tabla de números aleatorios. Para aprender

Podríamos obtener una muestra aleatoria al asignar a cada empleado un número

1. Elegir arbitrariamente un punto desde el cual comenzar a leer la tabla. Para

Fuente: Anderson (2008)

2. Recorrer de arriba hacia abajo los bloques de números de la tabla partiendo

3. Si llegáramos hasta el final de la columna y aun no tenemos los 𝑛 elementos,

Una muestra aleatoria sistemática involucra la selección aleatoria de uno de

Inicialmente se separan los 𝑁 elementos de la población en 𝑛 grupos de 𝑘

Para seleccionar una muestra sistemática de 𝑛 = 40 elementos de una población

primeros 20 individuos y se incluye cada vigésimo individuo después de la

Cuando se utiliza el muestreo sistemático, existe la posibilidad de que resulten

En el muestreo estratificado la población se divide en grupos homogéneos a

El muestreo por estratos puede ser más efectivo si se trata de poblaciones

d) Muestreo por conglomerados

En el siguiente video se presenta un ejemplo sobre cómo

Manuel Luque. (2 de mayo de 2020). PROBLEMA

Considere el siguiente ejemplo: se está realizando una investigación de mercado

Un procedimiento de muestreo por conglomerados bien diseñado puede producir

Tanto en el muestreo estratificado como en el de conglomerados, la población

La distribución muestral de un estadístico es la

13.2.1 Error de muestreo

El error de muestreo es la diferencia entre el estadístico de

las 𝑟 muestras diferentes. Si ahora calculamos en cada muestra la media

La distribución de los valores promedio 𝑥̅𝑖 , correspondientes a muestras de un

a) La media de todas las medias en las muestras 𝜇𝑥̅ es igual a la media de la

b) La desviación típica de todas las medias 𝜎𝑥̅ (la desviación típica de la

• En una población infinita (o muestreo con reemplazo)

Al utilizar los valores obtenidos podemos comprobar las propiedades de la

𝜎 𝑁−𝑛 √18 5−2

Llamemos 𝑋 a la variable aleatoria del número de individuos de una población

Si se toman todas las muestras posibles de un mismo tamaño 𝑛 y en cada

éxitos en una muestra específica (ver figura 52).

Figura 52. Distribución muestral de proporciones. Fuente: elaboración propia

La distribución de valores del conjunto resultante {𝑝̂1 , 𝑝̂ 2 , 𝑝̂ 3 , … , 𝑝̂𝑟 } se llama

La media aritmética de esta secuencia de valores sería:

donde 𝑥1 es el número de éxitos en las 𝑛 observaciones. La media obtenida es

La distribución de los valores de proporción de éxito 𝑝̂ 𝑖 , correspondientes a

a) La media de todas las proporciones en las muestras 𝜇𝑝̂ es igual a la proporción

b) La desviación típica de todas las proporciones 𝜎𝑝̂ (la desviación típica de la