Está en la página 1de 56

UNIDAD 4-5

METODOS DE MUESTREO Y TEOREMA


CENTRAL DEL LIMITE
METODOS DE MUESTREOS

Razones para muestrear

INTRODUCCION
Cuando se estudian las características de una población, existen
Como se ha mencionado con diversas razones practicas para preferir algunas partes o muestras
anterioridad, el propósito de la de ella para observar y medir. Algunas de las principales razones
estadística inferencial consiste en son:
determinar algo sobre la población a
partir de una muestra. Una muestra es 1. Establecer contacto con toda la población requeriría mucho
una porción o parte de la población de tiempo.
interés.
2. El costo de estudiar todos los elementos de una población
En muchos casos, el muestreo resulta resultaría prohibitivo
mas accesible que el estudio de toda la
población. 3. Es imposible verificar de manera física todos los elementos de
la población.

4. Algunas pruebas son de naturaleza destructiva.

5. Los resultados de la muestra son adecuados.


METODOS DE MUESTREOS

Muestreo aleatorio simple

Es el tipo de muestreo mas común.

Por definición, es una muestra seleccionada de


manera que cada elemento o individuo de la
población tenga las mismas posibilidades de que Ejemplo:
se incluya.
Para ejemplificar el muestreo aleatorio simple y la selección, suponga
que una población consta de 845 empleados de Nitra Industries, de la
cual se va a elegir una muestra de 52 empleados. Una forma de
asegurarse de que todos los empleados de la población tienen las
mismas posibilidades de que se les elija consiste en escribir primero el
nombre de cada empleado en un papel y depositarlos todos en una
caja. Después de mezclar todos los papeles, se efectúa la primera
selección tomando uno de la caja sin mirarlo. Se repite este proceso
hasta terminar de elegir la muestra de 52 empleados. Otro método
conveniente es el uso de software.
Muestreo aleatorio sistemático

Se selecciona un punto aleatorio de inicio y posteriormente se Ejemplo:


elige cada k-esimo miembro de la población. Primero se calcula
k, que es el resultado de dividir el tamaño de la población entre La división de ventas de Computer Graphic, Inc., necesita
el tamaño de la muestra, Si k no es un número entero, hay que calcular rápidamente el ingreso medio en dólares por venta del
redondearlo. mes pasado. La división confirmó que se registraron 2 000
ventas y se almacenaron en cajones de archivo, y se decidió
Para seleccionar el primer elemento emplee el muestreo seleccionar 100 recibos para calcular el ingreso medio en
aleatorio simple. A partir de este primer elemento, se dólares.
seleccionará cada vigésimo elemento como muestra (ver
ejemplo). Primero se calcula k, (2 000/100) de los cajones del archivo
k=20. Se selecciona el primer recibo empleando el muestreo
aleatorio simple, 15, a partir de este numero, se seleccionará
cada vigésimo recibo (15, 35, 55, etc.) como muestra.
Muestreo aleatorio estratificado

Cuando una población se divide en grupos a partir de ciertas


características, se aplica el muestreo aleatorio estratificado con
el fin de garantizar que cada grupo se encuentre representado
en la muestra. A los grupos también se les denomina estratos.
Una vez definidos los estratos, se aplica el muestreo aleatorio
simple en cada grupo o estrato con el fin de formar la muestra.

Ejemplo:

Los estudiantes universitarios se pueden agrupar en


estudiantes de tiempo completo o de medio tiempo, por sexo,
masculino o femenino, tradicionales o no tradicionales.
Muestreo por conglomerados

La población se divide en conglomerados a partir de los límites


naturales geográficos o de otra clase. A continuación se
seleccionan los conglomerados al azar y se toma una muestra
de forma aleatoria con elementos de cada grupo.

Ejemplo:

Se desea determinar la opinión de los residentes de algún


estado con referencia a las políticas federales y estatales de
protección ambiental. Suponga que dividió el estado en 12
unidades primarias, seleccionó al azar cuatro regiones, 2, 7, 4 y
12, y concentró su atención en estas unidades primarias. Usted
puede tomar una muestra aleatoria de los residentes de cada
una de estas regiones y entrevistarse con ellos (observe que se
trata de una combinación de un muestreo por conglomerados y
un muestreo aleatorio simple).
EJEMPLO

La siguiente lista incluye las tiendas de Pato’s Pizza. Se indica si la


tienda es propiedad de alguna corporación (C) o del administrador
(A). Se debe seleccionar e inspeccionar una muestra de cuatro
establecimientos en relación con la conveniencia para el cliente, la
seguridad, la higiene y otras características. Determine:

a) Los números aleatorios seleccionados son 08, 18, 11, 02. ¿Qué
tiendas se eligieron?

b) Utilice la tabla de números aleatorios para seleccionar su propia


muestra de establecimientos.

c) Una muestra consta de cada séptimo establecimiento. El número


03 es el punto de partida. ¿Qué establecimientos se incluirán en
la muestra?

d) Suponga que una muestra consta de tres establecimientos, de


los cuales dos son propiedad corporativa y uno del
administrador. Seleccione una muestra adecuada.
Error de Muestreo

Las muestras se emplean para determinar características de la


población. Por ejemplo, con la media de una muestra se calcula la
media de la población. No obstante, como la muestra forma parte o es
una porción representativa de la población, es poco probable que su
media sea exactamente igual a la media poblacional. Asimismo, es
poco probable que la desviación estándar de la muestra sea ഥ−𝝁
𝑬𝒓𝒓𝒐𝒓 𝒅𝒆 𝒎𝒖𝒆𝒔𝒕𝒓𝒂 = 𝑿
exactamente igual a la desviación estándar de la población.

Por lo tanto, puede esperar una diferencia entre un estadístico de la


muestra y el parámetro de la población correspondiente. Esta
diferencia recibe el nombre de error de muestreo.
EJEMPLO

Jane y Joe Millar administran el Foxtrot Inn, una pensión donde


dan alojamiento y desayuno, localizada en Tryon, Carolina del
Norte. El negocio tiene ocho habitaciones. A continuación
aparece el número de estas ocho habitaciones rentadas
diariamente durante junio de 2011.

A) Utilice Excel para seleccionar una muestra de cinco noches


de junio.

B) Determine la media de la población.

C) Utilice Excel para seleccionar tres muestras aleatorias de


cinco días.

D) Calcule la media de cada muestra y compárela con la media


poblacional. ¿Cuál es el error de muestreo en cada caso?
Distribución muestral de la media

La distribución muestral de 𝑋ത con tamaño muestral n es la


distribución que resulta cuando un experimento se lleva a cabo
una y otra vez (siempre con una muestra de tamaño n) y
resultan los diversos valores de 𝑋ത . Por lo tanto, esta distribución
muestral describe la variabilidad de los promedios muestrales
alrededor de la media de la población μ.
Fórmula de las permutaciones
La fórmula de las permutaciones se aplica para determinar el
número posible de disposiciones cuando sólo hay un grupo de 𝑵!
𝑵 𝑪𝒏 =
objetos. 𝒏! 𝑵 − 𝒏 !

donde:
Por definición
N representa el total de objetos.
PERMUTACIÓN Es cualquier distribución de r objetos
seleccionados de un solo grupo de n posibles objetos. n representa el total de objetos
seleccionados.
EJEMPLO

Tartus Industries cuenta con siete empleados de producción (a quienes


se les considera la población). En la siguiente tabla se incluyen los
ingresos por hora de cada uno de ellos. Determine:

a) ¿Cuál es la media de la población?

b) ¿Cuál es la distribución muestral de la media de muestras de


tamaño 2?

c) Elabore una lista de todas las muestras posibles de 2 ejecutivos de


la población y calcule las medias.

d) Organice las medias en una distribución muestral.

e) ¿Cuál es la media de la distribución muestral de la media?


Teorema central del limite

Si todas las muestras de un tamaño en particular se


seleccionan de cualquier población, la distribución
muestral de la media se aproxima a una distribución
normal. Esta aproximación mejora con muestras más DISTRIBUCION NORMAL ESTANDAR
grandes. (Z) CUANDO SE CONOCE LA
DESVIACION ESTANDAR DE LA
POBLACION

ERROR ESTANDAR DE LA MEDIA 𝑋ത − 𝜇


𝑍=
𝜎/ 𝑛
𝜎
𝜎𝑥ҧ =
𝑛 Donde,
Donde, 𝑋ത = 𝑀𝑒𝑑𝑖𝑎 muestral
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
Teorema central del limite
EJEMPLO

El departamento de control de calidad de Cola, Inc., conserva


registros sobre la cantidad de bebida de cola en su botella
gigante. La cantidad real de bebida en cada botella es de
primordial importancia, pero varía en una mínima cantidad
entre botellas. La empresa no desea llenar botellas con menos
líquido del debido, pues tendría problemas en lo que se
refiere a la confiabilidad de la marca. Por otra parte, no puede
colocar líquido de más en las botellas porque regalaría bebida,
lo cual reduciría sus utilidades. Los registros indican que la
cantidad de bebida de cola tiene una distribución de
probabilidad normal. La cantidad media por botella es de 31.2
onzas, y la desviación estándar de la población, de 0.4 onzas.
Hoy, a las 8 de la mañana, el técnico de calidad seleccionó al
azar 16 botellas de la línea de llenado. La cantidad media de
bebida en las botellas es de 31.38 onzas. Determina

a) la distribución normal estándar


b) b) el error estándar de la media
c) Trace grafico de colas de la distribución muestral de
bebida de cola en una botella gigante.
ESTIMACION E INTERVALOS
DE CONFIANZA
INTRODUCCION

Actualmente se debe estar bien consciente de que las


Por definición
poblaciones son generalmente muy grandes como para ser
estudiadas en su totalidad. Su tamaño requiere que se
seleccionen muestras, las cuales se pueden utilizar mas Un estimador puntual utiliza un numero único o
adelante para hacer referencia sobre las poblaciones. valor para localizar una estimación del
parámetro. Es decir, es un estadístico calculado a
Hay por lo menos dos tipos de estimadores que se utilizan: partir de información de la muestra para estimar
el parámetro poblacional.
✓ Un estimador puntual
✓ Un estimador por intervalo
EJEMPLO

Los siguientes ejemplos ilustran los estimadores puntuales de medias poblacionales.

1. El turismo constituye una fuente importante de ingresos para muchos países caribeños, como Barbados.
Suponga que la Oficina de Turismo de Barbados desea un cálculo aproximado de la cantidad media que gastan los
turistas que visitan el país. No resultaría viable ponerse en contacto con cada turista. Por consiguiente, se
selecciona al azar a 500 turistas en el momento en que salen del país y se les pregunta los detalles de los gastos
que realizaron durante su visita a la isla. La cantidad media que gastó la muestra de 500 turistas constituye un
cálculo aproximado del parámetro poblacional desconocido. Es decir, la media muestral es el estimador puntual
de la media poblacional.
EJEMPLO

2. Estudios médicos recientes indican que el ejercicio constituye una parte importante de la salud general de una
persona. El director de recursos humanos de OCF, fabricante importante de vidrio, desea calcular la cantidad de
horas semanales que los empleados dedican al ejercicio. Una muestra de 70 empleados revela que la cantidad
media de horas de ejercicio de la semana pasada fue de 3.3. La media muestral de 3.3 horas aproxima la media
poblacional desconocida, la media de horas de ejercicio de todos los empleados.

La media muestral, , no es el único estimador puntual de un parámetro poblacional. Por ejemplo, p, una
proporción muestral, es un estimador puntual de , la proporción poblacional; y s, la desviación estándar
muestral, es un estimador puntual de , la desviación estándar poblacional.
PROPIEDADES DE LOS ESTIMADORES PUNTUALES

Estimador insesgado

Si tenemos un gran número de muestras de tamaño n y obtenemos


el valor del estimador en cada una de ellas, sería deseable que la
media de todas estas estimaciones coincidiera con el valor de μ .Se
dice que un estimador es insesgado si su esperanza matemática
coincide con el valor del parámetro a estimar.

Estimador eficiente

Se dice que los estimadores son eficientes cuando generan una


distribución muestral con el mínimo error estándar ,es decir, entre dos
estimadores insesgados de un parámetro dado es más eficiente el de
menor varianza.
Estimador consistente

Un estimador se dice consistente cuando su valor tiende hacia el


verdadero valor del parámetro a medida que aumenta el tamaño de
la muestra . Es decir, la probabilidad de que la estimación sea el
verdadero valor del parámetro tiende a 1.
DEFINICION

Conjunto de valores que se forma a partir de una


muestra de datos de forma que exista la posibilidad
de que el parámetro poblacional ocurra dentro de
dicho conjunto con una probabilidad específica. La
probabilidad específica recibe el nombre de nivel de
confianza.

Para calcular el intervalo de confianza, consideraremos dos


INTERVALO DE CONFIANZA DE LA situaciones:
MEDIA POBLACIONAL CON UNA
DESVIACION CONOCIDA
• Utilizamos los datos de la muestra para calcular 𝜇 con 𝑋ത ,
𝜎 mientras que la desviación estándar de la población 𝜎 es
𝑋ത ± 𝑍
𝑛 conocida.
Donde,
𝑋ത = 𝑀𝑒𝑑𝑖𝑎 muestral • Utilizamos los datos de la muestra para calcular 𝜇 con ത
𝑋,
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 mientras que la desviación estándar de la población es
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 desconocida. En este caso, sustituimos la desviación estándar de
𝑧 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑡𝑎𝑏𝑙𝑎 la(s) muestra(s) por la desviación estándar de la población (𝜎).
MARGEN DE ERROR DE LA MEDIA
POBLACIONAL CON UNA
DESVIACION CONOCIDA

𝜎
𝑀𝐸 = 𝑍
𝑛

Donde,
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
𝑧 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑡𝑎𝑏𝑙𝑎
EJEMPLO

La American Management Association desea


información acerca del ingreso medio de los
gerentes de la industria del menudeo. Una
muestra aleatoria de 256 gerentes revela una
media muestral de $45 420. La desviación estándar
de esta muestra es de $2 050. Determine:

a) La media de la población

b) El intervalo de confianza de 95% de la media


poblacional.

c) Diagrama de colas de los resultados obtenidos

d) El margen de error de la media poblacional


EJEMPLO

Se toma una muestra de 49 observaciones de una población normal con una desviación estándar de 10. La media de la muestra es
de 55. Determine el intervalo de confianza de 99% de la media poblacional y el margen de error de la media poblacional.
DISTRIBUCION t
Distribución t

DEFINICION

La distribución t de Student o distribución t es un


modelo teórico utilizado para aproximar el momento
de primer orden de una población normalmente
distribuida cuando el tamaño de la muestra es
pequeño y se desconoce la desviación típica.
Dada una variable aleatoria continua L, decimos que
la frecuencia de sus observaciones puede
En otras palabras, la distribución t es una distribución
aproximarse satisfactoriamente a una distribución t
de probabilidad que estima el valor de la media de
con g grados de libertad tal que:
una muestra pequeña extraída de una población que
sigue una distribución normal y de la cual no
𝐿~𝑡𝑔
conocemos su desviación típica.

La variable aleatoria L sigue una distribución t con g grados de libertad.

𝑔𝑙 = 𝑛 − 1
Distribución t

Aplicación

La distribución t se utiliza cuando:

✓ Queremos estimar la media de una población normalmente distribuida a partir de una muestra pequeña.

✓ Tamaño de la muestra es inferior a 30 elementos, es decir, n < 30.

A partir de 30 observaciones, la distribución t se parece mucho a la distribución normal y, por tanto, utilizaremos
la distribución normal.

✓ No se conoce la desviación típica o estándar de una población y tiene que ser estimada a partir de las
observaciones de la muestra.
Distribución t

Representación

La representación de la distribución t se parece


mucho a la distribución normal salvo que la
distribución normal tiene las colas más anchas y es
más apuntalada. En otras palabras, deberíamos
añadir más grados de libertad a la distribución t
para que la distribución “crezca” y se parezca más a
la distribución normal.
Distribución t

Para crear un intervalo de confianza de la media


poblacional con la distribución t, se ajusta la
Para crear un intervalo de confianza de la media poblacional con una
fórmula de la siguiente manera. desviación estándar desconocida:

1. Suponga que la población muestreada es normal o aproximadamente


normal.
INTERVALO DE CONFIANZA
DE LA MEDIA POBLACIONAL 2. Estime la desviación estándar de la población (σ) con la desviación
CON UNA DESVIACION estándar de la muestra (s).
CONOCIDA
3. Utilice la distribución t en lugar de la distribución z.
𝜎
𝑋ത ± 𝑍
𝑛
INTERVALO DE
CONFIANZA DE LA MEDIA
La decisión de utilizar t o z se basa en el hecho de que se conozca , la
POBLACIONAL CON UNA
desviación estándar poblacional. Si se conoce, se utiliza z. Si no se
DESVIACION
conoce, se debe utilizar t.
DESCONOCIDA

𝑠
𝑋ത ± 𝑡
𝑛
Distribución t

MARGEN DE ERROR EN UN INTERVALO DE


CONFIANZA DE LA MEDIA POBLACIONAL
CON UNA DESVIACION DESCONOCIDA

𝑠
ME= 𝑡
𝑛
Distribución t

Valores de z y t para el nivel de confianza de 95 por ciento

𝝈
ഥ±𝒁
𝑿
𝒏

𝒔
ഥ±𝒕
𝑿
𝒏
Distribución t
EJEMPLO

Un fabricante de llantas desea investigar la durabilidad


de sus productos. Una muestra de 10 llantas que
recorrieron 50 000 millas reveló una media muestral
de 0.32 pulgadas de cuerda restante con una
desviación estándar de 0.09 pulgadas.

a) Construya un intervalo de confianza de 95% de la


media poblacional.

b) ¿Sería razonable que el fabricante concluyera que


después de 50 000 millas la cantidad media
poblacional de cuerda restante es de 0.30
pulgadas?
EJEMPLO

El gerente de Inlet Square Mall, cerca de Ft. Myers, Florida, desea


estimar la cantidad media que gastan los clientes que visitan el
centro comercial. Una muestra de 20 clientes revela las siguientes
cantidades.

a) Construya un intervalo de confianza de 95% de la media


poblacional.

b) ¿Concluiría de forma razonable que la media poblacional es


de $50? ¿Y de $60?. Interprete el resultado.

c) Cual es el margen de error.

d) Realice la comprobación del ejercicio por medio de Excel


Intervalo de confianza de una proporción

DEFINICION

Un intervalo de confianza para una proporción es un


rango de valores que probablemente contenga una
proporción de población con un cierto nivel de Para crear el intervalo de confianza de una proporción, es necesario cumplir
confianza. con los siguientes supuestos:

1. Las condiciones binomiales, han quedado satisfechas.


INTERVALO DE CONFIANZA INTERVALO DE CONFIANZA
DE LA PORCION DE UNA DE LA PORCION DE UNA a) Los datos de la muestra son resultado de conteos.
POBLACION POBLACION
b) Sólo hay dos posibles resultados (lo normal es referirse a uno de los
resultados como éxito y al otro como fracaso).
𝒑(𝟏 − 𝒑) 𝝅(𝟏 − 𝝅)
𝒑±𝒛 𝒑±𝒛
𝒏 𝒏 c) La probabilidad de un éxito permanece igual de una prueba a la siguiente.

Donde, d) Las pruebas son independientes. Esto significa que el resultado de la prueba
𝑝/𝜋 = 𝑃𝑜𝑟𝑐𝑖𝑜𝑛 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 no influye en el resultado de otra.

𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 2. Los valores 𝒏𝝅 𝒚 𝒏 𝟏 − 𝝅 deben ser mayores o iguales que 5. Esta
condición permite recurrir al teorema central del límite y emplear la
𝑧 = 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 (𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑡𝑎𝑏𝑙𝑎)
distribución normal estándar, es decir, z, para completar un intervalo de
confianza.
PORCION MUESTRAL

𝑋
𝑝=
𝑛

Donde,
X= 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜𝑠
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
EJEMPLO

El sindicato que representa a Bottle Blowers of


America (BBA) considera la propuesta de fusión con
Teamsters Union. De acuerdo con el reglamento del
sindicato de BBA, por lo menos tres cuartas partes de
los miembros del sindicato deben aprobar cualquier
fusión. Una muestra aleatoria de 2 000 miembros
actuales de BBA revela que 1 600 planean votar por la
propuesta. Determine:

a) El valor de la proporción poblacional


b) Construya el intervalo de confianza de 95% de la
proporción poblacional.
c) Cual es el margen de error.
d) Fundamente su decisión en esta información de la
muestra. (conclusiones)
e) Realice los calculos anteriores en Excel
Elección del tamaño adecuado de una muestra

Una variable importante cuando se trabaja con intervalos de


confianza es el tamaño de la muestra. Sin embargo, en la
práctica, no es una variable, sino una decisión que se toma
para que la estimación del parámetro de población sea
bueno. Esta decisión se basa en tres variables:

1. El margen de error que tolerará el investigador.

2. El nivel de confianza deseado.

3. La variabilidad o dispersión de la población que se estudia.


Elección del tamaño adecuado de una muestra

Margen de error

El máximo error admisible, designado E, es la magnitud que se suma y resta


de la media muestral (o proporción muestral) para determinar los puntos
extremos del intervalo de confianza. El margen de error es la magnitud del
error que se tolerará al estimar un parámetro poblacional. Existe una
compensación entre el margen de error y el tamaño de la muestra. Un
margen de error pequeño requiere de una muestra más grande y de más
tiempo y dinero para recolectarla. Un margen de error más grande permitirá
tener una muestra más pequeña y un intervalo de confianza más amplio.

Nivel de confianza

Al trabajar con un intervalo de confianza, lógicamente se


elegirán niveles de confianza relativamente altos como
de 95 y 99%, que son los más comunes. Para calcular el
tamaño de la muestra, se necesitará un estadístico z que
corresponda al nivel de confianza elegido..
Elección del tamaño adecuado de una muestra

Tamaño de muestra

El tercer factor en la determinación del tamaño de una muestra es la


desviación estándar de la población. Si la población se encuentra muy
dispersa, se requiere una muestra grande. Por el contrario, si se encuentra
concentrada (homogénea), el tamaño de muestra que se requiere será
menor.
Gracias
UNIDAD 6
PRUEBA DE HIPOTESIS
¿QUÉ ES UNA HIPÓTESIS?

En general, una hipótesis es una declaración relativa a una


población.

En el análisis estadístico se establece una afirmación, una


hipótesis, se recogen datos que posteriormente se utilizan para
probar la aserción.

Entonces, una hipótesis estadística es: Una afirmación relativa a


un parámetro de la población sujeta a verificación.
¿Qué es la prueba de hipótesis?

La prueba de hipótesis comienza con una


afirmación, o suposición, sobre un
parámetro de la población. En si, es un
procedimiento basado en evidencia de la
muestra y la teoría de la probabilidad para
determinar si la hipótesis es una afirmación
razonable.
Procedimiento de cinco pasos para probar una hipótesis:
Paso 1: Se establece la hipótesis nula (𝑯𝒐 ) y la hipótesis
alternativa (𝑯𝟏 )

Ejemplo:
HIPÓTESIS NULA ( 𝐻𝑜 ): Enunciado relativo al valor de un
parámetro poblacional que se formula con el fin de probar Hipótesis nula: La vida del motor de un auto es de 500,000
evidencia numérica. kilómetros

Hipótesis alternativa: La vida del motor de un auto es diferente


HIPÓTESIS ALTERNATIVA (𝐻1 ): Enunciado que se acepta si los de 500,000 kilómetros
datos de la muestra ofrecen suficiente evidencia para rechazar
la hipótesis nula. La vida del motor de un auto es menor
de 500,000 kilómetros

Simbólicamente:
Prueba de 2 colas Prueba de 1 cola
𝐻𝑜 : 𝜇 = 500,000
𝐻𝑜 : 𝜇 = 𝑛 𝐻𝑜 : 𝜇 ≤, ≥ 𝑛 𝐻1 : 𝜇 ≠ 500,000
𝐻1 : 𝜇 ≠, >, < 𝑛 𝐻1 : 𝜇 >, < 𝑛 𝐻1 : 𝜇 < 500,000
Paso 2: Se selecciona un nivel de significancia

El nivel de significancia se expresa con la letra griega alfa, 𝛼. En


CASOS:
ocasiones también se conoce como nivel de riesgo. Éste quizá
sea un término más adecuado porque se trata del riesgo que se
corre al rechazar la hipótesis nula cuando es verdadera.
✓ Se acostumbra elegir el nivel de 0.05 en el caso de los
proyectos de investigación relacionados con los
No existe ningún nivel de significancia que se aplique a todas
consumidores.
las pruebas. Se toma la decisión de utilizar el nivel de 0.05
(expresado con frecuencia como nivel de 5%), nivel de 0.01,
nivel de 0.10 o cualquier otro nivel entre 0 y 1.
✓ El nivel de 0.01 en relación con el del control de calidad.

ERROR TIPO I: Rechazar la hipótesis nula, 𝑯𝒐 , cuando es ✓ El de 0.10 en el de las encuestas políticas.
verdadera. (𝛼)

ERROR TIPO II: Aceptar la hipótesis nula cuando es falsa.


(𝛽)
Paso 3: Se selecciona el estadístico de prueba

Hay muchos estadísticos de prueba. Se utilizan z y t como


estadísticos de prueba.
ഥ−𝝁
𝑿
ESTADÍSTICO DE PRUEBA: Valor, determinado a partir de la
información de la muestra, para determinar si se rechaza la
𝒁=
𝝈/ 𝒏
hipótesis nula.

La prueba de hipótesis de la media ( 𝜇), cuando se conoce 𝜎 o


el tamaño de la muestra es grande, es el estadístico de prueba
z que se calcula de la siguiente manera:
Paso 4: Se formula la regla de decisión

Una regla de decisión es un enunciado sobre las condiciones específicas en que se rechaza la
hipótesis nula y aquellas en las que no se rechaza. La región o área de rechazo define la
ubicación de todos esos valores que son tan grandes o tan pequeños que la probabilidad de
que ocurran en una hipótesis nula verdadera es muy remota.

VALOR CRÍTICO: Punto de división entre la


región en que se rechaza la hipótesis nula y
aquella en la que se acepta.
Paso 5: Se toma una decisión

El quinto y último paso en la prueba de hipótesis consiste en


calcular el estadístico de la prueba, comparándola con el valor
crítico, y tomar la decisión de rechazar o no la hipótesis nula.

𝑺𝒊 𝒁𝒄 > 𝒁𝑻 se rechaza la hipótesis nula 𝑯𝒐 y se acepta la hipótesis alternativa 𝑯𝟏

𝑺𝒊 𝒁𝒄 ≤ 𝒁𝑻 se mantiene la hipótesis nula 𝑯𝒐


EJEMPLO

Jamestown Steel Company fabrica y arma escritorios y


otros muebles para oficina en diferentes plantas en el
oeste del estado de Nueva York. La producción semanal
del escritorio modelo A325 en la planta de Fredonia tiene
una distribución normal, con una media de 200 y una
desviación estándar de 16. Hace poco, con motivo de la
expansión del mercado, se introdujeron nuevos métodos
de producción y se contrató a más empleados. El
vicepresidente de fabricación pretende investigar si hubo
algún cambio en la producción semanal del escritorio
modelo A325. En otras palabras, ¿la cantidad media de
escritorios que se produjeron en la planta de Fredonia es
diferente de 200 escritorios semanales con un nivel de
significancia de 0.01?

Nota: La cantidad media de escritorios que se produjeron


el año pasado (50 semanas, pues la planta cerró 2
semanas por vacaciones) es de 203.5.
EJEMPLO

Responda las siguientes preguntas en el siguiente


ejercicio:

Se selecciona una muestra de 36 observaciones de una


población normal. La media muestral es de 49, y el
tamaño de la muestra, de 36. La desviación estándar de
la población es 5. Utilice el nivel de significancia de 0.05.

a) ¿es una prueba de una o de dos colas?


b) ¿cuál es la regla de decisión?
c) ¿cuál es el valor del estadístico de la prueba?
d) ¿cuál es su decisión respecto de Ho?
Gracias

También podría gustarte