Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Inferencial
Estadística Inferencial
• La estadística inferencial se usa
frecuentemente para pronosticar el
comportamiento de variables indicadoras
en situaciones inciertas. El proceso conlleva
a la verificación y el contraste.
Estadística Inferencial
• El objetivo de la estadística inferencial consiste en extraer información
aplicable a toda una población con base en los resultados obtenidos a
partir de una muestra representativa. Esta parte de la estadística proporciona
las herramientas necesarias para generalizar lo que se observa en una parte
de la población, lo que significa que las conclusiones que se buscan obtener
son acerca de la población, no sobre la muestra; eso implica, además, que si
se pueden conocer datos de toda la población no tiene sentido estimar nada.
Estadística Inferencial
Usa la información que proporciona una muestra
para sacar conclusiones acerca del valor de un
Estimación parámetro poblacional (como la media poblacional
y la proporción poblacional) con un nivel de
confianza y un margen de error específicos.
Estadística Inferencial
No indica la cantidad de información sobre la cual se basa la estimación y no dice nada acerca del
posible tamaño del error (y siempre que se toman muestras existe algún error).
Tamaño de la muestra
Se dice que una muestra debe ser pequeña, con el fin de que el costo de la
investigación sea lo suficientemente bajo, y bastante grande para que el error del
muestreo sea admisible. En el cálculo del tamaño óptimo, se deben tener en cuenta, los
siguientes componentes:
• El Error de Muestreo: es la diferencia que puede haber entre el valor poblacional
(parámetro) y la estimación de la misma (estimación puntual o estadígrafo), obtenida
por medio de una muestra aleatoria. En muchos casos, el error será determinado
por el investigador.
• La Varianza: Del grado de variabilidad, depende en gran parte el tamaño de la
muestra (variable cuantitativa).
• La probabilidad de éxito: la proporción de la ocurrencia de un evento.
Tamaño de la muestra
• Nivel de confianza: Se ha mencionado que el grado de precisión depende de
alguna manera, del tamaño de la muestra y éste, a su vez, de factores tales como el
error, la varianza. Esta última es fijada por el investigador, que por lo general
selecciona una confianza (1-α) del 90%, 95% o 99%.
2 2
𝑧𝛼/2 1,96
𝑛 = 𝑝𝑞
ҧ = 0,44 ∗ 1 − 0,44 ∗ = 1514,5 = 1515 𝑔𝑜𝑙𝑓𝑖𝑠𝑡𝑎𝑠
𝑒 0,025
Determinación del tamaño de la muestra para
una población finita
Variables cuantitativas Variables cualitativas
2 2 2
𝑧𝛼/2 𝜎 𝑁 𝑧𝛼/2 ҧ
𝑝𝑞𝑁
𝑛= 2 2 𝑛= 2
𝑁−1 𝑒 2+ 𝑧𝛼/2 𝜎 𝑁−1 𝑒 2 + 𝑧𝛼/2 ҧ
𝑝𝑞
𝜎2
𝑛= 𝑒 2 𝜎2
𝑧
+𝑁
Ejemplo
• Dos administradores recién egresados inauguraron el año pasado un
establecimiento de comidas basado en el sabor de la canela en un centro
comercial de Medellín. Los dueños de un establecimiento de comidas
hicieron antes de la apertura una investigación de mercados para determinar
qué productos ofrecer. Para tal efecto planearon la realización de una
encuesta y en los resultados quieren tener un nivel de confianza de 90% y un
margen de error de 5%, ¿cuál debe ser el tamaño de la muestra a utilizar?
Ejemplo
Los dueños del negocio anterior planean abrir un pequeño local en un sector de
Medellín muy visitado por turistas extranjeros; el mercado meta está formado por los
turistas alojados en ese sector, que se calcula en una población flotante de
aproximadamente 1300 personas. Para acceder a ellos se quiere hacer una encuesta y en
los resultados se quiere tener un nivel de confianza de 90% y un margen de error de
3,5%,
a) ¿cuál debe ser el tamaño de la muestra a utilizar?
b) Si antes de abrir el nuevo local deciden hacer la encuesta a 30 turistas, ¿de qué
tamaño es el margen de error si se considera ese nivel de confianza de 90%? ¿Lo
consideras aceptable?
Ejemplo
Para vigilar la calidad de su servicio, una empresa que se dedica al comercio electrónico
selecciona una muestra aleatoria de clientes cada mes; se establece contacto con cada
cliente muestreado, se le hace una serie de preguntas acerca de la calidad del servicio y
se determina una calificación de satisfacción por cliente muestreado entre 0 y 100. Las
encuestas anteriores han demostrado que, aunque la media cambia mes a mes, la
desviación estándar de las calificaciones ha tendido a estabilizarse en 20.
a) ¿Qué tan grande se requiere una muestra si queremos tener 95% de confianza de
que el error de estimación no excederá de 2?
b) Si se estima que la empresa tiene 1800 clientes, ¿qué tan grande debe ser la muestra
si se consideran los parámetros anteriores?
Distribuciones muestrales
• Una distribución muestral es el conjunto de todas las muestras distintas de
determinado tamano n que es posible extraer de una poblacion de tamano N.
En primer lugar, se debe observar que se trata del conjunto de todas las
muestras distintas que es posible extraer de determinada poblacion.
• De una población a estudiar, se selecciona una sola muestra de todas las
muestras posibles de igual tamaño, con el fin de obtener conclusiones sobre
la población, no sobre la muestra.
Distribución de la media muestral
Si consideramos una población de N
elementos, con media µ y desviación
estandar σ, si se obtienen M número
de muestras posibles, de tamaño n,
simbolizamos a cada media muestral,
por 𝑥1ҧ , 𝑥ҧ2 , … 𝑥ҧ𝑀 y cada desviación
estándar como 𝑠1 , 𝑠2 , … 𝑠𝑀 .
Teorema. Dada una población, si extraemos todas las muestras posibles de un mismo
tamaño, entonces la media de la distribución de todas las medias muestrales posibles,
será igual a la media poblacional.
Distribución de medias muestrales
• Media muestral 𝜇𝑥ҧ En aquellos casos de poblaciones finitas, es
σ 𝑥ҧ 𝑖 decir, cuando se da información sobre el
𝜇𝑥ҧ = , 𝜇 = 𝜇𝑥ҧ tamaño poblacional, y cuando el tamaño de la
𝑀
muestra es mayor n/N>5% de la población,
• Desviación estándar muestral (error se puede aplicar el factor de corrección
estándar de la media), población infinita
2
𝜎 𝑁−𝑛
𝑥ҧ𝑖 − 𝜇 𝜎 𝜎𝑥ҧ =
𝜎𝑥ҧ = = 𝑛 𝑁−1
𝑀 𝑛 Factor de
corrección
Esta formula también aplica para la población
sea finita y el tamaño de la muestra sea menor
o igual a 5% del tamaño de la población; es
decir, n/N = 0.05.
Teorema del limite central
• Si X es una variable aleatoria para la que se La población no tiene distribución
conocen su media μ y su varianza 𝜎 2,
la normal. Cuando la población de la que se
distribución muestral de la media tiende a tomó la muestra aleatoria simple no tiene
ser normal con media μ y desviacion
𝜎
distribución normal, el teorema del límite
estándar (error estandar):𝜎𝑥ҧ = o 𝜎𝑥ҧ = central ayuda a determinar la forma de la
𝑛 distribución de muestreo de x.
𝜎 𝑁−𝑛
𝑛 𝑁−1 • TEOREMA DEL LÍMITE CENTRAL
• Forma de la distribución de muestreo: Cuando se seleccionan muestras aleatorias
La población tiene distribución normal. Si simples de tamaño n de una población, la
se supone que la población de la que se distribución de muestreo de la media muestral
selecciona la muestra aleatoria simple tiene x puede aproximarse mediante una distribución
distribución normal o casi normal, la normal a medida que el tamaño de la muestra
distribución de muestreo de x está distribuida se hace grande.
normalmente cualquiera que sea el tamaño de
la muestra.
Teorema del limite central
• Dicho teorema demuestra, que la
distribución de las medias
muestrales se puede aproximar con
una distribución normal de
probabilidades cuando el tamaño
de la muestra es de por lo menos 30
elementos.
Aplicaciones del análisis de la distribución
muestral de la media
Cuando se trata de una muestra grande Aquí vale aclarar que se usa la desviación
(n>=30), de acuerdo con el teorema estándar muestral para la normalización.
central del limite, la distribucion de las
medias muestrales es aproximadamente
𝑥ҧ − 𝜇 𝑥ҧ − 𝜇
normal, por lo que se utiliza el 𝑧=𝜎 𝑧=
procedimiento de estandarizar los valores ൗ 𝑛 𝜎 𝑁−𝑛
para convertirlos a unidades de la 𝑛 𝑁−1
desviacion estandar y asi poder utilizar la
tabla.
Ejemplos
• La altura media de 400 alumnos de un plantel de secundaria es de 1,50 mts, y
su desviación típica es de 0,25 mts. Determinar la probabilidad de que en
una muestra de 36 alumnos, la media sea superior a 1,60 mts.
• Se tiene para la venta un lote de 1.000 pollos, con un peso promedio de 3,50
kg y una desviación estándar de 0,18 kg, ¿Cuál es la probabilidad de que en
una muestra aleatoria, 100 pollos de esta población, pesen entre 3,53 y 3,56
kg?
Ejemplo
Una empresa fabrica focos que tienen una duración con media de 800 horas y
desviación estándar de 35 horas.
• Encuentre la probabilidad de que un foco que alguien compró dure menos
de 780 horas.
• Encuentre la probabilidad de que una muestra de 50 focos tenga una vida
promedio de menos de 780 horas.
Distribución muestral de Proporción p
• En el análisis de una característica cualitativa o atributo, se emplea la proporción de
éxitos y fracasos.
• La distribución muestral de la proporción es el conjunto de las proporciones de
todas las muestras de tamaño n que se pueden sacar de una población de tamaño N.
• La proporción muestral 𝑝ҧ es el estimador puntual de la proporción poblacional p. La
fórmula para calcular la proporción muestral
𝑥𝑖 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜𝑠
𝑝ҧ = =
𝑛 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Distribución muestral de Proporción p
• Media de p o valor esperado de P • Desviación estándar población infinita:
(proporción poblacional)
σ 𝑥𝑖 𝑃 1−𝑃
𝜇𝑝ҧ = 𝑃 = 𝜎𝑝ҧ =
𝑁 𝑛
• D. estándar o Error estándar población
finita:
𝑃 1−𝑃 𝑁−𝑛 𝑛
≤ 0,05, 𝑛𝑜 𝑠𝑒 𝑢𝑠𝑎 𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑐𝑐𝑖ó𝑛
𝜎𝑝ҧ = 𝑁
𝑛 𝑁−1
Distribución muestral de Proporción p
• La distribución de muestreo de 𝑝ҧ se • Variante estadística
aproxima mediante una distribución 𝑝 − 𝜇𝑝
normal, siempre 𝑛𝑝 ≥ 5 𝑦 𝑛(1 − 𝑍=
𝑝) ≥ 5. 𝑃 1−𝑃
• En las aplicaciones prácticas, cuando 𝑛
se requiere una estimación de la
proporción poblacional, casi siempre
se encuentra que el tamaño de la
muestra es suficientemente grande
para permitir usar la aproximación
normal para la distribución de
muestreo de 𝑝ҧ
Ejemplo
• Se tiene que el 4% de las piezas • El 46% de los sindicatos del país
producidas por cierta maquina es están en contra de comercializar
defectuosa. ¿ Cual es la con China continental, ¿ Cual es la
probabilidad de que un grupo de probabilidad de que en una
200 piezas, sea defectuosa mas del encuesta a 100 sindicatos muestre
3%? que mas del 52% tengan la misma
posición?
Ejercicios
• Se ha determinado que el 65% de los estudiantes universitarios de Medellín
prefieren los cuadernos marca Profesional ¿Cuál es la probabilidad de que en
una muestra de 100 universitarios de dicha ciudad, encontremos que: Como
máximo el 68% sean usuarios de este tipo de cuaderno
• Un fabricante de desodorantes recibe cada semana lotes de 10,000 válvulas
para los tarros rociadores. Para aceptar o rechazar dichos lotes, selecciona al
azar 400 válvulas de cada lote; si el 2% o más resultan defectuosos, se rechaza
el lote. En caso contrario se acepta el lote. ¿Cuál es la probabilidad de
rechazar un lote que contiene menos del 1% de válvulas defectuosas?
Estimación por intervalos
• Sirve para medir cuán próxima esta estimador puntual del parámetro poblacional.
• INTERVALO DE CONFIANZA: Conjunto de valores que se forma a partir de
una muestra de datos de forma que exista la posibilidad de que el parámetro
poblacional ocurra dentro de dicho conjunto con una probabilidad específica. La
probabilidad específica recibe el nombre de nivel de confianza.
• Intervalo de confianza asocia a cada muestra un intervalo que tiene una alta
probabilidad de contener el verdadero valor del parámetro.
• Este parámetro será habitualmente una proporción (p) en el caso de variables
cualitativas, y la media o la varianza (μ,σ)para variables cuantitativas.
Estimación por intervalos
El tamaño de la muestra depende de tres factores:
• Si la población fuente de la muestra se considera infinita o finita; se supone finita si es de un
tamaño conocido y se considera infinita si es de un tamaño desconocido o es muy grande.
• Nivel de confianza (1-α), es la probabilidad de que la estimación hecha se ajuste a la
característica poblacional evaluada, es decir, es la probabilidad de que el verdadero valor del
parámetro caiga en el intervalo de confianza establecido. Puede tomar valor de 90, 95 o
99%.
• El estadístico de la muestra, puede ser la media muestral o la proporción muestral
Estimación por intervalos
• El error del intervalo (e) de confianza establecido (que corresponde a la
mitad de la amplitud del intervalo) no puede exceder de lo que se fija
como margen de error.
• Cuando la encuesta tiene solamente preguntas cuantitativas el margen de
error no corresponde a un porcentaje, sino a un espacio evaluado en la
misma unidad de medida.
Construcción de intervalos de confianza
Un intervalo de confianza puede ser bilateral o unilateral y, en cualquiera de los casos, existen sutiles
diferencias en su construcción si la población origen es finita o si es infinita.
• Bilateral se expresa mediante dos valores: límite inferior y límite superior,
𝑃 𝑙𝑖𝑛𝑓 ≤ 𝜃 ≤ 𝑙𝑠𝑢𝑝 = 1 − 𝛼.
• Unilateral presenta solamente uno de los límites y el otro extremo es infinito o menos infinito.
Construcción de intervalos de confianza
• El error y margen de error no es lo mismo. El margen de error
es algo que se fija antes de seleccionar la muestra y el error se
calcula a partir del nivel de confianza y el tamaño de la
muestra; el margen de error es un máximo, por lo que el debe
ser menor o igual.
• Entre más amplio sea el intervalo de confianza, mayor es la
seguridad de que realmente el intervalo contenga el verdadero
valor, pero se aumenta el error. Es mejor un intervalo de
confianza relativamente pequeño con una confianza grande, lo
que se logra aumentando el tamaño de la muestra evaluada.
Construcción de intervalos de confianza
Errores comunes en la interpretación de intervalos de confianza:
• No mencionar el nivel de confianza.
• No mencionar que es un promedio o una proporción.
• No mencionar que se trata de una estimación.
• Asegurar que los valores para los elementos variarán entre los valores del intervalo de
confianza.
• No mencionar claramente la población objeto de estudio o extrapolar resultados.
• Decir que esa estimación es para los elementos de la muestra, ya que es para todos los
elementos de la población.
Estimación por intervalos para variables
cuantitativas: Desv. Estándar(σ) conocida.
• Un intervalo de confianza se calcula con el • Cuando no se conoce la desviación
empleo de dos estadísticos: la media estándar σ, se usa la desviación estándar
muestral ( 𝑥ҧ ) y la desviación estándar de la muestra, s, para calcular el error
muestral ( 𝜎𝑥ҧ ), que también se puede estándar de la media, esto es posible solo sí
llamar error estándar. el tamaño de la muestra es relativamente
grande (n > 30).
• Conocer σ simplifica el desarrollo del
intervalo de confianza, porque podemos 𝑠 𝑠 𝑁−𝑛
𝑠𝑥ҧ = 𝑠𝑥ҧ =
utilizar la distribución normal estándar. 𝑛 𝑛 𝑁−1
Bajo el supuesto que nuestra distribución
es normal estándar para 𝑥ҧ , el error
estándar muestral está definido:
𝜎 𝜎 𝑁−𝑛
𝜎𝑥ҧ = 𝜎𝑥ҧ =
𝑛 𝑛 𝑁−1
Población Infinita Población finita
Estimación por intervalos para variables
cuantitativas: Desv. Estándar(σ) conocida.
• ¿Cómo determinar el intervalo de confianza de 95%? La amplitud del intervalo se
determina por medio del nivel de confianza y de la magnitud del error estándar de la
media. Por lo tanto, la Estimación por intervalo de la media poblacional con σ
conocida:
Población Infinita Población finita
𝜎 𝜎 𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝑥ҧ − 𝑧𝛼/2 , 𝑥ҧ + 𝑧𝛼/2 𝑜 𝑥ҧ − 𝑧𝛼 , 𝑥ҧ + 𝑧𝛼/2
𝑛 𝑛 2 𝑛 𝑁−1 𝑛 𝑁−1
• 𝑥ҧ = 4,015 𝑜𝑛𝑧𝑎𝑠 El nivel de confianza de 95% se encuentra entre 4.0052 y 4.0248. Por
supuesto, en este caso, la media de población de 4.01 onzas se
encuentra en este intervalo.
Ejemplo del texto guía
• Diez meses después de inaugurado el establecimiento, los dueños deciden
hacer una encuesta para evaluar el nivel de satisfacción de sus clientes con el
servicio que brindan. Pidieron calificar el servicio de 0 a 10 (0 implica un
pésimo servicio y 10 un excelente servicio); las calificaciones asignadas por
los clientes se ven en el archivo de Excel. (Descargar archivo Calificaciones
servicio).
• Construya un intervalo de confianza de 90% para la calificación promedio.
Ejercicio
En la siguiente tabla se registra el número de productos vendidos por una
muestra de 32 de los 265 vendedores de cierta empresa durante el mes anterior
(Descargar archivo ejercicios para clase 1:1).
a) Determina un intervalo de confianza del 90% para la cantidad promedio de
productos vendidos por cada vendedor durante el mes anterior.
b) Con ese tamaño de muestra y ese nivel de confianza, ¿cuál sería el margen
de error?
Ejercicio propuesto
Algunas empresas medianas exportan parte de su producción a países del Grupo
Andino. Para estimar el monto de esas exportaciones se hizo un muestreo entre 100
empresas medianas tomadas aleatoriamente entre las que exportaban y se averiguó a
cuánto ascendían sus exportaciones en el último mes. Se encontró un promedio de
7500 dólares y una desviación estándar de 3260 dólares. (Ejercicio para clase1:2)
a) Encuentra un intervalo de confianza del 90% para la verdadera media.
b) ¿Cuál sería ese intervalo si el nivel de confianza es 95% y el tamaño muestral no
cambia? Concluye
c) ¿Cuál sería ese intervalo si el nivel de confianza sigue siendo 90%, pero el tamaño
de muestra se duplica? Concluye
Estimación por intervalos para variables
cuantitativas: Muestra menor 30 elementos.
• Para producir un intervalo de confianza • La distribución t depende del nivel de
válido debe hacerse una hipótesis más confianza y los grados de libertad=n-1
fuerte con respecto a la población de
• Al aumentar lo grados de Libertad de la
interés y es que ella está distribuida
distribución t, se acerca mas a los valores
normalmente.
de la distribución normal z
• No se conoce la desviación estándar .
de la población y se utiliza la de la
muestra, s.
• Esto conduce a intervalos de confianza
basados en la distribución t de
Student.
Distribución t-Student
• Se utiliza la desviación estándar de la Principales propiedades son las siguientes:
muestra, s, para estimar la de la población
y, por ello, el calculo del error estándar de
• Tiene media de 0.
la media se convierte en: • Simétrica respecto a la media.
𝑠 • No se trata de una sola distribución sino, mas bien,
𝑠𝑥ҧ =
𝑛 de una familia de distribuciones, cada una de ellas
El estadístico t se hallaría: definida por los denominados grados de libertad
dados por n – 1. En símbolos gl = n – 1.
𝑥ҧ − 𝜇
𝑡=𝑠 • En términos generales, esta distribución t es mas
ൗ 𝑛 achatada que la normal en el centro y sus colas son
mas altas que las de la normal pero, la distribución
t, se aproxima a la normal conforme n aumenta.
Distribución t-Student
• Para crear un intervalo de confianza de la media poblacional con la
distribución t,
𝑠 𝑠 𝑠
𝑥ҧ ± 𝑡𝛼/2 𝑜 𝑥ҧ − 𝑡𝛼 , 𝑥ҧ + 𝑡𝛼/2
𝑛 2 𝑛 𝑛
• Suponga que la población muestreada es normal o aproximadamente
normal.
• Suponga que la muestra es menor de 30 elementos.
• Estime la desviación estándar de la población (σ) con la desviación estándar
de la muestra (s).
• Utilice la distribución t en lugar de la distribución z.
• Los grados de libertad se calcula con el número de observaciones incluidas
en la muestra menos 1 (n-1).
Distribución t-Student
• Un fabricante de llantas desea investigar la durabilidad de sus productos. Una
muestra de 10 llantas que recorrieron 50000 kilómetros reveló una media
muestral de 0.32 pulgadas de desgaste con una desviación estándar de 0.09
pulgadas. Construya un intervalo de confianza de 95% de la media
poblacional. ¿Sería razonable que el fabricante concluyera que después de
50000 km, la cantidad media poblacional de desgaste es de 0.30 pulgadas?
• 𝑥ҧ = 0,32𝑖𝑛, s=0,09in, n=10, grados de libertad=10-1=9
Distribución t-Student
𝑝ҧ 1 − 𝑝ҧ
𝑒 = 𝑧𝛼/2
𝑛
Estimación por intervalos para variables
cualitativas
• Se debe tomar como estimador puntual de • La estimación por intervalo de una
𝑝ҧ la proporción de éxitos obtenidos en las proporción poblacional, población finita o
n pruebas, es decir: cuando el tamaño de la muestra es mayor
𝑥 n/N>5% de la población, se puede aplicar
𝑝ҧ = el factor de corrección
𝑛
• La estimación por intervalo de una
proporción poblacional, población infinita
𝑝ҧ 1 − 𝑝ҧ 𝑁−𝑛
𝑝ҧ ± 𝑧𝛼/2
𝑝ҧ 1 − 𝑝ҧ 𝑛 𝑁−1
𝑝ҧ ± 𝑧𝛼/2
𝑛
Estimación por intervalos para variables
cualitativas
• Un estudio en Colombia encuestó a 900 mujeres futbolistas para conocer su
opinión acerca de como se les trataba en los cursos de futbol. En el estudio
se encontró que 396 estaban satisfechas con el trato igualitario. La estimación
puntual de la proporción poblacional de futbolistas satisfechas con el trato es
396/900=0,44, con un nivel de confianza de 95%,
𝑝ҧ 1−𝑝ҧ 0,44 1−0,44
𝑝ҧ ± 𝑧𝛼/2 = 0,44 ± 1,96 = 0,44 ± 0,0324
𝑛 900
Hipótesis 𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 < 𝜇0 𝐻𝑎 : 𝜇 > 𝜇0 𝐻𝑎 : 𝜇 ≠ 𝜇0
Estadístico de prueba 𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0
𝑧= 𝑧= 𝑧=
𝜎Τ 𝑛 𝜎Τ 𝑛 𝜎Τ 𝑛
Hipótesis 𝐻0 : 𝑝 ≥ 𝑝0 𝐻0 : 𝑝 ≤ 𝑝0 𝐻0 : 𝑝 = 𝑝0
𝐻𝑎 : 𝑝 < 𝑝0 𝐻𝑎 : 𝑝 > 𝑝0 𝐻𝑎 : 𝑝 ≠ 𝑝0
Estadístico de prueba 𝑝Ƹ − 𝑝0 𝑝Ƹ − 𝑝0 𝑝Ƹ − 𝑝0
𝑧= 𝑧= 𝑧=
𝑝0 1 − 𝑝0 Τ𝑛 𝑝0 1 − 𝑝0 Τ𝑛 𝑝0 1 − 𝑝0 Τ𝑛
ഥ𝟏 , 𝒑
𝒏𝟏 , 𝒙 ෝ𝟏 ഥ𝟐 , 𝒑
𝒏𝟐 , 𝒙 ෝ𝟐
Prueba de hipótesis con dos poblaciones
independientes: Variable Cualitativa
• Prueba de hipótesis de la diferencia de proporciones: No es poco
común que quiera establecerse el contraste de dos proporciones para
establecer si son similares o si una sí supera a la otra por la diferencia que se
supone
Prueba de 2 Colas Prueba Cola Inferior Prueba de Cola Superior
𝐻0 : 𝑝1 − 𝑝2 = 𝑑0 𝐻0 : 𝑝1 − 𝑝2 ≥ 𝑑0 𝐻0 : 𝑝1 − 𝑝2 ≤ 𝑑0
𝐻1 : 𝑝1 − 𝑝2 ≠ 𝑑0 𝐻1 : 𝑝1 − 𝑝2 < 𝑑0 𝐻1 : 𝑝1 − 𝑝2 > 𝑑0
Donde 𝑑0 es la diferencia hipotética entre las proporciones poblacionales
Prueba de hipótesis con dos poblaciones
• Si se supone que 𝐻0 es verdadera los parámetros poblacionales 𝑝1 = 𝑝2 = 𝑝. Por lo tanto, el
estadístico muestral de prueba se puede expresar así:
𝑝Ƹ1 − 𝑝Ƹ 2 − 𝑑0
𝑧=
1 1
𝑝Ƹ 1 − 𝑝Ƹ +
𝑛1 𝑛2
• Proporción muestral o estimador combinado de p:
𝑥1 + 𝑥2
𝑝Ƹ =
𝑛1 + 𝑛2
𝑝Ƹ1 y 𝑝Ƹ 2 son estadísticos muestrales para las poblaciones 𝑝1 𝑦 𝑝2 , 𝑛1 𝑦 𝑛2 son el tamaño de
muestra.
Ejemplo del texto guía
• Supóngase que en el establecimiento que se viene evaluando hicieron la
encuesta sobre la calificación de los clientes al servicio prestado, pero las
respuestas posibles eran únicamente “Bueno”, “Regular” o “Malo”; una
encuesta similar se hizo en un negocio de la competencia. Pruebe la hipótesis
de que entre los dos establecimientos no hay diferencia en la proporción de
personas que califican el servicio como malo con un nivel de significancia del
5%. Los datos de las encuestas están en el siguiente archivo: (Descargar
archivo Calificaciones propio competencia, pagina 158)
Ejercicio propuesto
Una empresa pequeña de confecciones utiliza dos máquinas para el proceso de
corte; quiere evaluar si la proporción de cortes defectuosos es similar en ambas
máquinas. Para tal efecto evaluó dos muestras de 150 elementos cada una en
cada máquina y clasificó los cortes como defectuosos o no defectuosos, de
acuerdo con ciertos límites de tolerancia establecidos previamente. Los
resultados están en el siguiente archivo: (Descargar archivo ejercicios para clase
2:3).
• Elabora una prueba de hipótesis para evaluar si hay diferencia entre las
proporciones. Para dar tu respuesta básate en un valor p.
Prueba de hipótesis con dos poblaciones
independientes: Variable Cuantitativa
• Nos interesa son las diferencias entre las medias 𝜇1 − 𝜇2 . Se toman dos
muestras separadas e independientes. Sea 𝑑0 la diferencia hipotética entre
𝜇1 𝑦 𝜇2 . Las tres formas que puede adoptar una prueba de hipótesis son las
siguientes:
Prueba de 2 Colas Prueba Cola Inferior Prueba de Cola Superior
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0 𝐻0 : 𝜇1 − 𝜇2 ≥ 𝑑0 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝑑0
𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑑0 𝐻1 : 𝜇1 − 𝜇2 < 𝑑0 𝐻1 : 𝜇1 − 𝜇2 > 𝑑0
Prueba de hipótesis con dos poblaciones
independientes: Variable Cuantitativa
• De igual manera que para el calculo con una población, para dos poblaciones
independientes se seleccionar el nivel de significancia (α), calcular el estadístico de
prueba y encontrar el valor-p para determinar si se rechaza la hipótesis nula.
• Estimador puntual : 𝑥ҧ1 − 𝑥ҧ2 . Cuando las muestras son mayores a 30 elementos se
puede considerar que se distribuye normal, si es menor a 30 elementos se usa la
distribución t.
• Estadístico de prueba:
𝑥ҧ1 − 𝑥ҧ2 − 𝑑0
𝑧=
𝜎12 𝜎22
+
𝑛1 𝑛2
Ejercicio del texto guía
• Como evaluación del proceso de capacitación a través de las charlas de
atención al cliente se hizo el siguiente experimento: hace un mes, cuando aún
no se habían brindado las charlas, se pidió a una muestra de 100 clientes que
calificaran el servicio; hoy, después de las capacitaciones, se pidió a otro
grupo de 100 clientes que calificaran el servicio. Si los dueños consideran que
el proceso fue eficaz si el promedio de las calificaciones mejora por lo menos
en 1,5 después de la capacitación, ¿podría afirmarse que el proceso fue
efectivo? (Descargar archivo calificaciones independientes)
Ejercicio
• A los empleados de una empresa se les midió el tiempo que utilizaban para
ensamble de un producto especifico (datos en horas). Los jefes de
producción quieren verificar si hay diferencia en los tiempos promedios de
ensamble del turno A con el turno B(Descargar archivo ejercicios para clase
2:4).
• Elabora una prueba de hipótesis para evaluar si hay diferencia entre los
tiempos promedio de ensamble. Usa una significancia del 5% para hacer la
prueba.
Prueba de hipótesis con dos poblaciones
pareadas
• El segundo tipo de muestra dependiente se caracteriza por relacionar o
aparear observaciones. Se selecciona una característica a evaluar y se hacen
dos estudios. Cada estudio puede mostrar o no diferencias de uno con
respecto al otro. La evaluación se hace con condiciones similares para reducir
los posibles errores muestrales.
• Para la prueba de hipótesis, el interés recae sobre la distribución de las
diferencias en el valor calculado. O sea la diferencia entre las observaciones
tomadas para un solo elemento o sujeto.
Prueba de hipótesis con dos poblaciones
pareadas
• Se investiga si la media de la distribución de las diferencias de los valores
calculados es 0 (si 𝜇1 = 𝜇2 ) o cualquier otro valor hipotético; por lo tanto, la
muestra se construye de las diferencias para cada unidad experimental. Sea
𝑑ҧ = 𝜇1 − 𝜇2 la media de la diferencia entre los valores de la población.
Prueba de 2 Colas Prueba Cola Inferior Prueba de Cola Superior
𝐻0 : 𝑑ҧ = 𝑑0 𝐻0 : 𝑑ҧ ≥ 𝑑0 𝐻0 : 𝑑ҧ ≤ 𝑑0
𝐻1 : 𝑑ҧ ≠ 𝑑0 𝐻1 : 𝑑ҧ < 𝑑0 𝐻1 : 𝑑ҧ > 𝑑0
Prueba de hipótesis con dos poblaciones
pareadas
• El estadístico de prueba tiene una distribución t con n-1 grados de libertad:
𝑑ҧ − 𝑑0
𝑡=
𝑠𝑑 Τ 𝑛
donde 𝑑ҧ es la media de las diferencias, 𝑠𝑑 es su desviación estándar, n es el
número de observaciones y 𝑑0 es la diferencia hipotética.
σ 𝑑𝑖
ҧ
𝑑=
𝑛
Ejercicio
• Al personal del Establecimiento le imparten unas charlas de atención al
cliente. Luego se hizo una encuesta a 15 clientes asiduos y se les pidió que
calificaran el servicio; esos mismos clientes habían calificado el servicio antes
del proceso de capacitación. Eso se hizo con el fin de evaluar si el proceso
había surtido efecto; los dueños considerarán que el proceso fue eficaz si el
promedio de las calificaciones mejora por lo menos en 1,5. Según los datos
que se presentan en el siguiente archivo, ¿podría afirmarse que el proceso fue
efectivo? (descargar archivo charlas de capacitación)
Ejercicio
• A los empleados de una empresa se les inscribió en una capacitación con una
nueva máquina de pulido para optimizar los tiempos que tardaban en este
proceso, ya que algunos clientes se quejaban por demora en la entrega de los
pedidos. Los tiempos que tardaba cada empleado antes y después de la
capacitación se muestran en el siguiente archivo (datos en horas). (Descargar
archivo ejercicios para clase 2:5).
• Establece las hipótesis para verificar si la capacitación para mejorar el tiempo
promedio de pulido dio resultado. Usa una significancia del 5% para hacer la
prueba.
Ejercicio
• Desea evaluarse el grado de favorabilidad de los grandes ejecutivos colombianos frente a los
tratados de libre comercio. Se hizo una encuesta a 500 de ellos en la que se indagó acerca de
su actitud al respecto; los resultados se muestran en el siguiente archivo: (descargar archivo
ejercicios para clase3:1).
a) Estima con un 90% de confianza su grado de favorabilidad frente a los TLC. Un censo
que se desarrolló a principios de este año encontró que en el país hay 27250 grandes
ejecutivos.
b) En una revista de amplia circulación nacional se afirmó la semana anterior que por lo
menos el 60% de los grandes ejecutivos colombianos está a favor de los tratados de libre
comercio. Según lo encontrado en la encuesta, ¿crees que es cierto lo que se dice allí? Para
dar tu respuesta realiza la prueba de hipótesis correspondiente.
Ejercicio
• Una empresa comercializa una bebida refrescante en un envase en cuya etiqueta se
puede leer que el contenido es de 250 centímetros cúbicos. El Departamento de
Consumo toma aleatoriamente 25 envases y encuentra los siguientes contenidos:
(descargar archivo ejercicios para clase3:2)
a) ¿Puede afirmarse con un nivel de significancia de 5% que no se está vendiendo el
contenido indicado?
b) ¿De qué tamaño debió haber sido la muestra tomada para que los resultados
fueran plenamente confiables? Considera un margen de error de 5%
Ejercicio
Maquila de Oriente es una empresa que se encarga de cortar y distribuir piezas de tela para
indumentaria deportiva. La empresa cuenta con dos máquinas automáticas para hacer los cortes de
tela. Para hacer un control de calidad, se tomó una muestra de cada una de las máquinas. Las
medidas de los cortes (medidos en cm) se muestran en las tablas (descargar archivo ejercicios para
clase3:3).
a) Encuentra un intervalo de confianza del 90% para la medida promedio de los cortes de cada
una de las máquinas. Interpreta los resultados. Con nivel de confianza de 90% y margen de
error de 5%, ¿de qué tamaño debería ser la muestra para obtener resultados confiables?
b) Un corte se considera defectuoso si mide menos de 1,44 cm o más de 1,8 cm. El mecánico
encargado del mantenimiento dice que en la máquina 1 el 5% de los cortes es defectuoso y en la
máquina 2 el 12% presenta defectos. Establece la hipótesis para cada máquina y utilice una
significancia del 5% para validar lo que dice el mecánico. Interpreta los resultados y especifica
cuáles son las regiones de aceptación y rechazo.
Ejercicio
En la siguiente tabla se registra el número de productos vendidos por una muestra de
32 de los 265 vendedores de cierta empresa durante el mes anterior: (descargar archivo
ejercicios para clase3:4)
a) Determina un intervalo de confianza del 90% para la cantidad promedio de
productos vendidos por cada vendedor durante el mes anterior.
b) La Gerencia lanzó la hipótesis de que los vendedores de la Empresa logran vender
como máximo 1800 productos por mes en promedio. Según los resultados del mes
anterior para la muestra tomada, ¿parecería que eso es cierto? Demuéstralo
planteando el desarrollo de una prueba de hipótesis, utilizando un nivel de
significancia de 10%.
Ejercicio
Consultores en Calidad S.A.S A realizó una asesoría a una productora de arepas, ya que algunos
clientes se quejaban por demora en la entrega de los pedidos. Para disminuir el tiempo de
producción se les inscribió en una capacitación en Six sigma (Metodología para mejora de
procesos). El tiempo en horas que tardaba cada empleado en la fabricación de un lote de arepas
antes y después de la capacitación se muestra en la tabla. (descargar archivo ejercicios para
clase3:5)
a) Halla medias y coeficientes de variación antes y después de la capacitación. Establece una
comparación a partir de los coeficientes de variación.
b) Establece las hipótesis para verificar si la capacitación para mejorar el tiempo promedio de
producción de un lote de arepas dio resultado. Usa un nivel de significancia del 5% para
hacer la prueba.
Ejercicio
Aprovechando un tratado firmado recientemente algunas pymes de alimentos
han comenzado a exportar a países de Lejano Oriente. Las exportaciones de 25
de esas empresas seleccionadas aleatoriamente ascienden a los siguientes
montos (en miles de dólares) en el último año: (descargar archivo ejercicios para
clase3:6)
• El Presidente de la República afirmó ayer que el promedio de exportaciones
de empresas de las características señaladas es al menos de 200000 dólares en
el último año. Según esa muestra, ¿parece que eso es cierto? Compruébalo
mediante una prueba de hipótesis.