Está en la página 1de 118

Estadística Inferencial

Estadística Inferencial
Estadística Inferencial
• La estadística inferencial se usa
frecuentemente para pronosticar el
comportamiento de variables indicadoras
en situaciones inciertas. El proceso conlleva
a la verificación y el contraste.
Estadística Inferencial
• El objetivo de la estadística inferencial consiste en extraer información
aplicable a toda una población con base en los resultados obtenidos a
partir de una muestra representativa. Esta parte de la estadística proporciona
las herramientas necesarias para generalizar lo que se observa en una parte
de la población, lo que significa que las conclusiones que se buscan obtener
son acerca de la población, no sobre la muestra; eso implica, además, que si
se pueden conocer datos de toda la población no tiene sentido estimar nada.
Estadística Inferencial
Usa la información que proporciona una muestra
para sacar conclusiones acerca del valor de un
Estimación parámetro poblacional (como la media poblacional
y la proporción poblacional) con un nivel de
confianza y un margen de error específicos.
Estadística Inferencial

Estable el grado de compatibilidad entre la muestra


Pruebas de hipótesis obtenida y alguna afirmación que se había
planteado antes de recoger los datos.
Estadística Inferencial
A los empleados de una empresa se les inscribió en una capacitación con una nueva
máquina de pulido para optimizar los tiempos que tardaban en este proceso, ya que
algunos clientes se quejaban por demora en la entrega de los pedidos. Se tienen datos
de tiempos de algunos empleados de la empresa antes y después de la capacitación.
• Estimación: Predice el promedio de la mejora en los tiempos después de la
capacitación.
• Prueba de hipótesis: Los dueños de la empresa suponen que la capacitación hará
que los tiempos que tardan los empleados para este proceso mejorará por lo menos
en 30 minutos. Comprueba mediante los datos si parece que eso no se cumplió o si
no hay base estadística para refutarlo.
Conceptos básicos

Población: conjunto de elementos de interés en un Muestra: subconjunto de la población; debe ser


determinado estudio. Tienen una característica una porción representativa en cantidad y calidad.
común. En cantidad implica que no puede ser muy
Se trabaja con una población cuando nuestro pequeña en relación a la población y en calidad
estudio se basa en datos reunidos para todos los implica que la muestra sí sea reflejo de la
elementos que cumplen la característica definida. población de la cual se extrae.
El tamaño de la población se representa como N. El tamaño de la muestra se representa como n.
Conceptos básicos
• Muestreo: Proceso de selección de una • Parámetros: Valores característicos de una
muestra dentro de una población; es mejor población. Un parámetro es un valor fijo
hacerlo aleatoriamente, pero cuando la (no aleatorio) que caracteriza a una
población es muy heterogénea es mejor población en particular.
hacerlo estratificado, que consiste en
dividir la población en varios subconjuntos
• Estadígrafos: Valores característicos de
una muestra. Un estadígrafo no es un valor
y de cada uno de ellos seleccionar una
fijo, ya que puede tener varios resultados
muestra aleatoria.
posibles según la muestra seleccionada.
• Elementos Individuos sobre los cuales se
evalúa la variable que se maneja
Variables
• Cualitativas: son atributos, • Cuantitativas: son variables
características, susceptibles de ser susceptibles de ser medidas, se
expresados mediante palabras expresan numéricamente (ingresos,
(ocupación, profesión, actividad ventas, consumos, pesos, estatura,
económica, nacionalidad, sexo, …). edades…).
Solo se pueden contar.
Muestreo
Población Muestra
Colección de Parte o porción de
elementos la población
Definición
considerados seleccionada para
su estudio
Parámetros Estadígrafos
Características
(Estadísticos)
Tamaño: N Tamaño: n
media: μ media: 𝑥ҧ
Símbolos
Desv. Estandar: σ Desv. Estadar: s
Proporción: p=x/N Proporción: p=x/n
Método de muestreo
• Métodos no probabilísticos o por conveniencia: Interviene la opinión del
investigador para obtener cada elemento de la muestra.
• Métodos probabilísticos: muestra seleccionada de tal forma que cada elemento de
la población en estudio tiene la misma probabilidad (conocida diferente de cero) de
ser incluido.
• Muestreo aleatorio simple Tarea
• Muestreo aleatorio estratificado Consultar otros métodos de muestreo
• Muestreo por conglomerado
• Muestreo sistemático
Muestreo aleatorio simple
• Muestreo de una población
finita: Una muestra aleatoria simple
de tamaño n de una población finita
N es una muestra seleccionada de
manera que cada posible muestra de
tamaño n tenga la misma
probabilidad de ser seleccionada.
Ejemplo: muestreo de una población finita
• Suponga que una población consta de 845 empleados de la Nacional de
Chocolates, de la cual se va a elegir una muestra de 52 empleados.
Solución: Un método más conveniente de seleccionar una muestra aleatoria
consiste en utilizar un número de identificación por cada empleado y una tabla
de números aleatorios.
Muestreo aleatorio simple
• Muestreo de una población infinita: una muestra aleatoria de tamaño n de
una población infinita se selecciona de manera tal que cumpla las siguientes
condiciones:
• Cada elemento proviene de la misma población
• Cada elemento es seleccionado de manera independiente. (No haya sesgo en la
información)
Este tipo de muestreo aplica cuando la población es infinitamente grande o sus
elementos están siendo generados por un proceso en marcha, por lo que no es
posible hacer una lista de todos los elementos.
Ejemplo de muestreo de población infinita
• Considere una población de clientes que llegan a un restaurante de comidas
rápidas. Se le pide a un empleado que seleccione y entreviste a una muestra
para elaborar un perfil de consumidores que visitan el restaurante.
Para fines prácticos se considera infinita la población de este proceso en
marcha.
• El empleado debe seleccionar la muestra de personas que llegan y consumen. Con esto
se puede asegurar que los elementos son seleccionados de la misma población.
• Asegurarse que los consumidores son seleccionados de manera independiente (no en
grupos, edades, géneros).
Estimación
• Sacar una conclusiones sobre una población por medio de un razonamiento a partir
de hechos, indicios, supuestos anteriores obtenidos mediante el estudio de una
muestra.
• El estimador es una medida que describe una determinada característica de la
muestra, obtenida mediante la aplicación de promedios, proporciones, tasas,
razones, varianzas, desviaciones típicas, etc
• La estimación es una técnica que permite predecir la medición mas probable de un
parámetro poblacional a partir de la observación de una muestra (estadígrafo),
con una confianza y un margen de error específico.
Media
Puntual Desviación estándar
Proporción poblacional
Estimación
Por intervalos Limites de confianza
Estimadores Puntuales
Algunos estimadores puntuales son:
𝑥
• La proporción muestral (𝑝),ҧ usado como estimador de la proporción poblacional (P). 𝑝ҧ = 𝑛
σ 𝑥𝑖
• La media muestral ( 𝑥ҧ ), usado como estimador del valor esperado poblacional (µ). 𝑥ҧ = 𝑛

• La varianza de la muestra (𝜎𝑛−1


2
), usado como estimador de la varianza de la población (𝜎𝑛2 ).
• La desviación estándar de la muestra (𝑠), usado como estimador de la desviación estandar de la
𝑥𝑖 −𝑥ҧ 2
población (𝜎).𝑠 =
𝑛−1

No indica la cantidad de información sobre la cual se basa la estimación y no dice nada acerca del
posible tamaño del error (y siempre que se toman muestras existe algún error).
Tamaño de la muestra
Se dice que una muestra debe ser pequeña, con el fin de que el costo de la
investigación sea lo suficientemente bajo, y bastante grande para que el error del
muestreo sea admisible. En el cálculo del tamaño óptimo, se deben tener en cuenta, los
siguientes componentes:
• El Error de Muestreo: es la diferencia que puede haber entre el valor poblacional
(parámetro) y la estimación de la misma (estimación puntual o estadígrafo), obtenida
por medio de una muestra aleatoria. En muchos casos, el error será determinado
por el investigador.
• La Varianza: Del grado de variabilidad, depende en gran parte el tamaño de la
muestra (variable cuantitativa).
• La probabilidad de éxito: la proporción de la ocurrencia de un evento.
Tamaño de la muestra
• Nivel de confianza: Se ha mencionado que el grado de precisión depende de
alguna manera, del tamaño de la muestra y éste, a su vez, de factores tales como el
error, la varianza. Esta última es fijada por el investigador, que por lo general
selecciona una confianza (1-α) del 90%, 95% o 99%.

• Tamaño de la población: Es el último componente de la fórmula, para calcular


el tamaño óptimo de la muestra, cuando se trata de poblaciones finitas.
Determinación del tamaño de la muestra para
una población infinita: Variable cuantitativa
• Una encuesta generalmente incluye preguntas referentes a variables a cuantitativas.
• En la práctica es muy frecuente que no se conozca la varianza de la característica en la
población.
• La desviación estándar de la muestra es conocida (𝜎)
• Se debe seleccionar el nivel de confianza (1-α)
𝜎
• Se obtiene despejando n de la relación del error estándar, 𝑒 = 𝑧𝛼/2 𝑛
2
𝑍𝛼/2 𝜎
𝑛=
𝑒
En la ecuación e representa el error que el usuario está dispuesto a aceptar.
Determinación del tamaño de la muestra para
una población infinita: Variable cuantitativa
• En un estudio previo para investigar el costo de la renta de automóviles en USA se encontró
que el costo medio de alquilar un vehículo era de aproximadamente $55 por día. Se quiere
realizar otro estudio para estimar la media poblacional del costo del alquiler por día de
vehículos en USA. El director del proyecto especificó que la media poblacional del alquiler
por día debe estimarse con un error de $2 y que sea un nivel de confianza de 95%. Un
analista revisó los datos del primer estudio y encontró que la desviación estándar muestral
del costo diario del alquiler era de $9,65.
• Sí el nivel de confianza es del 95%, 𝑧0,025 = 1,96
• e= $2
𝑍𝛼/2 𝜎 2 1,96∗9,65 2
• σ=$9,65 𝑛=
𝑒
=
2
= 89,43 = 90 𝑎𝑙𝑞𝑢𝑖𝑙𝑒𝑟𝑒𝑠
Determinación del tamaño de la muestra para
una población infinita : Variable cualitativas
• Una encuesta generalmente incluye preguntas referentes a variables cualitativas y otras a
cuantitativas; si incluye ambos el tamaño de la muestra se elige según proporciones.
• Para calcular el tamaño apropiado de muestra se debe hacer una estimación de P. Para ello
debemos basarnos en un valor 𝑝ҧ de una muestra anterior o en el establecimiento de 𝑝ҧ a
partir de una muestra piloto o haciendo una estimación subjetiva.
• Otro enfoque para seleccionar el tamaño de muestra (el más utilizado) consiste en
maximizar el producto de pxq (q=1-𝑝),
ҧ donde la probabilidad de éxito 𝑝ҧ es de 50%.
𝑧𝛼/2 2 n es el tamaño de la muestra.
• Para una población infinita 𝑛 = 𝑝𝑞
ҧ
𝑒 z es el valor normal estándar correspondiente al nivel de
confianza deseado.
p es la proporción de la población.
e es el máximo error tolerable.
Determinación del tamaño de la muestra para
una población infinita : Variable cualitativas
• Una empresa desea llevar a cabo una investigación para determinar la proporción
actual en el que la población de golfistas que está satisfecha con la disponibilidad de
horarios de practica. ¿ De qué tamaño deberá ser la muestra si se desea que en la
estimación de la proporción poblacional el error sea de 0,025 a 95% de nivel de
confianza? Se usa el valor de 𝑝ҧ del resultado de un estudio anterior donde p=0,44.

2 2
𝑧𝛼/2 1,96
𝑛 = 𝑝𝑞
ҧ = 0,44 ∗ 1 − 0,44 ∗ = 1514,5 = 1515 𝑔𝑜𝑙𝑓𝑖𝑠𝑡𝑎𝑠
𝑒 0,025
Determinación del tamaño de la muestra para
una población finita
Variables cuantitativas Variables cualitativas

2 2 2
𝑧𝛼/2 𝜎 𝑁 𝑧𝛼/2 ҧ
𝑝𝑞𝑁
𝑛= 2 2 𝑛= 2
𝑁−1 𝑒 2+ 𝑧𝛼/2 𝜎 𝑁−1 𝑒 2 + 𝑧𝛼/2 ҧ
𝑝𝑞

𝜎2
𝑛= 𝑒 2 𝜎2
𝑧
+𝑁
Ejemplo
• Dos administradores recién egresados inauguraron el año pasado un
establecimiento de comidas basado en el sabor de la canela en un centro
comercial de Medellín. Los dueños de un establecimiento de comidas
hicieron antes de la apertura una investigación de mercados para determinar
qué productos ofrecer. Para tal efecto planearon la realización de una
encuesta y en los resultados quieren tener un nivel de confianza de 90% y un
margen de error de 5%, ¿cuál debe ser el tamaño de la muestra a utilizar?
Ejemplo
Los dueños del negocio anterior planean abrir un pequeño local en un sector de
Medellín muy visitado por turistas extranjeros; el mercado meta está formado por los
turistas alojados en ese sector, que se calcula en una población flotante de
aproximadamente 1300 personas. Para acceder a ellos se quiere hacer una encuesta y en
los resultados se quiere tener un nivel de confianza de 90% y un margen de error de
3,5%,
a) ¿cuál debe ser el tamaño de la muestra a utilizar?
b) Si antes de abrir el nuevo local deciden hacer la encuesta a 30 turistas, ¿de qué
tamaño es el margen de error si se considera ese nivel de confianza de 90%? ¿Lo
consideras aceptable?
Ejemplo
Para vigilar la calidad de su servicio, una empresa que se dedica al comercio electrónico
selecciona una muestra aleatoria de clientes cada mes; se establece contacto con cada
cliente muestreado, se le hace una serie de preguntas acerca de la calidad del servicio y
se determina una calificación de satisfacción por cliente muestreado entre 0 y 100. Las
encuestas anteriores han demostrado que, aunque la media cambia mes a mes, la
desviación estándar de las calificaciones ha tendido a estabilizarse en 20.
a) ¿Qué tan grande se requiere una muestra si queremos tener 95% de confianza de
que el error de estimación no excederá de 2?
b) Si se estima que la empresa tiene 1800 clientes, ¿qué tan grande debe ser la muestra
si se consideran los parámetros anteriores?
Distribuciones muestrales
• Una distribución muestral es el conjunto de todas las muestras distintas de
determinado tamano n que es posible extraer de una poblacion de tamano N.
En primer lugar, se debe observar que se trata del conjunto de todas las
muestras distintas que es posible extraer de determinada poblacion.
• De una población a estudiar, se selecciona una sola muestra de todas las
muestras posibles de igual tamaño, con el fin de obtener conclusiones sobre
la población, no sobre la muestra.
Distribución de la media muestral
Si consideramos una población de N
elementos, con media µ y desviación
estandar σ, si se obtienen M número
de muestras posibles, de tamaño n,
simbolizamos a cada media muestral,
por 𝑥1ҧ , 𝑥ҧ2 , … 𝑥ҧ𝑀 y cada desviación
estándar como 𝑠1 , 𝑠2 , … 𝑠𝑀 .
Teorema. Dada una población, si extraemos todas las muestras posibles de un mismo
tamaño, entonces la media de la distribución de todas las medias muestrales posibles,
será igual a la media poblacional.
Distribución de medias muestrales
• Media muestral 𝜇𝑥ҧ En aquellos casos de poblaciones finitas, es
σ 𝑥ҧ 𝑖 decir, cuando se da información sobre el
𝜇𝑥ҧ = , 𝜇 = 𝜇𝑥ҧ tamaño poblacional, y cuando el tamaño de la
𝑀
muestra es mayor n/N>5% de la población,
• Desviación estándar muestral (error se puede aplicar el factor de corrección
estándar de la media), población infinita
2
𝜎 𝑁−𝑛
𝑥ҧ𝑖 − 𝜇 𝜎 𝜎𝑥ҧ =
𝜎𝑥ҧ = = 𝑛 𝑁−1
𝑀 𝑛 Factor de
corrección
Esta formula también aplica para la población
sea finita y el tamaño de la muestra sea menor
o igual a 5% del tamaño de la población; es
decir, n/N = 0.05.
Teorema del limite central
• Si X es una variable aleatoria para la que se La población no tiene distribución
conocen su media μ y su varianza 𝜎 2,
la normal. Cuando la población de la que se
distribución muestral de la media tiende a tomó la muestra aleatoria simple no tiene
ser normal con media μ y desviacion
𝜎
distribución normal, el teorema del límite
estándar (error estandar):𝜎𝑥ҧ = o 𝜎𝑥ҧ = central ayuda a determinar la forma de la
𝑛 distribución de muestreo de x.
𝜎 𝑁−𝑛
𝑛 𝑁−1 • TEOREMA DEL LÍMITE CENTRAL
• Forma de la distribución de muestreo: Cuando se seleccionan muestras aleatorias
La población tiene distribución normal. Si simples de tamaño n de una población, la
se supone que la población de la que se distribución de muestreo de la media muestral
selecciona la muestra aleatoria simple tiene x puede aproximarse mediante una distribución
distribución normal o casi normal, la normal a medida que el tamaño de la muestra
distribución de muestreo de x está distribuida se hace grande.
normalmente cualquiera que sea el tamaño de
la muestra.
Teorema del limite central
• Dicho teorema demuestra, que la
distribución de las medias
muestrales se puede aproximar con
una distribución normal de
probabilidades cuando el tamaño
de la muestra es de por lo menos 30
elementos.
Aplicaciones del análisis de la distribución
muestral de la media
Cuando se trata de una muestra grande Aquí vale aclarar que se usa la desviación
(n>=30), de acuerdo con el teorema estándar muestral para la normalización.
central del limite, la distribucion de las
medias muestrales es aproximadamente
𝑥ҧ − 𝜇 𝑥ҧ − 𝜇
normal, por lo que se utiliza el 𝑧=𝜎 𝑧=
procedimiento de estandarizar los valores ൗ 𝑛 𝜎 𝑁−𝑛
para convertirlos a unidades de la 𝑛 𝑁−1
desviacion estandar y asi poder utilizar la
tabla.
Ejemplos
• La altura media de 400 alumnos de un plantel de secundaria es de 1,50 mts, y
su desviación típica es de 0,25 mts. Determinar la probabilidad de que en
una muestra de 36 alumnos, la media sea superior a 1,60 mts.
• Se tiene para la venta un lote de 1.000 pollos, con un peso promedio de 3,50
kg y una desviación estándar de 0,18 kg, ¿Cuál es la probabilidad de que en
una muestra aleatoria, 100 pollos de esta población, pesen entre 3,53 y 3,56
kg?
Ejemplo
Una empresa fabrica focos que tienen una duración con media de 800 horas y
desviación estándar de 35 horas.
• Encuentre la probabilidad de que un foco que alguien compró dure menos
de 780 horas.
• Encuentre la probabilidad de que una muestra de 50 focos tenga una vida
promedio de menos de 780 horas.
Distribución muestral de Proporción p
• En el análisis de una característica cualitativa o atributo, se emplea la proporción de
éxitos y fracasos.
• La distribución muestral de la proporción es el conjunto de las proporciones de
todas las muestras de tamaño n que se pueden sacar de una población de tamaño N.
• La proporción muestral 𝑝ҧ es el estimador puntual de la proporción poblacional p. La
fórmula para calcular la proporción muestral
𝑥𝑖 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜𝑠
𝑝ҧ = =
𝑛 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Distribución muestral de Proporción p
• Media de p o valor esperado de P • Desviación estándar población infinita:
(proporción poblacional)
σ 𝑥𝑖 𝑃 1−𝑃
𝜇𝑝ҧ = 𝑃 = 𝜎𝑝ҧ =
𝑁 𝑛
• D. estándar o Error estándar población
finita:

𝑃 1−𝑃 𝑁−𝑛 𝑛
≤ 0,05, 𝑛𝑜 𝑠𝑒 𝑢𝑠𝑎 𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑐𝑐𝑖ó𝑛
𝜎𝑝ҧ = 𝑁
𝑛 𝑁−1
Distribución muestral de Proporción p
• La distribución de muestreo de 𝑝ҧ se • Variante estadística
aproxima mediante una distribución 𝑝 − 𝜇𝑝
normal, siempre 𝑛𝑝 ≥ 5 𝑦 𝑛(1 − 𝑍=
𝑝) ≥ 5. 𝑃 1−𝑃
• En las aplicaciones prácticas, cuando 𝑛
se requiere una estimación de la
proporción poblacional, casi siempre
se encuentra que el tamaño de la
muestra es suficientemente grande
para permitir usar la aproximación
normal para la distribución de
muestreo de 𝑝ҧ
Ejemplo
• Se tiene que el 4% de las piezas • El 46% de los sindicatos del país
producidas por cierta maquina es están en contra de comercializar
defectuosa. ¿ Cual es la con China continental, ¿ Cual es la
probabilidad de que un grupo de probabilidad de que en una
200 piezas, sea defectuosa mas del encuesta a 100 sindicatos muestre
3%? que mas del 52% tengan la misma
posición?
Ejercicios
• Se ha determinado que el 65% de los estudiantes universitarios de Medellín
prefieren los cuadernos marca Profesional ¿Cuál es la probabilidad de que en
una muestra de 100 universitarios de dicha ciudad, encontremos que: Como
máximo el 68% sean usuarios de este tipo de cuaderno
• Un fabricante de desodorantes recibe cada semana lotes de 10,000 válvulas
para los tarros rociadores. Para aceptar o rechazar dichos lotes, selecciona al
azar 400 válvulas de cada lote; si el 2% o más resultan defectuosos, se rechaza
el lote. En caso contrario se acepta el lote. ¿Cuál es la probabilidad de
rechazar un lote que contiene menos del 1% de válvulas defectuosas?
Estimación por intervalos
• Sirve para medir cuán próxima esta estimador puntual del parámetro poblacional.
• INTERVALO DE CONFIANZA: Conjunto de valores que se forma a partir de
una muestra de datos de forma que exista la posibilidad de que el parámetro
poblacional ocurra dentro de dicho conjunto con una probabilidad específica. La
probabilidad específica recibe el nombre de nivel de confianza.
• Intervalo de confianza asocia a cada muestra un intervalo que tiene una alta
probabilidad de contener el verdadero valor del parámetro.
• Este parámetro será habitualmente una proporción (p) en el caso de variables
cualitativas, y la media o la varianza (μ,σ)para variables cuantitativas.
Estimación por intervalos
El tamaño de la muestra depende de tres factores:
• Si la población fuente de la muestra se considera infinita o finita; se supone finita si es de un
tamaño conocido y se considera infinita si es de un tamaño desconocido o es muy grande.
• Nivel de confianza (1-α), es la probabilidad de que la estimación hecha se ajuste a la
característica poblacional evaluada, es decir, es la probabilidad de que el verdadero valor del
parámetro caiga en el intervalo de confianza establecido. Puede tomar valor de 90, 95 o
99%.
• El estadístico de la muestra, puede ser la media muestral o la proporción muestral
Estimación por intervalos
• El error del intervalo (e) de confianza establecido (que corresponde a la
mitad de la amplitud del intervalo) no puede exceder de lo que se fija
como margen de error.
• Cuando la encuesta tiene solamente preguntas cuantitativas el margen de
error no corresponde a un porcentaje, sino a un espacio evaluado en la
misma unidad de medida.
Construcción de intervalos de confianza
Un intervalo de confianza puede ser bilateral o unilateral y, en cualquiera de los casos, existen sutiles
diferencias en su construcción si la población origen es finita o si es infinita.
• Bilateral se expresa mediante dos valores: límite inferior y límite superior,
𝑃 𝑙𝑖𝑛𝑓 ≤ 𝜃 ≤ 𝑙𝑠𝑢𝑝 = 1 − 𝛼.
• Unilateral presenta solamente uno de los límites y el otro extremo es infinito o menos infinito.
Construcción de intervalos de confianza
• El error y margen de error no es lo mismo. El margen de error
es algo que se fija antes de seleccionar la muestra y el error se
calcula a partir del nivel de confianza y el tamaño de la
muestra; el margen de error es un máximo, por lo que el debe
ser menor o igual.
• Entre más amplio sea el intervalo de confianza, mayor es la
seguridad de que realmente el intervalo contenga el verdadero
valor, pero se aumenta el error. Es mejor un intervalo de
confianza relativamente pequeño con una confianza grande, lo
que se logra aumentando el tamaño de la muestra evaluada.
Construcción de intervalos de confianza
Errores comunes en la interpretación de intervalos de confianza:
• No mencionar el nivel de confianza.
• No mencionar que es un promedio o una proporción.
• No mencionar que se trata de una estimación.
• Asegurar que los valores para los elementos variarán entre los valores del intervalo de
confianza.
• No mencionar claramente la población objeto de estudio o extrapolar resultados.
• Decir que esa estimación es para los elementos de la muestra, ya que es para todos los
elementos de la población.
Estimación por intervalos para variables
cuantitativas: Desv. Estándar(σ) conocida.
• Un intervalo de confianza se calcula con el • Cuando no se conoce la desviación
empleo de dos estadísticos: la media estándar σ, se usa la desviación estándar
muestral ( 𝑥ҧ ) y la desviación estándar de la muestra, s, para calcular el error
muestral ( 𝜎𝑥ҧ ), que también se puede estándar de la media, esto es posible solo sí
llamar error estándar. el tamaño de la muestra es relativamente
grande (n > 30).
• Conocer σ simplifica el desarrollo del
intervalo de confianza, porque podemos 𝑠 𝑠 𝑁−𝑛
𝑠𝑥ҧ = 𝑠𝑥ҧ =
utilizar la distribución normal estándar. 𝑛 𝑛 𝑁−1
Bajo el supuesto que nuestra distribución
es normal estándar para 𝑥ҧ , el error
estándar muestral está definido:
𝜎 𝜎 𝑁−𝑛
𝜎𝑥ҧ = 𝜎𝑥ҧ =
𝑛 𝑛 𝑁−1
Población Infinita Población finita
Estimación por intervalos para variables
cuantitativas: Desv. Estándar(σ) conocida.
• ¿Cómo determinar el intervalo de confianza de 95%? La amplitud del intervalo se
determina por medio del nivel de confianza y de la magnitud del error estándar de la
media. Por lo tanto, la Estimación por intervalo de la media poblacional con σ
conocida:
Población Infinita Población finita

𝜎 𝜎 𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝑥ҧ − 𝑧𝛼/2 , 𝑥ҧ + 𝑧𝛼/2 𝑜 𝑥ҧ − 𝑧𝛼 , 𝑥ҧ + 𝑧𝛼/2
𝑛 𝑛 2 𝑛 𝑁−1 𝑛 𝑁−1

Donde (1-α) es el nivel de confianza (ejemplo:95%) y 𝑧𝛼/2 es el valor de z (en 2,5% y


97,5%) que proporciona un área en las colas de la distribución normal estándar.
Estimación por intervalos para variables
cuantitativas: Desv. Estándar(σ) conocida.
Si por ejemplo usamos en los intervalos de confianza
un nivel de confianza del 95%:
• 95% de las medias muestrales seleccionadas de una
población se encontrará dentro de 1.96 errores
estándares (desviación estándar) de la media
poblacional.
Con cualquier media muestral 𝑥ҧ que se encuentre
dentro de la región del 95% se obtendrá un intervalo
que contenga la media poblacional μ. Todos los
intervalos que se obtengan de restar y sumar
1,96𝜎𝑥ҧ abarcaran la media poblacional.
Ejemplo Estimación por intervalos: Desv.
Estándar(σ) conocida
• Del Monte Foods, Inc., distribuye duraznos en trozos en latas de 4 onzas. Para
asegurarse de que cada lata contenga por lo menos la cantidad que se requiere, Del
Monte establece que el proceso de llenado debe verter 4.01 onzas de duraznos y
almíbar en cada lata. Así, 4.01 es la media poblacional. Por supuesto, no toda lata
contendrá exactamente 4.01 onzas de duraznos y almíbar. Algunas latas contendrán
más y otras menos. Suponga que la desviación estándar del proceso es de 0.04
onzas. También suponga que el proceso se rige por la distribución de probabilidad
normal. Ahora se selecciona una muestra aleatoria de 64 latas y se determina la
media de la muestra. Ésta es de 4.015 onzas de duraznos y almíbar.
Ejemplo Estimación por intervalos: Desv.
Estándar(σ) conocida
• 𝜇 = 4,01𝑜𝑛𝑧𝑎𝑠 Para un intervalo de confianza de 95% de la media poblacional
de esta muestra particular es:
• 𝜎 = 0,04 𝑜𝑛𝑧𝑎𝑠
0,04
• 𝑛 = 64 𝑙𝑎𝑡𝑎𝑠 4,015 ± 1,96
64
= 4,015 ± 0,0098

• 𝑥ҧ = 4,015 𝑜𝑛𝑧𝑎𝑠 El nivel de confianza de 95% se encuentra entre 4.0052 y 4.0248. Por
supuesto, en este caso, la media de población de 4.01 onzas se
encuentra en este intervalo.
Ejemplo del texto guía
• Diez meses después de inaugurado el establecimiento, los dueños deciden
hacer una encuesta para evaluar el nivel de satisfacción de sus clientes con el
servicio que brindan. Pidieron calificar el servicio de 0 a 10 (0 implica un
pésimo servicio y 10 un excelente servicio); las calificaciones asignadas por
los clientes se ven en el archivo de Excel. (Descargar archivo Calificaciones
servicio).
• Construya un intervalo de confianza de 90% para la calificación promedio.
Ejercicio
En la siguiente tabla se registra el número de productos vendidos por una
muestra de 32 de los 265 vendedores de cierta empresa durante el mes anterior
(Descargar archivo ejercicios para clase 1:1).
a) Determina un intervalo de confianza del 90% para la cantidad promedio de
productos vendidos por cada vendedor durante el mes anterior.
b) Con ese tamaño de muestra y ese nivel de confianza, ¿cuál sería el margen
de error?
Ejercicio propuesto
Algunas empresas medianas exportan parte de su producción a países del Grupo
Andino. Para estimar el monto de esas exportaciones se hizo un muestreo entre 100
empresas medianas tomadas aleatoriamente entre las que exportaban y se averiguó a
cuánto ascendían sus exportaciones en el último mes. Se encontró un promedio de
7500 dólares y una desviación estándar de 3260 dólares. (Ejercicio para clase1:2)
a) Encuentra un intervalo de confianza del 90% para la verdadera media.
b) ¿Cuál sería ese intervalo si el nivel de confianza es 95% y el tamaño muestral no
cambia? Concluye
c) ¿Cuál sería ese intervalo si el nivel de confianza sigue siendo 90%, pero el tamaño
de muestra se duplica? Concluye
Estimación por intervalos para variables
cuantitativas: Muestra menor 30 elementos.
• Para producir un intervalo de confianza • La distribución t depende del nivel de
válido debe hacerse una hipótesis más confianza y los grados de libertad=n-1
fuerte con respecto a la población de
• Al aumentar lo grados de Libertad de la
interés y es que ella está distribuida
distribución t, se acerca mas a los valores
normalmente.
de la distribución normal z
• No se conoce la desviación estándar .
de la población y se utiliza la de la
muestra, s.
• Esto conduce a intervalos de confianza
basados en la distribución t de
Student.
Distribución t-Student
• Se utiliza la desviación estándar de la Principales propiedades son las siguientes:
muestra, s, para estimar la de la población
y, por ello, el calculo del error estándar de
• Tiene media de 0.
la media se convierte en: • Simétrica respecto a la media.
𝑠 • No se trata de una sola distribución sino, mas bien,
𝑠𝑥ҧ =
𝑛 de una familia de distribuciones, cada una de ellas
El estadístico t se hallaría: definida por los denominados grados de libertad
dados por n – 1. En símbolos gl = n – 1.
𝑥ҧ − 𝜇
𝑡=𝑠 • En términos generales, esta distribución t es mas
ൗ 𝑛 achatada que la normal en el centro y sus colas son
mas altas que las de la normal pero, la distribución
t, se aproxima a la normal conforme n aumenta.
Distribución t-Student
• Para crear un intervalo de confianza de la media poblacional con la
distribución t,
𝑠 𝑠 𝑠
𝑥ҧ ± 𝑡𝛼/2 𝑜 𝑥ҧ − 𝑡𝛼 , 𝑥ҧ + 𝑡𝛼/2
𝑛 2 𝑛 𝑛
• Suponga que la población muestreada es normal o aproximadamente
normal.
• Suponga que la muestra es menor de 30 elementos.
• Estime la desviación estándar de la población (σ) con la desviación estándar
de la muestra (s).
• Utilice la distribución t en lugar de la distribución z.
• Los grados de libertad se calcula con el número de observaciones incluidas
en la muestra menos 1 (n-1).
Distribución t-Student
• Un fabricante de llantas desea investigar la durabilidad de sus productos. Una
muestra de 10 llantas que recorrieron 50000 kilómetros reveló una media
muestral de 0.32 pulgadas de desgaste con una desviación estándar de 0.09
pulgadas. Construya un intervalo de confianza de 95% de la media
poblacional. ¿Sería razonable que el fabricante concluyera que después de
50000 km, la cantidad media poblacional de desgaste es de 0.30 pulgadas?
• 𝑥ҧ = 0,32𝑖𝑛, s=0,09in, n=10, grados de libertad=10-1=9
Distribución t-Student

Comando de Excel : DISTR.T.INV((1-α)%; gl)


Comando de Excel : DISTR.T.INV(5%; 9)
Ejemplo
• Una pequeña empresa dedicada a la producción y comercialización de
guacamole desea estudiar los precios de sus competidores de la misma
ciudad, para lo cual reunió los precios de 16 de ellos para envases de
guacamole de 200 gramos. En la tabla siguiente están dichos precios en COP:
(descargar archivo Precios guacamole). Determine un intervalo de confianza
de 95% para el precio promedio de los envases de guacamole de 200 gramos.
Estimación por intervalos para variables
cualitativas
PROPORCIÓN: Fracción, razón o porcentaje que indica la parte de la muestra de la población que
posee un rasgo de interés particular.
• p se refiere al porcentaje de éxitos de la población.
• La distribución es resultado de un conteo
• Aproximando a una distribución normal la distribución de muestreo de 𝑝,ҧ el error estándar es
𝜎𝑝ො = 𝑝(1 − 𝑝)Τ𝑛, como no conocemos el para parámetro p se estima con 𝑝ҧ muestral, el error
para la estimación queda:

𝑝ҧ 1 − 𝑝ҧ
𝑒 = 𝑧𝛼/2
𝑛
Estimación por intervalos para variables
cualitativas
• Se debe tomar como estimador puntual de • La estimación por intervalo de una
𝑝ҧ la proporción de éxitos obtenidos en las proporción poblacional, población finita o
n pruebas, es decir: cuando el tamaño de la muestra es mayor
𝑥 n/N>5% de la población, se puede aplicar
𝑝ҧ = el factor de corrección
𝑛
• La estimación por intervalo de una
proporción poblacional, población infinita
𝑝ҧ 1 − 𝑝ҧ 𝑁−𝑛
𝑝ҧ ± 𝑧𝛼/2
𝑝ҧ 1 − 𝑝ҧ 𝑛 𝑁−1
𝑝ҧ ± 𝑧𝛼/2
𝑛
Estimación por intervalos para variables
cualitativas
• Un estudio en Colombia encuestó a 900 mujeres futbolistas para conocer su
opinión acerca de como se les trataba en los cursos de futbol. En el estudio
se encontró que 396 estaban satisfechas con el trato igualitario. La estimación
puntual de la proporción poblacional de futbolistas satisfechas con el trato es
396/900=0,44, con un nivel de confianza de 95%,
𝑝ҧ 1−𝑝ҧ 0,44 1−0,44
𝑝ҧ ± 𝑧𝛼/2 = 0,44 ± 1,96 = 0,44 ± 0,0324
𝑛 900

• La estimación por intervalo de confianza de 95% de la proporción


poblacional es 0,4076 a 0,4724 de las mujeres futbolistas están satisfechas
con el trato igualitario.
Ejemplo
• En la encuesta en que se hizo la pregunta sobre la evaluación del servicio
también se hizo la siguiente pregunta: ¿Estaría dispuesto a adquirir su
producto a través de una aplicación móvil? (Descargar archivo Aplicación
móvil).
• Determine intervalo de confianza de 90%. Luego determine intervalo de
confianza de 95%, suponiendo que la proporción de clientes que utilizarían la
aplicación es la misma y que también es igual el tamaño de la muestra usada.
Ejemplo
Se va a hacer una encuesta para conocer qué porcentaje de las mipymes de
alimentos de Sabaneta están exportando parte de su producción.
• Se identificó que en Sabaneta hay 563 mipymes de alimentos; si en los
resultados se quiere tener un nivel de confianza de 90% y un margen de error
de 5%. ¿Cuál debe ser el tamaño de la muestra a utilizar?
• Si ya se hizo esa encuesta y se encontró que el 35,7% de esas empresas están
exportando. Establezca un intervalo de confianza de 90% para la proporción
de mipymes de Sabaneta que exportan.
Ejemplo
• Una entidad bancaria seleccionó una muestra aleatoria de 30 días y registró el
número de reclamos de sus usuarios en cada uno de ellos. Dichos registros
fueron: (Descargar archivo Reclamo de usuarios)
• Establezca un intervalo de confianza unilateral, de tal manera que tenga una
confianza aproximada de 90% de que el promedio de reclamos diarios en la
entidad no supere un valor determinado.
Ejemplo
• Se va a hacer una encuesta para conocer qué porcentaje de las mipymes de
alimentos de Sabaneta están exportando parte de su producción. Se
identificó que en Sabaneta hay 563 mipymes de alimentos; en los resultados
se quiere tener un nivel de confianza de 90% y se identificó anteriormente
que la muestra a usar debe ser por lo menos de 183 empresas Si ya se hizo
esa encuesta y se encontró que el 35,7% de esas empresas están exportando.
Establezca un intervalo de confianza unilateral inferior de 90% para la
proporción de mipymes de Sabaneta que exportan.
Ejercicio
• Una compañía que importa consolas de video juegos tiene en su inventario
10000 unidades para la venta. El encargado del inventario desea estimar
cuantas consolas pueden estar fallando y para ello va a probar el
funcionamiento de algunas aleatoriamente. ¿Cuál debe ser el número de
consolas a probar si se desea estimar la proporción de las que están fallando
con un error del 5 % y un nivel de confianza del 90 %?
Ejercicio
Cierto estudio indica que 64 % de los clientes de los supermercados piensa que los productos de las
marcas propias son tan buenos como los de las marcas comerciales. Para investigar si estos resultados
aplican a sus propios productos, un fabricante de salsa de tomate de una marca propia de un
supermercado preguntó a los integrantes de una muestra si consideraban que la salsa de tomate de marcas
propias era tan buena como las de marcas comerciales. (Descargar ejercicios para clase1:3).
• Si se quiere tener un nivel de confianza de 90 % y un margen de error de 4 % en la investigación,
¿cuántas personas deberían hacer parte de la muestra?
• Si la muestra no era del tamaño óptimo sino del tamaño que se deduce del archivo, ¿cuál fue el margen
de error de la encuesta? ¿Consideras que le resta confiabilidad a la investigación?
• De acuerdo con los resultados de la encuesta, ¿parece ser cierto lo que afirma el estudio?
• Elabora un intervalo con un nivel de confianza de 90 % para la proporción de personas que consideran
que las salsas de tomate de las marcas propias de los supermercados son tan buenas como las de
marcas comerciales.
Ejercicio
Durante un estudio fueron visitados 90 sitios de comida rápida. Se registró el
tiempo que transcurría entre el momento en que el cliente hacía el pedido y el
momento en que recibía la comida. Los tiempos en minutos fueron los
siguientes: (Descargar ejercicios para clase1:4).
• ¿Cuál es la estimación por intervalo de confianza de 95 % para la media
poblacional?
• ¿Cuál es el margen de error con 95 % de confianza?
• ¿Qué sugerirías para la repetición de este estudio?
Pruebas de hipótesis con una población
• HIPÓTESIS Afirmación relativa a un parámetro de la población sujeta a
verificación.
• Se establece un procedimiento para probar la validez de un enunciado relativo a un
parámetro poblacional
• El contexto de la situación es muy importante para determinar como deben hacerse
las hipótesis. ¿Cuál es el propósito de recolectar la muestra?¿Qué conclusiones se
espera formular?
• PRUEBA DE HIPÓTESIS Procedimiento basado en evidencia de la muestra y la
teoría de la probabilidad para determinar si la hipótesis es una afirmación razonable.
Pruebas de hipótesis con una población
• Existe un procedimiento de cinco pasos que sistematiza la prueba de una
hipótesis; al llegar al paso 5, se está en posibilidades de rechazar o no la
hipótesis.
Pruebas de hipótesis con una población
• Identificar parámetro de interés: lo primero que debe hacerse es establecer
claramente, según el contexto, cuál es el parámetro de interés (si es la proporción, la
media o la desviación estándar) y de acuerdo con esto el estadístico de prueba (z,t).
• Plantear la hipótesis nula y la alternativa: en cualquier investigación deben
plantearse dos hipótesis, que se denominan hipótesis nula (Ho) e hipótesis
alternativa (H1) y que de alguna manera reflejarán esa idea a priori que tenemos y
que pretendemos contrastar con la “realidad”. La hipótesis nula es un supuesto
tentativo acerca de un parámetro poblacional que se formula con el fin de probar
evidencia numérica y la hipótesis alternativa contradice lo que establece la hipótesis
nula, por lo tanto, es un enunciado que se acepta si los datos de la muestra ofrecen
suficiente evidencia para rechazar la hipótesis nula.
Pruebas de hipótesis con una población
• Seleccionar nivel de significancia (α): Consiste en la
probabilidad de cometer un error tipo I cuando la
hipótesis nula es verdadera como igualdad. Se elige
subjetivamente (no es producto de ningún cálculo), pero
debe ser un valor bajo, generalmente 5 o 10%.
• Formular la regla de decisión: con base en el nivel de
significancia, en el valor hipotético del parámetro y
asumiendo que los datos poblacionales siguen una
distribución normal, deben establecerse una región
crítica (o de rechazo) y una región de aceptación. Si la
muestra que se toma es muy pequeña (de tamaño
inferior a 30) no debe utilizarse la distribución normal,
sino la distribución t de Student.
Pruebas de hipótesis con una población
• La hipótesis nula debe incluir una igualdad (= o desigualdad ≤,≥); es la
hipótesis que se trata de contrastar, de forma que al final del proceso, se
rechaza o no. La hipótesis alternativa es el complemento de la nula (≠,>,<);
por lo tanto, el rechazo de la hipótesis nula supone el no rechazo de la
hipótesis alternativa (o viceversa).
• Es necesario recordar que, sin que importe la manera de plantear el
problema, la hipótesis nula siempre incluirá el signo de igual. Este signo (=)
nunca aparecerá en la hipótesis alternativa.
Ejercicio del texto guía
• Hipótesis 1: EL 20% de las empresas colombianas exportan a Estados Unidos o a
países europeos.
Ho: p = 20% H1: p ≠ 20%
• Hipótesis 2: AL MENOS EL 20% de las empresas colombianas exportan a
Estados Unidos o a países europeos
Ho: p ≥ 20% H1: p < 20%
• Hipótesis 3: NO MÁS DEL 20% de las empresas colombianas exportan a Estados
Unidos o a países europeos
Ho: p ≤ 20% H1: p > 20%
Pruebas de hipótesis con una población
Resumen de las formas para las hipótesis nula y alternativa.
• Las pruebas de hipótesis a las cuales se referirán a dos parámetros
poblacionales: la media poblacional y la proporción poblacional.
• En las pruebas de hipótesis para la media poblacional, 𝜇0 denota el valor
hipotético y hay que escoger una de las siguientes formas:
𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 > 𝜇0 𝐻0 : 𝜇 ≠ 𝜇0
Ejercicios
Establezca las pruebas de hipótesis adecuadas con cada enunciado.
• Hipótesis 1: En promedio la botella de gaseosa contiene 350ml

• Hipótesis 2: En promedio la botella de gaseosa contiene al menos 350 ml

• Hipótesis 3: En promedio la botella de gaseosa contiene máximo 350 ml


Ejemplo
• Una empresa fabricante de computadoras personales utiliza una gran
cantidad de tarjetas con circuitos impresos y contrata con una empresa
externa para la compra de este producto. El fabricante de computadoras
tomará una muestra de los envíos que llegan. Si más de 6% de las tarjetas de
la muestra no cumple con las normas, el envío se rechaza. Formule la prueba
de hipótesis para la aceptación del envío.
Errores tipo I y II
La prueba de hipótesis se basa en información muestral, debe considerarse que
existe la posibilidad del error.
• Si se rechaza la hipótesis nula cuando realmente es verdadera. Esto se
conoce como error tipo I; la probabilidad de cometerlo se simboliza con (α)
y es lo que se conoce como nivel de significancia. El nivel de significancia
puede tomar valores de 0.1, 0.05 y 0.01(10%, 5%, 1%).
• Si no se rechaza la hipótesis nula cuando realmente es falsa. Esto se
conoce como error tipo II y la probabilidad de cometerlo se denota como β.
Ejemplo: Error tipo I
• Una muestra de 50 tarjetas de circuitos, reveló que 4, es decir, 8%, no cumplían con
las normas. El envío se rechazó en virtud de que excedía el máximo de 6% de
tarjetas que no cumplían con las normas. Si en realidad el envío no cumplía con
las normas, fue acertada la decisión de devolver las tarjetas al proveedor. Suponga
que las 4 tarjetas elegidas de la muestra de 50 eran las únicas que no cumplían con
las normas en un envío de 4.000 tarjetas. Entonces, sólo 0.1% se encontraba
defectuoso (4/4.000 = 0.001). En este caso, menos de 6% de todo el envío no
satisfacía las normas, y rechazarlo fue un error. En términos de la prueba de
hipótesis, rechazamos la hipótesis nula de que el envío cumplía con las normas
cuando se debió aceptar. Al rechazar la hipótesis nula, se incurrió en un error
tipo I. La probabilidad de cometer este tipo de error es α.
Ejemplo: Error tipo II
• Suponga que 2 de las 50 tarjetas (4%) no son aceptables, mientras que 48 de
50 lo son. De acuerdo con el procedimiento mencionado, como la muestra
contiene menos de 6% de tarjetas que no cumplen con las normas, el envío
se acepta. ¡Puede suceder que, por azar, las 48 tarjetas que contiene la
muestra sean las únicas aceptables en todo el envío, que consta de miles de
tarjetas!. Se cometería el error tipo II, aceptar la hipótesis siendo falsa.
Errores tipo I y II
Condición Poblacional
Ho verdadera H1 verdadera
Conclusión Error tipo II
Ho es aceptada
Correcta
Conclusión
Ho es rechazada Error tipo I Conclusión
Correcta

α= P(error tipo I) = P(rechazar Ho\ Ho es V)


β= P(error tipo II) = P(aceptar Ho\ Ho es falsa)

En general, si el tamaño de muestra se aumenta, se reducen tanto α como β


Ejercicio del texto guía
• Una agencia de viajes planea desarrollar una propaganda para televisión si el
promedio de clientes es por lo menos 15 al día en temporada fría. Para
estimar dicho promedio, tomó una muestra aleatoria de 25 días de estos
últimos tres meses (temporada fría); los datos que encuentre se usarán para
probar las siguientes hipótesis: Ho: µ ≥ 15; H1: µ <15
• ¿Cuál es el error de tipo I en este caso? ¿Cuáles serían sus consecuencias?
• ¿Cuál es el error de tipo II en este caso? ¿Cuáles serían sus consecuencias?
Reglas de decisión: prueba de cola
• Prueba bilateral (2 Colas): detecta
diferencias a partir del valor hipotético del
parámetro que se encuentren a su derecha o
a su izquierda.
𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0
• En una prueba de este tipo, la región crítica
se separa en dos partes, generalmente con la
misma probabilidad en cada cola, por lo que
el nivel de significancia se divide en ambos
extremos.
Reglas de decisión: prueba de cola
• La región correspondiente a la zona de aceptación (región azul claro) puede
calcularse como una función normal estándar si la muestra es de 30 o mas
elementos. En Excel se usa la función INV.NORM.ESTAND y se presenta
la región en términos de valores Z.
• Si la muestra es menor de 30 elementos la función se aproxima con una
distribución t student. En Excel se usa la función INV.T y se presenta la
región en términos de valores t.
Reglas de decisión: prueba de cola
• Prueba de Cola Superior • Prueba de Cola Inferior
𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0
La región crítica se presenta de esta manera. En La región crítica se presenta de esta manera. En
Excel se halla el valor critico con la función Excel se halla el valor critico con la función
INV.NORM.ESTAND con probabilidad 1-α. INV.NORM.ESTAND con probabilidad α
Ejemplo del texto guía
Plantear las regiones de aceptación de las pruebas de hipótesis en cada uno de
los siguientes casos. Para todos debe considerarse un nivel de significancia de
5% y que se usa una muestra de 50 elementos:
• Hipótesis nula: EL 20% de las empresas colombianas exportan a Estados Unidos o a
países europeos.
• Hipótesis nula: Al menos el 20% de las empresas colombianas exportan a Estados
Unidos o a países europeos.
Ejercicios
Plantear las regiones de aceptación de las pruebas de hipótesis en cada uno de los
siguientes casos. Para todos debe considerarse un nivel de significancia de 10% y que
se usa una muestra de 120 elementos:
• Hipótesis 1: En promedio la botella de gaseosa contiene 350ml

• Hipótesis 2: En promedio la botella de gaseosa contiene al menos 350 ml

• Hipótesis 3: En promedio la botella de gaseosa contiene máximo 350 ml


Pruebas de hipótesis con una población
• Tomar una muestra, calcular estadístico de prueba, comparar y decidir: finalmente debe
tomarse una muestra, preferiblemente aleatoria para garantizar una buena estimación de los
parámetros poblacionales, y se calculan los datos necesarios para el contraste, es decir, la media de
la muestra o su proporción.
• Para variables cuantitativas (media):
Infinita Finita
𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0 𝑁 − 𝑛
𝑧= 𝑜 𝑧=
𝜎Τ 𝑛 𝜎Τ 𝑛 𝑁 − 1
• Para variables cualitativas (proporción):
Finita
Infinita
𝑝ҧ − 𝑝0 𝑝ҧ − 𝑝0
𝑧= 𝑜 𝑧=
𝑝0 1 − 𝑝0 Τ𝑛 𝑁−𝑛
𝑝0 1 − 𝑝0 Τ𝑛 𝑁 − 1
Pruebas de hipótesis con una población:
Valor-p
• El valor p es la probabilidad de obtener un valor para el estadístico de prueba tan
improbable o más improbable que el obtenido con la muestra; por lo tanto el valor
p es el nivel de significancia más bajo que llevaría al rechazo de la hipótesis nula.
• Este proceso compara la probabilidad, denominada valor p, con el nivel de
significancia. Si el valor p es menor o igual que el nivel de significancia, Ho se
rechaza. Si es mayor que el nivel de significancia, Ho no se rechaza.
• El nivel de significancia identifica “qué tan pequeño debe ser el valor p para declarar
que la diferencia entre el valor especificado en la hipótesis nula y el valor observado
es estadísticamente significativo” Kelmansky (2009).
Pruebas de hipótesis con una población:
Valor-p
• Regla para el rechazo usando el valor-p (probabilidad).
Rechazar 𝐻0 si el valor-p≤ 𝛼
• Un valor p muy pequeño, como por ejemplo 0.0001, indica que existe poca
probabilidad de que Ho sea verdadera. Por otra parte, un alto de valor-p
como por ejemplo 0.2033 significa que Ho no se rechazaría y que existe poca
probabilidad de que sea falsa.
Resumen de las pruebas de hipótesis para la
media poblacional
Prueba de cola inferior Prueba de cola superior Prueba de dos colas

Hipótesis 𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 < 𝜇0 𝐻𝑎 : 𝜇 > 𝜇0 𝐻𝑎 : 𝜇 ≠ 𝜇0

Estadístico de prueba 𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0
𝑧= 𝑧= 𝑧=
𝜎Τ 𝑛 𝜎Τ 𝑛 𝜎Τ 𝑛

Regla de rechazo del Rechazar H0 si valor-p≤α Rechazar H0 si valor-p≤α Rechazar H0 si valor-p≤α


valor crítico

Regla de rechazo por Rechazar H0 Rechazar H0 Rechazar H0


zonas si z≤-zα si z≥zα si z≤-zα/2 o si z≥zα/2
Resumen de las pruebas de hipótesis para la
proporción poblacional
Prueba de cola inferior Prueba de cola Prueba de dos colas
superior

Hipótesis 𝐻0 : 𝑝 ≥ 𝑝0 𝐻0 : 𝑝 ≤ 𝑝0 𝐻0 : 𝑝 = 𝑝0
𝐻𝑎 : 𝑝 < 𝑝0 𝐻𝑎 : 𝑝 > 𝑝0 𝐻𝑎 : 𝑝 ≠ 𝑝0

Estadístico de prueba 𝑝Ƹ − 𝑝0 𝑝Ƹ − 𝑝0 𝑝Ƹ − 𝑝0
𝑧= 𝑧= 𝑧=
𝑝0 1 − 𝑝0 Τ𝑛 𝑝0 1 − 𝑝0 Τ𝑛 𝑝0 1 − 𝑝0 Τ𝑛

Regla de rechazo del Rechazar H0 si valor-p≤α Rechazar H0 si valor-p≤α Rechazar H0 si valor-p≤α


valor crítico

Regla de rechazo por Rechazar H0 Rechazar H0 Rechazar H0


zonas si z≤-zα si z≥zα si z≤-zα/2 o si z≥zα/2
Ejemplo
• Antes de la prueba donde los clientes calificaron el servicio en el
establecimiento con una nota entre 0 y 10 los dueños suponían que el
servicio iba a ser evaluado con una calificación promedio de 8,5 o superior.
Pruebe dicha hipótesis con un nivel de significancia de 5%.
a) Con la muestra dada anteriormente. (Descargar archivo Calificaciones de
servicio)
b) Con una muestra que tiene la misma desviación estándar, pero cuyo
promedio es 8,33.
Ejemplo
• Los dueños del Establecimiento aseguran que el 80% de los clientes califican
el servicio como bueno. Probar esa afirmación a partir de una prueba de
hipótesis con base en el archivo que se presenta a continuación y un nivel de
significancia de 10%. (Descargar archivo Calificación clientes propios)
Ejemplo del texto guía
• Una firma comisionista de bolsa estima que el volumen promedio de sus
transacciones por día es de 1100 millones de pesos colombianos; para
verificarlo recolectó la información de los últimos 20 días. Las cantidades
están dadas en millones de pesos colombianos y están dadas en la siguiente
base de datos: (descargar datos Firma comisionista)
Ejercicio
• Una empresa comercializa una bebida refrescante en un envase en cuya etiqueta se puede leer:
“Contenido: 250 centímetros cúbicos”. El Departamento de Consumo toma aleatoriamente 25
envases y estudia el contenido (descargar archivo Ejercicio resuelto 2_Inferencial)
a) ¿Puede afirmarse, con un nivel de significancia de 5%, que no se está vendiendo el contenido
indicado?
b) ¿De qué tamaño debió haber sido la muestra tomada para que los resultados fueran plenamente
confiables? Considera un margen de error de 5%
c) ¿Qué pasaría si el experimento no es realizado por el Departamento de Consumo sino por la
empresa productora?
d) ¿Qué pasaría si la media es 246,2 centímetros cúbicos, la desviación estándar es la obtenida
previamente y el nivel de significancia es 5%?
Prueba de hipótesis con dos poblaciones
Población 1 Población 2

𝝁𝟏 : 𝑴𝒆𝒅𝒊𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍 𝝁𝟐 : 𝒎𝒆𝒅𝒊𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍


𝒑𝟏 : 𝑷𝒓𝒐𝒑𝒐𝒓𝒄𝒊ó𝒏 𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍 𝒑𝟐 : 𝑷𝒓𝒐𝒑𝒐𝒓𝒄𝒊ó𝒏 𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍

Muestra aleatoria simple Muestra aleatoria simple

ഥ𝟏 , 𝒑
𝒏𝟏 , 𝒙 ෝ𝟏 ഥ𝟐 , 𝒑
𝒏𝟐 , 𝒙 ෝ𝟐
Prueba de hipótesis con dos poblaciones
independientes: Variable Cualitativa
• Prueba de hipótesis de la diferencia de proporciones: No es poco
común que quiera establecerse el contraste de dos proporciones para
establecer si son similares o si una sí supera a la otra por la diferencia que se
supone
Prueba de 2 Colas Prueba Cola Inferior Prueba de Cola Superior
𝐻0 : 𝑝1 − 𝑝2 = 𝑑0 𝐻0 : 𝑝1 − 𝑝2 ≥ 𝑑0 𝐻0 : 𝑝1 − 𝑝2 ≤ 𝑑0
𝐻1 : 𝑝1 − 𝑝2 ≠ 𝑑0 𝐻1 : 𝑝1 − 𝑝2 < 𝑑0 𝐻1 : 𝑝1 − 𝑝2 > 𝑑0
Donde 𝑑0 es la diferencia hipotética entre las proporciones poblacionales
Prueba de hipótesis con dos poblaciones
• Si se supone que 𝐻0 es verdadera los parámetros poblacionales 𝑝1 = 𝑝2 = 𝑝. Por lo tanto, el
estadístico muestral de prueba se puede expresar así:
𝑝Ƹ1 − 𝑝Ƹ 2 − 𝑑0
𝑧=
1 1
𝑝Ƹ 1 − 𝑝Ƹ +
𝑛1 𝑛2
• Proporción muestral o estimador combinado de p:
𝑥1 + 𝑥2
𝑝Ƹ =
𝑛1 + 𝑛2
𝑝Ƹ1 y 𝑝Ƹ 2 son estadísticos muestrales para las poblaciones 𝑝1 𝑦 𝑝2 , 𝑛1 𝑦 𝑛2 son el tamaño de
muestra.
Ejemplo del texto guía
• Supóngase que en el establecimiento que se viene evaluando hicieron la
encuesta sobre la calificación de los clientes al servicio prestado, pero las
respuestas posibles eran únicamente “Bueno”, “Regular” o “Malo”; una
encuesta similar se hizo en un negocio de la competencia. Pruebe la hipótesis
de que entre los dos establecimientos no hay diferencia en la proporción de
personas que califican el servicio como malo con un nivel de significancia del
5%. Los datos de las encuestas están en el siguiente archivo: (Descargar
archivo Calificaciones propio competencia, pagina 158)
Ejercicio propuesto
Una empresa pequeña de confecciones utiliza dos máquinas para el proceso de
corte; quiere evaluar si la proporción de cortes defectuosos es similar en ambas
máquinas. Para tal efecto evaluó dos muestras de 150 elementos cada una en
cada máquina y clasificó los cortes como defectuosos o no defectuosos, de
acuerdo con ciertos límites de tolerancia establecidos previamente. Los
resultados están en el siguiente archivo: (Descargar archivo ejercicios para clase
2:3).
• Elabora una prueba de hipótesis para evaluar si hay diferencia entre las
proporciones. Para dar tu respuesta básate en un valor p.
Prueba de hipótesis con dos poblaciones
independientes: Variable Cuantitativa
• Nos interesa son las diferencias entre las medias 𝜇1 − 𝜇2 . Se toman dos
muestras separadas e independientes. Sea 𝑑0 la diferencia hipotética entre
𝜇1 𝑦 𝜇2 . Las tres formas que puede adoptar una prueba de hipótesis son las
siguientes:
Prueba de 2 Colas Prueba Cola Inferior Prueba de Cola Superior
𝐻0 : 𝜇1 − 𝜇2 = 𝑑0 𝐻0 : 𝜇1 − 𝜇2 ≥ 𝑑0 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝑑0
𝐻1 : 𝜇1 − 𝜇2 ≠ 𝑑0 𝐻1 : 𝜇1 − 𝜇2 < 𝑑0 𝐻1 : 𝜇1 − 𝜇2 > 𝑑0
Prueba de hipótesis con dos poblaciones
independientes: Variable Cuantitativa
• De igual manera que para el calculo con una población, para dos poblaciones
independientes se seleccionar el nivel de significancia (α), calcular el estadístico de
prueba y encontrar el valor-p para determinar si se rechaza la hipótesis nula.
• Estimador puntual : 𝑥ҧ1 − 𝑥ҧ2 . Cuando las muestras son mayores a 30 elementos se
puede considerar que se distribuye normal, si es menor a 30 elementos se usa la
distribución t.
• Estadístico de prueba:
𝑥ҧ1 − 𝑥ҧ2 − 𝑑0
𝑧=
𝜎12 𝜎22
+
𝑛1 𝑛2
Ejercicio del texto guía
• Como evaluación del proceso de capacitación a través de las charlas de
atención al cliente se hizo el siguiente experimento: hace un mes, cuando aún
no se habían brindado las charlas, se pidió a una muestra de 100 clientes que
calificaran el servicio; hoy, después de las capacitaciones, se pidió a otro
grupo de 100 clientes que calificaran el servicio. Si los dueños consideran que
el proceso fue eficaz si el promedio de las calificaciones mejora por lo menos
en 1,5 después de la capacitación, ¿podría afirmarse que el proceso fue
efectivo? (Descargar archivo calificaciones independientes)
Ejercicio
• A los empleados de una empresa se les midió el tiempo que utilizaban para
ensamble de un producto especifico (datos en horas). Los jefes de
producción quieren verificar si hay diferencia en los tiempos promedios de
ensamble del turno A con el turno B(Descargar archivo ejercicios para clase
2:4).
• Elabora una prueba de hipótesis para evaluar si hay diferencia entre los
tiempos promedio de ensamble. Usa una significancia del 5% para hacer la
prueba.
Prueba de hipótesis con dos poblaciones
pareadas
• El segundo tipo de muestra dependiente se caracteriza por relacionar o
aparear observaciones. Se selecciona una característica a evaluar y se hacen
dos estudios. Cada estudio puede mostrar o no diferencias de uno con
respecto al otro. La evaluación se hace con condiciones similares para reducir
los posibles errores muestrales.
• Para la prueba de hipótesis, el interés recae sobre la distribución de las
diferencias en el valor calculado. O sea la diferencia entre las observaciones
tomadas para un solo elemento o sujeto.
Prueba de hipótesis con dos poblaciones
pareadas
• Se investiga si la media de la distribución de las diferencias de los valores
calculados es 0 (si 𝜇1 = 𝜇2 ) o cualquier otro valor hipotético; por lo tanto, la
muestra se construye de las diferencias para cada unidad experimental. Sea
𝑑ҧ = 𝜇1 − 𝜇2 la media de la diferencia entre los valores de la población.
Prueba de 2 Colas Prueba Cola Inferior Prueba de Cola Superior
𝐻0 : 𝑑ҧ = 𝑑0 𝐻0 : 𝑑ҧ ≥ 𝑑0 𝐻0 : 𝑑ҧ ≤ 𝑑0
𝐻1 : 𝑑ҧ ≠ 𝑑0 𝐻1 : 𝑑ҧ < 𝑑0 𝐻1 : 𝑑ҧ > 𝑑0
Prueba de hipótesis con dos poblaciones
pareadas
• El estadístico de prueba tiene una distribución t con n-1 grados de libertad:
𝑑ҧ − 𝑑0
𝑡=
𝑠𝑑 Τ 𝑛
donde 𝑑ҧ es la media de las diferencias, 𝑠𝑑 es su desviación estándar, n es el
número de observaciones y 𝑑0 es la diferencia hipotética.
σ 𝑑𝑖
ҧ
𝑑=
𝑛
Ejercicio
• Al personal del Establecimiento le imparten unas charlas de atención al
cliente. Luego se hizo una encuesta a 15 clientes asiduos y se les pidió que
calificaran el servicio; esos mismos clientes habían calificado el servicio antes
del proceso de capacitación. Eso se hizo con el fin de evaluar si el proceso
había surtido efecto; los dueños considerarán que el proceso fue eficaz si el
promedio de las calificaciones mejora por lo menos en 1,5. Según los datos
que se presentan en el siguiente archivo, ¿podría afirmarse que el proceso fue
efectivo? (descargar archivo charlas de capacitación)
Ejercicio
• A los empleados de una empresa se les inscribió en una capacitación con una
nueva máquina de pulido para optimizar los tiempos que tardaban en este
proceso, ya que algunos clientes se quejaban por demora en la entrega de los
pedidos. Los tiempos que tardaba cada empleado antes y después de la
capacitación se muestran en el siguiente archivo (datos en horas). (Descargar
archivo ejercicios para clase 2:5).
• Establece las hipótesis para verificar si la capacitación para mejorar el tiempo
promedio de pulido dio resultado. Usa una significancia del 5% para hacer la
prueba.
Ejercicio
• Desea evaluarse el grado de favorabilidad de los grandes ejecutivos colombianos frente a los
tratados de libre comercio. Se hizo una encuesta a 500 de ellos en la que se indagó acerca de
su actitud al respecto; los resultados se muestran en el siguiente archivo: (descargar archivo
ejercicios para clase3:1).
a) Estima con un 90% de confianza su grado de favorabilidad frente a los TLC. Un censo
que se desarrolló a principios de este año encontró que en el país hay 27250 grandes
ejecutivos.
b) En una revista de amplia circulación nacional se afirmó la semana anterior que por lo
menos el 60% de los grandes ejecutivos colombianos está a favor de los tratados de libre
comercio. Según lo encontrado en la encuesta, ¿crees que es cierto lo que se dice allí? Para
dar tu respuesta realiza la prueba de hipótesis correspondiente.
Ejercicio
• Una empresa comercializa una bebida refrescante en un envase en cuya etiqueta se
puede leer que el contenido es de 250 centímetros cúbicos. El Departamento de
Consumo toma aleatoriamente 25 envases y encuentra los siguientes contenidos:
(descargar archivo ejercicios para clase3:2)
a) ¿Puede afirmarse con un nivel de significancia de 5% que no se está vendiendo el
contenido indicado?
b) ¿De qué tamaño debió haber sido la muestra tomada para que los resultados
fueran plenamente confiables? Considera un margen de error de 5%
Ejercicio
Maquila de Oriente es una empresa que se encarga de cortar y distribuir piezas de tela para
indumentaria deportiva. La empresa cuenta con dos máquinas automáticas para hacer los cortes de
tela. Para hacer un control de calidad, se tomó una muestra de cada una de las máquinas. Las
medidas de los cortes (medidos en cm) se muestran en las tablas (descargar archivo ejercicios para
clase3:3).
a) Encuentra un intervalo de confianza del 90% para la medida promedio de los cortes de cada
una de las máquinas. Interpreta los resultados. Con nivel de confianza de 90% y margen de
error de 5%, ¿de qué tamaño debería ser la muestra para obtener resultados confiables?
b) Un corte se considera defectuoso si mide menos de 1,44 cm o más de 1,8 cm. El mecánico
encargado del mantenimiento dice que en la máquina 1 el 5% de los cortes es defectuoso y en la
máquina 2 el 12% presenta defectos. Establece la hipótesis para cada máquina y utilice una
significancia del 5% para validar lo que dice el mecánico. Interpreta los resultados y especifica
cuáles son las regiones de aceptación y rechazo.
Ejercicio
En la siguiente tabla se registra el número de productos vendidos por una muestra de
32 de los 265 vendedores de cierta empresa durante el mes anterior: (descargar archivo
ejercicios para clase3:4)
a) Determina un intervalo de confianza del 90% para la cantidad promedio de
productos vendidos por cada vendedor durante el mes anterior.
b) La Gerencia lanzó la hipótesis de que los vendedores de la Empresa logran vender
como máximo 1800 productos por mes en promedio. Según los resultados del mes
anterior para la muestra tomada, ¿parecería que eso es cierto? Demuéstralo
planteando el desarrollo de una prueba de hipótesis, utilizando un nivel de
significancia de 10%.
Ejercicio
Consultores en Calidad S.A.S A realizó una asesoría a una productora de arepas, ya que algunos
clientes se quejaban por demora en la entrega de los pedidos. Para disminuir el tiempo de
producción se les inscribió en una capacitación en Six sigma (Metodología para mejora de
procesos). El tiempo en horas que tardaba cada empleado en la fabricación de un lote de arepas
antes y después de la capacitación se muestra en la tabla. (descargar archivo ejercicios para
clase3:5)
a) Halla medias y coeficientes de variación antes y después de la capacitación. Establece una
comparación a partir de los coeficientes de variación.
b) Establece las hipótesis para verificar si la capacitación para mejorar el tiempo promedio de
producción de un lote de arepas dio resultado. Usa un nivel de significancia del 5% para
hacer la prueba.
Ejercicio
Aprovechando un tratado firmado recientemente algunas pymes de alimentos
han comenzado a exportar a países de Lejano Oriente. Las exportaciones de 25
de esas empresas seleccionadas aleatoriamente ascienden a los siguientes
montos (en miles de dólares) en el último año: (descargar archivo ejercicios para
clase3:6)
• El Presidente de la República afirmó ayer que el promedio de exportaciones
de empresas de las características señaladas es al menos de 200000 dólares en
el último año. Según esa muestra, ¿parece que eso es cierto? Compruébalo
mediante una prueba de hipótesis.

También podría gustarte