Documentos de Académico
Documentos de Profesional
Documentos de Cultura
estadística
Parte 2
2 Estimación puntual y por intervalo
Una distribución de probabilidad de una variable que representa cierta
característica de una población se define completamente cuando se conocen sus
parámetros
cuando los parámetros no se conocen, será necesario estimarlos con base en los
datos muestrales para hacer inferencias sobre la población.
Por ejemplo:
Tres parámetros sobre los que con frecuencia se desea hacer inferencia son:
La media muestral =
La varianza muestral 2 = S 2.
Para hacer esto se toma una muestra de 30 días y registras las ventas
diarias del producto durante ese período.
Entonces, la estimación puntual para la cantidad promedio de ventas diarias del producto en toda la
población para ese mes es de aproximadamente 13.2 unidades.
Es importante tener en cuenta que esta es solo una estimación puntual basada en una muestra
específica. La estimación puede variar si se toma una muestra diferente.
Este valor puede usarse como una estimación puntual de µ (la media del proceso).
Colocar un acento ˆ(llamado gorro o tongo) sobre un parámetro es una manera general de denotar un
estimador puntual del correspondiente parámetro, puesto que los estimadores no son únicos.
La estimación de la media, , podría hacerse con el uso de la media muestral
8 la mediana , o la moda, dado que las tres son diferentes medidas de la
tendencia central de unos datos.
Por ello es necesario saber qué tan precisa es la estimación puntual, y esto
tiene que ver con la varianza del correspondiente estimador.
Para saber qué tan precisa es la estimación puntual, se tiene que ver con la
varianza del correspondiente estimador.
9
Una forma de saber qué tan variable es el estimador, consiste en calcular la desviación
estándar o error estándar del estadístico, visto como una variable aleatoria.
Por ejemplo, sea la desviación estándar S y la media de una muestra de tamaño n, puesto que
es una variable aleatoria, ésta tiene su propia desviación o error estándar, que se puede
estimar mediante
=S/
Una forma operativa de saber qué tan precisa es la estimación consiste en calcular un intervalo de
confianza que indique un rango “en el que puede estar el parámetro” con cierto nivel de
seguridad o confianza.
Construir un intervalo al 100(1 – α)% de confianza para un parámetro desconocido θ, consiste en
12
estimar dos números (estadísticos) L y U, de manera que la probabilidad de que θ se encuentre entre
ellos sea 1 – a, es decir:
P(L ≤ θ ≤ U) = 1 – a
Donde L y U forman el intervalo de confianza buscado [L, U].
Si se obtuvieran 100 muestras independientes de la misma población o proceso, cada una de tamaño n,
para cada muestra se calculará el intervalo de confianza al 95%: (a = 0.05), para el mismo
parámetro
entonces se espera que 95 de los 100 intervalos contengan el verdadero valor de dicho parámetro.
En la práctica se obtiene sólo un intervalo y se dice que el intervalo [L, U] tiene una
13 confianza de 100(1 – α)%;
Es decir que el parámetro estará en el intervalo el 100(1 – α)% de las veces que se aplique el
procedimiento.
De aquí que es deseable que la longitud de los intervalos sea pequeña y con alto nivel de confianza.
El ancho de los intervalos es mayor a medida que sea mayor la varianza de la población y el nivel
de confianza exigido.
Finalmente, podemos construir el intervalo de confianza del 95% para la cantidad promedio
de ventas diarias:
Esto significa que estamos 95% seguros de que el promedio real de ventas diarias del
producto en toda la población cae dentro del intervalo (11.413, 14.987) unidades.
17 Conceptos básicos de pruebas de hipótesis
Es deseable que la hipótesis sea realista y comprobable, para así facilitar el diseño de la
investigación.
19 En este contexto, cuando en la investigación se recolectan datos, es posible
formular hipótesis un tanto más operativas sobre las características estadísticas de
tales datos.
Una hipótesis estadística es una afirmación sobre los valores de los parámetros de una
población o proceso, que es susceptible de probarse a partir de la información
contenida en una muestra representativa que es obtenida de la población.
El nombre de hipótesis nula se deriva del hecho de que comúnmente se plantea como una
igualdad, lo cual facilita el tener una distribución de probabilidad de referencia específica.
El experimentador está interesado en concluir que una de las dos hipótesis se cumple. Por
ejemplo, en el caso de las proposiciones se quiere verificar que se cumple la hipótesis
alternativa.
22 Supongamos ahora que la afirmación a probar es “este proceso produce 8% de
defectuosos”.
HA se conoce como hipótesis alternativa de un solo HA se llama hipótesis alternativa de dos lados
lado (unilateral) (bilateral)
ya que la única manera de rechazar H0 es teniendo ya que la evidencia en contra de H0 se obtiene con
valores de la proporción muestral significativamente valores pequeños o grandes de la proporción
más pequeños que 0.08. muestral .
En caso de que los resultados de la investigación no demuestren claramente la falsedad de H0, ésta
no se rechaza. Es decir, la hipótesis nula es verdadera mientras no se demuestre lo contrario.
26
Una vez planteada la hipótesis, se toma una muestra aleatoria de la población de estudio o se
obtienen datos mediante un experimento planeado de acuerdo con la hipótesis.
Al conjunto de posibles valores del estadístico de prueba que llevan a rechazar H0 se le llama región
o intervalo de rechazo para la prueba, y a los posibles valores donde no se rechaza H0 se les llama
región o intervalo de aceptación.
Criterio de rechazo
27
El estadístico de prueba, construido bajo el supuesto de que H0 es verdad, es una variable
aleatoria con distribución conocida. Si efectivamente H0 es verdad, el valor del estadístico de
prueba debería caer dentro del rango de valores más probables de su distribución asociada, el
cual se conoce como región de aceptación.
Si cae en una de las colas de su distribución asociada, fuera del rango de valores más
probables (en la región de rechazo), es evidencia en contra de que este valor pertenece a dicha
distribución. De aquí se deduce que debe estar mal el supuesto bajo el cual se construyó, es
decir, H0 debe ser falsa.
28 Pruebas de una y dos colas (unilaterales y
bilaterales)
La ubicación de la región o intervalo de rechazo depende de si la hipótesis es bilateral o
unilateral.
Como se vio en el caso de las proporciones, una hipótesis es bilateral cuando la hipótesis
alternativa (HA) es del tipo “no es igual” (≠); y es unilateral cuando la alternativa es del tipo “mayor
que” (>) o “menor que” (<)
Pruebas de una y dos colas (unilaterales y
29
bilaterales)
Cuando es bilateral, la región de rechazo está repartida de manera equitativa entre ambas colas
de la distribución del estadístico de prueba.
Hipótesis nula (H0): El tiempo promedio de respuesta al servicio al cliente es mayor que 5
minutos.
Es importante tener en cuenta que la elección entre una prueba de una cola o una prueba de
dos colas depende de la afirmación específica que se quiere probar y de la pregunta de
investigación.
Las pruebas de una cola son adecuadas cuando estamos interesados en demostrar si un
valor es mayor o menor que cierto valor, mientras que las pruebas de dos colas son más
apropiadas cuando estamos interesados en determinar si un valor es simplemente diferente
de cierto valor sin tener una dirección específica en mente.
33 Errores tipo I y tipo II
Probar una hipótesis estadística es una decisión probabilística, por lo que existe el riesgo
de cometer un error tipo I o un error tipo II.
Error tipo I ocurre si se rechaza H0 cuando ésta es verdadera,
Error tipo II es cuando se acepta H0 y ésta es falsa.
En toda prueba de hipótesis cada tipo de error tiene una probabilidad de ocurrir.
Con a y b se denotan las probabilidades de los errores tipo I y II, respectivamente.
Ahora, se realizan las pruebas de hipótesis utilizando una muestra de yogures y se obtienen
los siguientes resultados:
En resumen, el error tipo 1 implica llegar a una conclusión positiva falsa, mientras que el
error tipo 2 implica llegar a una conclusión negativa falsa. Ambos tipos de errores son
importantes considerar al realizar pruebas de hipótesis, y el objetivo es minimizarlos a través
del diseño adecuado de la prueba y el tamaño de la muestra.
38 Prueba de media y varianza
Cuando se estudia el comportamiento de un proceso o un fenómeno, a través de una
variable aleatoria continua, suele interesar su media y varianza (o desviación estándar).
En particular, al estudiar la media µ, es de interés preguntarse si ésta es igual, mayor o
menor que cierto valor µ0, donde µ0, es un número conocido.
Por ejemplo, puede ser de interés investigar si el rendimiento promedio del proceso
durante esta semana es igual, mayor o menor que el de la semana anterior, µ 0,. Cualquiera
de estas tres preguntas se responden planteando una hipótesis estadística adecuada.
Las hipótesis se pueden probar suponiendo la varianza poblacional s 2 conocida o
desconocida.
Sin embargo, como en la mayoría de los problemas es irreal suponer de antemano que se
39 conoce la varianza, nos limitamos a describir el caso cuando s 2 no se conoce.
Sea X una variable aleatoria con distribución normal con media m y varianza s 2, ambas
desconocidas. Se quiere probar la hipótesis de que la media es igual a cierto valor m0. Es
decir, la hipótesis a probar es
H0 : µ = µ0
HA : µ ≠ µ0