Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONFIABILIDAD
MUESTREO PROBABILÍSTICO
ESPECIALIZACIÓN EN GERENCIA DE
MANTENIMIENTO Y CONFIABILIDAD
MUESTREO PROBABILÍSTICO
Población. O universo estadístico, es el conjunto de elementos de
cualquier naturaleza (personas, objetos, animales, plantas, pueblos,
familias, países) que se pretende analizar o investigar.
Marco Muestral
Todo material o dispositivo usado para obtener acceso a los elementos
de la población de interés. Delimita, identifica y permite tener acceso a
los elementos de la población objetivo. En una encuesta las unidades
del marco son las unidades a las cuales se le aplica la selección por
muestreo probabilístico.
P4 de
Marco 11
Muestra
p
4
Muestreo (grupo de
T4 t
1
estudio)
4 x x
1 2
Población Generalización 1
p p
2
susceptible de 1 2
P 1 P2
Observar
Tamaño de la Muestra en Muestreo
Criterios a considerar
Probabilístico
Probabilístico No probabilístico
probabilístico
1. Se puede definir el conjunto de muestras, S = {s1, ..., sM}, posibles que se derivan del
proceso de muestreo.
Para un diseño muestral dado p(·), se puede considerar a cada muestra s como el resultado
de una variable aleatoria S, con distribución de probabilidad especificada por p(·). Así, si S es
el conjunto de todas las muestras posibles s, entonces Pr(S = s) = p(s) para cada s ϵ S.
RTA.
INFERENCIAS
•ESTIMACIONES
• PRUEBAS DE HIPÓTESIS
INFERENCIA ESTADÍSTICA
Herramienta que permite, con base en la
INFORMACIÓN proporcionada por una
MUESTRA DE TAMAÑO n sobre una variable de
naturaleza cuantitativa o cualitativa, PROYECTAR
el comportamiento de la variable a la TOTALIDAD
DE LA POBLACIÓN asumiendo para ello la
PRESENCIA DE LA INCERTIDUMBRE y facilitando
así los procesos de TOMA DE DECISIONES
CRITERIOS
¿CUANTAS MUESTRAS
DIFERENTES SE PUEDEN
OBTENER?
POBLACIÓN ¿CON REPOSICIÓN? POBLACIÓN DE
VARIABLE ¿SIN REPOSICIÓN? MUESTRAS
VARIABLE
• MEDIA POBLACIONAL DE LA
VARIABLE EN LAS UNIDADES
2
?
• VARIANZA Y DESVIACIÓN ESTÁNDAR
POBLACIONAL DE LA VARIABLE EN LAS
UNIDADES NORMAL
• COMPORTAMIENTO FUNCIONAL DE LA DESCONOCIDO
VARIABLE EN LA POBLACIÓN CONOCIDO NO NORMAL
¿PARA QUÉ LAS DISTRIBUCIONES
MUESTRALES DE PROBABILIDAD?
PARA LLEGAR A LA CONCLUSIÓN DEL
COMPORTAMIENTO DE LA VARIABLE EN LA
POBLACIÓN SIN TENER QUE OBSERVAR
TODA LA POBLACIÓN
TEORIA DE ESTIMACIÓN ESTADÍSTICA
Proceso mediante el cual se intenta develar o
descubrir información sobre el comportamiento
de variables de interés a nivel poblacional a partir
de la información proporcionada en tales
variables por una muestra. El proceso de
estimación supone la no presencia de errores
sistemáticos.
ERROR MUESTRAL
Una vez que se tiene una estimación puntual del
parámetro poblacional, una pregunta válida es: ¿qué tan
buena es la estimación? En general no se conoce el valor
del parámetro θ (¿de otro modo para que estimar?), por lo
que es imposible calcular exactamente el error muestral.
El error de la
muestra es una
variable
aleatoria
Sesgo y Variabilidad
En la figura se analiza intuitivamente el efecto combinado de sesgo y variabilidad de
la distribución de muestras de un estadístico . Si θ es el valor del parámetro que se
está estimando, los puntos representan los valores posibles del estadístico θ. Así, si
el estadístico de muestra es la media o mediana, los puntos representan posibles
medias o medianas de muestras.
E es relativamente
más eficiente que
y se prefiere como
estimador puntual.
Consistencia (depende de n)
Un
estimador puntual es consistente si el valor del estimador
puntual tiende a estar más cerca del parámetro poblacional a
medida que el tamaño de la muestra aumenta.
Cuando se realiza una afirmación acerca de los parámetros de la población en estudio con
base en la información proporcionada por una muestra, señalando un intervalo de valores
dentro del cual se tiene confianza de que esté el valor del parámetro, se tendrá una
estimación por Intervalos de confianza ()
Realizar una estimación por para un parámetro al nivel del de confianza es hallar un intervalo
en para el que se tiene una probabilidad de de que el verdadero valor del parámetro caiga
dentro del intervalo. A los valores extremos de la distribución asociados con el nivel de
confianza se les suele denominar coeficientes de confianza.
TEOREMA DEL LIMITE CENTRAL
Dada una población y en ella una variable X que se distribuye de cualquier forma funcional:
Normal, No normal o Desconocida con media y varianza 2, la distribución del estimador
a partir de todas las posibles muestras de tamaño grande (n≥30) de esta población estará
distribuida en forma aproximadamente normal.
Para un nivel de confianza el intervalo de confianza del parámetro está dado por:
Dado que es usual que no se conozca debido a que en su cálculo intervienen datos
poblacionales no conocidos, en su lugar se utiliza
Observación.
En este caso no se puede asegurar con exactitud que el intervalo cubra a con probabilidad
pero en la mayoría de los casos toma la forma de una suma de variables normales, con lo
que podrá inferirse su normalidad.
realmente es dudoso que entonces se puede utilizar la distribución t-student con grados
Si
de libertad para el cálculo del intervalo. En este caso queda:
1.00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
𝑆
𝑆
𝐸 =𝜃^ ± 𝑍 𝛼 𝜎 ( 𝜃^ ) − 𝐵 ( 𝜃^ )
𝐼
𝐸 =𝜃^ ± 𝑡 𝛼 𝜎 ( 𝜃^ ) −𝐵 ( 𝜃
𝐼
^)
𝑆 𝜎 ( ^)
𝜃
𝐸 𝐼 =𝜃^ ±
√𝛼
Ejemplo.
Supongamos que para una variable (por ejemplo “Tiempo necesario para realizar una
actividad”), se pretende hacer una estimación con base en una cierta muestra de
tamaño n utilizando un nivel de confianza del 95% y un error del 3%. ¿Qué quiere decir
esto?
Sol.
Quiere decir que se espera que en el 95% de las posibles muestras (en particular, con
la muestra que se está trabajando) el verdadero tiempo (promedio) de toda la
población de aquellos que la realizan, se presente con una diferencia aproximada al
3% del tiempo promedio proporcionado por la muestra.
EJEMPLO
1. Un fabricante de llantas desea investigar la durabilidad de sus productos. Una
muestra de 10 llantas que recorrieron 50.000 millas reveló una media
muestral de 0,32 pulgadas de cuerda restante (lo que queda de la llanta
después del uso) con una desviación estándar de 0,09 pulgadas. Construya un
intervalo de confianza de 95% de la media poblacional. ¿Sería razonable que
el fabricante concluyera que después de 50.000 millas la cantidad media
poblacional de cuerda restante es de 0,30 pulgadas? Asumir que la
distribución es normal
4. Se toma una muestra de 49 observaciones de una población normal con una desviación
estándar de 10. la media de la muestra es de 50. determine el intervalo de confianza de
99% de la media poblacional (µ).
6. Una investigación efectuada a 400 familias de clase media reveló que en la realización de
fiestas familiares, un 62% prefería el aguardiente a cualquier otra clase de licor. Estime
utilizando un nivel del 95% la proporción de familias en la población que prefiere
aguardiente en sus fiestas.
7. Supóngase que para verificar la confiabilidad de los saldos del movimiento de un artículo, un
auditor ha decidido realizar una prueba sustantiva. Se sabe que los saldos se distribuyen en
forma aproximadamente normal. Al observar una muestra de 21 documentos, se encontró
que el saldo promedio era de $2450000 con una varianza de $260000. A un nivel del 95%
estime el saldo promedio del movimiento del artículo que se observa.
8. Una auditora de una gran compañía de tarjetas de crédito sabe que en promedio, el saldo
mensual de determinado tipo de cliente es de $1.812.000 con una desviación de $100000. Si
revisa 50 cuentas seleccionadas al azar, ¿Cuál es la probabilidad que el saldo promedio
mensual sea...
a. A lo más de $1.820.000=
b. Entre $1.810.000= y $1.830.000=
9. Se sabe que el 4 % de las piezas producidas por cierta máquina son defectuosas, ¿Cuál es la
probabilidad de que en un grupo de 200 piezas el 3% o más sean defectuosas?
10. Un fabricante de desodorantes recibe cada semana lotes de 8000 válvulas para los tarros
rociadores, para aceptar o rechazar dichos lotes, selecciona al azar 500 válvulas de cada lote ; si
el 2% o más resulta defectuosos, se rechaza el lote, ; en caso contrario se acepta el lote. ¿Cuál
es la probabilidad de rechazar un lote que contenga el 1% de válvulas defectuosas?
11. El departamento de control de calidad de una empresa fabricante de
pintura desea establecer el tiempo de secado promedio de su nueva
pintura de “secado rápido”. Para ello se instruye a su personal para que
pinte 49 tableros con pintura de 49 latas distintas de 1 galón de la nueva
pintura. Los resultados se dan a continuación. ¿se consideraría válido
anunciar que seca en 20 minutos?
12. El rendimiento medio de los autos de la marca A es de 20 Km/gal. Con una desviación
estándar de 6 Km/gal. Las cifras comparables para los autos de la marca B son 25 y 5,5 Km/gal. Se
supone que el rendimiento de cada una de ambas está normalmente distribuido. ¿Cuál es la
probabilidad que al realizar una comparación el rendimiento medio para 40 autos de la marca A
sea mayor que el de 39 autos de la marca B?
14. Al tomar dos muestras de 100 bombillas cada una, de dos marcas diferentes, se
encontró que el tiempo medio de duración en la primera fue de 1750 horas y en la segunda
de 1850 horas, con varianzas de 12100 horas2 y 8100 horas2 respectivamente. Utilizando un
nivel de confianza del 90% estime la diferencia media en los tiempos de duración de los dos
tipos de bombillas.
15. Se hizo una entrevista a 32 subdirectores y 31 analistas de mercado de una gran
empresa. Se les preguntó a cada uno cuál considera ser el porcentaje óptimo de cobertura
de mercado para su compañía. Se obtuvieron las siguientes respuestas :
Subdirectores : 26 – 27 – 26,5 – 27,3 – 28 - 25 – 31,3 – 27,8 – 20,3 – 24,2 – 22,5 – 26,3
– 24 – 25 – 23,5 – 27 – 30 – 23,5 – 23,5 – 24 – 23 – 25 – 24 – 26 – 26,5 – 29 – 27 – 28 –
26,7- 23,6 – 23,7 - 28
Analistas : 23,1 – 28,6 – 24,2 – 23,5 – 26,3 – 29 – 30 – 32 – 30,5 – 30 – 32 – 31,5 –
32 – 30 – 28 – 26 – 25 –28 – 29 – 28 – 27 – 26 – 25,5 – 26,5 – 28 – 27,5 – 30 – 31 – 30,5
– 30,5 - 28
Utilizando un nivel de confianza del 98% estime la diferencia en la opinión de cobertura
entre subdirectores y analistas.
Observación.
El método de máxima verosimilitud puede usarse en situaciones en las que hay varios
parámetros desconocido.
L(1, 2, … , k) = f(x1; 1, 2, … , k). f(x2; 1, 2, … , k). …. . f(xn; 1, 2, … , k)
Los estimadores de máxima verosimilitud se encuentran igualando a cero las
derivadas parciales y resolviendo el sistema de ecuaciones.
Estimador de Kaplan-Meier
Sea S(t)
la función de supervivencia de una determinada población, es decir,
En
la probabilidad de de
el análisis la de
que uno supervivencia,
sus integrantesel estimador
no falle más alládede un
Kaplan–Meier es
tiempo t.
un estimador no paramétrico de la función de supervivencia.
Fue
Paraintroducido
una muestra por Edward
de estaL.población
Kaplan y Paul Meier en 1958.
de tamaño N, sean … los tiempos que
discurren hasta que todos fallen.
Este estimador tiene en cuenta la censura. La censura es el fenómeno que ocurre
cuando el valor
Entonces, paradecada t
una observación
, se define:sólo se conoce parcialmente.
i
• di, el número de fallos en el momento ti
• ni, el número de elementos en riesgo justo antes de ti.
De no haber censura, ni es el número de unidades sin fallo inmediatamente
antes del momento ti.
Con censura, ni es el número de unidades sin fallo menos el número de casos
censurados: sólo se observan los sujetos sin fallo que no se han caído del
estudio en el momento en que ocurre un fallo.