Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modulo de Nivelación
“Estadística para
Ingeniería de
Confiabilidad”
Julio 2015
Especialización en Confiabilidad de Sistemas Industriales
Contenido:
• Conceptos Básicos.
• Probabilidad y Estadística Descriptiva.
• Estadística de la Muestra.
• Influencia del Tamaño de la Muestra en el cálculo de las estadísticas.
• Estadística de la Población.
• De la Estadística de la Muestra a la de la Población (Muestras Grandes >
14 Datos).
• De la Opinión de Expertos a la Estadística de la Población.
• De la Estadística de la Muestra a la de la Población (Muestras Pequeñas <
15 datos).
• Operación con Variables Aleatorias (Simulación de Montecarlos).
Especialización en Confiabilidad de Sistemas Industriales
Sistema de Evaluación:
Especialización en Confiabilidad de Sistemas Industriales
Fechas de Evaluación:
Conceptos Básicos
Conceptos Básicos
Conceptos Básicos
Incertidumbre
Incertidumbre
1 2 CONCEPTOS BASICOS
CONCEPTOS BASICOS
3
4
5
66 7
8 Incertidumbre
Conceptos Básicos
Incertidumbre
El nivel de conocimiento acerca de un proceso específico puede variar desde el extremo de no saber
absolutamente nada acerca del mismo (ignorancia total), hasta el extremo de llegar a entender y modelar
completamente su comportamiento (certidumbre total).
CERTIDUMBRE TOTAL
Niveles de INCERTIDUMBRE
Conocimiento
IGNORANCIA TOTAL
El grado de separación entre nuestro nivel de conocimiento del proceso, y el estado de certidumbre total
se define como nuestro nivel de incertidumbre
Fundamentos Teóricos
Riesgo Incertidumbre
Incertidumbre Riesgo
Riesgo
El riesgo es un término de naturaleza probabilística, que se define como “egresos o pérdidas probables
consecuencia de la ocurrencia de un evento no deseado o falla”.
Matemáticamente el riego asociado a una decisión o la ocurrencia de una falla o evento viene dado por la
expresión:
Ra(t) = pa(t) x ca(t)
Ra(t): Riesgo del evento “a” en el tiempo “t”
pa(t): Probabilidad de que ocurra el evento no deseado “a” en el tiempo “t”
Ca(t): Consecuencias de la probable ocurrecia del evento no deseado “a” en el tiempo “t”
Conceptos Básicos
Análisis de Riesgo
• Producto: Calificación del Riesgo (Alto, Medio, Bajo)
Area 1:
•Virtud: Velocidad y Facilidad del Análisis
Dimensionamiento
del Riesgo • Debilidad: Subjetividad y Inauditabilidad del Análisis
Escuela Avanzada: Análisis Cuantitativo de Riesgo
– Quantitative Risk Analysis (QRA)
• Herramienta Base de Análisis: Caracterización Probabilística
Area 2: Area 3: de la Información de Variables y Modelaje Estocástico de
Procesos (Probabilidad y Estadística Descriptiva)
Administración Comunicación
del Riesgo del Riesgo • Producto: Cuantificación del Riesgo.
• Debilidad: Complejidad
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Probabilidad y Estadística
Descriptiva
Probabilidad:
Es una medida de la posibilidad de ocurrencia de un evento. La frecuencia de ocurrencia de un
evento es un indicador de probabilidad:
Si el evento “A” es muy frecuente => probabilidad de ocurrencia de “A” [P(A)] es alta (tiende a 1)
Si el evento “A” es poco frecuente=> probabilidad de ocurrencia de “A” [P(A)] es baja (tiende a 0)
0 P(A) 1
El evento o escenario El evento o escenario
“A” no se presentará. “A” se presentará.
nAn
P
r
A
l
i
m
Enfoque
Enfoque Frecuentista
n
Clásico
Basada en la historia de
ocurrencias
nA: Número de veces que se observa el evento “A”
n: Número total de observaciones o tamaño de muestra
Enfoque Enfoque Subjetivo
Bayesiano
Basada en “grado de conocimiento”
(“Grado de creencia”)
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Población
No es más que aquel conjunto de individuos o elementos que le podemos observar, medir
una característica o atributo.
Ejemplos de población:
Muestra
Subconjunto de la población a la cual se le efectúa la medición, con el fin de estudiar las
propiedades del conjunto del cual es obtenida.
Ejemplo; Supongamos que nos interesa conocer el peso promedio de la población formada
por los estudiantes de una universidad. Si la universidad tiene 5376 alumnos, bastaría pesar
cada estudiante, sumar los 5376 pesajes y dividirlo por 5376. Pero este proceso puede
presenta dificultades dentro de las que podemos mencionar:
Muestra
Las dificultades son mayores si en número de elementos de la población es infinito, si los
elementos se destruyen, si sufren daños al ser medidos o están muy dispersos, si el costo
para realizar el trabajo es muy costoso.
Una solución a este problema consiste en medir solo una parte de la población que
llamaremos muestra y tomar el peso medio en la muestra como una aproximación del
verdadero valor del peso medio de la población.
Muestra Representativa
Para considerar que una muestra es “representativa”, la misma debe ser:
Robusta: La muestra contiene la cantidad suficiente de datos para que se puedan hacer
inferencias válidas y minimizar el margen de error.
Justa (sin sesgo): La muestra debe tener elementos de todas las áreas del proceso, para
representar adecuadamente su heterogeneidad.
Estandarizada: Los datos de la muestra deben tener atributos y formato predefinido para
reducir inconsistencias.
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Estadística Descriptiva
La Estadística Descriptiva es la ciencia que se ocupa del estudio de la variación, dispersión o
incertidumbre de un tipo especial de variables conocidas como Variables Random, Variables
Aleatorias, Variables Dispersas o Variables Distribuidas
La Estadística Descriptiva se apoya en herramientas matemáticas conocidas como
“Distribuciones de Probabilidad” y en indicadores de comportamiento de los datos
conocidos como “estadísticas de la variable aleatoria” que en conjunto permiten organizar,
describir, representar matemática y gráficamente la información sobre este tipo de variables
y cuantificar su incertidumbre. 1 x 2
÷
1
. Histograma de f (x) .e 2
2
Frecuencias
Curva de
Probabilidad
Probabilidad y Estadística Descriptiva
Relación entre Población, Muestra, Parámetros y Estadísticas
Parámetros
Seleccionar Realizar
individuales inferencias
Estadísticas
Variables Aleatorias
Se denomina variable aleatoria, random o distribuida, a una variable “X” que por sus
características pueda tomar un conjunto de valores (x1, x2, x3, x4, ... xn-1) cada uno de los
cuales tiene una probabilidad de ocurrencia (p1, p2, p3, p4, ... pn-1,), sin que se pueda asegurar
específicamente cual de todos estos probables valores tomará la variable.
p(X) Convenio de Notación
.167 (X=xi): representa el evento "la variable aleatoria X
toma el valor xi”
.125
p(X=xi): representa la probabilidad que la variable
.083 aleatoria “X” tome el valor xi.
.042
.000
2 3 4 5 6 7 8 9 10 11 12 X
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Variables Discretas
Es una variable random que sólo puede tomar valores enteros, es decir, un número
finito de valores contables.
Variables Continuas
Es una variable random que teóricamente puede tomar todos los valores de un
intervalo dado (enteros, decimales), es decir, un número infinito de valores.
Gráficos para Variables Aleatorias ‐ Distribuciones de Probabilidad
Las Distribuciones de Probabilidad, son modelos gráficos que muestran la relación entre los
diversos probables valores que puede tomar una variable aleatoria y la frecuencia de
repetición u ocurrencia de estos probables valores.
Las Distribuciones de Probabilidad se clasifican en dos familias:
Distribuciones de la Muestra o Histogramas de Frecuencia
Distribuciones de la Población o Distribuciones Paramétricas
x x
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Estadística de la Muestra
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad de la Muestra ‐ Histogramas de Frecuencia
Formatos de Histogramas
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
4. Calcular la frecuencia relativa para cada rango o clase con la siguiente fórmula:
Lectura No. 1
Procedimiento para crear un
Histograma.
(En forma Manual)
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
0.15
0.10
No. de Clases (k)= 6
Ancho de Clases (A)= 0,270 0.05
0.00
9.1 - 9.4 9.4 - 9.7 9.7 – 10.0 10.0 – 10.3 – 10.6 –
10.3 10.6 10.9
Clases
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Del histograma acumulado directo construido para la variable aleatoria “aceleración de gravedad”
podemos inferir entre otras cosas, lo siguiente:
Del histograma acumulado inverso construido para la variable aleatoria “porosidad” podemos
inferir entre otras cosas, lo siguiente:
Lectura No. 2
Procedimiento para crear un
Histograma
(Usando Excel)
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad de la Muestra ‐ Histogramas de Frecuencia
Ejercicio No 2: La tabla anexa contiene una muestra de 100 valores de tiempos correspondientes
a una de las actividades rutinarias en la secuencia operacional de perforación de un pozo.
Actividad: Correr Casing de 13. 3/8" y posterior a su bajada a fondo, cementación.
2.‐ Para la muestra dada, usando las funciones de
estadística de “Excel”, calcular:
• Media de la Muestra
• Desviación Estándar de la Muestra
• Percentiles 60 y 80
Consultar Lectura No 2 ‐ Procedimiento para crear un Histograma
(Usando Excel)
Ver Ejercicio No 2 ‐ Histogramas (Act Perforacion)
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad de la Muestra ‐ Estadísticas
1
es necesariamente el valor de mayor
n
s
xi
X
.
2
probabilidad de ocurrencia (como suele
n
1
interpretarse de manera errónea); la
i
1
media es “el centro de gravedad” de una
distribución.
Desviación Estándar Muestral
Es una medida de dispersión de una distribución de
1 n
X = xi probabilidad y puede considerarse una de la
n i 1 característica más importante de la misma, ya que en
ella está retratada la información sobre la incertidumbre
Promedio o Media Muestral
de la variable random en estudio. En otras palabras, la
dispersión es un indicativo de la incertidumbre
relacionada con la variable; por ello, al cuantificar la
dispersión se está cuantificando el nivel de incertidumbre
de la variable en análisis.
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad de la Muestra ‐ Estadísticas
Percentil 70 (0.7)
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Lectura No. 3
Procedimiento para obtener las
Estadísticas de una Muestra con
Excel
Estadística de la Muestra
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad de la Muestra ‐ Estadísticas
Consultar Lectura No 3 ‐ Procedimiento para obtener las
Estadísticas de una Muestra con Excel
Ver Ejercicio No 3 ‐ Histogramas (Act. Mantenimiento Bombas)
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción
fracasos : k 3
trials : n 30
3
p prob .fracaso 0 .1
30
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción
Sin embargo, esto es solo un “estimado puntual”. El verdadero valor de “p” se encuentra en el
rango
1 k 1
p
pLOW p pHIGHT 1
n k 1
k (F2 k ,2 ( n k 1 ),1 )
n 1 nk
k 1(F2 ( k 1 ),2 ( n k ), )
2 2
El “ancho o incertidumbre” de este rango depende del tamaño de la muestra analizada y del grado
de confianza que se le dará a la estimación.
Estimado “Optimista” Estimado “Mas Probable” Estimado “Pesimista”
1 1
pLOW k pHIGT
1
n k 1 p 1
nk
k (F2 k ,2 ( n k 1 ),1 ) n k 1(F2 ( k 1),2 ( n k ), )
2 2
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción
Lectura No. 4
Estimación Intervalos Parámetros
Binomial – Software RARE
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad de la Muestra
Influencia del Tamaño de la Muestra en el cálculo de las estadísticas
Media o Promedio
La Media () (promedio, average, valor esperado o esperanza matemática) es posiblemente el parámetro o
estadística mas conocida, y la mas utilizada como “valor estimado de una variable”.
1 n
Tradicionalmente, la media para una variable aleatoria X, se calcula como = X = xi
n i 1
Sin embargo, esto es solo un “estimado puntual”. El verdadero valor de “” se encuentra en el rango
X
Z1
X
Z1
n
n
L
O
W
H
I
G
H
T
2
El “ancho o incertidumbre” de este rango depende del tamaño de la muestra analizada y del grado de
confianza que se le dará a la estimación.
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción
Lectura No. 5
Estimación del Intervalo de
Confianza para la
Media (µ) de una muestra,
apoyados en la Herramienta RARE
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción
Para las muestras observadas en las tablas anexas, y utilizando la herramienta RARE.xls, estimar los intervalos y el valor más
probable para la “Temperatura (ºF)” para los niveles de confianza de 80, 90 y 99%.
Estadística de la Población
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMÉTRICAS”
Una distribución de probabilidad paramétrica tambien conocida como curva de
probabilidades, es una función matemática teórica, que describe la forma en que se
espera que varíen los probables valores de una variable random (aleatoria), es decir, una
función matemática que relaciona los diversos probables valores que puede tomar una
variable random con la probabilidad de ocurrencia de cada uno de ellos.
F( x ) 0.5
C(x)=1-F(x)
F(xi)
0 0
0
8 9 10 11 12 X
8 x 12 xi
i x
Variable Aleatoria
INTERPRETACIÓN: INTERPRETACIÓN:
PROBABILIDAD DE OBSERVAR EL VALOR xi PROBABILIDAD DE OBSERVAR VALORES ≥ xi
Al igual que para las distribuciones no paramétricas, existen dos formatos para cada
distribución paramétrica
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS” ‐ Estadísticas
XM =MODA (valor de la variable con
mayor probabilidad de ocurrencia)
f(x)
=MEDIA (medida de la tendencia
central, o valor esperado
de la variable)
=Desviacion estandar
(Medida de la dispersion incertidumbre
asociada a la variable)
XM X
XL=5% XU=95%
LIMITE LIMITE
INFERIOR 90 % INTERVALO DE SUPERIOR
Pr(X< XL)=0.05 CONFIANZA Pr(X< XU)=0.95
Pr(L<X<U)=0.9
Una distribución se caracteriza por:
• El valor central o medida de posición (la media, la mediana o la moda).
• Una cantidad que expresa el grado de dispersión (la desviación estándar).
• La forma de la curva, es decir la forma general de la distribución probabilística
Estadística de la Población
f(x) f(x)
xm x50% X xm X
Media x50%
Media
Moda
Moda Mediana
Mediana
Estadística de la Población
Media, Esperanza Matemática o Valor Esperado: La media o valor esperado es una idea
fundamental en el estudio de las distribuciones de probabilidad que expresa
básicamente la tendencia central o posición de la distribución. La media no es
necesariamente el valor de mayor probabilidad de ocurrencia (como suele interpretarse
de manera errónea); la media es “el centro de gravedad” de una distribución.
Moda: La Moda, es también una medida que indica la tendencia central de una
distribución. Formalmente se define como el valor xm de la variable aleatoria X, que
tiene la mayor probabilidad de ocurrencia.
Distribuciones de Probabilidad “PARAMETRICAS”.
Medidas de Dispersión‐ Desviación Estándar
f(x)
0 X 1
68%
2
1.645 1.645 ( x ) . f ( x ) dx
2
90%
1.967 1.967
95%
3.00 3.00
99.7%
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS”.
Percentiles Estadísticos
F(x)
1 Si “” es percentil de la distribución de
probabilidad, el valor de la variable aleatoria
denotada como X o P para las cuales la
probabilidad acumulada es “” , se puede decir
F(x)
que hay % de probabilidad de que la los valores
de la variable aleatoria X sean menores o iguales a
0 X. x
x X
f(x) f ( x ) dx
f(x) El perceptil 50 (P50 o X50%) se conoce como la
mediana de la distribución.
x X
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS”.
Intervalo de Confidencia.
f(x)
F(xa)
xa xb X
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS”.
Coeficiente de Asimetria
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor
del punto central (Media aritmética). La asimetría presenta tres estados diferentes, cada uno
de los cuales define de forma concisa como están distribuidos los datos respecto al eje de
asimetría.
La asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de
la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma
cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando
la mayor cantidad de datos se aglomeran en los valores menores que la media
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS”.
Coeficiente de Asimetria
Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores, () la media
de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuación se interpretan:
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la
parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la
parte derecha de la media.
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma
cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a
tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS”.
Curtosis
Esta medida determina el grado de concentración que presentan los valores en la región
central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si
existe una gran concentración de valores (Leptocúrtica), una concentración normal
(Mesocúrtica) ó una baja concentración (Platicúrtica).
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS”.
Curtosis
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, () la media
de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula se
interpretan:
(g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante
difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los
valores cercanos (± 0.5 aprox.).
(g2 > 0) la distribución es Leptocúrtica
(g2 < 0) la distribución es Platicúrtica
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS”
Modelos Paramétricos de uso común
Distribución Normal
Distribución Lognormal
Distribución Binomial
Distribución Exponencial
Variables Variables Distribución de Poisson
Aleatorias Distribución de Weibull Aleatorias
Continuas Discretas Dist. Hipergonométrica
Distribución Beta
Distribución Geométrica
Distribución Gamma
Distribución Triangular
Distribución Uniforme
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS” – Parámetros
Parámetro 1 Parámetro 2
Media:
Desviación estándar:
1 n
xi 1 n
xi
2
Normal n i 1
n 1 i 1
Desviación estándar
Media Logarítmica: logarítmica:
1 n
t lnxi
n i 1
1 n
t ln xi t 2
Log-Normal
n i 1
Escala: Forma:
n
n. xi x
2
n 1 x i
n 2
Gamma
i 1 i 1
n
n 1 xi
n
n 2 x i x
2
i 1 i 1
Tasa :
1
Exponencial n
N.A
x i 1
i
Escala: Forma:
x lnx
1 n
n
x i i i
1 n
lnxi
Weibull 1
i 1
i 1
n n
x
n i1
i
i 1
Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Distribuciones de Probabilidad “PARAMETRICAS” ‐ Modelos Matemáticos
Distribución f(t): Distribución de F(t): Distribución C(t)=1-F(t): Distribución
Frecuencia Relativa Acumulada Directa Acumulada Inversa
Exponencial f (t ) e t F (t ) 1 e t C ( t ) e t
t
1 t t
t
Weibull
f (t ) e F (t ) 1 e
C (t ) e
t
t 1
t
1
t
Gamma f (t ) e F (t ) t 1
e
dt C (t ) 1 F (t )
0
2
1 t
2
1 t
1 1 e 2 dt
Normal f (t ) e 2 F (t ) C (t ) 1 F (t )
2 2
1 ln( t ) t
2
Log- Normal f (t )
1
e
2 t
F (t ) f (t )dt C (t ) 1 F (t )
t t 2 0
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
De la Estadística de la
Muestra a la de la Población
Muestras Grandes > 14 Datos
Caracterización probabilística de la muestra o
“¿Cómo seleccionar el modelo de distribución de
probabilidad para una muestra dada? ”
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
De la estadística de la muestra a la de la población
Estadística de la Muestra Estadística de la Población
x x
1 n
Media de la Muestra X = xi
n i 1
Media de la Población x.f ( x )dx
1
1 n
2
. x i X .
2
Muestra SD s Población SD ( x )2 .f ( x )dx
n 1 i 1
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
De la estadística de la muestra a la de la población – MUESTRAS GRANDES
Caracterización probabilística de la muestra o “¿Cómo seleccionar el modelo de
distribución de probabilidad para una muestra dada? ”
Procedimiento General
Paso 1: Construir el Histograma de Frecuencia Acumulada de la Muestra
Paso 2: Plantear hipótesis de las distribuciones paramétricas que podrían hacer un buen
ajuste con los datos.
Paso 3: Calcular los parámetros de cada una de las distribuciones hipótesis con los datos de
la muestra.
Paso 4: Graficar sobre el Histograma de Frecuencia Acumulada de la muestra, las Curvas de
Probabilidad Acumuladas Directas, de cada una de las hipótesis establecidas en el Paso 2
Paso 5: Realizar alguna de las Pruebas de Bondad de Ajuste.
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Sugerencias para Plantear “Hipótesis” sobre Modelos de Probabilidad que puedan
hacer un buen ajuste sobre los datos de una Muestra
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Caracterización probabilística de la muestra o “¿Cómo seleccionar el modelo de
distribución de probabilidad para una muestra dada? ”
8
f 7
F 1( X ,1 , 2 ) Fm ( X , 1 , 2 ) F 2( X ,1 , 2 )
6
Muestra
1
x
F(x)
0
F 1
2
0.8
X1 0.6 1
0.4
X2
0.2
8
0
0.064-0.086 0.086-0.108 0.108-0.13 0.13-0.152 0.152-0.174 0.174-0.196 0.196-0.218 0.218-0.24
x
6
X3
4
X4 Establecer Distribución de
2
Probabilidad “Hipótesis”
. 0
0.064-0.086 0.086-0.108 0.108-0.13 0.13- 0.152 0.152-0.174 0.174- 0.196 0.196- 0.218 0.218- 0.24 X
.
Test de Bondad de Ajuste
. f1 ( x,1 , 2 )
Hipótesis 1
Xn F1 ( x,1 , 2 )
n= número de f2 ( x,1 , 2 )
datos de la Hipótesis 2 F 2( X ,1 , 2 )
muestra o F2 ( x,1 , 2 )
“tamaño de
muestra” fm ( x, 1 , 2 ) Es el mejor ajuste para los
Hipótesis m
Fm ( x, 1 , 2 ) Datos de la Muestra
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Lectura No. 6
Procedimiento para caracterizar
variables apoyados en Crystal Ball
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
De la estadística de la muestra a la de la población – MUESTRAS GRANDES
Ejercicio No 6
La tabla que se muestra a continuación, muestra los valores de “Vibración Radial”
medidos durante 02 años en un Compresor Centrifugo de Gas Natural. Utilizando el
software Crystall Ball, caracterice en forma probabilística la variable en estudio
encontrando la distribución paramétrica que mejor represente los datos.
Ver Ejercicio No 6 ‐ Caracterización Probabilística de Variables con Crystal Ball
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
De la Opinión de Expertos
a la Estadística de la
Población
“¿Cómo representar una variable aleatoria cuando la
evidencia muestral es nula o demasiado pequeña y el
conocimiento sobre la variable aleatoria recide en la
mente de los expertos? ”
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Caracterización Probabilística de las Variables a partir de la Opinión de Expertos
La opinión de expertos representa una de las fuentes fundamentales de información para
cálculos en ingeniería y es particularmente útil cuando se trata de análisis de riesgo.
2.‐ Técnicas de Entrevistas del Experto o Grupo de Expertos, tales como el “Método
de Delphi”, que permite obtener la opinión de expertos, documentarla y reducir su
subjetividad.
De la Opinión de Expertos a la Estadística de la Población
Caracterización Probabilística de las Variables (Físicas y de Tiempo) a partir de la
Opinión de Expertos f(X
) )
0,45
EXPERTO
0.00350
0.00250
Probability
valores; un mínimo (Xmin) y un máximo 0.00200
0.00150
(Xmax). El experto expresa que debe haber 0.00100
0.00000
estimarlo.
0 0.1 0.2 0.3 0.4 0.5 0.6
X 5% X MIN X
X 95% X MAX
EXPERTO
De la Opinión de Expertos a la Estadística de la Población
Caracterización Probabilística de las Variables (Costos) a partir de la Opinión de
Expertos f(x)
f(x)
EXPERTO
EXPERTO
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Lectura No. 7
Procedimiento para Opinión de
Expertos con Crystal Ball ‐ BetaPert
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Caracterización Probabilística de las Variables a partir de la Opinión de Expertos
Ejercicio No 7 ‐ Parte I
En la siguiente tabla se presentan los estimados realizados por expertos de Geociencias de los
probables valores para la variable “Espesor Neto (h) o Arena Neta Petrolífera (ANP)”.
Nótese que estimación del Área, está dada por tres valores (Un máximo, un mínimo y un más
probable)
Con esta información conteste las siguientes preguntas:
1.‐ Que distribución de probabilidades puede usarse para representar dicha variable. Justifique su
selección
Lectura No. 8
Procedimiento para Opinión de
Expertos con Crystal Ball‐ LogNormal
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo
en Proyectos de Exploración y Producción
Caracterización Probabilística de las Variables a partir de la Opinión de Expertos
Ejemplo No 7 ‐ Parte II
Después de un análisis del comportamiento de producción de el yacimiento del Campo XRM, el Ing. de
Yacimientos a cargo expresa su estimación sobre la declinación del mencionado yacimiento tal como
se muestra en la tabla siguiente:
Nótese que estimación del Área, está dada por dos valores (un máximo y un mínimo). Con esta
información conteste las siguientes preguntas:
1.‐ Que distribución de probabilidades puede usarse para representar dicha variable. Justifique su
selección
De la Estadística de la
Muestra a la de la Población
Muestras Pequeñas < 15 datos
Caracterización probabilística de la muestra o
“¿Cómo seleccionar el modelo de distribución de
probabilidad para una muestra dada? ”
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
Muestra Pequeñas
en Proyectos de Exploración y Producción
De la estadística de la muestra a la de la población – MUESTRAS PEQUEÑAS
Tamaño de Muestra entre 6 y 15 datos – OPCIÓN 1
Paso 1: Determine el Valor Mínimo de los datos de la muestra.
Paso 4: Con los tres valores previamente calculados, construya una Distribución BetaPert
Pasos 1 y 2 Paso 3 Paso 4
Muestra Datos 7
Pozo 10 27.70%
Valor Mas Probable o Moda
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
Muestra Pequeñas
en Proyectos de Exploración y Producción
De la estadística de la muestra a la de la población – MUESTRAS PEQUEÑAS
Tamaño de Muestra entre 6 y 15 datos – OPCIÓN 2
Paso 1: A partir de los datos de la muestra; y utilizando la función PERCENTIL de Excel calcule los
Percentiles 5% y 95% (P5% y P95%)
Paso 2: Con los dos valores previamente calculados, construya una Distribución LogNormal
Vecinos % Declinacion
Pozo 1 17.30%
Pozo 2 15.80%
Pozo 3 17.00%
Pozo 4 14.20%
Pozo 5 10.70%
Pozo 6 20.70%
Pozo 7 19.50%
Pozo 8 25.20%
Pozo 9 46.90%
Pozo 10 27.70%
P5%=PERCENTIL(K15 :K24,0.05)=0.12275
P95%=PERCENTIL(K15 :K24,0.95)=0.3826
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo
Muestra Pequeñas
en Proyectos de Exploración y Producción
De la estadística de la muestra a la de la población – MUESTRAS PEQUEÑAS
Tamaño de Muestra entre 6 y 15 datos.
Ejercicio No 8.
Después de un análisis del comportamiento del Sistema de Generación Eléctrica, se han registrado en
los últimos 10 años los siguientes valores de Disponibilidad.
Ver Ejercicio No 8 ‐ Caracterización de Variables
(Muestra Pequeñas).xls
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Simulación de Montecarlo
en Proyectos de Exploración y Producción
Operaciones con
Variables Aleatorias
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Simulación de Montecarlo
en Proyectos de Exploración y Producción
Operaciones con Variables Aleatorias
Variables de Entrada Modelo Variable de Salida
(Información) (Información) (Variable de decisión)
A
0,15 0,15 0,15 0,15 0,15
B ,083
D ,021
C ,000
50.680,17 54.456,64 58.233,11 62.009,58 65.786,05
18,50 19,25 20,00 20,75 21,50
1,000
,750
E
D ,500
,000
50.000,00 54.375,00 58.750,00 63.125,00 67.500,00
A
0,15 0,15 0,15 0,15 0,15
B ,083
D ,021
C ,000
50.680,17 54.456,64 58.233,11 62.009,58 65.786,05
18,50 19,25 20,00 20,75 21,50
D
0,92 0,93 0,95 0,96 0,98
SOLUCIÓN NUMÉRICA SOLUCIÓN ANALÍTICA
X1 X2 X3
0,15 0,15 0,15 0,15 0,15 18,50 19,25 20,00 20,75 21,50
-1,29 1,71 4,71 7,70 10,70 -1,29 1,71 4,71 7,70 10,70 0,76
-1,29 0,78
1,71 0,80
4,71 0,82
7,70 0,85
10,70
X 1j X 2j X nj
Si
j < m ? j = j+1
f(Y)
No
Con los “m” valores calculados de Y (desde Y 1 hasta Y m ), construir un histograma de frecuencias
y realizar prueba de bondad de ajuste para definir la distribución probabilística que mejor ajusta
Lectura No. 9
Procedimiento para efectuar
Operaciones con Variables Random
apoyados en Crystal Ball
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Simulación de Montecarlo
en Proyectos de Exploración y Producción
Operaciones con Variables Aleatorias – Ejercicio No 9.
Se propone realizar un Mantenimiento y el equipo de ingenieros necesita estimar el tiempo total de la actividad, con
la finalidad de optimizar la programación de recursos.
Suponga que para realizar este nivel de mantenimiento se realizan tres actividades básicas (Act.1,Act.2,Act.3). En las
siguientes tablas se presentan los tiempos para cada una de las actividades, a partir de dos fuentes de información,
datos históricos de pozos de estructura similar y opinión de expertos.
Act.1 Act.2
Con esta información conteste las siguientes preguntas:
12,805 Mínimo 4 1.‐ Cuál es la probabilidad que el mantenimiento se complete antes
11,603 Mas Probable 10
12,634 Máximo 17 de 30 días.
10,243
6,572 2.‐ Si tuviese que suministrar sus estimados sobre el “Tiempo para
Act.3
15,218 realizar un Mantenimiento, cual sería su respuesta . Justifíquela
14,397 Mínimo 2
17,782 Mas Probable 8
25,959 Máximo 32
19,044
19,926
19,311
19,578
18,365
9,778
15,345
11,222
18,483
14,091 Consultar Lectura No 9 ‐ Procedimiento para efectuar Operaciones con Variables Random apoyados en Crystal Ball
11,778
Ver Ejercicio No 9– Operación con Variables Aleatorias (Tiempo Actividad).xls
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Simulación de Montecarlo
en Proyectos de Exploración y Producción
Correlaciones
Probabilísticas
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción
Correlaciones Probabilísticas
Para detectar la posible existencia de correlación entre dos variables X y Y, se grafican los
valores de las muestras independientemente colectadas de ambas variables, para identificar
si existe algún tipo de tendencia.
Y
Y
0 1 0
15 20 25 30 35 40 0 500 1000 1500 2000 2500 0 200 400 600 800 1000 1200 1400
X X X
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción
Correlaciones Probabilísticas
Factor de Correlación: La intensidad de la dependencia probabilística se mide con un indicador estadístico
conocido como “Factor de Correlación, cuyos valores varían entre ‐1 y 1.
La correlación entre variables que son débiles no afecta el resultado del modelo de simulación, más aún
moderadas y altas correlaciones pueden producir un error significante si este no es considerado
explícitamente en el modelo de simulación.
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción
Lectura No. 10
Procedimiento para estimar Factor
de Correlación entre Variables
apoyados Crystal Ball
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción
Operaciones con Variables Aleatorias – Correlaciones Probabilísticas
Ejercicio No. 11: Estimación del Factor de Correlación entre Variables
Ver Lectura No 10 ‐ Procedimiento para estimar Factor de Correlación
entre Variables apoyados Crystal Ball
Análisis de Sensibilidad
Operaciones con Variables Aleatorias Módulo2:
Análisis Probabilístico de Riesgo
Análisis de SensibilidadGerencia de la Incertidumbre
en Proyectos de Exploración y Producción
Análisis de Sensibilidad
El análisis de sensibilidad permite cuantificar la contribución relativa de cada una de las variables
aleatorias de entrada a un modelo, a la dispersión o varianza del resultado o variable de salida del
modelo. Obviamente es un procedimiento que debe realizarse después de haber completado la
propagación de incertidumbre ya sea por el Método de los Momentos o por Simulación de Montecarlo.
Este análisis es de vital importancia para “gerenciar la incertidumbre” ya que permite identificar las
variables de entrada al modelo en las que debe centrarse la atención y tomar las acciones necesarias
(compra de información, toma de datos, análisis causa raíz, etc) para mejorar el nivel de conocimiento
sobre las mismas, (de ser técnicamente factible y económicamente rentable), porque solo así se logrará
reducir la incertidumbre de la variable de salida.
Análisis de Sensibilidad ‐ Contribución a la Varianza
% Contribución a la Varianza de
“Y”
X1
X3
X2
Xn
Análisis de Sensibilidad ‐ Diagrama de Tornado Clásico o de una Variable a la Vez
Para su construcción la variación de los datos se
realiza individualmente, es decir, se analiza la
sensibilidad de la salida debido a la variación de una
variable a la vez, asumiendo que todos las demás TORNADO POES
Análisis de Sensibilidad – Gráfico de Araña
El Gráfico de Araña, es una herramienta muy útil que representa exactamente los mismos
resultados del Diagrama de Tornado, pero empleando una representación gráfica
diferente.
Lectura No. 11
Pozo Probabilista ‐ Qo y Perfil
de Producción
Lectura No 12
Simulación de Montecarlo y
Análisis de Sensibilidad ‐ Qo
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo
Análisis de Sensibilidad
en Proyectos de Exploración y Producción
Ejercicio No. 12: Estimación (Pronóstico) de la Producción Inicial de un Pozo, Perfil
de Producción y Análisis de Sensibilidad
Con base en los datos que se plantean en el Ejercicio No 12 y siguiendo las Lecturas No 11 y 12 se
plantea:
Parte 2: Estimar el Perfil de Producción del nuevo Pozo para un período de 10 años.
Ecuación de Darcy