Está en la página 1de 104

UNIVERSIDAD SIMON BOLIVAR

DECANATO DE ESTUDIOS DE POSTGRADO


COORDINACION DE POSTGRADO EN ING. MECANICA
Especialización en Confiabilidad de Sistemas Industriales

Modulo de Nivelación

“Estadística para
Ingeniería de
Confiabilidad”

Julio 2015
Especialización en Confiabilidad de Sistemas Industriales

¿Quién soy , cual es mi profesión?

¿A qué Grupo de Trabajo,


Organización o
Empresa pertenezco ?

¿Cuáles son mis funciones ?

¿Cuáles son mis expectativas de


esta especialización?
Especialización en Confiabilidad de Sistemas Industriales

Contenido:
• Conceptos Básicos.
• Probabilidad y Estadística Descriptiva.
• Estadística de la Muestra.
• Influencia del Tamaño de la Muestra en el cálculo de las estadísticas.
• Estadística de la Población.
• De la Estadística de la Muestra a la de la Población (Muestras Grandes >
14 Datos).
• De la Opinión de Expertos a la Estadística de la Población.
• De la Estadística de la Muestra a la de la Población (Muestras Pequeñas <
15 datos).
• Operación con Variables Aleatorias (Simulación de Montecarlos).
Especialización en Confiabilidad de Sistemas Industriales

Sistema de Evaluación:
Especialización en Confiabilidad de Sistemas Industriales

Fechas de Evaluación:
Conceptos Básicos

Conceptos Básicos
Conceptos Básicos

Incertidumbre

“Es preferible estar aproximadamente correcto que


exactamente equivocado”
Conceptos Básicos

Incertidumbre
1 2 CONCEPTOS BASICOS
CONCEPTOS BASICOS

3
4
5
66 7

8 Incertidumbre
Conceptos Básicos

Incertidumbre
El nivel de conocimiento acerca de un proceso específico puede variar desde el extremo de no saber
absolutamente nada acerca del mismo (ignorancia total), hasta el extremo de llegar a entender y modelar
completamente su comportamiento (certidumbre total).

El escenario más común es el de la incertidumbre; es decir, disponer de un nivel de conocimiento que


es mayor que la ignorancia total; pero que no alcanza el estado de certidumbre total.

CERTIDUMBRE TOTAL

Niveles de INCERTIDUMBRE
Conocimiento

IGNORANCIA TOTAL

El grado de separación entre nuestro nivel de conocimiento del proceso, y el estado de certidumbre total
se define como nuestro nivel de incertidumbre

“La Incertidumbre es una medida de la inseguridad o grado de desconocimiento


acerca de una variable, proceso o fenómeno bajo estudio”
Conceptos Básicos

Fundamentos Teóricos
Riesgo Incertidumbre
Incertidumbre Riesgo
Riesgo

El riesgo es un término de naturaleza probabilística, que se define como “egresos o pérdidas probables
consecuencia de la ocurrencia de un evento no deseado o falla”.

Matemáticamente el riego asociado a una decisión o la ocurrencia de una falla o evento viene dado por la
expresión:
Ra(t) = pa(t) x ca(t)
Ra(t): Riesgo del evento “a” en el tiempo “t”
pa(t): Probabilidad de que ocurra el evento no deseado “a” en el tiempo “t”
Ca(t): Consecuencias de la probable ocurrecia del evento no deseado “a” en el tiempo “t”
Conceptos Básicos

Análisis de Riesgo

“ El análisis de riesgo es una ciencia de


toma de decisiones en ambientes con
incertidumbre ”
Conceptos Básicos

Escuelas de Análisis de Riesgo Escuela Básica : Análisis de Riesgo por Índices 


Subjetivos de Riesgo
• Herramienta Base de Análisis: Matrices de Multiples
Atributos

• Producto: Calificación del Riesgo (Alto, Medio, Bajo)  
Area 1:
•Virtud: Velocidad y Facilidad del Análisis
Dimensionamiento
del Riesgo • Debilidad: Subjetividad y Inauditabilidad del Análisis

Escuela Avanzada: Análisis Cuantitativo de Riesgo 
– Quantitative Risk Analysis (QRA)
• Herramienta Base de Análisis: Caracterización Probabilística
Area 2: Area 3: de la Información de Variables y Modelaje Estocástico de
Procesos (Probabilidad y Estadística Descriptiva)
Administración Comunicación
del Riesgo del Riesgo • Producto: Cuantificación del Riesgo.

•Virtud: Reducción de la Subjetividad y Trazabilidad del Análisis

• Debilidad: Complejidad
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Probabilidad y Estadística
Descriptiva

“Marco matemático para predecir el futuro


modelando la experiencia.”
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Probabilidad:
Es una medida de la posibilidad de ocurrencia de un evento. La frecuencia de ocurrencia de un
evento es un indicador de probabilidad:

Si el evento “A” es muy frecuente => probabilidad de ocurrencia de “A” [P(A)] es alta (tiende a 1)
Si el evento “A” es poco frecuente=> probabilidad de ocurrencia de “A” [P(A)] es baja (tiende a 0)

0 P(A) 1
El evento o escenario El evento o escenario
“A” no se presentará. “A” se presentará.

nAn
P
r
A
l
i
m
Enfoque   
Enfoque Frecuentista
   
n
Clásico
Basada  en  la historia de   
ocurrencias
nA: Número de veces que se observa el evento “A”
n: Número total de observaciones o tamaño de muestra 

Enfoque  Enfoque Subjetivo
Bayesiano
Basada  en  “grado de conocimiento”
(“Grado de creencia”)
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Población
No es más que aquel conjunto de individuos o elementos que le podemos observar, medir
una característica o atributo.

Ejemplos de población:

•El conjunto formado por todos los estudiantes universitarios en Venezuela.


•El conjunto de todos los estudiantes de una Universidad.
•El conjunto de personas fumadoras de una región.

Son características medibles u observables de cada


elemento por ejemplo, su estatura, su peso, edad,
sexo, etc.

Las poblaciones pueden ser finitas e infinitas.


Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Muestra
Subconjunto de la población a la cual se le efectúa la medición, con el fin de estudiar las
propiedades del conjunto del cual es obtenida.

Ejemplo; Supongamos que nos interesa conocer el peso promedio de la población formada
por los estudiantes de una universidad. Si la universidad tiene 5376 alumnos, bastaría pesar
cada estudiante, sumar los 5376 pesajes y dividirlo por 5376. Pero este proceso puede
presenta dificultades dentro de las que podemos mencionar:

• Localizar y pesar con precisión cada estudiante.


• Escribir todos los datos sin equivocaciones en una lista.
• Efectuar los cálculos.
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Muestra
Las dificultades son mayores si en número de elementos de la población es infinito, si los
elementos se destruyen, si sufren daños al ser medidos o están muy dispersos, si el costo
para realizar el trabajo es muy costoso.

Una solución a este problema consiste en medir solo una parte de la población que
llamaremos muestra y tomar el peso medio en la muestra como una aproximación del
verdadero valor del peso medio de la población.

Para que los resultados obtenidos de los datos


muestrales se puedan extender a la población, la
muestra debe ser representativa
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Muestra Representativa
Para considerar que una muestra es “representativa”, la misma debe ser:

Robusta: La muestra contiene la cantidad suficiente de datos para que se puedan hacer
inferencias válidas y minimizar el margen de error.

Fidedigna: Los elementos de la muestra reproducen la realidad de los procesos y variables


bajo análisis; es decir, los atributos del dato son coherentes y corresponden a las condiciones
y características del proceso.

Justa (sin sesgo): La muestra debe tener elementos de todas las áreas del proceso, para
representar adecuadamente su heterogeneidad.

Estandarizada: Los datos de la muestra deben tener atributos y formato predefinido para
reducir inconsistencias.
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Estadística Descriptiva
La Estadística Descriptiva es la ciencia que se ocupa del estudio de la variación, dispersión o
incertidumbre de un tipo especial de variables conocidas como Variables Random, Variables
Aleatorias, Variables Dispersas o Variables Distribuidas
La Estadística Descriptiva se apoya en herramientas matemáticas conocidas como
“Distribuciones de Probabilidad” y en indicadores de comportamiento de los datos
conocidos como “estadísticas de la variable aleatoria” que en conjunto permiten organizar,
describir, representar matemática y gráficamente la información sobre este tipo de variables
y cuantificar su incertidumbre. 1  x   2
  ÷
1  
. Histograma de  f (x)  .e 2
 2
Frecuencias
Curva de 
Probabilidad
Probabilidad y Estadística Descriptiva

Relación entre Población, Muestra, Parámetros y Estadísticas

Parámetros

Seleccionar Realizar
individuales inferencias

Estadísticas

Fuente: Statistical Analysis with


Excel for Dummies
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Variables Aleatorias
Se denomina variable aleatoria, random o distribuida, a una variable “X” que por sus
características pueda tomar un conjunto de valores (x1, x2, x3, x4, ... xn-1) cada uno de los
cuales tiene una probabilidad de ocurrencia (p1, p2, p3, p4, ... pn-1,), sin que se pueda asegurar
específicamente cual de todos estos probables valores tomará la variable.

p(X) Convenio de Notación
.167 (X=xi): representa el evento "la variable aleatoria X 
toma el valor xi”
.125
p(X=xi): representa  la  probabilidad que la variable 
.083 aleatoria “X” tome el valor xi.

.042

.000
2 3 4 5 6 7 8 9 10 11 12 X
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Variables Discretas
Es una variable random que sólo puede tomar valores enteros, es decir, un número
finito de valores contables.

Variables Continuas
Es una variable random que teóricamente puede tomar todos los valores de un
intervalo dado (enteros, decimales), es decir, un número infinito de valores.

Las variables aleatorias


discretas se identifican de las
continuas, porque para
cuantificar su frecuencia hay
que “contar”, mientras que
para las variables aleatorias
continuas hay que “medir”.
Probabilidad y Estadística Descriptiva
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Gráficos para Variables Aleatorias ‐ Distribuciones de Probabilidad
Las Distribuciones de Probabilidad, son modelos gráficos que muestran la relación entre los
diversos probables valores que puede tomar una variable aleatoria y la frecuencia de
repetición u ocurrencia de estos probables valores.
Las Distribuciones de Probabilidad se clasifican en dos familias:
Distribuciones de la Muestra o Histogramas de Frecuencia
Distribuciones de la Población o Distribuciones Paramétricas

f(x) Histogramas de Frecuencias f(x) Distribución Parametrica


2
1 x  
  
1 2  
f (x)  .e
 2
Frecuencias

x x
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Estadística de la Muestra
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad de la Muestra ‐ Histogramas de Frecuencia
Formatos de Histogramas
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad no Paramétricas


Histogramas de Frecuencia
Para construir un histograma de frecuencias relativas deben seguirse los siguientes
pasos:

1. Determinar el recorrido o amplitud de la población o muestra, restando el valor máximo


menos el mínimo.

2. Dividir el recorrido en un número de rangos o clases, seleccionados convenientemente de


forma de no desvirtuar el dominio de la variable aleatoria.

3. Contar el número de observaciones que corresponden a cada rango o clase

4. Calcular la frecuencia relativa para cada rango o clase con la siguiente fórmula:

Frecuencia Clasei = (Nº observaciones en rango o clasei)


(Nº total observaciones)

5. Construír el gráfico resultante


Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Lectura No. 1
Procedimiento para crear un 
Histograma.
(En forma Manual)
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad no Paramétricas


Histogramas de Frecuencia
Ejercicio No 1: Los datos mostrados en la tabla anexa corresponden a 34 mediciones de la
aceleración a la que caen libremente objetos de diferentes formas y pesos (aceleración de
gravedad); en un experimento realizado un el laboratorio de física de la Universidad Simón
Bolívar en Venezuela.
2
Aceleración de Gravedad (m/s )
1. Elaborar un histograma de frecuencias de la 9.123 9.645 9.661
variable random “aceleración de gravedad”. 9.261 10.453 9.701
10.768 9.819 10.326
2. Elaborar un histograma acumulado directo 10.103 9.677 9.888
de la variable random “aceleración de 9.809 10.256 10.645
gravedad”. 9.472 10.008 9.185
9.403 9.489 9.842
3. Elaborar un histograma acumulado inverso 9.158 9.559 9.978
de la variable random “aceleración de 10.256 9.589 10.461
10.188 9.672 10.058
gravedad”.
10.114 9.624
9.385 9.91

Ver Ejercicio No 1 ‐ Histograma (Aceleración de la  Consultar Lectura No 1 ‐ Procedimiento para 


Gravedad) crear un Histograma (Manual)
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad no Paramétricas


Histogramas de Frecuencia
Ejercicio No. 1: Construcción de Histogramas de Frecuencia (Solución)
Para crear un histograma de frecuencias, debemos agrupar convenientemente los datos, tal como se 
muestra en la siguiente tabla

No. Puntos en la Frecuencia Histograma de Frecuencia de Aceleración de Gravedad (m/s2)


Clase
Clase (Probabilidad)
9.1 - 9.4 5 0.15
9.4 - 9.7 10 0.29
9.7 – 10.0 7 0.21 0.30
10.0 – 10.3 7 0.21
0.25
10.3 – 10.6 3 0.09
10.6 – 10.9 2 0.06 0.20

0.15

0.10
No. de Clases (k)= 6
Ancho de Clases (A)= 0,270 0.05

0.00
9.1 - 9.4 9.4 - 9.7 9.7 – 10.0 10.0 – 10.3 – 10.6 –
10.3 10.6 10.9

Clases
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad no Paramétricas ‐ Ejercicio No 1 – Solución (cont.)


Histogramas Acumulados Directos

En ocasiones estamos interesados en contestar preguntas como:


¿Cuál es la probabilidad de que X tome un valor menor o igual a determinado valor?
Para contestar esta pregunta es conveniente organizar gráficamente la información en la forma de un
histograma acumulado directo.
Convenio de Notación
(X<xi) representa el evento la variable
Histograma Acumulado Directo de Aceleración de Gravedad (m/s2)
aleatoria X toma un valor menor o igual a
xi
Pr(X< xi) representa la probabilidad de que 1.00
0.90
X tome un valor menor o igual a xi 0.80
0.70
Frecuencia 0.60
No. Puntos en la
Clase Acumulada 0.50
Clase
Directa 0.40
9.1 - 9.4 5 0.15 0.30
9.4 - 9.7 15 0.44 0.20
9.7 – 10.0 22 0.65 0.10
0.00
10.0 – 10.3 29 0.85
9.1 - 9.4 9.4 - 9.7 9.7 – 10.0 10.0 – 10.3 – 10.6 –
10.3 – 10.6 32 0.94
10.3 10.6 10.9
10.6 – 10.9 34 1.00
Clases
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad no Paramétricas ‐ Ejercicio No  1 – Solución (cont.)


Histogramas Acumulados Directos

Del histograma acumulado directo construido para la variable aleatoria “aceleración de gravedad” 
podemos inferir entre otras cosas, lo siguiente:

p(g  10.6 )=1=100%

p(g  10.3 )=0.94

p(g > 10.3 )=1-0.94=0.06 La probabilidad de que la aceleración de gravedad


tome valores menores o iguales de 10.6 es de
100%

La probabilidad de que la aceleración de gravedad


tome valores menores o iguales de 10.3 es de 94%

La probabilidad de que la aceleración de gravedad


tome valores mayores a 10.3 es de 6%).
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad no Paramétricas - Ejercicio No 1 – Solución (cont.)


Histogramas Acumulados Inversos
En ocasiones estamos interesados en contestar preguntas como
¿Cuál es la probabilidad de que X tome un valor mayor o igual a determinado valor?
Para contestar esta pregunta es conveniente organizar gráficamente la información en la forma de un
histograma acumulado inverso.

Histograma Acumulado Inverso de Aceleración de Gravedad (m/s2) Convenio de Notación


(X>xi) representa el evento la variable
1.00
aleatoria X toma un valor mayor o igual a
0.90 xi
0.80
0.70 Pr(X> xi) representa la probabilidad de que
0.60
0.50
X tome un valor mayor o igual a xi
0.40
0.30 Frecuencia
No. Puntos en la
0.20 Clase Acumulada
0.10
Clase
Inversa
0.00 9.1 - 9.4 34 1.00
9.1 - 9.4 9.4 - 9.7 9.7 – 10.0 10.0 – 10.3 – 10.6 – 9.4 - 9.7 29 0.85
10.3 10.6 10.9 9.7 – 10.0 19 0.56
10.0 – 10.3 12 0.35
Clases
10.3 – 10.6 5 0.15
10.6 – 10.9 2 0.06
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad no Paramétricas - Ejercicio No 1 – Solución (cont.)


Histogramas Acumulados Inversos

Del histograma acumulado inverso construido para la variable aleatoria “porosidad” podemos
inferir entre otras cosas, lo siguiente:

p(g  9.1 )=1=100%

p(g  9.4 )=0.85


La probabilidad de que la aceleración de gravedad tome
p(g < 9.4 )=1-0.85=0.15 valores mayores o iguales de 9.1 es de 100%).

La probabilidad de que la aceleración de gravedad tome


valores mayores o iguales de 9.4 es de 85%

Probabilidad de que la aceleración de gravedad tome valores


menores a 9.4 es de 15%
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Lectura No. 2
Procedimiento para crear un 
Histograma 
(Usando Excel)
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad de la Muestra ‐ Histogramas de Frecuencia
Ejercicio No 2: La tabla anexa contiene una muestra de 100 valores de tiempos correspondientes
a una de las actividades rutinarias en la secuencia operacional de perforación de un pozo.
Actividad: Correr Casing de 13. 3/8" y posterior a su bajada a fondo, cementación.

Para los datos suministrados, se solicita:


1.‐ Construya los histogramas de frecuencia y
acumulado de los datos de la muestra utilizando
funciones de Excel.

2.‐ Para la muestra dada, usando las funciones de 
estadística de “Excel”, calcular:

• Media de la Muestra
• Desviación Estándar de la Muestra
• Percentiles 60 y 80

Consultar Lectura No 2 ‐ Procedimiento para crear un Histograma 
(Usando Excel)

Ver Ejercicio No 2 ‐ Histogramas (Act Perforacion)
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad de la Muestra ‐ Estadísticas

Media: La media o valor esperado, Desviación Estándar: (σ) Es una medida de


expresa básicamente la tendencia central centralización o dispersión para variables de razón y de
o posición de la distribución. La media no intervalo, de gran utilidad en la estadística descriptiva.

1
es necesariamente el valor de mayor

n
s

xi
X

.
2
 
probabilidad de ocurrencia (como suele
 


n
1
interpretarse de manera errónea); la   

i
1
media es “el centro de gravedad” de una   
distribución.
Desviación Estándar Muestral
Es una medida de dispersión de una distribución de
1 n
X =  xi probabilidad y puede considerarse una de la
n i 1 característica más importante de la misma, ya que en
ella está retratada la información sobre la incertidumbre
Promedio o Media Muestral
de la variable random en estudio. En otras palabras, la
dispersión es un indicativo de la incertidumbre
relacionada con la variable; por ello, al cuantificar la
dispersión se está cuantificando el nivel de incertidumbre
de la variable en análisis.
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad de la Muestra ‐ Estadísticas

Percentil: Se conoce como percentil “α” de una distribución de probabilidades,


al valor de la variable aleatoria denotado como “P” para el cual la probabilidad
acumulada es “α” ; es decir, existe “%α” de probabilidades de que los valores de
la variable aleatoria X sean menores o iguales a Xα.
.

Percentil 70 (0.7)
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Lectura No. 3
Procedimiento para obtener las 
Estadísticas de una Muestra con 
Excel
Estadística de la Muestra
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad de la Muestra ‐ Estadísticas

Ejercicio No 3: La tabla anexa contiene


una muestra de 100 valores del tiempos
correspondientes a las actividades de
mantenimiento de las Bombas Centrifugas,
Modelo OH‐1 de la Refinería ubicada en el
oriente del país.

Para los datos suministrados, obtener las


estadísticas asociadas a la muestra
utilizando “Excel”

Consultar Lectura No 3 ‐ Procedimiento para obtener las 
Estadísticas de una Muestra con Excel

Ver Ejercicio No 3 ‐ Histogramas (Act. Mantenimiento Bombas)
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo 
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción

Influencia del Tamaño de


la Muestra en el Cálculo de
las Estadísticas
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo 
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción

Influencia del Tamaño de Muestra en el cálculo de probabilidad “p”


Ejercicio N.‐ 4

Con ambas muestras se


obtiene el mismo estimado
para la probabilidad de
fracaso “p=0.1”

A pesar de obtener el mismo


resultado, consideramos que
la estimación de la
probabilidad hecha con la
fracasos : k  1 muestra 2 tiene mayor
trials : n  10 “confianza” porque la
1 muestra es mas grande
p  prob .fracaso   0 .1
10

fracasos : k  3
trials : n  30
3
p  prob .fracaso   0 .1
30
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo 
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción

Influencia del Tamaño de Muestra en el cálculo de probabilidad “p”


Ejercicio No 4
k
En el ejemplo anterior, se estimó la probabilidad “p” como: p 
n
Donde : p: Probabilidad de Fracaso o “Abandono del Pozo”
k: No de fracasos en la historia o muestra de perforaciones analizadas
n: No de perforaciones consideradas en la muestra

Sin embargo, esto es solo un “estimado puntual”. El verdadero valor de “p” se encuentra en el
rango
1 k 1
p 
pLOW  p  pHIGHT  1
n  k 1
k (F2 k ,2 ( n k 1 ),1 )
n 1 nk
k  1(F2 ( k 1 ),2 ( n k ), )
2 2

El “ancho o incertidumbre” de este rango depende del tamaño de la muestra analizada y del grado
de confianza que se le dará a la estimación.
Estimado “Optimista” Estimado “Mas Probable” Estimado “Pesimista”
1 1
pLOW  k pHIGT 
1
n  k 1 p 1
nk
k (F2 k ,2 ( n k 1 ),1 ) n k  1(F2 ( k 1),2 ( n k ), )
2 2
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo 
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción

Lectura No. 4
Estimación Intervalos Parámetros 
Binomial – Software RARE
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo 
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción

Influencia del Tamaño de Muestra en el cálculo de probabilidad “p”


Ejercicio No 4
En conclusión. el análisis de las muestras 1 y 2 de éxitos y fracasos en perforación nos permite estimar para
el parámetro “probabilidad de fracaso” lo siguiente:
Muestra 1 Muestra 2
Estos rangos
pueden obtenerse Número de Número de
k 1 k 3
con distintos grados Fracasos Fracasos
de confianza Número de Número de
n 10 n 30
Intetentos Intetentos
Estimado Estimado Estimado Estimado Estimado Estimado
Grado de
"Optimista" "Mas Probable" "Pesimista" "Optimista" "Mas Probable" "Pesimista"
Confianza
p LOW p p HIGT p LOW p p HIGT

80% 0.0105 0.1000 0.3370 0.0373 0.1000 0.2090

90% 0.0051 0.1000 0.3940 0.0279 0.1000 0.2390

99% 0.0005 0.1000 0.5440 0.0011 0.1000 0.3200

NOTA: Estos resultados se obtubieron


Ver Ejercicio No.4  Incertidumbre en Parámetros ‐ p.xls con la herramienta RARE.xls, en la
sección de “Interval Estimation”
Ver Lectura No 4.‐ Estimación Intervalos Parámetros Binomial ‐ RARE
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo 
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad de la Muestra
Influencia del Tamaño de la Muestra en el cálculo de las estadísticas 

Media o Promedio
La Media () (promedio, average, valor esperado o esperanza matemática) es posiblemente el parámetro o
estadística mas conocida, y la mas utilizada como “valor estimado de una variable”.
1 n
Tradicionalmente, la media para una variable aleatoria X, se calcula como  = X =  xi
n i 1

Donde: Xi: Valores de la muestra de la variable aleatoria X y n: tamaño de la muestra

Sin embargo, esto es solo un “estimado puntual”. El verdadero valor de “” se encuentra en el rango
X
Z1

X
Z1
   
 n

n
    
L
O
W

H
I
G
H
T

2
 

El “ancho o incertidumbre” de este rango depende del tamaño de la muestra analizada y del grado de
confianza que se le dará a la estimación.
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo 
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción

Lectura No. 5
Estimación del Intervalo de 
Confianza para la  
Media (µ) de una muestra, 
apoyados en la Herramienta RARE
Influencia del Tamaño de la Muestra en el
Análisis Probabilístico de Riesgo 
Cálculo de las Estadísticas
en Proyectos de Exploración y Producción

Influencia del Tamaño de Muestra - Incertidumbre de Estadísticas – Media o Promedio


Ejercicio No 5: A continuación se suministran los valores de temperatura (ºF) registrados en los
Hornos de una planta de manejo de crudo. El primer set de datos corresponde al Horno A, sin
embargo, un equipo de ingenieros se dedicó ampliar la información con los datos del Horno B y
lograron enriquecer el primer set de datos, obteniendo el set de datos No. 2.

Para las muestras observadas en las tablas anexas, y utilizando la herramienta RARE.xls, estimar los intervalos y el valor más
probable para la “Temperatura (ºF)” para los niveles de confianza de 80, 90 y 99%.

Ver Ejercicio No.5 Incertidumbre en Parámetros ‐ media.xls Lectura No. 5: Estimación Intervalos Parámetros ‐ Media – RARE. doc


Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Estadística de la Población
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMÉTRICAS”
Una distribución de probabilidad paramétrica tambien conocida como curva de
probabilidades, es una función matemática teórica, que describe la forma en que se
espera que varíen los probables valores de una variable random (aleatoria), es decir, una
función matemática que relaciona los diversos probables valores que puede tomar una
variable random con la probabilidad de ocurrencia de cada uno de ellos.

f(x) Distribución Parametrica Estadísticas Variable Aleatoria


2 Media 68.53
1 x 
  
1 2   Error típico 1.31
f ( x)  .e
 2 Mediana
Moda
67.45
66.34
Desviación estándar 13.06
Varianza de la muestra 170.54
Curtosis 0.00
Coeficiente de asimetría 0.46
Rango 60.60
Mínimo 41.62
Máximo 102.22
x x
Estadística de la Población

Distribuciones de Probabilidad “PARAMÉTRICAS”


Distribución de probabilidad Distribución de probabilidad
acumulada directa - F(X) acumulada inversa - C(X)
1
1.0
1
C(xi)

F( x ) 0.5

C(x)=1-F(x)
F(xi)
0 0
0
8 9 10 11 12 X
8 x 12 xi
i x
Variable Aleatoria

INTERPRETACIÓN: INTERPRETACIÓN:

PROBABILIDAD DE OBSERVAR EL VALOR xi PROBABILIDAD DE OBSERVAR  VALORES  ≥ xi

Al igual que para las distribuciones no paramétricas, existen dos formatos para cada
distribución paramétrica
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS” ‐ Estadísticas
XM =MODA (valor de la variable con
mayor probabilidad de ocurrencia)
f(x)
=MEDIA (medida de la tendencia
central, o valor esperado
de la variable)

 =Desviacion estandar
(Medida de la dispersion incertidumbre
asociada a la variable)

XM  X
XL=5% XU=95%
LIMITE LIMITE
INFERIOR 90 % INTERVALO DE SUPERIOR
Pr(X< XL)=0.05 CONFIANZA Pr(X< XU)=0.95
Pr(L<X<U)=0.9
Una distribución se caracteriza por:
• El valor central o medida de posición (la media, la mediana o la moda).
• Una cantidad que expresa el grado de dispersión (la desviación estándar).
• La forma de la curva, es decir la forma general de la distribución probabilística
Estadística de la Población

Distribuciones de Probabilidad “PARAMETRICAS”.


Medidas de Posición (media, moda y mediana)

f(x) f(x)

  xm  x50% X xm X
Media x50%
 Media
Moda
Moda Mediana
Mediana
Estadística de la Población

Distribuciones de Probabilidad “PARAMETRICAS”.


Medidas de Posición (media, moda y mediana)

Media, Esperanza Matemática o Valor Esperado: La media o valor esperado es una idea
fundamental en el estudio de las distribuciones de probabilidad que expresa
básicamente la tendencia central o posición de la distribución. La media no es
necesariamente el valor de mayor probabilidad de ocurrencia (como suele interpretarse
de manera errónea); la media es “el centro de gravedad” de una distribución.

Moda: La Moda, es también una medida que indica la tendencia central de una
distribución. Formalmente se define como el valor xm de la variable aleatoria X, que
tiene la mayor probabilidad de ocurrencia.

Mediana: La Mediana, es otra de las medidas o valores indicativos de la tendencia


central de una distribución. Formalmente se define a la “Mediana” como el valor “x50%”
que tiene una probabilidad acumulada de 50%. En otras palabras, la mediana es un
valor de la variable aleatoria, de manera tal, que el 50% de los probables valores de “X”
serán menores o iguales de dicho valor y el otro 50% serán mayores.
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS”. 
Medidas de Dispersión‐ Desviación Estándar
f(x)

La medida de dispersión más útil



es la desviación estándar (σ), la
cual se corresponde a la raíz
cuadrada de la varianza (Var(x)).

0   X 1
68%  
 2
1.645  1.645      ( x   ) . f ( x ) dx 
2

90%   
1.967  1.967 
95%
3.00  3.00 
99.7%
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS”.
Percentiles Estadísticos

F(x)
1 Si “” es percentil de la distribución de
probabilidad, el valor de la variable aleatoria
denotada como X o P para las cuales la
probabilidad acumulada es “” , se puede decir
F(x)


que hay % de probabilidad de que la los valores
de la variable aleatoria X sean menores o iguales a
0 X. x
x X 

f(x)  f ( x ) dx  

f(x) El perceptil 50 (P50 o X50%) se conoce como la
mediana de la distribución.

x X
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS”. 
Intervalo de Confidencia.
f(x)

El intervalo de confianza es aquel en el cual se


puede decir que se encuentra el valor real con
cierto grado de confidencia.

f(xa) Mientras más amplia sea la distancia entre los
f(xb) limites del intervalo, la probabilidad de que el valor
real se encuentre dentro del intervalo es mayor, lo
xa  xb X
cual aumenta el rango de variación.
/2 Intervalo de
CONFIDENCE 
/2
F(x) Confianza
INTERVAL
Los valores de “xa” y “xb” representan los limites
de confianza; la probabilidad “” representa el
F(xb) grado de confianza o probabilidad de que le valor
real de la variable “X” se encuentre en el intervalo
 entre “xa” y “xb” .

F(xa)
xa xb X
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS”. 
Coeficiente de Asimetria
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor
del punto central (Media aritmética). La asimetría presenta tres estados diferentes, cada uno
de los cuales define de forma concisa como están distribuidos los datos respecto al eje de
asimetría.

La asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de
la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma
cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando
la mayor cantidad de datos se aglomeran en los valores menores que la media
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS”. 
Coeficiente de Asimetria

Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores, () la media
de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuación se interpretan:
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la
parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la
parte derecha de la media.
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma
cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a
tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS”. 
Curtosis
Esta medida determina el grado de concentración que presentan los valores en la región
central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si
existe una gran concentración de valores (Leptocúrtica), una concentración normal
(Mesocúrtica) ó una baja concentración (Platicúrtica).
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS”. 
Curtosis

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, () la media
de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula se
interpretan:
(g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante
difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los
valores cercanos (± 0.5 aprox.).

(g2 > 0) la distribución es Leptocúrtica
(g2 < 0) la distribución es Platicúrtica
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS”
Modelos Paramétricos de uso común

Distribución Normal
Distribución Lognormal
Distribución  Binomial
Distribución Exponencial
Variables Variables Distribución de Poisson
Aleatorias Distribución de Weibull Aleatorias
Continuas Discretas Dist. Hipergonométrica
Distribución Beta
Distribución Geométrica
Distribución Gamma
Distribución Triangular
Distribución Uniforme
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS” – Parámetros
Parámetro 1 Parámetro 2

Media:
Desviación estándar:
1 n
   xi   1  n

      xi     
2
Normal n i 1
  n  1  i 1 

Desviación estándar
Media Logarítmica: logarítmica:
1 n
t   lnxi 
n i 1
  1  n
 t      ln xi   t 2  

Log-Normal
  n  i 1 

Escala: Forma:
n
n. xi  x
2

n  1  x i 
n 2

Gamma
   i 1   i 1
n
n  1 xi
n
n 2  x i   x 
2

i 1 i 1

Tasa   :
1
Exponencial   n
N.A
x i 1
i

Escala: Forma:

x  lnx 
1 n
 n
 
  x i  i i
1 n
lnxi 
Weibull 1
   i 1   
i 1
 n  n

x
n i1
  i
  i 1
Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Distribuciones de Probabilidad “PARAMETRICAS” ‐ Modelos Matemáticos
Distribución f(t): Distribución de F(t): Distribución C(t)=1-F(t): Distribución
Frecuencia Relativa Acumulada Directa Acumulada Inversa

Exponencial f (t )  e  t F (t )  1  e  t C ( t )  e  t

  t  
 1       t     t  
t             
Weibull
f (t )  e F (t )  1  e
    
C (t )  e
    

t
t  1
t
 1
t 
Gamma f (t )   e  F (t )    t  1
e 
dt C (t )  1  F (t )
      0

2
  1  t    
2
1 t   
1    1  e 2   dt
Normal f (t )  e 2   F (t )   C (t )  1  F (t )
 2  2  
 

1  ln( t )   t 
2

  
Log- Normal f (t ) 
1
e
2 t 
 F (t )   f (t )dt C (t )  1  F (t )
 t t 2 0
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

De la Estadística de la
Muestra a la de la Población
Muestras Grandes > 14 Datos

Caracterización probabilística de la muestra o 
“¿Cómo seleccionar el modelo de distribución de 
probabilidad para una muestra dada? ”
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

De la estadística de la muestra a la de la población

Estadística de la Muestra Estadística de la Población

f(x) Histogramas de Frecuencias f(x) Distribución Parametrica


Distribución No Paramétrica Distribución Paramétrica
2
1 x  
  
1 2  
f (x)  .e
 2
Frecuencias
Frequencies

x x

1 n
Media de la Muestra X =  xi
n i 1
Media de la Población   x.f ( x )dx

1
1  n
2   

.  x i  X   .
2
Muestra SD s Población SD     ( x   )2 .f ( x )dx 
n  1  i 1    
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

De la estadística de la muestra a la de la población – MUESTRAS GRANDES 
Caracterización probabilística de la muestra o “¿Cómo seleccionar el modelo de 
distribución de probabilidad para una muestra dada? ”

Procedimiento General
Paso 1: Construir el Histograma de Frecuencia Acumulada de la Muestra
Paso 2: Plantear hipótesis de las distribuciones paramétricas que podrían hacer un buen
ajuste con los datos.
Paso 3: Calcular los parámetros de cada una de las distribuciones hipótesis con los datos de
la muestra.
Paso 4: Graficar sobre el Histograma de Frecuencia Acumulada de la muestra, las Curvas de
Probabilidad Acumuladas Directas, de cada una de las hipótesis establecidas en el Paso 2
Paso 5: Realizar alguna de las Pruebas de Bondad de Ajuste.
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Sugerencias para Plantear “Hipótesis” sobre Modelos de Probabilidad que puedan 
hacer un buen ajuste sobre los datos de una Muestra
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Caracterización probabilística de la muestra o “¿Cómo seleccionar el modelo de 
distribución de probabilidad para una muestra dada? ”
8

f 7

F 1( X ,1 , 2 ) Fm ( X ,  1 ,  2 ) F 2( X ,1 , 2 )
6

Muestra
1

x
F(x)
0

F 1
2
0.8

X1 0.6 1
0.4

X2
0.2
8
0
0.064-0.086 0.086-0.108 0.108-0.13 0.13-0.152 0.152-0.174 0.174-0.196 0.196-0.218 0.218-0.24
x
6
X3
4

X4 Establecer Distribución de 
2
Probabilidad  “Hipótesis”
. 0
0.064-0.086 0.086-0.108 0.108-0.13 0.13- 0.152 0.152-0.174 0.174- 0.196 0.196- 0.218 0.218- 0.24 X
.
Test de Bondad de Ajuste
. f1 ( x,1 , 2 )
Hipótesis 1
Xn F1 ( x,1 , 2 )
n= número de f2 ( x,1 , 2 )
datos de la Hipótesis 2 F 2( X ,1 , 2 )
muestra o F2 ( x,1 , 2 )
“tamaño de
muestra” fm ( x,  1 ,  2 ) Es el mejor ajuste para los
Hipótesis m
Fm ( x,  1 ,  2 ) Datos de la Muestra
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Caracterización Probabilística de Variables desde los datos de la Muestra 


Test de Bondad de Ajuste
Estas pruebas consideran las siguientes
Test de Chi Cuadrado
etapas:
.158 Hipótesis
(Modelo 
Matemático) Valor del Test Etapa 1: Graficar cada una de las curvas
.119 de las distribuciones hipótesis teóricas, con
el histograma de los datos de la muestra.
.079 Histograma 
de los datos
Etapa 2: Calcular para cada distribución
hipótesis el valor llamado “valor del test” y
.040
compararlo contra el valor llamado “valor
.000
critico”.
4 8 12 15
Etapa 3: Si el valor del test es menor que
Test de Kolmogorov-Smirnov / Anderson Darlin
el valor crítico entonces la distribución
hipotética se considera un buen ajuste y la
1.00
hipótesis no es rechazada. Si por el
contrario, el valor del test es mayor que el
.750
valor crítico, la hipótesis se rechaza.
.50 Para cada Nivel de Confianza (α),existe un 
Valor del Test Valor Crítico 
.25
Si  el Valor  del Test < Valor Crítico
.00 La Hipótesis es aceptada, de lo contrario se 
4 8 12 15 rechaza
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Lectura No. 6
Procedimiento para caracterizar 
variables apoyados en Crystal Ball 
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

De la estadística de la muestra a la de la población – MUESTRAS GRANDES 
Ejercicio No 6
La tabla que se muestra a continuación, muestra los valores de “Vibración Radial”
medidos durante 02 años en un Compresor Centrifugo de Gas Natural. Utilizando el
software Crystall Ball, caracterice en forma probabilística la variable en estudio
encontrando la distribución paramétrica que mejor represente los datos.

1.‐ Represente estos datos con la


distribución en su forma de
frecuencia relativa y en su forma
acumulada
2.‐ Calcule los percentiles 10, 50 y
90 de la variable, usando las
funciones de Crystal Ball en Excel.

Consultar Lectura No 6. Procedimiento para caracterizar variables apoyados en Crystal Ball.

Ver Ejercicio No 6 ‐ Caracterización Probabilística de Variables con Crystal Ball
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

De la Opinión de Expertos
a la Estadística de la
Población

“¿Cómo representar una variable aleatoria cuando la 
evidencia  muestral es nula o demasiado pequeña y el 
conocimiento sobre la variable aleatoria recide en la 
mente de los expertos? ”
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Caracterización Probabilística de las Variables a partir de la Opinión de Expertos
La opinión de expertos representa una de las fuentes fundamentales de información para
cálculos en ingeniería y es particularmente útil cuando se trata de análisis de riesgo.

Los expertos poseen valiosísima información sobre las variables y su incertidumbre


normalmente sustentada en la observación y experiencia con procesos similares.

El procedimiento para aprovechar la opinión de expertos como fuente de información


puede dividirse en dos áreas:

1.‐ Técnicas Matemáticas para Modelar la Opinión; lo que implica el uso de


Distribuciones de Probabilidad como BetaPert, LogNormal, Triangular y Uniforme
para modelar la opinión.

2.‐ Técnicas de Entrevistas del Experto o Grupo de Expertos, tales como el “Método
de Delphi”, que permite obtener la opinión de expertos, documentarla y reducir su
subjetividad.
De la Opinión de Expertos a la Estadística de la Población

Caracterización Probabilística de las Variables (Físicas y de Tiempo) a partir de la 
Opinión de Expertos f(X
) )
0,45

Caso 1: Distribución BetaPert: La opinión 0,4


0,35

del experto viene expresada en tres 0,3


0,25

valores; un mínimo (Xmin), un valor mas 0,2


0,15

probable (Xmprob) y un máximo (Xmax). 0,1


0,05
0
0,1190 0,1390 0,1590 0,1790 0,1990 0,2190 0,236

Xmin Xmas probable Xmax

EXPERTO

Caso 2: Distribución LogNormal: La 0.00400

0.00350

opinión del experto viene expresada en dos 0.00300

0.00250
Probability
valores; un mínimo (Xmin) y un máximo 0.00200

0.00150
(Xmax). El experto expresa que debe haber 0.00100

un valor mas probable pero no puede 0.00050

0.00000

estimarlo.
0 0.1 0.2 0.3 0.4 0.5 0.6

X 5%  X MIN X
X 95%  X MAX

EXPERTO
De la Opinión de Expertos a la Estadística de la Población

Caracterización Probabilística de las Variables (Costos) a partir de la Opinión de 
Expertos f(x)

Caso 3: Distribución Triangular: La opinión


del experto viene expresada en tres
valores; un mínimo (Xmin), un valor mas
probable (Xmprob) y un máximo (Xmax). xmin xmprob. xmax X

f(x)
EXPERTO

Caso 4: Distribución Uniforme: La opinión


del experto viene expresada en dos
valores; un mínimo (Xmin) y un máximo
(Xmax).
xmin a b xmax X

EXPERTO
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Lectura No. 7
Procedimiento para Opinión de 
Expertos con Crystal Ball ‐ BetaPert
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Caracterización Probabilística de las Variables a partir de la Opinión de Expertos
Ejercicio No 7  ‐ Parte I
En la siguiente tabla se presentan los estimados realizados por expertos de Geociencias de los
probables valores para la variable “Espesor Neto (h) o Arena Neta Petrolífera (ANP)”.
Nótese que estimación del Área, está dada por tres valores (Un máximo, un mínimo y un más
probable)
Con esta información conteste las siguientes preguntas:
1.‐ Que distribución de probabilidades puede usarse para representar dicha variable. Justifique su
selección

Consultar Lectura No 7 ‐ Procedimiento para Opinión de Expertos con Crystal Ball ‐ BetaPert 

Ver Ejercicio No 7 ‐ Parte I ‐ Opinión de Expertos .xls


De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Lectura No. 8
Procedimiento para Opinión de 
Expertos con Crystal Ball‐ LogNormal
De la Opinión de Expertos a la Estadística de la Población
Análisis Probabilístico de Riesgo 
en Proyectos de Exploración y Producción

Caracterización Probabilística de las Variables a partir de la Opinión de Expertos
Ejemplo No 7  ‐ Parte II
Después de un análisis del comportamiento de producción de el yacimiento del Campo XRM, el Ing. de
Yacimientos a cargo expresa su estimación sobre la declinación del mencionado yacimiento tal como
se muestra en la tabla siguiente:

Factor de  Mínimo 0.12275


Declinación 
Yacimiento  Máximo 0.3826

Nótese que estimación del Área, está dada por dos valores (un máximo y un mínimo). Con esta
información conteste las siguientes preguntas:
1.‐ Que distribución de probabilidades puede usarse para representar dicha variable. Justifique su
selección

Consultar Lectura No 8 ‐ Procedimiento para Opinión de Expertos con Crystal Ball‐ LogNormal

Ver Ejercicio No 7‐ Parte II‐ Opinión de Expertos xls


De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
Muestra Pequeñas
en Proyectos de Exploración y Producción

De la Estadística de la
Muestra a la de la Población
Muestras Pequeñas < 15 datos

Caracterización probabilística de la muestra o 
“¿Cómo seleccionar el modelo de distribución de 
probabilidad para una muestra dada? ”
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
Muestra Pequeñas
en Proyectos de Exploración y Producción

De la estadística de la muestra a la de la población – MUESTRAS PEQUEÑAS
Tamaño de Muestra entre 6 y 15 datos – OPCIÓN 1
Paso 1: Determine el Valor Mínimo de los datos de la muestra.

Paso 2: Determine el Valor Máximo de los datos de la muestra.

Paso 3: Utilizando las facilidades de Excel explicadas en la Lectura No 2, construya un histograma de


frecuencias relativas con los datos de la muestra y determine a partir del gráfico, el Valor Moda o Valor
Mas Probable

Paso 4: Con los tres valores previamente calculados, construya una Distribución BetaPert
Pasos 1 y 2 Paso 3 Paso 4
Muestra Datos 7

Pozos Muestra % Declinacion 6 Histograma Declinación


Pozo 1 17.30%
5
Pozo 2 15.80%
4
Pozo 3 17.00%
Pozo 4 14.20% 3
Pozo 5 10.70% Valor Mínimo
2
Pozo 6 20.70%
1
Pozo 7 19.50%
Pozo 8 25.20% 0
Pozo 9 46.90% Valor Máximo 10.70% 22.77% 34.83% y mayor...

Pozo 10 27.70%
Valor Mas Probable o Moda
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
Muestra Pequeñas
en Proyectos de Exploración y Producción

De la estadística de la muestra a la de la población – MUESTRAS PEQUEÑAS
Tamaño de Muestra entre 6 y 15 datos – OPCIÓN 2
Paso 1: A partir de los datos de la muestra; y utilizando la función PERCENTIL de Excel calcule los
Percentiles 5% y 95% (P5% y P95%)

Paso 2: Con los dos valores previamente calculados, construya una Distribución LogNormal

Vecinos % Declinacion
Pozo 1 17.30%
Pozo 2 15.80%
Pozo 3 17.00%
Pozo 4 14.20%
Pozo 5 10.70%
Pozo 6 20.70%
Pozo 7 19.50%
Pozo 8 25.20%
Pozo 9 46.90%
Pozo 10 27.70%

P5%=PERCENTIL(K15 :K24,0.05)=0.12275

P95%=PERCENTIL(K15 :K24,0.95)=0.3826
De la Estadística de la Muestra a la Estadística de la Población
Análisis Probabilístico de Riesgo 
Muestra Pequeñas
en Proyectos de Exploración y Producción

De la estadística de la muestra a la de la población – MUESTRAS PEQUEÑAS
Tamaño de Muestra entre 6 y 15 datos.
Ejercicio No 8.
Después de un análisis del comportamiento del Sistema de Generación Eléctrica, se han registrado en
los últimos 10 años los siguientes valores de Disponibilidad.

1.‐ Qué distribución de probabilidades


puede usarse para representar dicha
variable? Emplee las dos opciones de
caracterización para muestras
pequeñas. Finalmente justifique su
selección.

Ver Ejercicio No 8 ‐ Caracterización de Variables 
(Muestra Pequeñas).xls
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Simulación de Montecarlo
en Proyectos de Exploración y Producción

Operaciones con
Variables Aleatorias
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Simulación de Montecarlo
en Proyectos de Exploración y Producción

Operaciones con Variables Aleatorias
Variables de Entrada Modelo Variable de Salida
(Información) (Información) (Variable de decisión)

A
0,15 0,15 0,15 0,15 0,15

B ,083

0,76 0,78 0,80 0,82 0,85


,062
E
(A+B+C)
E = ,041

D ,021

C ,000
50.680,17 54.456,64 58.233,11 62.009,58 65.786,05
18,50 19,25 20,00 20,75 21,50
1,000

,750
E
D ,500

0,92 0,93 0,95 0,96 0,98 ,250

,000
50.000,00 54.375,00 58.750,00 63.125,00 67.500,00

ETAPA 1: ETAPA 2: ETAPA 3:


CUANTIFICACION DE LA INCERTIDUMBRE PROPAGACION DE LA CUANTIFICACION DE LA INCERTIDUMBRE
ASOCIADA A LAS VARIABLES DE ENTRADA O INCERTIDUMBRE ASOCIADA A ASOCIADA A LA VARIABLE DE SALIDA O
CARACTERIZACION PROBABILISTICA DE LAS CADA VARIABLE EN EL MODELO RESULTADO, O CARACTERIZACION
VARIABLES DE ENTRADA MATEMATICO. PROBABILISTIA DEL RESULTADO
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Simulación de Montecarlo
en Proyectos de Exploración y Producción

Operaciones con Variables Random - Propagación de Incertidumbre


Variables de Entrada Modelo Variable de Salida
(Información) (Información) (Variable de decisión)

A
0,15 0,15 0,15 0,15 0,15

B ,083

0,76 0,78 0,80 0,82 0,85


,062
E
(A+B+C)
E = ,041

D ,021

C ,000
50.680,17 54.456,64 58.233,11 62.009,58 65.786,05
18,50 19,25 20,00 20,75 21,50

D
0,92 0,93 0,95 0,96 0,98

SOLUCIÓN NUMÉRICA SOLUCIÓN ANALÍTICA

Método de Simulación de Método de los Momentos


Montecarlo (Serie de Taylor)
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Simulación de Montecarlo
en Proyectos de Exploración y Producción

Operaciones con Variables Random – Simulación de Montecarlo


Fijar  el número de  iteraciones  requeridas = m
j=1

Generar  aleatoriamente,  un valor de  cada variable,  desde  sus  respectivas  distribuciones de  probabilidad

f(X 1) f(X 2) f(X n)

X1 X2 X3
0,15 0,15 0,15 0,15 0,15 18,50 19,25 20,00 20,75 21,50
-1,29 1,71 4,71 7,70 10,70 -1,29 1,71 4,71 7,70 10,70 0,76
-1,29 0,78
1,71 0,80
4,71 0,82
7,70 0,85
10,70

X 1j X 2j X nj

Sustituir en la  función “g” ,el conjunto de  valores  generados  aleatoriamente y  resolver en forma


determinística  para obtener  un  probable valor de Y  para esta  iteración
Y j  g ( X 1 j , X 2 j , X 3 j ,.., X nj )

Registrar y  almacenar  el resultado Y j.

Si
j < m ? j = j+1

f(Y)
No
Con  los “m” valores  calculados de Y (desde Y 1 hasta Y m ),  construir  un histograma de  frecuencias
y realizar  prueba de  bondad de  ajuste  para definir la distribución probabilística  que  mejor ajusta

0,00 20,00 40,00 60,00 80,00


Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Simulación de Montecarlo
en Proyectos de Exploración y Producción

Lectura No. 9
Procedimiento para efectuar 
Operaciones con Variables Random 
apoyados en Crystal Ball
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Simulación de Montecarlo
en Proyectos de Exploración y Producción

Operaciones con Variables Aleatorias – Ejercicio No 9.
Se propone realizar un Mantenimiento y el equipo de ingenieros necesita estimar el tiempo total de la actividad, con
la finalidad de optimizar la programación de recursos.
Suponga que para realizar este nivel de mantenimiento se realizan tres actividades básicas (Act.1,Act.2,Act.3). En las
siguientes tablas se presentan los tiempos para cada una de las actividades, a partir de dos fuentes de información,
datos históricos de pozos de estructura similar y opinión de expertos.

Act.1 Act.2
Con esta información conteste las siguientes preguntas:
12,805 Mínimo 4 1.‐ Cuál es la probabilidad que el mantenimiento se complete antes
11,603 Mas Probable 10
12,634 Máximo 17 de 30 días.
10,243
6,572 2.‐ Si tuviese que suministrar sus estimados sobre el “Tiempo para
Act.3
15,218 realizar un Mantenimiento, cual sería su respuesta . Justifíquela
14,397 Mínimo 2
17,782 Mas Probable 8
25,959 Máximo 32
19,044
19,926
19,311
19,578
18,365
9,778
15,345
11,222
18,483
14,091 Consultar Lectura No 9  ‐ Procedimiento para efectuar Operaciones con Variables Random apoyados en Crystal Ball 
11,778
Ver Ejercicio No 9– Operación con Variables Aleatorias (Tiempo Actividad).xls 
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Simulación de Montecarlo
en Proyectos de Exploración y Producción

Operaciones con Variables Aleatorias – Ejercicio No 10.‐ Planteamiento del Problema


De la población total de actividades en la secuencia de Reparación Mayor de un Pozo, asumiremos que las
actividades que conformarán la reparación son las listadas a continuación:
1.‐ Deslizar (D)
2.‐ Control de Pozo (CP)
3.‐ Recuperar Aparejo de Producción (RAP)
4.‐ Perforar (P)
5.‐ Escarrear Tubería y Rimar Boca de Liner (ETRB)
6.‐ Estimulación (E)
En las tablas de la página siguiente, se muestran los datos recopilados en bitácoras de perforación de pozos similares
estructuralmente, geológicamente equivalentes y de aproximadamente la misma profundidad, sobre la duración en
horas de las actividades de la secuencia de reparación previamente descrita
Basado en el listado de actividades y el set de datos en horas asociado a la duración de cada una de ellas, se solicita
1.‐ Definir la Distribución de Probabilidad que mejor describe a cada una de las actividades.
2.‐ Definir la Distribución de Probabilidad que representa la variable Random "Tiempo Total de la Actividad de
Reparación".
3.‐ Si usted es el responsable de suministrar a la alta Administración el estimado de la variable Tiempo Total de la
Actividad de Reparación, cual sería su respuesta?
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Simulación de Montecarlo
en Proyectos de Exploración y Producción

Operaciones con Variables Aleatorias – Ejercicio No 10 – Datos


D (hrs) CP (hrs) RAP (hrs) P (hrs) ETRB (hrs) E (hrs)
13 28 22 82.5 44 72
20 47 49 66.5 21 37
8 40 21 57 33.5 20.5
24 27.5 36 118.5 30 46
12 65 22 58 17 153
11.5 23.5 21 172 39 122
21 112.5 81 51 18 18
5.5 59.5 28.5 154.5 20.5 28
13.5 17.5 37.5 167 19 158
5.5 33.5 88.5 68 36 43.5
9.5 24 34.5 304 28.5 31.5
10 61 154.5 184 38 47.5
12 20 22.5 186.5 86 116.5
29.5 66.5 181.5 83 77.5 25
14.5 10 33 166 142.5
29 39 35.5 105.5
11.5 83 42 10
10 52 26 40.5
7 24 31.5 48
10 24.5 41 20.5
4 41.5 53 41
12 29 70 7.5
3 96 105.5 31.5
9 19.5 41.5 20
11.5 87 50 28.5
3 12 74 22.5
19 51 74.5 8.5
22.5 19 71.5 23
9 85 52 70
57 42 59.5 48.5
9 56 163 10
11 53 42 44.5
11.5 35 47 5.5
15 56 22.5 90
44 95.5 58.5 7
13 43.5 27.5
21 53 83
26 110.5 46.5
14 158 94.5
8 83 30.5
9 46 89
32 46.5
34 62.5
95.5 41
105 110.5
27 47
38.5 99
Ver Ejercicio No 10 ‐ Operación con Variables (Tiempos Perforación).xls 
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción

Correlaciones
Probabilísticas
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción

Correlaciones Probabilísticas
Para detectar la posible existencia de correlación entre dos variables X y Y, se grafican los
valores de las muestras independientemente colectadas de ambas variables, para identificar
si existe algún tipo de tendencia.

Algunos ejemplos de correlaciones entre variables que la experiencia ha permitido detectar


son los siguientes

• Costo de la Energía e Inflación (Correlación Positiva)


• Precio del Producto y Volumen de Ventas (Correlación Negativa)
• Altura y Peso de los habitantes en USA (Correlación Positiva)
• Permeabilidad y Porosidad en un Yacimiento (Correlación Positiva)
Variables Positivamente Variables Negativamente Variables No Correlacionadas o
Correlacionadas Correlacionadas Independientes

2500 1,5 2500

2000 1,4 2000

1500 1,3 1500


Y

Y
Y

1000 1,2 1000

500 1,1 500

0 1 0
15 20 25 30 35 40 0 500 1000 1500 2000 2500 0 200 400 600 800 1000 1200 1400
X X X
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción

Correlaciones Probabilísticas
Factor de Correlación: La intensidad de la dependencia probabilística se mide con un indicador estadístico
conocido como “Factor de Correlación, cuyos valores varían entre ‐1 y 1.

La correlación entre variables que son débiles no afecta el resultado del modelo de simulación, más aún
moderadas y altas correlaciones pueden producir un error significante si este no es considerado
explícitamente en el modelo de simulación.
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción

Operaciones con Variables Aleatorias – Dependencia Probabilísticas


Efecto de la Simulación de Montecarlo.
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción

Lectura No. 10
Procedimiento para estimar Factor 
de Correlación entre Variables 
apoyados Crystal Ball
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Correlaciones Probabilísticas
en Proyectos de Exploración y Producción

Operaciones con Variables Aleatorias – Correlaciones Probabilísticas
Ejercicio No. 11: Estimación del Factor de Correlación entre Variables

Estimar el factor de correlación entre


Porosidad y Saturación de Agua,
utilizando los datos mostrados a
continuación:

Ver Lectura No 10 ‐ Procedimiento para estimar Factor de Correlación 
entre Variables apoyados Crystal Ball

Ver Ejercicio No 11 ‐ Correlación Porosidad ‐ Saturación


Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Análisis de Sensibilidad
en Proyectos de Exploración y Producción

Análisis de Sensibilidad
Operaciones con Variables Aleatorias Módulo2:
Análisis Probabilístico de Riesgo 
Análisis de SensibilidadGerencia de la Incertidumbre
en Proyectos de Exploración y Producción

Análisis de Sensibilidad
El análisis de sensibilidad permite cuantificar la contribución relativa de cada una de las variables
aleatorias de entrada a un modelo, a la dispersión o varianza del resultado o variable de salida del
modelo. Obviamente es un procedimiento que debe realizarse después de haber completado la
propagación de incertidumbre ya sea por el Método de los Momentos o por Simulación de Montecarlo.

Este análisis es de vital importancia para “gerenciar la incertidumbre” ya que permite identificar las
variables de entrada al modelo en las que debe centrarse la atención y tomar las acciones necesarias
(compra de información, toma de datos, análisis causa raíz, etc) para mejorar el nivel de conocimiento
sobre las mismas, (de ser técnicamente factible y económicamente rentable), porque solo así se logrará
reducir la incertidumbre de la variable de salida.

Variables Sensibles del


Identificar Proceso

Centrar Variables Críticas


Atención

Tomar Técnicamente Factibles


Decisiones
Económicamente
Rentables
Operaciones con Variables Aleatorias Módulo2:
Análisis Probabilístico de Riesgo 
Análisis de SensibilidadGerencia de la Incertidumbre
en Proyectos de Exploración y Producción

Análisis de Sensibilidad  ‐ Contribución a la Varianza

% Contribución a la Varianza de
“Y”

X1

X3

X2

Xn

0% 20% 40% 60% 80% 100


%

αxi = Contribución de la Variable Random Xi a la 


Varianza de Y 
Operaciones con Variables Aleatorias Módulo2:
Análisis Probabilístico de Riesgo 
Análisis de SensibilidadGerencia de la Incertidumbre
en Proyectos de Exploración y Producción

Análisis de Sensibilidad ‐ Diagrama de Tornado Clásico o de una Variable a la Vez
Para su construcción la variación de los datos se
realiza individualmente, es decir, se analiza la
sensibilidad de la salida debido a la variación de una
variable a la vez, asumiendo que todos las demás TORNADO POES

permanecen sin alteración alguna. 0,0000 20,0000 40,0000 60,0000 80,0000

ANP (Pies) 26,5085 88,9662


Se determina un valor referencia de la variable de
salida, evaluando la ecuación que la relaciona con
A (Acres) 411,2372 550,0000
las variables de entrada para los valores “medios”
de estas (valor referencial).
Sw 0,3365 0,1157

Partiendo de este valor referencia, se hace variar a


Porosidad 0,1983 0,2380
la vez una de las variables de entrada desde un
valor mínimo que puede corresponder a su Bo 1,0950 1,0550
Downside
Upside
percentil 10 (P10) hasta un valor máximo que
puede seleccionarse como su percentil 90 (P90), y POES MONTECARLO Input

se determina qué tanto se incrementa o decrece el Variable


ANP (Pies)
Downside Upside Range Downside Upside Base Case
11,1652 37,4718 26,3066 26,5085 88,9662 80,9077
valor de la variable de salida de su valor referencial. A (Acres)
Sw
38,1425 51,0129 12,8703 411,2372 550,0000 367,4109
42,4786 31,8726 10,6060 0,1157 0,3365 0,2906
Porosidad 30,6530 36,7792 6,1261 0,1983 0,2380 0,2205
Bo 34,1889 32,9400 1,2489 1,0550 1,0950 1,0584
Este procedimiento se repite para cada una de las
variables de entrada.
Operaciones con Variables Aleatorias Módulo2:
Análisis Probabilístico de Riesgo 
Análisis de SensibilidadGerencia de la Incertidumbre
en Proyectos de Exploración y Producción

Análisis de Sensibilidad – Gráfico de Araña
El Gráfico de Araña, es una herramienta muy útil que representa exactamente los mismos
resultados del Diagrama de Tornado, pero empleando una representación gráfica
diferente.

Curvas con pendientes


pronunciadas quieren
decir que tienen una alta
influencia sobre la
variable de salida.

Curvas casi horizontales


que indican el poco efecto
que tienen sobre la
variable de salida
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Análisis de Sensibilidad
en Proyectos de Exploración y Producción

Lectura No. 11
Pozo Probabilista  ‐ Qo y Perfil 
de Producción

Lectura No 12 
Simulación de Montecarlo y 
Análisis de Sensibilidad ‐ Qo
Operaciones con Variables Aleatorias
Análisis Probabilístico de Riesgo 
Análisis de Sensibilidad
en Proyectos de Exploración y Producción

Ejercicio No. 12: Estimación (Pronóstico) de la Producción Inicial de un Pozo, Perfil 
de Producción y Análisis de Sensibilidad
Con base en los datos que se plantean en el Ejercicio No 12 y siguiendo las Lecturas No 11 y 12 se
plantea:

 Parte 1: Estimar la Producción Inicial del Pozo.

Parte 2: Estimar el Perfil de Producción del nuevo Pozo para un período de 10 años.

Parte 3: Generar los diferentes análisis de sensibilidad de la variable Qo.

Ecuación de Darcy

Ver Ejercicio No 12 ‐ Pozo Probabilista ‐ Qo y Perfil.xls 

Lectura No.11: Pozo Probabilista  ‐ Qo y Perfil de Producción Ver Lectura No 12 ‐ Simulación de Montecarlo y Análisis de Sensibilidad ‐ Qo

También podría gustarte