Está en la página 1de 18

TECNOLÓGICO NACIONAL DE MÉXICO.

CAMPUS: CERRO AZUL.


INGENIERÍA PETROLERA.
PROBABILIDAD Y ESTADÍSTICA APLICADA AL CAMPO PETROLERO.

DOCENTE:
INGENIERO. JUAN VILLANUEVA ESPINOZA.
PRESENTA:
TORIBIO MATEO ERNESTO
MARTINEZ BRADLEY JORGE ENRIQUE
FELICIANO GENCHI ZULEMA
MENDEZ SANTIAGO NICOLAS.
ACTIVIDAD:
INVESTIGACION DE LA UNIDAD 4: ESTIMACION DE PARAMETROS.

CERRO AZUL, VERACRUZ. 19/11/2021.


Estimación de parámetros

Definición técnica:
La estimación de parámetros es un método que consiste en asignar un valor al
parámetro o al conjunto de parámetros que caracterizan el campo sujeto a estudio.
La fórmula matemática que lo determina se denomina estimador.
Al ser una estimación existe cierto error. Incluso, aunque el estimador tenga todas
las propiedades óptimas. Por pequeño que sea, siempre existirá un error.
Así pues, para obtener estimaciones adaptadas a esa realidad, se crean intervalos
de confianza. Es decir, rangos entre los que están esos valores estimados con cierto
grado de confianza. El grado de confianza (fiabilidad) se puede modificar. Cuando
mayor sea el grado de confianza, más grande será el intervalo. Eso sí, cuanto
menos error tenga la estimación inicial, más acotado será el intervalo de confianza.
Ejemplo estimación de parámetros
Queremos información sobre el resultado de las elecciones generales e intentar
predecir qué porcentaje de votos tendrá cada partido político. Tras utilizar las
técnicas pertinentes se extraen los siguientes resultados:
Partido A: 32%
Partido B: 51%
Partido C: 17%
Sin embargo, somos conscientes, de que es una estimación. Así pues, utilizando
las fórmulas adecuadas, establecemos los intervalos de confianza al 95%.
Partido A: [30 – 34]%
Partido B: [47 – 53]%
Partido C: [15-19]%
Tras los resultados obtenidos se puede interpretar que existe un 95% de
probabilidades de que el resultado de los partidos políticos estén en ese rango. Aun
así, existe un 5% de probabilidades de que los resultados estén fuere de ese rango.

INTERVALO DE CONFIANZA PARA LA MEDIA

Un intervalo de confianza es una técnica de estimación utilizada en inferencia


estadística que permite acotar un par o varios pares de valores, dentro de los cuales
se encontrará la estimación puntual buscada (con una determinada probabilidad)
Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una
media muestral (uno superior y otro inferior). Estos valores van a acotar
un rango dentro del cual, con una determinada probabilidad, se va a localizar el
parámetro poblacional.

Intervalo de confianza = media +- margen de error

Conocer el verdadero poblacional, por lo general, suele ser algo muy complicado.
Pensemos en una población de 4 millones de personas. ¿Podríamos saber el gasto
medio en consumo por hogar de esa población? En principio sí. Simplemente
tendríamos que hacer una encuesta entre todos los hogares y calcular la media. Sin
embargo, seguir ese proceso sería tremendamente laborioso y complicaría bastante
el estudio.

Ante situaciones así, se hace más factible seleccionar una muestra estadística. Por
ejemplo, 500 personas. Y sobre dicha muestra, calcular la media. Aunque
seguiríamos sin saber el verdadero valor poblacional, podríamos suponer que este
se va a situar cerca del valor muestral. A esa media le sumamos el margen de error
y tenemos un valor del intervalo de confianza. Por otro lado, le restamos a la media
ese margen de error y tendremos otro valor. Entre esos dos valores estará la media
poblacional.
En conclusión, el intervalo de confianza no sirve para dar una estimación puntual
del parámetro poblacional, si nos va a servir para hacernos una idea aproximada de
cuál podría ser el verdadero de este. Nos permite acotar entre dos valores en dónde
se encontrará la media de la población.

coeficiente de variación
Frecuencia acumulada
Factores de los que depende un intervalo de confianza

El cálculo de un intervalo de confianza depende principalmente de los siguientes


factores:

 Tamaño de la muestra seleccionada: Dependiendo de la cantidad de datos que se


hayan utilizado para calcular el valor muestral, este se acercará más o menos al
verdadero parámetro poblacional.
 Nivel de confianza: Nos va a informar en qué porcentaje de casos nuestra
estimación acierta. Los niveles habituales son el 95% y el 99%.
 Margen de error de nuestra estimación: Este se denomina como alfa y nos informa
de la probabilidad que existe de que el valor poblacional esté fuera de nuestro
intervalo.
 Lo estimado en la muestra (media, varianza, diferencia de medias…): De esto va a
depender el estadístico pivote para el cálculo del intervalo.

Ejemplo de intervalo de confianza para la media, asumiendo normalidad y conocida


la desviación típica

El estadístico pivote utilizado para el cálculo sería el siguiente:

El intervalo resultante sería el siguiente:


Vemos como en el intervalo a la izquierda y derecha de la desigualdad tenemos la
cota inferior y superior respectivamente. Por tanto la expresión nos dice, que la
probabilidad de que la media poblacional se sitúe entre esos valores es de 1-alfa
(nivel de confianza).

Veamos mejor lo anterior con un ejercicio resuelto a modo de ejemplo.

Se desea estimar la media del tiempo que un corredor emplea para completar una
maratón. Para ello se han cronometrado 10 maratones y se ha obtenido una media
de 4 horas con una desviación típica de 33 minutos (0,55 horas). Se desea obtener
un intervalo al 95% de confianza.

Para obtener el intervalo, no tendríamos más que sustituir los datos en la fórmula
del intervalo.

El intervalo de confianza, sería la parte de la distribución que queda sombreada en


azul. Los 2 valores acotados por este serían los correspondientes a las 2 líneas de
color rojo. La línea central que parte la distribución en 2 sería el verdadero valor
poblacional.

Es importante resaltar que en este caso, dado que la función de densidad de la


distribución N(0,1) nos da la probabilidad acumulada (desde la izquierda hasta el
valor crítico), tenemos que encontrar el valor que nos deja a la izquierda 0,975%
(este es 1,96).

INTERVALOS DE CONFIANZA PARA LA VARIANZA.


Intervalo de confianza para la media en una población normal con varianza
conocida

El intervalo de confianza para la media de una variable continua con el valor de la


varianza de dicha variable conocida en toda la población es el intervalo menos
usual.

Para estimar la media poblacional μ de una población Normal de


media μ (desconocida) y de varianza σ2 (conocida), N(μ,σ2), se selecciona una
muestra aleatoria X1,X2,⋯,Xn; de tamaño n de valores de una variable aleatoria de
esta población y se calcula su media muestral, como mejor estimador puntual de μ.
La construcción del intervalo de confianza se hace tomando como base este
estimador. Para calcular un intervalo de confianza para μ partimos de la variable
aleatoria
Z=X¯¯¯¯−μσ/n−−√

Expresión 1: Expresión de la variable aleatoria

que sigue una distribución normal de media 0 y desviación típica 1. Buscamos los
cuantiles de esta distribución tales que

P[–z1−α/2≤X¯¯¯¯−μσ/n−−√≤z1−α/2]=1−α
Expresión 2: Obtención del cuantil z{1 – α/2}

O, equivalentemente,

P[X¯¯¯¯–z1−α/2σn−−√≤μ≤X¯¯¯¯+z1−α/2σn−−√]=1−α
Expresión 3: Obtención del cuantil z{1 – α/2}

Por lo tanto, el intervalo de confianza que debemos calcular es

[X¯¯¯¯–z1−α/2σn−−√,X¯¯¯¯+z1−α/2σn−−√]

Expresión 4: Intervalo de confianza (varianza conocida)


Nota: R no incluye una función específica para el cálculo de intervalos de confianza
en este tipo de situaciones. Aun así, pueden calcularse de una forma muy sencilla
como se muestra en el siguiente ejemplo.
Supuesto Práctico 1
Con el fin de estudiar el número medio de flexiones continuadas que pueden
realizar los alumnos, un profesor de educación física somete a 75 de ellos,
elegidos aleatoriamente, a una prueba. El número de flexiones realizado por
cada alumno, así como su sexo y si realizan o no deporte se muestran en el
fichero Flexiones.txt.
Se sabe que el número de flexiones se distribuye según una Normal de
varianza poblacional 7.5. ¿Determinar el intervalo de confianza a un nivel de
confianza del 95% para el número medio de flexiones?
Solución
En primer lugar debemos importar, en R, los datos que contienen el número de
flexiones realizadas por cada alumno. Para ello, utilizamos la orden read.table
> datos <- read.table(“F:/Flexiones.txt”, header = TRUE)
> datos
Flexiones Sexo Deporte
1 60 H 0
2 41 H 0
3 53 M 1
4 53 M 0
5 41 H 0
6 56 H 0
7 50 H 0
8 53 M 1
9 50 M 1
10 48 M 0
……………………………
A continuación, introducimos en R los datos relativos al nivel de significación y la
varianza poblacional de la variable que proporciona el enunciado.
> alpha<- 0.05
> varianza <- 7.5
Calculamos por separado cada uno de los elementos restantes que necesitamos
para obtener el intervalo de confianza.
> n <- nrow(datos)
> media <- mean(datos$Flexiones)
>cuantil<- qnorm(1 – alpha/2)
Por último, calculamos los extremos inferior y superior del intervalo de acuerdo a
la expresión que se vio anteriormente:

Por tanto:

>lim_inf<-media – cuantil * sqrt(varianza) / sqrt(n)


>lim_inf
[1] 49.48687
>lim_sup<- media + cuantil * sqrt(varianza) / sqrt(n)
>lim_sup
[1] 50.72646
Por lo que el intervalo de confianza que buscamos es (49.48687, 50.72646).
Intervalo de confianza para la media en una población normal con varianza
desconocida

Supongamos, en este caso, que la varianza poblacional de la variable de interés es


desconocida. Nuestro objetivo sigue siendo el cálculo de un intervalo de confianza
para la media de dicha variable.

Supongamos una muestra aleatoria X1,X2,⋯,Xn; de tamaño n de valores de la


variable aleatoria que sigue una distribución Normal de media μ y de varianza σ2,
ambas desconocidas. Para calcular un intervalo de confianza, en este caso,
partimos de la variable aleatoria
T=X¯¯¯¯−μs/n−−√

Expresión 5: Expresión de la variable aleatoria

que sigue una distribución t de Student con n−1 grados de libertad. En la fórmula
anterior, s hace referencia a la cuasidesviación típica muestral.

Tenemos que buscar dos valores de esta distribución tales que

P[–t1−α/2≤X¯¯¯¯−μs/n−−√≤t1−α/2]=1−α
Expresión 6: Obtención del cuantil t1−α/2

Al operar algebraicamente, se obtiene que

P[X¯¯¯¯–t1−α/2sn−−√≤μ≤X¯¯¯¯+t1−α/2sn−−√]=1−α
Expresión 7: Obtención del cuantil t1−α/2
por lo que el intervalo de confianza que buscamos es
[X¯¯¯¯–t1−α/2sn−−√,X¯¯¯¯+t1−α/2sn−−√]

Expresión 8: Expresión del Intervalo de confianza (varianza desconocida)

La función de R t.test calcula intervalos de confianza en este contexto. Esta función


también se utiliza para resolver contrastes de hipótesis, como veremos en la
práctica 6. La sintaxis de la función t.test es la siguiente:
t.test(x, conf.level = 0.95)

donde

 x: Vector numérico con los valores de la variables de interés


 conf.level: Valor numérico que indica el nivel de confianza, en tanto por uno, al que
se construirá el intervalo. Si omitimos este parámetro en la llamada a la función, los
intervalos de confianza se calculan a un nivel de confianza del 95%.
Intervalos de confianza de proporciones
En poblaciones dicotómicas con una proporción de éxitos el estimador puntual
del parámetro es la proporción muestral
de éxitos, p, que coincide con la media de la muestra cuando se codifica como 1 la
característica que se considera como éxito y 0 la que se considera no éxito. A
partir de un tamaño muestral moderadamente grande el estadístico p tiene una
distribución aproximadamente normal. El intervalo de confianza para la proporción
poblacional está centrado en la proporción muestral; siendo sus límites superior e

inferior donde z /2 es el valor crítico correspondiente al grado

de confianza 1- de la distribución normal tipificada y es el error típico


de la proporción.

Para obtener el intervalo de confianza y contrastar hipótesis sobre la proporción


una alternativa consiste en tratar a la proporción como la media poblacional de
una variable dicotómica codificada como se ha descrito anteriormente (éxito=1, no
éxito=0) y la secuencia es:

 Para el intervalo de confianza:

Analizar

Estadísticos Descriptivos

Explorar

 Para contrastar la hipótesis nula

Analizar

Comparar medias

Prueba T para una muestra

Utilizando este criterio los resultados numéricos no coinciden exactamente con los
que se obtendrían aplicando la expresión del error típico de la proporción; no
obstante la discrepancia es despreciable si el número de observaciones es
suficientemente grande.
Otras alternativas para realizar este contraste son de naturaleza no paramétrica.

PRUEBA BINOMIAL

La prueba binomial prueba binomial analiza variables dicotómicas y compara las


frecuencias observadas en cada categoría con las que cabría esperar según una
distribución binomial de parámetro especificado en la hipótesis nula. El nivel de
significación crítico de esta prueba indica la probabilidad de obtener una
discrepancia igual o superior a la observada a partir de la muestra si la distribución
es la postulada por la hipótesis nula.

El nivel de significación crítico (bilateral) de este contraste debe interpretarse


como:

el número de éxitos en la muestra.

Cuando n es suficientemente grande se calcula esta probabilidad aproximando la


distribución binomial a la normal con corrección de continuidad.
Intervalo de confianza para la diferencia de
medias.

Uno de los dilemas que más trae de cabeza a los historiadores y antropólogos
es si existen diferencias físicas y psicológicas (inteligencia, fuerza, carácter… )
entre la gente de derechas y de izquierdas. Hoy vamos a traer algo de luz a este
tema, comparando las estaturas de famosos personajes históricos de izquierdas
y de derechas.
Calcular un intervalo de confianza, al 95 por ciento, para la diferencia de estaturas
medias, y razonar si alguno de los grupos puede considerarse más alto que el otro.

De derechas Estatura De izquierdas Estatura

Adolf Hitler 175 Boris Yeltsin 187

Rudolf Hess 175 Josif Stalin 168

Francisco Franco 163 Fidel Castro 191

Reinhard Heydrich 191 Nicolas Maduro 190

Benito Mussolini 169 Che Guevara 175

Donald Trump 188 Hugo Chavez 173

Joseph Goebbels 165 Lenin 165

Hermann Goering 178 Nikita Khruschev 160


De derechas Estatura De izquierdas Estatura

Heinrich Himmler 174 Leonid Bhreznev 173

Jordi Pujol 165 Gorbachov 175

Jose Maria Aznar 171 Pablo Iglesias 176

Silvio Berlusconi 171 Evo Morales 174

Solución:

Calcular el intervalo de confianza a mano es bastante tedioso (lo dice uno que lo
tuvo que hacer muchas veces), por culpa del valor ΔΔ que aparece en la
fórmula. Los afortunados hijos de la era digital tenéis la suerte de contar con R o
herramientas similares. Tan sencillo como poner los datos y una orden:
e1=c(175,175,163,191,169,188,165,178,174,165,171,171)
e2=c(187,168,191, 190,175,173,165,160,173,175,176,174)
t.test(e1,e2, conf.level=0.95)$conf.int
## [1] -9.566 5.899
## attr(,"conf.level")
## [1] 0.95

Este es el procedimiento para realizar un test de comparación de medias. Ahora


mismo nos interesa el intervalo de confianza, que es (−9.56,5.89)(−9.56,5.89).
Como podemos ver, el intervalo de confianza contiene al cero, o sea que hay
poca diferencia entre la estatura media de un grupo y otro. De todas formas,
para tomar una decisión más acertada, desde el punto de vista estadístico, es
mejor realizar un contraste de hipótesis.
Estimación de parámetros, (aplicación en la
explotación de hidrocarburos).
En la actualidad el control de los yacimientos de hidrocarburos está a la par con la
tecnología. La posibilidad de instalar dispositivos para la medición de variables de
fondo y superficie permiten la supervisión y control del pozo a nivel del cabezal,
identificar el aporte real del yacimiento a través del flujo de producción que proviene
de zonas especificas, el desplazamiento del flujo de producción al pozo y su estado
operacional de producción [Going, et al., 2006 ]. Ahora bien, la gran mayoría de
completaciones (tubería de pozo mas arreglo mecánico) tradicionales están
ausentes de equipos de supervisión de fondo, dando como resultado una cantidad
limitada de datos del yacimiento, debido a que el uso de dicha tecnología es
altamente costoso, como también su instalación requeriría la paralización de los
pozos activos, más los costo de mantenimiento y poca vida útil (menor a 5 años);
estas son algunas de las razones por la cual una gran cantidad de pozos no cuentan
con tecnología de medición de fondo. Por esta razón, en este trabajo se propone
estimar la Presión de Fondo (PfINF) utilizando técnicas de Inteligencia Artificial, ya
que han demostrado ser efectivas en procesos de automatización industrial, donde
el manejo del conocimiento o la toma de decisiones juegan un factor importante [T.
Yamakawa, 1992, Eikrem, et al., 2002, Takeshi, 2004]. Finalmente, la validación de
la estimación de la variable de fondo se realizará a través de un índice, el cual
consiste en calcular la diferencia entre la Presión de la Tubería de Producción
Medida (THPM) y la Presión de la Tubería de Producción Inferida (THPINF); si el
resultado es menor a un factor β indica que el valor de estimación de fondo es
correcto, razón por la cual se propone estimar esta segunda variable (THPINF), ya
que las estructuras de estimación son similares, y por otra parte, se dispone de la
tecnología de medición del THP a nivel de cabezal del pozo (por su costo de
implantación y cero impacto operacional en su instalación y mantenimiento).
Aplicación práctica en el campo “C” La cuantificación de reservas de hidrocarburos
de este caso práctico, comienza en la etapa inicial de explotación del campo,
cuando no se cuenta con información suficiente de los parámetros del yacimiento
que lo conforma, por lo que se realizan ciertas suposiciones, o se toma información
de yacimientos análogos, los cuales pudieran no reflejar la realidad del yacimiento
en estudio, pero que de alguna forma, dan una idea de las propiedades y
características que pudieran encontrarse. De esta forma, el caso práctico se enfoca
al desarrollo y explotación de las reservas de petróleo y gas asociado de un campo
de la costa del Golfo de México. El campo C, tiene un yacimiento terrestre de
naturaleza carbonatada y fracturada, cuyos sedimentos se depositaron en un
ambiente de rampa interna; su estructura geológica corresponde a un anticlinal en
dirección NW-SE, limitado por una falla inversa al noreste y por un domo salino al
suroeste; el yacimiento está ubicado en una de las partes más altas de la estructura
del Jurásico Superior Kimmeridgiano, (JSK). Información general del yacimiento
ARJ El campo C, cuenta con información de sísmica 3D, la cual comprende un área
de 100 km2 aproximadamente. En la Figura 1, se muestra una sección sísmica de
la estructura del campo y la distribución de sus fallas principales. A partir de la
interpretación de los atributos sísmicos, se definió la estructura y el modelo
estratigráfico presente, y de acuerdo a las mejores propiedades identificadas por los
geocientíficos, el pozo exploratorio se perforó al noroeste de la zona.
VALIDACIÓN DEL ANÁLISIS PVT

Las propiedades volumétricas del fluido son de suma importancia para los cálculos
de reservas de hidrocarburos; desafortunadamente, en ocasiones las muestras
recolectadas pueden no representar al fluido del yacimiento, motivo por el cual se
realizó la validación del experimento PVT, utilizando la técnica propuesta por
Bashbush (1981), ya que proporciona los lineamientos y recomendaciones (valores
K sin cruces, ni inflexiones, para un orden específico de los componentes en cada
decremento de presión del experimento de AVC), para validar y corregir, si fuera
necesario, los datos PVT en yacimientos que contienen fluidos composicionales.
Fuentes de información

Economipedia. (2021, 23 marzo). Página no encontrada. Recuperado 23 de noviembre de

2021, de https://economipedia.com/definiciones/intervalo-de-confianza.htm

https://economipedia.com/definiciones/estimacion-de-parametros.html

http://wpd.ugr.es/~bioestad/guia-de-r/practica-5/

http://www.ub.edu/aplica_infor/spss/cap4-4.htm

También podría gustarte