Está en la página 1de 13

METODOS PROBABILSTICOS

Los mtodos aplicados a continuacin se aplicarn a la seguridad de


sistemas, midiendo probabilidades de fallas de software y de hardware
en tiempos dados.

Procesos Estocsticos
En estadstica, y en concreto teora de la probabilidad, un proceso
aleatorio o proceso estocstico es un concepto matemtico que
sirve
para
caracterizar;
es
una
sucesin
de variables
aleatorias (estocsticas) que evolucionan en funcin de otra variable,
generalmente, el tiempo. Cada una de las variables aleatorias del
proceso tiene su propia funcin de distribucin de probabilidad y, entre
ellas, pueden estar correlacionadas o no.
Cada variable o conjunto de variables sometidas a influencias o
impactos aleatorios constituye un proceso estocstico

Distribucin de Poisson
Definicin:
Expresa la probabilidad de un nmero k de eventos ocurriendo en un
tiempo fijo si estos eventos ocurren con una frecuencia media conocida
y son independientes del tiempo discurrido desde el ltimo evento.
Frmula:

Donde es un parmetro positivo que representa la frecuencia


esperada del fenmeno modelado por la distribucin.
Ejemplo:
Si 2% de los libros encuadernados en cierto taller tiene encuadernacin
defectuosa, obtener la probabilidad de que 5 de 400 libros
encuadernados en este taller tengan encuadernaciones defectuosas
En este caso concreto, k es 5 y , , el valor esperado de libros
defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la probabilidad
deseada es

Variables Aleatorias

Una variable aleatoria es un valor numrico que corresponde al


resultado de un experimento aleatorio, como la suma de los puntos
obtenidos al lanzar dos dados, el nmero de lanzamientos de un dado
hasta que aparece el cuatro, el nmero de personas que suben en un
determinado ascensor al mes, el tiempo de espera en la sala de un
doctor.
Momentos de una Variable Aleatoria
Sea X es una variable aleatoria. El r-simo momento de X consiste en
obtener los valores esperados de X hasta de orden r:

En la teora de probabilidad y estadstica, una distribucin de


probabilidad identifica bien la probabilidad de cada valor de una
variable aleatoria no identificados (cuando la variable es discreta), o la
probabilidad de que el valor que corresponda a un determinado
intervalo (cuando la variable es continua). [1 ] La distribucin de
probabilidad describe el rango de valores posibles que una variable
aleatoria se puede alcanzar, y la probabilidad de que el valor de la
variable aleatoria dentro de un (medibles) subconjunto de ese rango.
Cuando la variable aleatoria toma valores en el conjunto de los
nmeros reales, la distribucin de probabilidad es completamente
descrito por la funcin de distribucin acumulada, cuyo valor en cada
real x es la probabilidad de que la variable aleatoria es menor o igual
que x.
El concepto de la distribucin de probabilidad y las variables aleatorias
que describen la base de la disciplina matemtica de la teora de la
probabilidad, y la ciencia de la estadstica. Hay dispersin o
variabilidad en el valor de casi todos los que se puede medir en una
poblacin (por ejemplo, la altura de las personas, la durabilidad de un

metal, etc), casi todas las mediciones se hacen con algn error
intrnseco, en muchos procesos de la fsica se describen de forma
probabilstica, de de las propiedades cinticas de gases a la
descripcin de la mecnica cuntica de las partculas fundamentales.
Por estas y muchas otras razones, nmeros simples son a menudo
inadecuados para describir una cantidad, mientras que las
distribuciones de probabilidad son a menudo ms apropiados.
Hay varias distribuciones de probabilidad que aparecen en diversas
aplicaciones. Uno de los ms importantes es la distribucin normal,
que es tambin conocida como la distribucin de Gauss o curva de
campana y se aproxima a muchas distribuciones diferentes de origen
natural. El lanzamiento de una moneda de rendimiento justo de
distribucin de otro familiar, donde los valores posibles son a cara o
cruz, cada uno con una probabilidad de 1 / 2.
Distribucion Exponencial
Distribucin de la vida exponencial (o modelo HPP) las pruebas
de
Pruebas exponencial son comunes en la industria para verificar que las
herramientas, sistemas o equipos cumplen con sus requisitos de
fiabilidad a tiempo medio entre fallos (MTBF). El supuesto es que el
sistema tiene una falla constante (o reparacin) tarifa, que es el
recproco de la MTBF. El tiempo de espera entre las fallas sigue el
modelo de distribucin exponencial.
Una situacin tpica prueba podra ser: una pieza compleja de equipo
nuevo o herramienta se instala en una fbrica y un estrecho
seguimiento por un perodo de varias semanas a varios meses. Si no
tiene ms que un pre-determinado nmero de fallos durante ese
perodo, el equipo "pasa" su prueba de aceptacin de la fiabilidad.
Este tipo de prueba de fiabilidad a menudo se denomina prueba de
aptitud o de un producto de aceptacin de prueba de confiabilidad
(PRAT). Sanciones contractuales puede ser invocada si el equipo no
supera la prueba. Todo est vinculado a una reunin de los clientes
MTBF requisito en un nivel de confianza especificado.

Cunto tiempo debe probar una pieza de equipo o un sistema


para asegurar un MTBF especificado a una confianza dado?

Se comienza con un objetivo determinado MTBF, m, y un nivel de


confianza, por ejemplo, 100 (1-alfa). Usted necesita una pieza ms
de informacin para determinar la longitud de la prueba: cuntos no
lo quiere permitir y an "pasar" el equipo? Cuanto ms no autorizados,
la ms larga es la prueba requerida. Sin embargo, un largo ensayo que
permite ms fallos tiene la caracterstica deseable de lo que es menos
probable que una buena pieza de equipo ser rechazado por suerte al
azar "malo" durante el perodo de prueba.
El procedimiento recomendado es para iterar sobre r = el nmero de
no admisibles, hasta un mayor r exigira una longitud de prueba
inaceptables. Para cualquier eleccin de r, la longitud de la prueba
correspondiente se calcular multiplicando rpidamente M (el objetivo)
por el factor en el siguiente cuadro correspondiente a la fila r-o
columna deseada y el nivel de confianza.
Por ejemplo, para confirmar un objetivo de 200 horas de MTBF de
confianza del 90%, lo que permite hasta 4 fallos en la prueba, la
duracin del ensayo debe ser de 200 7,99 = 1598 horas. Si este es
un tiempo excesivamente largo, trate de no permitir que slo el 3 por
un perodo de ensayo de 200 6,68 = 1336 horas. El ms corto de
prueba no permitira ninguna falla y el ltimo 200 2,3 = 460 horas.
Todas estas pruebas de garanta de 200 horas de MTBF de confianza
de 90%, cuando el equipo pasa. Sin embargo, la prueba ms cortos
son mucho menos "justo" para el proveedor en que tienen una gran
oportunidad de fallar un pedazo marginalmente aceptable de los
equipos.
Ejemplo 1:
Suponga que un sistema contiene cierto tipo de componente cuyos
tiempo de falla en aos est dada por T. La variable aleatoria T se
modela bien mediante la distribucin exponencial con tiempo medio
para la falla =5. Si se instalan cinco de estos componentes en
diferentes sistemas. Cul es la probabilidad de que al menos dos an
funcionen al final de ocho aos?
Solucin:
La probabilidad de que un componente dado an funcione despus de
ocho aos est dada por:

Distribucion Gamma
En la teora de probabilidad y estadstica, la distribucin gamma es una
familia de dos parmetros de las distribuciones de probabilidad
continua. Tiene un parmetro de escala y un parmetro de forma k.
Si k es un entero entonces la distribucin representa la suma de k
variables independientes de distribucin exponencial al azar, cada una
de ellas tiene una media de (que es equivalente a un parmetro de
tasa de -1).
La distribucin gamma es con frecuencia un modelo de probabilidad
para los tiempos de espera, por ejemplo, en las pruebas de la vida, el
tiempo de espera hasta que la muerte es una variable aleatoria que a
menudo se modela con una distribucin gamma [1]. Distribuciones
Gamma se ajustaban a las cantidades de lluvia de las tormentas
diferentes , y las diferencias en las cantidades de semillas y las
tormentas de preclasificacin se reflejan en las diferencias de k y los
parmetros estimados [2]
La frmula general para la funcin de densidad de probabilidad de la
distribucin gamma es de

Donde
es la forma del parametro, es la ubicacion del parametro,
es la escala del parametro, y
es la funcin gamma que tiene la
formula

El caso donde = 0 y = 1 se llama la distribucin gamma estndar.


La ecuacin para la distribucin gamma estndar se reduce a la

La siguiente es la trama de la funcin gamma de densidad de


probabilidad.

Distribucin Beta
En la teora de probabilidad y estadstica, la distribucin beta es una
familia de distribuciones de probabilidad continua definida en el
intervalo (0, 1) con parmetros de los dos parmetros forma positiva,
por lo general denota por y . Es el caso especial de la distribucin de
Dirichlet con slo dos parmetros. Dado que la distribucin de Dirichlet
es el conjugado antes de la distribucin multinomial, la distribucin
beta es el conjugado antes de la distribucin binomial. En la estadstica
bayesiana, puede ser visto como la distribucin posterior del
parmetro p de una distribucin binomial despus de observar - 1
eventos independientes con probabilidad p y - 1 con probabilidad 1 p, si la distribucin antes de p fue uniforme.
La frmula general para la funcin de densidad de probabilidad de la
distribucin beta

donde p y q son la forma de parmetros, A y B son los lmites inferior y


superior, respectivamente, de la distribucin, y B (p, q) es la funcin
beta. La funcin beta tiene la formula

El caso en que a = 0 y b = 1 se llama la distribucin beta estndar. La


ecuacin para la distribucin beta estndar es

Generalmente se define la forma general de una distribucin en


trminos de ubicacin y los parmetros de escala. La versin
beta es diferente en que se define la distribucin general en
trminos de los lmites inferior y superior. Sin embargo, la
ubicacin y los parmetros de escala pueden ser definidas en
trminos de los lmites inferior y superior de la siguiente manera:
ubicacin = a
escala = b a
La siguiente es la trama de la beta de la funcin de densidad de
probabilidad para los cuatro valores diferentes de la forma de
parmetros.

Mtodos probabilsticas para la deteccin de defectos en


software
a) Probabilidad Condicional
Las probabilidades estn conformadas por 3 axiomas bsicos

p(A), la probabilidad de la ocurrencia de un evento. A, es un


nmero entre 0 y 1;
p(A)=0 significa que A no se dar nunca, p(A)=1 significa que A se
dar ciertamente;
p(A or B) = p(A) + p(B) dado que A y B son distintos.
Sin embargo al referirnos a una probabilidad p(H) de un evento o
hiptesis estamos refirindonos a una probabilidad bastante
simplificada, ya que por lo general la probabilidad de un evento se
da en un contexto sensitivo es decir que la probabilidad de que se
de un evento o hiptesis tambin depende de otro
evento(evidencia) que esta en el mismo contexto y es su
condicional, por lo general esta probabilidad se denota as p(H|E) y
se lee la probabilidad de H dada la evidencia E.
Un avance significativo en la teora de probabilidades ha sido la
demostracin de una equivalencia formal entre la estructura de un
modelo grfico y las dependencias que son expresadas por una
distribucin de probabilidad numrica. En trminos numricos
podemos decir que el evento A es independiente del evento B si
observamos que B no influye en A lo cual hace que p(A|B) = p(A).
En trminos de grafos podemos indicar que A es independiente de B
si no hay una conexin o arista entre los nodos A y B.

b) Teorema de Bayes y los modelos grficos


El teorema de Bayes bsicamente se enfoca de un universo U a un
subconjunto B restringido que se mantiene, es decir que se enfoca
en una fraccin de eventos B para los que A es tambin verdad.

Este teorema es importante ya que muestra que podemos razonar


en ambos sentidos para obtener una probabilidad, es decir
podemos obtener probabilidades de las causas a efectos y de los
efectos a las causas

En trminos probabilsticos , dos variables X e Y son independientes


si p(X,Y) = p(X)p(Y) la distribucin de probabilidad sobre 2
variables factorizadas en 2 distribuciones independientes. Esto se
expresa en un grfico mediante la ausencia de una arista
expresando la influencia entre las 2 variables. Tambin se puede
agregar una tercera variable con lo cual se le da la siguiente
expresin de probabilidad p(X,Y | Z) = p(X | Z)p(Y | Z).

De modo similar, se puede descomponer la distribucin de


probabilidad asociadas con los nodos DD, TE y SQ tal que la
probabilidad p(DD, TE, SQ) = p(DD | TE,SQ)p(TE)p(SQ).
Esto nos da una serie de casos de ejemplos donde un grafo puede
admitir una simple factorizacin correspondiente a distribucin de
probabilidad. Si el grafo es dirigido y no hay ciclos en el grafo,
entonces esta propiedad es general.

c) Modelo Probabilstico para la prediccin de defectos


Los modelos probabilsticos son buenos candidatos para un modelo
efectivo de prediccin de defectos de software por las siguientes
razones:

Pueden modelar fcilmente la influencia entre las variables de un


dominio especfico.
El enfoque bayesiano permite la inferencia estadstica para ser ampliado
por expertos en aquellas reas de un dominio del problema en que los
datos empricos son escasos

Como resultado de lo anterior, es posible incluir las variables en un


modelo de fiabilidad del software que corresponden a proceso, as como
los atributos del producto

La asignacin de probabilidades a las predicciones de fiabilidad significa


que la toma de decisiones correcta utilizando la teora de los enfoques
clsicos puede ser apoyada.

d) Estructura de una red probabilstica


Los modelos probabilsticos son ejecutados usando la maquina de
inferencia probabilstica de Hugin, sin embargo el tamao y la
complejidad de la red no hizo posible la construccin de la red
usando directamente herramientas Hugin, sin embargo se pudo
usar Agena Ltd la cual consta de 2 metodos y herramientas que son
construidos en maquina de propagacin de Hugin.

La SERENE, que es un mtodo y herramienta la cual permite que


grandes redes sean construidas desde las mas pequenas en un
punto de vista modular,y las grandes tablas de probabilidad sean
construidas usando funciones matematicas predefinidas y
distribucin de probabilidad.

El IMPRESS, que es un mtodo y herramienta la cual extiende a


SERENE para permitir a los usuarios generar simplemente
distribuciones e probabilidad complejos.

e) Las Tablas de probabilidad


El trabajo en la construccin de modelos grficos de probabilidad se
factoriza en dos escenarios.

Escenarios Cualitativos: Consideran la relacin general entre las


variables de inters en trminos de relevancia de una variable a
otra en circunstancias especficas.
Escenarios Cuantitativos: Es la especificacin numrica de
parmetros de los modelos.

f) Conclusiones
Un modelo de probabilidad para de prediccin de defectos en
software puede no ser solamente usado para evaluar proyectos en
ejecucin, sino tambin puede ser usado para explorar posibles
efectos de un rango de actividades de mejora en los procesos de
software. Si los costos pueden ser asociados con mejora de
procesos, y beneficios evaluados para las mejoras previstas en la
calidad de software, entonces el modelo puede ser usado para
soportar la toma de decisiones para SPI(Software Process
Improvement).
Una desventaja de un modelo de confiabilidad de esta complejidad
es la cantidad de data que es necesario para soportar
estadsticamente estudios de validacin significativos.

También podría gustarte