Está en la página 1de 6

 Los Algoritmos Genéticos (AGs) son métodos adaptativos que pueden usarse para resolver problemas de búsqueda y

optimización. Están basados en el proceso genético de los organismos vivos.


 Aquellos individuos que tienen más éxito en sobrevivir y en atraer compañeros tienen mayor probabilidad de generar un
gran número de descendientes. Por el contrario individuos poco dotados producirán un menor número de descendientes
 Cuanto menor sea la adaptación de un individuo, menor será la probabilidad de que dicho individuo sea seleccionado
para la reproducción, y por tanto de que su material genético se propague en sucesivas generaciones.
 Pasos de los algoritmos genéticos
o Inicial la población
o Selección de la reproducción
o Cruza
o Mutación
o Selección de nueva población
o Repetir desde la selección de reproducción hasta la convergencia

 El gran campo de aplicación de los Algoritmos Genéticos se relaciona con aquellos problemas para los cuales no existen
técnicas especializadas. Incluso en el caso en que dichas técnicas existan, y funcionen bien, pueden efectuarse mejoras
de las mismas hibridándolas con los Algoritmos Genéticos.
 Se supone que los individuos (posibles soluciones del problema), pueden representarse como un conjunto de parámetros
(que denominaremos genes), los cuales agrupados forman una ristra de valores (a menudo referida como cromosoma).
Si bien el alfabeto utilizado para representar los individuos no debe necesariamente estar constituido por el f0; 1g, buena
parte de la teoría en la que se fundamentan los Algoritmos Genéticos utiliza dicho alfabeto.
 El conjunto de parámetros representando un cromosoma particular se denomina fenotipo. El fenotipo contiene la
información requerida para construir un organismo, el cual se refiere como genotipo.
 La función de adaptación debe ser diseñada para cada problema de manera específica. Dado un cromosoma particular,
la función de adaptación le asigna un número real, que se supone refleja el nivel de adaptación al problema del individuo
representado por el cromosoma.
 Durante la fase reproductiva se seleccionan los individuos de la población para cruzarse y producir descendientes, que
constituirán, una vez mutados, la siguiente generación de individuos. La selección de padres se efectúa al azar usando
un procedimiento que favorezca a los individuos mejor adaptados, ya que a cada individuo se le asigna una probabilidad
de ser seleccionado que es proporcional a su función de adaptación. Este procedimiento se dice que está basado en la
ruleta sesgada. Según dicho esquema, los individuos bien adaptados se escogerán probablemente varias veces por
generación, mientras que los pobremente adaptados al problema, no se escogerán más que de vez en cuando.
 Una vez seleccionados dos padres, sus cromosomas se combinan, utilizando habitualmente los operadores de cruce y
mutación.
 El operador de cruce, coge dos padres seleccionados y corta sus ristras de cromosomas en una posición escogida al
azar, para producir dos subristras iniciales y dos subristras finales. Después se intercambian las subristras finales,
produciéndose dos nuevos cromosomas completos. Ambos descendientes heredan genes de cada uno de los padres.
Este operador se conoce como operador de cruce basado en un punto. Habitualmente el operador de cruce no se aplica
a todos los pares de individuos que han sido seleccionados para emparejarse, sino que se aplica de manera aleatoria,
normalmente con una probabilidad comprendida entre 0.5 y 1.0. En el caso en que el operador de cruce no se aplique,
la descendencia se obtiene simplemente duplicando los padres.
 El operador de mutación se aplica a cada hijo de manera individual, y consiste en la alteración aleatoria (normalmente
con probabilidad pequeña) de cada gen componente del cromosoma. Si bien puede en principio pensarse que el
operador de cruce es más importante que el operador de mutación, ya que proporciona una exploración rápida del
espacio de búsqueda, este último asegura que ningún punto del espacio de búsqueda tenga probabilidad cero de ser
examinado, y es de capital importancia para asegurar la convergencia de los Algoritmos Genéticos.
 El concepto de convergencia está relacionado con la progresión hacia la uniformidad: un gen ha convergido cuando al
menos el 95 % de los individuos de la población comparten el mismo valor para dicho gen. Se dice que la población
converge cuando todos los genes han convergido. Se puede generalizar dicha definición al caso en que al menos un %
de los individuos de la población hayan convergido.
 Modelos de los algoritmos genéticos
o Modelo generacional:
 Durante cada iteración se crea una población completa con nuevos individuos. La población
reemplaza directamente a la antigua
o Modelo estacionario:
 Durante cada iteración se escogen dos padres de la población (diferentes mecanismos de muestreo)
y se les aplica los operadores genéticos. El/los descendiente/s reemplazan a uno/ dos cromosoma/s
de la población inicial. Este modelo es elitista, además produce una presión selectiva alta
(convergencia rápida) Cuando se reemplazan los peores cromosomas de la población.

 Optimización:
o El llevar a cabo una ACTIVIDAD tomando la mejor DECISIÓN en la magnitud de las variables con la finalidad
de maximizar el BENEFICIO o minimizar el COSTO se le llama optimización. Ya que la optimización es la
disciplina que se ocupa de la selección de valores en la variable que tiene un efecto directo sobre la tarea o
actividad y que conlleve a maximizar o minimizar el valor de la función matemática.
 Población
o Las poblaciones pueden ser de varios tipos pero las más usadas son:
 Representación binaria:
 La representación de un individuo se puede hacer mediante una codificación discreta y en
particular binaria.
 Representación real
 Una forma natural de codificar un asolucion es utilizando valores reales como
genes, los individuos se representan como vectores de valores reales.

 La función de evaluación asocia a un vector un valor real de evaluación.

 Selección
 En el operador Selección se hace una analogía entre la Evolución Biológica y los
Algoritmos Genéticos, en él, cada solución representa un individuo con características
propias y que es posible de evaluar, en donde sobreviven aquellos individuos mejor
evaluados y pasarán a las siguientes generaciones creando una nueva descendencia más
facultada
 CRUZA
 El cruce en un algoritmo genético es una operación que se realiza con el fin de tener
nuevas soluciones que utilicen la información de soluciones anteriores y explotar la

información ya generada en el proceso de optimización.


 Los operadores de cruce tratan de crear una generación de individuos
nuevos pidiendo información a sus padres.
 Unas vez seleccionado los padres sus cromosomas se combinan
utilizando los operadores de cruce y mutación.
 El operador de cruce toma dos padres seleccionados, corta sus
cadenas de cromosomas en una posición elegida al azar, para
producir dos subcadenas iniciales y dos subcadenas finales
 Después las subcadenas se intercambian produciéndose dos
cromosomas completos
 Ambos descendientes heredan genes de cada uno de los padres, a
este operador se conoce como operador de cruce basado en un punto
 El operador de cruce no se aplica a todos los pares de individuos, se
aplica de manera aleatoria con una probabilidad comprendida entre
0.5 y 1.0. en caso de que el operador de cruce no se aplique, la
descendencia se obtiene simplemente duplicando los padres

 Mutación
o La mutación en un algoritmo genético es una operación cuyo objetivo es generar nueva información
dentro de la población de soluciones para obtener una mejor exploración del espacio de búsqueda.
 Las mutaciones en promedio sueles ser beneficiosas pues contribuyen a la diversidad genetica
de la especie.
 El operador genetico de mutacion puede ser aplicado a algunos elementos o toda la población
de nuevos descendientes consiste en alterar aleatoriamente un gen en cromosoma
 Este operador asegura que ningún punto de espacio de búsqueda tenga una probabilidad de
0.
 Permite introducir información nueva que no llegase a presentar la población.
 Hasta este punto se tendrá una nueva población que continuara evolucionando a lo largo de
las nuevas generaciones de tal forma que su adaptación media podría ser extendida a todos
y cada uno de los individuos que conforman la población.
 Función objetivo
o Es aquella función que recibe valores numéricos de entrada y solo regresa un valor para cualquier
combinación de valores de entrada, el objetivo en este caso en encontrar sus máximos o mínimos de
dicha función
o Si la función no tiene cambios abruptos es fácil encontrar su optimo utilizando herramientas matemáticas
clásicas
o Sin embargo si dicha función tiene michos máximos o mínimos locales o si tienen una gran cantidad de
cambios y ni es claro donde se encuentren sus valores globales óptimos entonces es muy complicado
para los métodos clásicos encontrar el valor óptimo.
REDES BAYESIANAS

Las redes bayesianas (también conocidas como redes causales probabilísticas, redes causales, sistemas expertos
bayesianos, redes de creencia, sistemas expertos probabilísticas o diagramas de influencia) son herramientas estadísticas
que representan un conjunto de incertidumbres asociadas sobre la base de las relaciones de independencia condicional que
se establecen entre ellas.

Es un grafo acíclico dirigido en el que cada nodo representa una variable aleatoria que tiene asociada una función de
probabilidad condicional.

La estructura de la red bayesiana provee información sobre las relaciones de dependencia e independencia condicional
existentes entre las variables. Estas relaciones simplifican la representación de la función de probabilidad conjunta como el
producto de las funciones de probabilidad condicional de cada variable.

La topología o estructura de la red no sólo proporciona información sobre las dependencias probabilísticas entre las variables,
sino también sobre las independencias condicionales de una variable o conjunto de ellas dada otra u otras variables. Cada
variable es independiente de las variables que no son descendientes suyas en el grafo, dado el estado de sus variables padre.

Inferencia

El razonamiento probabilístico sobre las redes bayesianas consiste en propagar los efectos de las evidencias (variables
conocidas) a través de la red para conocer las probabilidades a posteriori de las variables desconocidas. De esta forma se
puede determinar un valor estimado para dichas variables en función de los valores de probabilidad obtenidos.

El mecanismo de inferencia sobre redes bayesianas permite utilizarlas para construir clasificadores. Para ello, se ha de
construir una red bayesiana en la que clase y atributos sean las variables interrelacionadas en el grafo. La clase corresponderá
a la variable desconocida, objetivo de la inferencia. Dada una instancia cualquiera para la que se conozcan todos sus atributos,
la clasificación se efectuará infiriendo sobre el grafo la probabilidad posterior de cada uno de los valores de la clase, y
seleccionando aquel valor que maximice dicha probabilidad.

Clasificadores bayesianos

Un clasificador es una función que asigna un valor de un atributo, llamado clase, a instancias o ejemplos descritos mediante
un conjunto de atributos. Cuando una red bayesiana se construye con la finalidad de predecir el valor de una
variable clase dada cualquier configuración en el resto de las variables, se tiene un "clasificador bayesiano".

Los clasificadores bayesianos son ampliamente utilizados debido a que presentan ciertas ventajas:
1) Generalmente, son fáciles de construir y de entender.
2) Las inducciones de estos clasificadores son extremadamente rápidas, requiriendo sólo un paso para hacerlo.
3) Es muy robusto considerando atributos irrelevantes.
4) Toma evidencia de muchos atributos para realizar la predicción final.

Un sistema experto puede ser utilizado como clasificador.

Un clasificador bayesiano que suele ser bastante preciso a pesar de su simplicidad es el "clasificador bayesiano simple" (del
inglés Naive Bayes classifier).

Aprendizaje de redes bayesianas

 Aprendizaje estructural: obtener la estructura de la red.


 Aprendizaje paramétrico: conocida la estructura del grafo, obtener las probabilidades correspondientes a cada
nodo.

Aprendizaje paramétrico

Datos completos

El aprendizaje de los parámetros es simple cuando todas las variables son completamente observables en el conjunto de
entrenamiento. El método más común es el llamado estimador de máxima verosimilitud, que consiste sencillamente en estimar
las probabilidades deseadas a partir de la frecuencia de los valores de los datos de entrenamiento, de forma análoga a como
se hace en Naive Bayes.

Datos incompletos

Aparecen mayores dificultades cuando los datos de entrenamiento no están completos. Pueden plantear se dos tipos de
información incompleta:

 Valores faltantes: faltan algunos valores de uno o varias variables en algunos ejemplos.
 Nodo oculto: faltan todos los valores de una variable.

El primer caso es más sencillo, y existen varias alternativas, entre ellas:

 Eliminar los ejemplos con valores ausentes.


 Considerar un nuevo valor adicional para la variable: "desconocido".
 Considerar el valor más probable a partir de los datos de la misma en las demás instancias.
 Considerar el valor más probable en base a las demás variables.

Las dos primeras opciones son habituales en problemas de aprendizaje, y válidas siempre y cuando se cuente con un número
elevado de datos completos. La tercera opción viene a ignorar las posibles dependencias de la variable con las demás, cuando
ya se cuenta con la estructura que las describe en el grafo; no suele proporcionar los mejores resultados.

La cuarta técnica se sirve de la red ya conocida para inferir los valores desconocidos. Primero se rellenan las tablas de
parámetros usando todos los ejemplos completos. Después, para cada instancia incompleta, se asignan los valores conocidos
a las variables correspondientes en la red y se propaga su efecto para obtener las probabilidades a posteriori de las no
observadas. Entonces se toma como valor observado el más probable y se actualizan todas las probabilidades del modelo
antes de procesar la siguiente instancia incompleta.

Aprendizaje estructural

El aprendizaje estructural conlleva explorar un espacio de grafos. Esta tarea es muy compleja. A poco que se incrementa el
número de variables (nodos), el número de posibles grafos a construir con ellas se dispara. Por eso en muchas ocasiones se
restringe el espacio de búsqueda a grafos con características concretas. Existen muchos algoritmos específicos para el
aprendizaje de redes donde G se limita a un árbol, o a un poliárbol, o a otras estructuras menos generales.

Ventajas

Entre las ventajas de las redes bayesianas se encuentra:

 Permiten representar al unísono la dimensión cualitativa y cuantitativa de un problema en un entorno gráfico


inteligible.
 Pueden trabajar con datos perdidos de una manera eficiente, algo que en la práctica es deseable.
 Permiten reducir el sobre ajuste de los datos.
 Posibilitan el descubrimiento de la estructura causal subyacente en un conjunto de datos.
 Representan toda la información en un único formato (probabilístico y gráfico) lo que hace sencillas las
interpretaciones, permite retractarse de conclusiones obtenidas con anterioridad ya que no son razonables a la luz
de nuevas evidencias, proporcionan una visión general del problema, generan un conjunto de alternativas
ordenadas y facilita la explicación de las conclusiones.
 Permiten realizar inferencias bidireccionales; esto es, desde los efectos a las causas y desde las causas a los
efectos, etc.

Aplicaciones

 Tutores bayesianos inteligentes

HYDRIVE: El sistema HYDRIVE fue desarrollado por los Laboratorios Amstrong de las Fuerzas Aéreas de los Estados Unidos
para simular el funcionamiento del avión de combate F-15.

 Biomedicina
1) Predicción de la supervivencia en cáncer de mama.
2) Multiclasificador de dos niveles para supervivencia en Unidad de Cuidados Intensivos (UCI).
3) Clustering geográfico de la incidencia del cáncer.
4) Predicción de la estructura secundaria de las proteínas.
5) BayesChess: Programa de ajedrez capaz de adaptar su estrategia al usuario al que se enfrenta y de refinar la
función de evaluación que guía el proceso de búsqueda en base a su propia experiencia de juego.
6) Investigaciones policiales
 Aplicaciones en empresas
 Microsoft: Answer Wizard (Office), diagnóstico de problemas de impresora, etc.
 Intel: Diagnóstico de fallos de procesadores.
 HP: Diagnóstico de problemas de impresora.
 Nasa: Ayuda a la decisión de misiones espaciales.
 Psicología

También podría gustarte