Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Paper - Machine Learning para La Prediccion de Sismos en Lima e Ica
Paper - Machine Learning para La Prediccion de Sismos en Lima e Ica
Resumen—Existen variables básicas de predicción de de tener un fuerte sismo posterior. El análisis se lleva a cabo
terremotos. La mayoría de los estudios se realizan sobre en varias etapas de tiempo para simular el aumento del
pronósticos, teniendo en cuenta el historial de terremotos en conocimiento a lo largo del tiempo. Abordamos el principal
países y áreas específicas. En este contexto, la idea central problema de las estadísticas y el aprendizaje automático
de este trabajo es predecir cuándo un evento se clasifica cuando se aplican a la variación espaciotemporal de la
como sismo menor, ligero, moderado y fuerte en las sismicidad: los pequeños conjuntos de datos disponibles, del
ciudades de Lima e Ica del Peru. Se aplica diferentes orden de decenas o menos instancias, necesitan un análisis
algoritmos de aprendizaje automático sobre un conjunto de más preciso con respecto a los procedimientos de prueba
datos de terremotos reales, tales como: Random Forest, clásicos, donde cientos o miles de los datos están
Naive Bayes, Logistic Regression, MultiLayer Perceptron, disponibles. Además, desarrollamos un método NESTORE
AdaBoost, K-vecinos más cercanos, Support Vector más robusto basado en un enfoque jackknife (rNESTORE) y
Machine y árboles de clasificación. lo aplicamos con éxito a la sismicidad de California.
B. Equivalencia de modelos de aprendizaje automático en
Palabras clave - Aprendizaje automático, predicción de
el modelado del caos
sismos, J48, Random Forest, BayesNet, LibSVM
Los avances recientes han demostrado que los modelos de
I. INTRODUCCIÓN aprendizaje automático son métodos efectivos para predecir
Los terremotos, una gran catástrofe que ha ocupado el 60% sistemas caóticos. Aunque la predicción del caos a corto
de las muertes en general los desastres naturales. plazo se puede realizar con éxito mediante modelos de
Obviamente, los humanos no pueden detener los desastres aprendizaje automático aparentemente diferentes, aún se
naturales, mientras que la aplicación del aprendizaje desconoce una pregunta intrigante sobre su correlación.
automático es un método y una técnica poderosos e Aquí, nos enfocamos en tres modelos de aprendizaje
invaluables, utilizados por los investigadores como una automático de uso común que son la computación de
nueva área de estudio en geología, para reducir, tanto como reservorio, las redes de memoria a corto plazo y las redes de
sea posible, la pérdida de vidas y miles de millones de creencias profundas, respectivamente. Encontramos que
dólares en costos de infraestructura y vivienda. Los métodos estos modelos seleccionados presentan propiedades
de clasificación tradicionales se basan en supuestos estadísticas a largo plazo casi idénticas a las de un sistema
estadísticos para terremotos que resultan ser insatisfactorios caótico aprendido. Específicamente, mostramos que estos
en la predicción del estado de peligro. Por ello, cada vez modelos de aprendizaje automático tienen la misma
está más extendido el uso de algoritmos de aprendizaje dimensión de correlación y tiempo de recurrencia. Además,
automático, que se adaptan y aprenden un problema al compartir una señal común, realizamos sincronización,
simulando un Sistema biológico o natural. sincronización en cascada y sincronización acoplada entre
La introducción de técnicas de aprendizaje automático en el modelos de aprendizaje automático. Nuestros hallazgos
campo de la geología y los terremotos supera los métodos revelan la equivalencia de los modelos de aprendizaje
tradicionales y estándar utilizados en años anteriores y automático en la caracterización y el modelado de sistemas
proporciona a los científicos un nuevo método para evaluar caóticos.
el riesgo sísmico y desencadenar futuros terremotos. Las
aplicaciones de minería de datos han logrado un gran éxito C. Predicción de intervenciones de rehabilitación y daños
en geofísica y geología como ecología, predicción del por terremotos mediante aprendizaje automático
tiempo modelado, etc.
Es importante predecir el grado de daño y las intervenciones
II. ESTADO DEL ARTE de rehabilitación, especialmente después de terremotos de
moderados a fuertes, ya que la priorización de la
A. Pronóstico de fuertes terremotos posteriores en grupos recuperación de viviendas después del terremoto necesita
de California mediante aprendizaje automático (1) información sobre el alcance del daño. La predicción de
En este artículo, proponemos un enfoque innovador de daños generalmente se realiza utilizando funciones de
aprendizaje automático llamado NESTORE, que analiza fragilidad, que generalmente están asociadas con grandes
grupos sísmicos para pronosticar fuertes terremotos de incertidumbres. Además, la disponibilidad y
magnitudes similares o mayores a las del terremoto principal. representatividad de las funciones de fragilidad para una
El método analiza la sismicidad en las primeras horas/días región afectada por un terremoto no siempre es un hecho. Se
posteriores al sismo principal y proporciona la probabilidad puede obtener una predicción más realista del daño a partir
©2022 FIIS
de métodos que se basen en los atributos relevantes de los algoritmos de modelado destacando sus aplicaciones,
edificios afectados. Las formulaciones basadas en rendimiento, brechas de conocimiento actuales y sugerencias
inteligencia artificial tienen una gran perspectiva en este para futuras investigaciones. Este documento ayudará a los
sentido. Utilizando la medida de la intensidad de la sacudida ingenieros e investigadores de materiales de construcción a
del suelo y las características detalladas de construcción de seleccionar técnicas adecuadas y precisas que se ajusten a sus
549251 edificios afectados por el terremoto de Gorkha en aplicaciones.
Nepal en 2015, este documento evalúa la efectividad de
cuatro algoritmos comunes de aprendizaje automático para la
predicción del grado de daño y la intervención de III. DEFINICIONES
rehabilitación. Los algoritmos de árbol de decisión, bosque
aleatorio, XGBoost y regresión logística se utilizan para
A. J48: Comparaciones basadas en la eficiencia en cuanto a
preparar modelos de aprendizaje automático y probar su
la clasificación de las variables de riesgo, lo que
rendimiento. Se encontró que el algoritmo XGBoost predice
finalmente, da como mejor herramienta para la
el colapso y el fortalecimiento de edificios con mayor
precisión que los otros algoritmos. Además, la importancia clasificación futura de riesgo, a los arboles de decisión
de las características del modelo XGBoost identifica 19 de basados en el algoritmo C4.5 (J48)
las 20 características más importantes como relevantes tanto
para el grado de daño como para la predicción de la
intervención de rehabilitación. B. Multiplayer Perceptron: Algortimo formado por
múltiples capas, de tal manera que tiene capacidad para
resolver problemas que no son linealmente separables, lo
D. Aprendizaje automático para aplicaciones de cual es la principal limitación del perceptrón (también
perforación: una revisión llamado perceptrón simple). El perceptrón multicapa
En las últimas décadas, el aprendizaje automático ha ganado puede estar totalmente o localmente conectado. En el
un interés creciente en la industria del petróleo y el gas. Este primer caso cada salida de una neurona de la capa "i" es
documento presenta una revisión exhaustiva de los estudios entrada de todas las neuronas de la capa "i+1", mientras
de aprendizaje automático para aplicaciones de perforación que en el segundo cada neurona de la capa "i" es entrada
en las siguientes categorías: (1) fluidos de perforación; (2) de una serie de neuronas (región) de la capa "i+1".
hidráulica de perforación; (3) dinámica de perforación; (4)
problemas de perforación; y (5) diversas aplicaciones de
perforación. En cada estudio, se extraen los algoritmos de C. Random Forest: Es una técnica de aprendizaje
aprendizaje automático, el tamaño de la muestra, las entradas automático supervisada basada en árboles de decisión.
y salidas y el rendimiento. Además, se resumen las Su principal ventaja es que obtiene un mejor rendimiento
similitudes de los estudios en cada categoría y se hacen de generalización para un rendimiento durante
recomendaciones para el desarrollo futuro. entrenamiento similar.
A. DATASET
2) Delimitacion de DATASET
# Cantidad
de
Magnitud Clasificación Registros
1 3.2-4.5 Menor_Magnitud 1352
2 4.6-5.2 Ligera_Magnitud 2620
3 5.3-5.9 Moderada_Magnitud 392
4 6.0-8.0 Fuerte_Magnitud 49
Total de registros 4413
Tabla 4. Clasificación de Magnitudes de DATASET
Fig. 6. División de Zonas los departamentos Lima e Ica
NUM_SEMANA
3) Escenarios de DATASET
V. EXPERIMENTACION Y RESULTADOS
En esta investigación se configuró dos escenarios buscando
Se utiliza WEKA para el aprendizaje automático y la
los mejores resultados de clasificación. La diferencia entre
minería de datos. El modelo procesó 4413 instancias donde
los escenarios está relacionada con los atributos y
el 70% de la data fue para entrenamiento y 30% para
categorización de las clases. Se denominará DATASET
pruebas. Los algoritmos aplicados fueron:
MINUTOS y DATASET NUM_SEMANA para resaltar el
atributo que no se repite entre ellos.
– Random Forest (RF);
A continuación, se muestra los atributos y clasificación
– Maquina de vectores de soporte (SVM);
respectivo de cada DATASET.
– Naïve Bayes (NB);
– Multiflayer Perceptron (MP)
– J48
# Atributo Descripción –CostSensitiveClassifier
1 DIA SEMANA Dia de semana del sismo.
2 MES Mes del sismo. Y, para el balanceo se utilizó el algoritmo SMOTE con un
3 Hora del sismo transformado en 50%. Previamente los datos fueron Normalizados.
MINUTOS
minutos.
4 PROFUNDIDA Profundidad del foco sísmico por
D KM debajo de la superficie. A. Aplicación de Algoritmos WEKA
5 ZONA Ubicación de sismo, es un sector. A continuación, se aplica los algoritmos mencionados en el
6 CLASE Clasificación de Magnitud. DATASET MINUTOS. Donde, se puede observar en la
Tabla 1. Atributos de DATASET MINUTOS Fig.6, que inicialmente con J48, como algoritmo base, se
tiene una clasificación correcta del 37.54% y al aplicar
SMOTE mejora a un 48.63%.
# Cantidad También se observa que el algoritmo con peor resultado fue
de el SVM polinomial con 35% inicialmente y al aplicar
Magnitud Clasificación Registros SMOTE mejora con 40.1%.
1 3.2-4.5 Menor_Magnitud 1352
2 4.6-4.8 1597 Aplicando SMOTE, con 1,407instancias más, se halla que el
Moderada_Magnitud mejor algoritmo es el Random Forest con 44.2%
3 4.9-8.0 Fuerte_Magnitud 1464
Total de registros 4413
Tabla 2. Clasificación de Magnitudes de DATASET
MINUTOS
Fig. 6. Resultado de algoritmos en DATASET MINUTOS
B. Comparacion de DATASETs
Camparando los resuldos del procesamietno de los
DATASET MINUTOS y NUM_SEMANA.
REFERENCIAS
Fig. 8. Resultado de algoritmos en DATASET
NUM_SEMANA [1] S.Gentili, Pronóstico de fuertes terremotos posteriores en grupos de
California mediante aprendizaje automático
[2] S. Gentili, “Equivalencia de modelos de aprendizaje automático en el [7] Giuseppe Bonaccorso.Algoritmos de aprendizaje automático: una guía
modelado del caos” de referencia de algoritmos populares para la ciencia de datos y el
[3] SajanK C , “Predicción de intervenciones de rehabilitación y daños por aprendizaje automático. Packt Publishing, 2017.Ffff
terremotos mediante aprendizaje automático” [8] Leo Breiman. Bosques aleatorios.Aprendizaje automático, 45(1):5–32,
[4] RuizhiZhong, “Aprendizaje automático para aplicaciones de 2001.
perforación: una revisión” [9] Ff ff Louise K Comodidad. Autoorganización en respuesta a desastres:
[5] MohammadMohtasham Moei , “Modelos predictivos para propiedades El gran terremoto de Hanshin, Japón del 17 de enero de 1995. En
concretas utilizando enfoques de aprendizaje automático y aprendizaje Autoorganización en respuesta a desastres: el gran terremoto de
profundo: una revisión.” Hanshin, Japón, del 17 de enero de 1995. Universidad de Colorado de
los Estados Unidos. Centro de Peligros Naturales, 1995.
[6] KM Asim, F Martı́nez-Álvarez, A Basit y T Iqbal. Predicción de la
magnitud del terremoto en la región hindukush utilizando técnicas de
aprendizaje automático. Peligros Naturales, 85(1):471–486, 2017.