Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los resultados obtenidos durante este proceso son conocimiento explcito y tcito. Se pueden encontrar
en el Diccionario de palabras, lista de conceptos y Tuplas obtenidos durante el proceso. El proceso de
minera de texto y los resultados se describen a continuacin segn la informacin mostrada en la Figura
3.2 y la descripcin presentada en Miura (2003).
2. Elabore un diccionario de palabras. Este es el primer proceso interactivo entre el usuario y PhDic:
a. (PhDic) Bsqueda de palabras en S generando una lista D de palabras clasificadas por radicales y
asociadas a sus sufijos, frecuencias y relevancia (TF-IDF)
b. (Usuario) Corrija la relevancia de la lista de palabras D (es decir, reemplace TF-IDF por entropa de
Shannon), organice las palabras por relevancia (la ms relevante siempre debe estar en la parte superior
de la lista), deseche la informacin que considere ruido y seleccione Las palabras con un significado
relevante en el contexto del anlisis. Por ltimo dar una gramtica G para cada palabra (G (K)
especialistagramtica). La gramtica especializada en este paso ha sido: MNO = verbo o sustantivo, y
mno = palabras que no sean verbos o sustantivos.
Como resultado de este proceso interactivo se genera el diccionario de palabras D (Figura 3.3).
Obsrvese que en esta aplicacin el diccionario de palabras generadas engloba informacin de
seguridad en las actividades de O & G Offshore, pero debe variar segn el contenido de la base de datos
utilizada.
Figura 3.3 Conocimientos explcitos y tcitos de una muestra de "Diccionario de palabras" obtenida por
PhDic.
3. Elaborar una lista de conceptos. Es el segundo proceso interactivo:
a. (PhDic) Utilizando el diccionario de palabras se procesa de nuevo el conjunto de textos, esta vez para
encontrar agrupaciones de palabras (denominadas argumentos por PhDic) en los textos segn la
gramtica especializada G (K). A continuacin, se genera la lista de argumentos con su respectiva
frecuencia de ocurrencia.
b. (Usuario) Corrija la relevancia de la lista de argumentos, selecciona los argumentos con significado
relevante (es decir, el 20% de conglomerados con mayor entropa). En este paso, el experto puede
refinar la gramtica o ajustar manualmente los argumentos para generar una lista de conceptos. Por
ejemplo, implementar la forma negativa de algunas palabras en la lista, agregando o Eliminarlos (es
decir, cambiar MNO + mno a MNO o mno, o incluso aMNO + mno + mno). Adems, el usuario asocia
cada agrupacin a una frase semntica de acuerdo con su significado en la base de datos (por ejemplo, a
la agrupacin "result_fire", la frase semntica es "Fuego resultado de la ignicin de fluidos")
Como resultado de este proceso interactivo, se genera la lista de conceptos que contienen palabras
relevantes o agrupaciones de palabras (20% con mayor entropa) que tienen un fuerte significado en el
contexto analizado. En este caso, esta lista trata sobre la seguridad en la industria offshore O & G.
Tenga en cuenta que en el diccionario de palabras la informacin de "No. Docs "se clasifica como
conocimiento explcito y dentro de la lista de conceptos se le clasifica como conocimiento tcito. Porque
es posible encontrar una palabra en la base de datos utilizando mtodos de bsqueda tradicionales,
pero es muy difcil encontrar dos palabras con el mismo significado contenido en las oraciones de una
gran base de datos.
Argumentos
El resultado obtenido en esta etapa es "tuplas" que es una lista de documentos asociados a grupos de
palabras que les pertenecen.
Una muestra de esta lista se presenta en la Tabla 3.1. Recuerde que un argumento puede repetirse en
uno o ms documentos de la base de datos. Ayuda a determinar el tema principal del documento o base
de datos. El documento de informacin y los argumentos se consideran conocimientos explcitos.
Documents Arguments
SA_002-ShallowDrillingHazards.txt drill_case
SA_002-ShallowDrillingHazards.txt drill_while
SA_002-ShallowDrillingHazards.txt drill_pipe
SA_002-ShallowDrillingHazards.txt drill_well
SA_002-ShallowDrillingHazards.txt drill_well
SA_002-ShallowDrillingHazards.txt drill_well
SA_004-FlashFireCuttingandWelding.txt ignit_ga
SA_004-FlashFireCuttingandWelding.txt instal_oper
SA_004-FlashFireCuttingandWelding.txt extinguish_fire
SA_004-FlashFireCuttingandWelding.txt extinguish_fire
SA_004-FlashFireCuttingandWelding.txt extinguish_fire
SA_004-FlashFireCuttingandWelding.txt occur_fire
O Zona I: esta zona contiene la informacin que ocurre con ms frecuencia en la base de datos. Se
considera que esta zona contiene informacin trivial porque generalmente contiene informacin
ampliamente conocida, que no muestra beneficios para mejorar la adquisicin de conocimientos.
O Zona II: esta zona presenta informacin interesante y potencialmente innovadora. En la aplicacin de
la metodologa en la base de datos de BSEE, la informacin de alertas de seguridad sobre causas,
consecuencias y recomendaciones para la ocurrencia de eventos indeseables se han obtenido de esta
zona.
O Zona III: esta zona presenta informacin menos frecuente contenida en la base de datos, esta
informacin podra corresponder a investigaciones emergentes, informacin mal conocida o errores
tipogrficos.
2) Agrupacin de conceptos
Esta tarea se realiza con la informacin de la lista de conceptos generados en el proceso de minera de
texto, de acuerdo con caractersticas o definiciones mutuas que abarcan varios de esos conceptos.
El uso de la informacin agrupada de la base de datos de BSEE fue posible para mapear cuatro
entornos operacionales presentados en la Figura 3.7 Esta informacin se utiliz para filtrar los
datos y encontr alertas de seguridad sobre las operaciones de ingeniera de pozos
Figura 3.7 Entornos Operacionales encontrados en la base de datos de BSEE sobre la
Industria Offshore O & G. A) Plataforma de perforacin, b) Buque de suministro, c)
Helicptero, d) Plataforma de produccin.
Se podran realizar diferentes operaciones desde estos entornos operacionales. Desde las
plataformas de perforacin, las operaciones de construccin de pozos podran realizarse.
Las reparaciones o actividades logsticas se realizan desde buques de suministro y
helicpteros. Y las actividades de produccin se ejecutan desde plataformas de produccin.
Tenga en cuenta que los buques de suministro y helicpteros tambin se utilizan en la
construccin de pozos o actividades de produccin, pero slo ocasionalmente.
Por lo tanto, se espera que usando los conceptos claves en el proceso de filtrado, la base de
datos podra ser separada en:
A. documentos relativos a las actividades de construccin de pozos;
B. documentos relativos a reparaciones y logstica;
C. documentos relativos a las actividades de produccin.
Despus de aclarar la razn de elegir el "entorno operativo" del grupo, se puede describir el
proceso de filtrado ilustrado en la figura 3.8.
La explicacin de la figura 3.8 se describe a continuacin.
En estudios futuros, si ocurre una situacin similar, el usuario debe leer los documentos y
decidir si son relevantes o no.
6. (Usuario y PhDic) proceso de minera de texto se ha aplicado de nuevo, pero esta vez en
cada base de datos. Como el ejemplo es sobre la construccin de pozos, slo se
demostrarn estos resultados.
Comparaciones de las dos graficas 3.10y 3.11
De la comparacin de la Figura 3.11 y la Figura 3.12 es posible notar que la relevancia y la
frecuencia varan segn el nivel de informacin. En la base de datos de alertas de seguridad
de las actividades offshore de O & G, el accidente ms frecuente encontrado es "Fuego" y el
accidente ms relevante es "Evento de Flujo Desviador". Por otro lado, el accidente ms
frecuente para la construccin de pozos es "Blowout", pero los accidentes ms relevantes
en ambos casos son "Riser Disconnect" y "Diverter Flow Event".
Obsrvese que los conceptos ms frecuentes de la base de datos de BSEE sobre accidentes
(incendios y explosiones) coinciden con la informacin ampliamente reconocida en la
industria. Se les presta mucha atencin para evitar su recurrencia. Sin embargo, los
accidentes ms relevantes (evento de flujo de derivacin, prdida del control del pozo y
desconexin de la subida) son mal notados o reconocidos como riesgos latentes,
especialmente por el personal principiante.
Despus de encontrar conceptos relevantes sobre la construccin de pozos deben estar
relacionados, este proceso se describe a continuacin.
Escenario 3: Este escenario tena la intencin de cumplir con los requisitos de los
principiantes del personal tcnico (usuarios finales), personas con poca o ninguna
experiencia que deberan aprender muchas cosas nuevas. En este caso la matrcula de una
persona con experiencia es muy importante porque los principiantes no saben qu
informacin es relevante para aprender, por lo que intentarn leer, entender y recordar
todo, pero como se explic en el captulo 1 es improbable. Adems, las oportunidades de
recordar informacin relevante cuando es necesario disminuye debido a la gran cantidad de
informacin estudiada.
Por lo tanto, el tiempo invertido en tratar de aprender todo podra considerarse como
prdida de tiempo y prdida de tiempo implican siempre prdida de dinero, pero stos no
son los nicos aspectos que importan porque la seguridad de las personas tambin es
importante.
La estructura desarrollada para este escenario es un "Grfico de conocimiento de mltiples
capas". Dicha estructura ha sido desarrollada por el autor, es un tipo de grfico de
conocimiento compuesto por varias capas que podran dividirse en tres modelos diferentes.
Esas capas, por sus caractersticas y funcin, se titulaban como "ndice Grfico", "Contenido
Grfico" y "Documentos Relacionados", la capa "Contenido Grfico" se construy utilizando
grficos de datos de radar. Los modelos de esas capas se muestran en la Figura 3.16.
Cada carta y capa fue construida y relacionada de acuerdo con las relaciones identificadas
en el proceso de conceptos relacionados.
Tenga en cuenta que "grfico" es el tipo de grfico generado para cada grupo de
informacin, y el "grfico de conocimiento" es el conjunto de grficos interrelacionados que
representan el conocimiento encontrado en la base de datos.